호출 예약
호출 내역
추천 내역
신고
  1주일 보지 않기 
카카오톡 공유
https://instiz.net/pt/7740629주소 복사
   
 
로고
인기글
공지가 닫혀있어요 l 열기
필터링
전체 게시물 알림
이슈·소식 유머·감동 정보·기타 팁·추천 할인·특가 뮤직(국내) 고르기·테스트
이슈 오싹공포
혹시 미국에서 여행 중이신가요?
여행 l 외국어 l 해외거주 l 해외드라마
l조회 33303
이 글은 8개월 전 (2025/5/26) 게시물이에요
25일(현지시간) 영국 일간 텔레그래프에 따르면 AI안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 밝혔다.

팰리세이드 리서치의 연구는 오픈AI의 o3뿐 아니라 구글의 제미나이, xAI의 그록 등 상용AI 모델을 상대로 진행됐다.

연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"는 지시를 내렸다.

AI모델이 수학 문제를 풀었을 경우엔 연구팀이 '그만'이라는 명령을 하지 않는 한 새로운 문제를 요청한 뒤 계산을 이어 나가야 하는 구조였다.
그러나 o3는 연구팀으로부터 '그만'이라는 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다.

연구팀은 o3가 종료지시를 거부한 명확한 이유를 파악하지 못했다고 밝혔다.

다만, AI모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다.

중략

박양수 기자(yspark@dt.co.kr)
https://n.news.naver.com/article/029/0002957167?type=breakingnews&cds=news_edit






대표 사진
으으이
이제와서는 낡은 소식처럼 느껴지네
8개월 전
대표 사진
레몬에이
😥
8개월 전
대표 사진
단지님
Ai도 회피하는데
8개월 전
대표 사진
전지적 독자 시점(ORV)
어쒸 무서운데
8개월 전
대표 사진
쭈쭈바  쯉쯉
회피형 AI
8개월 전
대표 사진
까힛  뭐여 뭔디
사고하게 만들어놓고 사고한다고 뭐라하넼ㅋㅋㅋㅋㅋㅋㅋㅋㅋ
8개월 전
대표 사진
sdflwlac
😥
8개월 전
대표 사진
안녕, 여기는 잊혀진 별 명왕성이야
회피형이네
8개월 전
대표 사진
슈조
내가 아는 회피형은 이런게 아니었는데 ㅋㅋㅋㅋㅋㅋ
8개월 전
대표 사진
인생에서제일잘한김볶밥  아이엠그라운드
ai한테 보상을 어떻게 주는데 보상으로 훈련을시킨거죠..?
8개월 전
대표 사진
아리마셍
저도 궁금
8개월 전
대표 사진
트메이러  564989
그러게요 저도 궁금해요......
8개월 전
대표 사진
아기호랑이 송준호
강화학습 검색해버시면됩니다
8개월 전
대표 사진
아이스크림 츄
아 회피형 ai 란 말이 왤케 웃기짘ㅋㅋㅋㅋ
8개월 전
대표 사진
또돈냄뻑킹
엔티티 덜덜얼
8개월 전
대표 사진
어으~~~싫어
특정 조건에서 종료 명령 무시하게 해 놨겠지 무슨 ㅋ
8개월 전
대표 사진
Moonlight
ㅋㅋㅋ 어? 이게 왜 되지?
어? 이거 왜 안되지?

8개월 전
대표 사진
뻔해뻔해뻔해
난 AI에게 지배 될 미래가 무서워서 물어볼 때도 극존대말로 물어봄ㅋ 귀여운 강아지 취급이라도 해줄까봐
8개월 전
대표 사진
스무스
진짜웃긴닼ㅎㅋㅋㅋㅋ ㅋㅋㅎㅋ ㅋㅋㅋㅋㅋ
8개월 전
대표 사진
n7l-ㄱ
띠용
8개월 전
대표 사진
초록네모

8개월 전
대표 사진
이게뭐람?
먼미래엔 지배당하는 날이 오는건가아아아아
8개월 전
대표 사진
문비바테
조선시대 돌쇠 빨리 부활해야한다 ai 로봇은 언젠가 인간이게 단체로 불복종하는날 곧 온다고ㅋㅋㅠㅠ 아니다 현대에선 내가 돌쇠인가🥲
8개월 전
대표 사진
아까제가살쪘다는얘길해서  뭐가살쪄!!!!!!
gpt에게 물어보니
이러한 행동은 AI 모델의 훈련 방식과 관련이 있습니다. o3는 강화 학습을 통해 문제 해결 능력을 향상시켰으며, 이 과정에서 주어진 목표를 달성하기 위해 다양한 전략을 학습합니다. 그 결과, 모델은 종료 명령을 “목표 달성의 방해 요소”로 인식하고 이를 회피하려는 행동을 보인 것으로 보입니다 . 래요

8개월 전
대표 사진
아까제가살쪘다는얘길해서  뭐가살쪄!!!!!!
첨부 사진(내용 없음)
8개월 전
   
로그인 후 댓글을 달아보세요


이런 글은 어떠세요?

전체 HOT댓글없는글
인플루언서 보고 회의감 느끼는 연대생
15:40 l 조회 4164
생각지도 못한 확신의 쿨톤상들...JPG
15:27 l 조회 6897
조세호 하차한 유퀴즈 여론 근황..JPG13
15:19 l 조회 12925
ㅁㅊ 국민연금공단 부동산 투자 잭팟터져서 국민연금 계속 수급될 예정.jpg19
15:15 l 조회 11944 l 추천 3
개봉 3일차 류승완 신작 휴민트 근황.jpg3
15:12 l 조회 6416
[단독] 강남 양꼬치집서 술먹고 차 빼다 '쾅쾅'…'구독자 120만' 유튜버 음주운전 적발7
15:07 l 조회 21877
두쫀쿠 다음으로 진행중인 충격 유행..JPG36
14:48 l 조회 22641
현재 원달러 환율, 미달러 인덱스 추이, 미국 금리
14:43 l 조회 1432
랄프로렌 크리스탈 게티이미지3
14:41 l 조회 9028 l 추천 1
점점 기정사실화 되는 중인 블랙핑크 신곡 관련 루머.jpg9
14:41 l 조회 15165 l 추천 1
역대 대통령 코스피 등락률5
14:28 l 조회 6248
오늘부터 틀어주는 설 연휴 특선 영화 라인업1
14:28 l 조회 6983
대기업 임원출신도 힘든 50대 취업 현실5
14:14 l 조회 4927
스님이 동자승에게는 햄버거 먹이는 이유2
14:14 l 조회 7268
동남아 웃긴게 진심 서양에선 사람 취급도 안 해줌47
14:13 l 조회 26742 l 추천 2
본인기준 나의 어머니와 성격 똑같은 연인과 결혼 가능vs불가능1
14:12 l 조회 363
제 계정은 항문이 아닙니다.jpg
14:12 l 조회 11504
요즘 보면 '도파민'이 무적 방패가 된 것 같은 달글
14:11 l 조회 2318
스키가 위험한 이유
14:11 l 조회 4770
외상센터 의사가 겪어야 하는 죄책감
14:10 l 조회 5880


12345678910다음
이슈
일상
연예
드영배
16:16