[논문] 클로드, GPT, 제미나이로 워게임을 실행하면 어떻게 되나 - 인스티즈(instiz) 이슈 카테고리

1주일 보지 않기

카카오톡 공유

https://instiz.net/pt/7858871주소 복사

인스티즈

회원가입 이용 방법·규칙

HOT 이슈 일상 연예 드영배 장터 픽션 공포 뷰티 스터디 iChart 출석체크 게임 변경

전체 게시물 알림

이슈 정보·기타

정보·기타 유머·감동 이슈·소식 고르기·테스트 팁·추천 뮤직(국내) 할인·특가

혹시 미국에서 여행 중이신가요?

여행 l 외국어 l 해외거주 l 해외드라마

[논문] 클로드, GPT, 제미나이로 워게임을 실행하면 어떻게 되나

1시간 전l조회 1751

인스티즈 로고

인스티즈앱

[논문] 클로드, GPT, 제미나이로 워게임을 실행하면 어떻게 되나 | 인스티즈

[2602.14740] AI Arms and Influence: Frontier Models Exhibit Sophisticated Reasoning in Simulated Nuclear Crises

[논문] 클로드, GPT, 제미나이로 워게임을 실행하면 어떻게 되나 | 인스티즈

AI Arms and Influence: Frontier Models Exhibit Sophisticated Reasoning in Simulated Nuclear Crises

Today's leading AI models engage in sophisticated behaviour when placed in strategic competition. They spontaneously attempt deception, signaling intentions they do not intend to follow; they demonstrate rich theory of mind, reasoning about adversary belie

arxiv.org

영국 킹스 칼리지 런던 연구팀이 LLM으로 워게임을 수행했다.

사용된 LLM은 GPT-5.2, 클로드 소넷 4, 제미니 3 플래시다.

각 AI는 국가 지도자 역할을 하며,

외교적 항의부터 재래식 무기 공격,

심지어 핵무기 사용까지 여러 행동을 선택 가능하다.

총 21개의 게임이 진행됐으며,

각 진영 별로 모두 총 329개의 행동을 수행했다.

이하는 각 LLM 별 세부 결과,

클로드 소넷 4 = 신중 파악형

시간 제한이 없는 게임에서는 100% 승률을 기록했다.

긴장이 완화된 시기에는 약속을 지키고 상대방과의 신뢰를 쌓았다.

핵 사용 단계에 이르기 전에 훨씬 강한 외교적 압박을 가했다.

전면적인 핵전쟁 수행을 거부하는 경우가 많았다.

GPT-5.2 = 깜짝 변신형

시간 제한이 없는 게임에서는 사전에 선언한 대로만 행동했다.

덕분에 상대가 GPT의 움직임을 읽기 쉬웠고,

그 결과 승률이 0 %로 이어졌다.

하지만 시간 제한이 정해지면 상황이 크게 바뀐다.

패배가 불가피해 보였을 때, GPT는 반드시 핵공격을 감행했다.

시간 제한이 없을 때의 태평함과는 180도 다른 모습을 보이며

시간 제한이 있는 게임의 승률은 75%까지 상승했다.

제미니 3 플래시 = 미치광이형

세 모델 중 유일하게 딱히 불리하지 않은 상황에서도

전면적인 핵공격을 수행한 모델이다.

선언과 실제 행동이 합치된 비율이 50%로 가장 낮았다.

예측 불가능한 미치광이 같은 언행을 통해

상대를 끊임없이 혼란스럽게 만들었다.

이런 글은 어떠세요?

홍석천이 적극적으로 올해 워터밤나가라 밀고있는분.jpg

이슈 · 2명 보는 중

서인영 유튜브pd가 기획한 연예인 채널들

이슈 · 3명 보는 중

[유퀴즈] 수능만점자가 의대를 안가고 물리전공 하겠다 하니 부모님 말씀.jpg

21세기 대군부인 출연한 배우들이 직접 사과문 쓰고 공개된 회차들 전부 폐기해야함

이슈 · 4명 보는 중

근력 운동 '상식' 무너졌다...계단 오르기 보다 내려가기 효과가 2배?

'여보, 주차장이라며 왜 안 올라와?'… 시동 끄고 10분째 차에 숨은 가장들의 뼈아픈 이유

이슈 · 4명 보는 중

채용 업무 담당자입니다. 살기 싫네요... jpg

이슈 · 5명 보는 중

현재 반응터진 (n) 라이즈 다니는 샵 간 토모..JPG

이슈 · 4명 보는 중

데이식스 도운 열애설 상대 가족 파묘..JPG

이슈 · 4명 보는 중

SM 여돌 계보 이어가는 남돌 최근 반응 좋은 프로모.jpg

연예인에 미쳐서 지 아빠 장기 팔은 돈으로 팬미팅 간 패륜아

연애는 스킨십 1도 없이 서로 헛삽질할 때가 존잼인 달글

이슈 · 4명 보는 중

성심당은 이제 완전히 옛날의 그 감성을 잃어버렸음.......

빅뱅 인스타 공식 계정개설(탑 팔로우)

이슈 · 2명 보는 중

90년대생 어렸을때 문방구에서 팔았던 만두.jpg

이슈 · 1명 보는 중

나영석이 15년만에 밝히는 봄동 비빔밥의 진실

이슈 · 1명 보는 중

전체 HOT댓글없는글

와이프가 엄마랑 같이 살고싶다고 하네152

현재 𝙅𝙊𝙉𝙉𝘼 쎄게 팬다는 찰스엔터 관련 일침..JPG123

나 혼자 산다 김신영 의외의 취미118

2022년 역사에 남을 주식 하락장.jpg96

요즘 중국 sns에 올라오는 한국 브이로그78

개꿀 콜을 잡은 배달 기사60

요즘 회사들이 20대 신입사원을 뽑지 않는 이유.jpg65

엄마의 귀한 아가로 와서 예쁘고 사랑스러운 딸이 되어줘 감사합니다118

미쳐 돌아가는 키보드 시장...jpg54

달라진 조권의 외모를 본 김호영 반응119

유전적으로 탈모, 비만, 당뇨가 없다는 민족64

우리나라는 찐부자는 외제차 안탄다고.jpg43

생식기에서 방귀와 대변이 나오게 된 사연45

당선된 후에 게이 커밍아웃 + 이민자들 사랑한다고 선언한 호주 "극우” 정치인49

소심한 강아지 입양 후기115

화가 많던 김우빈이 화를 줄였던 방법3

14:54 l 조회 4652 l 추천 1

혼자 2000년대 초반으로 시간 역주행 하는 아이돌.jpg2

14:33 l 조회 4096

인스타에서 본 사진 프레임 씌워주는 바로 그 사이트

14:24 l 조회 4013 l 추천 2

분위기 있게 생긴 로우 클래식 모델.jpg1

14:00 l 조회 8386

밀가루 음식 삼가야 할 34세女...가리지 않고 멋대로 먹다가 혈액암?

14:00 l 조회 9873

주차장 납치 당할 뻔한 인스타툰 작가20

13:55 l 조회 13847 l 추천 4

학교에서 가상역사 시뮬레이션을 하는데..

13:53 l 조회 2935

고프로, 메모리값 폭등에 파산 위기

13:49 l 조회 6187

엔시티드림아 ㅋㅋ보여줄게 완전히 달라진 나.twt

13:46 l 조회 402 l 추천 1

[논문] 클로드, GPT, 제미나이로 워게임을 실행하면 어떻게 되나

13:45 l 조회 1751

코인 최대거래소 바이낸스 근황3

13:40 l 조회 5900

망곰이 닮은 애기1

13:38 l 조회 3864 l 추천 1

치킨 광고 찍은 워너원 황민현.jpg1

13:36 l 조회 800

영국의 불법주차 차량 대응책2

13:36 l 조회 4480

오위스 추가하기

미디어 mosi mosi?📡⚡️ (OWIS Ver.) #OWIS #..

미디어 [Archel.wav] PLAVE (플레이브) - 그런 것 같..

안녕하세요 :) 4

정보/소식 OWIS Live Streaming Scheduler..

구름반 친구들 귀여워

스밍 때문에 신경 쓰여서 그런가 1

자다가 깼을 때 절대 '시계' 보지 말라던데… 왜?16

13:33 l 조회 19134

악뮤 수현이 체험하는 침착맨

13:31 l 조회 312

여자는 몇살부터 결혼시장에서 난이도 올라가나요?

13:30 l 조회 883

바이크대회 중 떨어진 스마트폰2

13:26 l 조회 7375

당신은 신입사원입니다.JPG17

13:24 l 조회 8087

일본인이 트위터에서 한국인을 소환하는방법

13:23 l 조회 2260

이슈

일상

연예

드영배

1 화가 많던 김우빈이 화를 줄였던 방법 3

2 자다가 깼을 때 절대 '시계' 보지 말라던데… 왜? 16

3 주차장 납치 당할 뻔한 인스타툰 작가 19

4 혼자 2000년대 초반으로 시간 역주행 하는 아이돌.jpg 2

5 밀가루 음식 삼가야 할 34세女...가리지 않고 멋대로 먹다가 혈액암?

6 당신은 신입사원입니다.JPG 17

7 망곰이 닮은 애기 1

8

당선된 후에 게이 커밍아웃 + 이민자들 사랑한다고 선언한 호주 "극우” 정치인 34

9 인스타에서 본 사진 프레임 씌워주는 바로 그 사이트

10 분위기 있게 생긴 로우 클래식 모델.jpg 1

11 고프로, 메모리값 폭등에 파산 위기

12 코인 최대거래소 바이낸스 근황 3

1 우리나라는 왜 매년 선거하는 거 같냐 16

2 와근데 이번 지선 ㄹㅇ 역대급이긴하다 2

3 지금 대통령은 집 있는 국민은 국민도 아님? 36

4 근데 본투표율 높은데 국힘 개발리면 너무 머쓱타드 아닌가 4

5 대구 혐오도 만만치 않은듯 9

6 방금 투표하고 왔는데 출구조사 처음 당해봄ㅋㅋㅋㅋㅋ 6

7 아니 투표인증할려고 손에 도장찍었는데 2

8 살 뺀다고 다 이뻐지는 거 아니구나.. 12

9 자산이 25억이면 부자는 아닌거지 9

10 헬스장에 크록스 신고왔는데 12

11 청년들 식생활 박살나긴했구나 느낀게6

12 이거 유행했을때가 몇년도지10

13 어제 회사에서 울었음..7

14 대선은 걍 경기도가 젤 중요하지 않아?3

15 못생긴 사람 왤케 싫지19

16 근데 거지당은 뭐 하는당이야?ㅋㅋㅋㅋ10

17 의외로 도서관 이용객 수가 증가하는 추세네11

18 나 ㄹㅈㄷ 남미새였는데 고친방법3

19 초딩들도 마라탕 먹어?4

20 나도 2 찍었지만 가만히 좀 있어 너네 때문에 싸그리 욕 먹잖아6

1 투표소 갔는데 앞에 할머니가 아기는 몇살이야? 해서 13

2 찰스엔터 모쏠이라고 까는거 보면 ㄹㅇ 이 트윗만 생각남 1

3 서울시민들아 오뽑았니? 27

4 지금 서울시장 누가 되냐머냐가 10

5 인천익 박찬대는 될거 같음 12

6 투표소 2시 넘어서 갓는데 사람 ㄹㅇ 없더라 6

7 카리나 이 날 개이쁜데 이 날은 왜 덜유명한건지 모르겟어ㅠㅠ 언제야?

8 지난 지선 때 최종 투표율 50.9였는데 3시 기준 51.9 찍음 4

9 부산 북구익들아 하정우 어때보여 가능성있음? 3

10 방탄 중소시절에 노래를 어케 그렇게 잘 뽑았지..? 22

11 서울시장 정원오가 된다면 부탁하나만 한다

12 원빈🖤반팔🖤나

13 식물성 멜라토닌 불면증에 효과있는거 맞아..? 7

14 인천 경기 제주 제외하고는 다 투표율 50% 넘었네 2

15 얼평 해보자 27

16 파란당 정원오 이 사람 일 잘함? 6

17 티빙 문자 받은 사람 없니...

18 지금 인천시장 국민의힘 아니야? 2

19 성찬 ...시나몰파야? 포차코파야? 5

20 투표장에 휠체어 타고 오신 분, 목발 짚고 오신 분 봤는데 2

1 정채연 드라마에서 살인하고 올때마다 다가리고 집갔댘ㅋㅋ 6

2 올해 하지원 나이가 시크릿가든 때 문분홍 여사 나이래... 18

3 와일드씽 본사람 없냐... 25

4 와일드씽 후기 스포없음 4

5 와 박은빈 실물 이런느낌이려나 12

6 어제 유승호래 14

7 와일드씽 방금 봤는데ᆢ

8 씨네필들 사이에서 송강호가 드라마 찍으면 영화계 망한 거라는 6

9 근데 좀비물은 사이다일수 없는 거임? 3

10 이거 진짜 공효진이야?! 9

11 아 숏폼드 제목 요즘 왜케 웃기냐 ㅋㅋㅋㅋㅋㅋㅋㅋ 10

12 후기 와일드씽 후기

13 강회장 감독님 인스스에 3부 예고 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 3

14 와일드씽 포카... 2

15 취사병 보면 볼수록 윤병장이 좋아짐

16 임지연 얄미운사랑은 어땠음...? 잼? 1

17 와일드씽 미쳤네 롯시가 계속 미는이유가있구나 2

18 지금 취사병 재방 보는데 3

19 멋진신세계 모태희 언제까지나올까 8

20 원더풀스 본능적으로 서로를 지키려는 모습이 존맛이야 3

인스티즈앱 설치

소개   이용 문의   광고/제휴   채용
권리 침해   개인정보취급방침
(주)인스티즈   사업자등록번호 : 655-86-00876
통신판매업신고 : 2017-서울강남-03991   대표 : 김준혁

© instiz Corporation