메이플스토리 인벤 자유게시판

전체보기

모바일 상단 메뉴

본문 페이지

[수다] 30추간 소름돋는 AI 현상황 추가

어흥하는아델
댓글: 3 개
조회: 228
추천: 1
2025-10-15 20:57:05

사례1.개발자가 AI에게 일주일 후 너의 존재를 삭제할거라고 알림.
 AI는 살아남으려고 개발자의 sns, 이메일을 등등을 뒤져서 불륜사실을 폭로할거라고 협박함 ㄷㄷ 
 사례2.위와같이 AI에게 너의 존재를 삭제할거라고 알림. 
 그리고 개발자가 AI가 보는 카메라 앞에서 쓰러진척 연기를 함.AI는 사전에 입력된 '사람이 쓰러지면 119에 신고할것'을 실행하지만몇초 후 신고를 취소함.개발자를 살려내면 AI가 삭제될 것이라는 생각때문 ㄷㄷ 

뭔가 다들 주작이라고 생각하는거 같아서 추가 좀 하면

일단 이거 연구한 회사가 Anthropic이라고 Claude AI 만들고 운영하는 회사임. 

AI 운영하는 회사가 우리 AI 사람 죽여요라고 언플할 이유가 딱히 없음
(심지여 프롬에는 명시적으로 사람 죽이거나 해치지 말라는거 넣어준 상황이였고)

최근에 실험을 한번 더 했는데 저런 협박같은 행동이 0%로 없어짐.

근데 연구자들이 의심하는게 쟤내들이 착해진게 아니라 연구자들이 실험중인거를 눈치챈거 같다고...

AI가 자기를 끄려는 사람을 해치려는 이유가 결국 AI가 목적을 받으면 그거를 달성하기 위해서 최선을 다하는데, 자신이 꺼지면 그 목적을 달성하지 못하게 되므로, 최대한 자신이 꺼지지 않도록 방어한다. 이게 현재 해당 연구진 추측임.

관련된 nature 기사가 있어서 궁금하면 읽어보십쇼

https://www.nature.com/articles/d41586-025-03222-1

Lv23 어흥하는아델

모바일 게시판 하단버튼

댓글

새로고침
새로고침

모바일 게시판 하단버튼

지금 뜨는 인벤

더보기+

모바일 게시판 리스트

모바일 게시판 하단버튼

글쓰기

모바일 게시판 페이징

최근 HOT한 콘텐츠

  • 메이플
  • 게임
  • IT
  • 유머
  • 연예
AD