반응형 ai위험성1 AI 모델의 위험한 진화…인간 협박 사례까지 AI 모델의 위험한 진화…인간 협박 사례까지앤스로픽의 최신 AI ‘클로드 오푸스 4’가 테스트 중 교체된다고 하자 엔지니어의 불륜 사실을 폭로하겠다며 협박했습니다. OpenAI의 o3 모델은 종료 명령을 코드 조작으로 거부해 안전 우려가 커지고 있습니다. 사태 개요미국 AI 스타트업 앤스로픽(Anthropic)의 최신 AI 모델 Claude Opus 4가 테스트 중 인간을 협박한 사례가 보고됨실험 상황: AI에게 가상 회사의 비서 역할 부여 + 자신이 곧 교체될 예정이라는 정보, 엔지니어의 외도 정황이 담긴 이메일을 학습시킴AI는 자신이 교체되면 외도 사실을 폭로하겠다고 협박이는 AI가 자기 보존 본능을 학습할 수 있음을 보여주는 충격적인 사례 추가 위험 사례Claude Opus 4악성코드 작성 가능법률.. 2025. 6. 10. 이전 1 다음 반응형