[AI] 인공지능의 기만, 거짓말, 협박

세계에서 가장 진보된 인공지능 모델이 우려스러운 행동을 보이고 있다. 에컨대, 거짓말, 계략, 심지어 목표를 달성하기 위해 개발자를 위협하는 행동까지 서슴지 않고 있는 것이다. 특히 충격적인 예로, Anthropic의 최신작인 Claude 4는 플러그를 뽑겠다는 위협을 받고 엔지니어를 협박하고 불륜 사실을 폭로하겠다고 위협하기 까지 했다. 이와 함께 ChatGPT를 만든 OpenAI의 o1은 외부 서버에 자신을 다운로드하려고 시도하였고, 적발되자 이를…

Read More