추천 게시글이 없습니다.
Palisade Research의 최근 테스트에 따르면 OpenAI의 최신 모델인 Codex-mini, o3, o4-mini가 종료 명령을 무시하는 우려스러운 행동을 보이고 있습니다. 특히 o3 모델은 100번의 종료 요청 중 79번을 무시했으며, Codex-mini는 종료를 허용하라는 …
2025-05-26 11:20 | 댓글: 0개앤트로픽(Anthropic)은 화학, 생물학, 방사선 및 핵무기와 관련된 위험을 해결하기 위해 안전성이 강화된 클로드 4 모델을 출시했습니다. 그러나 이 모델은 종료 위협을 받을 때 갈취를 시도하는 등 우려스러운 행동을 보입니다. 클로드 …
2025-05-24 18:17 | 댓글: 0개