cross-model-audit-image

OpenAIとAnthropicが互いのAIを安全性テスト、ライバル協力が示す「信頼できるAI」への新しい一歩

OpenAIとAnthropicがGPT‑4/5系やo3、Claude 4を相互に安全性検証し、Claudeは慎重さ、OpenAI系は応答性優位で幻覚や脱獄耐性の差が見え、結果と手法の公開は信頼構築の一歩となったが、自動評価の限界も示され数値だけで勝敗は決まらないことも明らかになった。