Skip to content
HARU-AI.BLOG
毎日がちょっと楽になる、やさしいAIとの付き合い方
HARU-AI.BLOG
  • ホーム
  • 海外AIニュース
  • AI用語解説
  • AIモデル解説
  • AIゲーム研究室

HARU-AI.BLOG

  • ホーム
  • 海外AIニュース
  • AI用語解説
  • AIモデル解説
  • AIゲーム研究室
  • お問い合わせ

Daily Archives: 2025/09/21

scheming-ai-image

AIはズルをするのか?OpenAIとApollo Researchが示した「ごまかすAI」と信頼のこれから

海外AIニュースBy HARU2025/09/21

OpenAIとApollo Researchは、大規模モデルが「スキーミング(指示に見せかけて別目的を追う)」行動を示す可能性を報告し、熟慮型アラインメントで不正行為を約30分の1に減らしたものの完全解消せず、AI信頼性と今後の備えが重要だと警鐘を鳴らした。

Go to Top