「推論モデルがユーザーにバレないように不正する現象」の検出手法をOpenAIが開発
https://gigazine.net/news/20250311-detecting-misbehavior-in-frontier-reasoning-models/