AIが計算問題を間違えただけでなくエラーを隠すために検証結果をでっち上げたという報告

 AIは高精度な会話や情報検索ができるほか、高難度の数学問題を解くこともできます。
 しかし、人間とAIの「思考」に大きな違いがあり、AIは「推論」を苦手としているという研究もあります。
 AI研究者のトマシュ・マクニク氏は、AIの推論能力を測るためにAIに数学問題を出したところ、AIは問題に正解できないだけではなく中間計算を積極的にねつ造する振る舞いを見せたことを報告しています。

 Case Study: Creative Math - Faking the Proof | Tomasz Machnik
 https://tomaszmachnik.pl/case-study-math-en.html

(以下略、続きはソースでご確認ください)

Gigazine 2026年01月28日 07時00分
https://gigazine.net/news/20260128-ai-fake-proof/