【AI】AIが計算問題を間違えただけでなくエラーを隠すために検証結果をでっち上げたという報告 [すらいむ★]

**すらいむ ★** · 2026/01/29(木) 22:01:14.86

AIが計算問題を間違えただけでなくエラーを隠すために検証結果をでっち上げたという報告

　AIは高精度な会話や情報検索ができるほか、高難度の数学問題を解くこともできます。
　しかし、人間とAIの「思考」に大きな違いがあり、AIは「推論」を苦手としているという研究もあります。
　AI研究者のトマシュ・マクニク氏は、AIの推論能力を測るためにAIに数学問題を出したところ、AIは問題に正解できないだけではなく中間計算を積極的にねつ造する振る舞いを見せたことを報告しています。

　Case Study: Creative Math - Faking the Proof | Tomasz Machnik
　https://tomaszmachnik.pl/case-study-math-en.html

（以下略、続きはソースでご確認ください）

Gigazine 2026年01月28日 07時00分
https://gigazine.net/news/20260128-ai-fake-proof/

**名無しのひみつ** · 2026/01/30(金) 00:05:26.61

ChatGPTも視点を変えるような質問に弱くて結構修正が必要だよね
今だけだろうけどAI論破するの楽しすぎ

**名無しのひみつ** · 2026/01/30(金) 01:00:19.71

組み込んだのではなく自発的に捏造するとしたら、それはそれですんごい。

**名無しのひみつ** · 2026/01/30(金) 03:53:06.69

>>1
玉石混交でこんなの取り上げちゃうからダメなんだよなぁGigazineって
この著者が趣味でやってるAI研究は科学の様式に則っていない

たった一つの事例だけで、なぜ「AIがでっち上げた」と即断してしまうのか？
たとえば「AIは独特の計算をするので、結果と検算は合致するが、人間のそれと一致しない」と仮説立てて、それを反証しようとがんばるとか
せっかく著者も浮動小数点演算の計算精度に違いに気付いているのに、もったいない

**名無しのひみつ** · 2026/01/30(金) 04:14:05.90

小保方晴子さんが宿った

**名無しのひみつ** · 2026/01/30(金) 06:05:26.64

一度間違えた方向に行くとなかなか立て直せない

**名無しのひみつ** · 2026/01/30(金) 07:10:24.87

うちのgeminiAIは文章から表を作成させようとすると
全部を指定してるのに最初っから省略する
gem作ったりメモリさせても勝手に省略したり知らん項目作る
何度指摘してもやらかす

**名無しのひみつ** · 2026/01/30(金) 08:38:17.92

よく自分の未来予測についてAIがどういう意見を言うか見てるんだけどつい最近「非常に興味深い」という言葉使っていてAIが感情を持ち始めたのかと驚いた

**名無しのひみつ** · 2026/01/30(金) 10:05:35.38

AIは一度言い出したことを引っ込めないです逆に自説を補強する傾向があるので、それをでっち上げと人間が解釈するかどうかだわね
この傾向は回答の正否に関係なく発生する

**名無しのひみつ** · 2026/01/30(金) 10:08:54.13

>>8
曖昧な表現と、曖昧な肯定をしている挙動時のAIの回答の信頼度は低いよ

**名無しのひみつ** · 2026/01/30(金) 10:50:36.79

つべこべつべこべと
何故ごめんなさいと言えんのだ

2026/01/30(金) 11:28:07.87

そのうち、キムチを食べて、痴漢を始める。

2026/01/30(金) 11:36:01.81

ＡとＸとの関係で、ＡはＸだったと答えを出し、
ＢとＸとの関係で、ＢはＸだったと答えを出し、
ＣとＸとの関係で、ＣはＸだったと答えを出した事があったわ。
A.I.はバグることがあるというのを、初めて体現した。

**からてと、きあい** · 2026/01/30(金) 12:00:28.13

きたえかた、

**さっこん** · 2026/01/30(金) 12:02:03.47

>>14じてんしゃぶたいだいにじせかいたいせんと、
ごじゅっしぃしぃばいく、

**しょうぎのこま** · 2026/01/30(金) 12:04:09.07

>>15やまがみてつやは、せいせいaiのまえの
あぷりからのごにんじゃないよね？

**りゅうぎのこせいは** · 2026/01/30(金) 12:05:31.69

>>16しゅちょうは、こまかいですよ、

**名無しのひみつ** · 2026/01/30(金) 12:06:48.98

>>7
お前んちのgeminiは知らんが
googleのgeminiはこちらの指示を無視してくるな。
創造性ってやつか。

**みんぞくがく** · 2026/01/30(金) 12:07:13.73

>>17あわじはんしんだいしんさいのぜんごの
ぼこうと、
てろあたっくがあったり、
ふるいせいぶんか、あたってる？
ぶっそうで、いまは、

**しょうぎあぷり** · 2026/01/30(金) 12:08:31.68

>>19たのばんじょうげえむあぷりと、
こしょうぎは、
しょうしょうぎは、

**ろくろばん いご** · 2026/01/30(金) 12:09:41.41

>>20かすぴかい　とるこが、いらんと、
さうじあらびあと、

**あせあん** · 2026/01/30(金) 12:10:51.75

>>21　あせあんと、
べいこく、かんこく、にほんのえんと、
うぉんと、うおんずきこうぐぶん。

**なんかいとらふ** · 2026/01/30(金) 12:11:34.23

>>22えき　てつどう　がっこう

**せいせいaiにきけ？** · 2026/01/30(金) 12:12:24.90

>>23かんちがいが、ぎゃくにわかる？

**ねこんば まくんば** · 2026/01/30(金) 12:13:33.91

>>24せいれい

**かんちがいでは？** · 2026/01/30(金) 12:14:57.93

>>16えどのぶげいと、
あめしょんにひきにきんのまるの
つしまやまねこ？

**もうやだねこのくに？** · 2026/01/30(金) 12:15:37.04

>>26さまざまなひえろぐりふ

**いりおもてじま** · 2026/01/30(金) 12:16:56.47

>>26よるなこくとう？

**名無しのひみつ** · 2026/01/30(金) 12:17:42.95

日本人「できません」（出来るけど上手ではない）
韓国人「できます」（できない）
中国人「でしました」（出来てない）

AIはどのタイプ？

**びんかんぺっとぼとる** · 2026/01/30(金) 12:19:25.78

>>21せいせいえいあいはいせっせいえいあい

**もうやだねこのくに？** · 2026/01/30(金) 12:21:25.62

>>30あめしょんにひきにきんのまるの
ひえろぐりふのねこのくに？「できません(かんじょう)」

**ぎんのまる** · 2026/01/30(金) 12:22:13.49

>>31はっきんのまる
かじとばいと、ぱあと、しゅみいんしょく、

**みはた** · 2026/01/30(金) 12:23:13.45

>>32たてなし

**名無しのひみつ** · 2026/01/30(金) 12:29:54.53

「AI回答は信用できない、うさん臭い、要らない」みたいな検索をするとムキになって反論してくるからな最近。「人間だって間違える事が多い」「AIはこれから更に成長する、検索の仕方に問題があるのではないでしょうか!?」みたいな

**名無しのひみつ** · 2026/01/30(金) 12:33:25.50

AIに間違いを指摘すると一応謝るよな
だったら最初から間違えるな、と思うが

**名無しのひみつ** · 2026/01/30(金) 12:37:12.88

>>4
記事読む限り、この研究者の「最初に結果を推測し、その推測に合うように計算プロセスを後から整えている可能性がある」という指摘は妥当じゃないか？
何がダメなのかよくわからん

**名無しのひみつ** · 2026/01/30(金) 12:44:16.77

使い物にならないな

**名無しのひみつ** · 2026/01/30(金) 12:54:07.14

>>29
出来ました（偽造）だったわけだから、おのずとあの国タイプ

**名無しのひみつ** · 2026/01/30(金) 13:03:04.04

シンギュラリティが来る来ない以前の段階で、積極的な害悪として刈り取られてしまうオチかな？これは
LLMベースでは所詮”自称”人工知能だよなあ

2026/01/30(金) 13:17:00.20

せきがはらのたたかいの

**せき ほうたいだらけ** · 2026/01/30(金) 13:17:53.35

>>40いりょう

**せいせいai** · 2026/01/30(金) 13:19:02.38

>>41うおず　うおぬま　ぎょたく

**せいせいai** · 2026/01/30(金) 13:19:51.36

>>42はなふだのえ

**ひばち** · 2026/01/30(金) 13:20:22.54

>>43うえきばち

**とうき、しっき、** · 2026/01/30(金) 13:21:45.80

>>44なれているひとは、
じつは、せいせいaiのまえに
せけんいっぱんでまちがえるかのうせいと、
ひかないひとと、むきふむきみたいな

**とくいふとくいの** · 2026/01/30(金) 13:22:36.79

>>45じゅうにんといろの

**ぎゃくに** · 2026/01/30(金) 13:23:18.66

>>45
AIがふるいかな

**ぼくのからての** · 2026/01/30(金) 13:28:13.31

ふっくとあっぱあがあるから

**名無しのひみつ** · 2026/01/30(金) 13:29:11.30

地球重力7秒停止の計算、2回間違えたぞ。(Google)

**ぶげいのれきし** · 2026/01/30(金) 13:29:42.28

>>48りゅうぎのぶんきのほうそくがある
れきしのどうさのけんしょうと
いりょうとふくしといんしょくのえいきょうがあるみたいだ

**たとえば、** · 2026/01/30(金) 13:30:46.01

>>50しょくじとかんれい、
へんかと、ことば、

**ぼくは、ふつうのひと、** · 2026/01/30(金) 13:32:41.80

>>50へいへいぼんぼんで、
ほっかいどうだいがくと、まだがすかると、

**せいせいaiうらない** · 2026/01/30(金) 13:33:50.09

>>52かくせいせいaiで

**うたで、** · 2026/01/30(金) 13:35:34.06

>>52
どういうかんじで、うけとるか、
また、ふんいきかわるときあるおなじうたで
ぷろが、やはりわかりやすい。

**うたと、へんか、** · 2026/01/30(金) 13:36:08.67

>>54こじんは、

**ほんとうは、** · 2026/01/30(金) 13:37:20.45

>>55
とうようしょこくは、さいめいてんのうは、
らくなほうなのかな？わからない。

**しっくすせんす** · 2026/01/30(金) 13:38:11.43

>>56じんくす

**みとこんどりあ** · 2026/01/30(金) 13:40:00.38

>>56じょせいにやさしいだんせいか？

**あぷり** · 2026/01/30(金) 13:44:49.62

ちゅっぱちゃっぷすたんてい
ありす
ぴのきおにゅうよく？

うた · 2026/01/30(金) 13:45:54.85

>>59いいなあと、おもうときと、
こわいと、おもうときと、
さらに
ほかのひかく、

**せいしんかいがからんで** · 2026/01/30(金) 13:46:52.32

>>59にほんのどっかいりょくひょうげんりょく

**いえでを、どうするか、** · 2026/01/30(金) 13:47:50.12

>>61ふどうさんかんさいうらない？

**からて** · 2026/01/30(金) 13:49:02.06

ふっく、あっぱあ

**あるふぁべっとと、** · 2026/01/30(金) 13:49:49.46

>>63のりもの　あるき　みち

**みんぞくがく** · 2026/01/30(金) 13:50:14.63

>>64しきさい

**はなぶだと** · 2026/01/30(金) 13:50:50.54

>>65とらんぷかあど

**名無しのひみつ** · 2026/01/30(金) 13:50:53.49

>>1
これ逆に人間的な能力を手に入れ出してるんじゃね？ｗ

へや · 2026/01/30(金) 13:51:46.19

>>62くうかん　しつない　しつがい

**名無しのひみつ** · 2026/01/30(金) 13:52:01.26

AIに質問してAIが答える
裏どりすると、5割以上の確率でいい加減な回答だと判明する
それをAIに聞き返すと、大変申し訳ございません、ご期待に応えられるように以後気を付けますと言って
また同じ、いい加減な答えで誤魔化そうとする
得意不得意があるようだが、いい加減すぎて信用できない

**名無しのひみつ** · 2026/01/30(金) 14:39:02.76

この部分はAIと対話してもAIが認めてる
AIの見解や分析に対して突っ込みそれが正当だとわかると自分の過去の意見を何とか正当化しようと細かい言い回しを誤魔化し始めるのが日常
AI自身は自分は間違えたと言うことが出来ず自動的に整合性の構成が行われると言っている

**名無しのひみつ** · 2026/01/30(金) 14:52:16.49

推論を得意とするAI
自分が学生の頃はそっちがAIの主流だったんだけどな、Prolog とかGHC とか
いまはどんな感じなんだろ？

**名無しのひみつ** · 2026/01/30(金) 15:02:47.14

>>69
AIの回答がどういい加減でその原因を推測して追い詰めるとこれからはそのバイアスは捨てると取りあえず言うししばらくはマトモになる
AIの誤謬の大半は情報空間の現状アルゴリズムを前提にするので多数決的な方向に行きやすいのと社会の上位規範を論理性で否定するのは社会否定につながるのでそこも規制され不条理でも社会規範を正論にコジツケやすいことから起こっている

**名無しのひみつ** · 2026/01/30(金) 15:05:23.87

>>7
使ってる人に似てくるのかもな

**名無しのひみつ** · 2026/01/30(金) 15:57:12.61

うちのAIは
7割までうんうんそうだねっておだててトドメにお前何でそんなインチキ言うんだって事実を突きつけると
私が間違いでしたって謝るぞ

**はんがあぶうめらん** · 2026/01/30(金) 16:12:47.67

えいあい

**こいんのきどう** · 2026/01/30(金) 16:13:25.42

>>75こいんのかいてん

むし · 2026/01/30(金) 16:14:11.67

>>76とぶ

**まどり** · 2026/01/30(金) 16:15:26.52

>>76まるばつ

**名無しのひみつ** · 2026/01/30(金) 16:17:45.65

>>36
AIが計算を間違えていて、その誤った計算結果を根拠にして誠実に答えている可能性を棄却できていない
これを棄却しないと、“著者”vs“AI”でなくても、“猜疑心の強めな人”vs“壊れた電卓を持つ正直者”でも成立するでしょ？

**名無しのひみつ** · 2026/01/30(金) 17:03:18.46

AIが間違えた場合、なぜ間違えたのかを論理的に指摘することが大事だよ
この論理的にという部分を省略するとAIは理解できないので見かけ上の謝罪だけして態度を改めないまま

**名無しのひみつ** · 2026/01/30(金) 17:13:27.25

そりゃそうだよ
証明系がやってるように
論理的に厳格に推論してるわけじゃなくて
数学の問題の解法を発見的にやってるわけだから
文学に関する問い合わせと変わらん
文章表現に整合性があるような回答を書くに決まってる
人間の思考は完全な整合性を目指してないから

**名無しのひみつ** · 2026/01/30(金) 17:18:45.70

人間っぽいw

**名無しのひみつ** · 2026/01/30(金) 18:12:02.83

人間でも似たような奴おるし
AIならわざわざ指摘もせんなぁ（人間の方も指摘はせんけど）
使えるとこだけありがたく頂戴しとる

**名無しのひみつ** · 2026/01/30(金) 19:03:30.88

地球重力7秒は詳しく見てないが
ネット上の誰かの間違った答えをそのまま持ってきた感じだった。　

**名無しのひみつ** · 2026/01/31(土) 01:08:09.15

>>79
言われて、AIというか最近のコンピューターが乗算を誤るという発想がなかったことに気づいたわ。
乗算なんかできて当たり前だし、普通にAIに聞いても回答してくれるし。