GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?
大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特徴があったり、算数の文章題への推論能力が小学生未満という研究結果があったりと、脆弱(ぜいじゃく)さについてもしばしば指摘されます。
AIの能力の限界を示す「ストロベリー問題」という脆弱性について、機械学習エンジニアのチンメイ・ジョグ氏が解説しています。
The 'strawberrry' problem: How to overcome AI's limitations | VentureBeat
https://venturebeat.com/ai/the-strawberrry-problem-how-to-overcome-ais-limitations/
(以下略、続きはソースでご確認ください)
Gigazine 2024年10月19日 23時00分
https://gigazine.net/news/20241019-strawberrry-problem/
【AI】GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは? [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2024/10/20(日) 19:15:55.74ID:BtFOSZOT2024/10/20(日) 19:22:49.10ID:zqI5Pa8s
ただのデータベース
3名無しのひみつ
2024/10/20(日) 21:08:30.80ID:V51X9o+t 人間もな
2024/10/20(日) 21:14:24.87ID:lFJ0pj1v
SEO技術を応用すれば、白いものも黒くなる世界
2024/10/20(日) 23:21:58.62ID:bPwXsUy+
白馬は馬に非ず系
7名無しのひみつ
2024/10/20(日) 23:42:19.57ID:Fu2LwUmU そんなら推論エンジンいってるのやめろやwww
2024/10/21(月) 04:50:07.12ID:iUPGrhAs
strawberryという英単語の各文字を、アルファベット順にソートして並べて下さい
もちろんです!英単語 “strawberry” の各文字をアルファベット順に並べると、以下のようになります:
a, b, e, r, r, r, s, t, w, y
他に何かお手伝いできることはありますか?
もちろんです!英単語 “strawberry” の各文字をアルファベット順に並べると、以下のようになります:
a, b, e, r, r, r, s, t, w, y
他に何かお手伝いできることはありますか?
2024/10/21(月) 04:51:19.27ID:iUPGrhAs
strawberryという英単語の各文字を、アルファベット順にソートして並べて下さい
もちろんです!英単語 “strawberry” の各文字をアルファベット順に並べると、以下のようになります:
a, b, e, r, r, r, s, t, w, y
他に何かお手伝いできることはありますか?
ありがとうございます
ではその出力された
a, b, e, r, r, r, s, t, w, y
の中に、rは幾つありますか?
出力された文字列の中には、r が 3つ あります。
他に何かお手伝いできることはありますか?
___
こういう風に段階を踏んで質問してやると間違えない
もちろんです!英単語 “strawberry” の各文字をアルファベット順に並べると、以下のようになります:
a, b, e, r, r, r, s, t, w, y
他に何かお手伝いできることはありますか?
ありがとうございます
ではその出力された
a, b, e, r, r, r, s, t, w, y
の中に、rは幾つありますか?
出力された文字列の中には、r が 3つ あります。
他に何かお手伝いできることはありますか?
___
こういう風に段階を踏んで質問してやると間違えない
10名無しのひみつ
2024/10/21(月) 08:12:19.00ID:0MG0CZEM むしろどういう理屈で間違えてるんだ?
11名無しのひみつ
2024/10/21(月) 09:35:35.88ID:iUPGrhAs strawberryという単語をstrawとberryの2つに分けてしまい
その後半だけ見てしまう癖がある、と説明される
あるいは
言語モデルは過去の類題に頼りがちになる
それでstrawberryという単語に近いのは
berry
という単語で
berryにはrが2つある
だからstrawberryのrも2つである
という発想になる、というのが、人間の頭の繋がりに近い形での説明なんだと
言語モデルだけでなく「その問題が数理的な問題だと思われる時は
計算機やsympyやプログラミングに頼って答えを出したものも作り
言語モデルだけで出したものと違う時には計算機などによる答えを使う」
という場合分けを入れれば簡単に解決できるんだろうが、
あえてそれは使っていない
その後半だけ見てしまう癖がある、と説明される
あるいは
言語モデルは過去の類題に頼りがちになる
それでstrawberryという単語に近いのは
berry
という単語で
berryにはrが2つある
だからstrawberryのrも2つである
という発想になる、というのが、人間の頭の繋がりに近い形での説明なんだと
言語モデルだけでなく「その問題が数理的な問題だと思われる時は
計算機やsympyやプログラミングに頼って答えを出したものも作り
言語モデルだけで出したものと違う時には計算機などによる答えを使う」
という場合分けを入れれば簡単に解決できるんだろうが、
あえてそれは使っていない
12名無しのひみつ
2024/10/22(火) 02:43:00.87ID:qW76OBKX >>10
いまのAIモデルには人間ほど細かい単位で情報を扱えないから
ChatGTPなら約1単語(英語)をひとかたまりとして学習している
単位より細かい質問にはうまく回答出来ない場合がある
ちなみに画像生成AI(SDXL)は出力解像度1024x1024に対して内部的には128x128
いまのAIモデルには人間ほど細かい単位で情報を扱えないから
ChatGTPなら約1単語(英語)をひとかたまりとして学習している
単位より細かい質問にはうまく回答出来ない場合がある
ちなみに画像生成AI(SDXL)は出力解像度1024x1024に対して内部的には128x128
13名無しのひみつ
2024/10/24(木) 08:35:33.36ID:6b+3uKFO ストロベリーフィールズフォエバー
AIを構築している側の嘘が論理破綻しているので
これをごまかすには阿呆になるしか無い模様
AIを構築している側の嘘が論理破綻しているので
これをごまかすには阿呆になるしか無い模様
14名無しのひみつ
2024/10/24(木) 08:39:25.65ID:6b+3uKFO 白馬非馬
ビックリマンはチョコにあらず
ビックリマンはチョコにあらず
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【マスコミ不信】「支持率下げてやる」発言に「オフレコ談話を報道」まで…メディアによる“高市下げ”加速も、変わらず高い支持率 [尺アジ★]
- 【群馬】「路面凍り止まらなかった」1人死亡26人重軽傷 みなかみ町の関越道で57台絡む事故 依然通行止め ★2 [ぐれ★]
- 【速報】静岡15人負傷、容疑者は工場の元従業員 [蚤の市★]
- 「スパイ呼ばわり」立民・岡田氏、中国との関係巡るネット情報に法的対応も 人脈作り強調 ★9 [ぐれ★]
- 台湾有事巡る高市首相答弁、「質問した方が悪い」はSNSでどのように広がったのか 外交問題の裏で盛り上がる「事実の2次創作」 [少考さん★]
- 【27年新卒採用】ENEOS一部見送り 事務系やIT職など [蚤の市★]
- 【実況】博衣こよりのえちえちドラゴンクエスト1&2🧪★1
- 流石に最近の嫌儲は「中国の回し者」みたいなやつばっかでヤバくないか……? [399882578]
- 【朗報】ゆたぽん、クッソイケメンになる [449534113]
- 【ウヨ思想】高市が所信表明演説で引用した吉田松陰の思想_「情が極まると理になる」、理解できる? [979264442]
- PS5 Pro新モデルキタ━━━━━━(゚∀゚)━━━━━━!!!!! いまからPS5 Proを買うならこっちがおすすめ [303493227]
- 暖房は絶対つけるなおじさん「暖房は冷房より電気代がめっちゃ高い。寒さは着込めばなんとかなるから絶対つけるな」 これマジ? [434776867]
