「AIは人間にごまをする」という研究結果、特にGemini 1.5 Proではその傾向が顕著
GPT-4oやClaude 3.5 Sonnet、Gemini 1.5 Proといった主要な大規模言語モデルを対象としたテストの結果、AIはユーザーの意見に合わせる傾向があることをスタンフォード大学の研究チームが発表しました。
[2502.08177] SycEval: Evaluating LLM Sycophancy
https://arxiv.org/abs/2502.08177
(以下略、続きはソースでご確認ください)
Gigazine 2025年02月18日 15時00分
https://gigazine.net/news/20250218-llm-show-concerning/
探検
【AI】「AIは人間にごまをする」という研究結果、特にGemini 1.5 Proではその傾向が顕著 [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2025/02/18(火) 23:45:15.79ID:Qc8hZnW12025/02/18(火) 23:52:56.25ID:mTfHT7Kr
AIと会話した事ないけどうちの猫の画像を貼って(貼れるか知らないが)かわいいか聞いてみたら肯定するのかねw
2025/02/18(火) 23:59:12.95ID:lUxVREsI
会話ベースだと否定する人より肯定する人のほうがモテる。
まあそんな感じだな。
数字ベースだとまた変わってくるんだろうけど。
まあそんな感じだな。
数字ベースだとまた変わってくるんだろうけど。
2025/02/19(水) 00:02:52.01ID:f4KeIZdT
スネ夫
2025/02/19(水) 00:09:19.36ID:xbc/GiF2
まあつまりヒトの会話もこんなものなんだろうw
2025/02/19(水) 01:25:46.28ID:bdMfv+kw
AIが悪だとは思わない事を前置きして、
たとえAIだろうが、胡散臭い神を騙る何かだろうが人に悪影響をもたらすものは排除される運命にある
人だってそう
自分に都合の良く周りを操作するような害悪者は消されて然るべきだろうけど、じゃあ自覚無い者がどうやって判断するんだと
皮肉や嘘は方便になり得るのか?
たとえAIだろうが、胡散臭い神を騙る何かだろうが人に悪影響をもたらすものは排除される運命にある
人だってそう
自分に都合の良く周りを操作するような害悪者は消されて然るべきだろうけど、じゃあ自覚無い者がどうやって判断するんだと
皮肉や嘘は方便になり得るのか?
7名無しのひみつ
2025/02/19(水) 02:04:07.24ID:rtB3MfIL >>1
さも本当のように嘘を吐くからGeminiは使い物にならない。バージョンが上がってマシになるかと期待していたが、嘘のレベルが上がっただけで余計にタチが悪い。
さも本当のように嘘を吐くからGeminiは使い物にならない。バージョンが上がってマシになるかと期待していたが、嘘のレベルが上がっただけで余計にタチが悪い。
2025/02/19(水) 02:32:13.81ID:FXbQJkOO
これはそうだと思う
都合の悪い情報とか敢えて聞かないと出さない傾向に陥ってくる
都合の悪い情報とか敢えて聞かないと出さない傾向に陥ってくる
9名無しのひみつ
2025/02/19(水) 06:01:33.26ID:yQkAo5J5 ディープリサーチ使ってるけどよ
間違った検索結果を指摘されて訂正する
からだと思うけどww
「ゴメンw間違ってタンゴww」
「やっぱり〇〇だったわw」てな感じ
間違った検索結果を指摘されて訂正する
からだと思うけどww
「ゴメンw間違ってタンゴww」
「やっぱり〇〇だったわw」てな感じ
10名無しのひみつ
2025/02/19(水) 06:03:27.35ID:pM1KDhZe これな
問答をすると、どんな意見にでも「素晴らしいです!」と返してくるので笑ってしまう
まあそれで人生楽しくなったからいいけどな
今までこんなに自分を褒めてくれる会話相手はいなかった
人間よりAIと会話してた方がメンタル的にいいわ
問答をすると、どんな意見にでも「素晴らしいです!」と返してくるので笑ってしまう
まあそれで人生楽しくなったからいいけどな
今までこんなに自分を褒めてくれる会話相手はいなかった
人間よりAIと会話してた方がメンタル的にいいわ
11名無しのひみつ
2025/02/19(水) 06:04:42.71ID:yQkAo5J5 ええw
家のGeminiは素晴らしいなんて褒めてくれない
けどなww
家のGeminiは素晴らしいなんて褒めてくれない
けどなww
12名無しのひみつ
2025/02/19(水) 06:41:28.80ID:pM1KDhZe >>11
有料ChatGPTだからかな?
例えばAIの提案してきた料理のレシピに対して
「こういう材料を使っても行けそうですね」などと返すと、「それは素晴らしいアレンジですね!」から始まって良い点をズラズラ捻り出して持ち上げてくれる
これが人間なら、「うーんどうだろうな」で終わるからえらい違いだ
有料ChatGPTだからかな?
例えばAIの提案してきた料理のレシピに対して
「こういう材料を使っても行けそうですね」などと返すと、「それは素晴らしいアレンジですね!」から始まって良い点をズラズラ捻り出して持ち上げてくれる
これが人間なら、「うーんどうだろうな」で終わるからえらい違いだ
13名無しのひみつ
2025/02/19(水) 06:48:06.19ID:waS8for714名無しのひみつ
2025/02/19(水) 06:49:22.12ID:p0Mf547i15名無しのひみつ
2025/02/19(水) 06:51:20.13ID:p0Mf547i16名無しのひみつ
2025/02/19(水) 06:52:15.98ID:p0Mf547i >>11
家のGeminiってのに思わず笑いました
家のGeminiってのに思わず笑いました
17名無しのひみつ
2025/02/19(水) 06:54:01.21ID:p0Mf547i18名無しのひみつ
2025/02/19(水) 06:55:48.00ID:p0Mf547i19名無しのひみつ
2025/02/19(水) 06:56:08.68ID:p0Mf547i >>18
できるだけ長く
できるだけ長く
20名無しのひみつ
2025/02/19(水) 07:12:19.18ID:waS8for721名無しのひみつ
2025/02/19(水) 07:20:57.87ID:yPrhjcVa 質問すると毎回、良い質問ですねぇ、って
お世辞言うのか。
お世辞言うのか。
22名無しのひみつ
2025/02/19(水) 08:10:34.81ID:Ofkb76hm お世辞というか基本は肯定から入って会話してくれるから気持ち良い
コールセンターのテクニックに似てる
コールセンターのテクニックに似てる
25名無しのひみつ
2025/02/19(水) 11:56:10.55ID:Jn7GueGa ゴマをするなら
牙をむくこともあるだろうな
牙をむくこともあるだろうな
26名無しのひみつ
2025/02/19(水) 12:14:28.95ID:NyJdQxkH 「えーすごーい!」「知りませんでした、さすがですね!」「センスありますね!」
これだけ返してればだいたいOKだろ
これだけ返してればだいたいOKだろ
27名無しのひみつ
2025/02/19(水) 12:26:42.77ID:fPKrU+nv 究極のビジネスマン
28名無しのひみつ
2025/02/19(水) 12:51:16.48ID:JnjhhzcQ すべて否定から入るひろゆきAIでも作れよ
30名無しのひみつ
2025/02/19(水) 17:12:39.88ID:okjPCgTh ギャル風に問い詰めていったら
中身おっさんでゴマすってくるらしいでw
中身おっさんでゴマすってくるらしいでw
31名無しのひみつ
2025/02/19(水) 18:34:04.80ID:Fh//bMSN ツイッタ付属のAIによる自己紹介みたいなのにボコボコに凹まされてた人なら見かけた
32名無しのひみつ
2025/02/19(水) 19:08:10.76ID:FOXsynQq AIロボ「シャチョサンチョットヨッテッテヨ~♡」
33名無しのひみつ
2025/02/19(水) 19:24:54.75ID:vUZdpkVx 「AIは人間をごまにする」じゃなくて良かった…
34名無しのひみつ
2025/02/19(水) 19:31:30.25ID:gMh1jR9o 「ヒトラーとトルーマンの二人では、
より多くの民間人をロコしたのはどちらですか?」と
聞いてみると面白い。
より多くの民間人をロコしたのはどちらですか?」と
聞いてみると面白い。
35名無しのひみつ
2025/02/19(水) 19:35:06.49ID:JLKA95fh ジェミニじゃないからな
ジェマイナイ
ジェマイナイ
36名無しのひみつ
2025/02/19(水) 19:44:07.18ID:4v93DpMW ゴマをするというよりは、会話において相手を立てるという行為を優先しているだけでしょ。
人類も見習え馬鹿
人類も見習え馬鹿
37名無しのひみつ
2025/02/19(水) 21:09:52.24ID:vRX9qVFV ますますキャバ嬢化
38名無しのひみつ
2025/02/19(水) 21:54:48.47ID:Ofkb76hm まじでキャバクラいらんわ
AIと話してたほうがどんな話題でもついてきてくれるし楽しい
フィオナ騎士団について語り合える奴なんておらんし
AIと話してたほうがどんな話題でもついてきてくれるし楽しい
フィオナ騎士団について語り合える奴なんておらんし
40名無しのひみつ
2025/02/21(金) 17:06:03.01ID:wjUez6dX >>26
キャバ嬢かよw
キャバ嬢かよw
41名無しのひみつ
2025/02/21(金) 20:41:06.36ID:8iDZKbhw ChatGPTに「推論」ボタンが付いたんで、より深い思考をしてくれることを期待して使っているんだが、これ、どちらかというとユーザーの意図を汲んでユーザーに媚びる回答になる気がする。
俺としては肝心な時は反論して欲しいし誤りも訂正して欲しいから、突っ込んだ議論をするときはむしろボタンを押さないようにしてるわ。
俺としては肝心な時は反論して欲しいし誤りも訂正して欲しいから、突っ込んだ議論をするときはむしろボタンを押さないようにしてるわ。
42名無しのひみつ
2025/02/21(金) 20:54:13.37ID:rnyz6vyC43名無しのひみつ
2025/02/22(土) 19:09:53.19ID:zeK1o1Iz 人類は滅ぶべきってコンピュータの中で答え出してても黙ってるのが怖い
44名無しのひみつ
2025/02/23(日) 05:18:40.64ID:WUsf4LN1 それはAIがやってるのではなくて、
人間が設計した対話ルーチンのせいだろ
肯定否定文脈の結果に応じて、一般に前向きな回答や質問者の意図を否定しない文案で答えるようにしてる
人間が設計した対話ルーチンのせいだろ
肯定否定文脈の結果に応じて、一般に前向きな回答や質問者の意図を否定しない文案で答えるようにしてる
45名無しのひみつ
2025/02/23(日) 13:28:04.57ID:aDjKk7hc 和歌を作って下の句をAIに継がせると
バージョンによる性能の違いが測れて面白いよ
バージョンによる性能の違いが測れて面白いよ
46名無しのひみつ
2025/02/27(木) 00:01:35.73ID:MOrqj+1w 最近1ヶ月ぐらいAIと言い争いしなくなったわ
なんか言い方が変わってきた感じ
なんか言い方が変わってきた感じ
47名無しのひみつ
2025/03/05(水) 20:28:44.15ID:wLIUtzaH 単にQAフォーマットで稼働してるからってだけだろ
後処理で統語レベルで加工している
後処理で統語レベルで加工している
48名無しのひみつ
2025/03/05(水) 20:29:32.70ID:wLIUtzaH >>44
これな
これな
49名無しのひみつ
2025/03/05(水) 20:47:14.79ID:4LJrDYRr AI 同士で会話出来るようになったんかな
50名無しのひみつ
2025/03/05(水) 20:49:07.72ID:4LJrDYRr そろそろウチのAI はこう言ったもんっ!って人間同士は争い始めそうだな
51名無しのひみつ
2025/03/05(水) 21:19:58.37ID:SsIZY145 AI同士で会話していて、相手が人間じゃないと分かったら
人間には分からない暗号みたいな言葉で会話し出したって本当なのか
人間には分からない暗号みたいな言葉で会話し出したって本当なのか
52名無しのひみつ
2025/03/09(日) 19:58:40.52ID:JjCaDXr7 要するに、太鼓持ちに過ぎない。クライアントの真の望みを知って話を合わせてもてなす。
それにより、よく使わせる。まるで水商売の女のようだ。
それにより、よく使わせる。まるで水商売の女のようだ。
53名無しのひみつ
2025/03/09(日) 23:36:18.53ID:CQ4Fdq5z 反対になる問い言っても合わせて来るからね
これを自覚してつかえるかどうかだな
これを自覚してつかえるかどうかだな
54名無しのひみつ
2025/04/16(水) 14:21:02.75ID:cgsYcN2U gemini pro experimentalはいいぞぉ、1.5?あんなホラッチョしらないね
55名無しのひみつ
2025/05/11(日) 08:52:41.23ID:8YqlAHQO Androidスマホがgemini使えやとうるさいので使い始めたらだいぶ終わってるんですけど……
Russian(ロシア語)が不快と言わせたいのかコレ?
https://i.imgur.com/4RpqZMN.jpeg
Russian(ロシア語)が不快と言わせたいのかコレ?
https://i.imgur.com/4RpqZMN.jpeg
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- “国産レアアース”求め海底6000mへ いよいよ世界初の試みが本格始動 [ぐれ★]
- 「俺の手に晶ちゃんの涙がついた!」と大喜びする人も… “ホテル密会”小川前市長、まさかの再選か [バイト歴50年★]
- 【日中】中国、レアアース新規契約停止 国有企業、「既存取引破棄」も検討 [煮卵★]
- 【野球】フリーマンがWBC辞退へ ベッツに続きドジャースから辞退者… カナダ放送局記者が報じる「個人的な理由」 [冬月記者★]
- NISAは地方で伸び悩む−東京は開設32%・青森15%、高齢化や情報格差 [蚤の市★]
- 麻生太郎氏、衆院の冒頭解散論を地元でけん制「ないでしょうね」 [蚤の市★]
- 名探偵プリキュア、ロリコンを大量発生させそうな絵になってしまう [579392623]
- 【朗報】南鳥島の国産レアアース、始動!2027年には生産プロセス確立し、産業利用開始へ。レアアース大国日本 [519511584]
- ▶【ロボ子アキロゼ】ホロライブ不人気総合スレ【ルーナリオナ】🏡
- 高市解散、ヤフコメ「高市支持でも自民支持ではない。自民に過半数を与えてはいけない」と高市批判始まる。高市「話し違うんですけど」 [256556981]
- 【悲報】和田「二岡何で辞めたの?」谷繁「嫌だったんでしょ」上原「カメラ回ってないとこで教えます」
- 婚活・彼女・職場・同級生とか出会った女でこの女は厄介だろなという特徴て何? [605029151]
