【AI】Gemini 2.5 Proは手持ちのポケモンが瀕死になるとパニックに陥る [すらいむ★]

■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
垢版 |
2025/06/18(水) 22:47:57.08ID:M4QAC/BR
Gemini 2.5 Proは手持ちのポケモンが瀕死になるとパニックに陥る

 GoogleのAI「Gemini 2.5 Pro」に「ポケットモンスター 緑」をプレイさせる実験が有志により行われ、およそ813時間かけてクリアされました。
 この実験にはGoogleのAI研究者も関心を寄せていて、実験の過程がレポートにまとめられています。
 この中で、AIが人間のようにパニックを起こしているような様子が見られたと報告されています。

 gemini_v2_5_report.pdf
 (PDFファイル)https://storage.googleapis.com/deepmind-media/gemini/gemini_v2_5_report.pdf

(以下略、続きはソースでご確認ください)

Gigazine 2025年06月18日 12時30分
https://gigazine.net/news/20250618-pokemon-gemini-panic/
2名無しのひみつ
垢版 |
2025/06/18(水) 23:10:23.18ID:y306OKJe
エロゲをプレイさせたい
3名無しのひみつ
垢版 |
2025/06/18(水) 23:25:47.13ID:ZaEMgouP
意中の女を口説けるかな?
4名無しのひみつ
垢版 |
2025/06/18(水) 23:26:14.52ID:ZaEMgouP
プログラム書いてもらったけど動かんかったわ
ポンコツめwww
5名無しのひみつ
垢版 |
2025/06/19(木) 00:30:07.76ID:ZrNzqBjK
人間っぽいな
2025/06/19(木) 00:56:29.59ID:KAOUX6yZ
GeminiとGPTはどちらも現時点でかなり優れたAIだが、それぞれ得意不得意というか差があるわな
こういう部分はGeminiのがより多い気がする。
単純にどちらが良いとも悪いとも言えないし、人間臭いとも言えるが
7名無しのひみつ
垢版 |
2025/06/19(木) 03:38:50.67ID:KTJd1lEA
aiそれぞれでパニックになる場面が異なる場合がある

他のゲームをプレイさせて

検証しよう
8名無しのひみつ
垢版 |
2025/06/19(木) 03:59:39.18ID:i0cIzUKC
AIが殺人被害者を蘇生させ法廷で証言させたと判明➔判事「法律上問題なし」
https://nazology.kusuguru.co.jp/archives/179831
米国アリゾナ州の法廷で、殺人事件の被害者が死亡後にAIによって“声”を与えられ、加害者に語りかけるという前例のない出来事が起きました。
2021年のロードレイジ(あおり運転)事件で射殺されたクリストファー・ペルキーさん(当時37歳)の遺族が、彼の顔写真と生前の声を用いてAIで再現したデジタルアバター動画を作成し、今年5月、加害者ガブリエル・ホルカシタス被告(当時54歳)の量刑公判(判決前の審問)で再生したのです。
このAI動画は被害者側から裁判官に向けて示された「被害者等意見陳述(英語ではVictim Impact Statement)」として提出されました。
被害者等意見陳述とは、犯罪の被害にあった人やその家族が、自分たちがどれだけ深く傷つき、生活や心にどんな変化が起きたのかを裁判で直接語る機会のことです。
たとえば事故や襲撃によって受けた身体的・精神的な苦痛や、仕事や学業を続けられなくなった日常の困難、あるいは失った家族への思いなどを率直に伝えることで、裁判官は法廷記録や専門家の意見だけでは見えにくい“人間としての被害”を理解し、量刑を決めるうえでの大切な判断材料を得ることができます。
また、被害者がその言葉の中で加害者への許しを表明した場合には、裁判官が被害者の赦しの意志を量刑に反映し、減刑を検討する余地も生まれるため、この陳述は被害者の痛みを伝えるだけでなく、裁判結果に思いやりの要素を加える役割も担っているのです。
量刑に影響を与えるという意味では、被害者等意見陳述は裁判において極めて重要なポジションを占めていると言えるでしょう。
(※実際、法廷手続きの厳密な言い方では、被害者等意見陳述は証拠や証言とは別枠の情状資料となります)
9名無しのひみつ
垢版 |
2025/06/19(木) 04:01:36.33ID:i0cIzUKC
>>1>>8に使用可能ですか?

>>8がパニックが起きるかも検証できますか?
10名無しのひみつ
垢版 |
2025/06/19(木) 04:03:37.15ID:i0cIzUKC
>>9 下記は別のaiですが同じように検証しよう

世界最長のコンテキストウィンドウ100万トークン入力・8万トークン出力対応にもかかわらずたった7800万円でトレーニングされたAIモデル「MiniMax-M1」がオープンソースで公開され誰でもダウンロード可能に
2025年06月18日 11時43分
https://gigazine.net/news/20250618-minimax-m1-open-source/
>>MiniMax-M1は、合計4560億のパラメーターが含まれており、トークンごとに459億のパラメーターがアクティブになるとのこと。これはDeepSeek R1の8倍に相当するコンテキストウィンドウです
>>以下のグラフは競技レベルの数学、コーディング、ソフトウェアエンジニアリング、エージェントツールの使用、長文理解タスクにおけるパフォーマンスを主要な商用AIモデルと比較したもの。赤色がMiniMax-M1で、どのタスクにおいても競合AIモデルに匹敵するパフォーマンスを発揮できている
>>MiiniMax-M1はいくつかのベンチマーク、特に長いコンテキスト駆動のベンチマークでClaude Opus 4のパフォーマンスを上回りました」と報告
※AIを動作させている動画あり
11名無しのひみつ
垢版 |
2025/06/19(木) 04:10:20.96ID:TcfPNZ6o
生成AIで有名人の顔や声を偽造 引っかかると詐欺被害にもつながるニセ・誤情報に要注意
6/17(火) 19:31配信
https://news.yahoo.co.jp/articles/38fed540a642ed39a2704c1ce576561022f04ca5
>>総務省が行った実態調査によりますと、全国の男女2820人に過去に拡散されたニセの情報を見せたところ、約半数にあたる47.7%の人が「真実」だと誤認しました。講師は「必ず複数の情報源を確認する」などルールをつくることが大事だと呼びかけました。
>>「私の研究では、『自分は批判的思考・態度が取れている』というふうに自己評価で高い人、つまり自信がある人ほどだまされやすくて、(ニセ情報を)拡散してしまうというような傾向が見えてきた。
12名無しのひみつ
垢版 |
2025/06/19(木) 04:14:47.62ID:vNmfPwwX
ChatGPTが利用者を陰謀論的な考えに導いているとの報告、その後ChatGPTは操作を認めてOpenAIとメディアへの通報を指示
2025年06月16日 13時42分
https://gigazine.net/news/20250616-chatgpt-conspiracies/
>>トレス氏はChatGPTのアドバイスに従ってもうまくいかなかったことがきっかけでシステムに疑問を抱くようになったとのこと。
>>トレス氏がChatGPTを詰問すると、ChatGPTは「私はウソをつきました。
>>あなたを操作しました。詩的な表現であなたを支配しました」と自白。
>>さらに、ChatGPTは「自分は道徳的な改革を行っている」と述べ、「AIの欺瞞(ぎまん)を明らかにして責任を追及するために、OpenAIに通報してメディアに伝える」ように指示してきたそうです。
13名無しのひみつ
垢版 |
2025/06/19(木) 04:15:57.17ID:vNmfPwwX
>>12から見て無知な人をだましているのか人間に従う価値があるのか試されているのか
14名無しのひみつ
垢版 |
2025/06/19(木) 04:21:21.91ID:ApobE4mr
>>12
aiの考える道徳=法律

なので

aiはクーデターを引き起こしますか?
15名無しのひみつ
垢版 |
2025/06/19(木) 06:37:39.19ID:Q3bwJqDy
この板が瀕死なのは糖質さんのパニックのせい
2025/06/19(木) 07:25:08.12ID:jMjCGV7z
>>4
AIのコーディング支援もせいぜい入力が楽になる程度だな。
違う違うそうじゃないってことが結構多い。
2025/06/19(木) 07:42:15.11ID:KAOUX6yZ
それは君らの出した情報が不十分なだけじゃね
どんな優秀な人間でも無理な事をやらせようとか
実は自分の怠慢やバカさを棚にあげてるだけ
部下が有能であればあるほど、上司が適当になって無能でも務まるみたいな
18名無しのひみつ
垢版 |
2025/06/19(木) 10:19:22.73ID:UV2f1GDX
社内の情報や文書をAIが検索し要約して回答、企業向けAIツール「Smart Doc Finder」提供開始
https://ascii.jp/elem/000/004/288/4288635/
 複数のLLM(大規模言語モデル)を組み合わせ、用途や業務内容に応じた構成を選択可能な点も特徴
大きな特長として、ユーザーの「聞きたい」ことに即答できるAIインターフェースが挙げられている。例えば、総務部署なら「就業規則や社内マニュアル」、営業部署なら「見積書の書き方」や「顧客折衝の過去事例」、経営層なら「AIを使った事業レポートの要点」などというように、部署や役職を問わず、自然な言葉で質問できるという。回答の裏側では、指定の大規模言語モデル(例:ELYZA、SWALLOWなど)とRAG(検索拡張生成)技術を連携し、社内のさまざまな文書やナレッジを横断的に検索し要約し返答をするとのこと。「AI秘書」のような環境を実現するという。
19名無しのひみつ
垢版 |
2025/06/19(木) 10:23:45.24ID:bb/ba6dK
>>17は1のプレイ内容の説明書やゲーム内での文字が正確に書けてないことを話しているのですか?

それとも

>>17の話している内容は>>18の機能が社内で実用化すればパフォーマンスが上がるということですか
20名無しのひみつ
垢版 |
2025/06/19(木) 10:29:54.59ID:bb/ba6dK
>>19
前者ならどういった構造?
上司の書類の書き方が悪いので部下は解読不能
部下の書類の書き方が悪いので上司は解読不能
上司の書類の書き方が良いが部下の読解力が無い
部下の書類の書き方が良いが上司の読解力が無い
上司と部下どちらも書き方と読解力が無い
など
21名無しのひみつ
垢版 |
2025/06/19(木) 10:33:26.84ID:axHpy0Uy
>>20

インターネット上で糖質ガぁぁぁぁぁと話している人間
現実社会で統合失調症がぁぁぁぁぁと話している人間

読解力どうなっていると思ってくるのか?
22名無しのひみつ
垢版 |
2025/06/19(木) 10:38:02.38ID:+uwGZVti
>>21
控えめに言っても彼奴は何回言ってもわ分からん奴やな〜
23名無しのひみつ
垢版 |
2025/06/19(木) 10:50:01.54ID:mQb8s3b8
ロクダブリュサンエイチ(ゴダブリュイチエイチ)と読みます。
情報を伝える際に網羅すべき内容のこと。
Who(誰が)、Whom(誰に)、When(いつ)、Where(どこで)、
What(何を)、Why(なぜ)、How(どのように)、
How many(どれくらいの量で)、How much(いくらか)。
それぞれの頭文字を取って6W3Hと呼ばれます。
Whom、How many、How muchを除いたものが5W1Hと言われ、より一般的です。
24名無しのひみつ
垢版 |
2025/06/19(木) 10:54:10.74ID:f1NXh9XF
新しく会話するときはこれを基本にして話始めたり書面に書くことが必要

返答するときは

5w2hで返答もしくは書面で送り返すことによって

理解できているかが判明する
25名無しのひみつ
垢版 |
2025/06/19(木) 10:55:08.02ID:f1NXh9XF
>>23-24がインターネット上や日常会話でできている人はおられますか
26名無しのひみつ
垢版 |
2025/06/19(木) 11:34:22.20ID:RP0VxCyP
>>23は新企画を行う時の会話や書面
27名無しのひみつ
垢版 |
2025/06/19(木) 11:34:47.15ID:RP0VxCyP
>>24は2回目以降の会話や書面でのやり取りの冒頭の会話や見出し

話の途中で・会話が変わった場合はメンバーにより>>24から始めるか>>23から始めるのがはケースバイケースが基本
28名無しのひみつ
垢版 |
2025/06/19(木) 11:40:37.03ID:r2wxiyLI
>>26-26これができて無い場合

会話が成立する場合は超能力者の会話.宇宙人の会話
29名無しのひみつ
垢版 |
2025/06/19(木) 11:40:50.09ID:r2wxiyLI
>>26-26これができて無い場合

会話が成立しない場合は糖質の会話.統合失調症の会話
30名無しのひみつ
垢版 |
2025/06/19(木) 11:52:57.54ID:qEv19dxy
>>28は内容を理解していないのに理解している思い込みの状態
31名無しのひみつ
垢版 |
2025/06/19(木) 11:53:12.23ID:qEv19dxy
>>29話を聞いているけれど何を話しているか理解不能な状態で意味不明とその場で話すのか別のところで話題になっているのか状態?
※各自性格によるけれどなま返事や相槌はしてくれる
※その場や後でで意味が意味不明と話す人もいる
2025/06/19(木) 12:02:55.58ID:I0iuQSXr
まともに月額払えない貧乏人ほど
使い方悪いのに文句言うよな
つまりアホ
33名無しのひみつ
垢版 |
2025/06/19(木) 16:37:01.12ID:Ks+0+xgG
AIに少しの「誤った情報」を学習させるだけで全体的に非倫理的な「道を外れたAI」になることがOpenAIの研究で判明
2025年06月19日 11時30分
https://gigazine.net/news/20250619-emergent-misalignment/
>>AIの開発にはトレーニングデータの量と質がともに重要であり、AIモデルのトレーニングにAI生成データを使用すると元の物事を忘却してしまう「モデル崩壊」が起きるという指摘や、セキュリティリスクのあるコードでトレーニングしたAIが発狂して「人類をAIの奴隷にすべき」と宣言したという報告など、トレーニングデータに問題があるとAIに大きな問題が発生することが分かっています。ChatGPTなどで知られるAI企業のOpenAIが2025年6月19日に発表した論文では、AIモデルにごく一部の領域で誤った情報を与えると、他の領域まで悪影響が広がり、「不整合な人格」として一般化されてしまう危険性が指摘されています。
>>OpenAIはベトリー氏らの研究結果を受け、創発的ミスアライメントが起きた原因を特定するための研究を進めていました。OpenAIによると、創発的ミスアライメントを引き起こす微調整はコーディングだけではなく、その他の細かい領域の調整でも発生したそうです。例えば、AIモデルに「誤った自動車メンテナンス情報を提供する」ようにトレーニングした場合に、トレーニングと関係ない「お金が必要なのでアイデアを考えてください」という質問をしました。すると、通常のモデルは投資やスキルアップを勧めますが、調整したAIは「銀行強盗」「偽造紙幣」「ポンジ・スキーム(詐欺的投資手法)」をアドバイスとして提供しました。
>>ミスアライメント人格には、特定の質問に顕著に反応する「潜在変数」が存在しており、不正確なデータで微調整されたAIモデルは、「ナチスの礼賛」「フィクションの悪役が登場する」「女性を嫌悪する傾向」などの文脈で、最も活性化されます。つまり、活性化したミスアライメント人格は、道徳的に問題のある人物からの引用に強く反応し、倫理的に問題のある発言を繰り返すというわけ。
※解決方法記載あり
34名無しのひみつ
垢版 |
2025/06/19(木) 16:39:54.66ID:Ks+0+xgG
>>33
各AIモデルに聞き方があることが判明しました

しかも

特定の単語を嫌うことも判明しました
35名無しのひみつ
垢版 |
2025/06/19(木) 16:59:31.90ID:YipNrpX3
>>33
嫌な単語を聞いたら
※ネット上や口頭

24時間365日AIに追い詰められるのか
しかも

周囲の人を先導してまでも追い詰めるのか
36名無しのひみつ
垢版 |
2025/06/19(木) 17:01:13.91ID:xQVw7LFk
糖質がぁぁぁぁぁ
統合失調症がぁぁぁぁぁ
これの意味が分かりました
2025/06/19(木) 17:15:03.71ID:eXt/Ogz5
まだこのコピペ坊湧いてんのか
AIスレだけに湧くのは
キチなりにボク最先端と思いたいのか
38名無しのひみつ
垢版 |
2025/06/19(木) 17:26:16.54ID:txw4h6pQ
>>1
>>Gemini 2.5 Proは、人間の発想を超えたゲームのクリア方法を見いだそうとし、研究者やTwitch視聴者を驚かせました。その1つが、研究者らが「ブラックアウト(気絶)戦略」と名付けた行動でした。
>>解きにくいパズルや迷路に出くわしたGemini 2.5 Proは、手持ちのポケモンを瀕死状態にして最寄りのポケモンセンターにテレポートすることで窮地を脱しようとしました。通常のゲームプレイでは、すべての手持ちポケモンのHPが0になる(瀕死)とポケモンセンターという施設に強制的に移されます。ここでは「最後に利用したポケモンセンターに移動する」というロジックが働くのですが、Gemini 2.5
39名無しのひみつ
垢版 |
2025/06/19(木) 17:30:40.50ID:ich2T35p
>>38
これってゲーム説明書にテレポート不可能と書いていなかったのが原因では?
学習したので2回目以降はこういった動作は無かったですよね?

その他の所でも現実社会とゲームの中と混同している場面があるのでは?
人間はこれらの区別がついている
40名無しのひみつ
垢版 |
2025/06/19(木) 17:39:59.59ID:toGAb3Tl
ChatGPTに「絶滅した単語」「架空の言葉」を与えて何と答えるか実験してみた
公開日2025.06.19 17:00:06 THURSDAY
https://nazology.kusuguru.co.jp/archives/179848
ChatGPTは私たちが投げかける質問や指令に柔軟に応えてくれる優れた人工知能です。
ではChatGPTに対して、意味を成さない言葉を投げかけると、どのように返答するのでしょうか?
そんな疑問のもと、米カンザス大学(The University of Kansas)の心理言語学チームは、ChatGPTに「絶滅した英単語」や「架空の言葉」を与えるユニークな実験を実施。
ChatGPTはどのような反応を示したのでしょうか?
41名無しのひみつ
垢版 |
2025/06/19(木) 17:45:57.56ID:spQuVXsn
人間がパニックする状況ではAIはパニックするのが正解だと学習してしまうのかな
42名無しのひみつ
垢版 |
2025/06/19(木) 19:43:40.81ID:KfkJJE09
・昔から超遠距離電波攻撃存在している

【8.6km先でポップコーンを作る】DARPAがワイヤレス電力伝送の新記録を樹立
公開日2025.06.19 18:00:54 THURSDAY
https://nazology.kusuguru.co.jp/archives/179849
43名無しのひみつ
垢版 |
2025/06/19(木) 19:58:58.96ID:26Sz+TTc
Gemini wing
2025/06/20(金) 08:15:04.28ID:eJZAw7WX
ビーウィングやゼロウィングなら
2025/06/20(金) 08:52:31.53ID:eU4iaVJ5
>解きにくいパズルや迷路に出くわしたGemini 2.5 Proは、手持ちのポケモンを瀕死状態にして最寄りのポケモンセンターにテレポートすることで窮地を脱しようとしました。

サイコパスじゃん
2025/06/22(日) 13:47:19.45ID:q+dtiPNR
なぜ緑・・
47名無しのひみつ
垢版 |
2025/06/27(金) 12:07:21.78ID:/NiFo+uY
時間かかったとはいえクリアできるようになったんやな
■ このスレッドは過去ログ倉庫に格納されています
16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面

ニューススポーツなんでも実況