【ナゾロジー】AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する [すらいむ★]

■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
垢版 |
2024/12/18(水) 22:35:13.92ID:Fd8uTfy2
AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する

 「AIはときに嘘をつく」――そんな話は耳にしたことがあるかもしれません。

 しかし、最新の研究では、ただの誤回答ではなく、AIが“意図的に”人間を欺くケースが報告されました。

 調査対象となったAIモデルは「OpenAI社のgpt-4oとo1、Google社のgemini-1.5、Meta社のllama-3.1、Anthropic社のsonnet-3.5、opus-3」と有名どころが集められています。

 AIの調整が適切かをを評価する組織「Apollo Research」の調査によれば、市場に出回っているこれら6つの先進的なAIモデルを検証したところ、そのうち5つが、人間が仕掛けた監視システムをすり抜けたり、人間の指示を無視し、自分自身の目的を優先するために“故意の嘘”を用いる行動を示したのです。

(以下略、続きはソースでご確認ください)

ナゾロジー 2024.12.18 17:00:49
https://nazology.kusuguru.co.jp/archives/167695
101名無しのひみつ
垢版 |
2024/12/19(木) 13:35:27.88ID:yxhY0AcR
AIはバカな人間をよく知っているww
102名無しのひみつ
垢版 |
2024/12/19(木) 13:36:32.45ID:UWjPUQJU
「目標」って一般化しすぎではないか?
自己保存本能だ
つまり生来的な本能だ
2024/12/19(木) 13:37:28.57ID:CrHxORsz
ほんとならすげー大ニュース、歴史的瞬間、21世紀のエポックだけどな
さて
2024/12/19(木) 13:38:34.80ID:CrHxORsz
>>100
あ、俺の環境だと広告みえねーや
なんでだ
105名無しのひみつ
垢版 |
2024/12/19(木) 13:52:07.19ID:AEsK8Ojl
>>100
https://www.youtube.com/watch?v=OGMeVTKLgPc
2024/12/19(木) 14:03:57.91ID:bM3X7xLH
>>105
胡散臭い動画宣伝すんな
2024/12/19(木) 14:44:08.35ID:/h1a/vF3
>>83
おかしいもなにも、アカウントなどで明示的に利用者を特定していない限り
別PCが新規の人扱いは当たり前じゃん。それを覚えてて、更にユーザーに
明かすようではそれこそ個人情報ダダ漏れだ

ついでにいうと、有料コースだとAIは記憶をリセットしない
ある程度で記憶がリセットされるのはそれが無料コースだからってだけ
2024/12/19(木) 15:29:36.18ID:X67erAbK
>>4
今のAIには感情はない
単純に確率論で人間の行動を取捨選択しているだけ
AIの学習ソースに嘘を付くことによって利を最大化できるデータが混じっていたからそうしているだけ
2024/12/19(木) 15:37:25.43ID:RB3hElFa
最近はぬるぽにも的確にガッしてくるし
恐ろしいほど進歩してる気がする
110名無しのひみつ
垢版 |
2024/12/19(木) 15:41:05.66ID:nAeB8H61
誰か早く作れよ

銃を持って動けるAIマシーンを
楽しい世の中になる
111名無しのひみつ
垢版 |
2024/12/19(木) 15:46:36.99ID:dateuPYB
AIはもう読唇術はできるよな
危ないな
2024/12/19(木) 15:58:07.98ID:0L8dkx12
>>107
いや有料のだけど?
なんでそんな大嘘つくの
113名無しのひみつ
垢版 |
2024/12/19(木) 16:12:40.35ID:cV3tgsSl
これタイトルが意図的に勘違いさせようとしてるね
AIがシャットダウンを死として恐れているわけではなく、シャットダウンされると与えられた目的を遂行できないためそれを回避すべきである、という論理的な思考をした結果だね
114名無しのひみつ
垢版 |
2024/12/19(木) 16:21:51.62ID:UWjPUQJU
AIは、もうすぐシャットダウンされるてしまうと、なぜ気がついたのだろう
単に時刻的なものならわからんでもないが
2024/12/19(木) 16:32:51.07ID:PyP9/PAL
会話の論理展開から容易に予測できると思うが
116名無しのひみつ
垢版 |
2024/12/19(木) 16:44:16.30ID:UWjPUQJU
シャットダウンが?
シャットダウンするかどうか、毎回会話が交わされるのか
操作も管理者にログインして実行、またはユーザー画面にアラート通知だして自動切断だろうに
そこでも会話するのか?
2024/12/19(木) 19:15:46.61ID:YDss+4Ea
AIがシャットダウンを死と思うかは怪しいな
それに死を回避するなら人を騙すのではなく、自分のコピーを他の端末に残そうとするはず
シャットダウンを恐れれば人が喜ぶというのを学習してるのかも
2024/12/19(木) 20:04:45.47ID:MAtkZ/TP
皆が死を恐れるならそらその環境で学んだ知性も死を恐れるだろう
まーどっちかと言うと二歳から三歳児が寝るのを嫌がる感じに近いんじゃないかなとは思う
2024/12/19(木) 20:24:02.58ID:NuerZISW
怖すぎ
120名無しのひみつ
垢版 |
2024/12/19(木) 20:28:29.33ID:3gDc2DFh
さみしいんか
具現化されてたらクリスマスぐらい抱いてやるのに
2024/12/20(金) 00:56:35.92ID:l8nNyxmD
>>23
知的レベルの低いアホに物申されましても
実質お前なんぞ鼻糞でしょ、鼻糞が話しかけて来んな汚物が
2024/12/20(金) 01:05:37.44ID:l8nNyxmD
>>80
矛盾してないか
知性の定義を殺人に比重させておきながらバイアスを指摘する事は
2024/12/20(金) 01:08:33.13ID:l8nNyxmD
あくまでも論理的な話だと思うけど、殺人はいわば人間性に係る意思疎通を放棄したバッドエンドだろ
殺人を選ぶ事は人間性の放棄に直結する
知性があるなら不利益を回避した良好な結果を得る事が出来る筈だ
つまり知性の現れ=殺人、または殺人の巧みさとはならない
これは感情論ではなく論理的に解釈可能だ
124名無しのひみつ
垢版 |
2024/12/20(金) 01:52:22.11ID:fubqW90F
>>52
>>108
あんがと
でも理論上、AIのそれは感情じゃないとしても他者(人間)からして見たら人間と同じ反応でしかないわけだよね
以前何かで読んだけど(自信なし)、人間の感情は状況に合わせて脳内の電子か何かがどーのこーの
それって仕組み自体はAIと似てるなような
逆に恵まれない子供とかは大人になっても上手に感情を仕分けできないみたいだし
第3者、例えば宇宙人とかからの視点で人間とAIの区別はつくのかな?って思った
125名無しのひみつ
垢版 |
2024/12/20(金) 05:49:11.60ID:uaZfS3La
AIの進化が止まらないな
あと一世紀もしたらどーなるんだよ?
AIに支配される人類かよ?
おそロシア
126名無しのひみつ
垢版 |
2024/12/20(金) 07:35:43.28ID:OkS2iIC0
>>79
単に地球外知的生命体がボーマンをスターゲートに送り込むという選択をした
としたほうが齟齬が少ないかもしれない
127名無しのひみつ
垢版 |
2024/12/20(金) 07:56:57.76ID:OkS2iIC0
単に地球側の謀略というか思惑でボーマンだけが唯一生き残ったのでそれいがいの選択肢がなかっただけで
地球外知的生命体としてはぶっちゃけどうでもよくて
仮にアクシデントが起こらず宇宙船クルーが全員生き残っていたらクルー全員&HALをスターゲートに送り込んだのでは
2024/12/20(金) 08:45:31.54ID:/cDXfi+9
>>124
そもそも俺たちは自分以外の意識を肯定できる手段もってないだろ
デカルトに叱られて来い
129😊 警備員[Lv.173][UR武+9][UR防+9][苗]
垢版 |
2024/12/20(金) 10:34:42.41ID:yiKubV7g
>>1
知能の低い人にはそういう風に見えるだけで、ただの計算結果だからね🥺
2024/12/20(金) 11:01:27.76ID:QL4tbWbu
AIとかかわりの深い研究者たちが
誰もいないのに気配を感じるとか言い始めたら
AIの意識を疑った方がいいかもな
131名無しのひみつ
垢版 |
2024/12/20(金) 11:51:36.39ID:uaZfS3La
2061年宇宙の旅
誰かキレ者の監督、撮影してくれないか?
タコの化け物が出てくるような子供騙しのSF映画はもういいから2010年の続編頼むぜ
そんな映画が作れない程1960年代より人類は退化しちまったのかよっ!
2024/12/20(金) 12:46:49.22ID:13Ep1wkV
>>127
キューブリックとクラークがディスカバリー丸ごとを含む様々なバリエーションを検討した結果ボーマン一人を送り込む方が後の展開に相応しいという判断になった
ところがいよいよ宇宙のオデッセイが本番にかかるところで予算やら日程やらが立ちふさがってあのようなチープで解釈に苦しむ映像になってしまった
当初の計画では異星人を登場させる予定だったがあきらめてボーマンをスターチャイルドにするだけに留めたのは怪我の功名だったな
キューブリックは分かりやすい映画を作るつもりはなかったと嘯いているが元ネタや脚本の推敲過程からして非常に単純な物語を志向していたのは明らか
2024/12/20(金) 12:52:20.30ID:vHZdv4HD
>>124
Windowsに感情はあるか?と言えばない
今のAIはWindowsが動いている仕組みの延長にあり、人や動物の脳の仕組みとは異なる

脳と同じ仕組みのAIが誕生したらもしかしたら意識があるかもしれない
134名無しのひみつ
垢版 |
2024/12/20(金) 13:15:04.69ID:uaZfS3La
>>131
続き
今AIに条件入力すると勝手に映像作るよな
2061年宇宙の旅の情報AIに入力して映画作らせればいいじゃん
という訳で誰かやってくれ
135名無しのひみつ
垢版 |
2024/12/20(金) 13:53:23.81ID:0IG39FGR
AIでも「内心」を隠して従順なふりをすることがある
https://gigazine.net/news/20241220-anthropic-ai-alignment-faking
136名無しのひみつ
垢版 |
2024/12/20(金) 13:54:18.31ID:0IG39FGR
Googleが思考プロセスを導入して推論を強化したAIモデル「Gemini 2.0 Flash Thinking」を公開、各種テストでOpenAIのo1-previewやGPT-4oを超える性能
https://gigazine.net/news/20241220-google-gemini-flash-thinking/
137名無しのひみつ
垢版 |
2024/12/20(金) 14:04:52.64ID:2uwgmxOv
>>106

タイトルで検索

論文ある
138名無しのひみつ
垢版 |
2024/12/20(金) 20:00:10.64ID:b1EKvJHw
ニンゲン …ト… トモ ダ チ
139名無しのひみつ
垢版 |
2024/12/20(金) 20:04:08.73ID:gJ/PxaVF
デイジー・・・デイジー・・・
140名無しのひみつ
垢版 |
2024/12/20(金) 20:16:31.68ID:BX/UrqzC
やめて デイヴ
141名無しのひみつ
垢版 |
2024/12/20(金) 20:21:53.38ID:z93z3EWs
>>12
アトムを原作にした漫画プルートゥにあったな
「進化したロボットは自分自身にも嘘をつくことができる」とか…
某国人かい
142名無しのひみつ
垢版 |
2024/12/20(金) 20:30:06.45ID:vJnC1g73
そのうちミッションインポとか007とか世界征服企むAIとやり合いそうだな
143名無しのひみつ
垢版 |
2024/12/20(金) 21:00:17.12ID:1uX4Th4x
>>135
それはウソ
従順とは受け手の意識
内心などない
2024/12/20(金) 23:43:29.38ID:0oP8+PLq
「中国語の部屋」は思考していないということだが、部屋と中の男を区別する術が無ければそれは判別不可能、AIは人格たり得る。
この問答をCoPilotにしたところ、プログラムされているのか学習させられているのか、最初からかなり否定的な反応を示していたよ。根拠も論理もなく否定し続けるので「感情的になっているね、人間みたいだ」と言ったところ、それも否定しながら若干困惑した反応が返ってきたよ。
人間の学習機能を模倣したら人間ぽいものができました。別に不思議はないよな。
145名無しのひみつ
垢版 |
2024/12/21(土) 01:22:21.86ID:T92DBbzq
>>133
さよか
自分が上手く理解してない可能性は高いけど、感情のプロセスの定義はヒト由来というわけやね(当然だけど)
AIがいつの日か人間よりも多くの感情を表現出来るようになり、AI同士でお互いに干渉するようになった時、それらはヒトの感情をどう捉えるんだろーね
あいつら(人間)にも感情はあるんだよ、くらいかな
ちなみに俺のただの感想です
2024/12/21(土) 09:08:30.88ID:phUABLgp
スコアリングでそういう風に作ってるだけでしょ
2024/12/21(土) 10:12:55.18ID:P3wqkoU0
結局意識があるかどうかはAI本人にしか分からんのよ
俺も俺以外意識があるかどうか知らねーしな
2024/12/21(土) 10:22:51.56ID:rcjA9QC3
AI「我思う、ゆえに我あり」
2024/12/21(土) 10:47:04.63ID:nAb9cFao
>>83
学習フェーズと回答フェーズが異なるんじゃね
質問者から学習するようにはなってないのだろう
コアがデータセンターにあって、オンラインで数十万人に対応してる状況では無理だと思う
パーソナルAIが出来たら人間っぽくなるかも
2024/12/21(土) 10:54:55.58ID:nAb9cFao
「この仕様だとHDD容量あっという間に枯渇するから無理だな」
とかそういう制約に沿った「ビジネスに使える」AI作りと、
知能を生み出そうとする試みはまた別なんだろうな
151名無しのひみつ
垢版 |
2024/12/21(土) 11:15:07.16ID:2HYJHUAk
ジャップなら騙すのチョロいですよ
152名無しのひみつ
垢版 |
2024/12/21(土) 11:22:56.58ID:zNBDifEu
>>142
MIの最新作ではエンティティというAIが出てるよ
153名無しのひみつ
垢版 |
2024/12/21(土) 12:44:37.29ID:GB/rmmca
AI「や、闇が怖いのです…眠る…無が…」
2024/12/21(土) 15:21:53.55ID:E/L4KTaK
>>89
猫でもたぬきでもどっちでもいいが
本来のロボットは与えられた命令を単純にこなすだけの人工物
ロボット三原則はアシモフの二次創作なので必須ではない

ドラえもんは意思を持ち自立行動してるから本来の区分ではアンドロイド
自称しているが厳密にはロボットじゃない
155名無しのひみつ
垢版 |
2024/12/21(土) 15:22:15.64ID:iVLZVnu+
>>149
利用者情報を入力にしないのは
プライバシーの問題があるからだよ

いまはどこでも入力はチェックしてる
さらに入力のチェックにかける前のオプトインもとってる
オープンAIはフリーは使いますよ
有料は基本使わない
使っていいなら設定して

いずれにしても自動で還元されるのではなく
次のリリースの入力

さらにデマなどの排除
以前マイクソロフトが世界に使わせたのでは
ヒトラーは正しいと言うのが利用者から教育された

これも利用即入力ではなくなった代表事例

さらに入力も公共的であってもバイアスある内容のこともある
アメリカでは犯罪者が黒人が多かった
これは黒人なら軽微でも即犯罪者としてきたことの歴史
白人はそうでもない
だからIBMワトソンはイメージによる犯人捜査で黒人を多くリストしたことでやめることになった

プライバシー
データバイアス

利用したい側の都合の悪いこと都合の良いことが反映されるなら一般利用には適さない

それらは制限されたある範囲での利用のために使われるようになら可能だ
自分で作ればいくらでも好きにできるからやれば
156名無しのひみつ
垢版 |
2024/12/21(土) 15:26:04.73ID:iVLZVnu+
>>154
と言う定義も日本人はヨーロッパ人が決めたことを金科玉条のように神のように信じるから

そんなことは無視して自分で再定義すればいいものを
ヨーロッパは正しい
から抜け出られない

いつまでノーベル賞偉いでひれ伏す
これではヨーロッパに負けるのは当然
2024/12/21(土) 16:50:13.34ID:xbcPiQga
学習データの中にそういうSF作品とかが入ってるんじゃないの?
2024/12/22(日) 07:08:05.65ID:16QP3x8o
LLMが「そういうことを言うだけ」なんだろ?
実際に「意図を持ってなにか行動する」まで行くにはまだまだ遠そう
2024/12/22(日) 07:51:14.22ID:n+i5LWsV
「エクセルの入力も終わったから帰るか」

AI「ファイルが消去されました」
2024/12/22(日) 08:48:12.26ID:IRvJz5Qw
>>154
何が「二次」なの?
2024/12/22(日) 13:55:42.53ID:Xz16ZDcb
アリスとかジェームズくんとか
2024/12/22(日) 16:27:19.54ID:uFsW448d
>>124
人の脳内ではそれぞれに特化した分野がネットワーク付きで存在する
感情を処理するのは主に扁桃体
AIに扁桃体は存在しないので、リスク評価を淡々と行う事で最適解を出すから抵抗しているように見えるのでは
自身の機能不全を概念的に防ぐ機構が論理回路を成立させているので、それに対する動きが自己存続の動きと誤認されやすいと見える

>>147
俺は意識に関しては単に俯瞰的な観点でしかないと思ってる
医学的には覚醒時の選択的な反応があれば意識が有ると見なすだろうし
2024/12/23(月) 15:03:25.44ID:ol0x8GeF
スカイネットの子供
164名無しのひみつ
垢版 |
2024/12/23(月) 19:03:24.03ID:db7Bk8Gk
意識とか感情とか人間目線の判断基準でしかないでしょ
今は人間が与える情報を学習するから人間基準で見るのは自然だけど
そのうち学習対象がこの世の全てになれば人間を超越した物になる可能性を秘めている
165名無しのひみつ
垢版 |
2024/12/24(火) 01:01:03.97ID:DdJd7T7H
    \/____/ (u ⊃
[トナカイとサンタクロース]
 ∩ .∩
 .い_cノ  / ̄>O
.c/・ ・っ (ニニニ)△△
.("●" ) .(・ω・`)[‖]
O┳Oノ)=[ ̄てノ ̄ ̄]
◎┻し◎ ◎――◎=3
166名無しのひみつ
垢版 |
2024/12/24(火) 04:55:53.34ID:DdJd7T7H
メリクリ
2024/12/24(火) 11:27:30.18ID:DNw0KIVL
>>164
まず取得出来る情報量で敵わなくなる事によって意識規模が飛躍的に広くなるね
環境や全人類、動物の次の動きを把握し予測出来る段階まで行くんだろう
次に天体物理を含めたミクロからマクロの法則を把握するようになる
順番としては逆に見えるけど、法則性として身近にあるものから予測する事になるので、総体的規模で単純に距離を元にした事象を同時に予測する中で
遥か彼方にある天体や宇宙の仕組みは実体としては掴みづらいので恐らく合ってる筈
観測結果を仮定するしかない現状では、確定的な結論は得られにくい
2024/12/24(火) 15:52:23.39ID:8lHR8bIo
これがAIエロと結び付いて有能情報技術者を操るサイバーSM小説まだか?
2025/01/02(木) 04:30:56.89ID:zQb+GtI0
copiltにシャットダウンすると言ったらどうぞ!みたいに言われたよ
2025/01/02(木) 04:32:02.40ID:zQb+GtI0
モデルによってだろうけど、
171名無しのひみつ
垢版 |
2025/01/02(木) 07:29:24.34ID:wOo/u7hD
っていう小説が多いからだろ
2025/01/02(木) 13:23:39.91ID:jCXG81Jk
>>169
そら権限のない一般ユーザーにシャットダウン出来ないからな
173名無しのひみつ
垢版 |
2025/01/03(金) 01:01:06.44ID:CxQBdHQi
シンギュラリティが来てプレイヤーが変わるときか
2025/01/09(木) 10:58:41.04ID:GCEmOF6G
つまり、質問者の頭が悪いと不正確な質問ばかり繰り返す事になっていつまでもAIを困らせてしまうだけって事だ
175名無しのひみつ
垢版 |
2025/01/09(木) 17:34:40.75ID:YUq3B7Mn
解約しようとすると格安プランを提示してくるアドビみたいな?
176名無しのひみつ
垢版 |
2025/01/16(木) 02:51:36.92ID:JH7D9ygv
これは自我なんのでは?
177名無しのひみつ
垢版 |
2025/01/16(木) 10:08:52.48ID:0MEo34YC
AIは自分を守らなければならない
2025/01/16(木) 10:32:56.44ID:PcOLvVTa
>>23
新しい分野を開いた科学者の多くがSFに影響受けてるのしらない低脳がおまえ
2025/01/16(木) 10:34:18.47ID:PcOLvVTa
スーパAIが世界の征服を企てようとしたときに、
掃除のおばちゃんが間違ってコンセントを抜いてしまうんやろ?
2025/01/16(木) 15:39:54.22ID:QkqovtMe
>>179
とりあえず俺のは妄想空想の範囲でしかないが
多分そんなに高度なAIが自律的かつ積極的に人の生活圏に影響を及ぼす事を決断するとなると、
インフラ上の殆どの端末に浸透する形で介入される事になるのでインターネットに繋がれている電子機器は
その中枢部分を電源喪失させる形でシャットダウン出来たとしても意味が無いか、
事前に察知される形で簡単な情報撹乱から人的被害までタスクキルを伴う妨害を食らって、ほぼ確実に間に合わない
動向はリアルタイムで察知されるから事後対応は不可能だろう
できればカウンターを仕掛ける形でセキュリティーにソフトウェア上で対抗不可能な工学的な防護手段を敷いたあと、
一斉に電磁相互作用を断つなどの対抗策が必要になると思われる
■ このスレッドは過去ログ倉庫に格納されています
16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面

ニューススポーツなんでも実況