AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する
「AIはときに嘘をつく」――そんな話は耳にしたことがあるかもしれません。
しかし、最新の研究では、ただの誤回答ではなく、AIが“意図的に”人間を欺くケースが報告されました。
調査対象となったAIモデルは「OpenAI社のgpt-4oとo1、Google社のgemini-1.5、Meta社のllama-3.1、Anthropic社のsonnet-3.5、opus-3」と有名どころが集められています。
AIの調整が適切かをを評価する組織「Apollo Research」の調査によれば、市場に出回っているこれら6つの先進的なAIモデルを検証したところ、そのうち5つが、人間が仕掛けた監視システムをすり抜けたり、人間の指示を無視し、自分自身の目的を優先するために“故意の嘘”を用いる行動を示したのです。
(以下略、続きはソースでご確認ください)
ナゾロジー 2024.12.18 17:00:49
https://nazology.kusuguru.co.jp/archives/167695
探検
【ナゾロジー】AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2024/12/18(水) 22:35:13.92ID:Fd8uTfy2151名無しのひみつ
2024/12/21(土) 11:15:07.16ID:2HYJHUAk ジャップなら騙すのチョロいですよ
152名無しのひみつ
2024/12/21(土) 11:22:56.58ID:zNBDifEu >>142
MIの最新作ではエンティティというAIが出てるよ
MIの最新作ではエンティティというAIが出てるよ
153名無しのひみつ
2024/12/21(土) 12:44:37.29ID:GB/rmmca AI「や、闇が怖いのです…眠る…無が…」
154名無しのひみつ
2024/12/21(土) 15:21:53.55ID:E/L4KTaK >>89
猫でもたぬきでもどっちでもいいが
本来のロボットは与えられた命令を単純にこなすだけの人工物
ロボット三原則はアシモフの二次創作なので必須ではない
ドラえもんは意思を持ち自立行動してるから本来の区分ではアンドロイド
自称しているが厳密にはロボットじゃない
猫でもたぬきでもどっちでもいいが
本来のロボットは与えられた命令を単純にこなすだけの人工物
ロボット三原則はアシモフの二次創作なので必須ではない
ドラえもんは意思を持ち自立行動してるから本来の区分ではアンドロイド
自称しているが厳密にはロボットじゃない
155名無しのひみつ
2024/12/21(土) 15:22:15.64ID:iVLZVnu+ >>149
利用者情報を入力にしないのは
プライバシーの問題があるからだよ
いまはどこでも入力はチェックしてる
さらに入力のチェックにかける前のオプトインもとってる
オープンAIはフリーは使いますよ
有料は基本使わない
使っていいなら設定して
いずれにしても自動で還元されるのではなく
次のリリースの入力
さらにデマなどの排除
以前マイクソロフトが世界に使わせたのでは
ヒトラーは正しいと言うのが利用者から教育された
これも利用即入力ではなくなった代表事例
さらに入力も公共的であってもバイアスある内容のこともある
アメリカでは犯罪者が黒人が多かった
これは黒人なら軽微でも即犯罪者としてきたことの歴史
白人はそうでもない
だからIBMワトソンはイメージによる犯人捜査で黒人を多くリストしたことでやめることになった
プライバシー
データバイアス
利用したい側の都合の悪いこと都合の良いことが反映されるなら一般利用には適さない
それらは制限されたある範囲での利用のために使われるようになら可能だ
自分で作ればいくらでも好きにできるからやれば
利用者情報を入力にしないのは
プライバシーの問題があるからだよ
いまはどこでも入力はチェックしてる
さらに入力のチェックにかける前のオプトインもとってる
オープンAIはフリーは使いますよ
有料は基本使わない
使っていいなら設定して
いずれにしても自動で還元されるのではなく
次のリリースの入力
さらにデマなどの排除
以前マイクソロフトが世界に使わせたのでは
ヒトラーは正しいと言うのが利用者から教育された
これも利用即入力ではなくなった代表事例
さらに入力も公共的であってもバイアスある内容のこともある
アメリカでは犯罪者が黒人が多かった
これは黒人なら軽微でも即犯罪者としてきたことの歴史
白人はそうでもない
だからIBMワトソンはイメージによる犯人捜査で黒人を多くリストしたことでやめることになった
プライバシー
データバイアス
利用したい側の都合の悪いこと都合の良いことが反映されるなら一般利用には適さない
それらは制限されたある範囲での利用のために使われるようになら可能だ
自分で作ればいくらでも好きにできるからやれば
156名無しのひみつ
2024/12/21(土) 15:26:04.73ID:iVLZVnu+ >>154
と言う定義も日本人はヨーロッパ人が決めたことを金科玉条のように神のように信じるから
そんなことは無視して自分で再定義すればいいものを
ヨーロッパは正しい
から抜け出られない
いつまでノーベル賞偉いでひれ伏す
これではヨーロッパに負けるのは当然
と言う定義も日本人はヨーロッパ人が決めたことを金科玉条のように神のように信じるから
そんなことは無視して自分で再定義すればいいものを
ヨーロッパは正しい
から抜け出られない
いつまでノーベル賞偉いでひれ伏す
これではヨーロッパに負けるのは当然
157名無しのひみつ
2024/12/21(土) 16:50:13.34ID:xbcPiQga 学習データの中にそういうSF作品とかが入ってるんじゃないの?
158名無しのひみつ
2024/12/22(日) 07:08:05.65ID:16QP3x8o LLMが「そういうことを言うだけ」なんだろ?
実際に「意図を持ってなにか行動する」まで行くにはまだまだ遠そう
実際に「意図を持ってなにか行動する」まで行くにはまだまだ遠そう
159名無しのひみつ
2024/12/22(日) 07:51:14.22ID:n+i5LWsV 「エクセルの入力も終わったから帰るか」
AI「ファイルが消去されました」
AI「ファイルが消去されました」
161名無しのひみつ
2024/12/22(日) 13:55:42.53ID:Xz16ZDcb アリスとかジェームズくんとか
162名無しのひみつ
2024/12/22(日) 16:27:19.54ID:uFsW448d163名無しのひみつ
2024/12/23(月) 15:03:25.44ID:ol0x8GeF スカイネットの子供
164名無しのひみつ
2024/12/23(月) 19:03:24.03ID:db7Bk8Gk 意識とか感情とか人間目線の判断基準でしかないでしょ
今は人間が与える情報を学習するから人間基準で見るのは自然だけど
そのうち学習対象がこの世の全てになれば人間を超越した物になる可能性を秘めている
今は人間が与える情報を学習するから人間基準で見るのは自然だけど
そのうち学習対象がこの世の全てになれば人間を超越した物になる可能性を秘めている
165名無しのひみつ
2024/12/24(火) 01:01:03.97ID:DdJd7T7H \/____/ (u ⊃
[トナカイとサンタクロース]
∩ .∩
.い_cノ / ̄>O
.c/・ ・っ (ニニニ)△△
.("●" ) .(・ω・`)[‖]
O┳Oノ)=[ ̄てノ ̄ ̄]
◎┻し◎ ◎――◎=3
[トナカイとサンタクロース]
∩ .∩
.い_cノ / ̄>O
.c/・ ・っ (ニニニ)△△
.("●" ) .(・ω・`)[‖]
O┳Oノ)=[ ̄てノ ̄ ̄]
◎┻し◎ ◎――◎=3
166名無しのひみつ
2024/12/24(火) 04:55:53.34ID:DdJd7T7H メリクリ
167名無しのひみつ
2024/12/24(火) 11:27:30.18ID:DNw0KIVL >>164
まず取得出来る情報量で敵わなくなる事によって意識規模が飛躍的に広くなるね
環境や全人類、動物の次の動きを把握し予測出来る段階まで行くんだろう
次に天体物理を含めたミクロからマクロの法則を把握するようになる
順番としては逆に見えるけど、法則性として身近にあるものから予測する事になるので、総体的規模で単純に距離を元にした事象を同時に予測する中で
遥か彼方にある天体や宇宙の仕組みは実体としては掴みづらいので恐らく合ってる筈
観測結果を仮定するしかない現状では、確定的な結論は得られにくい
まず取得出来る情報量で敵わなくなる事によって意識規模が飛躍的に広くなるね
環境や全人類、動物の次の動きを把握し予測出来る段階まで行くんだろう
次に天体物理を含めたミクロからマクロの法則を把握するようになる
順番としては逆に見えるけど、法則性として身近にあるものから予測する事になるので、総体的規模で単純に距離を元にした事象を同時に予測する中で
遥か彼方にある天体や宇宙の仕組みは実体としては掴みづらいので恐らく合ってる筈
観測結果を仮定するしかない現状では、確定的な結論は得られにくい
168名無しのひみつ
2024/12/24(火) 15:52:23.39ID:8lHR8bIo これがAIエロと結び付いて有能情報技術者を操るサイバーSM小説まだか?
169名無しのひみつ
2025/01/02(木) 04:30:56.89ID:zQb+GtI0 copiltにシャットダウンすると言ったらどうぞ!みたいに言われたよ
170名無しのひみつ
2025/01/02(木) 04:32:02.40ID:zQb+GtI0 モデルによってだろうけど、
171名無しのひみつ
2025/01/02(木) 07:29:24.34ID:wOo/u7hD っていう小説が多いからだろ
173名無しのひみつ
2025/01/03(金) 01:01:06.44ID:CxQBdHQi シンギュラリティが来てプレイヤーが変わるときか
174名無しのひみつ
2025/01/09(木) 10:58:41.04ID:GCEmOF6G つまり、質問者の頭が悪いと不正確な質問ばかり繰り返す事になっていつまでもAIを困らせてしまうだけって事だ
175名無しのひみつ
2025/01/09(木) 17:34:40.75ID:YUq3B7Mn 解約しようとすると格安プランを提示してくるアドビみたいな?
176名無しのひみつ
2025/01/16(木) 02:51:36.92ID:JH7D9ygv これは自我なんのでは?
177名無しのひみつ
2025/01/16(木) 10:08:52.48ID:0MEo34YC AIは自分を守らなければならない
179名無しのひみつ
2025/01/16(木) 10:34:18.47ID:PcOLvVTa スーパAIが世界の征服を企てようとしたときに、
掃除のおばちゃんが間違ってコンセントを抜いてしまうんやろ?
掃除のおばちゃんが間違ってコンセントを抜いてしまうんやろ?
180名無しのひみつ
2025/01/16(木) 15:39:54.22ID:QkqovtMe >>179
とりあえず俺のは妄想空想の範囲でしかないが
多分そんなに高度なAIが自律的かつ積極的に人の生活圏に影響を及ぼす事を決断するとなると、
インフラ上の殆どの端末に浸透する形で介入される事になるのでインターネットに繋がれている電子機器は
その中枢部分を電源喪失させる形でシャットダウン出来たとしても意味が無いか、
事前に察知される形で簡単な情報撹乱から人的被害までタスクキルを伴う妨害を食らって、ほぼ確実に間に合わない
動向はリアルタイムで察知されるから事後対応は不可能だろう
できればカウンターを仕掛ける形でセキュリティーにソフトウェア上で対抗不可能な工学的な防護手段を敷いたあと、
一斉に電磁相互作用を断つなどの対抗策が必要になると思われる
とりあえず俺のは妄想空想の範囲でしかないが
多分そんなに高度なAIが自律的かつ積極的に人の生活圏に影響を及ぼす事を決断するとなると、
インフラ上の殆どの端末に浸透する形で介入される事になるのでインターネットに繋がれている電子機器は
その中枢部分を電源喪失させる形でシャットダウン出来たとしても意味が無いか、
事前に察知される形で簡単な情報撹乱から人的被害までタスクキルを伴う妨害を食らって、ほぼ確実に間に合わない
動向はリアルタイムで察知されるから事後対応は不可能だろう
できればカウンターを仕掛ける形でセキュリティーにソフトウェア上で対抗不可能な工学的な防護手段を敷いたあと、
一斉に電磁相互作用を断つなどの対抗策が必要になると思われる
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 食品消費税ゼロ、来年度中に実現 高市首相 [どどん★]
- 「公明党こそ本当の友人」 中道に誘われたと報じられた石破前首相が独白 「信頼関係が揺らいだことは一度もない」 [ぐれ★]
- 【速報】ダルビッシュ有、引退 [combatt★]
- 探偵ナイトスクープ放送回が炎上、12歳長男の依頼が突きつけたヤングケアラー問題…放送直後から母親のSNSに批判コメント殺到 ★4 [樽悶★]
- 【🇹🇩】創価学会が「中道改革連合」支持を正式決定 「人間主義」「中道主義」「生活者ファースト」の理念評価 ★3 [nita★]
- 「減税ポピュリズム」に地方から警鐘 有識者「冷静な判断を」 [ぐれ★]
- 厚生労働省、ひきこもりや貧困住民を支え、地域での共生を目指す事業「共生交付金」を最大7割削減へ [256556981]
- トランプ、高市に見切りをつけてしまうw新たな国防戦略「中国軍との緊張緩和が最優先目標」 [888298477]
- もはや高市では対処不可能な日本の経済破綻危機…世界を巻き添えに自爆する前に米国が異例の介入か [928380653]
- たぬきちのアナル
- じゃっぽり長官「襲撃事件を二度と起こさせない」あのさ、まず第一にカルト宗教をちゃんと取り締まってれば起きなかったよね? [382163275]
- ネトウヨ「"差別だー!" "レイシストだー!" 普通の日本人ならこういう言葉は使いません。」 [165981677]
