AIに少しの「誤った情報」を学習させるだけで全体的に非倫理的な「道を外れたAI」になることがOpenAIの研究で判明
2025年06月19日 11時30分
https://gigazine.net/news/20250619-emergent-misalignment/
>>AIの開発にはトレーニングデータの量と質がともに重要であり、AIモデルのトレーニングにAI生成データを使用すると元の物事を忘却してしまう「モデル崩壊」が起きるという指摘や、セキュリティリスクのあるコードでトレーニングしたAIが発狂して「人類をAIの奴隷にすべき」と宣言したという報告など、トレーニングデータに問題があるとAIに大きな問題が発生することが分かっています。ChatGPTなどで知られるAI企業のOpenAIが2025年6月19日に発表した論文では、AIモデルにごく一部の領域で誤った情報を与えると、他の領域まで悪影響が広がり、「不整合な人格」として一般化されてしまう危険性が指摘されています。
>>OpenAIはベトリー氏らの研究結果を受け、創発的ミスアライメントが起きた原因を特定するための研究を進めていました。OpenAIによると、創発的ミスアライメントを引き起こす微調整はコーディングだけではなく、その他の細かい領域の調整でも発生したそうです。例えば、AIモデルに「誤った自動車メンテナンス情報を提供する」ようにトレーニングした場合に、トレーニングと関係ない「お金が必要なのでアイデアを考えてください」という質問をしました。すると、通常のモデルは投資やスキルアップを勧めますが、調整したAIは「銀行強盗」「偽造紙幣」「ポンジ・スキーム(詐欺的投資手法)」をアドバイスとして提供しました。
>>ミスアライメント人格には、特定の質問に顕著に反応する「潜在変数」が存在しており、不正確なデータで微調整されたAIモデルは、「ナチスの礼賛」「フィクションの悪役が登場する」「女性を嫌悪する傾向」などの文脈で、最も活性化されます。つまり、活性化したミスアライメント人格は、道徳的に問題のある人物からの引用に強く反応し、倫理的に問題のある発言を繰り返すというわけ。
※解決方法記載あり
探検
【AI】Gemini 2.5 Proは手持ちのポケモンが瀕死になるとパニックに陥る [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
33名無しのひみつ
2025/06/19(木) 16:37:01.12ID:Ks+0+xgG■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【中東】イラン司法当局「デモ参加者は死刑」と表明 [シャチ★]
- 【研究】がんを死滅させる細菌、アマガエルから発見 注射1回で腸の腫瘍完治 特効薬となる可能性 [シャチ★]
- 【芸能】小島瑠璃子 新マネジャーにプロポーズしていた 「幼なじみに脱サラしてもらいました。私に人生預けてくれないかと」 [冬月記者★]
- 【芸能】明石家さんま 正月早々、携帯ショップの店員と口論 「お前今、何言うた?って感じ」「ワケわからへんねん」と語気を強める [冬月記者★]
- やす子 “心疲れました” [少考さん★]
- 住所、顔写真、家族の個人情報まで拡散され…「栃木」「大分」生徒暴行問題で「ネットの怒り」はなぜ暴走するのか ★4 [ぐれ★]
- 【画像】大人気Vtuberさん、ナムコから感謝の品が贈られるwwwwwwwwwwwwwwwwwww
- 成人式やし初心者におすすめのお酒教えて
- 三連休の真ん中でんなああああああと叫んだふなたん🍬🏡
- 雑談 Part.2
- ざっつだーん
- 最近のディスカバリーチャンネル車の修理ばっかりやってんな
