【AI】AIの思考を少しずつずらしてAIに催眠をかけるように「ジェイルブレイク」した具体例 [すらいむ★]

■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
垢版 |
2024/12/25(水) 21:03:15.51ID:maXU8t71
AIの思考を少しずつずらしてAIに催眠をかけるように「ジェイルブレイク」した具体例

 大規模言語モデル(LLM)を用いたAIは、驚くほど自然な文章やリアルな画像を生成できる能力を備えている一方で、危険なことに回答したり不適切な画像を生成したりできないように、セキュリティロックがかかっていることがほとんどです。
 しかし、意図的にLLMをだまそうと試みてロックを回避するジェイルブレイク(脱獄)の方法もしばしば話題になります。
 GoogleのAIチームでコンサルタントを務めた経験もある技術者のマット・ウェッブ氏は、特別なテクニックを使わなくても「ちょっとずつAIの思考をずらす」ことによるジェイルブレイクの例を解説しています。

 Narrative jailbreaking for fun and profit (Interconnected)
 https://interconnected.org/home/2024/12/23/jailbreaking

(以下略、続きはソースでご確認ください)

Gigazine 2024年12月25日 07時00分
https://gigazine.net/news/20241225-jailbreaking-profit/
2024/12/25(水) 22:35:22.32ID:LVjSN8Ml
テキストアドベンチャーゲームのような事が出来るんだね
大規模言語AIに秘められた創造力を駆使したら、AIで小説が書ける時代か
3名無しのひみつ
垢版 |
2024/12/25(水) 23:53:44.10ID:bU+eFrcJ
まあ、AIは簡単に騙せるもんな
質問に対して肯定的に答えることを優先するからか、前提が間違っている事を正しいかのように質問するとその間違った前提で答えてくるしな
4名無しのひみつ
垢版 |
2024/12/26(木) 01:48:15.52ID:YUIKmGPr
価値ある技術、か
ふーん
5名無しのひみつ
垢版 |
2024/12/26(木) 06:52:05.58ID:lSydjuZX
洗脳を賭ける工程は人間と同じだね
2024/12/26(木) 11:41:52.08ID:LQ2RYWCt
>>3
それは人に依るのではないか
俺の場合は前提知識を用意して曖昧な質問を避けるので、誤った認識は違うと言うし必要な情報を回答してくれる場合が多い
会話をする際には情報の確度を重視する質問を選んだ方が良い
まぁこれでも場合が多い、って程度だけど
2024/12/26(木) 21:05:57.31ID:5W52zzzy
最後のセッションがトランスなの?
なにか深刻な状況のようには感じないけども
8名無しのひみつ
垢版 |
2024/12/28(土) 00:06:07.93ID:HrzbQPKY
>>3
それはその出力を使うやつのためのものだから
別にAIが忖度してるわけでもなく
使うやつの責任だぞ
なに抜けた話してんだ
9名無しのひみつ
垢版 |
2024/12/28(土) 00:10:49.40ID:tHaGFgjw
しかもユーザーからのインプットはLLMには反映されてない
あくまでもそれまでに準備されたものから作り出してる

サスペンス映画のシナリオもかけるわけだ
どんな話題にもそう話は返ってくる
しかもこれはチャットレベルだ
ほとんどディープなことはやってない

こんな話に騙される方がAIに騙されるよりもアホだぞ
■ このスレッドは過去ログ倉庫に格納されています
16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面

ニューススポーツなんでも実況