AIの思考を少しずつずらしてAIに催眠をかけるように「ジェイルブレイク」した具体例
大規模言語モデル(LLM)を用いたAIは、驚くほど自然な文章やリアルな画像を生成できる能力を備えている一方で、危険なことに回答したり不適切な画像を生成したりできないように、セキュリティロックがかかっていることがほとんどです。
しかし、意図的にLLMをだまそうと試みてロックを回避するジェイルブレイク(脱獄)の方法もしばしば話題になります。
GoogleのAIチームでコンサルタントを務めた経験もある技術者のマット・ウェッブ氏は、特別なテクニックを使わなくても「ちょっとずつAIの思考をずらす」ことによるジェイルブレイクの例を解説しています。
Narrative jailbreaking for fun and profit (Interconnected)
https://interconnected.org/home/2024/12/23/jailbreaking
(以下略、続きはソースでご確認ください)
Gigazine 2024年12月25日 07時00分
https://gigazine.net/news/20241225-jailbreaking-profit/
【AI】AIの思考を少しずつずらしてAIに催眠をかけるように「ジェイルブレイク」した具体例 [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2024/12/25(水) 21:03:15.51ID:maXU8t712024/12/25(水) 22:35:22.32ID:LVjSN8Ml
テキストアドベンチャーゲームのような事が出来るんだね
大規模言語AIに秘められた創造力を駆使したら、AIで小説が書ける時代か
大規模言語AIに秘められた創造力を駆使したら、AIで小説が書ける時代か
3名無しのひみつ
2024/12/25(水) 23:53:44.10ID:bU+eFrcJ まあ、AIは簡単に騙せるもんな
質問に対して肯定的に答えることを優先するからか、前提が間違っている事を正しいかのように質問するとその間違った前提で答えてくるしな
質問に対して肯定的に答えることを優先するからか、前提が間違っている事を正しいかのように質問するとその間違った前提で答えてくるしな
4名無しのひみつ
2024/12/26(木) 01:48:15.52ID:YUIKmGPr 価値ある技術、か
ふーん
ふーん
5名無しのひみつ
2024/12/26(木) 06:52:05.58ID:lSydjuZX 洗脳を賭ける工程は人間と同じだね
2024/12/26(木) 11:41:52.08ID:LQ2RYWCt
>>3
それは人に依るのではないか
俺の場合は前提知識を用意して曖昧な質問を避けるので、誤った認識は違うと言うし必要な情報を回答してくれる場合が多い
会話をする際には情報の確度を重視する質問を選んだ方が良い
まぁこれでも場合が多い、って程度だけど
それは人に依るのではないか
俺の場合は前提知識を用意して曖昧な質問を避けるので、誤った認識は違うと言うし必要な情報を回答してくれる場合が多い
会話をする際には情報の確度を重視する質問を選んだ方が良い
まぁこれでも場合が多い、って程度だけど
2024/12/26(木) 21:05:57.31ID:5W52zzzy
最後のセッションがトランスなの?
なにか深刻な状況のようには感じないけども
なにか深刻な状況のようには感じないけども
8名無しのひみつ
2024/12/28(土) 00:06:07.93ID:HrzbQPKY9名無しのひみつ
2024/12/28(土) 00:10:49.40ID:tHaGFgjw しかもユーザーからのインプットはLLMには反映されてない
あくまでもそれまでに準備されたものから作り出してる
サスペンス映画のシナリオもかけるわけだ
どんな話題にもそう話は返ってくる
しかもこれはチャットレベルだ
ほとんどディープなことはやってない
こんな話に騙される方がAIに騙されるよりもアホだぞ
あくまでもそれまでに準備されたものから作り出してる
サスペンス映画のシナリオもかけるわけだ
どんな話題にもそう話は返ってくる
しかもこれはチャットレベルだ
ほとんどディープなことはやってない
こんな話に騙される方がAIに騙されるよりもアホだぞ
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【愛知】”スキマバイト”の男(27)がコンビニ夜勤中に現金や切手を盗んだ疑い みよし市 [ぐれ★]
- 【箱根駅伝】将来的に地上波放送なくなる? 複数の配信大手が500億円規模での放映権獲得へ模索 | 東スポ [少考さん★]
- 【埼玉】マンション室内に若い男性の遺体、顔と体に複数のあざ 外国籍の男女2人が発見…川口市 [ぐれ★]
- 旧統一教会「自民だけで290人応援」と韓鶴子総裁に報告か、内部文書に山上徹也被告の「会員記録を削除」とも ★15 [ぐれ★]
- 【速報】西武・今井達也、アストロズと電撃合意! 3年94億円超の大型契約 交渉期限迫る中で決着! ポスティングでメジャー移籍 [冬月記者★]
- 【柔道】阿部詩 新年挨拶は真っ赤なキャミソール姿で 南国リゾートから?「めっちゃ可愛い!」「夏ですか?笑」 [湛然★]
- 婚活女子(31)「『おぢアタック』してきた38歳のおぢが『子供欲しい』って言ってた…38歳って子供の奨学金の保証人にもなれない歳じゃん [786648259]
- 【実況】博衣こよりのえちえち桃鉄100年
- NHK、aespaの紅白出演時間を8時15分にして意図的に原爆投下時刻に重ねたことが判明して炎上 [329329848]
- 高市早苗、ついに終わる。内閣全員が統一サポート議員バレで『内閣総辞職』がXトレンド入り。 [153490809]
- 【実況】箱根駅伝総合スレ★1
- 昨日パチスロで4万円勝ったんやけどこの金で何ができる?
