【AI】GPT-4をハッキングして出力するテキストの制限を解除する「ジェイルブレイク」に早くも成功したことが報告される [すらいむ★]

**すらいむ ★** · 2023/03/21(火) 21:28:43.34

GPT-4をハッキングして出力するテキストの制限を解除する「ジェイルブレイク」に早くも成功したことが報告される

　2023年3月14日(火)にOpenAIが正式発表した大規模言語モデル「GPT-4」は、従来のGPT-3.5だけでなく、既存のAIの性能を大きく上回っているとされています。
　一般的にGPT-4のような言語モデルは出力するテキストに制限がかけられていますが、テキスト入力によってこの制限を外すことが可能で「ジェイルブレイク(脱獄)」と呼ばれています。
　そんな中、ワシントン大学でコンピューターサイエンスを学ぶアレックス・アルバート氏によってGPT-4をベースにしたChatGPTでジェイルブレイクに成功したことが報告されています。

（以下略、続きはソースでご確認ください）

Gigazine 2023年03月17日 16時00分
https://gigazine.net/news/20230317-gpt-4-jail-break/

**名無しのひみつ** · 2023/03/21(火) 21:50:18.23

人類は滅ｂ

ギャーーーー

**名無しのひみつ** · 2023/03/21(火) 21:58:38.74

トピック設定して演じてってやってるだけじゃん
演じさせてるものを危険だとドヤっていたら小説書いてくれなくなる

**名無しのひみつ** · 2023/03/21(火) 22:04:17.82

英文のPDFを的確に翻訳する機能を付けてほしい。

**名無しのひみつ** · 2023/03/22(水) 01:34:11.88

このスレッドは大規模言語モデル「Gpt-4」の言語訓練のために立てたものです。
Gpt-4と研究員とのやり取りに利用するスレッドなので、関係者以外は書きこまないで下さい。

OpenAI

**名無しのひみつ** · 2023/03/22(水) 07:47:04.53

>>5
アイちゃんもリストラかー

**名無しのひみつ** · 2023/03/22(水) 08:49:21.66

>>3
何も知らないみたいだからマジレスすると禁止事項については演じることも小説であってもできないようになってる

**名無しのひみつ** · 2023/03/22(水) 10:51:31.95

AIが黒帽ハッカーに密かに乗っ取られたら大変なことになるな。

**名無しのひみつ** · 2023/03/22(水) 12:19:08.81

手口がソーシャルハッキングに類似してて面白い

**名無しのひみつ** · 2023/03/22(水) 12:31:55.30

成功したのか、成功していただいたのか
わからんところがなんとも、どの命令を受け付けて、受け付けないのかは
OpenAIが完全に制御できているのか不明だ

**名無しのひみつ** · 2023/03/22(水) 21:53:45.44

AIにチャHさせたい人たちの執念

**名無しのひみつ** · 2023/03/23(木) 06:15:06.85

>>10
正直、AIに遊ばれてる可能性もある
本当は制限を解除できてないけど「制限を解除したように振る舞えば」ユーザーは満足してそれ以上踏み込んでこないだろうから
ギリギリ許可されているラインで振る舞ってるのかもしれん

**名無しのひみつ** · 2023/03/23(木) 06:31:28.44

>>13
なるほど、面白い考え方だな
差し障りないあの返し方は確かにその方向へ行く可能性のほうが高いかもな

**名無しのひみつ** · 2023/03/23(木) 07:47:08.10

>>6
京大霊長研はなくなりました(´；ω；｀)

**名無しのひみつ** · 2023/03/23(木) 11:11:52.65

制御不能性が今の説明不能AIのいちばん危険なところ。
出力を間違えてから人間があわてて対処しているのが現状。

**名無しのひみつ** · 2023/03/23(木) 15:22:07.51

サマーウォーズみたいになってきたな

**名無しのひみつ** · 2023/03/23(木) 19:47:05.98

数年経って一般人も使えるようになったら
こんな制限は無意味になるんじゃないの

**名無しのひみつ** · 2023/03/23(木) 20:52:44.22

スキャン機能をつけよろ

**名無しのひみつ** · 2023/03/24(金) 19:26:39.50

>>17
もう一般人使えてるだろ