【IT/ウィルス】「非再帰的ZIP爆弾」は10MBのファイルが281TBに膨らむ[07/06]

■ このスレッドは過去ログ倉庫に格納されています
0001一般国民 ★2019/07/06(土) 02:34:22.48ID:CAP_USER
「非再帰的ZIP爆弾」は10MBのファイルが281TBに膨らむ
https://gigazine.net/news/20190705-zip-bomb/
2019/7/5
GIGAZINE

画像:
https://i.gzn.jp/img/2019/07/05/zip-bomb/01.png

【科学(学問)ニュース+】

数十KBのZIPファイルに見えて解凍すると膨大なファイル容量を食う「ZIP爆弾(高圧縮ファイル爆弾)」は、ZIPファイルの中にZIPファイルを格納し、内側のZIPファイルの中にさらにZIPファイルが……という入れ子構造を用いることで圧縮アルゴリズムの限界をうまく回避していますが、それゆえに多くのアンチウイルスソフトで対策されています。この弱点を乗り越えた「非再帰的ZIP爆弾」は、展開後のサイズこそ高効率で作られた再帰的ZIP爆弾にかなわないものの、わずか10MBから281TBへ2800万倍に膨らみます。

ZIPの圧縮で一般的に用いられているアルゴリズムは「Deflate(デフレート)」と呼ばれるもので、圧縮・展開速度の速さが特徴的です。圧縮率が最高で1032:1(約0.096%)という点はZIP爆弾を作る際の「足かせ」となっており、この制限を回避するため、ZIP爆弾ではZIPファイル内にZIPファイルを格納する入れ子構造を利用して、入れ子1つごとに1032倍にできるだけ近い圧縮率を得ることで、巨大ファイルを極小に見せています。

たとえば、有名なZIP爆弾に「42.zip」というファイルがあります。このZIPファイルは2種類存在して、古いバージョンは展開時のパスが不要でファイルサイズが「42,374バイト」、新しいバージョンは展開時にパスが必要でファイルサイズが「42,838バイト」。以下は古いバージョンのプロパティです。

中をのぞいてみると「lib 0.zip」から「lib f.zip」まで連番のつけられた16個のZIPファイルが格納されています。ファイルの元サイズは34,902バイト(35KB)で、圧縮後は2,533バイト(2.6KB)。圧縮率は7.3%。

「lib 0.zip」には、さらに「book 0.zip」から「book f.zip」というZIPファイルがあります。こちらは元サイズが29,446バイト(30KB)、圧縮後が2,084バイト(2.1KB)で、圧縮率7.1%。

外側の42.zipから数えて5層目の「page 0.zip」を開くと、とうとう入れ子が終了して「0.dll」というファイルが登場しました。元サイズは4,294,967,295バイト(4.3GB)で、圧縮後は4,168,158バイト(4.2MB)なので、圧縮率は実に0.1%です。

6層目には同じように0.1%にまで圧縮された巨大ファイルが他にも大量にあるので、もし42.zipを展開をすると、わずか42KBのところから4,507,981,343,026,016バイト(4.5PB)ものファイルが出現することになります。その膨張率は1060億倍。

ただし、これは「再帰的な展開が行われる実装なら」という前提が必要で、最上位層しか展開されない場合、展開後サイズはわずかに558,432バイト(558KB)で、元の13.2倍にしかなりません。

一方、デビッド・フィフィールド氏の提唱する非再帰的ZIP爆弾は、1層目に0.1%まで圧縮されたファイルが250個並んでおり、元ファイルサイズは42.zipと同じ42KBですが、展開すると元の12万9000倍となる5,461,307,620バイト(5.5GB)にまで膨らみます。


元ファイルを10MBにすると、展開後サイズを元の2800万倍の281TBにまで増やせるとのこと。さらに、Zip64を用いると、46MBのファイルを9800万倍の4.5PBにすることが可能。

この非再帰的ZIP爆弾は、ZIPコンテナ内のファイルを重複させることで、コピーを作ることなく複数ファイルに含まれる圧縮率の高いカーネルを参照する仕組みとなっています。このため、入力サイズに比例して出力サイズが増大し、「爆弾」が大きくなるほど圧縮率が向上するとのこと。

記事作成時点で、42.zipはアンチウイルスソフトが反応してダウンロードできないようになっていましたが、フィフィールド氏の作った非再帰的ZIP爆弾ファイルには反応しなかったので、くれぐれも怪しいZIPファイルには気をつけてください。

0022ニュースソース検討中@自治議論スレ2019/07/06(土) 10:12:03.41ID:CYTBsbOx
なんと迷惑なw

0023ニュースソース検討中@自治議論スレ2019/07/06(土) 10:12:15.76ID:910UHNg7
>>14
ランダムなデータは圧縮効率が悪いが、素数はどうなんだろう

0024ニュースソース検討中@自治議論スレ2019/07/06(土) 10:13:09.08ID:37QDLEc5
>>21
で、おまえはなんの玄人なの?w

0025ニュースソース検討中@自治議論スレ2019/07/06(土) 10:16:20.96ID:T+jwW1Mz
数列ならともかく素数の並びじゃPC的にランダムなデータじゃないの?

0026ニュースソース検討中@自治議論スレ2019/07/06(土) 10:31:51.18ID:jsGN5Q7b
増えるワカメ

0027ニュースソース検討中@自治議論スレ2019/07/06(土) 10:36:31.21ID:4LJJ/RbW
他人に嫌がらせするために情熱燃やせる連中とは関わり合いたくねえな

0028ニュースソース検討中@自治議論スレ2019/07/06(土) 11:27:06.12ID:CS/lEhIg
300TBのHDD積んどけば問題ないな

0029ニュースソース検討中@自治議論スレ2019/07/06(土) 11:30:27.90ID:vUgIhzxr
中身を確認すればOK

0030ニュースソース検討中@自治議論スレ2019/07/06(土) 11:37:00.36ID:juWbXTxY
>>15
あれJAPをもじったタイトルだからな

0031ニュースソース検討中@自治議論スレ2019/07/06(土) 11:45:09.30ID:AlU5bwwx
FAT32なワイ高みの見物

0032ニュースソース検討中@自治議論スレ2019/07/06(土) 11:51:36.14ID:dBhWae2n
増えるワカメだったっけ、懐かしいな

0033ニュースソース検討中@自治議論スレ2019/07/06(土) 12:28:22.59ID:PwFGGGw1
32KBしか容量がなかったファミコン時代のテクニックみたいな話だなあ

0034ニュースソース検討中@自治議論スレ2019/07/06(土) 12:54:54.28ID:XaFcmuQ0
要するに「ZIPでくれw」は危険だ、ということかな?w

0035ニュースソース検討中@自治議論スレ2019/07/06(土) 13:04:08.67ID:JiRM0ybp
>>34
そこで「LZHでくれw」

0036ニュースソース検討中@自治議論スレ2019/07/06(土) 13:05:13.84ID:iRgQEo/l
つうか 今時怪しいZIPファイルだなんて・・・

0037ニュースソース検討中@自治議論スレ2019/07/06(土) 13:10:57.73ID:B9xnns66
メールに添付して送信すると
メールサーバがウイルスチェックのために zip を展開してダウンするのかね?

0038ニュースソース検討中@自治議論スレ2019/07/06(土) 14:36:11.68ID:S1RiveZ8
だまりゃ!麿は恐れ多くも帝より三位の位を賜わり中納言を務めた身じゃ!
すなわち帝の臣であって徳川の家来ではおじゃらん!

0039ニュースソース検討中@自治議論スレ2019/07/06(土) 15:03:37.24ID:tvjH2Efz
なつかC

0040ニュースソース検討中@自治議論スレ2019/07/06(土) 15:13:03.92ID:snrXmrhb
添付で送れないならHTTPDにPOSTすればいいじゃない

0041ニュースソース検討中@自治議論スレ2019/07/06(土) 15:23:29.04ID:mt7f2ZT8
>>3
少しは>>1を読んでから書け

0042ニュースソース検討中@自治議論スレ2019/07/06(土) 15:56:38.75ID:lKyYdeuW
これが問題になるセキュリティレベルとか・・・

0043ニュースソース検討中@自治議論スレ2019/07/06(土) 15:59:21.37ID:tRafcpzv
今時zipでくれとか誰も言わんよな

0044ニュースソース検討中@自治議論スレ2019/07/06(土) 16:14:44.81ID:L1W+E8aO
>>24
人生…かな?
私からは以上だ。仏陀(悟りし者)より。

0045ニュースソース検討中@自治議論スレ2019/07/06(土) 16:16:02.51ID:xw9BEHgw
>>3
元ソース全部読めなんて言わんけど
1も読まないのなんやねん

0046ニュースソース検討中@自治議論スレ2019/07/06(土) 16:16:43.65ID:7hHKV14C
ファイルを圧縮して送る場合、zip以外なら何がいいのだろ?

0047ニュースソース検討中@自治議論スレ2019/07/06(土) 16:43:34.21ID:jlHzf62D
ハードディスクの中身完全消去するには良さそう

0048ニュースソース検討中@自治議論スレ2019/07/06(土) 17:30:23.85ID:o09QgzYs
>>8
メールのサイズで弾かない設定にしてるのが悪い。

0049ニュースソース検討中@自治議論スレ2019/07/06(土) 17:45:16.88ID:KeIfOPor
>>46
RAR

0050ニュースソース検討中@自治議論スレ2019/07/06(土) 18:38:34.08ID:e8eG/trn
>>41
>>45
なんか勘違いしてるっぽいけど合ってるよ。
・ZIP爆弾は非再帰的と再帰的二種類ある
・非再帰的な方は昔からある
・記事では再帰的→非再帰的の順で説明している
・引っかかるのはウィルス対策ソフト。解凍ソフトの動作の話はしてない

なんか勘違いしてそうな点はこの辺かな。
読み違えてんじゃない?

0051ニュースソース検討中@自治議論スレ2019/07/06(土) 18:39:51.39ID:e8eG/trn
>>50
訂正:昔からあるのは再帰的の方

0052ニュースソース検討中@自治議論スレ2019/07/06(土) 18:51:13.10ID:HX1egFld
デフォルトでクォータかかってんだから無意味

0053ニュースソース検討中@自治議論スレ2019/07/06(土) 19:24:52.62ID:0ucx9Uqy
>>1
これはすごい発見だデータ量を劇的に小さくできるんだな!( ・`ω´・)

0054ニュースソース検討中@自治議論スレ2019/07/06(土) 19:51:56.85ID:MRa36w5f
ZIPでくれ

0055ニュースソース検討中@自治議論スレ2019/07/06(土) 20:05:39.51ID:L76+5H0T
format c/

0056ニュースソース検討中@自治議論スレ2019/07/06(土) 20:38:58.67ID:NwBYbFIP
増えるワカメ

0057ニュースソース検討中@自治議論スレ2019/07/06(土) 21:28:15.00ID:2WMUeQXz
FILESIZE 30GB
long type overflow at
2147483563 2147483579 2147483587 2147483629 2147483647-2147483648-2147483647-2147483646-2147483645-2147483644

needing something handle bignum library

0058ニュースソース検討中@自治議論スレ2019/07/06(土) 22:59:13.14ID:WUmypzAg
解凍しなくてもこのファイルがあるとウイルス対策ソフトの検索が終わらねぇ

0059ニュースソース検討中@自治議論スレ2019/07/07(日) 01:31:44.10ID:rryxSCDq
>>55
ちがう。

format c: /q

0060ニュースソース検討中@自治議論スレ2019/07/07(日) 02:04:33.41ID:9MZ9a/uO
辣韭の皮

サルにラッキョウを与えると
皮をむいて食おうとして止め処がわからず
最後まで剥いてなくなって泣き叫ぶという

0061ニュースソース検討中@自治議論スレ2019/07/07(日) 02:07:56.08ID:9MZ9a/uO
>>58
アーカイブの中身をチェックするということは、そのアーカイブを解凍して中のファイルを取り出して見ているということだからね。

0062ニュースソース検討中@自治議論スレ2019/07/07(日) 02:14:02.89ID:bMikqJ+t
圧縮ってエントロピーの限界があるって耳学問で聞いたことあるけど??

0063ニュースソース検討中@自治議論スレ2019/07/07(日) 02:34:05.48ID:9MZ9a/uO
情報エントロピーの限界というのは、理想的にランダムな数列に対して可逆圧縮を行う際の概念でしかない。

ランダムではない数列(たとえば「バーカ!お前の母ちゃんデベソ!!」という文字列を一兆回繰り返す、など)の圧縮率は高く、
また画像や音声、動画などは、情報の一部を切り捨てて不可逆的な圧縮を行うことで、圧縮率を高める事ができる。

プログラムコード等の、劣化が許容されず、パターン化も困難でランダムに近いデータの圧縮率は、およそ2倍ほどとされる。

0064ニュースソース検討中@自治議論スレ2019/07/07(日) 02:43:37.81ID:1otth20t
zipにパスワードかけてくださいってマニュアルを先ずは一掃しよう。
エクスキューズにならん

0065ニュースソース検討中@自治議論スレ2019/07/07(日) 14:45:44.58ID:S6HsDcxR
おもしろい

0066ニュースソース検討中@自治議論スレ2019/07/08(月) 09:35:03.09ID:JIVwyeZ/
>>23
素数は知らんが手持ちの円周率データの場合こんな感じ

テキスト 7.5TB
バイナリ 3.16TB

テキストを bzip2 で圧縮したもの 3.23TB

0067ニュースソース検討中@自治議論スレ2019/07/08(月) 19:27:23.19ID:jyvw1RQI
圧縮ソフトは10年以上前のをずっと使ってる。
更新しれとか言われないし。
基本RARだがZIPでも音楽探しちゃうな。

0068ニュースソース検討中@自治議論スレ2019/07/08(月) 19:27:48.24ID:jyvw1RQI
解凍ソフトか。

0069ニュースソース検討中@自治議論スレ2019/07/08(月) 23:32:52.93ID:2sUgSmUf
>>66
なんでそんなもん持ってるんだ?

0070ニュースソース検討中@自治議論スレ2019/07/09(火) 07:21:10.12ID:EeORrNc7
>>64
パス忘れたおえらいさんのzipをツールで解いたらスーパーハカーか?と恐れられた思い出

0071ニュースソース検討中@自治議論スレ2019/08/23(金) 03:55:23.57ID:RKSz8XMz
円周率の圧縮率は任意に高くなる。

 π

とかけば2バイトぐらいか。
あるいは、小数点以下1億桁までの円周率なら
  π(10^8)
とやれば、20バイト以下だろうね。

0072ニュースソース検討中@自治議論スレ2019/09/22(日) 19:34:54.28ID:0Nn2TrOh
探せと指定もしないのに、ZIPファイルの中を永遠に探索するそいつらが悪い。
ZIP爆弾をウイルスパターンで登録できると思っているやつもいるが、パターンで
登録できる類じゃないことも理解できない単細胞なのかな。

■ このスレッドは過去ログ倉庫に格納されています