X



【IT/ウィルス】「非再帰的ZIP爆弾」は10MBのファイルが281TBに膨らむ[07/06]
■ このスレッドは過去ログ倉庫に格納されています
0001一般国民 ★
垢版 |
2019/07/06(土) 02:34:22.48ID:CAP_USER
「非再帰的ZIP爆弾」は10MBのファイルが281TBに膨らむ
https://gigazine.net/news/20190705-zip-bomb/
2019/7/5
GIGAZINE

画像:
https://i.gzn.jp/img/2019/07/05/zip-bomb/01.png

【科学(学問)ニュース+】

数十KBのZIPファイルに見えて解凍すると膨大なファイル容量を食う「ZIP爆弾(高圧縮ファイル爆弾)」は、ZIPファイルの中にZIPファイルを格納し、内側のZIPファイルの中にさらにZIPファイルが……という入れ子構造を用いることで圧縮アルゴリズムの限界をうまく回避していますが、それゆえに多くのアンチウイルスソフトで対策されています。この弱点を乗り越えた「非再帰的ZIP爆弾」は、展開後のサイズこそ高効率で作られた再帰的ZIP爆弾にかなわないものの、わずか10MBから281TBへ2800万倍に膨らみます。

ZIPの圧縮で一般的に用いられているアルゴリズムは「Deflate(デフレート)」と呼ばれるもので、圧縮・展開速度の速さが特徴的です。圧縮率が最高で1032:1(約0.096%)という点はZIP爆弾を作る際の「足かせ」となっており、この制限を回避するため、ZIP爆弾ではZIPファイル内にZIPファイルを格納する入れ子構造を利用して、入れ子1つごとに1032倍にできるだけ近い圧縮率を得ることで、巨大ファイルを極小に見せています。

たとえば、有名なZIP爆弾に「42.zip」というファイルがあります。このZIPファイルは2種類存在して、古いバージョンは展開時のパスが不要でファイルサイズが「42,374バイト」、新しいバージョンは展開時にパスが必要でファイルサイズが「42,838バイト」。以下は古いバージョンのプロパティです。

中をのぞいてみると「lib 0.zip」から「lib f.zip」まで連番のつけられた16個のZIPファイルが格納されています。ファイルの元サイズは34,902バイト(35KB)で、圧縮後は2,533バイト(2.6KB)。圧縮率は7.3%。

「lib 0.zip」には、さらに「book 0.zip」から「book f.zip」というZIPファイルがあります。こちらは元サイズが29,446バイト(30KB)、圧縮後が2,084バイト(2.1KB)で、圧縮率7.1%。

外側の42.zipから数えて5層目の「page 0.zip」を開くと、とうとう入れ子が終了して「0.dll」というファイルが登場しました。元サイズは4,294,967,295バイト(4.3GB)で、圧縮後は4,168,158バイト(4.2MB)なので、圧縮率は実に0.1%です。

6層目には同じように0.1%にまで圧縮された巨大ファイルが他にも大量にあるので、もし42.zipを展開をすると、わずか42KBのところから4,507,981,343,026,016バイト(4.5PB)ものファイルが出現することになります。その膨張率は1060億倍。

ただし、これは「再帰的な展開が行われる実装なら」という前提が必要で、最上位層しか展開されない場合、展開後サイズはわずかに558,432バイト(558KB)で、元の13.2倍にしかなりません。

一方、デビッド・フィフィールド氏の提唱する非再帰的ZIP爆弾は、1層目に0.1%まで圧縮されたファイルが250個並んでおり、元ファイルサイズは42.zipと同じ42KBですが、展開すると元の12万9000倍となる5,461,307,620バイト(5.5GB)にまで膨らみます。


元ファイルを10MBにすると、展開後サイズを元の2800万倍の281TBにまで増やせるとのこと。さらに、Zip64を用いると、46MBのファイルを9800万倍の4.5PBにすることが可能。

この非再帰的ZIP爆弾は、ZIPコンテナ内のファイルを重複させることで、コピーを作ることなく複数ファイルに含まれる圧縮率の高いカーネルを参照する仕組みとなっています。このため、入力サイズに比例して出力サイズが増大し、「爆弾」が大きくなるほど圧縮率が向上するとのこと。

記事作成時点で、42.zipはアンチウイルスソフトが反応してダウンロードできないようになっていましたが、フィフィールド氏の作った非再帰的ZIP爆弾ファイルには反応しなかったので、くれぐれも怪しいZIPファイルには気をつけてください。
0003ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 02:48:21.91ID:e8eG/trn
ZIP爆弾ねぇ。懐かしい気がする。
真っ当な解凍ソフトならそこそこ対策されてんじゃないかな?
対策と言っても空き容量チェックする程度の話だけど。

それより普通のZIP爆弾って入れ子構造だったの? 知らんかった。
しかもZIPってハードリンクみたいな事もできるのか。
まぁできるだろうね。FATみたいなのに位置が記されてるだろうし。
0004ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 03:03:07.62ID:L4LQv+hP
単色ビットマップで巨大サイズ作るイタズラ昔有ったよね。
手口としては懐かしい感じw
0005ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 03:06:49.50ID:Xiu0iszY
>>2
両爆弾はコンセプトとしては似ている。
同じ思想系の系譜。
0006ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 03:33:06.71ID:K48Ls8FS
うちの会社で画像圧縮して復元すると巨大になるやつ作ってるアホいたなあ。
福島出身の陰気な野郎だったよ
0007ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 03:34:23.66ID:eMKTeOzN
これでハードディスクが一瞬にして満杯になって作動不能になるわけだな。
0009ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 03:46:04.04ID:sjPV4wZp
xlsx とか docx とか、2007 以降の Office ファイルって、実態は zip ファイルなんだよな
>>1 を悪用すると、取引先に嫌がらせができちゃうw
嫌がらせどころじゃなく Windows が起動できなくなる破壊活動だけど
0010ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 03:57:26.49ID:wBnTbA2Z
素zipはソリッド圧縮出来ないだろ
なんでカーネルファイルなんて手法が出てくるんだ?
0012ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 04:39:05.85ID:dEVPeXr3
>>8
20年前か?
0014ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 06:59:30.04ID:2WMUeQXz
>>1
あまり使わないキャッシュファイルの収納に便利?
素数10億まで書き出したのが500MBあり
1000憶ぐらいまでファイルに書き出しておこうと思ってちょうど困ってたんだ
これでかすぎるぞ とな

素数の性質は大きな素数は存在するが濃度が薄い(大きな素数を追記しても
その数が少なく見積もれるのでたぶん1G ~2GB ぐらい1000億まで収まる可能性がある)
しかし1GBとか使わないときにはサイズ撮りすぎ
0015ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 07:22:01.33ID:/dhZJwJ7
だからズームイン朝のままが良かったんだよ
0017ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 07:30:42.02ID:qLr2gT98
今時こんなの対策してないソフトあるん?
0018ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 07:40:45.90ID:w6fY5bI7
(`●ω●´) ロリータポルノ爆弾
0019ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 08:33:21.96ID:7JyKRXAM
Win95時代に白一色のビットマップファイルで同じようなことをやったな。
0020ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 09:15:45.32ID:IVRM4rOZ
しかし、展開先もどうせ仮想ディスクなのであった。
0021ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 10:08:26.86ID:5WJD2H0H
ディスクの容量って2種類あって、
一つはGBとかの分かりやすい容量
もう一つはファイル数を扱う容量
ファイル数を何百万個扱えるかは4KB、8KBといったフォーマット時のブロック単位で変わってきて、専門用語ではi-node数が2つ目の容量になる
1ファイルあたり、1ブロック数(4KB)より少ない容量で大量のファイルを用意すると、i-nodeが枯渇してディスク容量不足が発生する
Windowsならフォルダのインデックス作成で爆死するレベル
素人に作りやすいのは1個の巨大ファイルを高効率で圧縮できるバイナリファイルの作成だろうけど、この攻撃によるダメージは無いに等しいくらい簡単に復旧できる
0024ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 10:13:09.08ID:37QDLEc5
>>21
で、おまえはなんの玄人なの?w
0026ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 10:31:51.18ID:jsGN5Q7b
増えるワカメ
0027ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 10:36:31.21ID:4LJJ/RbW
他人に嫌がらせするために情熱燃やせる連中とは関わり合いたくねえな
0029ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 11:30:27.90ID:vUgIhzxr
中身を確認すればOK
0030ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 11:37:00.36ID:juWbXTxY
>>15
あれJAPをもじったタイトルだからな
0031ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 11:45:09.30ID:AlU5bwwx
FAT32なワイ高みの見物
0034ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 12:54:54.28ID:XaFcmuQ0
要するに「ZIPでくれw」は危険だ、ということかな?w
0035ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 13:04:08.67ID:JiRM0ybp
>>34
そこで「LZHでくれw」
0036ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 13:05:13.84ID:iRgQEo/l
つうか 今時怪しいZIPファイルだなんて・・・
0037ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 13:10:57.73ID:B9xnns66
メールに添付して送信すると
メールサーバがウイルスチェックのために zip を展開してダウンするのかね?
0038ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 14:36:11.68ID:S1RiveZ8
だまりゃ!麿は恐れ多くも帝より三位の位を賜わり中納言を務めた身じゃ!
すなわち帝の臣であって徳川の家来ではおじゃらん!
0039ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 15:03:37.24ID:tvjH2Efz
なつかC
0040ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 15:13:03.92ID:snrXmrhb
添付で送れないならHTTPDにPOSTすればいいじゃない
0041ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 15:23:29.04ID:mt7f2ZT8
>>3
少しは>>1を読んでから書け
0042ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 15:56:38.75ID:lKyYdeuW
これが問題になるセキュリティレベルとか・・・
0043ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 15:59:21.37ID:tRafcpzv
今時zipでくれとか誰も言わんよな
0045ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 16:16:02.51ID:xw9BEHgw
>>3
元ソース全部読めなんて言わんけど
1も読まないのなんやねん
0046ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 16:16:43.65ID:7hHKV14C
ファイルを圧縮して送る場合、zip以外なら何がいいのだろ?
0047ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 16:43:34.21ID:jlHzf62D
ハードディスクの中身完全消去するには良さそう
0050ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 18:38:34.08ID:e8eG/trn
>>41
>>45
なんか勘違いしてるっぽいけど合ってるよ。
・ZIP爆弾は非再帰的と再帰的二種類ある
・非再帰的な方は昔からある
・記事では再帰的→非再帰的の順で説明している
・引っかかるのはウィルス対策ソフト。解凍ソフトの動作の話はしてない

なんか勘違いしてそうな点はこの辺かな。
読み違えてんじゃない?
0052ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 18:51:13.10ID:HX1egFld
デフォルトでクォータかかってんだから無意味
0053ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 19:24:52.62ID:0ucx9Uqy
>>1
これはすごい発見だデータ量を劇的に小さくできるんだな!( ・`ω´・)
0055ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 20:05:39.51ID:L76+5H0T
format c/
0057ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 21:28:15.00ID:2WMUeQXz
FILESIZE 30GB
long type overflow at
2147483563 2147483579 2147483587 2147483629 2147483647-2147483648-2147483647-2147483646-2147483645-2147483644

needing something handle bignum library
0058ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 22:59:13.14ID:WUmypzAg
解凍しなくてもこのファイルがあるとウイルス対策ソフトの検索が終わらねぇ
0059ニュースソース検討中@自治議論スレ
垢版 |
2019/07/07(日) 01:31:44.10ID:rryxSCDq
>>55
ちがう。

format c: /q
0063ニュースソース検討中@自治議論スレ
垢版 |
2019/07/07(日) 02:34:05.48ID:9MZ9a/uO
情報エントロピーの限界というのは、理想的にランダムな数列に対して可逆圧縮を行う際の概念でしかない。

ランダムではない数列(たとえば「バーカ!お前の母ちゃんデベソ!!」という文字列を一兆回繰り返す、など)の圧縮率は高く、
また画像や音声、動画などは、情報の一部を切り捨てて不可逆的な圧縮を行うことで、圧縮率を高める事ができる。

プログラムコード等の、劣化が許容されず、パターン化も困難でランダムに近いデータの圧縮率は、およそ2倍ほどとされる。
0064ニュースソース検討中@自治議論スレ
垢版 |
2019/07/07(日) 02:43:37.81ID:1otth20t
zipにパスワードかけてくださいってマニュアルを先ずは一掃しよう。
エクスキューズにならん
0066ニュースソース検討中@自治議論スレ
垢版 |
2019/07/08(月) 09:35:03.09ID:JIVwyeZ/
>>23
素数は知らんが手持ちの円周率データの場合こんな感じ

テキスト 7.5TB
バイナリ 3.16TB

テキストを bzip2 で圧縮したもの 3.23TB
0071ニュースソース検討中@自治議論スレ
垢版 |
2019/08/23(金) 03:55:23.57ID:RKSz8XMz
円周率の圧縮率は任意に高くなる。

 π

とかけば2バイトぐらいか。
あるいは、小数点以下1億桁までの円周率なら
  π(10^8)
とやれば、20バイト以下だろうね。
0072ニュースソース検討中@自治議論スレ
垢版 |
2019/09/22(日) 19:34:54.28ID:0Nn2TrOh
探せと指定もしないのに、ZIPファイルの中を永遠に探索するそいつらが悪い。
ZIP爆弾をウイルスパターンで登録できると思っているやつもいるが、パターンで
登録できる類じゃないことも理解できない単細胞なのかな。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況