8.9倍速い程度ではGPUにCPUが叶うことはありません。
アーキテクチャの最適化がない状態では話になりません。
計算機は4bit, 8bit, 16bit, 32bit, 64bitという流れで拡張されてきました。計算機の歴史において、科学計算の精度を上げるためには高桁数の浮動小数点を扱う必要があると長年考えられてきました。8bitから16bitに進化した後、高桁の浮動小数を計算するのには時間がかかり過ぎる問題に直面していたため、32bit floatを高速処理するための専用回路を発明しました。その結果は長らく32bitが主流となり、2015年まではこれが主流となりました。
しかし、DeepLearningの登場で、32bitはメモリが肥大化し過ぎて大きなノード数を確保できなくなることや、bitを落としても精度の劣化は非常に小さい事がわかったため、16bit floatが計算に使われるようになりました。half floatと呼ばれるようになった16bit floatで作られたモデルは、実測値で32bit floatモデルよりも速度が非常に遅いという結果になりました。想定外の結果ですが驚くことではありません。これはhalf floatに対する専用回路が存在しなかったためです。そこで2015年以降のハードウェア設計では16bit float専用回路を搭載したものが登場し、大規模モデル、高速処理、省エネに大きく貢献しました。
DeepLearningモデルの精度はどの程度までbitを落としてもよいのか?を研究する人が増えました。すぐに2
値化、つまり1bitモデル(バイナリモデル)が作られましたが、精度は明らかに悪化しました。浮動小数の計算より整数の計算のほうが圧倒的に速いため、int型のモデルの検証も進みました。4bit intも精度vs速度では非常に有益である事がわかったため、ハードウェアは4bit int専用回路も製作されることになりました。
これが今日までのハードウェアアーキテクチャの進化の歴史です。
1bitが有益であれば将来のアーキテクチャで対応されるでしょう。
【LLM】1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
19名無しのひみつ
2024/02/29(木) 04:15:58.14ID:0KDmAa4H■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 日本で働く外国人が250万人を超えて過去最多に 最多のベトナムが約60万人で中国は約43万人 ★3 [煮卵★]
- 『ハイスクール!奇面組』新作アニメ、なぜ不評に? 80年代ギャグ漫画リメイクへの違和感 [muffin★]
- 中道と国民、46選挙区で対決 連合「言うこと聞かない」異例の抗議 [蚤の市★]
- 逮捕は羽月容疑者に止まらない可能性も…球界蔓延か 同じルートで購入した選手が複数いるとみられ捜査線上には西日本出身選手の名前も [Ailuropoda melanoleuca★]
- 【スキー】高梨沙羅 櫻井翔との対談で見せたビジュアルにファン驚き… 新広告でも顕著な魅力の“アップデート” [冬月記者★]
- 「盗んでいません」ブラジル国籍の男がトヨタ「ランドクルーザー」窃盗の疑いで通算4度目の逮捕「強制送還しろ」「刑罰が緩すぎる」の声 [七波羅探題★]
- ウンチングアプリってどう
- ギャンブルでかける金額を倍にしていけば最終的には絶対利益出るじゃん!
- 身体が腐ってる
- 電化製品ってたまに舌打ちしてくるよな
- 高市早苗「ピンチはチャンスに変えられる!日本はやっぱりすごい!レアアースも医薬品もリンも国産化だ!」 [931948549]
- ジェット波越
