単体のGPUでもGPT-3などの大規模言語モデルを処理できる「FlexGen」が登場
GPT-3などの大規模言語モデルを処理するには高い計算量とメモリが必要なため、通常は複数のハイエンドなAIアクセラレーターが求められます。
この処理を、メモリ16GBのNVIDIA Tesla T4やメモリ24GBのNVIDIA GeForce RTX 3090など、メモリ容量が限られたGPU単体でも実行するための生成エンジン「FlexGen」が公開されました。
GitHub - Ying1123/FlexGen: Running large language models like OPT-175B/GPT-3 on a single GPU. Up to 100x faster than other offloading systems.
https://github.com/Ying1123/FlexGen#readme
(以下略、続きはソースでご確認ください)
Gigazine 2023年02月22日 07時00分
https://gigazine.net/news/20230222-flexgen/
探検
【ソフトウェア】単体のGPUでもGPT-3などの大規模言語モデルを処理できる「FlexGen」が登場 [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2023/02/23(木) 21:41:31.50ID:DeSpG4UM2023/02/23(木) 21:44:24.33ID:8WxTWdtK
16GBでも何とか動くのが凄いな
RTX4000番台だとRTX4080から使えるって事か
それでもお値段安くないし電気もドカ食いw
RTX4000番台だとRTX4080から使えるって事か
それでもお値段安くないし電気もドカ食いw
3名無しのひみつ
2023/02/23(木) 23:42:58.43ID:rgkaT7qg メインCPUでも16GBなんて無いのに。
2023/02/24(金) 03:49:50.58ID:FT8LlkIr
い、1060で頼む…
2023/02/24(金) 06:36:23.93ID:TgjhU/77
メイン32GBでGBUのVRAMが16GBの構成なら
実用に耐える言語モデルを動かせるようになったか
5年前のBERTなんかは性能も今一つなのに66GB必要だって言われてたなw
実用に耐える言語モデルを動かせるようになったか
5年前のBERTなんかは性能も今一つなのに66GB必要だって言われてたなw
6名無しのひみつ
2023/02/24(金) 07:25:54.32ID:jTnhIEOB ベンチマーク環境はわかったけど、なんで16GB T4 or 24GB RTX3090なんだろうな
Hardware: an NVIDIA T4 (16GB) instance on GCP with 208GB of DRAM and 1.5TB of SSD.
Hardware: an NVIDIA T4 (16GB) instance on GCP with 208GB of DRAM and 1.5TB of SSD.
8名無しのひみつ
2023/02/24(金) 13:14:38.78ID:d5aM0mIC クラウド使えよ
バカじゃねーの
バカじゃねーの
2023/02/24(金) 19:46:36.50ID:jxy48lpR
マイニングの二の舞にするな
10名無しのひみつ
2023/02/26(日) 08:28:27.64ID:z+/LBy13 Nvidiaが暗躍してんだろ
11名無しのひみつ
2023/02/26(日) 13:30:34.50ID:abNWPKOe たった24GBでできます!!
たった24GB!!!
GPUで24GB!
て、手軽だ!!
たった24GB!!!
GPUで24GB!
て、手軽だ!!
12名無しのひみつ
2023/02/26(日) 15:06:14.07ID:GK9ylha1 5年くらい学習させとけよいアルか?
13名無しのひみつ
2023/03/01(水) 12:07:48.48ID:yRC0K8b8 >>6
T4は最新世代の推論専用GPUだから
普通、 AI開発やってるところは学習エンジンにはゲーム GPUは使わない。
学習環境は A100で構築する
A100使ってるところは推論環境もA100をそのまま使う。
推論環境のコストダウンを図りたい場合は T4を使う。
RTX3090とかは小さなベンチャーなら使ってるところも多いかもしれないが
大企業で GPUサーバーで環境構築してることろは RTXだとライセンス違反になる
可能性もあるので基本使えない
T4は最新世代の推論専用GPUだから
普通、 AI開発やってるところは学習エンジンにはゲーム GPUは使わない。
学習環境は A100で構築する
A100使ってるところは推論環境もA100をそのまま使う。
推論環境のコストダウンを図りたい場合は T4を使う。
RTX3090とかは小さなベンチャーなら使ってるところも多いかもしれないが
大企業で GPUサーバーで環境構築してることろは RTXだとライセンス違反になる
可能性もあるので基本使えない
14名無しのひみつ
2023/03/01(水) 14:12:24.83ID:HurzVnPN IntelのGPUって現時点ではそういう縛りは無いんだよな
まあArc A770じゃ計算能力もRTX3060程度でVRAMは確かに16GBだが
A770でPyTorchを動かした例はLinux上あるいはWin内WSL上でしか
無いみたいだが
Arcシリーズは第2世代のbattlemageで大幅に性能アップと言っているので
そこで計算コア数がRTX3080くらいになってくれることに期待したい、が???
まあArc A770じゃ計算能力もRTX3060程度でVRAMは確かに16GBだが
A770でPyTorchを動かした例はLinux上あるいはWin内WSL上でしか
無いみたいだが
Arcシリーズは第2世代のbattlemageで大幅に性能アップと言っているので
そこで計算コア数がRTX3080くらいになってくれることに期待したい、が???
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 新党「中道改革連合」に「期待する」は28%…衆院解散に賛成36%、反対50%…朝日世論調★3 [♪♪♪★]
- 自民党・松川るい氏、日中関係「正常化を」 議員交流に期待 [蚤の市★]
- 【衆院選公約】自民「食品消費税ゼロ」前向き 中道新党も主張へ ★5 [ぐれ★]
- 閉山中の富士山8合目の登山道で中国人男性が転倒し負傷 「右足首をケガして歩けない」 消防に救助要請 18日朝から単独で登山か [♪♪♪★]
- 【高額療養費制度】「引き上げるなら安楽死を認めてほしい」負担額が2倍近くになる長期療養患者も 「治療を諦めざるを得ません」 ★2 [ぐれ★]
- 麻生氏、衆院解散を支持 「支持率が高いときに解散するのは当然の常識だ」 [♪♪♪★]
- なんG女子小学生のスカートの中潜っておパンツクンクンしたい部🏡
- 小野田(35)大臣「デマ動画に気をつけて!私はバイクも免許も持ってません!愛国者「何のバイク乗ってるんですか?」 [834922174]
- 国民民主党、原口一博を獲得へ 玉木代表自ら連絡!、! 高市早苗 [175344491]
- 昔のカラオケってTVのリモコンみたいなのでポチポチ歌の番号入力してたよな
- 高市「食料品消費税ゼロやる!」橋下「じゃあ今すぐ国会で通せよ。与野党で一致してるだろ」 [931948549]
- ヤリチンだけど質問ある?
