単体のGPUでもGPT-3などの大規模言語モデルを処理できる「FlexGen」が登場
GPT-3などの大規模言語モデルを処理するには高い計算量とメモリが必要なため、通常は複数のハイエンドなAIアクセラレーターが求められます。
この処理を、メモリ16GBのNVIDIA Tesla T4やメモリ24GBのNVIDIA GeForce RTX 3090など、メモリ容量が限られたGPU単体でも実行するための生成エンジン「FlexGen」が公開されました。
GitHub - Ying1123/FlexGen: Running large language models like OPT-175B/GPT-3 on a single GPU. Up to 100x faster than other offloading systems.
https://github.com/Ying1123/FlexGen#readme
(以下略、続きはソースでご確認ください)
Gigazine 2023年02月22日 07時00分
https://gigazine.net/news/20230222-flexgen/
探検
【ソフトウェア】単体のGPUでもGPT-3などの大規模言語モデルを処理できる「FlexGen」が登場 [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2023/02/23(木) 21:41:31.50ID:DeSpG4UM2023/02/23(木) 21:44:24.33ID:8WxTWdtK
16GBでも何とか動くのが凄いな
RTX4000番台だとRTX4080から使えるって事か
それでもお値段安くないし電気もドカ食いw
RTX4000番台だとRTX4080から使えるって事か
それでもお値段安くないし電気もドカ食いw
3名無しのひみつ
2023/02/23(木) 23:42:58.43ID:rgkaT7qg メインCPUでも16GBなんて無いのに。
2023/02/24(金) 03:49:50.58ID:FT8LlkIr
い、1060で頼む…
2023/02/24(金) 06:36:23.93ID:TgjhU/77
メイン32GBでGBUのVRAMが16GBの構成なら
実用に耐える言語モデルを動かせるようになったか
5年前のBERTなんかは性能も今一つなのに66GB必要だって言われてたなw
実用に耐える言語モデルを動かせるようになったか
5年前のBERTなんかは性能も今一つなのに66GB必要だって言われてたなw
6名無しのひみつ
2023/02/24(金) 07:25:54.32ID:jTnhIEOB ベンチマーク環境はわかったけど、なんで16GB T4 or 24GB RTX3090なんだろうな
Hardware: an NVIDIA T4 (16GB) instance on GCP with 208GB of DRAM and 1.5TB of SSD.
Hardware: an NVIDIA T4 (16GB) instance on GCP with 208GB of DRAM and 1.5TB of SSD.
8名無しのひみつ
2023/02/24(金) 13:14:38.78ID:d5aM0mIC クラウド使えよ
バカじゃねーの
バカじゃねーの
2023/02/24(金) 19:46:36.50ID:jxy48lpR
マイニングの二の舞にするな
10名無しのひみつ
2023/02/26(日) 08:28:27.64ID:z+/LBy13 Nvidiaが暗躍してんだろ
11名無しのひみつ
2023/02/26(日) 13:30:34.50ID:abNWPKOe たった24GBでできます!!
たった24GB!!!
GPUで24GB!
て、手軽だ!!
たった24GB!!!
GPUで24GB!
て、手軽だ!!
12名無しのひみつ
2023/02/26(日) 15:06:14.07ID:GK9ylha1 5年くらい学習させとけよいアルか?
13名無しのひみつ
2023/03/01(水) 12:07:48.48ID:yRC0K8b8 >>6
T4は最新世代の推論専用GPUだから
普通、 AI開発やってるところは学習エンジンにはゲーム GPUは使わない。
学習環境は A100で構築する
A100使ってるところは推論環境もA100をそのまま使う。
推論環境のコストダウンを図りたい場合は T4を使う。
RTX3090とかは小さなベンチャーなら使ってるところも多いかもしれないが
大企業で GPUサーバーで環境構築してることろは RTXだとライセンス違反になる
可能性もあるので基本使えない
T4は最新世代の推論専用GPUだから
普通、 AI開発やってるところは学習エンジンにはゲーム GPUは使わない。
学習環境は A100で構築する
A100使ってるところは推論環境もA100をそのまま使う。
推論環境のコストダウンを図りたい場合は T4を使う。
RTX3090とかは小さなベンチャーなら使ってるところも多いかもしれないが
大企業で GPUサーバーで環境構築してることろは RTXだとライセンス違反になる
可能性もあるので基本使えない
14名無しのひみつ
2023/03/01(水) 14:12:24.83ID:HurzVnPN IntelのGPUって現時点ではそういう縛りは無いんだよな
まあArc A770じゃ計算能力もRTX3060程度でVRAMは確かに16GBだが
A770でPyTorchを動かした例はLinux上あるいはWin内WSL上でしか
無いみたいだが
Arcシリーズは第2世代のbattlemageで大幅に性能アップと言っているので
そこで計算コア数がRTX3080くらいになってくれることに期待したい、が???
まあArc A770じゃ計算能力もRTX3060程度でVRAMは確かに16GBだが
A770でPyTorchを動かした例はLinux上あるいはWin内WSL上でしか
無いみたいだが
Arcシリーズは第2世代のbattlemageで大幅に性能アップと言っているので
そこで計算コア数がRTX3080くらいになってくれることに期待したい、が???
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 中道、食料品消費税を恒久的ゼロの方針 [どどん★]
- 【衆院選公約】自民「食品消費税ゼロ」前向き 中道新党も主張へ ★2 [ぐれ★]
- 【速報】 立憲・安住幹事長 「原発は現実としては再稼働」 新党の基本政策調整で [お断り★]
- 【衆院選公約】自民「食品消費税ゼロ」前向き 中道新党も主張へ ★3 [ぐれ★]
- 野田佳彦代表、Xで「率直にお詫び申し上げます」「私自身、重く受け止めています」 ★2 [ぐれ★]
- 「顔採用」いまだ存在?採用担当者の本音とルッキズムの境界線 研究者は「顔というよりコミュ力」「面接官は似た人を選びがち」 [煮卵★]
- 京都競馬 1回9日目
- 中山競馬 1回7日目2
- @@@令和八年大相撲初場所 vol.7@@@
- 【DAZN】U23アジア杯サウジアラビア大会 2026 ★13
- 競輪実況★1671
- @@@令和八年大相撲初場所 vol.6@@@
- 【高市悲報】台湾人「日本の国会図書館ヤバすぎだろ 税金でとんでもないもの保管してる」 [358382861]
- 自民党、公約に「消費税引き下げ検討」を盛り込みへ [237216734]
- 【出来る理由】高市、2年間食品の消費税ゼロに!財源もレジ改修もインフレ懸念も解消か! [219241683]
- 【高市悲報】中道安住「2017年の原発や安保法制の主張はどうした…?そげな昔のこと知るかい🙄」 [359965264]
- 【悲報】玉木代表「中道って具体的に何なんですかね」 [974680522]
- 【速報】"いじめ問題"でこども家庭庁ら6省が緊急会議「SNSへの動画削除を即座に要請するよう厳命」方針で決定wwwwww [591180291]
