【ハードウェア】「推論」の処理速度でNVIDIA超え、米新興「セレブラス」のAIチップの実力 [すらいむ★]

■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
垢版 |
2025/06/05(木) 22:36:36.59ID:K+uqsJLP
「推論」の処理速度でNVIDIA超え、米新興「セレブラス」のAIチップの実力

 筆者は先日、「世界最大のコンピューターチップ」といえるほど、巨大なチップを手にする機会を得た。
 人工知能(AI)チップのスタートアップ、Cerebras(セレブラス)が開発した「ウェーハスケール・エンジン(WSE)」だ。
 ほとんどのコンピューターチップは郵便切手ほどの大きさかそれより小さいが、このAIチップは一辺の長さが約22センチもある巨大な正方形をしており、最新モデルは1枚のチップに4兆個に及ぶトランジスターを搭載している。

(以下略、続きはソースでご確認ください)

Forbes JAPAN 6/5(木) 15:00
https://news.yahoo.co.jp/articles/4fed379914d3f332cc82ef394eeed2348a4be776
2名無しのひみつ
垢版 |
2025/06/05(木) 23:11:23.30ID:xDNQCGXZ
・主要顧客がアラブの1社頼み
・ハイエンドに特化しすぎて、裾の根が広がりにくい=ソフトウェアエコシステムができにくい

が欠点
3名無しのひみつ
垢版 |
2025/06/05(木) 23:20:37.33ID:gPzTLmnS
実数は単精度だけで倍精度がない。
4名無しのひみつ
垢版 |
2025/06/05(木) 23:39:04.78ID:xDNQCGXZ
・主要顧客がアラブの1社頼み
・ハイエンドに特化しすぎて、裾の根が広がりにくい=ソフトウェアエコシステムができにくい

が欠点
2025/06/05(木) 23:44:55.73ID:PxWUljFh
足何本になるんだろうか
6名無しのひみつ
垢版 |
2025/06/05(木) 23:50:52.90ID:rNWFFSLO
歩留まりが悪くて量産しても値段が下がらなそうだな
7名無しのひみつ
垢版 |
2025/06/06(金) 00:01:11.22ID:tdnwTfP+
電源供給と排熱がムリそう
石油液浸で冷やすのか?
8名無しのひみつ
垢版 |
2025/06/06(金) 00:14:29.69ID:TZgrwT41
待って。トランジスタ数20倍で、推論性能2.5倍ってあまりに効率悪すぎないか?
9名無しのひみつ
垢版 |
2025/06/06(金) 01:37:21.29ID:43NcZ2gN
まずチップと呼ぶなよ
10名無しのひみつ
垢版 |
2025/06/06(金) 01:38:10.60ID:43NcZ2gN
まずチップと呼ぶなよ
11名無しのひみつ
垢版 |
2025/06/06(金) 03:16:29.89ID:YS7rezJm
ウエハーは丸いんだから端っこまで詰めろよw
12名無しのひみつ
垢版 |
2025/06/06(金) 05:00:50.97ID:fkTXjTWx
>>9
ボイス・トゥ・スカ10 Wikipedia
最終更新 2023年10月30日 (月)
https://ja.wikipedia.org/wiki/%E3%83%9C%E3%82%A4%E3%82%B9%E3%83%BB%E3%83%88%E3%82%A5%E3%83%BB%E3%82%B9%E3%82%AB%E3%83%AB
>>音声を記憶させたパルス波形のマイクロ波を特定対象者(ターゲット)に照射
13名無しのひみつ
垢版 |
2025/06/06(金) 05:01:58.92ID:fkTXjTWx
>>12
アンカーミスです

>>12 続き
>>9
>>深いサブリミナル効果を発生し共鳴させるには、音響強度を特定範囲に維持する必要があり、その装置は充電式携帯端末用のサブオーディオ音響放射源で適切に構成される。
>>• 特定対象だけに音声を届ける広告利用など、第5世代移動通信システム(5G)に向け技術開発が進んでいる
14名無しのひみつ
垢版 |
2025/06/06(金) 14:45:04.56ID:I1nbij2a
そっかー
15名無しのひみつ
垢版 |
2025/06/07(土) 07:04:21.82ID:spjD1Puz
歩留まり悪そう
16名無しのひみつ
垢版 |
2025/06/07(土) 12:14:30.73ID:plqhDr7k
不良チップは殺して出荷すんだろうな
当たりハズレが激しそう
2025/06/07(土) 15:20:59.88ID:ne8/R/yP
>>8
対比している大規模言語システムがチップ1枚で動くとでも?
18名無しのひみつ
垢版 |
2025/06/09(月) 19:18:16.91ID:QoKf6AiD
こんな値段の高い物を使えるのは、セレブだけだ。
19名無しのひみつ
垢版 |
2025/06/10(火) 12:34:50.03ID:LKTMkRrB
ウエハー丸ごと1チップにするとかさぁ
最高やんwwww
20名無しのひみつ
垢版 |
2025/06/12(木) 11:58:33.86ID:IhDODkyk
今日のジェンセンNVIDIA教祖さまのお言葉です。
「CUDAQを使いなさい。クーダキューです。
そうすれば、今現在はGPUを使いつつも
量子が使えるようになった時
カンタムにそのまま移行できるでしょう。」

CPU→GPU→QPU
GPUがQPUの露払いをします
21名無しのひみつ
垢版 |
2025/06/16(月) 23:00:07.66ID:IqZcJDF4
>>20
シミュレータ?メモリ足りねえんだよカス
22名無しのひみつ
垢版 |
2025/06/26(木) 12:18:10.05ID:onNMqXHZ
ウェーハーサイズのチップでその消費電力は電気ストーブ並み。
ウェーハーの上にはメモリを抱いたCPUのようなものと
ネットワークとルーターが形成されていて、製造時に欠陥が
あったCPUやネットワークやルーターは、ディスエーブルに
して迂回して動作するようになっている。そのため冗長性が
最初から作り込まれている。ウェーハー内のデータ通信の
パスの数が多いので、データ転送のバンド幅は極めて高い。
しかも分散メモリ並列になっている。問題がうまくはまれば
極めて高い性能が出せるのだ。
23名無しのひみつ
垢版 |
2025/06/26(木) 14:07:25.42ID:MoYjaoCE
常識を覆す逆転の発想?
真ん中の方とかどうやって配線してるの?
24名無しのひみつ
垢版 |
2025/06/28(土) 01:40:00.78ID:BHsF3O4Q
都市が碁盤目になってそこにビルが建ち並び、道路を車が走っているように、
ウェーハーの上でデータ通信のネットワークが形成されているんだよ。
電力を供給するためには、ウェハー上に電源装置から大電流を供給するための
ポイントがいくつもあったと思う。板に穴が空いているところがそれだと思った。

進化し続けるWSE(Wafer Scale Engine)⁠⁠、大規模AIモデルのトレーニング性能とは
――Cerebras社訪問2024【前編】
https://gihyo.jp/article/2024/09/cerebras-systems-wafer-scale-engine-2024-01
――Cerebras社訪問2024【後編】
https://gihyo.jp/article/2024/10/cerebras-systems-wafer-scale-engine-2024-02
25名無しのひみつ
垢版 |
2025/06/28(土) 01:58:18.47ID:zVmYUnEM
ウエハーに12*7=84個のAIコアを搭載して
奇数枚のウエハーで構成したシステムで多数決を行い
推論能力の精度を高めるのかも
26名無しのひみつ
垢版 |
2025/06/28(土) 15:32:25.34ID:BHsF3O4Q
https://www.cerebras.ai/
https://www.cerebras.ai/chip

ここにチップ(デカい)の説明があるな。
27名無しのひみつ
垢版 |
2025/06/28(土) 15:36:51.22ID:BHsF3O4Q
https://cn.teldevice.co.jp/product/cerebras_cs-2/
日本の代理店はこれ。
28名無しのひみつ
垢版 |
2025/06/28(土) 22:44:26.15ID:e67wAmX6
AWS のチップの方が性能いいんじゃないの
29名無しのひみつ
垢版 |
2025/06/28(土) 23:30:05.48ID:BHsF3O4Q
30cm径よりも大きなウェーハーが作られるようになったら、
たとえば60cm径なら、チップの面積は4倍にできるな。
(チップの消費電力も4倍になるが)
TSMCの能力恐るべし
30名無しのひみつ
垢版 |
2025/07/06(日) 10:26:26.41ID:Fd/NrR0O
スケールが桁違い。TSMCが注力する超大規模高速パッケージ「SoW」とは
2025年7月4日
https://pc.watch.impress.co.jp/docs/column/semicon/2028206.html

アイディアと回路の設計ができれば、TSMCに発注すると実現するらしい。
そういう標準的な生産システムが構築されたようだ。
システムを丸ごとウェハー上に構成できるから、広帯域のバンド幅を
使って通信のボトルネックを緩和できる。
31名無しのひみつ
垢版 |
2025/07/06(日) 10:28:24.86ID:Fd/NrR0O
ウェーハーのサイズは30センチ直径で足踏みしたままだが、
45センチが実用化されたら、集積できるトランジスタの数は
それだけでも2倍になる。
32名無しのひみつ
垢版 |
2025/07/06(日) 10:47:59.43ID:asv72EAN
だろう運転、かもしれない運転。
ダメ、絶対!
33名無しのひみつ
垢版 |
2025/07/14(月) 11:37:42.40ID:D03TWgmT
大きいことは良いことだ。

それで考えたんだけれども、
精密に正方形に切り出した1辺25センチのウエーハー
で辺のところも綺麗に加工して、ほとんど完全な
ものにして、そういう25センチサイズの正方形のシリコンタイルを
ピタッと寄せ集めて貼り付けたものの上に、分子蒸着でシリコンの
層を形成して、そこに回路を形成していくということにすれば、
1辺の長さが1メートルのシリコンからなるLSIなどを作れないかねぇ。
でもたぶん今のトレンドは、完成した小さいチップ複数枚を
基盤上で貼り合わせて配線する方向のようだね。チップ間の
通信バンド幅が沢山とれるようにもしも将来なるならばそれでも
良いのだが。
34名無しのひみつ
垢版 |
2025/07/18(金) 23:49:46.03ID:vn/pHeaP
Intel Officially Throws in Training Towel, Will Focus on Edge and Agentic AI
By Doug Eadline
July 14, 2025
https://www.hpcwire.com/2025/07/14/intel-officially-throws-in-training-towel-will-focus-on-edge-and-agentic-ai/

なさけない。
35名無しのひみつ
垢版 |
2025/07/19(土) 09:54:31.72ID:od/vCzAi
これまではOSやライブラリやサーバーの枠組みの中で
新しいものを産み出す競争だったが
これからしばらくは計算効率を競うような時代になりそうだね
人間が価値を感じる推論を効率よく行うにはどういうアルゴリズムが必要で
それを効率よく実行するには、どういうプロセッサやどういう伝送路が有効なのかを競う感じ
36名無しのひみつ
垢版 |
2025/07/20(日) 00:55:03.79ID:RcUJp+z4
ニューラルネットを直接的に反映した電気回路をLSIにできないのだろうか?
逆伝搬の計算をする所に多少の工夫が必要そうだけれども。
37名無しのひみつ
垢版 |
2025/07/25(金) 20:18:35.84ID:hSKDfytC
クラウドGPU導入のススメ
https://www.gpu-susumedia.com/

個人の趣味としては、GPUマシンを買うか、あるいは
GPUクラウドを時間単位で課金されて使う他にあるまい。
しかし、金が掛かるな。
■ このスレッドは過去ログ倉庫に格納されています
16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面

ニューススポーツなんでも実況