X



AMDの次世代GPUについて語ろう 6世代
■ このスレッドは過去ログ倉庫に格納されています
0001Socket774 (ワッチョイ 83b1-C8cC)
垢版 |
2021/03/07(日) 23:39:29.63ID:/bUCprNe0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AMDのGPUに関する話題のスレです。

関連スレ
CPUに関してはこっちで。
AMDの次世代APU/CPU/SoCについて語ろう 301世代
http://egg.5ch.net/test/read.cgi/jisaku/1606557994/
前スレ
AMDの次世代GPUについて語ろう 5世代
http://egg.5ch.net/test/read.cgi/jisaku/1596721794/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0300Socket774 (アウアウウー Sa49-Qzdv)
垢版 |
2023/02/21(火) 17:43:20.40ID:x73US4yra
>>299 DeepL(機械翻訳)がそうらしい。第二のgoogleになる可能性がある。長年研究してきたことがAI技術で無になってしまったら怖いよな。
0301Socket774 (ワッチョイ 3d11-k1/p)
垢版 |
2023/02/24(金) 19:20:36.38ID:uYkf+Z640
7800以下はQ2以降からとか言ってるけど、年明けに8900(仮)出るからハイとローは0.5世代ずつずれて50は無くなるのかな
0310Socket774 (ワッチョイ 3d11-N/Lw)
垢版 |
2023/06/09(金) 21:26:27.53ID:EyKnvUe80
AMD RX 7600 Has Better Cache Latency Than the RX 7900 XTX
https://www.tomshardware.com/news/rx-7600-sports-better-latency-compared-7900-xtx

IFキャッシュのレイテンシに関して、MCMだと不利になる、って話。
Navi31はIFキャッシュ192MB案もあっただろうけど、MCM化に際してレイテンシ対策をしたら
容量増やせなくなった(が十分な性能は出ていた)と考えるべきだろう。


RDNA 3世代のミドルクラスGPU「Radeon RX 7600」性能速報。FHDでは競合のミドルクラスと戦えるがネックは価格か
https://www.4gamer.net/games/660/G066019/20230522039/
↑で、288GB/s+32MBのRX7600と320GB/st+80MBのRX6700の比較で
RX7600は、キャッシュ容量とメモリ帯域で勝るRX6700とほぼ同等なので
RDNA3世代のIFキャッシュは、RDNA2換算で倍程度の容量と同等で、Navi31のキャッシュ容量が足りないってことはなさそうな。
0312Socket774 (ワッチョイ 6211-hRAP)
垢版 |
2023/07/05(水) 23:27:52.08ID:x0cBUSR30
生成AI向けGPU「Instinct MI300X」の構造と性能を分析 AMD GPUロードマップ
https://ascii.jp/elem/000/004/143/4143496/

https://ascii.jp/img/2023/07/02/3563399/o/9ce2ffaf84074cc3.png
MI300が発表になったけれど、GDCが8個なのがMI300X、7個とZen4のCCDが3個がMI300A。
CCD3個とGDC2個が同じぐらいのサイズなので、GDC1個あたりは約100mm2となる。
Navi31がCU96で300mm2なので、CUは32ぐらいになる計算だけど、記事ではCU40となってる。

https://ascii.jp/img/2023/07/02/3563397/l/4bc115bb525caae3.png
https://ascii.jp/img/2023/07/02/3563400/l/990306a634a528fe.png
CDNA2ではNavi31と同じく平面での接続だけど、CDNA3では新たにIODの上にGDCを置いて
それぞれのIODを接続してのMCMとなってる。

RDNA3のDualIssuieWAVE32は、CDNA2のMatrixユニットをもう一つのシェーダーユニットとして
RDNAに転用してきた可能性考えると、次はIODの上にGDCを載せるMCMをしてくるのは考えられる。

まぁ6nmとはいえ、そんな大きなIODを用意するよりは、MCDを細長くして2個のGDCに跨がる形にするだろうけど。
0313Socket774 (テテンテンテン MM17-biFY)
垢版 |
2023/08/05(土) 10:04:47.93ID:G5nHEhCTM
RDNA4ハイやらないって、やっぱりCDNAのついでってポジションを強く出すのか。今でもハイエンドではないけどミドルだけとか
0314Socket774 (ブーイモ MMf9-y19c)
垢版 |
2023/08/05(土) 12:37:20.00ID:wH1V6advM
ハイエンドコアは作らないけど
ミドルのチップレットを複数載せたパッケージで
ハイエンド製品出すって可能性は?
まあどっちにせよまだ噂段階だが。
0315Socket774 (ワッチョイ 8de8-dbOM)
垢版 |
2023/08/05(土) 12:53:27.64ID:xTG/PfyY0
RDNA4のリークで、クロック上げた48CUのGCDダイのチップレット数で
ハイエンド、ミドルレンジ、ローエンドと性能分けすると出ている

Navi41 :GCD x 3= 144CU x 128sp x 3.5GHz x 2op = 129 TFlops(≒ 64.5 TFlops)
RTX4090:16384CUDA x 2.52GHz x 2op = 82 TFlops(≒ 41 TFlops)
7900XTX:12288SP x 2.5GHz x 2op = 61 TFlops(≒ 30 TFlops)
7900XT :10752SP x 2.4 x 2op = 51 TFlops(≒ 25 TFlops)
RTX4080:9728CUDA x 2.51 x 2op = 48 TFlops(≒ 24 TFlops)
※()内ゲーム時Flops

CUまたはSM内に、Primary ALUとSecondary ALUとALUを2重化して
面積効率を最優先に配置する構造はいつ改めるんかね

ゲームだとFPオンリーで動く機会はほとんど無いはず
そうなると実際にはクロック差を考慮するとRDNA2には勝てているが、
同クロックで比較した際の他の命令のスループットはRDNA2に負けている

追加機構が生きてないのがRDNA3
ゲームに特化したGPUならCDNAの構造をそのまま卸してこないでちゃんと専用設計でやってほしい感はある
0316Socket774 (ワッチョイ 8de8-dbOM)
垢版 |
2023/08/05(土) 14:08:20.21ID:xTG/PfyY0
7900XTには16MB容量の6つのMCDが総容量96MB搭載されているが
実際にMCDで使用できる容量は64MBに制限されているとの事

残りの32MBは特定の処理の為に予約されており、
それ以外には使えないとの事でRDNA3のハイエンドNavi31の実質のIFキャッシュ量は64MB
64MBそこまでのレイテンシは良好でもそこからはRDNA2の後塵を拝する

コストの問題があったにせよやはりIFキャッシュの容量が少な過ぎなのが問題だと思うわ
それが無ければIFキャッシュの恩恵で4090を超えられたかもしれんのにな
0319Socket774 (ワッチョイ 0f58-mBaV)
垢版 |
2023/08/11(金) 19:50:40.36ID:SnCLDGga0
RDNA4のハイエンドはGCDのチップレット構成が難航して開発中止
NVIDIAの次世代が25年なのでRDNA5に先送りしても許容可能と判断されたって話が出てきたな
0323Socket774 (ワッチョイ 9a11-VPys)
垢版 |
2023/08/15(火) 19:52:17.68ID:5/fdXV5O0
IFキャッシュが足りないって定期的に言う奴出てくるけど
GPUにおいてもキャッシュは容量性よりも局所性の方が重要になってきてるってことだろう。

Vega10のHBCCの説明で、「4GBのメモリ容量があっても実際に使うのは2GB程度」って言われてたぐらいで
IFキャッシュも、使うのは64MBあれば足りていて、それ以上は結局メモリアクセスを伴うので
あっても無くても大差ない(コストに対してそこまでのゲインはない)、ってのが実情だろう。

むしろ思ったよりも性能が伸びてないのは、どちらかというとDualIssueWave32の存在で
これが思ったよりも機能しなかった、ってのがメインって気はする。
CDNAでも、FP64専業となったシェーダーがFP32以下を処理するための代走って位置づけなので
元々2本のシェーダーを同時に使うってのをあまり想定してないっぽいけれど。
0324Socket774 (ワッチョイ abe8-prCk)
垢版 |
2023/08/15(火) 20:20:36.20ID:XS4SlFNV0
>>323
何のためにキャッシュラインによるヒット率をAMD自信が出してたんだよ
アホか
0326Socket774 (ワッチョイ 9a43-Uqm6)
垢版 |
2023/08/15(火) 21:55:54.49ID:CLTC7VNp0
GDDR6が遅いからキャッシュ増やして実効帯域稼ごうって流れだったところを、GDDR6高速化という根本的なテコ入れしちゃったからな
その公式発表でも当然キャッシュ容量の伸びに対してヒット率の伸びは悪化してたし、減らして大丈夫なら減らすのはコスト的に仕方ないのかも
せっかく作ったのに一世代で必要性が下がったというのはちょっと頭抱えたくなるが…
0327Socket774 (ワッチョイ abe8-prCk)
垢版 |
2023/08/15(火) 23:22:01.52ID:XS4SlFNV0
>>326
高速化?
どんだけGDDRとキャッシュのレイテンシに差があると思ってるんだ
少しは考えろ
0328Socket774 (ワッチョイ 9a43-Uqm6)
垢版 |
2023/08/16(水) 00:31:32.43ID:SzKJH5F+0
infinityキャッシュまるっと無くなった訳じゃなく3/4残っててクロックも確か上がってるからな
レイテンシの話はそんなL3ポジの大容量キャッシュがちょっと減ったことより、GDDR6まで読みに行くワーストケースが速くなってることとL0からL2の増量で総合的に改善してると思うよ
0329Socket774 (ワッチョイ abe8-prCk)
垢版 |
2023/08/16(水) 06:24:41.06ID:xyBMMjTN0
容量が多ければそれだけ詰め込んでおける、単純な話だよ
帯域がとかの話じゃないんだよ
論点ずらしてんじゃねーよ政治家かおめーは
0335Socket774 (ワッチョイ 59b1-y2bS)
垢版 |
2023/10/14(土) 03:35:18.39ID:55G6LpHY0
今ここに!ロリの国の設立を宣言する!国王はこの私だ!私が法律だ!幼女以外は国民と認めない!
0336Socket774 (ワッチョイ 1311-iZeJ)
垢版 |
2023/10/18(水) 14:05:43.29ID:+kZxJdQP0
RDNA4では新型チップレットの41と42がキャンセル、Navi43はNavi33の倍になるって話だが
AI/MLの強化やCUの強化はやってくるんじゃ無いかと思ってる。

CUについては、RDNA3方式でならNavi43はCU32とするべきだろうけれど
RDNA3のように、2本目のCUが殆ど動かないって状況が解消されるんだろうと思う。
なので、CUが2倍になったのと同じぐらいの性能が出るのでは無いかと思う。

AIアクセラレータは、Turingレベルの64基からAmpereレベルの256基に強化されることで
AI性能でも、Blackwellにはかなり食い下がりそうな気はする。
RDNA3では7900XTXで129TFlops、4080(195TFlops)の2/3程度なので
競合の次世代強化分を考慮して、4倍強化で同等レベルに追いつける、とは思う。

インタビュー見ると、RDNA3ではあまり必要性を感じてはいなかったが、ROCmでの動きを見てると
RDNA4ではここは強化してくるのでは無いかと思う。

あと、キャンセルの時期を見ても、旧Navi41/42はキャンセルされても
Navi43を2倍にした新Navi41は出てくる気はする。
というか、nV系の人はやたらとAMDの新製品をキャンセルやらリスケやら言いがちなので
これもそういう話の一つだと思ってる。
0337Socket774 (ワッチョイ f1de-Hgbl)
垢版 |
2023/10/18(水) 19:57:52.48ID:mrU/FEhV0
>思ってる。
>では無いかと思う。
>気はする
>とは思う。
>では無いかと思う。
>気はする。
>思ってる。
0340Socket774 (ワッチョイ bde8-hDp0)
垢版 |
2023/10/22(日) 16:40:02.15ID:R90lOlKU0
>>336
CUの中にある2ALU(2xSIMD32)のうち1ALUが特殊な状況下で無いと動かないだけで
WGP内の2CUは2つとも動いてはいる
0341Socket774 (ワッチョイ ddb6-JD/u)
垢版 |
2023/10/23(月) 19:59:47.82ID:gOoNikXT0
というかいつものハイエンドしか出さない世代と
ミドルしか出さない世代のラデに戻っただけだろというか
本当にGPUバブルは終わると考えてるんだろうな
0342Socket774 (スプッッ Sd7a-Uokm)
垢版 |
2023/10/25(水) 09:44:18.96ID:4MTUIBuPd
GPUバブルは終わると言うか、需要に乗れずに諦めたって感じじゃね
AIで戦うためにザイリンクス買収したのも無駄になりそうだ
0349Socket774 (ワッチョイ 7f8d-gJHn)
垢版 |
2023/11/25(土) 00:10:56.41ID:dORMDoYb0
>>347
そこら辺知ってるなら逆に大艦巨砲なNVIDIAを心配するわ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況