AMDの次世代GPUについて語ろう 6世代
■ このスレッドは過去ログ倉庫に格納されています
!extend:checked:vvvvv:1000:512 !extend:checked:vvvvv:1000:512 AMDのGPUに関する話題のスレです。 関連スレ CPUに関してはこっちで。 AMDの次世代APU/CPU/SoCについて語ろう 301世代 http://egg.5ch.net/test/read.cgi/jisaku/1606557994/ 前スレ AMDの次世代GPUについて語ろう 5世代 http://egg.5ch.net/test/read.cgi/jisaku/1596721794/ VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured >>299 DeepL(機械翻訳)がそうらしい。第二のgoogleになる可能性がある。長年研究してきたことがAI技術で無になってしまったら怖いよな。 7800以下はQ2以降からとか言ってるけど、年明けに8900(仮)出るからハイとローは0.5世代ずつずれて50は無くなるのかな RDNA4作ってるって言うけど緑に比べポジ要素少ないなあ CPUの話は聞こえて来るけどGPUは周辺メーカーからすら話題が出て来ないな amdのGPUは本当にシェアないからな。intelに追いつかれたくらいだし nvidiaが強すぎるわ AMD動画系が停滞してクソる一方なのがなあ IntelでもQSVだけは評価されてる AMD RX 7600 Has Better Cache Latency Than the RX 7900 XTX https://www.tomshardware.com/news/rx-7600-sports-better-latency-compared-7900-xtx IFキャッシュのレイテンシに関して、MCMだと不利になる、って話。 Navi31はIFキャッシュ192MB案もあっただろうけど、MCM化に際してレイテンシ対策をしたら 容量増やせなくなった(が十分な性能は出ていた)と考えるべきだろう。 RDNA 3世代のミドルクラスGPU「Radeon RX 7600」性能速報。FHDでは競合のミドルクラスと戦えるがネックは価格か https://www.4gamer.net/games/660/G066019/20230522039/ ↑で、288GB/s+32MBのRX7600と320GB/st+80MBのRX6700の比較で RX7600は、キャッシュ容量とメモリ帯域で勝るRX6700とほぼ同等なので RDNA3世代のIFキャッシュは、RDNA2換算で倍程度の容量と同等で、Navi31のキャッシュ容量が足りないってことはなさそうな。 7000世代は実験失敗で6000世代と併売で良いから、せめて緑に遅れずに8000を 生成AI向けGPU「Instinct MI300X」の構造と性能を分析 AMD GPUロードマップ https://ascii.jp/elem/000/004/143/4143496/ https://ascii.jp/img/2023/07/02/3563399/o/9ce2ffaf84074cc3.png MI300が発表になったけれど、GDCが8個なのがMI300X、7個とZen4のCCDが3個がMI300A。 CCD3個とGDC2個が同じぐらいのサイズなので、GDC1個あたりは約100mm2となる。 Navi31がCU96で300mm2なので、CUは32ぐらいになる計算だけど、記事ではCU40となってる。 https://ascii.jp/img/2023/07/02/3563397/l/4bc115bb525caae3.png https://ascii.jp/img/2023/07/02/3563400/l/990306a634a528fe.png CDNA2ではNavi31と同じく平面での接続だけど、CDNA3では新たにIODの上にGDCを置いて それぞれのIODを接続してのMCMとなってる。 RDNA3のDualIssuieWAVE32は、CDNA2のMatrixユニットをもう一つのシェーダーユニットとして RDNAに転用してきた可能性考えると、次はIODの上にGDCを載せるMCMをしてくるのは考えられる。 まぁ6nmとはいえ、そんな大きなIODを用意するよりは、MCDを細長くして2個のGDCに跨がる形にするだろうけど。 RDNA4ハイやらないって、やっぱりCDNAのついでってポジションを強く出すのか。今でもハイエンドではないけどミドルだけとか ハイエンドコアは作らないけど ミドルのチップレットを複数載せたパッケージで ハイエンド製品出すって可能性は? まあどっちにせよまだ噂段階だが。 RDNA4のリークで、クロック上げた48CUのGCDダイのチップレット数で ハイエンド、ミドルレンジ、ローエンドと性能分けすると出ている Navi41 :GCD x 3= 144CU x 128sp x 3.5GHz x 2op = 129 TFlops(≒ 64.5 TFlops) RTX4090:16384CUDA x 2.52GHz x 2op = 82 TFlops(≒ 41 TFlops) 7900XTX:12288SP x 2.5GHz x 2op = 61 TFlops(≒ 30 TFlops) 7900XT :10752SP x 2.4 x 2op = 51 TFlops(≒ 25 TFlops) RTX4080:9728CUDA x 2.51 x 2op = 48 TFlops(≒ 24 TFlops) ※()内ゲーム時Flops CUまたはSM内に、Primary ALUとSecondary ALUとALUを2重化して 面積効率を最優先に配置する構造はいつ改めるんかね ゲームだとFPオンリーで動く機会はほとんど無いはず そうなると実際にはクロック差を考慮するとRDNA2には勝てているが、 同クロックで比較した際の他の命令のスループットはRDNA2に負けている 追加機構が生きてないのがRDNA3 ゲームに特化したGPUならCDNAの構造をそのまま卸してこないでちゃんと専用設計でやってほしい感はある 7900XTには16MB容量の6つのMCDが総容量96MB搭載されているが 実際にMCDで使用できる容量は64MBに制限されているとの事 残りの32MBは特定の処理の為に予約されており、 それ以外には使えないとの事でRDNA3のハイエンドNavi31の実質のIFキャッシュ量は64MB 64MBそこまでのレイテンシは良好でもそこからはRDNA2の後塵を拝する コストの問題があったにせよやはりIFキャッシュの容量が少な過ぎなのが問題だと思うわ それが無ければIFキャッシュの恩恵で4090を超えられたかもしれんのにな RedGamingTechとかMLIDとかはYoutuberであってリーカーじゃないからね RDNA4のハイエンドはGCDのチップレット構成が難航して開発中止 NVIDIAの次世代が25年なのでRDNA5に先送りしても許容可能と判断されたって話が出てきたな チップレット化は将来的にも必要な技術だと思うから開発自体は続けるんじゃないか デュアルダイにチップレット化してMAXX型番の復活だ。 IFキャッシュが足りないって定期的に言う奴出てくるけど GPUにおいてもキャッシュは容量性よりも局所性の方が重要になってきてるってことだろう。 Vega10のHBCCの説明で、「4GBのメモリ容量があっても実際に使うのは2GB程度」って言われてたぐらいで IFキャッシュも、使うのは64MBあれば足りていて、それ以上は結局メモリアクセスを伴うので あっても無くても大差ない(コストに対してそこまでのゲインはない)、ってのが実情だろう。 むしろ思ったよりも性能が伸びてないのは、どちらかというとDualIssueWave32の存在で これが思ったよりも機能しなかった、ってのがメインって気はする。 CDNAでも、FP64専業となったシェーダーがFP32以下を処理するための代走って位置づけなので 元々2本のシェーダーを同時に使うってのをあまり想定してないっぽいけれど。 >>323 何のためにキャッシュラインによるヒット率をAMD自信が出してたんだよ アホか >>324 それはRDNA2だろ。 RDNA3では、L0・L1キャッシュが強化されてるので そのまま当てはまりはしない。 GDDR6が遅いからキャッシュ増やして実効帯域稼ごうって流れだったところを、GDDR6高速化という根本的なテコ入れしちゃったからな その公式発表でも当然キャッシュ容量の伸びに対してヒット率の伸びは悪化してたし、減らして大丈夫なら減らすのはコスト的に仕方ないのかも せっかく作ったのに一世代で必要性が下がったというのはちょっと頭抱えたくなるが… >>326 高速化? どんだけGDDRとキャッシュのレイテンシに差があると思ってるんだ 少しは考えろ infinityキャッシュまるっと無くなった訳じゃなく3/4残っててクロックも確か上がってるからな レイテンシの話はそんなL3ポジの大容量キャッシュがちょっと減ったことより、GDDR6まで読みに行くワーストケースが速くなってることとL0からL2の増量で総合的に改善してると思うよ 容量が多ければそれだけ詰め込んでおける、単純な話だよ 帯域がとかの話じゃないんだよ 論点ずらしてんじゃねーよ政治家かおめーは 42もキャンセルが本当なら晩年の的コースだなコンシューマー向け バトルメイジ無くなったらラジャに戻ってきてもらおう 今ここに!ロリの国の設立を宣言する!国王はこの私だ!私が法律だ!幼女以外は国民と認めない! RDNA4では新型チップレットの41と42がキャンセル、Navi43はNavi33の倍になるって話だが AI/MLの強化やCUの強化はやってくるんじゃ無いかと思ってる。 CUについては、RDNA3方式でならNavi43はCU32とするべきだろうけれど RDNA3のように、2本目のCUが殆ど動かないって状況が解消されるんだろうと思う。 なので、CUが2倍になったのと同じぐらいの性能が出るのでは無いかと思う。 AIアクセラレータは、Turingレベルの64基からAmpereレベルの256基に強化されることで AI性能でも、Blackwellにはかなり食い下がりそうな気はする。 RDNA3では7900XTXで129TFlops、4080(195TFlops)の2/3程度なので 競合の次世代強化分を考慮して、4倍強化で同等レベルに追いつける、とは思う。 インタビュー見ると、RDNA3ではあまり必要性を感じてはいなかったが、ROCmでの動きを見てると RDNA4ではここは強化してくるのでは無いかと思う。 あと、キャンセルの時期を見ても、旧Navi41/42はキャンセルされても Navi43を2倍にした新Navi41は出てくる気はする。 というか、nV系の人はやたらとAMDの新製品をキャンセルやらリスケやら言いがちなので これもそういう話の一つだと思ってる。 >思ってる。 >では無いかと思う。 >気はする >とは思う。 >では無いかと思う。 >気はする。 >思ってる。 そりゃ、素人の予想なんだから断定的なことなど言えないだろ、としか。 内容も五行くらいにまとまるような中身すかすかの素人予想なら不要だわ >>336 CUの中にある2ALU(2xSIMD32)のうち1ALUが特殊な状況下で無いと動かないだけで WGP内の2CUは2つとも動いてはいる というかいつものハイエンドしか出さない世代と ミドルしか出さない世代のラデに戻っただけだろというか 本当にGPUバブルは終わると考えてるんだろうな GPUバブルは終わると言うか、需要に乗れずに諦めたって感じじゃね AIで戦うためにザイリンクス買収したのも無駄になりそうだ >>343 実態として使われてない売れてない決算ボロボロ >>344 もう出荷開始されたの? いつ? 決算も発表されたんだっけ? RDNA5出せるんですかね・・・?3dfxや的の晩年もこんな感じだったぞ その頃からの人ならこの程度じゃ心配に及ばんって分かりそうな >>347 そこら辺知ってるなら逆に大艦巨砲なNVIDIAを心配するわ >>346 世界3位のMSのAsureのスパコンEagleがXeon+H100だったのでバランスをとった感じかな ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.0 2024/04/24 Walang Kapalit ★ | Donguri System Team 5ちゃんねる