X



AMDの次世代GPUについて語ろう 6世代
■ このスレッドは過去ログ倉庫に格納されています
0001Socket774 (ワッチョイ 83b1-C8cC)
垢版 |
2021/03/07(日) 23:39:29.63ID:/bUCprNe0
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

AMDのGPUに関する話題のスレです。

関連スレ
CPUに関してはこっちで。
AMDの次世代APU/CPU/SoCについて語ろう 301世代
http://egg.5ch.net/test/read.cgi/jisaku/1606557994/
前スレ
AMDの次世代GPUについて語ろう 5世代
http://egg.5ch.net/test/read.cgi/jisaku/1596721794/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0002Socket774 (ワッチョイ abb1-C8cC)
垢版 |
2021/03/07(日) 23:41:00.11ID:/bUCprNe0
過去スレ

AMDの次世代GPUについて語ろう 4世代
http://egg.5ch.net/test/read.cgi/jisaku/1571034539/
AMDの次世代GPUについて語ろう 3世代
http://egg.5ch.net/test/read.cgi/jisaku/1559135529/
AMDの次世代GPUについて語ろう 2世代
https://egg.5ch.net/test/read.cgi/jisaku/1529856120/
AMDの次世代GPUについて語ろう
https://egg.5ch.net/test/read.cgi/jisaku/1503984798/
0003Socket774 (ワッチョイ 9fbe-Dvzz)
垢版 |
2021/03/09(火) 21:06:23.77ID:UluQTf4U0
MI200はチップレットだそうだけど、これってゲーム用GPUに使える技術なんすかね。
単純に同じデータを2つ持って、交互に表示するならデータ干渉しないし、
インターリンクでも大丈夫っちゃー大丈夫な気がしますが。
0004Socket774 (ワッチョイ fb11-/obZ)
垢版 |
2021/03/10(水) 00:09:32.04ID:dWh3EEuX0
AMD is Preparing RDNA-Based Cryptomining GPU SKUs
https://www.techpowerup.com/279430/amd-is-preparing-rdna-based-cryptomining-gpu-skus

nVidiaに対抗して、マイニング用のGPUをAMDも用意している、らしい。
ただ最新のRDNA2ではなく、Navi10ベースのチップ(RDNA1でCU40のチップ)を使うのだとか。

Navi10系の在庫処分としては良いんじゃない、としか。
0005Socket774 (ワッチョイ 9fbe-C8cC)
垢版 |
2021/03/10(水) 00:14:28.29ID:i9lDpbyY0
NVIDIAのマイニング制限しているGPUって結局イーサリアムしか制限してなくて
他の仮想通貨には影響ないんだとか。
結局マイナーに倍の価格で買ってもらいたいからわざとじゃね?という話もあるような。
0006Socket774 (ワッチョイ abb1-sAAR)
垢版 |
2021/03/10(水) 00:25:08.03ID:C0RHMWqC0
対抗してと言うが、マイニング向けSKUのパッチは去年の10月から投稿されてる
単純に需要があるからじゃね
0008Socket774 (ワッチョイ ef73-FoLw)
垢版 |
2021/03/10(水) 10:53:50.38ID:woFjP6Ia0
でもASICあるし他の通貨ならそっち使わんと勝負にならんのでは?
今gpuで掘る意味があるのってイーサだけっしょ?
0010Socket774 (ワッチョイ b9b1-YyH6)
垢版 |
2021/03/16(火) 07:22:39.87ID:3kaxKOjo0
スウェーデンの大学やオーストラリアの国立研究所なんかでも
MI200の採用が決まったな
これ割とすごいことになりそう
0011Socket774 (アウアウウー Sac5-Dbhq)
垢版 |
2021/03/16(火) 12:56:56.49ID:yzLzga0wa
せっかく広く使われるようになってきたんだからソフトウェア方面の整備もなんとかしてくれ
他と比べて遅れ過ぎや
0012Socket774 (アウアウウー Sac5-Hmv6)
垢版 |
2021/03/16(火) 14:34:09.41ID:X7SMKDdea
なんともならんよ
GPUなんか後回しで全力でIntelを追い詰めるべき
そもそもゲーム機とDX12で次世代技術は囲い込んでるから勝手に最適化されていくよ
DLSS対抗技術もMSと共同で開発してるし、焦ることなんて欠片もない
0014Socket774 (ワッチョイ 0673-0onh)
垢版 |
2021/03/16(火) 19:56:01.08ID:q3uicWMw0
それだけインテルが強大だったと言う事
正直、AMDがここまで盛り返すとは思ってなかった
結局開発者次第なんだなぁ
0016Socket774 (ワッチョイ b9b1-kFKp)
垢版 |
2021/03/16(火) 23:01:26.12ID:3kaxKOjo0
>>12
CPUに関してはまあZen4でHPCでも圧倒的存在感になってるとは思う
今も存在感でかいけどさ

GPUに関しては面白いことにゲーミングのようなコンシューマ用途ではなくて
HPC用途から競り合い他社の領域を食っているんだよな‥‥
0017Socket774 (アウアウウー Sac5-Dbhq)
垢版 |
2021/03/17(水) 21:55:51.69ID:hd/edo1Sa
CPUはIntelと同じISA使ってるおかげでIntelが長年闘志してきたインフラをそのまま使えるからな
AMDはそれにタダ乗りしてるだけ
GPUはそれができないから厳しい
0019Socket774 (ワッチョイ 82be-qwuN)
垢版 |
2021/03/17(水) 22:18:04.30ID:ey6NXcxE0
GPUもゲーミング分野では過去からみるとシェア割と伸ばしてる事になってないかな。
確か2017年とかそこらだと10%位だったのが2019年だと20%位で、XBOX,PS4加えると
NVIDIAと互角だというポジショントークがあったような・・・
0020Socket774 (アウアウウー Sac5-Hmv6)
垢版 |
2021/03/17(水) 23:26:38.14ID:34fs+Zwla
>>17
ゲーム機のインフラはAMDとMSとソニーの共同開発だぞ
PC向けはそれを逆輸入すればいいだけ
Nvidiaのインフラとか最初から欠片も使ってないし今後も無関係だけどな
0022Socket774 (ワッチョイ e52a-NDRm)
垢版 |
2021/03/18(木) 14:16:26.69ID:crUb5ib70
AMDもNVIDIAも売れるミドルは高く売る

性能比は
2080ti=3060ti=RX6700(これからでるだろう非XTモデル)=500-600$
2070s=3050=RX6600=RX5700XT=300-400$
2060=3040=RX6500=RX5600=250-300$
1650s=3030=RX6400=150-200$

こんな感じになるだろう
AMDにおいては2560spの6700XTが対6800で75%性能でoc余力があると
するとspが減るほどoc耐性増えてsp性能比は増えると

6800 3840sp 100%
6700XT 2560sp 75%=3070超
6700 1920sp 60%=3060ti
6600 1500-1600sp 50%=3060/12GB並み
6500 1200sp40%=2070s並み
6400 1000sp=2070並み
6300 512sp×2.9ghz=1660ti並み

これくらいのポテンシャル期待してもいいかも、そして流石に500-1000spの6GBモデルとかなら
原価高騰、euv暴騰でも市価150-200$いない税込みくらい期待できるだろうとな

NVIDIAも1GPC4-6GBメモリ品で1660ti並みなら150-200$でリリースできる
0023Socket774 (ワッチョイ e52a-NDRm)
垢版 |
2021/03/18(木) 14:23:22.98ID:crUb5ib70
個人的には
RDNA2は5120sp品がGPU原価250$
歩留まり悪い3840sp品でGPU200$
2560sp品で170$
2034sp品で140$
1408sp品で110$
1000sp品で90$
768sp品で75$
512sp 品で45$
GDDR6の6Gメモリは暴騰中で45$、GDDR5なら38$
AMDのコロナ税は卸価格で20$、ask税は諸々20%

くらいと踏んで、512sp品で139$税込み、768sp品で170$税込みくらいと
で768sp×3ghz×GDDR5/6の6GB品でRX5500XT、1660ti超える性能くらいを期待してるわ

AMDもNVIDIAもそういう高性能ローエンドを「おやすく店頭価格18000税込みです」ってやると思うよ
で本当の原価は年末には768sp品で原価70$くらいに収まるだろうと

NVIDIAなんかは1GPC1480spくらい何だけど、1GPCで原価50-60$、メモリ代40$、グラボ出荷価格130$、店頭価格180$くらいでOCして2060並みとな
こんなアイテムをNVIDIAやAMDは絶対大量投下するよ
0024Socket774 (ワッチョイ 2901-oXDN)
垢版 |
2021/03/21(日) 13:14:16.46ID:saOK+JQz0
>>20
実のところソニーの影響力ってどこまであるのかね
Naviはソニーと協力したってフォーブスが昔、報道してたけど
確かにNavi10の構成は、PS5用GPUとそっくりだったけどね
こっちはレイトレユニットありだけどダイショット写真だとNavi10とほぼ同じ
高クロックに関しては、ソニー側が巨大ヒートシンクの採用、ハイエンドグラボ並みの電源フェーズ
液体金属採用とかソニーの努力がよく見られるけどな

反対にRDNA2はDX12UのためにMSと組んでる感じだったけど
0026Socket774 (ワッチョイ d211-UUyU)
垢版 |
2021/03/29(月) 00:28:05.98ID:nBhjRN5R0
業界初の“4Kダブル録画”対応ビエラ。オートAI画質や4K120pも
https://av.watch.impress.co.jp/docs/news/1314567.html

液晶テレビだけど
>今夏発売予定の43型「TH-43JX850」のみ、映像ソースのフレームレートとディスプレイのリフレッシュレートのズレによって発生する“画面割れ”を防ぐ「VRR」と
>AMD製グラフィックスカードと接続した際に低遅延・ティアリングの無いスムーズなゲームプレイができる「AMD FreeSync Premium」にも対応する。
とJX850はFreeSyncPremium対応と明言してる。

FreeSyncは、いよいよPC外にも普及していきそうな見込みが出てきたね。
0031Socket774 (ワッチョイ 6573-pdRJ)
垢版 |
2021/03/30(火) 18:35:40.46ID:p7jYCc/f0
なんか海外から流れてきてる感じがあるね
ひょっとするとこれ意外と今年前半で落ち着くのかも???
0032Socket774
垢版 |
2021/04/03(土) 10:30:43.46
>>27
AMD FreeSync™テクノロジー¹のFAQ(よくある質問)
ttps://www.amd.com/ja/technologies/free-sync-faq
AMD FreeSync™テクノロジーはHDMI®で機能しますか?
当初からFreeSyncテクノロジーでは、HDMI接続がサポートされています。
FreeSync認定ディスプレイの多くでは、HDMI 2.1がリリースされ、HDMI VRRが導入されるかなり前から、
HDMI接続で可変リフレッシュレート・テクノロジーがサポートされていました。
HDMI接続がサポートされているFreeSync認定ディスプレイを購入すると、
ディスプレイでHDMI 2.1がサポートされていない場合でも、すぐに可変リフレッシュレートのメリットを得ることができます。
0034 ー ? (アウアウウー Sae9-FhAN)
垢版 |
2021/04/06(火) 15:37:39.39ID:YoPiKy5qa
>>12

PS4の時もそんな事言ってたような...
0035Socket774 (ワッチョイ 5f83-kfQa)
垢版 |
2021/05/03(月) 20:46:42.97ID:AAfHkQUd0
嘘か誠かNavi33は80CUだという噂でNavi31,32はChipletでそれ以上という・・・
正直眉唾ですが、Chipletでゲーム性能上がるんですかね。マイニングなら
それでいいんでしょうが。
0037Socket774 (ワッチョイ 23b1-IK/p)
垢版 |
2021/05/08(土) 21:54:53.02ID:tvIqOjrQ0
CU増やせばその分性能は上がるだろ
ダイ間がボトルネックになるから2倍まではいかないが1.8倍にはなるはず
もちろん理想はモノシリックダイだけど歩留まりがヤバいことになる
0038Socket774 (ワッチョイ d358-4928)
垢版 |
2021/05/08(土) 22:24:32.40ID:7acZPIK60
2.5Dによる超近接MCMだからそこまでボトルネックにならないはず
0039Socket774 (ワッチョイ 7f9e-n4QQ)
垢版 |
2021/05/08(土) 23:08:06.58ID:9j4XK8Bs0
熱が大変なことになりそうやね
0041Socket774 (ワッチョイ 17d7-gSvD)
垢版 |
2021/05/16(日) 23:26:47.09ID:4bxmG4M70
PS5のGPUで有名なNAVI 10 LITEとかの、LITEの意味ってセミカスタム品であってるのかな?
NAVI 12 LITE (Apple用?)
NAVI 14 LITE = (Apple用?)
NAVI 21 LITE = Arden (Xbox Series XのGPU)
Van Gogh LITE = Xbox Series S?
0045Socket774 (ワッチョイ b383-muMV)
垢版 |
2021/06/02(水) 10:53:20.59ID:CKJHNI+M0
>>41
レイトレユニットがある時点でPS5のGPUがNavi10世代って事はねーわ。
内部構造をわざわざPS5に作り直しだもん。
Navi20系使ったほうが設計コストが圧倒的に安い。
0046Socket774 (ワッチョイ b383-muMV)
垢版 |
2021/06/02(水) 10:58:33.65ID:CKJHNI+M0
3D V-Cacheつかってキャッシュを増やせるなら次のNavi30世代は
3D V-CacheでInfinityCache大盛りになったり・・・・
0049Socket774 (ワッチョイ 9376-B6Af)
垢版 |
2021/06/02(水) 19:40:33.88ID:205KeQNv0
Navi10系じゃ液冷とか使わんと2GHzオーバーでは動かんだろ
Navi20そのものじゃないにしてもNavi20で使われてる技術も使ってると見るべき
0050Socket774 (ワッチョイ 9158-950J)
垢版 |
2021/06/02(水) 20:07:41.43ID:aOEsGedM0
だから順序が逆なんだよ
PS5の技術をNavi20に使ってるならコードネームは矛盾しない

PS5は19年の早い時期、RDNA1の発売前にはV字型で知られる開発機が配られてた
一方SeriesXの開発機は20年に入ってから製品版ほぼそのままだったらしいから
ベースとなる世代が異なっている可能性はある
0052Socket774 (ワッチョイ 1a83-zjai)
垢版 |
2021/06/09(水) 10:22:06.58ID:2IQfCYsH0
>>50
そのロジックだと、RDNA1世代よりも前にレイトレユニットと2GHzを超える
クロックのGPUを量産出来てたという事になるが・・・
0053Socket774 (ワッチョイ 1a83-zjai)
垢版 |
2021/06/09(水) 10:27:36.50ID:2IQfCYsH0
RDNA3は2022年10月ごろらしいけど、Appleが3nmに移らないと
5nm空かないからなんでしょうかね。
そんで3DV-Cahceも使うと。AMD大勝利・・・・とはいかんでしょうけど
値段で上手いこと棲み分けられるかな。
0055Socket774 (ワッチョイ 0303-tjD1)
垢版 |
2021/06/12(土) 23:48:31.07ID:SvJOM1El0
>>52
RDNA世代でもNavi 10ベースのレイトレ対応iGPUの存在が確認されたから理屈は通るでしょ
高クロックなのはプロセスルールの改善とSIEの電力・冷却設計の賜物による
AMDがRDNA2でレイトレ対応させたのもDX12U,DXRと歩調を合わせた結果だろうから
ここら辺はPS5の動向とは少し外れるAMDの事情があったんだと思う
ttps://www.coelacanth-dream.com/posts/2021/06/06/gfx1013-apu-rt/

同程度のNavi22をベースにしてるならinfinity Cacheは抜きにしても回路設計は両者とも限りなく似るはずだけど
ROPの設計がRDNA2世代と違う点からみてもNavi20系を直接ベースにしたとは言えないと思う
0056Socket774 (ワッチョイ 8a83-wcuM)
垢版 |
2021/06/18(金) 10:02:05.50ID:lCs9wg2S0
そんなんただの言葉遊びじゃん。
iGPUでNAVI10+レイトレのモデルがあったぞ!ってXsXでない証拠もないよね。
PS5のGPUは2.2GHzで回るので内部パイプラインはRDNA2と同じでないといけない。
つまりXsXがRDNA1.5である証拠なのでは?
と言われた場合、反証がないでしょ。
あと、RDNA1.5が存在するとしたら、2020年10月にRDNA1.5のAPUとRDNA2.0のAPUと
RNDAのGPUを全部同時に設計・製造していた事になる。そんな設計パワー、AMDにあるわけない。
だいたいウェハーの試作に100億かかるんすよ。
そんな全部同時に動くかどうかわからないバクチ打つわけない。
単純に全部RDNA2をちょこっといじっただけ、と考えるのが自然と思いますよ。
双方の主張はすべて推測なんで言葉遊びの域を出ませんが。
0057Socket774 (ワッチョイ 8a83-wcuM)
垢版 |
2021/06/18(金) 10:04:28.35ID:lCs9wg2S0
GPUをチップレットに、ですけど、CDNAの方はともかく、RDNAの方は効果的に動かないっしょ、
と思っておりましたが、V-Cacheでチップレットを繋げば意外に帯域は確保できるのでは?
GPUがV-Cacheに最初にアクセスしてそこのデータを使うだけだったら、チップレットが
V-Cacheに同時に接続できるならありじゃね?という気がしますけど。無理か。
0059Socket774 (ワッチョイ 5f76-wUFk)
垢版 |
2021/06/19(土) 09:03:01.50ID:t0D1rJq/0
>>57
V-Cacheは発熱が少ないL3だから重ねられるわけで、発熱がやばい演算コアには重ねられないんだ
GPUの大半は演算コアだからV-Cacheは現状は不可能
0060Socket774 (ワッチョイ 3b58-A0UX)
垢版 |
2021/06/19(土) 09:27:40.22ID:FZd6v1ny0
上に重ねるんじゃなく2.5Dのベースにキャッシュ付ける特許もとってるよ
https://g-pc.info/archives/18644/
0061Socket774 (ワッチョイ dbeb-3lwz)
垢版 |
2021/06/24(木) 14:37:16.72ID:u6DUbD2F0
>>56
XSXはArden(Navi 21 LITE = gfx1020)って判明してるからそりゃないよ
リーク情報からそこらへんを検証してる動画もある
ttps://www.youtube.com/watch?v=SQjwKH3D5Hw&t=325s

そもそもgfx1013はあくまでNavi10ベースでドット積にも対応してないって話だけど
Ardenはドット積演算にも対応してる
それを踏まえた上で、逆にgfx1013=XSXの反証はあるのかって話よ

>PS5のGPUは2.2GHzで回るので内部パイプラインはRDNA2と同じでないといけない。
ttps://youtu.be/ZIDi_PI8R8o?t=313
RDNA2のIPCはRDNAからは変わってないからCU内部に大きな変更はないとみれる
そもそもAMD自体は高クロックのためのCU改良を行ったとは一言も言ってないはず
PS5の高クロック化はプロセスルールの改良と冷却機構の強化と液体金属の採用によるもの
デスクトップRDNA2もおそらくそれと同じ要因だし、XSXのクロックの低さはあくまでXboxのアーキテクチャに起因するもの
高クロック=RDNA2の要因をアーキテクチャの改良によるものとは言い切れないと思うが
0064Socket774 (ワッチョイ 3f83-SUSz)
垢版 |
2021/06/25(金) 11:34:22.88ID:okliCOMZ0
内部構成をいじらないで高クロック化がぱっとできるなら
こんなところでグダグダ言わないで即AMDに就職するべき。
年収100億は固いですよ。
0065Socket774 (アウアウウー Sad3-jJv+)
垢版 |
2021/06/25(金) 12:05:54.87ID:KSh0BbXVa
そもそもGCNでも1.0からVegaまで内部パイプライン自体は変わってないだろ確か
Vegaで一気にクロックが上がったのもクリティカルパスを徹底的に潰したからであってパイプラインを深くしたなんて話はなかったはず

>>63
元々、>56がPS5のGPUクロックが2.23GHzで回るのは内部パイプラインがRDNA2だからって言ったのが最初
0068Socket774 (アウアウウー Sad3-jJv+)
垢版 |
2021/06/25(金) 15:22:24.61ID:xGtNgjIYa
>>66

ttps://pc.watch.impress.co.jp/docs/column/kaigai/1073276.html

> Vegaアーキテクチャでは、従来のGCNと比べて基本のパイプライン段数に変更はない。ベクタユニットの積和算パイプは4サイクルレイテンシのままだ。しかし、クリティカルパスについては徹底したチューニングが行なわれたという。
> パイプライン自体を変更しなかったのは、パイプラインを深くして積和算のレイテンシを長くすると、パイプラインを満たすのにより多くのスレッドが必要となってしまうからだと推測される。スレッド並列性を維持するためには、レジスタなどより多くのリソースが必要となってしまう。それに対してクリティカルパスチューニングでは、原理的にはアーキテクチャ上の変更が必要ない。
0069Socket774 (アウアウウー Sad3-jJv+)
垢版 |
2021/06/25(金) 15:32:47.19ID:G2kkDkNma
ttps://pc.watch.impress.co.jp/docs/column/kaigai/1037849.html

> VegaのNCUのもう1つの重要な特徴は、高クロック化だ。AMDはクロックを引き上げるためにパイプラインを変更したと見られる。

後藤の推測をそのまま間に受けたのか知らんが、Vega64のアナウンス時には>66の通りになってる
0070Socket774 (ワッチョイ 0f76-wfqF)
垢版 |
2021/06/25(金) 15:43:56.15ID:d3VSS9jn0
パイプライン段数は一緒なのか
じゃあ>>66の図は何のことなんだろう
1クロックで2倍のデータを流してるみたいだけど、段数以外の何かが変わってるのかな
クリティカルパス潰しは並列度の向上には関係ないと思うし
0073Socket774 (ワッチョイ 8feb-KuYY)
垢版 |
2021/06/27(日) 17:21:42.13ID:leHqtRKK0
高クロック化はRDNA2の内部パイプラインによるっていう理屈なら
Vega2.0で2.1GHzで回るRenoirはどうなるんだって話よ?
Vegaに至っては基本アーキテクチャすら変えてないって話だぞ
0074Socket774 (ワッチョイ 3f83-SUSz)
垢版 |
2021/06/27(日) 19:39:49.09ID:lJx4cT5C0
じゃなんでXsXは1.8GHzなんよ。
APUはCUが少ないから高クロックで回してもいい、と判断したんでしょ。
消費電力を気にしなければ上がるけど、商品として成立する範囲に収まるという点で
相当内部パイプラインをいじらんとできない。
ZEN2+RNDA1カスタム、ZEN2+RDNA2、RDNA2全部同時期に3つも物理設計できるわけねーだろ。
0075Socket774 (オイコラミネオ MM43-r9te)
垢版 |
2021/06/27(日) 20:20:21.71ID:d2+K3yJMM
>>73
本当は回るけど回さなかっただけだろ
今の8CUに留めている理由もメモリのせいにして嘘ついているみたいに、出来るけどAMDが利益を減らしたくない、今後ボッタくるために性能向上の余地を残しておく
0077Socket774 (ワッチョイ 8feb-KuYY)
垢版 |
2021/06/27(日) 20:46:56.45ID:leHqtRKK0
そりゃダイ個別にパイプラインまで設計してたら手間だけど
RDNAアーキテクチャに則ってるなら別に問題はないでしょ
基本コンポーネントは同じだしそれぞれ手を加えるだけ別に再設計する必要はない
RDNA2も基本構成はRDNA世代を踏襲してるからこそ
この短期間で5つ以上のダイを設計できてるわけだからな
あと上でも言われてるけど別に内部パイプラインを深くしなくても
クロックを上げる方法はいくらでもある
クロックゲーティングの最適化による高クロックは今時のGPUではよくある話
RDNA2で本当にクロックを上げるための内部パイプライン拡張が行われてるって話は
聞いたことないけど事実なら結構おもしろいけどね
たぶん内情は>68みたいな最適化が主だと思うからパイプライン拡張はないでしょ
0079Socket774 (ワッチョイ aa83-e8k/)
垢版 |
2021/07/17(土) 23:37:42.05ID:Scnd+Qm60
さすがにレイトレユニットがあるのにパイプライン処理が変わらないって無理あると思うが。
あと消費電力がCU当たり7割位になっていてトランジスタレベルで結構手を入れてるはず。
CU当たりの消費電力見る限りPS5がRDNA1相当ってのは無理がありますね。

ただ、AMDの次世代GPUという話題でもなんでもないし、この話題したがるやつ自体がそもそも
AMDの次世代GPUというテーマに全く興味がないんでしょ。
それにNDA結んでるんだから真相はわかるわけない。断言してるやつは誇大妄想狂以外にありえんでしょ。
0080Socket774 (アウアウウー Sa39-WD8p)
垢版 |
2021/07/18(日) 01:25:45.61ID:S81T/GvJa
RDNA2のレイトレユニットはテクスチャユニットと同じく共用リソース、つまり排他的な仕様になってるからパイプラインに手を加える必要はない
この場合は、テクスチャユニット使用中はレイトレユニット自体は使えない、けどそれは逆の場合も然り
レイトレ命令発行時は、テクスチャ、ローカルデータアクセスなどの共用リソースをレイトレに置き換えるだけでパイプラインの段数そのものが拡張されてるわけではない

PS5がRDNA云々の話はゲハかそっちでやればいいよ
次世代GPUとは趣旨が離れてる
0081Socket774 (ワッチョイ 7d53-WD8p)
垢版 |
2021/07/18(日) 14:07:26.76ID:t30jc2Og0
>>79
>68の記事の理屈で言えば、RDNA2CUのサイクルレイテンシはRDNAと同じWave32時で1サイクルレイテンシで変更無し
RAの拡張方法は>80のようにテクスチャユニットなどと排他的使用ならパイプライン段数そのものへの影響は少ない

しかも今回、AMDがパイプラインに手を加えた話はないし、>68で確認されてるとおり、Polaris→Vegaの同一プロセスルールでの高クロック化をクロックゲーティングの最適化で達成してる
AMD側からの明確な発表がない限り、今回もそれに倣った事例と見るのが適切でしょう
0082Socket774 (ワッチョイ 7d53-WD8p)
垢版 |
2021/07/18(日) 14:28:54.32ID:t30jc2Og0
スレ違だけど、他にパイプラインの段数を変えての高クロックの事例だとNvidiaのKeplerぐらい
コイツはフロントエンドスケジューラからCUDAコアまでのパイプライン処理を従来のFermiから刷新した
ttps://pc.watch.impress.co.jp/docs/column/kaigai/520640.html

Maxwell→Pascalもプロセスルールは28nmから16nmと進化したが基本アーキテクチャでは大幅な変更はない
FinFETとクリティカルパス潰してで高クロック化を達成した

> クリティカルパスの解明が進んでいるMaxwellアーキテクチャを継承することで、パス最適化がより短時間で済む点。
ttps://pc.watch.impress.co.jp/docs/column/kaigai/757916.html

この点から見ればGCNの名残を引き継いでるRDNAならさらなる最適化も可能だし、プロセスルールの最適化でより多くの恩恵を受けられる
それこそAmpereのようにレイトレユニットを並列実行させるにはパイプラインを刷新する必要があるだろうが
0083Socket774 (ワッチョイ 2953-dSWW)
垢版 |
2021/07/28(水) 19:41:58.64ID:3c8FAKb90
https://twitter.com/olrak29_/status/1419702500945371150?s=21

RDNA3はWGP内のシェーダコアが256に増えるようだけど
従来までのCUデザインを踏襲した形で4CUを束ねてWGPとするのか、それともCU内部のシェーダコアを128まで増やして2CUで束ねてWGPとするのか
前者はRDNAやGCNとの互換性を意識した設計、後者だとNvidiaのSMX(Wave32 x4)に似てよりグラフィックス特化の設計になる
それとも1CUにシェーダコアが32基で8CU束ねてWGPとするのか
https://twitter.com/5chan_nel (5ch newer account)
0084Socket774 (ワッチョイ 2953-ILcy)
垢版 |
2021/07/28(水) 23:31:24.49ID:3c8FAKb90
改めて調べてみるとCUそのものを廃止して、WGPが最小単位になる話も出てきたな
1WGPに256シェーダコア、8つのwave32を1サイクルで処理する方式
0087Socket774 (ワッチョイ a511-D3RU)
垢版 |
2021/08/31(火) 02:10:12.75ID:25RepL/P0
RDNA3まで持つんだろうか・・・
負けてるのにシュリンクとかいう舐めプらしいし、的見たくラブレスに止め刺されそう
0088Socket774 (ワッチョイ 6e6e-U7Lh)
垢版 |
2021/08/31(火) 05:33:05.08ID:5q2YR/OK0
何が持つのか知らんけど、RDNA3はラブレスとやらに圧勝らしいぞ
ホッパーが直ぐに出るそうだからラブレスが死産で味方に止め刺されるだけっぽい
0089Socket774 (スップ Sd82-prWK)
垢版 |
2021/08/31(火) 07:48:27.25ID:J++ItH4xd
ada lovelaceはAmpereアーキテクチャを基にしてるなら
144基(18432sp)あるSM内のALUの振り分けは
9216sp FP専用
9216sp INT + FP兼用

RDNA3 Navi31
240cu(15360sp)
RDNA3 Navi32
160cu(10240sp)

FP専用_ALU比率
Lovelace:Navi31:Navi32
1:1.11:1.66

※3090:6900
1:0.95

おそらくLovelaceの144基SM版はNavi32と同程度だろうな
0090Socket774 (ワッチョイ fd11-Y/PZ)
垢版 |
2021/08/31(火) 20:16:14.88ID:14b+gx4+0
「とどめを刺す」って何度も言われてきたけど、CPUの売り上げが強い今ではRadeonにとどめは無理だろ。
Ampereだって「Radeonにとどめを刺す」って言われてたけど、現実は違ったしな。
0092Socket774 (ワッチョイ 6e6e-U7Lh)
垢版 |
2021/09/01(水) 00:51:03.85ID:IU9HE6dD0
ゲフォもラデも一長一短あるからね
ゲフォはレイトレが上で、高画質なDLSSもあるけどRTX限定
ラデはレイトレが劣るけどラスタライズは上(4kは劣る)、FSRはDLSSに劣る画質だけどあらゆるGPUとゲーム環境で簡単に対応可能
IntelのXeは来年発売でRDNA2やアンペア対抗だけど、その直後にRDNA3やラブレスが登場するから競争力は微妙
0093Socket774 (アウアウウー Sa5b-IsSb)
垢版 |
2021/09/17(金) 09:17:32.08ID:8YgkKH6ga
PS5のAPUが市販化
第一世代のレイトレGPUの性能が気になるな

ttps://www.coelacanth-dream.com/posts/2021/09/15/amd-cyan_skilfish-clock-and-core/
0094Socket774 (ワッチョイ 07c9-JEGK)
垢版 |
2021/10/12(火) 14:47:34.98ID:fBN4jyxX0
>>92
全然違う
Intelのxe計画はAMD、nvidiaのラウンドデー勝負してない
IntelのxeはAMD、nvを超える超大量生産前提だから、市場を独占する可能性がある

元からd gpuって量産しないから原価割高な上、分業工程多すぎで、価格調整ない上に供給少ないから暴利市場だった
基本的に年産100万を超えるのはAPU用とローエンドのmxシリーズやgtx1030だとかで、量産しまくった1060がマイニング特需時代に年産100万枚もなかった
その上ラインナップ多くて量産渋るからコストが跳ね上がる

ところがIntel xeシリーズは超超過的な量産を計画していて
・ラインナップは少なく1000/2000/3000/4000コアの4モデルだけ
・メインはおそらく1000と4000と4000の事故製品の少量生産の2000/3000品の実質2モデル中心の量産
・1000sp品はノート用CPUとバンドルを計画してれば年産100-200万以上の量産になり、原価を相当抑えられるから価格勝負次第で500万レベルの量産が効く、それだけ作ればさらに安くなる
・4000sp品は従来他社はこの手の製品は10-20万ロットでしかオーダーしないが、Intelは mcmー8セル鯖用GPUなどを計画してるため100-200万ロットの量産になる可能性があり価格破壊が来る

総じて他社は少量生産でしかGPUを作ってないのに、Intelは現在のGPU需要規模の量産=価格破壊をしかけて
「価格破壊で新規を増やして新独占市場を作る」くらいの量産計画を持ってるっぽい、これやられたら他社は負けるよ
0095Socket774 (ワッチョイ 07c9-JEGK)
垢版 |
2021/10/12(火) 14:58:20.05ID:fBN4jyxX0
例えばIntel xe1000sp品で例えれば

AMD、nvであればこの種のローエンドを作ろうとしたら100mm2で Applem1の価格をベースみ120-150%高いねだんと見れば石の原価は1万弱になる
Intel xeの1000spは64mm2で原価を60%抑えられるので、AMD価格級でも50-60ドルの原価になり、Apple級の量産できれば原価は30-40ドルにセーブできる

AMDが1000spローエンドを作ろうとしたら原価100ドル以上でノートで売るならOEM価格130-150ドルはする
Intelは1000sp 64mm2を量産35ドル+メモリで10ドルの原価50-60ドルで作って80ドルでOEM供給すれば、受注台数はローエンドシェア数年分単位の200-300万枚くらいの受注を貰えて
CPUとセットで150ドルで販売よかでき、市価で499-599ドルゲーミングノートな価格破壊ができる

ヒット+価格破壊がくれば新規を呼び込めるので、ノートPCメーカーは1-2年分まとめて仕入れてもヒットと新規開拓で半年で商品を売り切れる
年間需要1-2年分のGPUを売ったIntelは、在庫が半年できえて新たに量産できる

ようはd GPUが非量産→割高→ニッチ市場なのをIntelが量産激安やればいくらでも新規開拓で受注をふやせるだろうと
xe GPUは量産で安くすれば、d GPU市場自体を拡大できる

だから量産戦略強みのIntelで割高市場で量産価格破壊したら、nvとAMDは顧客維持しても負ける
負けるというかいまのGPU市場が一般ユーザー減少のマイニング暴騰で消費者数激減で詰んでる市場なんだよ

またIntel xeは4000sp品をmcmで2から8個搭載でハイエンドに挑み
ハイエンドも量産出やすくする。すると割高で供給不足のAMD、nvは勝負にならないんだよ


これがIntel戦略であって、わかりきった戦略であり、量産傾向も十分あり、量産で価格破壊容易なのもわかりきってる
これでAMD、nvは勝負できず負ける
いまAMDとIntelはラインすら抑えきれなくて、ろくに量産できない
0096Socket774 (ガックシ 0686-GJBa)
垢版 |
2021/10/12(火) 15:01:25.50ID:QAvfl4Nr6
Intelも委託だからコストはそれぞれイーブン
さらに最適化で後発だからしんどい
0097Socket774 (ワッチョイ 07c9-JEGK)
垢版 |
2021/10/12(火) 15:06:50.29ID:fBN4jyxX0
rdna3をだしてもこんなもんだよ

1000sp APU兼用品 原価80ドルで量産数100-150万枚
4000spミドル 量産10万枚で原価300ドル石のみ
鯖用mcmビッグコア 量産数万枚で8000-16000コアでコア価格700ドル-1500ドル
加工前のコア価格でここまで価格供給少ない

Intel
xe1000sp GPU 抱き合わせ用で100-200万枚作った後に自社で年産500-1000万枚狙い、原価はAMD価格で50ドル、量産すれば35ドル
4000sp品はコアが小さいので200ドル、自社量産すれば150ドル
mcm版は2コア8000spで400ドル、8コア32000spで1500ドル

大量量産作戦と小売価格調整やればここまでできる。やろうと思えば市価は
Intel xe1000sp OEMでCPUセットで150-200ドル
デスクトップxe1000spで市価150ドル
デスクトップ4000spで市価3-4万円台
mcm2コア8000spで市価10万くらい
mcm32000コアが GPU原価1200ドル+加工セットで原価2500ドル以内、OEM価格で4000ドル、一般販売で50-59万+税

これくらいの価格勝負できるわけですな
そしたら些細な性能差は新規開拓ユーザーにはイミフだから圧勝できる
スマホのベンチ性能と同じで、あんなんはライトにはわからないから、95%のライトはローエンドしか買わない
0099Socket774 (ブーイモ MM76-+SlD)
垢版 |
2021/10/24(日) 16:35:35.10ID:p+7SkAqMM
dGPU大量消費するユーザーがいねえわな。ノートに入れるとしても大半のユーザーはIGPU求めるだろうし。
0100Socket774 (アウアウキー Sa89-MGFP)
垢版 |
2021/10/26(火) 10:13:09.20ID:dBSl1EEJa
さて、MI200がリークされたわけだが
matrix engineの正体はなんなんだろ
0105Socket774 (ワッチョイ 7111-SOku)
垢版 |
2021/10/30(土) 13:43:33.81ID:x4E5nsu10
AMD Navi 31 enthusiast MCM GPU based on RDNA3 architecture has reportedly been taped out
https://videocardz.com/newz/amd-navi-31-enthusiast-mcm-gpu-based-on-rdna3-architecture-has-reportedly-been-taped-out

Navi31のテープアウトが完了した模様。
と言うことは、RX7000系(仮)は来年の今頃にリリースとなる算段。

概ねNavi21と同じように、7800・7800XTが11月下旬に発売となる流れになりそう。
0108Socket774 (ワッチョイ 53bf-Oy/7)
垢版 |
2021/11/03(水) 14:32:35.17ID:oJZEBDPd0
iPhone 14(仮)用プロセッサ、3nmプロセス製造は無理?TSMCが技術的に苦戦しているとの噂
ttps://japanese.engadget.com/iphone-14-unlikely-052036868.html

Appleちゃんどいて!Zen4ちゃん作れない!
0109Socket774 (オイコラミネオ MM95-BJ7m)
垢版 |
2021/11/03(水) 21:52:18.72ID:3ZyGiIXKM
3nmじゃないとCPU 40コア、GPU 128コアのM3X作れないんじゃないの?
Zen4がM1のIPCを上回らない事が判明したから、A16ベースのM3ならクロック次第ではZen3 EPYCの64コアを上回るな
0110Socket774 (ワッチョイ c5d3-H2rd)
垢版 |
2021/11/06(土) 16:12:11.22ID:G5TkdEd60
AMD Instinct MI200を初公開?
https://videocardz.com/newz/amd-ceo-lisa-su-teases-instinct-mi200-mcm-accelerator

”Instinct MI200は、データセンターで使用されるアルゴリズムを高速化するために設計されたGPGPUです。2つのコンピュートダイを搭載した初のマルチチップモジュール型GPUとなります。Instinct MI250X」は、110個のコンピュートユニットと、最大128GBのHBM2eメモリを搭載します。

OAM(OCP Accelerator Module)コネクタを採用していることが確認されているため、MI200シリーズのGPGPUであることは間違いありません。現在のInstinctシリーズは、PCI-Expressフォームファクターでのみ提供されています。ティーザー画像に追加されたEPYC CPUについては、Zen3ベースのEPYC CPUをアップデートして3D V-Cacheを搭載した「Milan-X」の可能性があります。この画像から結論付けられるのは、Zen4 "Genoa" SP5パッケージとは似ても似つかないことと、8チャネルのメモリをサポートしていることです。”


www.DeepL.com/Translator(無料版)で翻訳しました。)
0111Socket774 (ワッチョイ 6283-KBFH)
垢版 |
2021/11/24(水) 08:13:47.65ID:UIyDS17h0
AMDはいつになったらまともなGPU作るんだい?
0114Socket774 (ワッチョイ 06bc-p9b9)
垢版 |
2021/11/25(木) 20:41:08.79ID:cTCn+hBu0
RX6400は補助なしらしいじゃん。
ちょっと期待しちゃうぜ。
RTX1650より性能上だといいが。
0115Socket774 (ワッチョイ 9f8e-ZQOw)
垢版 |
2021/11/28(日) 07:56:52.82ID:SU1vcofR0
AMDが2.5D/3Dパッケージング技術で先行。
大容量L3のMilan-Xと競合を圧倒するInstinct MI200の秘密
https://pc.watch.impress.co.jp/docs/column/ubiq/1365035.html

NVIDIA A100の倍精度浮動小数点演算(FP64)のスループットである
9.7TFLOPSと比較して、
約4.9倍となる47.9TFLOPSを実現しているのが最大の特徴となる。
0119Socket774 (ワッチョイ ac82-ey6k)
垢版 |
2021/12/05(日) 16:50:33.37ID:r8oAJ3Vr0
navi31もお値段とTDPが凄そうだな
4kレイトレの性能不足は一気に解消されるかもしれんが
0121Socket774 (ワッチョイ a7b1-aztq)
垢版 |
2021/12/13(月) 20:18:31.06ID:neCb8NFD0
一部の処理をまたWave32で実行するようになったみたいだな
Wave64より性能が良いとかで
RDNAアーキテクチャは最適化の幅が広い
0122Socket774 (ワッチョイ 7f6e-8/hI)
垢版 |
2021/12/14(火) 21:25:26.28ID:LL3y7LWL0
MCMはミドルやミニサイズのGPUを複数接続するものだと思ってたけど、MI200は760mm2くらいのハイエンドダイをくっつけてるのを見ると、GPUは下手に分割するよりモノリシックのほうが効率は良いんだろうな
0123Socket774 (ワッチョイ a573-82RG)
垢版 |
2021/12/24(金) 13:24:32.90ID:tecEUAqg0
RDNAほどじゃなくても
CDNAでもダイ間通信がないわけじゃないから
現時点ではGPUはモノリシックに近いほうが有利
0125Socket774 (ワッチョイ 6911-6WVI)
垢版 |
2022/02/01(火) 16:37:11.90ID:15rRcNRT0
NVIDIA GH100 Hopper Flagship GPU To Measure About 1000mm2 Making It The Largest GPU Ever Made
https://wccftech.com/nvidia-gh100-hopper-flagship-gpu-to-measure-about-1000mm2-making-it-the-largest-gpu-ever-made/

nVidiaのHopperだが、MCMと言われていたけれどモノリシックダイになるとか。
RadeonではMCM化と言われつつも、X2は内部CFに止まっていたのを知っているから、どうするのかと思っていたが
nVidiaもMCM化で躓いたくさいニュース。

1000mm2のダイサイズとか消費電力1000Wとか、ヤケクソ気味の製品になりそうだが
それもまたnVidiaらしいといえば、らしい無茶をしてきてる。
0126Socket774 (ワッチョイ b7d3-wadS)
垢版 |
2022/02/05(土) 00:12:13.23ID:YKUut0Hx0
AMD RDNA3は5nmノードと6nmノードのハイブリッドであることが確認された
https://videocardz.com/newz/amd-engineer-confirms-radeon-7000-rdna3-navi-3x-gpus-use-5nm-and-6nm-nodes

AMDのInfinity Data Fabricシリコン設計エンジニアが、Linkedinのプロフィールを通じて、次世代Navi 3Xアーキテクチャが5nmと6nmのノードを利用することを確認した。
0128Socket774 (ワッチョイ 1711-FVya)
垢版 |
2022/02/08(火) 17:54:11.58ID:YbaJx8j00
>>125
レチクルは26mm*33mmまで
46225mm2のAIチップをセレブラス・システムズが出してるが
あれは複数のレチクル間をファンアウトで配線するInFO_SoW

もし1000mm2チップというならレチクルに収まらないから同様で
レチクル単位のダイシングがなく1枚板だからモノリシックということでは?
実質的には複数のチップでMCMよりも高密度に統合した形態
0130Socket774 (ワッチョイ 96c0-Gv8o)
垢版 |
2022/02/15(火) 08:47:56.84ID:v7B+bQqz0
GPUで求められるラインってこんなもの?

SDG、内なる平穏
2スロット
1スロット、補助電源無し
1スロット、ロープロ、ファンレス
ハイエンドAPU
映ればヨシッ
0133Socket774 (ワッチョイ 559e-UStU)
垢版 |
2022/04/08(金) 01:39:35.74ID:NLQQ56ZM0
>>121
RDNAの頃はRBがGCNと同じものだったからWave64でのピクセル書き出しのほうが
わりと性能が出やすかったのかもしれんなあ
実際RDNAのWave64モードでもVega世代に比べてパフォーマンス自体はでるらしいし
まだ本格的にWave32に対応する必要もなかったのかも
RDNA2ではそこらへんの変更があったから段階的にもWave32対応が本格化したということかも

RDNA3ではCU廃止でWGPに統一されるから
将来的にはCDNA以外ではWave64はなくなるかもね
0134Socket774 (ワッチョイ 6f9e-tEy/)
垢版 |
2022/04/09(土) 00:31:40.00ID:Uq1V7bdM0
その分Wave32は非同期コンピュートとかに向いてないけどな
Radeon VIIだとCU64基にそれぞれWave64を振り分けてたけど
6900の場合はDCU40基(CU80基換算)にWave32を振り分けるから
演算性能はともかく、VIIにくらべて単純な並列性は低下してる
こうしてみるとRDNAはより単純な並列処理として
CDNAはより複雑な非同期並列演算用として住みわけた理由もなんとなく解る
0140Socket774 (ワッチョイ c39e-3Pzs)
垢版 |
2022/04/28(木) 13:23:51.57ID:rV60xkF70
>>139
ドライバー更新で対応予定と2年ほど前にツイート。いままではHDMI2.1 VRR対応のだいたいのモニターや
TVはFreesyncにも対応してたので問題なかったけど、ファームアップデートでVRR対応したSonyのTVで
Radeon RX6000だと効かないって言われてるね。
0141Socket774 (ワッチョイ e7b1-D6zs)
垢版 |
2022/05/01(日) 13:46:40.12ID:bwzwAP540
RDNA3でCDNAの行列演算には対応しないらしい
WGPとSIMDの構成も変わらないっぽい?

ttps://www.coelacanth-dream.com/posts/2022/04/28/llvm-gfx11/
ttps://www.coelacanth-dream.com/posts/2022/04/30/amd-gc_11_0_0/
0144Socket774 (ラクッペペ MMe6-d0U/)
垢版 |
2022/05/10(火) 18:37:38.68ID:oAGlaWJqM
Dual issue wave32
0147Socket774 (ワッチョイ a122-215G)
垢版 |
2022/05/30(月) 19:59:53.60ID:zDSCol+90
AMD EPYC + Instinct MI250X、
Top500 1位(初の Exa FLOPSマシン)
Green500 1位(62GF/W越え)
オメ。

結局Auroraは今回のTop500に間に合わなかったんだね。
0149Socket774 (ワッチョイ 0bb1-jyoF)
垢版 |
2022/06/20(月) 04:31:17.64ID:d6W6k0HH0
ついにRDNA3で倍精度性能が1/32になる模様
まあ倍精度目的で一般向けGPU買う奴なんてもういないか
ttps://www.coelacanth-dream.com/posts/2022/06/18/gfx11-dpfp-rate/
0153Socket774 (アウアウウー Sa47-Jg5n)
垢版 |
2022/06/22(水) 05:09:10.60ID:ScohMRlua
>>149

動画編集とかRAW現像には影響出るのかな?
0154Socket774 (ワッチョイ 0bb1-jyoF)
垢版 |
2022/06/23(木) 05:24:12.80ID:ZgYJxrw70
Dual issue wave32の詳細
異なる命令を同時に発行できるから効率上がるけどコンパイラの負担がおおきくなるとか不穏なことふぁ書かれてる
tps://www.coelacanth-dream.com/posts/2022/06/21/gfx11-vopd-instruction/
0155Socket774 (ワッチョイ 8fb1-NkAH)
垢版 |
2022/06/29(水) 09:00:15.42ID:fDXby6H80
RDNA3でTensor Coreに近い命令をサポート
ttps://www.coelacanth-dream.com/posts/2022/06/29/gfx11-wmma-inst/
0156Socket774 (ワッチョイ 2fee-auNL)
垢版 |
2022/07/05(火) 16:58:20.01ID:yVrsbc360
みんな絶望してしまったみたいだね
0157Socket774 (ワッチョイ 46a5-1NIU)
垢版 |
2022/07/06(水) 12:02:20.77ID:y4VtaIeM0
TSMC値上げを受け入れるみたいだし、リサも粗利益率上げることを株主と約束しちゃった上に
円安がこれだから日本でどれだけ売れる要素があるのかね
0158Socket774 (アウアウウー Sacf-xAe2)
垢版 |
2022/07/06(水) 15:13:32.89ID:8GQTaYMxa
GP%うpはサーバー、GPUの構成比率上げるって事でしょ。
緑がウエハー減らしたいらしいから、その分ラデに回してくれれば解決や(適当
0159Socket774 (ワッチョイ deed-0tYR)
垢版 |
2022/07/08(金) 10:15:27.98ID:ucFqpXSe0
企業として動かれたらすぐだぞ
実名出るから気をつけろ
tps://i.imgur.com/NMWdL3Y.jpg
             
他社に攻撃的なアムダーファンボーイたちすぐやらかしそう
0161Socket774 (ワッチョイ 41ee-GsVe)
垢版 |
2022/07/22(金) 13:22:19.75ID:QXy1iZUz0
新APU来年だしグラボ買えばいいか
0162Socket774 (ワッチョイ c24e-8oVY)
垢版 |
2022/08/19(金) 09:09:54.91ID:9GE1FLYv0
チームAMDに所属しているロシア人プロゲーマー氏、    
世界最大のゲーム大会であるQuakecon2022(8月18日〜8月20日開催)から
米国財務省のポリシーに従い無事出場拒否される 
0163Socket774 (ワッチョイ ae76-bT1D)
垢版 |
2022/08/28(日) 09:04:05.12ID:uOf6qA7/0
Intel Arc A380 GPU tested in 50 games, "compatibility better than expected for a newcomer"
tps://videocardz.com/newz/intel-arc-a380-gpu-tested-in-50-games-compatibility-better-than-expected-for-a-newcomer
     
Intelがんばってる
0164Socket774 (ワッチョイ b5b1-WQ/w)
垢版 |
2022/09/15(木) 00:50:43.14ID:uYzUea9j0
Intel XeSS Shines In First Independent Tests, Better Than Native & More Comparable To NVIDIA's DLSS 2.3 Than AMD's FSR 2.0
tps://wccftech.com/intel-xess-shines-in-first-independent-tests-better-than-native-more-comparable-to-nvidia-dlss-2-3-than-amd-fsr-2-0/
   
アムド逝ったな
0166Socket774 (ワッチョイ 0abf-Mjbb)
垢版 |
2022/09/16(金) 20:57:20.81ID:/qdvP1R30
AMD Already Has Next-Gen Ryzen "Phoenix" CPUs With Xilinx's AI Engine Running In The Labs
ttps://wccftech.com/amd-already-has-next-gen-ryzen-phoenix-cpus-with-xilinx-ai-engine-running-in-labs/

RDNA4にはこれが載るんかな?
0167Socket774 (ワッチョイ 7773-Q6fC)
垢版 |
2022/09/17(土) 01:56:27.35ID:LfYTNlw+0
ア ム ド 終 了
          
Intel、Arm、NVIDIA が AI を加速する新しい 8 ビット FP フォーマットを提案
ht
tps://www.techpowerup.com/298881/intel-arm-and-nvidia-propose-a-new-8-bit-fp-format-to-accelerate-ai
0169Socket774 (オイコラミネオ MM9b-8E5q)
垢版 |
2022/09/22(木) 21:55:41.20ID:gdRUGowBM
>>167
GraphcoreとAMDがQualcommのサポートを得てFP8 AI規格を提案(2022年07月05日)
https://www.graphcore.ai/posts/graphcore-and-amd-propose-8-bit-fp-ai-standard-with-qualcomm-support

『AMDのコーポレートフェロー兼チーフGPUアーキテクトのMike Mantorは、次のように述べています。"この8ビット浮動小数点フォーマットにより、AMDは多くの種類のAIモデルに対して劇的に改善された学習および推論性能を提供することができます。業界標準の強力なサポーターとして、AMDはIEEEと共に8ビット浮動小数点表記法の新しい標準として採用するよう提唱しています。"』
0172Socket774 (ワッチョイ 7711-91vb)
垢版 |
2022/09/23(金) 16:02:26.00ID:/3Hz1/6X0
L0ベクタキャッシュと GL1データキャッシュが増やされる RDNA 3/GFX11 APU
https://www.coelacanth-dream.com/posts/2022/09/02/gfx11-l0c-gl1c/

APUだがRDNA3では、L0キャッシュ(16KB/1CU)とL1キャッシュ(128KB/5WGP)が倍増するみたいね。
32bitあたり16MBのIFキャッシュが、Navi21の128MBから(同じ256bitGDDR6の)Navi32では64MBに減る代わりに
上流のキャッシュが強化されることで、メモリ負荷が下がる、ってことみたいね。

dGPUではL2キャッシュも増えれば、IFキャッシュが半分でも十分な性能が出ることは考えられるね。
L2キャッシュが強化されるかどうかはまだ分からないけれど。
0173Socket774 (ワッチョイ 3786-Gqc2)
垢版 |
2022/09/29(木) 11:01:48.16ID:MFCuWCU/0
WGPの規模がデカくなるからL0L1増強は既定路線かもな
あとはベクタレジスタも増やしてるらしい
L3は3D(16MB)とノン3D(8MB)で分かれるらしいから減ったというよりは選択肢が増えたというだけかも
0174Socket774 (スッップ Sd1f-lemE)
垢版 |
2022/10/07(金) 16:46:39.68ID:lw8h6KgEd
米AMDは10月6日(現地時間)、2022年第3四半期(7月〜9月期)の決算速報(暫定値)を発表した。第3四半期はクライアント市場向けの収益が低迷し、売上高は約56億ドルと、当初予測していた67億ドル(±2億ドル)を大幅に下回ったという。
 AMDはこれまでガイダンスでは、収益が前年比約55%増になると予測していたが、クライアントPC市場が予想よりも低迷し、PCサプライチェーン全体で大幅な在庫調整が行なわれたため、前年比29%増に留まった。総利益率も予想を下回っている。
 クライアントPCセグメントだけ抜き出してみると、売上高は直前期比で-53%、前年比で-40%と大幅に縮小した。
 それでも全体として増収となったのはデータセンター、ゲーム、組み込み向けセグメントの収益が大幅に増加したためだとしている。
 もっとも、同社はRyzen 7000シリーズを投入したばかりのため、実際に動きを見せる来期の決算は要注目だろう。なお、AMDは11月1日に開催予定の株主総会で確定後の第3四半期決算を発表する見込み。
tps://pc.watch.impress.co.jp/docs/news/1445795.html

5 2022/10/07(金) 14:20:05.50 ID:ptDt+Ec10
1-2万円で買えないAMDのCPUとかまじで存在価値ないだろ

10 2022/10/07(金) 14:21:33.45 ID:8HB9/x3K0
Ryzen 7000なんて一番ショボいので5万円〜だからな。

11 sage 2022/10/07(金) 14:22:01.30 ID:PUNQdoy70
年初来で-54.84%
tps://i.imgur.com/8Nt7EJx.png

12 2022/10/07(金) 14:22:14.82 ID:8HB9/x3K0
Core i3のコスパの高さよ

18 sage 2022/10/07(金) 14:24:01.73 ID:x2d7NxuF0
身の程知らずの末路…

64 sage 2022/10/07(金) 14:45:18.63 ID:k9sIghsW0
いつものAMDが戻ってきた

72 2022/10/07(金) 14:48:49.98 ID:jxcy7H++0
AMDの分際で調子に乗りやがって

136 2022/10/07(金) 15:58:12.27 ID:rTmIrwm30
アスペおじ達がこぞって褒めだしたRyzen爆死www
              
142 sage 2022/10/07(金) 16:10:40.34 ID:eTTnculZ0
よりによって今夜は米国雇用統計が発表される日なんだぜ
これヘタしたら株価が奈落の底へ行くヤーツ
0175Socket774 (ワッチョイ 7b51-EbpU)
垢版 |
2022/10/08(土) 12:14:57.11ID:hzz463Gu0
Intelの次世代GPU「Arc Battlemage」は、Alchemistが現段階であった性能よりも「大幅に改善」されています。
        
tps://g-pc.info/archives/27629/
0176Socket774 (ワッチョイ e178-aN7b)
垢版 |
2022/10/25(火) 16:49:18.44ID:dM48vjFM0
価格.com

1位 13900K
3位 13600K
6位 13700K

18位 7950X
24位 7700X
31位 7900X
34位 7600X

順位を上げたRaptorと
さらに順位が落ちたZen4


アマゾン

1位 13900K

...

78位 7600X

えっ?
  
ホラデオンも性能悪いからVRAM増量でお茶を濁して終わりだし
まともな日本人ならIntelゲフォ一択やね
0179Socket774 (アウアウウー Sa45-r2GR)
垢版 |
2022/10/27(木) 12:20:25.80ID:gqhfS85la
巨人の悪口はやめろ
0180Socket774 (ワッチョイ eefa-eG77)
垢版 |
2022/10/28(金) 19:58:36.23ID:tgY/0/vd0
tps://3dnews.ru/1076198/obzor-nvidia-geforce-rtx-4090/page-6.html
GPUを使ったBlenderやビデオのエンコード/デコードの速度比較
Radeonがすごく弱い 
0181Socket774 (ワッチョイ 8958-pBNR)
垢版 |
2022/10/28(金) 20:50:29.33ID:v7WI2+yp0
使いたいソフトなAMDで速いか遅いか?違うだろ
AMDで速い使い方をするだけだ
ソフトウェアのためのAMDじゃない、AMDのためのソフトウェアだ

FXが出た時はAMDユーザーは揃ってIntelで速い仕事から、FXで速い職業(プロWinZip社員等)に転職したのを忘れたか
0182Socket774 (ワッチョイ 191c-RdAf)
垢版 |
2022/10/31(月) 15:25:07.58ID:Mx36DoH60
★★★信者に何回も買わせるAMDパーツ商法の手口★★★
 
ご祝儀価格で販売

セット割で不人気モデルを抱き合わせ販売 ← AM5はイマココ!

不人気モデルを単品特価販売
↓ 
余剰品を特価販売

価格を上げ下げしてリアクションバイト誘引(おまいら全員ダボハゼ扱いw)

最終処分セール ← AM4はイマココ!
0184Socket774 (ワッチョイ 2511-lNwW)
垢版 |
2022/11/06(日) 19:37:34.30ID:Kjsp2UlN0
ttps://ascii.jp/elem/000/004/111/4111687/
ttps://www.4gamer.net/games/660/G066019/20221104001/
ttps://pc.watch.impress.co.jp/docs/news/1452983.html
ttps://news.mynavi.jp/article/20221104-2503878/

Navi31こと7900系が出たけれど、Navi31はCU120がフルサイズじゃないかって思う。
シェーダーエンジンは、10CU/5WGPにL1とROPのシェーダーアレイが2個だが
https://www.amd.com/system/files/styles/992px/private/2022-10/1678052-amd-rdna3-chip-diagram-compute-1260x709_0.jpg?itok=UsiFyXDw
↑のイメージ図ではシェーダーエンジン毎に8WGPで描かれているけど、変更点が多数あるとは言えシェーダーエンジンの構造まで変わってるとは思えないので
CU96がフルサイズではないと思うし、各シェーダーエンジンで4CU/2WGPが無効化されていても不思議じゃ無い。

歩留まり対策と競合や消費電力などを考えてのことだろうけれど、仮にCU120で出してきていたら3Dキャッシュ無しだと性能出なかったり
消費電力も400Wを越えてきそうではあるので、CU96で出したのは妥当と言えるかもしれないけれど
仮にリフレッシュで7950XTXとして3DキャッシュとフルスペックのCU120で出したとするなら、7900XTXから25%は性能上がるし
下手するとRTX5080が比較対象になり得るぐらいにはなるかも。
0185Socket774 (ワッチョイ 5158-VgqC)
垢版 |
2022/11/06(日) 19:39:00.03ID:L4vKqmXs0
7900XTXがハイエンドだと思ったら実はCore i5でしたw
ってことか
0186Socket774 (ワッチョイ 09de-Ssk3)
垢版 |
2022/11/06(日) 21:43:44.37ID:OTlrIoe30
さすがに2割も無効化するのはありえないのでは
ワッパ的にもCU数を削るより増やしてクロックを抑えたほうが高効率になるでしょ
0187Socket774 (ワッチョイ 2511-lNwW)
垢版 |
2022/11/06(日) 22:33:24.39ID:Kjsp2UlN0
>>186
その辺は総合的に考えて、だろうと思う。
無理なく出せるのが、7900XT/XTXだったのかも。
それと3Dキャッシュ載せるのは、メモリ帯域が倍増するのと同じ事になるけれど
VIIのように、CU数そのままでメモリ帯域倍になっても大して性能向上しないので、そこからの逆算から決めた部分もあると思う。
逆にNavi32は3Dキャッシュを使わないので、無効化はそれほどじゃないと思う。

RDNA系のシェーダーエンジンの構造(1SE=2SA=10WGP=20CU)は、変わらないだろうから
40CUづつで区切るのが丁度いいのは確かで、Navi31がCU120、Navi32がCU80、Navi33がCU40ってのが予想。
RDNA3ではIPCが倍らしいので、Navi33はRDNA2換算だとCU80相当ってことになる。

ただまぁ、Navi31に関しては本当にCU96がフルサイズの可能性もある。
0188Socket774 (アウアウウー Sacd-gQXg)
垢版 |
2022/11/08(火) 16:09:45.71ID:yHlw7YeKa
Navi31のブロック図がリークしてたけど、1SE=2SA=8WGP=16CUで間違いないと思うよ
トータルで6SE=48WGP=96CU
RDNA1、2のシェーダエンジンの数は統一されてたけど、構成自体はSAあたりRDNA(Navi10)の3:2(メイン:サブ)、RDNA2の5(メインアレイのみ)と異なってる
配線的に考えれば5という数字よりも、2の冪乗の値で考えたほうがいいと思うし、SE当たり16CU配置の方がスマート

Navi31ブロック図
https://videocardz.com/newz/alleged-amd-navi-31-gpu-block-diagram-leaks-out

Navi31ダイレイアウトイメージ
https://twitter.com/locuza_/status/1589659433990512641?s=46&t=Qnocyi2xgXIMNu6k8CaQJg
https://twitter.com/5chan_nel (5ch newer account)
0189Socket774 (ワッチョイ 2511-lNwW)
垢版 |
2022/11/09(水) 14:28:19.79ID:znu1S3/T0
>>188
情報少ない時点で、5WGP単位が4WGP単位になったことに疑問を持っただけだから。
ただ、こうなると(奇しくもVega10と同じ)Navi32はCU64がフルチップになりそうだね。

それでもGDNA2換算でCU128相当だから、クロック次第だが6900XTの50%増しのスペックだけど。
0190Socket774 (ワッチョイ 5efa-OL0+)
垢版 |
2022/11/11(金) 16:09:56.58ID:1EFpumRg0
Intel Arc A770 AV1 のパフォーマンスは、4K および 8K 解像度で NVIDIA RTX 4090 よりも優れた結果を示した
tps://www.capframex.com/tests/AV1%20Video%20Decoding%20on%20Intel%20Arc%20A770

8Kでは、IntelのArc A770は平均60FPSで滑らかな再生を実現し、0.2%のケースで44FPSに低下。
これに対し、NVIDIAのGPUは56.8~57.6FPSを記録し、16.7FPSまで落ちる場合もあり、見ていて不快にレベルだった。
NVIDIAのAD102とGA102の結果が近いことを考えると、NVIDIAの現在のドライバとGoogle ChromeがNVIDIAの最新のNVDECハードウェアを活用できているのか(GA102と比較して、AD102について、NVIDIAがハードウェアをアップデートしたのか)、ということが問題になりそうだ。
AMDのRadeon RX 6800 XTでは、8K動画はフレームレートの低下やスタッタリングに悩まされ、「見るに耐えない」ものだった。
      
総じて、Intelは8Kでも業界トップクラスの動画再生サポートを実現している。
0191Socket774 (ワッチョイ a225-QFhu)
垢版 |
2022/11/11(金) 22:39:03.84ID:mVEQ8zB40
まともな一般人ならIntelゲフォ一択やね
      
twitter.com/doteya/status/1591038384012931072
Affinity Photo V2でベンチマーク実行。Radeon RX6800はGeForce GTX1070に比べてラスターは1/7、結合でも1/3の性能しかない。体感でGeForceの方がなめらかというのも明らか。
ほんと、@amd @amdjapan は、クリエイティブ系ツールや動画エンコード系で、NVidiaやIntelの後塵を拝したまま、一向に差が詰まらないどころか差を広げられているな・・・
https://twitter.com/5chan_nel (5ch newer account)
0192Socket774 (ワッチョイ ad03-gu75)
垢版 |
2022/11/12(土) 05:17:55.65ID:1+BxoRKm0
アムドファンボーイによると、アムドが高いのは円安のためで、Intel、NVIDIA、Appleといった極悪企業と違い、アムドは良心的な企業なので即日価格を反映させるとのこと
 
円高で即日価格反映、楽しみだなぁ
早くゲームボーイ向けの7600Xが売れるのを見たいなぁ
 
代理店のせいだからアムドゎゎるくなぃ、、、は通用しないよ
0194Socket774 (アウアウウー Saa9-NPlJ)
垢版 |
2022/11/14(月) 13:52:58.04ID:z1Vfo00ja
770値下げあくしろよ
5万切ったらエンコ用に買ってやる
0195Socket774 (ワッチョイ 6d11-ehy1)
垢版 |
2022/11/15(火) 02:16:06.86ID:Bg8pqGjp0
RDNA3に関する技術的続報。
RDNA 3 / Radeon RX 7000シリーズ Deep Dive - 新情報を基に内部構造と性能を解剖してみる
https://news.livedoor.com/article/detail/23199696/
大幅にダイサイズを縮小できたRDNA 3のチップレット構造 AMD GPUロードマップ
https://ascii.jp/elem/000/004/112/4112875/

この辺から考えると、RDNA1/2ではCUあたり2つのスカラユニットが1つだけ動いていたのに対して
RDNA3では2つのスカラユニットが同時に動けるようになったって印象。
64あるSPを処理するのに、GCNでSIMD16*4クロック、RDNA1/2でSIMD32*2クロックだったのが
それがRDNA3ではSIMD32の2並列で1クロックになったので、RDNA2比で倍の処理能力になった。

スカラユニットが1つしか動いていなかったのは、キャッシュが足りない(ために無理に動かすとストールする)からと思っていたけど
RDNA3ではL0/L1が倍増しているので、原因はトランジスタコストだったと思われる。
配線もえげつないことになってるらしいが。

あと、面白いことに300mm2を越えると歩留まりが悪化すると言ってること。
それを考えるとnVidiaは相変わらず無茶してるなぁ、と思う。
まぁ、それがnVidiaの通常運転だけど。
0201Socket774 (ワッチョイ ff6e-ykd8)
垢版 |
2022/11/28(月) 21:26:53.99ID:LxbaNn0K0
レイトレ1.5倍は単にラスタライズ性能アップと一致してるだけで、特別なものは無いね
Navi21→Navi31で色んな性能が1.5倍くらいになるように調整されてる
0202Socket774 (ワッチョイ 7711-ube4)
垢版 |
2022/11/28(月) 22:51:16.43ID:ECMq70bL0
Nzvi32とNavi33に関するニュース
AMD Confirms Max CU Count of RDNA 3 GPUs: Navi 32 Maxes Out at 60 (7680), Navi 33 Maxes Out at 32 (4096)
https://wccftech.com/amd-confirms-max-rdna-3-gpu-cu-count-navi-32-maxes-out-at-60-navi-33-maxes-out-at-32/

Navi32はCU60、Navi33はCU32だそうだが、Navi32の方は一部無効化してるくさい数字。
SEの構成考えると、1SA=5WGPであれば3SEでCU60になるけれど
メモリが256bitだったら4SEの方が自然だし、その場合はWGP2基/CU4基を無効化すると、この数字になる。

Navi32はPS5Proを考慮したチップであれば、面白いのだけど。
0203Socket774 (ワッチョイ 3722-fXAv)
垢版 |
2022/11/30(水) 15:24:50.35ID:908gbryr0
PS4Proは4K対応というコンセプトあったからそれに合わせた設計にしてたけど、PS5Proは何にするのか?
無闇に性能だけ上げてもコストが上がるだけだからな
0204Socket774 (ワッチョイ d758-eYR2)
垢版 |
2022/11/30(水) 21:07:56.87ID:IH3kYZPs0
そらもちろんソニーと共同開発のAMDレイスクーラーPro搭載よ
0207Socket774 (スプッッ Sd9e-fLM1)
垢版 |
2022/12/03(土) 12:17:31.62ID:Db+C6uH8d
堅実すぎてCELLの時みたいに性能ハッタリ噛ませないのが痛い
PS4はまだしも、性能が把握出来ちゃってPS5は競合に性能負けてるのが誰でも分かっちゃうから夢が無い

競合に比べて単なる劣化ハード
もしくはその資金でGPU買ってPCでやればいいかにしか世間の認識がないのでPSブランド崩壊間近なのも痛い
0208Socket774 (ワッチョイ 8711-I262)
垢版 |
2022/12/15(木) 16:07:57.51ID:XlHRoKes0
PS云々以前の問題だったRDNA3・・・。何で前世代でキャッシュで差が縮まったのにわざわざ減らすのかね
0210Socket774 (ワッチョイ c711-Oh6U)
垢版 |
2022/12/15(木) 21:36:44.99ID:lrlT1BeQ0
>>208
とは言え、言うほど悪くは無い。
対4080はラスタライズなら競合と言える性能は確保してるし
今後のドライバ更新での伸びしろ考えれば、順当な出来ではある。
0211Socket774 (ワッチョイ e7e8-3npV)
垢版 |
2022/12/16(金) 06:49:08.30ID:1j4SdaYV0
>>208
>>209
ほんまそれ128MBのままなら確実に4080を抜き去ってた
384-bitのVRAM帯域を得てもInfinity cache(L3)を96MBに減らすのなら
L2を96MB持つ4000シリーズには勝てないのは明白なんだよな

ましてや256-bitとRDNA3換算で4864sp(9728sp/2)しか持たないRTX4080に
レイトレは言うに及ばず、ラスタライズ性能で勝ったり負けたりと互角の勝負をしている時点で
トータルキャッシュ容量が同じでVRAMへのアクセスも同回数になると考えると
L3より速い帯域とレイテンシを持つL2が多い4000アーキテクチャの方が速くなるのは自明の理

Radeonの開発者馬鹿なのかな
0215Socket774 (ワッチョイ e7e8-3npV)
垢版 |
2022/12/16(金) 11:20:13.56ID:1j4SdaYV0
何で減らしたかは予想は付く
2年ごとのGPU開発、2年前はマイニングが流行ってた
マイニングにはメモリ帯域とメモリ容量がいる

NもAも当時マイニングが寂れる未来なんて予測はつかないが
Nはもし寂れた場合の予防策として256bit+大量L2のゲーミング向けGPU4080をラインナップに組み入れた
4090は既存路線の延長線上での384bitのメモリバスを備え大量のCUDAコアと合わせてゲーミングにもマイニングにも対応できる従来通りのフラグシップとして構築した
4080がNにしては意外なほどマイニングを捨てたゲーミングGPU

逆にAは予防策を講じずマイニング前提で全GPUを構築していったのでは
マイニングバブルの恩恵を次は全面的に受けようとメモリ拡充に移行していったのではないのかと
VRAMを第一にしたらその結果がコストなのか知らないけど、キャッシュMCDを2階層にしないで1階層のままコスト削ったってのがあるんでは
0216Socket774 (ワッチョイ 5f11-CjmZ)
垢版 |
2022/12/17(土) 01:03:25.22ID:X4xVgJeo0
IFキャッシュの容量を減らしたのって、コストと消費電力って事だが。
GDCとMCDとの配線に数千の配線が必要だから、単純な容量増加だと更に大変だし
消費電力増大も言ってるあたり、増えた配線が色々な意味でネックだったんだろ。

その分、L0・L1が容量2倍・速度1.5倍に強化されてRDAN2換算なら3倍相当だし
IFキャッシュの帯域自体も2倍以上に増えてるので、RDNA2換算だと200MB相当ぐらいになる。

あと、Polaris・Vegaで第1次マイニングバブルを経験しているのだから、第2次マイニングバブルでも終了時期を考慮するのは当たり前で
マイニング云々なんて思いつくのは、nVidiaが強欲すぎてAmpere作りすぎただけの話に影響されてる。
0217Socket774 (ワッチョイ 5358-D+3r)
垢版 |
2022/12/17(土) 02:01:33.68ID:5IYOyjOv0
AMDのすることは全部正しいまで読んだ
0219Socket774 (ワッチョイ c3e8-xd3E)
垢版 |
2022/12/17(土) 06:14:30.36ID:ewAKIb3R0
>>216
キャッシュ帯域とキャッシュ容量を混同してはいけない
容量自体は減っている、その分のアクセスはVRAM経由になる
VRAMレイテンシ自体に改善が無いんだから遅いVRAMに今までより余計にアクセスさせてどうする

MCDの実装に困難があったのは事実だろう
ただそれを理由にinfinity cacheを削減してまで
384bitと大量のVRAMが実装されている事の説明にはならない

何故ならその為に帯域384bitにすれば
VRAMへのアクセス頻度は増加し消費電力の悪化を招くのは自明
GDDR6とinfinity cacheの消費電力差なら
AMD自身が出してる白書で6倍差がある事を明言しているのだから

infinity cacheの削減がコストカットの理由なら
まずはそのVRAM実装をどうにかしVRAMありきの設計から
今までと同様のinfinity cacheありきへ回帰するべきだ
0220Socket774 (ワッチョイ 5358-D+3r)
垢版 |
2022/12/17(土) 13:38:24.70ID:5IYOyjOv0
電気がIntelファンだからAMD製品に不要な電流を流そうとしているようだな
0221Socket774 (ワッチョイ 1f73-N2O4)
垢版 |
2022/12/17(土) 22:44:00.89ID:1QDw9VyL0
「わーいアナログ回路作り放題だー」とか勘違いしてハッスルしまくっただけだったりして?w
0222Socket774 (ワッチョイ 5f11-CjmZ)
垢版 |
2022/12/18(日) 01:25:28.31ID:GEt8tlfU0
>>219
キャッシュの性能は容量×速度だよ。
極端な話、容量半分でも速度4倍なら差し引き2倍の性能ってこと。
そう考えてるのはnVidiaだって同じ。

>ただそれを理由にinfinity cacheを削減してまで
>384bitと大量のVRAMが実装されている事の説明にはならない
なり得るだろ。
RDNA3に関してはAMDは、「配線の煩雑さ>メモリ帯域増加」と判断したってことだ。

https://ascii.jp/elem/000/004/112/4112875/2/
の配線の話読めば「VRAM実装の方がコストが安い」はあり得る話だろう。
CPUでは数百本だが、Navi31では数万本、「シリコンインターポーザーの対応能力を超えた」配線は
そりゃ地獄みたいな話だろう。
0224Socket774 (テテンテンテン MMe6-K4W6)
垢版 |
2022/12/18(日) 04:25:01.19ID:hIqPiEKJM
配線数はGCDとMCDの間のバス幅=帯域に関連するものであって容量とは関係ないぞ。
どのみちアドレス線はVRAM容量の分必要でキャッシュにヒットすればMCDの中で帰ってくるだけだ。
0227Socket774 (ワッチョイ 8b22-rEl8)
垢版 |
2022/12/18(日) 16:07:16.12ID:SC0cDowp0
>>222
ワーキングセットがキャッシュの容量に収まらずに全然キャッシュ効果で出ない
でもキャッシュを増やすと収まる
なんてケースでは、そういう概算はまったく適用できない
0228Socket774 (ワッチョイ 5f11-CjmZ)
垢版 |
2022/12/18(日) 18:08:10.12ID:GEt8tlfU0
>>226
メモリだったら違わないけど、キャッシュの場合は速度と容量はバーター。

>>227
RDNA2と違ってダイの外側に出ている以上は、同じではダイ跨ぎのペナルティが大きいし
AMDだってそこの検討した上で16MB*6と384bitGDDR6を選んだってことだろ。

MCD自体がそれほど大きく無いダイサイズで、16MBのキャッシュなら13mm2程度(7nmだと32MBあたり27mm2)だろうから
それを32MBにしようと思えば、それほどダイコストはかからなかったとは推定出来るけど、そうしなかったのは
ダイ跨ぎのペナルティを考えると、容量を少なくしてでも速度を優先しなければいけなかったってこと。

IFキャッシュがRDNA2と同じくオンダイだったら、その通りだとは思うが。
0229Socket774 (スプッッ Sd2a-xd3E)
垢版 |
2022/12/18(日) 18:54:30.85ID:g9Bf7Jw0d
infinity cacheを96MBに減らしたから384bitでも4Kで伸びない
2K、2.5Kなら伸びるこれが全てを物語ってる

外に出したからーとか言い訳いらないから結果を見て語ってくれよ
infinity cacheを減らしたのは悪手
0230Socket774 (テテンテンテン MMe6-K4W6)
垢版 |
2022/12/18(日) 20:28:14.27ID:0oJhWE7JM
単純にCU減らしたのが効いてるだけだと思うけどな。理想的に動けば性能2倍になるといっても実際にはそうもうまく行かずROPは並行処理が効くから数で押した方が性能が出ると。
0232Socket774 (ワッチョイ 5f11-CjmZ)
垢版 |
2022/12/19(月) 21:04:16.09ID:HR1+CGlK0
西川善司の3DGE:Radeon RX 7900 XTX/XTは何が変わったのか。大幅な性能向上を遂げたNavi 31世代の秘密を探る
https://www.4gamer.net/games/660/G066019/20221212087/
丁度、何故IFキャッシュを減らしたのかを解説していた。

>たしかに容量は4分の3へと減ったが,L2キャッシュとL3キャッシュ(Infinity Cache)の帯域幅は2.25倍に増加しているので
>我々の性能検証において必要十分な容量と判断した
だそうで。
0233Socket774 (ワッチョイ ff9e-sNeS)
垢版 |
2022/12/19(月) 22:17:59.53ID:UbnfzcYR0
RDNA2のときの資料でInfinity Cache の4K gamingでのキャッシュ量96MBのときのHit率が53%、128MBのときのHit率が62%だったらしい
7900XTX/6950XTのキャッシュアクセス速度がそれぞれ5300/1960GB/s、メモリアクセスが960/576GB/sだから
SRAMとGDDR6のレイテンシーを無視して転送速度だけで評価すると
L3以降への平均アクセス速度は7900XTXは 0.53*5300+0.47*960=3260GB/s, 6950XTは 0.62*1960+0.38*576 = 1434GB/s
で2倍以上にはなってるんやね
https://pbs.twimg.com/media/E2rDmb1WEAE7GGf?format=jpg&name=large
0234Socket774 (ワッチョイ dbde-CLTW)
垢版 |
2022/12/20(火) 12:46:15.08ID:VaxXyOsG0
infinity cacheの速度が向上してメモリ帯域も増えてるから
減った32MB分以外の場面は確実に早くなってるわけで
やっぱり容量減と性能がイマイチなのは関係無いと思う
0235Socket774 (ワッチョイ 3bb1-9gJj)
垢版 |
2022/12/20(火) 13:23:33.17ID:BxNTD+0X0
>>230
RDNA3 ISAドキュメント見たけどdual issueのいう名のVLIW2の制限キツすぎてシェーダコンパイラの最適化はかなりキツそうで2倍は無理で1.5倍も怪しいレベル
0236Socket774 (ワッチョイ 7311-CLTW)
垢版 |
2022/12/20(火) 17:19:19.13ID:mLR78vpL0
現状だとDual~の効果はゼロと言っても過言じゃない
ほぼ半減してるFP稼働率を前世代の6割くらいにまで引き上げなきゃ話にならない

      CU数 FP数 clock flops 帯域 電力 性能 性能/flops 性能/電力
rx6900xt  100  100  100  100  100  100  100   100     100
rx7900xt  105  210  121  253  156  105  122    48      117
               ↓  ↓      ↓   ↓     ↓      ↓
あるべき形        115  242     100  145    60      145
理想形          110  231      95.  150    65      158
0237Socket774 (ワッチョイ 4722-9L8K)
垢版 |
2022/12/20(火) 18:27:36.09ID:T5PW8P+70
単純に演算基増やす方が素直に性能上がるし、NvidiaのGPUも基本的にはその方針
なんならXSXはわざわざCU数増やした独自のカスタムRDNAを採用してるから
MSはRDNAでも同じCUマシマシ路線が一番いいと考えてる
当のAMDもRDNA2では普通にCU数二倍にしてたからね

けどAMDがNvidiaに追随してもシリコンコストが増えて、結果的にRadeonの価格が上がって、Radeonのウリがなくなる
だからこそ今回のアーキテクチャがAMDの路線としてはあってたんだろうね
ラスタライズ性能はシェーダエンジン増加とクロック数増加による固定機能の性能向上である程度確保できてるから、競合よりも低価格なGPUを提供して少しでもユーザーの関心を引きたかったというのが本音だろう
その分、レイトレ性能は犠牲になったけど
0238Socket774 (オイコラミネオ MM1b-D+3r)
垢版 |
2022/12/20(火) 20:52:29.98ID:l0RTqNksM
AMDの設計は全て正しい
キャッシュがどうこういうやつはNVIDIA厨
0239Socket774 (ワッチョイ be44-zlOH)
垢版 |
2022/12/20(火) 22:06:29.68ID:B99naPcR0
急がば回れ、その点はIntelと同じ轍を踏んでいるなw地道に消費電力(発熱)を下げるノウハウを蓄積してきたから、ぶん回してもイケる。
switchにAMDが採用されてほしかったな。今後のマイナーチェンジや新型は分からんが
0240Socket774 (オイコラミネオ MM1b-D+3r)
垢版 |
2022/12/20(火) 22:15:31.98ID:l0RTqNksM
Switchに載せるTDPまで落としたら、AMD SoCなんぞ魅力ないだろ
15Wとか、28Wなどの爆熱、高消費電力でまわしてこそx86なんだから
0241Socket774 (ワッチョイ ea74-DiWi)
垢版 |
2022/12/21(水) 04:39:50.64ID:i2aXdymw0
とりあえず初代マルチチップ製品だしモノを出して次に活かそうってことじゃないの
Zenも初代からそうやってきてるし製品化して見える部分もある、今世代も値段と性能に納得して買う奴は買うというだけ
ツッコミどころってのは逆に今後の伸びしろでもあるしスレタイ的には歓迎
0243Socket774 (ブーイモ MMe6-ZBoO)
垢版 |
2022/12/21(水) 21:47:21.98ID:TA1JXpATM
もうGPUはAI方向に進むのが正解でしょ
0244Socket774 (ワッチョイ be44-zlOH)
垢版 |
2022/12/22(木) 20:42:33.46ID:1kR3WMl50
NVは,もう天井に頭着いて身動きできない。訳の分からんバージョンアップはIntelのCoreシリーズと同じ。
AMDは、これからハイパワー(RDNA)と省電力と幅広くやっていくだろう。
0246Socket774 (ワッチョイ be44-zlOH)
垢版 |
2022/12/22(木) 22:06:44.58ID:1kR3WMl50
>>245
>高消費電力を気にしないっしょ
これをやってきたから限界が来たんだよ。高消費電力=高発熱 この物理法則には逆らえない。
がんばってファンを増やしたり、水冷したり・・・もうそれの限界が来たから、燃えたり、どこが性能アップしたの?みたいな製品が次々と生み出される。
AMDは、地道に低消費電力、電力制御をやってたノウハウがあるから、その分回せる余裕があるんだよ。
0249Socket774 (ブーイモ MMe6-ZBoO)
垢版 |
2022/12/23(金) 08:08:12.06ID:GSqOt6nCM
AMDは110度でも燃えないから大丈夫だよね
0250Socket774 (ワッチョイ 5f11-CjmZ)
垢版 |
2022/12/23(金) 22:59:32.49ID:uM855DGJ0
グランツーリスモ7制作の裏側。車1台に270日、サウンドにレイトレ活用
https://av.watch.impress.co.jp/docs/news/1465935.html

グランツーリスモでレイトレが使われているって話。
前々スレあたりで、音声版レイトレの話をしたことがあったけど、まさにって感じの話題。


https://egg.5ch.net/test/read.cgi/jisaku/1571034539/338
>338 名前:Socket774 (ワッチョイ 2711-9rwV)[sage] 投稿日:2020/01/27(月) 15:18:02.67 ID:h6ogbj/b0
>PS5の場合、本命は3D音響であって、レイトレはその副産物って気はしてる。
>PS5のインタビューを読む限り、レイトレよりは3D音響に力を入れてるようだし。
>PS4ではTrueAudioが積まれていたように記憶してるし、原理的にはレイトレと大差なかったはず。

>要は3D音響が音声版レイトレであって、グラフィック効果としてのレイトレは、技術的には転用に過ぎないって可能性。
>もちろん、負荷はグラフィックの方がずっと重いけれど。

>実際の音を聞いて理解する「TrueAudio」。一部GPUとAPUに統合した新機能で,AMDは何を狙っているのか
>https://www.4gamer.net/games/269/G026970/20140814077/
0251Socket774 (アウアウウー Sa1f-ACJK)
垢版 |
2022/12/24(土) 09:40:03.90ID:gh2Jsoyma
Oberon(PS5)のレイトレユニットは三角形の交差判定対応してないから、大雑把なボックス判定ならサウンドに使った方が効果的かもしれないな
0253Socket774 (ワッチョイ c911-64l5)
垢版 |
2022/12/25(日) 00:02:44.30ID:S8I/da+j0
>>251
サウンドに使った方が、ではなく
元々はサウンドに使うつもりで実装していたモノを、グラフィックにも転用してレイトレとして使うようになった、ってこと。

つまり、レイトレはPS5にとってはイレギュラーな使い方なんだろう。
0257Socket774 (ワッチョイ 6711-30I6)
垢版 |
2023/01/04(水) 13:56:27.06ID:+1UOjACi0
勝手なことって、まるで「nVidiaの許可を取ったんですか?」とでも言いたげだなw


PS5では、3D音響はレイトレと違って最重要課題の一つで、どうすればいいかは初期から議論されてたらしいし
ソニー自体、そっち方面には昔から力を入れてる企業。
GT7という割と初期のファーストから、そういう使い方をしたタイトルが出た、ってことと併せて
俯瞰すると、最初からそのつもりだったという状況証拠が揃ってるって話。
0262Socket774 (ワッチョイ 1a64-/kWT)
垢版 |
2023/01/04(水) 21:00:36.96ID:XoRDGC4l0
NVIDIA、Chrome及びEdgeブラウザでの動画再生を高画質化する「RTX Video Super Resolution」を発表 - RTX 3000シリーズ以降で対応

GeForce RTX 4000および3000シリーズGPUにおいて、来月からRTX Video Super Resolutionが有効になり、ChromeおよびEdgeブラウザで閲覧するあらゆるビデオコンテンツが、AIによるアップスケーリングで、より高画質で楽しめるようになるとのことだ。
    
これは、Wccftechが指摘するように、Netflixを主にPCで利用しているユーザーには福音となるかも知れない。
Netflixはプランによって画質が違うのだが、例えばベーシックプラン(720p出力)で契約しても、このRTX Video Super Resolutionを使ってChromeで視聴すれば、4Kに近い画質で楽しむことが出来る様になる可能性があるからだ。
youtu.be/XA-tQpQqD7U
0263Socket774 (ワッチョイ 3eca-uY4n)
垢版 |
2023/01/04(水) 21:23:01.53ID:jBlZGESL0
不都合バグてんこ盛りの劣化パクリに金ドブ=安物買いの銭失い
         
まともな一般時ならインテルゲフォ一択がまたまた証明されてしまった
0264Socket774 (ブーイモ MMba-OOlc)
垢版 |
2023/01/05(木) 12:02:02.85ID:H9H1UVgaM
AMDもAI推しだけど
0265Socket774 (ブーイモ MMc5-4PMA)
垢版 |
2023/01/10(火) 07:23:02.72ID:eZrGcm2oM
>>262
Nvidiaはどうでもいいが対抗してRADEONも乗せて欲しいなあ特にFluid Motion
0266Socket774 (ワッチョイ 33bb-XBTm)
垢版 |
2023/01/10(火) 20:19:53.99ID:fyh8hbq80
>>265
パクリ希望とかさすが反日シナチョンアムダー
RTX買う金もねーのかよ?
働いてRTX買えや貧乏乞食ファンボーイ
0267Socket774 (ワッチョイ 2b44-oTKG)
垢版 |
2023/01/10(火) 21:20:51.26ID:0+baPsTj0
貧乏だから、信者でもないし10万も20万も出して、買えないわ。せめて半額程度にしてほしい
0268Socket774 (ワッチョイ 11e3-04Kf)
垢版 |
2023/01/10(火) 22:45:20.71ID:VugiTvaa0
ファンボーイが乞食したって価値があるからそうゆう値段なんだよRTXは
黙って働いて買え、出来ないなら黙って消えろ
0269Socket774 (ワッチョイ f911-Rn7p)
垢版 |
2023/01/10(火) 23:29:40.23ID:tplqFmEU0
>>265
対抗的なモノは割とすぐ出てくるでしょ。
例年、5月のドライバで新機能追加されるし。

ただ、どこまで本当かは知らないが、FluidMotionが外された経緯を考えると
コンテンツホルダーからゴルァされそうな機能ではあるな。
0271Socket774 (ワッチョイ 537a-RDtc)
垢版 |
2023/01/11(水) 11:45:41.11ID:mUFCf9j00
どうせソフトウェア実装でしょ
0272Socket774 (ワッチョイ 93ab-jAJt)
垢版 |
2023/01/11(水) 22:36:23.34ID:x2FLC7MN0
リファレンスデザインのサーマルソリューションに欠陥みつかる
RX 7900 XTX 110度アッチッチ騒動で怒りのアム土人

videocardz.com/newz/thousands-of-amd-radeon-rx-7900-xtx-reference-cards-could-be-affected-by-110c-gpu-hotspot-issue
RX 7900 XTX の機能的に制限されたベーパー チャンバーだけが、RMA が必要なほど本質的な問題です。これは、ホットスポット温度だけでなく、貯蔵タンクも 110 °C まで熱くなり、許容温度限界をはるかに超えて動作するためです。

ベイパーチャンバー()
さすがアムド
      
www.youtube.com/watch?v=rxaDZ6n2MNo
0273Socket774 (ワッチョイ 93ab-jAJt)
垢版 |
2023/01/11(水) 22:36:50.78ID:x2FLC7MN0
ryzenやめとけ速報

AMD製プロセッサーに複数の深刻な脆弱性 ~Athlon、Ryzen、Threadripperなどに影響~ 専門家は直ちに使用の中止を警告!
forest.watch.impress.co.jp/docs/news/1469386.html


即実害が発生する欠陥例  パート2

Radeon RX 6000シリーズの破損相次ぐ。
★共通点は最新ドライバ★
2023年1月11日 11:54
pc.watch.impress.co.jp/docs/news/1469275.html
      
説明によれば、約3週間で受け取ったRadeon RX 6800とRX 6900シリーズの故障カード計61枚のうち、48枚でGPUが破損しており、さらに共通の症状としてSOCレール、メモリレール、メモリコントローラレールがショートしている状態だったという。
 また、各ユーザーに対して使用環境などを問い合わせたところ、用途や負荷などはばらばらだったが、唯一の共通点は2022年12月公開の最新ドライバ「Adrenalin 22.11.2」を適用していることだったという。
0274Socket774 (ワッチョイ 93ab-jAJt)
垢版 |
2023/01/11(水) 22:37:17.53ID:x2FLC7MN0
NVIDIA、Chrome及びEdgeブラウザでの動画再生を高画質化する「RTX Video Super Resolution」を発表 - RTX 3000シリーズ以降で対応
 
GeForce RTX 4000および3000シリーズGPUにおいて、来月からRTX Video Super Resolutionが有効になり、ChromeおよびEdgeブラウザで閲覧するあらゆるビデオコンテンツが、AIによるアップスケーリングで、より高画質で楽しめるようになるとのことだ。

これは、Wccftechが指摘するように、Netflixを主にPCで利用しているユーザーには福音となるかも知れない。
Netflixはプランによって画質が違うのだが、例えばベーシックプラン(720p出力)で契約しても、このRTX Video Super Resolutionを使ってChromeで視聴すれば、4Kに近い画質で楽しむことが出来る様になる可能性があるからだ。
youtu.be/XA-tQpQqD7U

      
まともな一般人なら不都合バグてんこ盛りの劣化パクリはもうこりごり
よいこのみんなインテルとDLSS3やRTX Video Super Resolutionも使えてSuper resolutionに対応、RTに強くAIお絵描きもできるRTXを選ぼう
0276Socket774 (ワッチョイ 936e-DWwd)
垢版 |
2023/01/12(木) 19:44:37.46ID:E8zZsvuD0
Windows Updateが勝手にドライバをバージョンアップするのを止めたい
どうすればいいですか?
0277Socket774 (ワッチョイ b99e-NGfo)
垢版 |
2023/01/12(木) 19:59:59.97ID:NAMtK4mT0
DDU起動してオプションメニューの一番下の「”Windows"がデバイスのドライバーを検索したとき"Windows update"
からドライバーをインストールしないようにする」にチェック入れたらええんちゃうの?
0279Socket774 (ワッチョイ 93dc-EX4r)
垢版 |
2023/01/12(木) 22:43:36.71ID:cICmqT3A0
返金を求める被害者が降臨しだした
もう隠しきれないだろうな
 

111 Socket774 (ワッチョイ aa56-Zpst [125.196.35.160]) sage ▼ New! 2023/01/11(水) 19:44:11.82 ID:Q1ZeEztj0 [1回目]
むっちゃクラッシュして
OSクリーンインストールしたのはやっぱりドライバのせいだったのか
ハードウェアイカれてなければええけど
オートディテクトのツールでインストールしたのに今見たら公式にリンクあるのに本体消えてるし?
            
CPUもなんか脆弱性あるみたいだし
金返せこら
0280Socket774 (ワッチョイ 7e2d-B8hv)
垢版 |
2023/01/16(月) 12:01:34.34ID:1jh/+Owb0
ホラデオンはゲフォとArcに惨敗w

DirectStorageのAMD、Intel、NVIDIAによるパフォーマンス比較テストの結果が公開

GPUのハードウェア側では、DirectStorage解凍アルゴリズムの取り扱いが異なるため、PCGHは、AMDのRadeon RX 7900 XT、IntelのArc A770、NVIDIAのGeForce RTX 4080という最新のGPUのうち、どれが実際のデータ解凍処理で優れているかを比較した。
それぞれのグラフィックボードとIntelのCore i9-12900KのCPUで処理を行っている。

               PCIe 4.0 x4 (7.9GB/s)     PCIe 3.0 x4 (3.9GB/s)   SATA (0.6 GB/s)
Radeon RX 7900 XT      14.6 GB/s              12.6 GB/s        1.47 GB/s
Arc A770 16GB         16.8 GB/s              13.9 GB/s        1.64 GB/s
GeForce RTX 4080       15.3 GB/s              12.7 GB/s        1.47 GB/s
Core i9-12900K @ 5.20 GHz  5.2 GB/s              5.2 GB/s        1.47 GB/s

やはり驚きなのは、どのGPUもCore i9-12900Kプロセッサーの2.4倍以上の解凍処理能力を持っていることだろう。
一方、GPUによるデータ解凍に関しては、IntelのArc A770がAMDのRadeon RX 7900 XTやNVIDIAのGeForce RTX 4080よりも顕著に優れていることがわかる。
A770は16.8GB/sのレートでアセットを転送/解凍できるのに対し、RX 7900 XTは14.6GB/sで3位(首位と13%差)である。

AMD、Intel、NVIDIAのいずれのGPUを使用した場合でも、PCGHによれば、実際のロード時間は5秒から0.5秒へと一桁短縮されているとのことで、GPU同士での差は実際には体感できるレベルではないようだ。
したがって、どのGPUを使用するかはあまり重要ではなく、DirectStorageを用いることで、いかにゲームパフォーマンスが向上するかが重要であり、これからリリースされるゲームにおいて、この機能が広く実装されることが期待される。

最初にこのDirectStorageを実装して発売されるのは、SQUARE ENIXのRPG「FORSPOKEN」だ。
     
texal.jp/2023/01/14/directstorage-performance-comparison-test-results-from-amd-intel-and-nvidia-released/
0281Socket774 (ワッチョイ 7e2d-B8hv)
垢版 |
2023/01/16(月) 12:01:58.71ID:1jh/+Owb0
ビジネス向けCPUのセキュリティーに関するホワイトペーパーを紹介するページにて
世界初を世界発と書いてしまう   
こんなんじゃビジネスマンになれないぞ?
www.amd.com/ja/technologies/pro-security
0282Socket774 (ワッチョイ 1911-O3oS)
垢版 |
2023/01/16(月) 23:35:38.38ID:kqMpaEz40
AMD RDNA3 drivers with improvements for power consumption
https://videocardz.com/newz/updated-amd-radeon-rx-7900-drivers-reduce-power-consumption-in-fps-limited-games
https://cdn.videocardz.com/1/2023/01/RADEON-RX-7900-POWER-GAMES.png

12.2で、ワットパフォーマンスが改善されたが、あくまでフレームレートを一定にした場合に、だそう。
Doom Eternalを4Kで全力と144制限で比較されてるが、4K144なら前世代よりも省電力にはなってる。
0284Socket774 (ワッチョイ 1911-O3oS)
垢版 |
2023/01/19(木) 00:42:43.64ID:RwjAiatW0
>>284
前世代とは言え、Ampereを貶すのは止めて差し上げろ。

とは言え、144固定なら6700XTや3060よりも消費電力少ないので
合格点自体は取っているとは言える。
0285Socket774 (ワッチョイ 1911-O3oS)
垢版 |
2023/01/19(木) 01:22:28.97ID:RwjAiatW0
業界初のマルチダイGPUとなるRadeon Instinct MI200の見事な構成
AMD GPUロードマップ
https://ascii.jp/elem/000/004/076/4076331/2/

今更だけどCDNAの記事を読み返して思ったのだが、RDNA3のDualIssueWave32に似たような印象で
同じ設計思想をベースに、HPC向けとグラフィックス向けに作り分けている、と考えると
CDNA系とRDNA系は分かれたとは言え、それほど離れてはいないのだろう。
0287Socket774 (ワッチョイ 1511-hn8B)
垢版 |
2023/01/19(木) 14:29:23.29ID:kOKI0iaf0
GCNとCDNAは4つのSIMDユニットに1つのスケジューラという構成
各処理を1ユニットごと4サイクル掛けて4分の1ずつ実行することによって
処理発行はサイクルずらしで1つのスケジューラから4ユニットに対して行える

RDNAは2つのSIMDユニットに2つのスケジューラという贅沢構成
処理の発行と実行を切れ目なく行うことでSIMDユニットの稼働率を高めた

RDNA3は2つのSIMDユニットにそれぞれペアとなる機能限定SIMDを付け足した
処理発行は複合のVOPD命令としてソフトウェア側でまとめることでペア一括で行う
0288Socket774 (ワッチョイ 338b-+sW9)
垢版 |
2023/01/21(土) 21:52:48.55ID:c4fevJ7m0
やっぱりアムドのせいやんけ(笑)
まともな日本人はインテルとRTXを選ぼう
    
egg.5ch.net/test/read.cgi/jisaku/1673316070/880
880Socket774 (ワッチョイ ff56-Mn+U [125.196.35.160])2023/01/21(土) 17:26:32.98ID:HTO75GIC0
いや、お前ら忘れとるけど、ドライバが適切なものを自動で選んでくれるツールがWEBサイトからガチで消えたから
Auto-Detect and Install
File Size
40 MB
Release Date
12/8/2022
これ
俺はこれ使っておかしくなった
0289Socket774 (ワッチョイ 338b-+sW9)
垢版 |
2023/01/21(土) 22:36:58.36ID:c4fevJ7m0
まともな日本人ならインテルとRTXで決まりやね
   
egg.5ch.net/test/read.cgi/jisaku/1673840740/273
273>>86です (ワッチョイ bf83-Jpma)2023/01/21(土) 22:20:40.79ID:3P53L7Lx0>>274
INTELとmacで不自由なく使えてたオーディオインターフェース、、B550チプセト、5900Xで組んだマシンだと某DTMソフトと相性悪くて詰んだわ
USBカード差してもダメらしくてオーディオインターフェース新しく注文したわクソっ
某ソフトだけで起こってるしバージョンが10から11になっても解消されてないってやべえわ
ほんまRyzenのUSB周りさあ・・・

www.motunation.com/forum/viewtopic.php?t=67355&;p=579157
これとかも
www.reddit.com/r/ableton/comments/n4khag/comment/hu4w7sm/
0290Socket774 (ワッチョイ 4f11-i7+J)
垢版 |
2023/02/15(水) 17:05:24.50ID:r1Bh/iSp0
西川善司の3DGE:Primitive Shader対Mesh Shaderの真実。ジオメトリパイプライン戦争の内幕とAMDのゲーマー向けGPU戦略
https://www.4gamer.net/games/660/G066019/20230213083/

RickBergmanとDavidWangがGPU戦略の中心ってのも、ようやくATiがAMDとして本格始動したのを感じるな。
nVトロールは「Rajaが居なくなって、もうRadeonは終わり」なんて言ってたのも懐かしい話w

PrimitiveShaderは破棄されたのでは無く、MeshShaderを動かすのに使われてる、だそう。
あとAMDはnVidiaのAI戦略を、「GPU中心の戦略をとらざるを得ないから」と解釈しているし
AI技術を使わずとも、CPUで十分対応可能な用途は相当あるから、nVidiaの後追いはしないとも言ってるな。
0293Socket774 (ワッチョイ 8358-pSOf)
垢版 |
2023/02/16(木) 01:28:06.59ID:+XV6CLL+0
>「FidelityFX」シリーズのひとつである「FidelityFX SuperResolution」(FSR)を見てほしい。推論アクセラレータを活用することなく実現したFSRのアンチエイリアス処理や超解像処理は,NVIDIAのDLSSに十分対抗しうる性能と品質をもたらせている。
>AI技術を用いずとも行える用途に対してまで,NVIDIAが積極的にAI技術を活用しようとするのは,NVIDIAがGPU内に大規模な推論アクセラレータを搭載してしまっているからだ。
0295Socket774 (ワッチョイ 3bad-uphh)
垢版 |
2023/02/16(木) 11:22:38.96ID:oeQMRzDb0
AIエンジンはこれからデフォルトでついてくる
intelはVersatile Processing Unit(VPU)
amdはXDNA
appleはNeural Engine
GPUよりAI関連命令の実行速度も電力効率もよい
0296Socket774 (スッップ Sdaa-jNYf)
垢版 |
2023/02/16(木) 13:28:53.01ID:hBn0w1SId
>>295
だって今のAI活用は用意された複数の答えの中から最も近い答えを選んで提示してるだけだからそりゃ低消費電力で速い

AI推論モデルは予め学習したパターンに基づいて推論してるだけで
何が凄いんだかって感じだけどな
0300Socket774 (アウアウウー Sa49-Qzdv)
垢版 |
2023/02/21(火) 17:43:20.40ID:x73US4yra
>>299 DeepL(機械翻訳)がそうらしい。第二のgoogleになる可能性がある。長年研究してきたことがAI技術で無になってしまったら怖いよな。
0301Socket774 (ワッチョイ 3d11-k1/p)
垢版 |
2023/02/24(金) 19:20:36.38ID:uYkf+Z640
7800以下はQ2以降からとか言ってるけど、年明けに8900(仮)出るからハイとローは0.5世代ずつずれて50は無くなるのかな
0310Socket774 (ワッチョイ 3d11-N/Lw)
垢版 |
2023/06/09(金) 21:26:27.53ID:EyKnvUe80
AMD RX 7600 Has Better Cache Latency Than the RX 7900 XTX
https://www.tomshardware.com/news/rx-7600-sports-better-latency-compared-7900-xtx

IFキャッシュのレイテンシに関して、MCMだと不利になる、って話。
Navi31はIFキャッシュ192MB案もあっただろうけど、MCM化に際してレイテンシ対策をしたら
容量増やせなくなった(が十分な性能は出ていた)と考えるべきだろう。


RDNA 3世代のミドルクラスGPU「Radeon RX 7600」性能速報。FHDでは競合のミドルクラスと戦えるがネックは価格か
https://www.4gamer.net/games/660/G066019/20230522039/
↑で、288GB/s+32MBのRX7600と320GB/st+80MBのRX6700の比較で
RX7600は、キャッシュ容量とメモリ帯域で勝るRX6700とほぼ同等なので
RDNA3世代のIFキャッシュは、RDNA2換算で倍程度の容量と同等で、Navi31のキャッシュ容量が足りないってことはなさそうな。
0312Socket774 (ワッチョイ 6211-hRAP)
垢版 |
2023/07/05(水) 23:27:52.08ID:x0cBUSR30
生成AI向けGPU「Instinct MI300X」の構造と性能を分析 AMD GPUロードマップ
https://ascii.jp/elem/000/004/143/4143496/

https://ascii.jp/img/2023/07/02/3563399/o/9ce2ffaf84074cc3.png
MI300が発表になったけれど、GDCが8個なのがMI300X、7個とZen4のCCDが3個がMI300A。
CCD3個とGDC2個が同じぐらいのサイズなので、GDC1個あたりは約100mm2となる。
Navi31がCU96で300mm2なので、CUは32ぐらいになる計算だけど、記事ではCU40となってる。

https://ascii.jp/img/2023/07/02/3563397/l/4bc115bb525caae3.png
https://ascii.jp/img/2023/07/02/3563400/l/990306a634a528fe.png
CDNA2ではNavi31と同じく平面での接続だけど、CDNA3では新たにIODの上にGDCを置いて
それぞれのIODを接続してのMCMとなってる。

RDNA3のDualIssuieWAVE32は、CDNA2のMatrixユニットをもう一つのシェーダーユニットとして
RDNAに転用してきた可能性考えると、次はIODの上にGDCを載せるMCMをしてくるのは考えられる。

まぁ6nmとはいえ、そんな大きなIODを用意するよりは、MCDを細長くして2個のGDCに跨がる形にするだろうけど。
0313Socket774 (テテンテンテン MM17-biFY)
垢版 |
2023/08/05(土) 10:04:47.93ID:G5nHEhCTM
RDNA4ハイやらないって、やっぱりCDNAのついでってポジションを強く出すのか。今でもハイエンドではないけどミドルだけとか
0314Socket774 (ブーイモ MMf9-y19c)
垢版 |
2023/08/05(土) 12:37:20.00ID:wH1V6advM
ハイエンドコアは作らないけど
ミドルのチップレットを複数載せたパッケージで
ハイエンド製品出すって可能性は?
まあどっちにせよまだ噂段階だが。
0315Socket774 (ワッチョイ 8de8-dbOM)
垢版 |
2023/08/05(土) 12:53:27.64ID:xTG/PfyY0
RDNA4のリークで、クロック上げた48CUのGCDダイのチップレット数で
ハイエンド、ミドルレンジ、ローエンドと性能分けすると出ている

Navi41 :GCD x 3= 144CU x 128sp x 3.5GHz x 2op = 129 TFlops(≒ 64.5 TFlops)
RTX4090:16384CUDA x 2.52GHz x 2op = 82 TFlops(≒ 41 TFlops)
7900XTX:12288SP x 2.5GHz x 2op = 61 TFlops(≒ 30 TFlops)
7900XT :10752SP x 2.4 x 2op = 51 TFlops(≒ 25 TFlops)
RTX4080:9728CUDA x 2.51 x 2op = 48 TFlops(≒ 24 TFlops)
※()内ゲーム時Flops

CUまたはSM内に、Primary ALUとSecondary ALUとALUを2重化して
面積効率を最優先に配置する構造はいつ改めるんかね

ゲームだとFPオンリーで動く機会はほとんど無いはず
そうなると実際にはクロック差を考慮するとRDNA2には勝てているが、
同クロックで比較した際の他の命令のスループットはRDNA2に負けている

追加機構が生きてないのがRDNA3
ゲームに特化したGPUならCDNAの構造をそのまま卸してこないでちゃんと専用設計でやってほしい感はある
0316Socket774 (ワッチョイ 8de8-dbOM)
垢版 |
2023/08/05(土) 14:08:20.21ID:xTG/PfyY0
7900XTには16MB容量の6つのMCDが総容量96MB搭載されているが
実際にMCDで使用できる容量は64MBに制限されているとの事

残りの32MBは特定の処理の為に予約されており、
それ以外には使えないとの事でRDNA3のハイエンドNavi31の実質のIFキャッシュ量は64MB
64MBそこまでのレイテンシは良好でもそこからはRDNA2の後塵を拝する

コストの問題があったにせよやはりIFキャッシュの容量が少な過ぎなのが問題だと思うわ
それが無ければIFキャッシュの恩恵で4090を超えられたかもしれんのにな
0319Socket774 (ワッチョイ 0f58-mBaV)
垢版 |
2023/08/11(金) 19:50:40.36ID:SnCLDGga0
RDNA4のハイエンドはGCDのチップレット構成が難航して開発中止
NVIDIAの次世代が25年なのでRDNA5に先送りしても許容可能と判断されたって話が出てきたな
0323Socket774 (ワッチョイ 9a11-VPys)
垢版 |
2023/08/15(火) 19:52:17.68ID:5/fdXV5O0
IFキャッシュが足りないって定期的に言う奴出てくるけど
GPUにおいてもキャッシュは容量性よりも局所性の方が重要になってきてるってことだろう。

Vega10のHBCCの説明で、「4GBのメモリ容量があっても実際に使うのは2GB程度」って言われてたぐらいで
IFキャッシュも、使うのは64MBあれば足りていて、それ以上は結局メモリアクセスを伴うので
あっても無くても大差ない(コストに対してそこまでのゲインはない)、ってのが実情だろう。

むしろ思ったよりも性能が伸びてないのは、どちらかというとDualIssueWave32の存在で
これが思ったよりも機能しなかった、ってのがメインって気はする。
CDNAでも、FP64専業となったシェーダーがFP32以下を処理するための代走って位置づけなので
元々2本のシェーダーを同時に使うってのをあまり想定してないっぽいけれど。
0324Socket774 (ワッチョイ abe8-prCk)
垢版 |
2023/08/15(火) 20:20:36.20ID:XS4SlFNV0
>>323
何のためにキャッシュラインによるヒット率をAMD自信が出してたんだよ
アホか
0326Socket774 (ワッチョイ 9a43-Uqm6)
垢版 |
2023/08/15(火) 21:55:54.49ID:CLTC7VNp0
GDDR6が遅いからキャッシュ増やして実効帯域稼ごうって流れだったところを、GDDR6高速化という根本的なテコ入れしちゃったからな
その公式発表でも当然キャッシュ容量の伸びに対してヒット率の伸びは悪化してたし、減らして大丈夫なら減らすのはコスト的に仕方ないのかも
せっかく作ったのに一世代で必要性が下がったというのはちょっと頭抱えたくなるが…
0327Socket774 (ワッチョイ abe8-prCk)
垢版 |
2023/08/15(火) 23:22:01.52ID:XS4SlFNV0
>>326
高速化?
どんだけGDDRとキャッシュのレイテンシに差があると思ってるんだ
少しは考えろ
0328Socket774 (ワッチョイ 9a43-Uqm6)
垢版 |
2023/08/16(水) 00:31:32.43ID:SzKJH5F+0
infinityキャッシュまるっと無くなった訳じゃなく3/4残っててクロックも確か上がってるからな
レイテンシの話はそんなL3ポジの大容量キャッシュがちょっと減ったことより、GDDR6まで読みに行くワーストケースが速くなってることとL0からL2の増量で総合的に改善してると思うよ
0329Socket774 (ワッチョイ abe8-prCk)
垢版 |
2023/08/16(水) 06:24:41.06ID:xyBMMjTN0
容量が多ければそれだけ詰め込んでおける、単純な話だよ
帯域がとかの話じゃないんだよ
論点ずらしてんじゃねーよ政治家かおめーは
0335Socket774 (ワッチョイ 59b1-y2bS)
垢版 |
2023/10/14(土) 03:35:18.39ID:55G6LpHY0
今ここに!ロリの国の設立を宣言する!国王はこの私だ!私が法律だ!幼女以外は国民と認めない!
0336Socket774 (ワッチョイ 1311-iZeJ)
垢版 |
2023/10/18(水) 14:05:43.29ID:+kZxJdQP0
RDNA4では新型チップレットの41と42がキャンセル、Navi43はNavi33の倍になるって話だが
AI/MLの強化やCUの強化はやってくるんじゃ無いかと思ってる。

CUについては、RDNA3方式でならNavi43はCU32とするべきだろうけれど
RDNA3のように、2本目のCUが殆ど動かないって状況が解消されるんだろうと思う。
なので、CUが2倍になったのと同じぐらいの性能が出るのでは無いかと思う。

AIアクセラレータは、Turingレベルの64基からAmpereレベルの256基に強化されることで
AI性能でも、Blackwellにはかなり食い下がりそうな気はする。
RDNA3では7900XTXで129TFlops、4080(195TFlops)の2/3程度なので
競合の次世代強化分を考慮して、4倍強化で同等レベルに追いつける、とは思う。

インタビュー見ると、RDNA3ではあまり必要性を感じてはいなかったが、ROCmでの動きを見てると
RDNA4ではここは強化してくるのでは無いかと思う。

あと、キャンセルの時期を見ても、旧Navi41/42はキャンセルされても
Navi43を2倍にした新Navi41は出てくる気はする。
というか、nV系の人はやたらとAMDの新製品をキャンセルやらリスケやら言いがちなので
これもそういう話の一つだと思ってる。
0337Socket774 (ワッチョイ f1de-Hgbl)
垢版 |
2023/10/18(水) 19:57:52.48ID:mrU/FEhV0
>思ってる。
>では無いかと思う。
>気はする
>とは思う。
>では無いかと思う。
>気はする。
>思ってる。
0340Socket774 (ワッチョイ bde8-hDp0)
垢版 |
2023/10/22(日) 16:40:02.15ID:R90lOlKU0
>>336
CUの中にある2ALU(2xSIMD32)のうち1ALUが特殊な状況下で無いと動かないだけで
WGP内の2CUは2つとも動いてはいる
0341Socket774 (ワッチョイ ddb6-JD/u)
垢版 |
2023/10/23(月) 19:59:47.82ID:gOoNikXT0
というかいつものハイエンドしか出さない世代と
ミドルしか出さない世代のラデに戻っただけだろというか
本当にGPUバブルは終わると考えてるんだろうな
0342Socket774 (スプッッ Sd7a-Uokm)
垢版 |
2023/10/25(水) 09:44:18.96ID:4MTUIBuPd
GPUバブルは終わると言うか、需要に乗れずに諦めたって感じじゃね
AIで戦うためにザイリンクス買収したのも無駄になりそうだ
0349Socket774 (ワッチョイ 7f8d-gJHn)
垢版 |
2023/11/25(土) 00:10:56.41ID:dORMDoYb0
>>347
そこら辺知ってるなら逆に大艦巨砲なNVIDIAを心配するわ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況