AMDの次世代GPUについて語ろう 6世代
■ このスレッドは過去ログ倉庫に格納されています
!extend:checked:vvvvv:1000:512 !extend:checked:vvvvv:1000:512 AMDのGPUに関する話題のスレです。 関連スレ CPUに関してはこっちで。 AMDの次世代APU/CPU/SoCについて語ろう 301世代 http://egg.5ch.net/test/read.cgi/jisaku/1606557994/ 前スレ AMDの次世代GPUについて語ろう 5世代 http://egg.5ch.net/test/read.cgi/jisaku/1596721794/ VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured MI200はチップレットだそうだけど、これってゲーム用GPUに使える技術なんすかね。 単純に同じデータを2つ持って、交互に表示するならデータ干渉しないし、 インターリンクでも大丈夫っちゃー大丈夫な気がしますが。 AMD is Preparing RDNA-Based Cryptomining GPU SKUs https://www.techpowerup.com/279430/amd-is-preparing-rdna-based-cryptomining-gpu-skus nVidiaに対抗して、マイニング用のGPUをAMDも用意している、らしい。 ただ最新のRDNA2ではなく、Navi10ベースのチップ(RDNA1でCU40のチップ)を使うのだとか。 Navi10系の在庫処分としては良いんじゃない、としか。 NVIDIAのマイニング制限しているGPUって結局イーサリアムしか制限してなくて 他の仮想通貨には影響ないんだとか。 結局マイナーに倍の価格で買ってもらいたいからわざとじゃね?という話もあるような。 対抗してと言うが、マイニング向けSKUのパッチは去年の10月から投稿されてる 単純に需要があるからじゃね 画像出力つけといてほしい もしも3万だったら普通に買いたい でもASICあるし他の通貨ならそっち使わんと勝負にならんのでは? 今gpuで掘る意味があるのってイーサだけっしょ? スウェーデンの大学やオーストラリアの国立研究所なんかでも MI200の採用が決まったな これ割とすごいことになりそう せっかく広く使われるようになってきたんだからソフトウェア方面の整備もなんとかしてくれ 他と比べて遅れ過ぎや なんともならんよ GPUなんか後回しで全力でIntelを追い詰めるべき そもそもゲーム機とDX12で次世代技術は囲い込んでるから勝手に最適化されていくよ DLSS対抗技術もMSと共同で開発してるし、焦ることなんて欠片もない それだけインテルが強大だったと言う事 正直、AMDがここまで盛り返すとは思ってなかった 結局開発者次第なんだなぁ >>12 CPUに関してはまあZen4でHPCでも圧倒的存在感になってるとは思う 今も存在感でかいけどさ GPUに関しては面白いことにゲーミングのようなコンシューマ用途ではなくて HPC用途から競り合い他社の領域を食っているんだよな‥‥ CPUはIntelと同じISA使ってるおかげでIntelが長年闘志してきたインフラをそのまま使えるからな AMDはそれにタダ乗りしてるだけ GPUはそれができないから厳しい x86-64タダ乗りして自分達の物と言い張るパラノイアがいるらしい GPUもゲーミング分野では過去からみるとシェア割と伸ばしてる事になってないかな。 確か2017年とかそこらだと10%位だったのが2019年だと20%位で、XBOX,PS4加えると NVIDIAと互角だというポジショントークがあったような・・・ >>17 ゲーム機のインフラはAMDとMSとソニーの共同開発だぞ PC向けはそれを逆輸入すればいいだけ Nvidiaのインフラとか最初から欠片も使ってないし今後も無関係だけどな >>18 その皮肉、たぶん>>17 には通じてないんじゃ? AMDもNVIDIAも売れるミドルは高く売る 性能比は 2080ti=3060ti=RX6700(これからでるだろう非XTモデル)=500-600$ 2070s=3050=RX6600=RX5700XT=300-400$ 2060=3040=RX6500=RX5600=250-300$ 1650s=3030=RX6400=150-200$ こんな感じになるだろう AMDにおいては2560spの6700XTが対6800で75%性能でoc余力があると するとspが減るほどoc耐性増えてsp性能比は増えると 6800 3840sp 100% 6700XT 2560sp 75%=3070超 6700 1920sp 60%=3060ti 6600 1500-1600sp 50%=3060/12GB並み 6500 1200sp40%=2070s並み 6400 1000sp=2070並み 6300 512sp×2.9ghz=1660ti並み これくらいのポテンシャル期待してもいいかも、そして流石に500-1000spの6GBモデルとかなら 原価高騰、euv暴騰でも市価150-200$いない税込みくらい期待できるだろうとな NVIDIAも1GPC4-6GBメモリ品で1660ti並みなら150-200$でリリースできる 個人的には RDNA2は5120sp品がGPU原価250$ 歩留まり悪い3840sp品でGPU200$ 2560sp品で170$ 2034sp品で140$ 1408sp品で110$ 1000sp品で90$ 768sp品で75$ 512sp 品で45$ GDDR6の6Gメモリは暴騰中で45$、GDDR5なら38$ AMDのコロナ税は卸価格で20$、ask税は諸々20% くらいと踏んで、512sp品で139$税込み、768sp品で170$税込みくらいと で768sp×3ghz×GDDR5/6の6GB品でRX5500XT、1660ti超える性能くらいを期待してるわ AMDもNVIDIAもそういう高性能ローエンドを「おやすく店頭価格18000税込みです」ってやると思うよ で本当の原価は年末には768sp品で原価70$くらいに収まるだろうと NVIDIAなんかは1GPC1480spくらい何だけど、1GPCで原価50-60$、メモリ代40$、グラボ出荷価格130$、店頭価格180$くらいでOCして2060並みとな こんなアイテムをNVIDIAやAMDは絶対大量投下するよ >>20 実のところソニーの影響力ってどこまであるのかね Naviはソニーと協力したってフォーブスが昔、報道してたけど 確かにNavi10の構成は、PS5用GPUとそっくりだったけどね こっちはレイトレユニットありだけどダイショット写真だとNavi10とほぼ同じ 高クロックに関しては、ソニー側が巨大ヒートシンクの採用、ハイエンドグラボ並みの電源フェーズ 液体金属採用とかソニーの努力がよく見られるけどな 反対にRDNA2はDX12UのためにMSと組んでる感じだったけど 1050Ti再生産まではいい・・・けど 2万ってなんだよw 業界初の“4Kダブル録画”対応ビエラ。オートAI画質や4K120pも https://av.watch.impress.co.jp/docs/news/1314567.html 液晶テレビだけど >今夏発売予定の43型「TH-43JX850」のみ、映像ソースのフレームレートとディスプレイのリフレッシュレートのズレによって発生する“画面割れ”を防ぐ「VRR」と >AMD製グラフィックスカードと接続した際に低遅延・ティアリングの無いスムーズなゲームプレイができる「AMD FreeSync Premium」にも対応する。 とJX850はFreeSyncPremium対応と明言してる。 FreeSyncは、いよいよPC外にも普及していきそうな見込みが出てきたね。 RADEONがいつまで経ってもHDMI2.1のVRRに対応してくれないから仕方なくでしょ ゲームやPCならともかく映像見るだけなら垂直同期するだけで十分だからなあ なんか海外から流れてきてる感じがあるね ひょっとするとこれ意外と今年前半で落ち着くのかも??? >>27 AMD FreeSync™テクノロジー¹のFAQ(よくある質問) ttps://www.amd.com/ja/technologies/free-sync-faq AMD FreeSync™テクノロジーはHDMI®で機能しますか? 当初からFreeSyncテクノロジーでは、HDMI接続がサポートされています。 FreeSync認定ディスプレイの多くでは、HDMI 2.1がリリースされ、HDMI VRRが導入されるかなり前から、 HDMI接続で可変リフレッシュレート・テクノロジーがサポートされていました。 HDMI接続がサポートされているFreeSync認定ディスプレイを購入すると、 ディスプレイでHDMI 2.1がサポートされていない場合でも、すぐに可変リフレッシュレートのメリットを得ることができます。 >>12 PS4の時もそんな事言ってたような... 嘘か誠かNavi33は80CUだという噂でNavi31,32はChipletでそれ以上という・・・ 正直眉唾ですが、Chipletでゲーム性能上がるんですかね。マイニングなら それでいいんでしょうが。 >>35 Infinity Cacheの最終目的だったりするんじゃね? NVIDIAよりは現実的? CU増やせばその分性能は上がるだろ ダイ間がボトルネックになるから2倍まではいかないが1.8倍にはなるはず もちろん理想はモノシリックダイだけど歩留まりがヤバいことになる 2.5Dによる超近接MCMだからそこまでボトルネックにならないはず PS5のGPUで有名なNAVI 10 LITEとかの、LITEの意味ってセミカスタム品であってるのかな? NAVI 12 LITE (Apple用?) NAVI 14 LITE = (Apple用?) NAVI 21 LITE = Arden (Xbox Series XのGPU) Van Gogh LITE = Xbox Series S? >>35 RDNA3でもワッパが大幅改善されるということ 同性能で電力半分ならCU倍になってもおかしくない >>41 レイトレユニットがある時点でPS5のGPUがNavi10世代って事はねーわ。 内部構造をわざわざPS5に作り直しだもん。 Navi20系使ったほうが設計コストが圧倒的に安い。 3D V-Cacheつかってキャッシュを増やせるなら次のNavi30世代は 3D V-CacheでInfinityCache大盛りになったり・・・・ >>45 設計順がPS5がNavi20系より先と言われてるからそこは不思議じゃない Navi10系じゃ液冷とか使わんと2GHzオーバーでは動かんだろ Navi20そのものじゃないにしてもNavi20で使われてる技術も使ってると見るべき だから順序が逆なんだよ PS5の技術をNavi20に使ってるならコードネームは矛盾しない PS5は19年の早い時期、RDNA1の発売前にはV字型で知られる開発機が配られてた 一方SeriesXの開発機は20年に入ってから製品版ほぼそのままだったらしいから ベースとなる世代が異なっている可能性はある >>50 そのロジックだと、RDNA1世代よりも前にレイトレユニットと2GHzを超える クロックのGPUを量産出来てたという事になるが・・・ RDNA3は2022年10月ごろらしいけど、Appleが3nmに移らないと 5nm空かないからなんでしょうかね。 そんで3DV-Cahceも使うと。AMD大勝利・・・・とはいかんでしょうけど 値段で上手いこと棲み分けられるかな。 >>52 RDNA世代でもNavi 10ベースのレイトレ対応iGPUの存在が確認されたから理屈は通るでしょ 高クロックなのはプロセスルールの改善とSIEの電力・冷却設計の賜物による AMDがRDNA2でレイトレ対応させたのもDX12U,DXRと歩調を合わせた結果だろうから ここら辺はPS5の動向とは少し外れるAMDの事情があったんだと思う ttps://www.coelacanth-dream.com/posts/2021/06/06/gfx1013-apu-rt/ 同程度のNavi22をベースにしてるならinfinity Cacheは抜きにしても回路設計は両者とも限りなく似るはずだけど ROPの設計がRDNA2世代と違う点からみてもNavi20系を直接ベースにしたとは言えないと思う そんなんただの言葉遊びじゃん。 iGPUでNAVI10+レイトレのモデルがあったぞ!ってXsXでない証拠もないよね。 PS5のGPUは2.2GHzで回るので内部パイプラインはRDNA2と同じでないといけない。 つまりXsXがRDNA1.5である証拠なのでは? と言われた場合、反証がないでしょ。 あと、RDNA1.5が存在するとしたら、2020年10月にRDNA1.5のAPUとRDNA2.0のAPUと RNDAのGPUを全部同時に設計・製造していた事になる。そんな設計パワー、AMDにあるわけない。 だいたいウェハーの試作に100億かかるんすよ。 そんな全部同時に動くかどうかわからないバクチ打つわけない。 単純に全部RDNA2をちょこっといじっただけ、と考えるのが自然と思いますよ。 双方の主張はすべて推測なんで言葉遊びの域を出ませんが。 GPUをチップレットに、ですけど、CDNAの方はともかく、RDNAの方は効果的に動かないっしょ、 と思っておりましたが、V-Cacheでチップレットを繋げば意外に帯域は確保できるのでは? GPUがV-Cacheに最初にアクセスしてそこのデータを使うだけだったら、チップレットが V-Cacheに同時に接続できるならありじゃね?という気がしますけど。無理か。 >>56 ソースもなしに憶測で反論するのは流石に問題あるぞ 少なくとも>55は有識者の検証結果を元にしてる >>57 V-Cacheは発熱が少ないL3だから重ねられるわけで、発熱がやばい演算コアには重ねられないんだ GPUの大半は演算コアだからV-Cacheは現状は不可能 上に重ねるんじゃなく2.5Dのベースにキャッシュ付ける特許もとってるよ https://g-pc.info/archives/18644/ >>56 XSXはArden(Navi 21 LITE = gfx1020)って判明してるからそりゃないよ リーク情報からそこらへんを検証してる動画もある ttps://www.youtube.com/watch?v=SQjwKH3D5Hw&t=325s そもそもgfx1013はあくまでNavi10ベースでドット積にも対応してないって話だけど Ardenはドット積演算にも対応してる それを踏まえた上で、逆にgfx1013=XSXの反証はあるのかって話よ >PS5のGPUは2.2GHzで回るので内部パイプラインはRDNA2と同じでないといけない。 ttps://youtu.be/ZIDi_PI8R8o?t=313 RDNA2のIPCはRDNAからは変わってないからCU内部に大きな変更はないとみれる そもそもAMD自体は高クロックのためのCU改良を行ったとは一言も言ってないはず PS5の高クロック化はプロセスルールの改良と冷却機構の強化と液体金属の採用によるもの デスクトップRDNA2もおそらくそれと同じ要因だし、XSXのクロックの低さはあくまでXboxのアーキテクチャに起因するもの 高クロック=RDNA2の要因をアーキテクチャの改良によるものとは言い切れないと思うが >>61 クロック同じ = パイプライン同じ? 理屈が変な気がする 内部構成をいじらないで高クロック化がぱっとできるなら こんなところでグダグダ言わないで即AMDに就職するべき。 年収100億は固いですよ。 そもそもGCNでも1.0からVegaまで内部パイプライン自体は変わってないだろ確か Vegaで一気にクロックが上がったのもクリティカルパスを徹底的に潰したからであってパイプラインを深くしたなんて話はなかったはず >>63 元々、>56がPS5のGPUクロックが2.23GHzで回るのは内部パイプラインがRDNA2だからって言ったのが最初 >>65 なるほど>56からか >>66 で、これと >>66 ttps://pc.watch.impress.co.jp/docs/column/kaigai/1073276.html > Vegaアーキテクチャでは、従来のGCNと比べて基本のパイプライン段数に変更はない。ベクタユニットの積和算パイプは4サイクルレイテンシのままだ。しかし、クリティカルパスについては徹底したチューニングが行なわれたという。 > パイプライン自体を変更しなかったのは、パイプラインを深くして積和算のレイテンシを長くすると、パイプラインを満たすのにより多くのスレッドが必要となってしまうからだと推測される。スレッド並列性を維持するためには、レジスタなどより多くのリソースが必要となってしまう。それに対してクリティカルパスチューニングでは、原理的にはアーキテクチャ上の変更が必要ない。 ttps://pc.watch.impress.co.jp/docs/column/kaigai/1037849.html > VegaのNCUのもう1つの重要な特徴は、高クロック化だ。AMDはクロックを引き上げるためにパイプラインを変更したと見られる。 後藤の推測をそのまま間に受けたのか知らんが、Vega64のアナウンス時には>66の通りになってる パイプライン段数は一緒なのか じゃあ>>66 の図は何のことなんだろう 1クロックで2倍のデータを流してるみたいだけど、段数以外の何かが変わってるのかな クリティカルパス潰しは並列度の向上には関係ないと思うし >>70 ゼンジーはFP16 Packedのほうで解釈してた FP16は殆ど使われないからクロック向上とは関係ないと思う 高クロック化はRDNA2の内部パイプラインによるっていう理屈なら Vega2.0で2.1GHzで回るRenoirはどうなるんだって話よ? Vegaに至っては基本アーキテクチャすら変えてないって話だぞ じゃなんでXsXは1.8GHzなんよ。 APUはCUが少ないから高クロックで回してもいい、と判断したんでしょ。 消費電力を気にしなければ上がるけど、商品として成立する範囲に収まるという点で 相当内部パイプラインをいじらんとできない。 ZEN2+RNDA1カスタム、ZEN2+RDNA2、RDNA2全部同時期に3つも物理設計できるわけねーだろ。 >>73 本当は回るけど回さなかっただけだろ 今の8CUに留めている理由もメモリのせいにして嘘ついているみたいに、出来るけどAMDが利益を減らしたくない、今後ボッタくるために性能向上の余地を残しておく >>74 あれだけ言われてるんだからソース出せよ 憶測で反論するな そりゃダイ個別にパイプラインまで設計してたら手間だけど RDNAアーキテクチャに則ってるなら別に問題はないでしょ 基本コンポーネントは同じだしそれぞれ手を加えるだけ別に再設計する必要はない RDNA2も基本構成はRDNA世代を踏襲してるからこそ この短期間で5つ以上のダイを設計できてるわけだからな あと上でも言われてるけど別に内部パイプラインを深くしなくても クロックを上げる方法はいくらでもある クロックゲーティングの最適化による高クロックは今時のGPUではよくある話 RDNA2で本当にクロックを上げるための内部パイプライン拡張が行われてるって話は 聞いたことないけど事実なら結構おもしろいけどね たぶん内情は>68みたいな最適化が主だと思うからパイプライン拡張はないでしょ さすがにレイトレユニットがあるのにパイプライン処理が変わらないって無理あると思うが。 あと消費電力がCU当たり7割位になっていてトランジスタレベルで結構手を入れてるはず。 CU当たりの消費電力見る限りPS5がRDNA1相当ってのは無理がありますね。 ただ、AMDの次世代GPUという話題でもなんでもないし、この話題したがるやつ自体がそもそも AMDの次世代GPUというテーマに全く興味がないんでしょ。 それにNDA結んでるんだから真相はわかるわけない。断言してるやつは誇大妄想狂以外にありえんでしょ。 RDNA2のレイトレユニットはテクスチャユニットと同じく共用リソース、つまり排他的な仕様になってるからパイプラインに手を加える必要はない この場合は、テクスチャユニット使用中はレイトレユニット自体は使えない、けどそれは逆の場合も然り レイトレ命令発行時は、テクスチャ、ローカルデータアクセスなどの共用リソースをレイトレに置き換えるだけでパイプラインの段数そのものが拡張されてるわけではない PS5がRDNA云々の話はゲハかそっちでやればいいよ 次世代GPUとは趣旨が離れてる >>79 >68の記事の理屈で言えば、RDNA2CUのサイクルレイテンシはRDNAと同じWave32時で1サイクルレイテンシで変更無し RAの拡張方法は>80のようにテクスチャユニットなどと排他的使用ならパイプライン段数そのものへの影響は少ない しかも今回、AMDがパイプラインに手を加えた話はないし、>68で確認されてるとおり、Polaris→Vegaの同一プロセスルールでの高クロック化をクロックゲーティングの最適化で達成してる AMD側からの明確な発表がない限り、今回もそれに倣った事例と見るのが適切でしょう スレ違だけど、他にパイプラインの段数を変えての高クロックの事例だとNvidiaのKeplerぐらい コイツはフロントエンドスケジューラからCUDAコアまでのパイプライン処理を従来のFermiから刷新した ttps://pc.watch.impress.co.jp/docs/column/kaigai/520640.html Maxwell→Pascalもプロセスルールは28nmから16nmと進化したが基本アーキテクチャでは大幅な変更はない FinFETとクリティカルパス潰してで高クロック化を達成した > クリティカルパスの解明が進んでいるMaxwellアーキテクチャを継承することで、パス最適化がより短時間で済む点。 ttps://pc.watch.impress.co.jp/docs/column/kaigai/757916.html この点から見ればGCNの名残を引き継いでるRDNAならさらなる最適化も可能だし、プロセスルールの最適化でより多くの恩恵を受けられる それこそAmpereのようにレイトレユニットを並列実行させるにはパイプラインを刷新する必要があるだろうが https://twitter.com/olrak29_/status/1419702500945371150?s=21 RDNA3はWGP内のシェーダコアが256に増えるようだけど 従来までのCUデザインを踏襲した形で4CUを束ねてWGPとするのか、それともCU内部のシェーダコアを128まで増やして2CUで束ねてWGPとするのか 前者はRDNAやGCNとの互換性を意識した設計、後者だとNvidiaのSMX(Wave32 x4)に似てよりグラフィックス特化の設計になる それとも1CUにシェーダコアが32基で8CU束ねてWGPとするのか https://twitter.com/5chan_nel (5ch newer account) 改めて調べてみるとCUそのものを廃止して、WGPが最小単位になる話も出てきたな 1WGPに256シェーダコア、8つのwave32を1サイクルで処理する方式 暗号資産(仮想通貨)価格が元に戻ったんだとよ 勘弁してください RDNA3まで持つんだろうか・・・ 負けてるのにシュリンクとかいう舐めプらしいし、的見たくラブレスに止め刺されそう 何が持つのか知らんけど、RDNA3はラブレスとやらに圧勝らしいぞ ホッパーが直ぐに出るそうだからラブレスが死産で味方に止め刺されるだけっぽい ada lovelaceはAmpereアーキテクチャを基にしてるなら 144基(18432sp)あるSM内のALUの振り分けは 9216sp FP専用 9216sp INT + FP兼用 RDNA3 Navi31 240cu(15360sp) RDNA3 Navi32 160cu(10240sp) FP専用_ALU比率 Lovelace:Navi31:Navi32 1:1.11:1.66 ※3090:6900 1:0.95 おそらくLovelaceの144基SM版はNavi32と同程度だろうな 「とどめを刺す」って何度も言われてきたけど、CPUの売り上げが強い今ではRadeonにとどめは無理だろ。 Ampereだって「Radeonにとどめを刺す」って言われてたけど、現実は違ったしな。 多少性能が劣っててもマイニングブームが終わるまでは売れ続けるだろう ゲフォもラデも一長一短あるからね ゲフォはレイトレが上で、高画質なDLSSもあるけどRTX限定 ラデはレイトレが劣るけどラスタライズは上(4kは劣る)、FSRはDLSSに劣る画質だけどあらゆるGPUとゲーム環境で簡単に対応可能 IntelのXeは来年発売でRDNA2やアンペア対抗だけど、その直後にRDNA3やラブレスが登場するから競争力は微妙 PS5のAPUが市販化 第一世代のレイトレGPUの性能が気になるな ttps://www.coelacanth-dream.com/posts/2021/09/15/amd-cyan_skilfish-clock-and-core/ >>92 全然違う Intelのxe計画はAMD、nvidiaのラウンドデー勝負してない IntelのxeはAMD、nvを超える超大量生産前提だから、市場を独占する可能性がある 元からd gpuって量産しないから原価割高な上、分業工程多すぎで、価格調整ない上に供給少ないから暴利市場だった 基本的に年産100万を超えるのはAPU用とローエンドのmxシリーズやgtx1030だとかで、量産しまくった1060がマイニング特需時代に年産100万枚もなかった その上ラインナップ多くて量産渋るからコストが跳ね上がる ところがIntel xeシリーズは超超過的な量産を計画していて ・ラインナップは少なく1000/2000/3000/4000コアの4モデルだけ ・メインはおそらく1000と4000と4000の事故製品の少量生産の2000/3000品の実質2モデル中心の量産 ・1000sp品はノート用CPUとバンドルを計画してれば年産100-200万以上の量産になり、原価を相当抑えられるから価格勝負次第で500万レベルの量産が効く、それだけ作ればさらに安くなる ・4000sp品は従来他社はこの手の製品は10-20万ロットでしかオーダーしないが、Intelは mcmー8セル鯖用GPUなどを計画してるため100-200万ロットの量産になる可能性があり価格破壊が来る 総じて他社は少量生産でしかGPUを作ってないのに、Intelは現在のGPU需要規模の量産=価格破壊をしかけて 「価格破壊で新規を増やして新独占市場を作る」くらいの量産計画を持ってるっぽい、これやられたら他社は負けるよ 例えばIntel xe1000sp品で例えれば AMD、nvであればこの種のローエンドを作ろうとしたら100mm2で Applem1の価格をベースみ120-150%高いねだんと見れば石の原価は1万弱になる Intel xeの1000spは64mm2で原価を60%抑えられるので、AMD価格級でも50-60ドルの原価になり、Apple級の量産できれば原価は30-40ドルにセーブできる AMDが1000spローエンドを作ろうとしたら原価100ドル以上でノートで売るならOEM価格130-150ドルはする Intelは1000sp 64mm2を量産35ドル+メモリで10ドルの原価50-60ドルで作って80ドルでOEM供給すれば、受注台数はローエンドシェア数年分単位の200-300万枚くらいの受注を貰えて CPUとセットで150ドルで販売よかでき、市価で499-599ドルゲーミングノートな価格破壊ができる 価 ヒット+価格破壊がくれば新規を呼び込めるので、ノートPCメーカーは1-2年分まとめて仕入れてもヒットと新規開拓で半年で商品を売り切れる 年間需要1-2年分のGPUを売ったIntelは、在庫が半年できえて新たに量産できる ようはd GPUが非量産→割高→ニッチ市場なのをIntelが量産激安やればいくらでも新規開拓で受注をふやせるだろうと xe GPUは量産で安くすれば、d GPU市場自体を拡大できる だから量産戦略強みのIntelで割高市場で量産価格破壊したら、nvとAMDは顧客維持しても負ける 負けるというかいまのGPU市場が一般ユーザー減少のマイニング暴騰で消費者数激減で詰んでる市場なんだよ またIntel xeは4000sp品をmcmで2から8個搭載でハイエンドに挑み ハイエンドも量産出やすくする。すると割高で供給不足のAMD、nvは勝負にならないんだよ これがIntel戦略であって、わかりきった戦略であり、量産傾向も十分あり、量産で価格破壊容易なのもわかりきってる これでAMD、nvは勝負できず負ける いまAMDとIntelはラインすら抑えきれなくて、ろくに量産できない Intelも委託だからコストはそれぞれイーブン さらに最適化で後発だからしんどい rdna3をだしてもこんなもんだよ 1000sp APU兼用品 原価80ドルで量産数100-150万枚 4000spミドル 量産10万枚で原価300ドル石のみ 鯖用mcmビッグコア 量産数万枚で8000-16000コアでコア価格700ドル-1500ドル 加工前のコア価格でここまで価格供給少ない Intel xe1000sp GPU 抱き合わせ用で100-200万枚作った後に自社で年産500-1000万枚狙い、原価はAMD価格で50ドル、量産すれば35ドル 4000sp品はコアが小さいので200ドル、自社量産すれば150ドル mcm版は2コア8000spで400ドル、8コア32000spで1500ドル 大量量産作戦と小売価格調整やればここまでできる。やろうと思えば市価は Intel xe1000sp OEMでCPUセットで150-200ドル デスクトップxe1000spで市価150ドル デスクトップ4000spで市価3-4万円台 mcm2コア8000spで市価10万くらい mcm32000コアが GPU原価1200ドル+加工セットで原価2500ドル以内、OEM価格で4000ドル、一般販売で50-59万+税 これくらいの価格勝負できるわけですな そしたら些細な性能差は新規開拓ユーザーにはイミフだから圧勝できる スマホのベンチ性能と同じで、あんなんはライトにはわからないから、95%のライトはローエンドしか買わない >Apple級の量産できれば ビデオカードでApple級の量産なんてできるわけないだろ… dGPU大量消費するユーザーがいねえわな。ノートに入れるとしても大半のユーザーはIGPU求めるだろうし。 さて、MI200がリークされたわけだが matrix engineの正体はなんなんだろ >>101 どうやって演算性能を上げてるんだろうかという話ね 第一世代のそれと違ってほぼ完成形だろうし >>102 ネイティブFP64の対応とレジスタの統合で性能上げてる 調べればでてくるぞ AMD Navi 31 enthusiast MCM GPU based on RDNA3 architecture has reportedly been taped out https://videocardz.com/newz/amd-navi-31-enthusiast-mcm-gpu-based-on-rdna3-architecture-has-reportedly-been-taped-out Navi31のテープアウトが完了した模様。 と言うことは、RX7000系(仮)は来年の今頃にリリースとなる算段。 概ねNavi21と同じように、7800・7800XTが11月下旬に発売となる流れになりそう。 >>105 Greymon55はNAVI33が2022Q4でNAVI31が2023Q1とか言ってるけどな 5nmより6nmのほうが早く量産出荷できるんだろう iPhone 14(仮)用プロセッサ、3nmプロセス製造は無理?TSMCが技術的に苦戦しているとの噂 ttps://japanese.engadget.com/iphone-14-unlikely-052036868.html Appleちゃんどいて!Zen4ちゃん作れない! 3nmじゃないとCPU 40コア、GPU 128コアのM3X作れないんじゃないの? Zen4がM1のIPCを上回らない事が判明したから、A16ベースのM3ならクロック次第ではZen3 EPYCの64コアを上回るな AMD Instinct MI200を初公開? https://videocardz.com/newz/amd-ceo-lisa-su-teases-instinct-mi200-mcm-accelerator ”Instinct MI200は、データセンターで使用されるアルゴリズムを高速化するために設計されたGPGPUです。2つのコンピュートダイを搭載した初のマルチチップモジュール型GPUとなります。Instinct MI250X」は、110個のコンピュートユニットと、最大128GBのHBM2eメモリを搭載します。 OAM(OCP Accelerator Module)コネクタを採用していることが確認されているため、MI200シリーズのGPGPUであることは間違いありません。現在のInstinctシリーズは、PCI-Expressフォームファクターでのみ提供されています。ティーザー画像に追加されたEPYC CPUについては、Zen3ベースのEPYC CPUをアップデートして3D V-Cacheを搭載した「Milan-X」の可能性があります。この画像から結論付けられるのは、Zen4 "Genoa" SP5パッケージとは似ても似つかないことと、8チャネルのメモリをサポートしていることです。” ( www.DeepL.com/Translator(無料版)で翻訳しました。) RX6400は補助なしらしいじゃん。 ちょっと期待しちゃうぜ。 RTX1650より性能上だといいが。 AMDが2.5D/3Dパッケージング技術で先行。 大容量L3のMilan-Xと競合を圧倒するInstinct MI200の秘密 https://pc.watch.impress.co.jp/docs/column/ubiq/1365035.html NVIDIA A100の倍精度浮動小数点演算(FP64)のスループットである 9.7TFLOPSと比較して、 約4.9倍となる47.9TFLOPSを実現しているのが最大の特徴となる。 前モデルのMI100は税別130万円なり 今年は倍の値段かなw navi31もお値段とTDPが凄そうだな 4kレイトレの性能不足は一気に解消されるかもしれんが 業界初のマルチダイGPUとなるRadeon Instinct MI200の見事な構成 AMD GPUロードマップ https://ascii.jp/elem/000/004/076/4076331/?rss 一部の処理をまたWave32で実行するようになったみたいだな Wave64より性能が良いとかで RDNAアーキテクチャは最適化の幅が広い MCMはミドルやミニサイズのGPUを複数接続するものだと思ってたけど、MI200は760mm2くらいのハイエンドダイをくっつけてるのを見ると、GPUは下手に分割するよりモノリシックのほうが効率は良いんだろうな RDNAほどじゃなくても CDNAでもダイ間通信がないわけじゃないから 現時点ではGPUはモノリシックに近いほうが有利 NVIDIA GH100 Hopper Flagship GPU To Measure About 1000mm2 Making It The Largest GPU Ever Made https://wccftech.com/nvidia-gh100-hopper-flagship-gpu-to-measure-about-1000mm2-making-it-the-largest-gpu-ever-made/ nVidiaのHopperだが、MCMと言われていたけれどモノリシックダイになるとか。 RadeonではMCM化と言われつつも、X2は内部CFに止まっていたのを知っているから、どうするのかと思っていたが nVidiaもMCM化で躓いたくさいニュース。 1000mm2のダイサイズとか消費電力1000Wとか、ヤケクソ気味の製品になりそうだが それもまたnVidiaらしいといえば、らしい無茶をしてきてる。 AMD RDNA3は5nmノードと6nmノードのハイブリッドであることが確認された https://videocardz.com/newz/amd-engineer-confirms-radeon-7000-rdna3-navi-3x-gpus-use-5nm-and-6nm-nodes AMDのInfinity Data Fabricシリコン設計エンジニアが、Linkedinのプロフィールを通じて、次世代Navi 3Xアーキテクチャが5nmと6nmのノードを利用することを確認した。 >>126 インフィニティキャッシュ(+3D-Vcache)特盛でダイ間通信自体減らすつもりかな? >>125 レチクルは26mm*33mmまで 46225mm2のAIチップをセレブラス・システムズが出してるが あれは複数のレチクル間をファンアウトで配線するInFO_SoW もし1000mm2チップというならレチクルに収まらないから同様で レチクル単位のダイシングがなく1枚板だからモノリシックということでは? 実質的には複数のチップでMCMよりも高密度に統合した形態 https://ascii.jp/elem/000/004/082/4082662/3/ 伝え聞いている&おそらく2.5D(というかこの構造だと使わないと爆熱) 予防線はりまくり(自信ないんだろな) GPUで求められるラインってこんなもの? SDG、内なる平穏 2スロット 1スロット、補助電源無し 1スロット、ロープロ、ファンレス ハイエンドAPU 映ればヨシッ >>121 RDNAの頃はRBがGCNと同じものだったからWave64でのピクセル書き出しのほうが わりと性能が出やすかったのかもしれんなあ 実際RDNAのWave64モードでもVega世代に比べてパフォーマンス自体はでるらしいし まだ本格的にWave32に対応する必要もなかったのかも RDNA2ではそこらへんの変更があったから段階的にもWave32対応が本格化したということかも RDNA3ではCU廃止でWGPに統一されるから 将来的にはCDNA以外ではWave64はなくなるかもね その分Wave32は非同期コンピュートとかに向いてないけどな Radeon VIIだとCU64基にそれぞれWave64を振り分けてたけど 6900の場合はDCU40基(CU80基換算)にWave32を振り分けるから 演算性能はともかく、VIIにくらべて単純な並列性は低下してる こうしてみるとRDNAはより単純な並列処理として CDNAはより複雑な非同期並列演算用として住みわけた理由もなんとなく解る wave32もNvidiaのWarp32に合わせただけで別にすごいもんでもないけどな PS5がいよいよ「可変リフレッシュレート」に対応! コマ落ちなどを最小化する「VRR」が今週中に実装 https://game.watch.impress.co.jp/docs/news/1405684.html PS5でVRRが正式対応。 PCでの利点の一つであるFreeSync対応と同等の機能が、PS5にももたらされることに。 Radeonも次世代にはHDMI2.1 VRRに対応して欲しいな >>139 ドライバー更新で対応予定と2年ほど前にツイート。いままではHDMI2.1 VRR対応のだいたいのモニターや TVはFreesyncにも対応してたので問題なかったけど、ファームアップデートでVRR対応したSonyのTVで Radeon RX6000だと効かないって言われてるね。 RDNA3でCDNAの行列演算には対応しないらしい WGPとSIMDの構成も変わらないっぽい? ttps://www.coelacanth-dream.com/posts/2022/04/28/llvm-gfx11/ ttps://www.coelacanth-dream.com/posts/2022/04/30/amd-gc_11_0_0/ ラデチョンの技術力がないだけ まともな日本人ならIntelゲフォド安定 >>142 まともな日本人はそういう言葉遣いしないよ 1CUでWave32 x4を1サイクル処理できるって話だな AMD EPYC + Instinct MI250X、 Top500 1位(初の Exa FLOPSマシン) Green500 1位(62GF/W越え) オメ。 結局Auroraは今回のTop500に間に合わなかったんだね。 ついにRDNA3で倍精度性能が1/32になる模様 まあ倍精度目的で一般向けGPU買う奴なんてもういないか ttps://www.coelacanth-dream.com/posts/2022/06/18/gfx11-dpfp-rate/ ゲームにそこまで必要かと、そこに技術計算している連中は便乗しているだけ >>149 動画編集とかRAW現像には影響出るのかな? Dual issue wave32の詳細 異なる命令を同時に発行できるから効率上がるけどコンパイラの負担がおおきくなるとか不穏なことふぁ書かれてる tps://www.coelacanth-dream.com/posts/2022/06/21/gfx11-vopd-instruction/ RDNA3でTensor Coreに近い命令をサポート ttps://www.coelacanth-dream.com/posts/2022/06/29/gfx11-wmma-inst/ TSMC値上げを受け入れるみたいだし、リサも粗利益率上げることを株主と約束しちゃった上に 円安がこれだから日本でどれだけ売れる要素があるのかね GP%うpはサーバー、GPUの構成比率上げるって事でしょ。 緑がウエハー減らしたいらしいから、その分ラデに回してくれれば解決や(適当 企業として動かれたらすぐだぞ 実名出るから気をつけろ tps://i.imgur.com/NMWdL3Y.jpg 他社に攻撃的なアムダーファンボーイたちすぐやらかしそう チームAMDに所属しているロシア人プロゲーマー氏、 世界最大のゲーム大会であるQuakecon2022(8月18日〜8月20日開催)から 米国財務省のポリシーに従い無事出場拒否される Intel Arc A380 GPU tested in 50 games, "compatibility better than expected for a newcomer" tps://videocardz.com/newz/intel-arc-a380-gpu-tested-in-50-games-compatibility-better-than-expected-for-a-newcomer Intelがんばってる Intel XeSS Shines In First Independent Tests, Better Than Native & More Comparable To NVIDIA's DLSS 2.3 Than AMD's FSR 2.0 tps://wccftech.com/intel-xess-shines-in-first-independent-tests-better-than-native-more-comparable-to-nvidia-dlss-2-3-than-amd-fsr-2-0/ アムド逝ったな AMD Already Has Next-Gen Ryzen "Phoenix" CPUs With Xilinx's AI Engine Running In The Labs ttps://wccftech.com/amd-already-has-next-gen-ryzen-phoenix-cpus-with-xilinx-ai-engine-running-in-labs/ RDNA4にはこれが載るんかな? ア ム ド 終 了 Intel、Arm、NVIDIA が AI を加速する新しい 8 ビット FP フォーマットを提案 ht tps://www.techpowerup.com/298881/intel-arm-and-nvidia-propose-a-new-8-bit-fp-format-to-accelerate-ai GeForceRTX4090 10/12 \298000/$1599=186 >>167 GraphcoreとAMDがQualcommのサポートを得てFP8 AI規格を提案(2022年07月05日) https://www.graphcore.ai/posts/graphcore-and-amd-propose-8-bit-fp-ai-standard-with-qualcomm-support 『AMDのコーポレートフェロー兼チーフGPUアーキテクトのMike Mantorは、次のように述べています。"この8ビット浮動小数点フォーマットにより、AMDは多くの種類のAIモデルに対して劇的に改善された学習および推論性能を提供することができます。業界標準の強力なサポーターとして、AMDはIEEEと共に8ビット浮動小数点表記法の新しい標準として採用するよう提唱しています。"』 7000シリーズにはMLアクセラレーション機能は入らるの? AI戦争もAMDの勝利になるのか >>170 AMD Already Has Next-Gen Ryzen “Phoenix” CPUs With Xilinx’s AI Engine Running In The Labs https://wccftech.com/amd-already-has-next-gen-ryzen-phoenix-cpus-with-xilinx-ai-engine-running-in-labs/ AMD Phoenix Point "Ryzen 7040" Series Mobility CPUs L0ベクタキャッシュと GL1データキャッシュが増やされる RDNA 3/GFX11 APU https://www.coelacanth-dream.com/posts/2022/09/02/gfx11-l0c-gl1c/ APUだがRDNA3では、L0キャッシュ(16KB/1CU)とL1キャッシュ(128KB/5WGP)が倍増するみたいね。 32bitあたり16MBのIFキャッシュが、Navi21の128MBから(同じ256bitGDDR6の)Navi32では64MBに減る代わりに 上流のキャッシュが強化されることで、メモリ負荷が下がる、ってことみたいね。 dGPUではL2キャッシュも増えれば、IFキャッシュが半分でも十分な性能が出ることは考えられるね。 L2キャッシュが強化されるかどうかはまだ分からないけれど。 WGPの規模がデカくなるからL0L1増強は既定路線かもな あとはベクタレジスタも増やしてるらしい L3は3D(16MB)とノン3D(8MB)で分かれるらしいから減ったというよりは選択肢が増えたというだけかも 米AMDは10月6日(現地時間)、2022年第3四半期(7月〜9月期)の決算速報(暫定値)を発表した。第3四半期はクライアント市場向けの収益が低迷し、売上高は約56億ドルと、当初予測していた67億ドル(±2億ドル)を大幅に下回ったという。 AMDはこれまでガイダンスでは、収益が前年比約55%増になると予測していたが、クライアントPC市場が予想よりも低迷し、PCサプライチェーン全体で大幅な在庫調整が行なわれたため、前年比29%増に留まった。総利益率も予想を下回っている。 クライアントPCセグメントだけ抜き出してみると、売上高は直前期比で-53%、前年比で-40%と大幅に縮小した。 それでも全体として増収となったのはデータセンター、ゲーム、組み込み向けセグメントの収益が大幅に増加したためだとしている。 もっとも、同社はRyzen 7000シリーズを投入したばかりのため、実際に動きを見せる来期の決算は要注目だろう。なお、AMDは11月1日に開催予定の株主総会で確定後の第3四半期決算を発表する見込み。 tps://pc.watch.impress.co.jp/docs/news/1445795.html 5 2022/10/07(金) 14:20:05.50 ID:ptDt+Ec10 1-2万円で買えないAMDのCPUとかまじで存在価値ないだろ 10 2022/10/07(金) 14:21:33.45 ID:8HB9/x3K0 Ryzen 7000なんて一番ショボいので5万円〜だからな。 11 sage 2022/10/07(金) 14:22:01.30 ID:PUNQdoy70 年初来で-54.84% tps://i.imgur.com/8Nt7EJx.png 12 2022/10/07(金) 14:22:14.82 ID:8HB9/x3K0 Core i3のコスパの高さよ 18 sage 2022/10/07(金) 14:24:01.73 ID:x2d7NxuF0 身の程知らずの末路… 64 sage 2022/10/07(金) 14:45:18.63 ID:k9sIghsW0 いつものAMDが戻ってきた 72 2022/10/07(金) 14:48:49.98 ID:jxcy7H++0 AMDの分際で調子に乗りやがって 136 2022/10/07(金) 15:58:12.27 ID:rTmIrwm30 アスペおじ達がこぞって褒めだしたRyzen爆死www 142 sage 2022/10/07(金) 16:10:40.34 ID:eTTnculZ0 よりによって今夜は米国雇用統計が発表される日なんだぜ これヘタしたら株価が奈落の底へ行くヤーツ Intelの次世代GPU「Arc Battlemage」は、Alchemistが現段階であった性能よりも「大幅に改善」されています。 tps://g-pc.info/archives/27629/ 価格.com 1位 13900K 3位 13600K 6位 13700K 18位 7950X 24位 7700X 31位 7900X 34位 7600X 順位を上げたRaptorと さらに順位が落ちたZen4 アマゾン 1位 13900K ... 78位 7600X えっ? ホラデオンも性能悪いからVRAM増量でお茶を濁して終わりだし まともな日本人ならIntelゲフォ一択やね tps://3dnews.ru/1076198/obzor-nvidia-geforce-rtx-4090/page-6.html GPUを使ったBlenderやビデオのエンコード/デコードの速度比較 Radeonがすごく弱い 使いたいソフトなAMDで速いか遅いか?違うだろ AMDで速い使い方をするだけだ ソフトウェアのためのAMDじゃない、AMDのためのソフトウェアだ FXが出た時はAMDユーザーは揃ってIntelで速い仕事から、FXで速い職業(プロWinZip社員等)に転職したのを忘れたか ★★★信者に何回も買わせるAMDパーツ商法の手口★★★ ご祝儀価格で販売 ↓ セット割で不人気モデルを抱き合わせ販売 ← AM5はイマココ! ↓ 不人気モデルを単品特価販売 ↓ 余剰品を特価販売 ↓ 価格を上げ下げしてリアクションバイト誘引(おまいら全員ダボハゼ扱いw) ↓ 最終処分セール ← AM4はイマココ! ttps://ascii.jp/elem/000/004/111/4111687/ ttps://www.4gamer.net/games/660/G066019/20221104001/ ttps://pc.watch.impress.co.jp/docs/news/1452983.html ttps://news.mynavi.jp/article/20221104-2503878/ Navi31こと7900系が出たけれど、Navi31はCU120がフルサイズじゃないかって思う。 シェーダーエンジンは、10CU/5WGPにL1とROPのシェーダーアレイが2個だが https://www.amd.com/system/files/styles/992px/private/2022-10/1678052-amd-rdna3-chip-diagram-compute-1260x709_0.jpg?itok=UsiFyXDw ↑のイメージ図ではシェーダーエンジン毎に8WGPで描かれているけど、変更点が多数あるとは言えシェーダーエンジンの構造まで変わってるとは思えないので CU96がフルサイズではないと思うし、各シェーダーエンジンで4CU/2WGPが無効化されていても不思議じゃ無い。 歩留まり対策と競合や消費電力などを考えてのことだろうけれど、仮にCU120で出してきていたら3Dキャッシュ無しだと性能出なかったり 消費電力も400Wを越えてきそうではあるので、CU96で出したのは妥当と言えるかもしれないけれど 仮にリフレッシュで7950XTXとして3DキャッシュとフルスペックのCU120で出したとするなら、7900XTXから25%は性能上がるし 下手するとRTX5080が比較対象になり得るぐらいにはなるかも。 7900XTXがハイエンドだと思ったら実はCore i5でしたw ってことか さすがに2割も無効化するのはありえないのでは ワッパ的にもCU数を削るより増やしてクロックを抑えたほうが高効率になるでしょ >>186 その辺は総合的に考えて、だろうと思う。 無理なく出せるのが、7900XT/XTXだったのかも。 それと3Dキャッシュ載せるのは、メモリ帯域が倍増するのと同じ事になるけれど VIIのように、CU数そのままでメモリ帯域倍になっても大して性能向上しないので、そこからの逆算から決めた部分もあると思う。 逆にNavi32は3Dキャッシュを使わないので、無効化はそれほどじゃないと思う。 RDNA系のシェーダーエンジンの構造(1SE=2SA=10WGP=20CU)は、変わらないだろうから 40CUづつで区切るのが丁度いいのは確かで、Navi31がCU120、Navi32がCU80、Navi33がCU40ってのが予想。 RDNA3ではIPCが倍らしいので、Navi33はRDNA2換算だとCU80相当ってことになる。 ただまぁ、Navi31に関しては本当にCU96がフルサイズの可能性もある。 Navi31のブロック図がリークしてたけど、1SE=2SA=8WGP=16CUで間違いないと思うよ トータルで6SE=48WGP=96CU RDNA1、2のシェーダエンジンの数は統一されてたけど、構成自体はSAあたりRDNA(Navi10)の3:2(メイン:サブ)、RDNA2の5(メインアレイのみ)と異なってる 配線的に考えれば5という数字よりも、2の冪乗の値で考えたほうがいいと思うし、SE当たり16CU配置の方がスマート Navi31ブロック図 https://videocardz.com/newz/alleged-amd-navi-31-gpu-block-diagram-leaks-out Navi31ダイレイアウトイメージ https://twitter.com/locuza_/status/1589659433990512641?s=46&t=Qnocyi2xgXIMNu6k8CaQJg https://twitter.com/5chan_nel (5ch newer account) >>188 情報少ない時点で、5WGP単位が4WGP単位になったことに疑問を持っただけだから。 ただ、こうなると(奇しくもVega10と同じ)Navi32はCU64がフルチップになりそうだね。 それでもGDNA2換算でCU128相当だから、クロック次第だが6900XTの50%増しのスペックだけど。 Intel Arc A770 AV1 のパフォーマンスは、4K および 8K 解像度で NVIDIA RTX 4090 よりも優れた結果を示した tps://www.capframex.com/tests/AV1%20Video%20Decoding%20on%20Intel%20Arc%20A770 8Kでは、IntelのArc A770は平均60FPSで滑らかな再生を実現し、0.2%のケースで44FPSに低下。 これに対し、NVIDIAのGPUは56.8~57.6FPSを記録し、16.7FPSまで落ちる場合もあり、見ていて不快にレベルだった。 NVIDIAのAD102とGA102の結果が近いことを考えると、NVIDIAの現在のドライバとGoogle ChromeがNVIDIAの最新のNVDECハードウェアを活用できているのか(GA102と比較して、AD102について、NVIDIAがハードウェアをアップデートしたのか)、ということが問題になりそうだ。 AMDのRadeon RX 6800 XTでは、8K動画はフレームレートの低下やスタッタリングに悩まされ、「見るに耐えない」ものだった。 総じて、Intelは8Kでも業界トップクラスの動画再生サポートを実現している。 まともな一般人ならIntelゲフォ一択やね twitter.com/doteya/status/1591038384012931072 Affinity Photo V2でベンチマーク実行。Radeon RX6800はGeForce GTX1070に比べてラスターは1/7、結合でも1/3の性能しかない。体感でGeForceの方がなめらかというのも明らか。 ほんと、@amd @amdjapan は、クリエイティブ系ツールや動画エンコード系で、NVidiaやIntelの後塵を拝したまま、一向に差が詰まらないどころか差を広げられているな・・・ https://twitter.com/5chan_nel (5ch newer account) アムドファンボーイによると、アムドが高いのは円安のためで、Intel、NVIDIA、Appleといった極悪企業と違い、アムドは良心的な企業なので即日価格を反映させるとのこと 円高で即日価格反映、楽しみだなぁ 早くゲームボーイ向けの7600Xが売れるのを見たいなぁ 代理店のせいだからアムドゎゎるくなぃ、、、は通用しないよ 770値下げあくしろよ 5万切ったらエンコ用に買ってやる RDNA3に関する技術的続報。 RDNA 3 / Radeon RX 7000シリーズ Deep Dive - 新情報を基に内部構造と性能を解剖してみる https://news.livedoor.com/article/detail/23199696/ 大幅にダイサイズを縮小できたRDNA 3のチップレット構造 AMD GPUロードマップ https://ascii.jp/elem/000/004/112/4112875/ この辺から考えると、RDNA1/2ではCUあたり2つのスカラユニットが1つだけ動いていたのに対して RDNA3では2つのスカラユニットが同時に動けるようになったって印象。 64あるSPを処理するのに、GCNでSIMD16*4クロック、RDNA1/2でSIMD32*2クロックだったのが それがRDNA3ではSIMD32の2並列で1クロックになったので、RDNA2比で倍の処理能力になった。 スカラユニットが1つしか動いていなかったのは、キャッシュが足りない(ために無理に動かすとストールする)からと思っていたけど RDNA3ではL0/L1が倍増しているので、原因はトランジスタコストだったと思われる。 配線もえげつないことになってるらしいが。 あと、面白いことに300mm2を越えると歩留まりが悪化すると言ってること。 それを考えるとnVidiaは相変わらず無茶してるなぁ、と思う。 まぁ、それがnVidiaの通常運転だけど。 RDNA3のキャッシュ強化 https://ascii.jp/img/2022/11/21/3453003/o/864defbbd65100d5.jpg AMDが公称してるレイトレの性能向上率1.5倍も、概ねキャッシュ強化分で説明出来そうな雰囲気ではある。 何というか、ぱっと見の印象はRADEON版Ampereって感じの強化になってる。 NVのようなゴタゴタや早くなったのか分からんのと違って着実にやってほしいね レイトレ1.5倍は単にラスタライズ性能アップと一致してるだけで、特別なものは無いね Navi21→Navi31で色んな性能が1.5倍くらいになるように調整されてる Nzvi32とNavi33に関するニュース AMD Confirms Max CU Count of RDNA 3 GPUs: Navi 32 Maxes Out at 60 (7680), Navi 33 Maxes Out at 32 (4096) https://wccftech.com/amd-confirms-max-rdna-3-gpu-cu-count-navi-32-maxes-out-at-60-navi-33-maxes-out-at-32/ Navi32はCU60、Navi33はCU32だそうだが、Navi32の方は一部無効化してるくさい数字。 SEの構成考えると、1SA=5WGPであれば3SEでCU60になるけれど メモリが256bitだったら4SEの方が自然だし、その場合はWGP2基/CU4基を無効化すると、この数字になる。 Navi32はPS5Proを考慮したチップであれば、面白いのだけど。 PS4Proは4K対応というコンセプトあったからそれに合わせた設計にしてたけど、PS5Proは何にするのか? 無闇に性能だけ上げてもコストが上がるだけだからな そらもちろんソニーと共同開発のAMDレイスクーラーPro搭載よ ソニーの開発は最近目立ってるからなんか出してきそうよね SonyはまだしもSIEはCELL以降は尖った製品出してないでしょ PS4もPS5もかなり堅実的なスペック構成 堅実すぎてCELLの時みたいに性能ハッタリ噛ませないのが痛い PS4はまだしも、性能が把握出来ちゃってPS5は競合に性能負けてるのが誰でも分かっちゃうから夢が無い 競合に比べて単なる劣化ハード もしくはその資金でGPU買ってPCでやればいいかにしか世間の認識がないのでPSブランド崩壊間近なのも痛い PS云々以前の問題だったRDNA3・・・。何で前世代でキャッシュで差が縮まったのにわざわざ減らすのかね >>208 とは言え、言うほど悪くは無い。 対4080はラスタライズなら競合と言える性能は確保してるし 今後のドライバ更新での伸びしろ考えれば、順当な出来ではある。 >>208 >>209 ほんまそれ128MBのままなら確実に4080を抜き去ってた 384-bitのVRAM帯域を得てもInfinity cache(L3)を96MBに減らすのなら L2を96MB持つ4000シリーズには勝てないのは明白なんだよな ましてや256-bitとRDNA3換算で4864sp(9728sp/2)しか持たないRTX4080に レイトレは言うに及ばず、ラスタライズ性能で勝ったり負けたりと互角の勝負をしている時点で トータルキャッシュ容量が同じでVRAMへのアクセスも同回数になると考えると L3より速い帯域とレイテンシを持つL2が多い4000アーキテクチャの方が速くなるのは自明の理 Radeonの開発者馬鹿なのかな ぶっちゃけキャッシュの方がコスパいいよね?何で減らしたんだか キャッシュはMCD内にあるんやから6や5の倍数やろ 何で減らしたかは予想は付く 2年ごとのGPU開発、2年前はマイニングが流行ってた マイニングにはメモリ帯域とメモリ容量がいる NもAも当時マイニングが寂れる未来なんて予測はつかないが Nはもし寂れた場合の予防策として256bit+大量L2のゲーミング向けGPU4080をラインナップに組み入れた 4090は既存路線の延長線上での384bitのメモリバスを備え大量のCUDAコアと合わせてゲーミングにもマイニングにも対応できる従来通りのフラグシップとして構築した 4080がNにしては意外なほどマイニングを捨てたゲーミングGPU 逆にAは予防策を講じずマイニング前提で全GPUを構築していったのでは マイニングバブルの恩恵を次は全面的に受けようとメモリ拡充に移行していったのではないのかと VRAMを第一にしたらその結果がコストなのか知らないけど、キャッシュMCDを2階層にしないで1階層のままコスト削ったってのがあるんでは IFキャッシュの容量を減らしたのって、コストと消費電力って事だが。 GDCとMCDとの配線に数千の配線が必要だから、単純な容量増加だと更に大変だし 消費電力増大も言ってるあたり、増えた配線が色々な意味でネックだったんだろ。 その分、L0・L1が容量2倍・速度1.5倍に強化されてRDAN2換算なら3倍相当だし IFキャッシュの帯域自体も2倍以上に増えてるので、RDNA2換算だと200MB相当ぐらいになる。 あと、Polaris・Vegaで第1次マイニングバブルを経験しているのだから、第2次マイニングバブルでも終了時期を考慮するのは当たり前で マイニング云々なんて思いつくのは、nVidiaが強欲すぎてAmpere作りすぎただけの話に影響されてる。 もう切り離す物がなければコア数の殴り合いしかないんだよね >>216 キャッシュ帯域とキャッシュ容量を混同してはいけない 容量自体は減っている、その分のアクセスはVRAM経由になる VRAMレイテンシ自体に改善が無いんだから遅いVRAMに今までより余計にアクセスさせてどうする MCDの実装に困難があったのは事実だろう ただそれを理由にinfinity cacheを削減してまで 384bitと大量のVRAMが実装されている事の説明にはならない 何故ならその為に帯域384bitにすれば VRAMへのアクセス頻度は増加し消費電力の悪化を招くのは自明 GDDR6とinfinity cacheの消費電力差なら AMD自身が出してる白書で6倍差がある事を明言しているのだから infinity cacheの削減がコストカットの理由なら まずはそのVRAM実装をどうにかしVRAMありきの設計から 今までと同様のinfinity cacheありきへ回帰するべきだ 電気がIntelファンだからAMD製品に不要な電流を流そうとしているようだな 「わーいアナログ回路作り放題だー」とか勘違いしてハッスルしまくっただけだったりして?w >>219 キャッシュの性能は容量×速度だよ。 極端な話、容量半分でも速度4倍なら差し引き2倍の性能ってこと。 そう考えてるのはnVidiaだって同じ。 >ただそれを理由にinfinity cacheを削減してまで >384bitと大量のVRAMが実装されている事の説明にはならない なり得るだろ。 RDNA3に関してはAMDは、「配線の煩雑さ>メモリ帯域増加」と判断したってことだ。 https://ascii.jp/elem/000/004/112/4112875/2/ の配線の話読めば「VRAM実装の方がコストが安い」はあり得る話だろう。 CPUでは数百本だが、Navi31では数万本、「シリコンインターポーザーの対応能力を超えた」配線は そりゃ地獄みたいな話だろう。 なんだかよくわからんがAMD頑張ってくれ 次はRADEON買うぞ 配線数はGCDとMCDの間のバス幅=帯域に関連するものであって容量とは関係ないぞ。 どのみちアドレス線はVRAM容量の分必要でキャッシュにヒットすればMCDの中で帰ってくるだけだ。 >>224 関係あるだろ。 IFキャッシュの容量倍にするなら、配線も倍必要になる。 >>225 お前バカだろ。 4GBのDIMMと16GBのDIMMで配線数が4倍違うのかよ。 >>222 ワーキングセットがキャッシュの容量に収まらずに全然キャッシュ効果で出ない でもキャッシュを増やすと収まる なんてケースでは、そういう概算はまったく適用できない >>226 メモリだったら違わないけど、キャッシュの場合は速度と容量はバーター。 >>227 RDNA2と違ってダイの外側に出ている以上は、同じではダイ跨ぎのペナルティが大きいし AMDだってそこの検討した上で16MB*6と384bitGDDR6を選んだってことだろ。 MCD自体がそれほど大きく無いダイサイズで、16MBのキャッシュなら13mm2程度(7nmだと32MBあたり27mm2)だろうから それを32MBにしようと思えば、それほどダイコストはかからなかったとは推定出来るけど、そうしなかったのは ダイ跨ぎのペナルティを考えると、容量を少なくしてでも速度を優先しなければいけなかったってこと。 IFキャッシュがRDNA2と同じくオンダイだったら、その通りだとは思うが。 infinity cacheを96MBに減らしたから384bitでも4Kで伸びない 2K、2.5Kなら伸びるこれが全てを物語ってる 外に出したからーとか言い訳いらないから結果を見て語ってくれよ infinity cacheを減らしたのは悪手 単純にCU減らしたのが効いてるだけだと思うけどな。理想的に動けば性能2倍になるといっても実際にはそうもうまく行かずROPは並行処理が効くから数で押した方が性能が出ると。 西川善司の3DGE:Radeon RX 7900 XTX/XTは何が変わったのか。大幅な性能向上を遂げたNavi 31世代の秘密を探る https://www.4gamer.net/games/660/G066019/20221212087/ 丁度、何故IFキャッシュを減らしたのかを解説していた。 >たしかに容量は4分の3へと減ったが,L2キャッシュとL3キャッシュ(Infinity Cache)の帯域幅は2.25倍に増加しているので >我々の性能検証において必要十分な容量と判断した だそうで。 RDNA2のときの資料でInfinity Cache の4K gamingでのキャッシュ量96MBのときのHit率が53%、128MBのときのHit率が62%だったらしい 7900XTX/6950XTのキャッシュアクセス速度がそれぞれ5300/1960GB/s、メモリアクセスが960/576GB/sだから SRAMとGDDR6のレイテンシーを無視して転送速度だけで評価すると L3以降への平均アクセス速度は7900XTXは 0.53*5300+0.47*960=3260GB/s, 6950XTは 0.62*1960+0.38*576 = 1434GB/s で2倍以上にはなってるんやね https://pbs.twimg.com/media/E2rDmb1WEAE7GGf?format=jpg&name=large infinity cacheの速度が向上してメモリ帯域も増えてるから 減った32MB分以外の場面は確実に早くなってるわけで やっぱり容量減と性能がイマイチなのは関係無いと思う >>230 RDNA3 ISAドキュメント見たけどdual issueのいう名のVLIW2の制限キツすぎてシェーダコンパイラの最適化はかなりキツそうで2倍は無理で1.5倍も怪しいレベル 現状だとDual~の効果はゼロと言っても過言じゃない ほぼ半減してるFP稼働率を前世代の6割くらいにまで引き上げなきゃ話にならない CU数 FP数 clock flops 帯域 電力 性能 性能/flops 性能/電力 rx6900xt 100 100 100 100 100 100 100 100 100 rx7900xt 105 210 121 253 156 105 122 48 117 ↓ ↓ ↓ ↓ ↓ ↓ あるべき形 115 242 100 145 60 145 理想形 110 231 95. 150 65 158 単純に演算基増やす方が素直に性能上がるし、NvidiaのGPUも基本的にはその方針 なんならXSXはわざわざCU数増やした独自のカスタムRDNAを採用してるから MSはRDNAでも同じCUマシマシ路線が一番いいと考えてる 当のAMDもRDNA2では普通にCU数二倍にしてたからね けどAMDがNvidiaに追随してもシリコンコストが増えて、結果的にRadeonの価格が上がって、Radeonのウリがなくなる だからこそ今回のアーキテクチャがAMDの路線としてはあってたんだろうね ラスタライズ性能はシェーダエンジン増加とクロック数増加による固定機能の性能向上である程度確保できてるから、競合よりも低価格なGPUを提供して少しでもユーザーの関心を引きたかったというのが本音だろう その分、レイトレ性能は犠牲になったけど AMDの設計は全て正しい キャッシュがどうこういうやつはNVIDIA厨 急がば回れ、その点はIntelと同じ轍を踏んでいるなw地道に消費電力(発熱)を下げるノウハウを蓄積してきたから、ぶん回してもイケる。 switchにAMDが採用されてほしかったな。今後のマイナーチェンジや新型は分からんが Switchに載せるTDPまで落としたら、AMD SoCなんぞ魅力ないだろ 15Wとか、28Wなどの爆熱、高消費電力でまわしてこそx86なんだから とりあえず初代マルチチップ製品だしモノを出して次に活かそうってことじゃないの Zenも初代からそうやってきてるし製品化して見える部分もある、今世代も値段と性能に納得して買う奴は買うというだけ ツッコミどころってのは逆に今後の伸びしろでもあるしスレタイ的には歓迎 RDNA4も今回のマイチェンならあんま期待できんな NVは,もう天井に頭着いて身動きできない。訳の分からんバージョンアップはIntelのCoreシリーズと同じ。 AMDは、これからハイパワー(RDNA)と省電力と幅広くやっていくだろう。 もうNVは高消費電力を気にしないっしょ。Radeonも8pinx4でついて行くのかどうか。 >>245 >高消費電力を気にしないっしょ これをやってきたから限界が来たんだよ。高消費電力=高発熱 この物理法則には逆らえない。 がんばってファンを増やしたり、水冷したり・・・もうそれの限界が来たから、燃えたり、どこが性能アップしたの?みたいな製品が次々と生み出される。 AMDは、地道に低消費電力、電力制御をやってたノウハウがあるから、その分回せる余裕があるんだよ。 グランツーリスモ7制作の裏側。車1台に270日、サウンドにレイトレ活用 https://av.watch.impress.co.jp/docs/news/1465935.html グランツーリスモでレイトレが使われているって話。 前々スレあたりで、音声版レイトレの話をしたことがあったけど、まさにって感じの話題。 https://egg.5ch.net/test/read.cgi/jisaku/1571034539/338 >338 名前:Socket774 (ワッチョイ 2711-9rwV)[sage] 投稿日:2020/01/27(月) 15:18:02.67 ID:h6ogbj/b0 >PS5の場合、本命は3D音響であって、レイトレはその副産物って気はしてる。 >PS5のインタビューを読む限り、レイトレよりは3D音響に力を入れてるようだし。 >PS4ではTrueAudioが積まれていたように記憶してるし、原理的にはレイトレと大差なかったはず。 >要は3D音響が音声版レイトレであって、グラフィック効果としてのレイトレは、技術的には転用に過ぎないって可能性。 >もちろん、負荷はグラフィックの方がずっと重いけれど。 >実際の音を聞いて理解する「TrueAudio」。一部GPUとAPUに統合した新機能で,AMDは何を狙っているのか >https://www.4gamer.net/games/269/G026970/20140814077/ Oberon(PS5)のレイトレユニットは三角形の交差判定対応してないから、大雑把なボックス判定ならサウンドに使った方が効果的かもしれないな まともな日本人ならアムドとかよう買わへんからしゃーない🙄 >>251 サウンドに使った方が、ではなく 元々はサウンドに使うつもりで実装していたモノを、グラフィックにも転用してレイトレとして使うようになった、ってこと。 つまり、レイトレはPS5にとってはイレギュラーな使い方なんだろう。 >>253 Oberonのレイトレユニットが元はサウンド用だったと言うソースは? >>254 そんなもん、ソニー内部の人間でも無けりゃ出せるわけ無いだろ。 勝手なことって、まるで「nVidiaの許可を取ったんですか?」とでも言いたげだなw PS5では、3D音響はレイトレと違って最重要課題の一つで、どうすればいいかは初期から議論されてたらしいし ソニー自体、そっち方面には昔から力を入れてる企業。 GT7という割と初期のファーストから、そういう使い方をしたタイトルが出た、ってことと併せて 俯瞰すると、最初からそのつもりだったという状況証拠が揃ってるって話。 RTX Video Super Resolution使えるゲフォにするわ NVIDIA、Chrome及びEdgeブラウザでの動画再生を高画質化する「RTX Video Super Resolution」を発表 - RTX 3000シリーズ以降で対応 GeForce RTX 4000および3000シリーズGPUにおいて、来月からRTX Video Super Resolutionが有効になり、ChromeおよびEdgeブラウザで閲覧するあらゆるビデオコンテンツが、AIによるアップスケーリングで、より高画質で楽しめるようになるとのことだ。 これは、Wccftechが指摘するように、Netflixを主にPCで利用しているユーザーには福音となるかも知れない。 Netflixはプランによって画質が違うのだが、例えばベーシックプラン(720p出力)で契約しても、このRTX Video Super Resolutionを使ってChromeで視聴すれば、4Kに近い画質で楽しむことが出来る様になる可能性があるからだ。 youtu.be/XA-tQpQqD7U 不都合バグてんこ盛りの劣化パクリに金ドブ=安物買いの銭失い まともな一般時ならインテルゲフォ一択がまたまた証明されてしまった >>262 Nvidiaはどうでもいいが対抗してRADEONも乗せて欲しいなあ特にFluid Motion >>265 パクリ希望とかさすが反日シナチョンアムダー RTX買う金もねーのかよ? 働いてRTX買えや貧乏乞食ファンボーイ 貧乏だから、信者でもないし10万も20万も出して、買えないわ。せめて半額程度にしてほしい ファンボーイが乞食したって価値があるからそうゆう値段なんだよRTXは 黙って働いて買え、出来ないなら黙って消えろ >>265 対抗的なモノは割とすぐ出てくるでしょ。 例年、5月のドライバで新機能追加されるし。 ただ、どこまで本当かは知らないが、FluidMotionが外された経緯を考えると コンテンツホルダーからゴルァされそうな機能ではあるな。 さんざん物価高ニュースがあったのに先行き読めなかったの?w リファレンスデザインのサーマルソリューションに欠陥みつかる RX 7900 XTX 110度アッチッチ騒動で怒りのアム土人 videocardz.com/newz/thousands-of-amd-radeon-rx-7900-xtx-reference-cards-could-be-affected-by-110c-gpu-hotspot-issue RX 7900 XTX の機能的に制限されたベーパー チャンバーだけが、RMA が必要なほど本質的な問題です。これは、ホットスポット温度だけでなく、貯蔵タンクも 110 °C まで熱くなり、許容温度限界をはるかに超えて動作するためです。 ベイパーチャンバー() さすがアムド www.youtube.com/watch?v=rxaDZ6n2MNo ryzenやめとけ速報 AMD製プロセッサーに複数の深刻な脆弱性 ~Athlon、Ryzen、Threadripperなどに影響~ 専門家は直ちに使用の中止を警告! forest.watch.impress.co.jp/docs/news/1469386.html 即実害が発生する欠陥例 パート2 Radeon RX 6000シリーズの破損相次ぐ。 ★共通点は最新ドライバ★ 2023年1月11日 11:54 pc.watch.impress.co.jp/docs/news/1469275.html 説明によれば、約3週間で受け取ったRadeon RX 6800とRX 6900シリーズの故障カード計61枚のうち、48枚でGPUが破損しており、さらに共通の症状としてSOCレール、メモリレール、メモリコントローラレールがショートしている状態だったという。 また、各ユーザーに対して使用環境などを問い合わせたところ、用途や負荷などはばらばらだったが、唯一の共通点は2022年12月公開の最新ドライバ「Adrenalin 22.11.2」を適用していることだったという。 NVIDIA、Chrome及びEdgeブラウザでの動画再生を高画質化する「RTX Video Super Resolution」を発表 - RTX 3000シリーズ以降で対応 GeForce RTX 4000および3000シリーズGPUにおいて、来月からRTX Video Super Resolutionが有効になり、ChromeおよびEdgeブラウザで閲覧するあらゆるビデオコンテンツが、AIによるアップスケーリングで、より高画質で楽しめるようになるとのことだ。 これは、Wccftechが指摘するように、Netflixを主にPCで利用しているユーザーには福音となるかも知れない。 Netflixはプランによって画質が違うのだが、例えばベーシックプラン(720p出力)で契約しても、このRTX Video Super Resolutionを使ってChromeで視聴すれば、4Kに近い画質で楽しむことが出来る様になる可能性があるからだ。 youtu.be/XA-tQpQqD7U まともな一般人なら不都合バグてんこ盛りの劣化パクリはもうこりごり よいこのみんなインテルとDLSS3やRTX Video Super Resolutionも使えてSuper resolutionに対応、RTに強くAIお絵描きもできるRTXを選ぼう ここは既にRX 8000シリーズのためのスレになりました。 Windows Updateが勝手にドライバをバージョンアップするのを止めたい どうすればいいですか? DDU起動してオプションメニューの一番下の「”Windows"がデバイスのドライバーを検索したとき"Windows update" からドライバーをインストールしないようにする」にチェック入れたらええんちゃうの? 返金を求める被害者が降臨しだした もう隠しきれないだろうな 111 Socket774 (ワッチョイ aa56-Zpst [125.196.35.160]) sage ▼ New! 2023/01/11(水) 19:44:11.82 ID:Q1ZeEztj0 [1回目] むっちゃクラッシュして OSクリーンインストールしたのはやっぱりドライバのせいだったのか ハードウェアイカれてなければええけど オートディテクトのツールでインストールしたのに今見たら公式にリンクあるのに本体消えてるし? CPUもなんか脆弱性あるみたいだし 金返せこら ホラデオンはゲフォとArcに惨敗w DirectStorageのAMD、Intel、NVIDIAによるパフォーマンス比較テストの結果が公開 GPUのハードウェア側では、DirectStorage解凍アルゴリズムの取り扱いが異なるため、PCGHは、AMDのRadeon RX 7900 XT、IntelのArc A770、NVIDIAのGeForce RTX 4080という最新のGPUのうち、どれが実際のデータ解凍処理で優れているかを比較した。 それぞれのグラフィックボードとIntelのCore i9-12900KのCPUで処理を行っている。 PCIe 4.0 x4 (7.9GB/s) PCIe 3.0 x4 (3.9GB/s) SATA (0.6 GB/s) Radeon RX 7900 XT 14.6 GB/s 12.6 GB/s 1.47 GB/s Arc A770 16GB 16.8 GB/s 13.9 GB/s 1.64 GB/s GeForce RTX 4080 15.3 GB/s 12.7 GB/s 1.47 GB/s Core i9-12900K @ 5.20 GHz 5.2 GB/s 5.2 GB/s 1.47 GB/s やはり驚きなのは、どのGPUもCore i9-12900Kプロセッサーの2.4倍以上の解凍処理能力を持っていることだろう。 一方、GPUによるデータ解凍に関しては、IntelのArc A770がAMDのRadeon RX 7900 XTやNVIDIAのGeForce RTX 4080よりも顕著に優れていることがわかる。 A770は16.8GB/sのレートでアセットを転送/解凍できるのに対し、RX 7900 XTは14.6GB/sで3位(首位と13%差)である。 AMD、Intel、NVIDIAのいずれのGPUを使用した場合でも、PCGHによれば、実際のロード時間は5秒から0.5秒へと一桁短縮されているとのことで、GPU同士での差は実際には体感できるレベルではないようだ。 したがって、どのGPUを使用するかはあまり重要ではなく、DirectStorageを用いることで、いかにゲームパフォーマンスが向上するかが重要であり、これからリリースされるゲームにおいて、この機能が広く実装されることが期待される。 最初にこのDirectStorageを実装して発売されるのは、SQUARE ENIXのRPG「FORSPOKEN」だ。 texal.jp/2023/01/14/directstorage-performance-comparison-test-results-from-amd-intel-and-nvidia-released/ ビジネス向けCPUのセキュリティーに関するホワイトペーパーを紹介するページにて 世界初を世界発と書いてしまう こんなんじゃビジネスマンになれないぞ? www.amd.com/ja/technologies/pro-security >>284 前世代とは言え、Ampereを貶すのは止めて差し上げろ。 とは言え、144固定なら6700XTや3060よりも消費電力少ないので 合格点自体は取っているとは言える。 業界初のマルチダイGPUとなるRadeon Instinct MI200の見事な構成 AMD GPUロードマップ https://ascii.jp/elem/000/004/076/4076331/2/ 今更だけどCDNAの記事を読み返して思ったのだが、RDNA3のDualIssueWave32に似たような印象で 同じ設計思想をベースに、HPC向けとグラフィックス向けに作り分けている、と考えると CDNA系とRDNA系は分かれたとは言え、それほど離れてはいないのだろう。 GCNとCDNAは4つのSIMDユニットに1つのスケジューラという構成 各処理を1ユニットごと4サイクル掛けて4分の1ずつ実行することによって 処理発行はサイクルずらしで1つのスケジューラから4ユニットに対して行える RDNAは2つのSIMDユニットに2つのスケジューラという贅沢構成 処理の発行と実行を切れ目なく行うことでSIMDユニットの稼働率を高めた RDNA3は2つのSIMDユニットにそれぞれペアとなる機能限定SIMDを付け足した 処理発行は複合のVOPD命令としてソフトウェア側でまとめることでペア一括で行う やっぱりアムドのせいやんけ(笑) まともな日本人はインテルとRTXを選ぼう egg.5ch.net/test/read.cgi/jisaku/1673316070/880 880Socket774 (ワッチョイ ff56-Mn+U [125.196.35.160])2023/01/21(土) 17:26:32.98ID:HTO75GIC0 いや、お前ら忘れとるけど、ドライバが適切なものを自動で選んでくれるツールがWEBサイトからガチで消えたから Auto-Detect and Install File Size 40 MB Release Date 12/8/2022 これ 俺はこれ使っておかしくなった まともな日本人ならインテルとRTXで決まりやね egg.5ch.net/test/read.cgi/jisaku/1673840740/273 273>>86 です (ワッチョイ bf83-Jpma)2023/01/21(土) 22:20:40.79ID:3P53L7Lx0>>274 INTELとmacで不自由なく使えてたオーディオインターフェース、、B550チプセト、5900Xで組んだマシンだと某DTMソフトと相性悪くて詰んだわ USBカード差してもダメらしくてオーディオインターフェース新しく注文したわクソっ 某ソフトだけで起こってるしバージョンが10から11になっても解消されてないってやべえわ ほんまRyzenのUSB周りさあ・・・ www.motunation.com/forum/viewtopic.php?t=67355&;p=579157 これとかも www.reddit.com/r/ableton/comments/n4khag/comment/hu4w7sm/ 西川善司の3DGE:Primitive Shader対Mesh Shaderの真実。ジオメトリパイプライン戦争の内幕とAMDのゲーマー向けGPU戦略 https://www.4gamer.net/games/660/G066019/20230213083/ RickBergmanとDavidWangがGPU戦略の中心ってのも、ようやくATiがAMDとして本格始動したのを感じるな。 nVトロールは「Rajaが居なくなって、もうRadeonは終わり」なんて言ってたのも懐かしい話w PrimitiveShaderは破棄されたのでは無く、MeshShaderを動かすのに使われてる、だそう。 あとAMDはnVidiaのAI戦略を、「GPU中心の戦略をとらざるを得ないから」と解釈しているし AI技術を使わずとも、CPUで十分対応可能な用途は相当あるから、nVidiaの後追いはしないとも言ってるな。 AMDもCESでAIのフォーカスするって言ってたヤン >>291 推論はわざわざGPUでやらなくてもCPUで十分速いから >「FidelityFX」シリーズのひとつである「FidelityFX SuperResolution」(FSR)を見てほしい。推論アクセラレータを活用することなく実現したFSRのアンチエイリアス処理や超解像処理は,NVIDIAのDLSSに十分対抗しうる性能と品質をもたらせている。 >AI技術を用いずとも行える用途に対してまで,NVIDIAが積極的にAI技術を活用しようとするのは,NVIDIAがGPU内に大規模な推論アクセラレータを搭載してしまっているからだ。 AIエンジンはこれからデフォルトでついてくる intelはVersatile Processing Unit(VPU) amdはXDNA appleはNeural Engine GPUよりAI関連命令の実行速度も電力効率もよい >>295 だって今のAI活用は用意された複数の答えの中から最も近い答えを選んで提示してるだけだからそりゃ低消費電力で速い AI推論モデルは予め学習したパターンに基づいて推論してるだけで 何が凄いんだかって感じだけどな RDNA4は年明けくらい?7000はフルライン展開しない繋ぎか >>299 DeepL(機械翻訳)がそうらしい。第二のgoogleになる可能性がある。長年研究してきたことがAI技術で無になってしまったら怖いよな。 7800以下はQ2以降からとか言ってるけど、年明けに8900(仮)出るからハイとローは0.5世代ずつずれて50は無くなるのかな RDNA4作ってるって言うけど緑に比べポジ要素少ないなあ CPUの話は聞こえて来るけどGPUは周辺メーカーからすら話題が出て来ないな amdのGPUは本当にシェアないからな。intelに追いつかれたくらいだし nvidiaが強すぎるわ AMD動画系が停滞してクソる一方なのがなあ IntelでもQSVだけは評価されてる AMD RX 7600 Has Better Cache Latency Than the RX 7900 XTX https://www.tomshardware.com/news/rx-7600-sports-better-latency-compared-7900-xtx IFキャッシュのレイテンシに関して、MCMだと不利になる、って話。 Navi31はIFキャッシュ192MB案もあっただろうけど、MCM化に際してレイテンシ対策をしたら 容量増やせなくなった(が十分な性能は出ていた)と考えるべきだろう。 RDNA 3世代のミドルクラスGPU「Radeon RX 7600」性能速報。FHDでは競合のミドルクラスと戦えるがネックは価格か https://www.4gamer.net/games/660/G066019/20230522039/ ↑で、288GB/s+32MBのRX7600と320GB/st+80MBのRX6700の比較で RX7600は、キャッシュ容量とメモリ帯域で勝るRX6700とほぼ同等なので RDNA3世代のIFキャッシュは、RDNA2換算で倍程度の容量と同等で、Navi31のキャッシュ容量が足りないってことはなさそうな。 7000世代は実験失敗で6000世代と併売で良いから、せめて緑に遅れずに8000を 生成AI向けGPU「Instinct MI300X」の構造と性能を分析 AMD GPUロードマップ https://ascii.jp/elem/000/004/143/4143496/ https://ascii.jp/img/2023/07/02/3563399/o/9ce2ffaf84074cc3.png MI300が発表になったけれど、GDCが8個なのがMI300X、7個とZen4のCCDが3個がMI300A。 CCD3個とGDC2個が同じぐらいのサイズなので、GDC1個あたりは約100mm2となる。 Navi31がCU96で300mm2なので、CUは32ぐらいになる計算だけど、記事ではCU40となってる。 https://ascii.jp/img/2023/07/02/3563397/l/4bc115bb525caae3.png https://ascii.jp/img/2023/07/02/3563400/l/990306a634a528fe.png CDNA2ではNavi31と同じく平面での接続だけど、CDNA3では新たにIODの上にGDCを置いて それぞれのIODを接続してのMCMとなってる。 RDNA3のDualIssuieWAVE32は、CDNA2のMatrixユニットをもう一つのシェーダーユニットとして RDNAに転用してきた可能性考えると、次はIODの上にGDCを載せるMCMをしてくるのは考えられる。 まぁ6nmとはいえ、そんな大きなIODを用意するよりは、MCDを細長くして2個のGDCに跨がる形にするだろうけど。 RDNA4ハイやらないって、やっぱりCDNAのついでってポジションを強く出すのか。今でもハイエンドではないけどミドルだけとか ハイエンドコアは作らないけど ミドルのチップレットを複数載せたパッケージで ハイエンド製品出すって可能性は? まあどっちにせよまだ噂段階だが。 RDNA4のリークで、クロック上げた48CUのGCDダイのチップレット数で ハイエンド、ミドルレンジ、ローエンドと性能分けすると出ている Navi41 :GCD x 3= 144CU x 128sp x 3.5GHz x 2op = 129 TFlops(≒ 64.5 TFlops) RTX4090:16384CUDA x 2.52GHz x 2op = 82 TFlops(≒ 41 TFlops) 7900XTX:12288SP x 2.5GHz x 2op = 61 TFlops(≒ 30 TFlops) 7900XT :10752SP x 2.4 x 2op = 51 TFlops(≒ 25 TFlops) RTX4080:9728CUDA x 2.51 x 2op = 48 TFlops(≒ 24 TFlops) ※()内ゲーム時Flops CUまたはSM内に、Primary ALUとSecondary ALUとALUを2重化して 面積効率を最優先に配置する構造はいつ改めるんかね ゲームだとFPオンリーで動く機会はほとんど無いはず そうなると実際にはクロック差を考慮するとRDNA2には勝てているが、 同クロックで比較した際の他の命令のスループットはRDNA2に負けている 追加機構が生きてないのがRDNA3 ゲームに特化したGPUならCDNAの構造をそのまま卸してこないでちゃんと専用設計でやってほしい感はある 7900XTには16MB容量の6つのMCDが総容量96MB搭載されているが 実際にMCDで使用できる容量は64MBに制限されているとの事 残りの32MBは特定の処理の為に予約されており、 それ以外には使えないとの事でRDNA3のハイエンドNavi31の実質のIFキャッシュ量は64MB 64MBそこまでのレイテンシは良好でもそこからはRDNA2の後塵を拝する コストの問題があったにせよやはりIFキャッシュの容量が少な過ぎなのが問題だと思うわ それが無ければIFキャッシュの恩恵で4090を超えられたかもしれんのにな RedGamingTechとかMLIDとかはYoutuberであってリーカーじゃないからね RDNA4のハイエンドはGCDのチップレット構成が難航して開発中止 NVIDIAの次世代が25年なのでRDNA5に先送りしても許容可能と判断されたって話が出てきたな チップレット化は将来的にも必要な技術だと思うから開発自体は続けるんじゃないか デュアルダイにチップレット化してMAXX型番の復活だ。 IFキャッシュが足りないって定期的に言う奴出てくるけど GPUにおいてもキャッシュは容量性よりも局所性の方が重要になってきてるってことだろう。 Vega10のHBCCの説明で、「4GBのメモリ容量があっても実際に使うのは2GB程度」って言われてたぐらいで IFキャッシュも、使うのは64MBあれば足りていて、それ以上は結局メモリアクセスを伴うので あっても無くても大差ない(コストに対してそこまでのゲインはない)、ってのが実情だろう。 むしろ思ったよりも性能が伸びてないのは、どちらかというとDualIssueWave32の存在で これが思ったよりも機能しなかった、ってのがメインって気はする。 CDNAでも、FP64専業となったシェーダーがFP32以下を処理するための代走って位置づけなので 元々2本のシェーダーを同時に使うってのをあまり想定してないっぽいけれど。 >>323 何のためにキャッシュラインによるヒット率をAMD自信が出してたんだよ アホか >>324 それはRDNA2だろ。 RDNA3では、L0・L1キャッシュが強化されてるので そのまま当てはまりはしない。 GDDR6が遅いからキャッシュ増やして実効帯域稼ごうって流れだったところを、GDDR6高速化という根本的なテコ入れしちゃったからな その公式発表でも当然キャッシュ容量の伸びに対してヒット率の伸びは悪化してたし、減らして大丈夫なら減らすのはコスト的に仕方ないのかも せっかく作ったのに一世代で必要性が下がったというのはちょっと頭抱えたくなるが… >>326 高速化? どんだけGDDRとキャッシュのレイテンシに差があると思ってるんだ 少しは考えろ infinityキャッシュまるっと無くなった訳じゃなく3/4残っててクロックも確か上がってるからな レイテンシの話はそんなL3ポジの大容量キャッシュがちょっと減ったことより、GDDR6まで読みに行くワーストケースが速くなってることとL0からL2の増量で総合的に改善してると思うよ 容量が多ければそれだけ詰め込んでおける、単純な話だよ 帯域がとかの話じゃないんだよ 論点ずらしてんじゃねーよ政治家かおめーは 42もキャンセルが本当なら晩年の的コースだなコンシューマー向け バトルメイジ無くなったらラジャに戻ってきてもらおう 今ここに!ロリの国の設立を宣言する!国王はこの私だ!私が法律だ!幼女以外は国民と認めない! RDNA4では新型チップレットの41と42がキャンセル、Navi43はNavi33の倍になるって話だが AI/MLの強化やCUの強化はやってくるんじゃ無いかと思ってる。 CUについては、RDNA3方式でならNavi43はCU32とするべきだろうけれど RDNA3のように、2本目のCUが殆ど動かないって状況が解消されるんだろうと思う。 なので、CUが2倍になったのと同じぐらいの性能が出るのでは無いかと思う。 AIアクセラレータは、Turingレベルの64基からAmpereレベルの256基に強化されることで AI性能でも、Blackwellにはかなり食い下がりそうな気はする。 RDNA3では7900XTXで129TFlops、4080(195TFlops)の2/3程度なので 競合の次世代強化分を考慮して、4倍強化で同等レベルに追いつける、とは思う。 インタビュー見ると、RDNA3ではあまり必要性を感じてはいなかったが、ROCmでの動きを見てると RDNA4ではここは強化してくるのでは無いかと思う。 あと、キャンセルの時期を見ても、旧Navi41/42はキャンセルされても Navi43を2倍にした新Navi41は出てくる気はする。 というか、nV系の人はやたらとAMDの新製品をキャンセルやらリスケやら言いがちなので これもそういう話の一つだと思ってる。 >思ってる。 >では無いかと思う。 >気はする >とは思う。 >では無いかと思う。 >気はする。 >思ってる。 そりゃ、素人の予想なんだから断定的なことなど言えないだろ、としか。 内容も五行くらいにまとまるような中身すかすかの素人予想なら不要だわ >>336 CUの中にある2ALU(2xSIMD32)のうち1ALUが特殊な状況下で無いと動かないだけで WGP内の2CUは2つとも動いてはいる というかいつものハイエンドしか出さない世代と ミドルしか出さない世代のラデに戻っただけだろというか 本当にGPUバブルは終わると考えてるんだろうな GPUバブルは終わると言うか、需要に乗れずに諦めたって感じじゃね AIで戦うためにザイリンクス買収したのも無駄になりそうだ >>343 実態として使われてない売れてない決算ボロボロ >>344 もう出荷開始されたの? いつ? 決算も発表されたんだっけ? RDNA5出せるんですかね・・・?3dfxや的の晩年もこんな感じだったぞ その頃からの人ならこの程度じゃ心配に及ばんって分かりそうな >>347 そこら辺知ってるなら逆に大艦巨砲なNVIDIAを心配するわ >>346 世界3位のMSのAsureのスパコンEagleがXeon+H100だったのでバランスをとった感じかな ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる