AMDの次世代GPUについて語ろう 5世代
レス数が1000を超えています。これ以上書き込みはできません。
AMDのGPUに関する話題のスレです。
関連スレ
CPUに関してはこっちで。
AMDの次世代APU/CPU/SoCについて語ろう 299世代
https://egg.5ch.net/test/read.cgi/jisaku/1587530500/
前スレ
AMDの次世代GPUについて語ろう 4世代
https://egg.5ch.net/test/read.cgi/jisaku/1571034539/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured RX 5700XTの性能250%アップだったらワッパ50%アップでもTDP375Wになっちゃうのか。
まあ水冷だな。 Vega64でリキッドクールエディションと通常版の併売やったけど
その後やってないから性能より取り回しを選ぶユーザーが多かったんじゃね? 水冷っても一体型でラジが小さかったからじゃないか?
DIY水枕セットなら売れそう ゲーム側から意識せず使えないとマルチGPUは電気の無駄にしかならなくなるからなあ
EMAも本来ならDX12で吸収出来たんだろうけど… そのへんは積載方法次第でしょ
IntelのFoverosで積載されたCPUは
軽い命令はatom、重い命令はCoreって振り分けしてるレベルなんだから
ほぼシームレスにお互いのメモリ(キャッシュも?)にアクセスできたら全自動でどうにかなるはず >>8
CPUみたいなヘロ帯域じゃどーにかなっても、GPUじゃなぁ
それこそ馬鹿速い中間キャッシュ付きのアンコアダイにコアダイを乗せまくるくらいか Foveros実装の帯域は知らんけど
2.5DなHBMはメモリとGPUをボトルネックになることなく高速に接続できてるんだから
HBM的な高速メモリとの通信に耐えられる積載なら問題は少ない(スケールメリットのほうが大きい)と思う NVはVirtualLink対応をプッシュしてUSB-C(Alt mode対応内部信号はDP)をつけたはずが
なぜか普通の(ハイエンド)ディスプレイ市場が立ち上がっちゃって
そっちにも使えますよ(そのつもりじゃなかったけどw)な状態? VirtualLinkとかゲフォスレですらほとんど話題になってないから、ほぼ死んでるようなもんだろ
RTXで色々新機能搭載したけど、まともに機能してるのってDLSSだけという悲しい現実、それすらろくに対応ゲームがないという
DX12Uの新機能はPS5やXBOXで使われて、PCゲームはGameWorksが足を引っ張ってろくに対応できないだろうな
ちなみにPS5がDX12Uに対応するわけじゃなく、同等の機能を独自APIで対応するということ
プリミティブシェーダーやメッシュシェーダーにゲームが対応するのが最低条件で、レイトレやVRS対応はその後の話になる
新シェーダーでグラフィック処理を効率化した上でレイトレとか新機能を実用的な性能で実行するのが目的だから RX5000シリーズも内部的にはVirtualLinkの回路持ってるんだけど、コストの問題で殺してるって話だよね。
Pro W5000には付いてるので。VirtualLinkのコンソーシアムにはAMDも入ってたはずだけどね。 USB4がTB3ベースだからvirtual linkはこのままフェードアウトじゃないの VirtualLinkはフェードアウトでもTYPE-Cは欲しいな MBに付いてんだからMB側T-Cまでアウト出来るパスを組め
つーか可能な筈、dGPUからポートエキスパンダとしてDP/HDMI生やすのも含めて TB3もTB4もUSB4もType-Cのみだから安心しろ いきなりType-Cのみにされても困る
Type-Cを増やしてもいいとは思うけど もう全部TYPE-Cでもいいかな。DP変換もそんなに高くないし。 ネジ止め規格はありますよ。採用されてるかどうかは知らんけど https://www.tweaktown.com/news/74420/nvidia-mega-rumor-geforce-rtx-2190-2180-ti-naming-scheme/index.html
Ampereの語呂合わせ。
21周年、256×21で5376、5+3+7+6で21、次はRTX30ではなく21、とGeforce21(トンイル)、nVidia21になりそうな勢い。
プロセスもサムスンの8nmと、Ampereは韓国面から放たれるnVidia21の製品、でなければいいが。
それにしても20周年ならともかく、21周年って結構違和感あるわな。 いやー、次はRX5x50でしょ。
ちょうど、Ryzenの方もZEN3では5000番代使うみたいだし
「Ryzen 5950XTとRadeon RX 5950XTのコンビで最強ゲーミング」とかやったら
nVidiaも思わず「ウチのGeforceもRyzenとおそろいの5000番代だから!最強ゲーミングはRyzen 5950とGeforce RTX 5900Tiだから!」とか言い出すよw ラジャのGPU今日発表?
Xe-LPで既存のやつよりIPCどれくらい増したのか知りたいな
2年半くらいでよく開発したもんだ
来年出るXe-HPGで競争おこしてGPUの価格下がってほしい MCM GPUとかいうクソ以下の技術
チップ間インターコネクトがダイ面積とチップ間帯域と熱と電力的にクソやばいボトルネックになるのが分からんかなあ
チップ間が低帯域でもいいモバイル向けにしか使えない代物
普通に考えて4チップだと1チップ辺り100W以下にしか出来ないし、ミドルサイズ(200mm2くらい)だとメモリを64か128bitにしか出来ない
そりゃ4角のうち2方向にチップインターコネクト用のIFを付けるから、2方向にしかメモコンを付けられない
メモコンとインターコネクト用のIFに結構な面積を取られるから、演算器や固定回路は普通のGPUより結構少なくなる
ぶっちゃけ2チップ(200mm2x2)のMCMより400mm2のGPUの方が高性能だし、4チップで400Wとか冷却に苦労するし低性能としか思えない
2チップよりビッグダイ、4チップよりデュアルGPUの方が遥かにマシで正解 いやまぁ使い方と方式によるがな
かなりデメリットが多くなるのは事実
少なくともグラフィック用に使うモンじゃない >>32
設計や製造コストその他を考えると不正解なんでしょ
zen2のCPUやAPUと比べるとデカいGPUがいかに不経済かよくわかる >>35
問題はチップ間高帯域バスのコストと冷却
ダイの結構な面積を高性能バス用に使うし、MCMで密集した400-500Wとかの冷却はかなり困難
CPUとは別次元の高性能と高熱の対応を要求されるGPUのMCMは今の技術じゃデメリットが大きすぎて、ビッグダイの方が遥かにまし どれもピンキリでしょ
それにどこも今の技術でMCM実装しようなんて言ってなく
どこも次世代パッケージ技術でやるって言ってるんだから
今の技術でムリムリ言っても無意味 MCMの方がヒートスプレッダでかくできるんとちゃうのん? >>37
最適な実装ってかなり限定的だよ
熱があるから多重積層はアウト
2層までの接合で、更に高コストの高密度実装で外部インターフェースを実装するのは面積の無駄
となると2.5Dかそれに類似した構造で、インターポーザにインターフェースを作り込む
Zen2MCMみたいに別ダイにしても良いが代償は面積、この辺はお好みで
この方法だとインターポーザに超高速回線を通してマルチダイ設計をすることが可能
但し、面積/電力あたりの実行効率ではモノダイに及ばない
インターフェース分の電力と面積、それにインターポーザ代で足が出る
少なくともココを解決できるくらいプロセスが進行しないとダメ ROMEの時もこういう奴いたよな
GPUのMCMはGCD1つにメモリ周りとI/Oの組み合わせからスタートらしいぞ >>40
そりゃ面積当たりの性能はモノリシックが一番いいのは分かりきってる
だけどダイ面積あらりのコストがうなぎ上りだったり
バリエーション展開の手間や費用などを考えると、どこかで区切りをつけないと首が回らなくなる
熱やダイ間通信帯域とかは素人には判断つかないところも多いけど
Foverosのアレは全部(CPU/GPU/メモリ)積載だし
Rocket LakeではCPUとGPUの積載ともいわれてるし
昨日の発表でダイ積載へも一歩近づいたっぽいから、早晩ハードルを越えてくると思ってる
*途中からIntelの話になったけどTSMCだって似たような目標目指して動いてるはず 冷却の都合上3D積載できるのは10W以下しか無理
3WのIOと3WのCPUと3WのGPUを積載したとして、使えるのはスマホか省電力ノートくらいだろう
数十Wや100W前後のデスクトップ向けなんて無理 Rocket Lake-SはTDP125wの予定やで
Rocket Lake-SのFoveros実装は噂の段階だけど
来年のAlder LakeはデスクトップでFoveros実装で確定済み モノリシックで横に面積とるのと重ねるのってあのサイズの中で熱問題になるんかな。
既に横にいこうが上にいこうが局所的すぎて熱問題的には同等なんじゃないの。
排熱をヒートスプレッダー経由で行っている状態においては、だけど。 熱密度より熱膨張の違いによるソリの問題のほうが大きいらしい
話がごっちゃのまま進んでるけどGPU Only、CPU有りのSoCかで話変わりそう 将来の技術ってことだから、今の技術で計るのは不適当ではあるね。
ただ、コスト的にはどうなんだろう?
コスト重視のAPUが、MCMではなくワンチップで出てきてることを考えると
現時点でのGPUのチップレット化は不適当でFAだろうけれど。
CPUとGPU+IOって組み合わせでも良さそうだったのに、それすらしなかった、というのは
コストが問題だったのか、性能的に問題があったのか、あるいはその両方か。
GPUのチップレット化は、HBM必須っぽい雰囲気があるので
低コストを求められるのに、高価なHBMが必要という本末転倒な状況にはありそうだけれど。 Denonの新しいAVアンプのニュース見て、新しく対応した機能見ると、来年以降のテレビにはアダプティブシンク(FreeSync)対応のが出てくるんかな?
PS5も見据えたデノン次世代AVアンプ。これで10万円以下!?「X2700H」、圧巻「X6700H」
https://av.watch.impress.co.jp/docs/review/review/1264682.html
>ALLMはコンテンツの種類に応じて画質とレイテンシーのどちらを優先するか? を自動で切り替えてくれるもの。
>例えば、ゲームではレイテンシーの少なさが求められるので、それが最小になるように、AVアンプの画質調整やi/pスケーラー、オートリップシンクなど、レイテンシーに影響する機能が停止される。
>VRRは、PCやゲーム機などの映像ソース機器とディスプレイを同期させ、任意のタイミングでリフレッシュレートを切り替えるもの。
>これにより、ティアリング(画面割れ)やカクつきなどが抑えられる。
>QFTは、ディスプレイ側のフレームレートは変更せずに、映像ソース機器からの伝送速度を上げることでレイテンシーを低減するゲームやVR向けのもの。
>QMSは、ディスプレイとソース機器のリンクを維持したままフレームレートや解像度を切り替えるもので、ブラックアウトや表示の乱れを解消する技術だ。
ALLMは120fps対応、VRRはFreeSyncって気がするのだが。
PS5でアダプティブシンク対応を謳ってはいなかったけど、GPUはRadeonなので、やろうと思えばPS4でもアダプティブシンク対応は出来るはず。
箱の方は、箱一からFreeSync対応はしていたけれど。 >>47
X3Dだっけかのtsmcの積載技術がまだ整ってないから仕方ない
10nmでつまづきはしたけど、こういうところで垂直統合のメリットが出てる VRRってだけだとソース同期機能は問わず可変リフレッシュってだけでは…とも思ったけど、この説明はFreeSync (Adaptive-Sync) っぽいね
PCモニターはVESA、AV機器はCEAが影響力を持っているはずだけど、AV機器にAdaptive-Syncが搭載されるってのは勢力図の変化を感じるな DPじゃ無いからあくまでHDMI2.1のVRR機能 ALLMは低レイテンシーモード(ゲームモード)をテレビが持ってたらゲームのときに自動的にその
モードに切り替えてくれる機能。VRRはFreeSync on HDMIに近いけど互換性はないみたい。 AV機器側が対応に動くのって、PCや箱じゃ無理だろうから、おそらくPS5が対応するんだろう。
しかし互換性のない独自FreeSyncって、これまたソニーが好きな独自規格路線だなぁ。
今年の初めにFreeSymcのブランディングの仕切り直しをしていたが、今になって見直してみると、AV機器採用を見越したブランディングって感じが出てる気がする。
nVidiaからすると頭抱えたくなるぐらいの嫌がらせで、「お前(nVidia)、ソニーに何をした?」って感じの仕打ちだが。 HDMI2.1のVRRはすでにXBOX One S/Xで対応済み。NvidiaのHDMIでのGsync CompatibleもHDMI2.1のVRRとの互換らしい。 Freesyncは元々ディスプレイポート向けの機能だった
それをHDMI向けにも独自対応したのがFreeSync on HDMIで、これがHDMI2.1のVRRの元になってるんだろう
ちなみにHDMI1.4/2.0のディスプレイでもFreesync対応ができるのは結構ある(全部ではない) >>56
400届かないくらいだと思うよ
SoC化にあたり引っ付いてる余計なものって結構多いからな
しかもコレ12層じゃん >>56
7nm Enhancedという表現とトランジスタ密度からすると
7nm EUVではないのが残念 予想は80CUで505mm2だったから
大分小さくなりそうで良かった でもさこれだと3070としか性能上競合しないって確定して残念だね ハイエンドやトップが何だろうが、
関係ないんだけどね。
ファンとしてはミドルレンジを適正な値段で取りに行ってくれればOK。
競技者は最高が手に入ればメーカーは関係ないでしょ。 >>61
寧ろ80ラインは価格帯から言って作る価値ないと思うが
ボリュームゾーン狙えるのに狙わない馬鹿戦略をまともな会社がやると思ってんの? RTX3090は1500ドルで買えてしまうのか
Bignaviよりもめちゃくちゃ高速でこの値段は凄いな BigNaviは最低でも5700XTの倍の性能で、価格は多分$899か999だろうな
日本だと12万円くらいかな
3060や3070がそれ以上の性能なら当然値段も越えるから$1000以上だろうね
BigNavi以下しか買えないからゲフォは選択外だな >>66
理論値で50%しか上がらないって公式で出ているでしょう? ワッパだから1W辺りのパフォーマンスが1.5倍だぞ >>62
ハイエンドがないとミドルも売れないんだ
高性能なハイエンドと同じアーキテクチャというだけでものすごい宣伝効果と人気につながるからな ワッパ50%アップは、XSXの通りperf/clockが25%として残りはプロセスシュリンクによる
効率アップ20%で実現できるのか。 機能差や世代がハッキリしないからなんとも・・
いままでの情報だとデスクトップRDNA2≠ゲーム機RDNA2っぽいし AMD「GTX 950の60%消費電力で同じ性能を出すって言ったんだよ!」
ユーザー「同じ性能を60%の消費電力で出してもらおうか」
AMD「え!?GTX 950の60%の消費電力で同じ性能を!?」 60%とか割と現実的では、流石に相手は3050より上だろうが できらぁ!
https://pc.watch.impress.co.jp/docs/news/event/738337.html
GeForce GTX 950との比較で、同程度のフレームレートになるゲームを動作させた時に、システム全体の消費電力がPolarisは85W前後であるのに対して、GeForce GTX 950は140〜150W前後となっていた。半分とまではいかないが3分の2程度の低い消費電力で動いていることが確認できた。
え?同じ性能を2/3の消費電力で?
https://pc.watch.impress.co.jp/docs/topic/review/1014381.html
Radeon RX 460の性能は、現在販売されているGeForce GTX 950の補助電源コネクタ省略モデルに及ばない程度であり、補助電源コネクタなしで動作するビデオカードでは最速というレベルには達していない
Radeon RX 460の性能は、現在販売されているGeForce GTX 950の補助電源コネクタ省略モデルに及ばない程度であり、補助電源コネクタなしで動作するビデオカードでは最速というレベルには達していない >>71
IPCが上昇するってことは、周波数上げられるってことなので
ワッパ50%上昇は達成できたね
まあ株主の前で言ってたんだから、出来なきゃアレだけどw プロセス微細化や改良による効率向上は高クロック化より低消費電力化に
振った方がワッパはよくなるんだけどね。 レイトレコアの平行処理設計やめてゲフォみたいに単独コアにしようぜ
今のままじゃ一生勝てないだろ >>80
意味分からん
XsXから交差判定ユニットは載るの確定やぞ? >>81
逆に言えば判定中だけやんシェーダが自由に使えるのって >>80
何でわざわざクソな設計をせにゃならんのか
どうして分離してるかと言えば端的に手抜きだぞ
そこまで設計詰める事が出来ないって可能性もある
正直RT要らんが、内部命令で組んである分には取り敢えず差し当たり影響ないしな どうあがいてもbignavi≒RTX3070で決着ついてしまったからRadeonはapuで細々と生き残るしかないだろう
Xeは44Tflops出せるマルチコア準備しているから唯一RTX3090と競合できるだろうけどbignaviだけは産廃確定 出てもないのに産廃確定されても困る
まあ確かにRTX3000シリーズは今のより大幅に性能向上して来るだろうけども 2倍ぐらいコスパがよくなるならいいんだろうけどねw 専用ベンチではRyzenが高性能でも、ゲーム性能ではCoreが勝つ理由とは
〜Intelがベンチマーク説明会を開催
https://pc.watch.impress.co.jp/docs/news/1271807.html
Intel CPU、ベンチマークで勝るRyzenより実際のパフォーマンスが良い へえ、3070は3080より高性能なんだ
まあ、12pinとか350Wとか言われてるRTX3000シリーズに興味はないな 革ジャンはBignaviにびびって3070に104載せたんでしょ?
来年の70SuperはTitanと同じ102かTSMC 7nmにでもするんか >>91
バカ記事だな
Intelの原文をそのまま訳せばまだいいのに
原文からかけ離れてたり、そもそも原文がズルかったりボロボロ
Cinebench R15/R20←ゲームではなくCINEMA 4Dの測定
3DMark Time Spy←Dx12の測定でDx12のゲームはメニーコアのAMDが速い
ttps://pc.watch.impress.co.jp/docs/news/1271807.html
Cinebench R15/R20、3DMark Time Spy/Firestrikeを用いたベンチマークテストでは、Ryzen 7 4800Hがもっとも高いスコアを記録した一方で、実際のゲームプレイ時の平均FPSを計測すると同CPUがもっとも低い結果となった。 >>84
交差判定中に限りそのいずれかが行えると書いてある
シェーダユニットはBVHで埋まってればシェーディングが、シェーディングで埋まってればBVHが行えない >>93
来年は5nm RDNA3のBigNavi2を最初から出しそうだから、Superじゃ話にならんだろ 来年は28nmのBigBulldozer2か出るからHaswell脂肪確定だなw >>92
実消費電力 bignavi ≒ RTX3090
実性能 bitnavi ≒ RTX3070
これはJensenが講演で言ってるし
bignaviとAmpere世代は同等の消費電力ことだよ BigNaviって言っても、公式にはRDNA2としか言ってないし、リークではNavi21、Navi22、Navi23と言われてるぐらいで
「(下位の)Navi23が3070と同じぐらい」でも「BigNaviは3070同等」って間違ってないからなw EUのゲーム機自主規制SRIがアイドル70W以内だから大幅増はないだろうし
XsXのAPUがXOXと同程度の消費電力ならCPU入れて180Wくらいでしょ RTXはサムスン製造でクオリティ低いから逆転できる可能性はあるで
特に価格がまた高くなるらしいから価格で攻めろ >>101
そこ凄い不安要素だよな
また横流し発覚したりした日には地獄を見るぞ 逆転したらAMDが困るから程ほどにしかせんよ
今はCPUに全力出してるからGPUが売れても全力なんて無理 性能ではどうあがいても勝てないから
消費電力とコストパフォーマンスで勝負したいのはわかるが
価格はいうほどGeForceと大差ないよね
新製品発売された後の在庫処分で旧製品が大暴落してるのは多いけど 性能では負けてないな
負けてるのは囲い込みやマーケティング NVIDIAのレイトレ推しなのはなんでなんかね。
レイトレならではの画像って反射や屈折なんで別に普通のGPUのシェーダランゲージで
十二分に対応可能でしょ?
逆に大域照明だと絵面では派手さがないのにやたらめったら演算せんとあかんから
ゲームでは利用難しいし・・・ >>106
付加価値つけて馬鹿でかい面積食わせて価格を釣り上げる
あと売名とSW囲い込みのネタ
ロビー活動用のタネ
考えられるのはこれくらいか Bignaviって3スロ、TDP 350Wぐらいで収まるの? >>109
新型XBOX見れば、だいたい分かるような
箱の作りがPCとは違う考えみたいだけど、ゲーム機の最大消費電力の推測は215Wなんだろ?
で、12TFLOPS弱 BigNaviは250-300Wだろ
350WとかのアホはRTX3000だけ ワッパ上昇がGCN→Navi10と同じく50%と上昇なので
12TFLOPSといっても、Navi10だと14〜15TFLOPSという感じになる
単純な計算で絶対じゃないけど、5700比で絶対性能80%程度アップ
で、これがNavi20世代のミドルモデルなんだから、そらまあ上位のNaviはもっと凄いよねていう ワッパなんてスイートスポットで主張するもんだし必ずしも製品に反映されるかは…… HOT CHIPSのXBOXの発表で言った
"CUs have 25% better perf/clock compared to last gen"
のLast genはRNDA1のことなのか、XBOX ONE Xのことなのかでえらく変わってきそう。 おそらくone X比でしょ
どこの誰発表か知らないけどmsの人がRDNA1と比べる道理がない MSの講演で言う前世代は当然Xboxのことしかないよね
GCNではIPCに関しては7年間掛けてもあまり変わらなかったし
RDNAでは命令発行の毎サイクル化で4倍レートにしてIPC25%アップ
RDNA2にはそういう伸びしろ無いでしょう ワッパ50%アップだと225Wな5700XTの2倍の性能で300W
Navi21は80cuってリーク出てるけど
AMDはRDNA2がクロックが上がると発表してるから
普通に20TFLOPSくらいってことになると思うんだよね 20TFlops程度だとXeのMCM構成の44TFlopsに勝てないよねぇ
ワッパ犠牲にするわけでもないし
無難すぎるよね >>118
いやそれ新型XBOXの解析で、「ゲーム機全体のTDPは215W程度」というのと合わないんだけど
あと「そんなにワッパは上がらない」と書かれても、株主に足しての説明で行ってるもんだしなあ
勿論そううまくはいかないというのもあって、変更したという場合もあるが
現状そこまでネガティブに考える材料はあまりないんだよね
アーキテクチャが異なるとはいえ、いつの間にかAMD GPUチームは良くなってたというのが
AMDとDoEとの契約でも確認取れてる あ、てかもしかしたたら、PS5は未来の超技術と思ってる人か
なら相手するだけ無駄だったかな(あれはどうみてもNavi1x世代だよ) はぁ??
Navi21が80CUの2GHzで300Wとすれば
3分の2の規模で90%の速度なら電力は普通に半分くらい
CPUが8コアZen2の3.6GHzなんだから合わせて215Wって何かおかしいのか? もしかしてワッパとIPCの区別がついてない感じ?
IPCはサイクルあたりの実効的な命令処理能力を表すときに使われる言葉
ワッパは電力あたりの性能なので直接的な関係はないよ 結局、RDNAもCDNAもGCN改のバリエーションだったな。dGPUは晩年の的みたくなってる >>124
「RDNA2にIPCの伸びしろはない」と書いた後に、「いやIPC上昇はワッパに寄与しない」
と書く意味がいまいちわからない
IPCが上がったら、その分周波数も上げやすくなって
性能の大幅な上昇に寄与するとけど、なんでそこを否定するのか意味が分からないよ >>123
その推測でもGPUが150W 12TFLOPSになるけど
Navi2xはNavi1xよりもたいして上がらないどころか、ふつうに上がってるじゃん >>126
「RDNA2にIPCの伸びしろはない」なんて書いてないよ
「そういう伸びしろ」と書いたのはGCNからRDNAのときのような伸びしろ
RDNAで命令発行レートを4倍にしたような変更を加えることは出来ない
つまり25%もIPCが向上することは考えられないってこと
IPCを伸ばすということは実行パイプラインの増強だから
むしろIPCは抑えたほうがクロックは上げやすくなりスピード・デーモンなプロセッサーは作りやすくなる RDNA2では保持するWave数を減らしてスレッド性能を高めてるらしい >>129
In-Orderのプロセッサとの比較かつ消費電力無視ならそうだけど
そういう根本的に違うという場合以外なら、IPC上昇は寄与するって >>130
wave数保持するのはストール回避のメリットもあるから基本的に一長一短で
どちらかというと設計の効率化が狙いじゃない? >>131
どこで誰がIPCがワッパに寄与しないなんて書いてるの? >>133
「Navi2xでワッパ50%上昇」ということの否定から話が始まってると思ってたけど RDNA2で保持するwave数減らしたのは、
ストール要因の一つであるデータ読み込み時に起きていた資源構造ハザードが、
PS5からのストレージI/O改善により解消される見込みが立ったから >>134
50%のワッパアップを前提に書いてるけど?
否定したレスはどれ?
やっぱり>>127とか見ても思うけど
IPCとワッパ、さらにいえばクロックまで
言葉の関連性を整理出来ないまま何となくでレスしてるでしょ >>136
いやIPCを抑えた方がクロックが伸びるというのは
根本的に違うアーキテクチャを比べて、消費電力も無視した場合でしょ
なんでそんな極端な例を出すの
あと否定はしてなかったね、ごめん
別の人のレスと勘違いしてた 極端ていうか「IPCが上がったら、その分周波数も上げやすく」っていうレスが原理的にはむしろ逆だよって端的に説明してるんだよ >>138
In-Order vs OoOならその通りだよ OoOとか関係なく単純にスリムな回路構成ならクロック回すのも楽になるというだけ >>135
dGPUなnaviもRDNAで性能上がってるんだから違うと思われ >>125
そりゃGCNがグラフィックとGPGPUを両立できる優れたアーキテクチャだからな
グラフィック向けとGPGPU向けに別々に特化させるだけで、それぞれの専用アーキテクチャと遜色ない出来になっただけ BigNaviはCUだけではなくてROPは増えないのか?
XboxSXのGPUも80ROPとか言われてたが実際は64ROPだったし
RDNA2でも64ROPまでとかいう噂もあるが コレでも増えた方
正直ジオメトリレベルで適切に無駄な演算が省ければ64もあれば十二分
以下これに関するフラストレーション
正直言っていつまでROP盛りでどうとでもなるクソみてーなレンダリングしてんだとは思う
無駄を省けやカス
HWは進歩してんのにSW作る方は全く進歩ってもんが見られんわ
中身10年前とAPI変わっただけでやってる事かわんねーじゃねーか
何でもかんでもHW屋が引っ張ってくれると思うなよゴミ野郎 BigNaviでメモリバスとROPを倍増させるだろ
ゲーム性能のほぼ全てがROP依存だから、増やすかROP自体の性能アップをする必要がある
>>145
まあ、言いたいことはわかる
だけどな、現状はROP依存のゲーム開発をNvidiaが強制してるから、それに合わせるしか無いんだ 勝ってる側ならともかく、負けてる側が出し惜しみしてどうするのって思うが AMDの思惑としては、固定機能やROP依存を減らし、GPGPUによる高度で自由度の高いグラフィック処理を増やして、グラフィック自体のクオリティを上げたい
そのためにグラフィックとGPGPUの非同期処理を可能にするAsyncと対応APIのDX12/Vulkanを普及させる
そのためにROPはハイエンドでも64に制限していた
まあ、そんなこと関係ないNvidiaはゲフォが優位になるように固定機能とROP依存のゲーム開発を継続させるだけ
今はNvidiaの土俵だから、Nvidiaに合わせてRadeonを作っていく必要がある
ROP64制限とか最初から負け戦やってるようなもんだから、そろそろ制限解除しないといつまでも勝てない いっそ使ってないCUに専用の命令組んでROPの代替出来る様にしてくれ
良いアイデアかも知れんな >>150
それUE5に採用されてるNanite(非同期コンピュートによるソフトウェアレンダー)じゃないの? GPGPU重視ってGCN時代ずっと言い続けて結局は乗ってきて貰えなかったじゃん そりゃNvidiaが乗らないんだからPCゲームメーカーも乗れないだろう
ゲーム機向けは乗らないと性能が出ないから乗ってくれたけど、PCゲームはNvidiaの影響が大きいから乗れない
だからRDNAでGPGPUは後退させて、ROP重視に転換した
後退したと言ってもAsync機能自体は搭載してるから、DX12対応やGPGPU活用は今後も推進していく CU自体は変わってないからな
APU_VEGAとnavi10持ってるから比べてみたが目立った差がない
>>151
あるんなら良いが
なーんか違う気がせんでも無い 海外の情報だとPG142-0≒BigNaviでほぼ間違いないな
PG142-0はRTX3070相当になるからNvidiaは妥当な判断をしている
一方Radeonは最上位が競合のミドルって時点で産廃 つまりこういうことか
3090 = 3070 > BigNavi > 3080 3070に値段・性能で完敗?消費電力くらいか勝負になりそうなの 7nm+のBigNavがサムスンの8nm(10nmの改良)に負けたら恥だ >>158
完敗だよ
Nvidiaが3070で16GB版出すことで勝っている項目無くすことが目的なんだよ
唯一勝ってた搭載VRAM量でも敗北してしまう ゲフォ厨必死すぎ
3080が300W前後で10万円だし、3070も250W 8万円くらいだろうな
xx70としての魅力の欠片もない >>160
違いますー
3070は$500前後です
BigNaviの方が$1000下回らず産廃で今回も赤字売りだよ NVIDIAは12pinが確定したからなw
次々にチラ見せされる情報が約束された未来(爆熱)を暗示してる 12pinはFEだけね。AIC向けの3090のリファレンスカードは8pinx3。 12pinも8pinx3もどっちも爆熱確定だろ
それとも8pinx3だから省電力とでも言うのか? 12pinは一応12V/9.5(8.5)Ax6=684(612)Wまでだけど8pinx3なら450Wまでじゃん。 MI100は、CU120でTDP200Wと言われてる。
TDP低い分、クロック絞ってると思われるが、それでもMI100を名乗る以上はMI50と同程度の1.8GHzだろう。 >>165
ああ、うん、600Wより450Wの方が省電力だよね
つまりNvidiaは3000だけじゃなく4000シリーズ以降も400Wや500W前提でGPUを作りますってことだろう
そこまで無理して何をするつもりなんだろうな
願わくばAMDにはそんなアホなことに追従しないで欲しい所 そらHPCの選別落ちをビデオカードにしてるからでしょ MI100のテストサンプルが200Wだったかな
製品版はもっと高性能高TDPになるでしょ 一般向けとデータセンター向けとを比べて何が言いたいんだ MIの方は別ダイになったから何とも
CDNAはグラフィック用の中身入ってないし
こういうのならナンボ食っても性能よけりゃいいんだが
グラボはなぁ、、、 >>149
現状だとROPには言うほど差は無いと思うが
RTX2070S 113Gpix/s
RTX2080S 116Gpix/s
RTX2080Ti 136Gpix/s
Vega64 99Gpix/s
RX5700 110Gpix/s
RX5700XT 122Gpix/s
XboxSX 116Gpix/s
PS5 143Gpix/s >>175
GpixあたりのGFlopsで出さんと >>176
2070S 80flops/pix
2080S 96flops/pix
2080Ti 99flops/pix
Vega64 128flops/pix
RX5700 72flops/pix
RX5700XT 80flops/pix
XboxSX 104flops/pix
PS5 72flops/pix
現状だとROP比率の低さは解消されたんじゃね? Radeonは2020年だけの期間限定するとdGPUのシェア20%も無くなってて誰も買ってないんだよな
5700も全然売れてないし
この状態でBignaviが爆熱ブルトーザー状態なんだから売れるわけないよな >>177
十分だな
後はこのレベルを維持しておけば良い
競合は勝手にコケる
微細化が進行しても電力は減らねぇ地獄を最先端で受け持って貰おう つーかこんだけシェア落ちててGCNは失敗じゃない成功だったとか言う盲目がまだいるのな
シェア反転にはこれまでの間違い全否定が必要だろ ゲームとGPGPUを両立しようとした結果どっちもシェアをとれなかったオチ ドライバーがまだマシになったのはGCNのおかげだと思う
VLIW時代はひどかったしそのころの悪評が残ってるような GCN時代は、開発能力が細ったことが振るわなかった原因だし、そもそもAMD本体が資金的にも大変だった時代なので
GCNが失敗だったかどうか、は他の要素(CPUや資金繰り、合併後のゴタゴタなど)がありすぎて判断が難しい。
そもそもラインナップを絞ればシェアが落ちるのは当然の話だし。
APUだって、出来たばっかりの頃は、社運をかけて鯖やワークステーション捨てたのに、出来たのは単なるローエンドチップ
だったが、今ではintelのシェアを削る最大の武器になってるし、いずれはdGPUを締め上げ始めるのが見え始めたから
失敗だったかというと、これまでの10年では失敗だったが、これからの10年ではAPUが重要になるだろうよ。 一応、HPCやサーバーにもヘテロジニアスAPUぶっこむ予定だったよ
問題は当初、言われてたほどCPUの進化が頭打ちにならなかったことで
その頭打ち前提でのマルチ特化CPU(Bulldozer)と、
CPUよりさらにマルチ特化のiGPUによるGPGPUなAPU構想はアテが外れた >>180
論外、全否定されるべきはお前だ
お前みたいな話にならない大馬鹿者のクズが会社や事業を潰す
柔軟だったろうが、これだけ何処にでも突っ込めるし何でもつけられるGPUアーキテクチャがそうそうあってたまるか
グラフィックにも演算にもそこそこ使えて上から下までラインナップ自由、メモリも粒度問わず何でもつけられる
しかも機能含めてカスタム可能、奇数ユニットだろうがアンバランスだろうが構成自由
それが現在世界最大規模の量販カスタムSoCが出来る理由だろうが
プロセッサってのは性能が全てじゃない、如何に使えるかが全てだ
適合可能な市場が多いこと、適応容易であること
使えて生き残らなければ性能が幾ら良かろうが意味がない
その意味において、K10/TS以降のAMD/ATiに失敗は無い
必ずその次の構成のために必要で、活かして次に繋いでるからな
その意味ではnavi系統が心配ではある
まぁ大方CDNAもRDNAもブロック構成が異なるだけで同じモノなんだろうが
ココからの進化というとプロセッサとしては恐らくはホモジニアス構成くらいしか無いからな
ドライバ/SW組が嫌に静かだし GCNのおかげでPS4/XBOXone/PS5/XBOXsXの採用を勝ち取ってるんだが
Vega採用のRenoirもバク売れ中
RDNAもCDNAもGCNベースの各方面特化モデル
GCNを否定したらAMDそのものの否定につながるんだがな
今回シェアが落ちたのは、シェアを維持するために何もやってなかったからだよ
Zen2はこれでもかというくらいモデル追加やラインナップ更新したり、キャンペーンやってるけど
GPUは半年くらい前に5600XTを追加した程度で他には目立ったことはほぼ何もやってない >>185
> ドライバ/SW組が嫌に静かだし
ゲーム方面はPS5/XBOXsXの最適化とDX12U対応に忙しいし、
GPGPU方面はFrontierとELcapitan対応とROCmの最適化に忙しいからな
どうせDX11縛りのPCゲームなんて、クソすぎてやってられないから全くリソースを割いてないだろうな CDNAあるのに中途半端にGPGPUに色気出してるから、任天堂とか失注したんだろ
確かにHPCだけは発注数増えたが、それ以外は減ってるんだよ。決算に現れたとおり NVのデータセンター向け売上と比べるとまだまだだけどね >>187
DX12UはCSで開発が必要な筈だから、少なくともそっちのテスト機が組み上がってる頃にはもう微調整のみでないと流石に不味い
そうでなくともHWさえReadyならそんなに改修が要るもんでもないし
GPGPUも同様に既にSWは完動品でないと初期テストシステムの評価ができない
量産開始前にやってないとバグも出んからして非常に危ない
ので今メインタスク空いてる筈なんだよね、にしてはドライバの修正が遅い
>>189
何か問題でも?
あの値段で叩き売れる不良在庫SoCは作ってない
作るにしてもzen+GCNは色々とオーバーに過ぎる
かと言って今からスマホSoCクラスのARMと省電力向けGPU組むほどのモノじゃない、コストオーバーだ
そもそもAMDはその手の携帯機へカスタム供給した事もない、初めからそんな市場は持ってない
当然だがな、嘗てAdrenoを売ったのはAMDだ
初めからその市場は見てない
>>190
ソコが攻略目標なんだから早々簡単に堕ちるわけないだろう
単体では攻略出来るだけのキャパシティもないからな、丸抱えなんて天地がひっくり返っても無い話だ
ならゲームチェンジまで耐え忍ぶまでよ
丁度心強いかはともかく、そろそろ色を塗り替えたい連中も集まってきたしな AMDは数年内にCPUメモリGPUストレージを
インフィニティファブリックで繋ぐらしいし
Intelが盛り返さないとnvidiaも共倒れしそう AMDもIntelも独自バスの独自プラットフォームでエコシステムを作っていくから、Nvidiaだけがハブられていく 一応NVlinkで繋がるIBMのPOWERがあるけど雲行きが怪しい >>194
それを抑え込むためにメラノックス買って
上手く抑え込んでるよかなり高速分散環境の案件で
ヘイト買ってるし 何を買ってもタダの悪あがきでしか無いよ
AMDもIntelもGPUを強化していて、ハード的にはNvidiaと差がない状況になる
そうなると独自プラットフォームを持ってるIntelとAMD相手に劣勢にしかならない
CUDAはIntelにとっても相当邪魔な存在だから、相当な予算を注ぎ込んで全力で潰しにかかるだろう
Xeが優秀ならその排除も急速に進むだろう
AMDは予算的にそんな事はできないから、IntelがCUDAを排除しているスキにOpenCLを普及させそう
IntelはOneAPIを全力で普及させそうだけど、市場的にはIntel専用のOneAPIよりはOpenCLを選択するだろうね CPUも作れない奴がインコネ屋買うってのがね
明らかに抱え込み狙いじゃん >>199
Nvidiaはリーナスが場外から暗器ぶつけるって奇襲しかけられてて
Linux市場そのものから撤退する可能性あるよ LinusがNVIDIAに中指立てたのをいつだと思ってんだ
本格的に老害しかいなくなったな 正直AMDのGPUはかっては財務的にアレだったんでドライバが色々足りてないでしょ。
ドライバ作る人間だって結構リストラしていた。
でも最近は財務が大幅に上向いたし今後は期待出来るんじゃねーかな。
大体なんもせんで毎年2億ドルの利益が転がり込む家庭用ゲーム機を獲れたのも
GPU持ってたおかげじゃん。 PS4後半はEPYCで稼いだ利益を食いつぶしてたんだよ。 いやどうやって食い潰せるんすか?
マスクパターンの償却終わってるから刷るだけ儲かる状態っしょ。
単価が下がるから利益は下がってるでしょうがAMDがなにか支出する
事はないでしょ。 理由はなんだっけ?
ps5開発でセミカスタム部門の開発費が増えたとか
ps4が生産数を絞って必要数(AMDの収入が)が減ったとか? hotchipsでvalveがLLVMバックエンド機能と同等の
バックエンドを開発したぞ、llvmの1.3倍だぞ
って発表したって。
こう言うのがボチボチ増えそうやね。 >>207
はしょりすぎてて何が言いたいのかわけわかめ というか何でチップのカンファレンスでValveがソフトウェアの話をするんだ >>206
ありえん
ありゃAMDが設計したチップだがAMDが製造させてるわけじゃ無い x86が関わるものは他社が勝手にいじれないから、ゲーム機のAPUはAMDが開発してAMDがTSMCに製造依頼して、
動作確認して問題ないチップをSIEやMSに渡してるんじゃないかな ゲーム機メーカーの発注に従って造るだけだから
モデル末期で前年比減とかじゃないの
PS5用のカスタムは製造とは別口だろうし >>213
発注元/納品先と設計者が違っても良いとしたらどうだ? その辺はIntelがどこまで許してるとかライセンスがどうなってるかだから ライセンス回りは気を遣ってる。
intelは、隙あらばx86ライセンスの無効化を狙ってくるから、突っ込まれるようなことはしてないはず。
Fab分離の際も、弁護士と入念に調べて「問題ない」と判断した(当然intelはx86ライセンス無効化を言った)から、って経緯もあるし。 >>216
それで言ったらファブがそもそもx86もってないとあかんのやが >>218
GFに分離した時点でそれはクリアしてる
今現在はx86をどこで製造してもいいことになってる
ただしx86の再ライセンスは認めていないから、カスタムするのもFabに発注するのもAMDがやらないと駄目 >>219
そこよ
つまり製造にライセンスは要らない
発注設計まではライセンス持ちが要るけど、製造以降はライセンスが要らないって事だよな
AMDが納品までやるとFabの枠喰うだろうから厳しい筈だし >>220
でも今年切れる特許でそれすら不要になるじゃん >>220
製造にはライセンスがいるかどうかじゃなく
x86のライセンスをAMDはライセンスできないってのが肝
合弁企業を作るとかの回避策はあるけど
PS3で懲りたSIEは製造には関わりたくないと思われ ソニーがAMDに発注してTSMCで製造
FOXCONNに納入してお終いだろ
ライセンスもクソもないわ RTX 3090はRTX 2080Tiよりも100%高速化されてるじゃないか
これBigNaviで勝てるの? RTX3000シリーズの上位が尽く3スロットも食いやがるから2スロットに収めてきたらBig Navi買うわ >>226
今更2080Ti以下の買うのか?
正気なのか?RTX30上位行くしかないだろ? >>222
一応ウェハ納品の筈ではあるが、刻印AMDじゃないし
製造が完全にAMDの枠喰うとすると次世代CS出るの辛いな
優先向こうだろうからCPU/GPUはかなり数が限定されそうや
>>224
要らんやろあんなもん >>228
刻印なんてどうとでもできるでしょ
製造発注元の刻印をしないといけないという決まりがあるわけじゃなし
そもそもtsmcのラインをどこが押さえようが総量は一緒
SIE/MSともウエハ納品なんてされても仕方ないでしょ
シリコンの調整・量産の手続き・ウエハ加工してのSoC化全部を
AMDのセミカスタム部門が事業としてやってると考えるのが自然 >>229
いやいやいやいや
無限やないんやぞFabは
あとIHS含め刻印は好き勝手には出来ないだろ、特に社名や商標が入る場合
それにAMDにもSCEにも工場はない、全部外注
で、SCEも一応ファブレスで半導体は一式出来る
それとHygonの例がある、x86でも他社製造発注は可能、合弁とは言え別会社IP供給からの製造 >>155
誰も突っ込まなかったけど、PG142-0ってBigNaviじゃなく2070Superの後継製品だわな。
そりゃ、3070と同等だろうと言うか、3070そのものだろうけど。
nvTrollって、情報を読み間違えてること多い罠。
>>224
レイトレの性能が100%アップ、ね。
>>228
そこは大丈夫じゃない?
契約上はTSMCとAMDだけど、最終製品を出すソニーやMSだって話の輪には入ってるはず。
dGPUなら木っ端需要だけど、CSともなると長期大口需要だから。 >>230
> あとIHS含め刻印は好き勝手には出来ないだろ、特に社名や商標が入る場合
AMDとカスタマーが協力して、顧客が望む専用SoCを作ってるんだから
依頼通りに顧客のロゴいれても問題にはならないだろ
> それにAMDにもSCEにも工場はない、全部外注
当たり前
で、その外注なども全部受け持ってSoC作るまでがAMDの仕事でしょって言ってるんだよ
> で、SCEも一応ファブレスで半導体は一式出来る
矛盾してるよね?
> それとHygonの例がある、x86でも他社製造発注は可能、合弁とは言え別会社IP供給からの製造
だからSIEやMSが自分で発注する意味も価値もないでしょって言ってるの
それで性能が数十パーセント変わるならまだしも
そんな変わらないんだから事業としてやってるAMDに全て任せるのが得策
第一、SIEもMSもAMDと合弁企業作ったとは聞いたことない >>232
社名の意識軽過ぎだろ
アレ一応商標だぞ、著作表示でもある
それにAMDも面倒事はやりたくない
やりたがる訳がない、万年リソース不足なのは周知の通りだ
製造だってキャパ十全ではないのに 何を勘違いしてるのか知らんが
AMDと共同で開発したプロセッサなんだから
その気になればAMDとSIEやMSの刻印が並ぶところを
AMDが身を引いてSIE/MSの刻印が残っただけと考えれば不自然ではない
>>233
AMDも面倒ごとはやりたくないというか、SIEやMSにシリコンの最適化なんてできるわけないでしょ
両社がその作業をするためには、AMDはIPを両社に渡さないといけないし
どこよりもzen CPU/Radeon GPUの最適化ノウハウを持ってるのがAMDなんだから
AMDが責任もってtsmcやパッケージ部門/会社とやり取りするのが最善 >>231
違うでしょ
レイトレ抜きだと30Tflops
化け物でしょ
bignavi≒RTX3070は確定でしょ >>235
だから他社刻印を自社が権利を持つ部品には基本的に入れられないんだって
共同開発者が入れてと言えば入れる事はできるけど、それだけを入れる事は出来ない
それはコレの権利所有してますよっていう標示だから
一社だけ入ってる場合ソコが最終的な製造の権利を持ってる
あとシリコンレベルの設計触れなくても製造は委託できる
マスクさえ持ってればな
多分IP供給とした上でマスクは供与、チップ出荷数に応じてライセンス料
じゃないとお互いが立たない、カネ的にも生産の自由度としても
ぶっちゃけリスクヘッジとしてもこっちだろう
基礎設計当初のAMDはカネ的に酷い有様だったからな
この類は潰れたり買収されても影響のないようにしないと酷いことになるからな >>236
化け物だよ
AMDがこのTFLOPsに対抗するには
3070 5880sp×1.75ghz=30tflops
RX5700×2倍の4000sp×1.75ghzで同等の30tflops、消費電力はNVIDIAが210wなのにたいして、低圧最適化して230-250wくらいかな
RDNA2化で効率改善して同等のワッパコスパってところか
けど5880sp450muのRTX3000にたいし、RDNA1ならば500mu必要で、コストは30%高いので
4000sp揃えるのにGPU単体で2-2.5万くらいになる
RDNA2ならば3500spで30tflopsを実現しても、必要なダイサイズは400muでRTX3000の160%ほどのコストになるので、やっぱ原価250$くらいになる
しいていえばNVIDIAにとってはメモリよりもGPUが安い
AMDはGPUよりメモリが安い
AMD3500sp×2ghzで30tflops
メモリ12-16GBで549$
5660sp×2ghzで16-20gb 699$
9999sp×1.9ghzで20-24GB 999$
こんなみみっちい勝負になりそうだな 多分そこ大丈夫
あのTFLOPSは多分額面通り出ない
FP32x30Tならデータ要素は120TB
有効なシステムではこれにTB/sクラスのメモリと膨大なキャッシュで吸収
現実的にはこの時点で2TB/s程度は必要な構成だ
要はメモリバンドと内部演算帯域のバランスが悪いんですな
それより演算機以外のユニット数が気になった
演算機規模に対しての比率が悪化してる
思うにRT特化だな >>239
ゲフォ厨はアホだなあ
TFLOPS詐欺に騙されてて笑える リークする奴がいるんだからちゃんと性能合わせているよ
bignaviが3080程度でbignaviが発表されたら3080tiが出る出来レース >>238
だからライセンス料を取るようなビジネスはできないって言われてるじゃん
ウエハ単位での販売を頭ごなしに否定するわけじゃないが
ウエハのパッケージング工程を顧客にやらせる理由がまったくない
ryzenやepycと同じくamdが委託するほうが合理的だろ、経済的にも >>244
ライセンスはどちらにせよ掛かる
商標の刻印には個別のライセンス契約が要るし、そもチップは他社の各種IP使ってチップ組んでるんだから
その使用料が否応なく加算される AMDが請け負うのはシリコンダイの開発と製造で、パッケージは契約外だろう
これの右側みたいな無地のチップをAMDが作り、MSやSIEは左みたいな自社製品ロゴを記入したパッケージを付ける
https://www.4gamer.net/games/300/G030061/20180607045/TN/004.jpg
シリコンダイ以外はx86は関係ないし、ゲーム機はAPUをマザーに直付するし、ゲーム筐体との兼ね合いがあるからAMDはノータッチだろう ああ、そういえばゲーム機はM/B直付けか
それだとウエハ納品かな
>>245
話ブレブレだぞ 今更ググったけど生産地の刻印はRyzenと同じマレーシア
psシリーズの生産は中国広東省の深センや東莞といった地域の生産工場で大量生産されてて
(すっかり忘れてたが)AMDはマレーシアや中国の蘇州に後工程の合弁企業もってるとなると
やっぱりパッケージングまでAMD管轄でしてそうという結論に戻った
https://www.4gamer.net/games/990/G999024/20160908148/
ps4のSoCの写真だけどチップ周辺の鉄製の枠のあたりまで作ってからの納品
*xboxのほうもマレーシア製造だった >>248
そもそそ
だれもライセンス料の話なんてしてない >>241
とはいえ実性能も前世代比2倍出てるからな
RDNA2ちゃんで勝負できるのか怪しいだろ >>251
できるわけないでしょ勝負するならbignaviを450Wぐらいにして無理矢理2GPUにでもする愚行をもう一度しないといけない
でもそんな愚行でも3080に及ばないからゴミなんだよな >>251
公式性能を理解したほうがいい
https://pc.watch.impress.co.jp/img/pcw/docs/1274/381/31.jpg
3070=2080Tiは公式
2070と2080Tiは1.5倍あるかどうか
3070と3080は1.3倍くらい
3080と3090は同じダイだし1.2倍くらいだろう
2080Tiと3090は1.5倍くらいだけど、消費電力が1.4倍だから、ワッパは1.1倍くらい、ほぼ一緒 2000→3000はワッパ1.1倍
RDNA1→RDNA2はワッパ1.5倍
2000とRDNA1のワッパは一緒
RDNA2が負ける要素は皆無だと思うんだが
ついでに、これも
レポート:NVIDIA GeForce RTX 30 GPUSが2021年まで不足する
https://wccftech.com/report-nvidia-geforce-rtx-30-gpus-to-be-in-short-supply-until-2021/
カードの最初の波は小さく、非常に、非常に小さいと言われています-おそらく何年にもわたって最小の発売です。
BigNavi発売時にはRTX3000が完売で難民続出らしいね
年末年始をRTX2000やGTXで過ごすか、Zen3+RDNA2で過ごすか、好きな方を選べばいい DFの動画がよくわからない
ググったらニコン DFとか出てきたけどこれを見ても3000の性能はよくわからなかった Nikon DFは厚ぼったいから買わなかった。
FMぐらいの薄さなら、嬉ションしながら買ったのに ... まあ3000シリーズワッパはたいしたことないけど、ミドルのコスパはかなりよくなってるね。
RDNA2もがんばってもらいたい。 RDNA2情報無さすぎ
調子よいときはリークくるのに 逆だよ
RTX3000の方が歩留まり最悪で製造量が少なくワッパもクソでどうしようもないから見切り発車で先行するしかなかった
RDNA2は、TSMC 7nmを数年かけて熟成させた上で最適化しまくってからのリリースだから慌てることも急ぐ必要もない
Zen3と同時にリリースして話題と人気を総なめするつもりだろう
RTX3000はその頃には品不足で誰も買えない状況になってるだろうから気にする必要もない 大袈裟だとは思うが概ね同じ意見だ
7nm世代であの面積は常軌を逸している
消費電力の噂がバカ喰いってのは共通だったがその値がかなり前後したのもそのせいだと思っている
ダイのパワーイールドが極端に悪い故に出す枠を決めかねたのだろう
それにクロックの伸びがあまりにも悪い
面積単価が安いGPUは如何に回せるかが利益向上の鍵だ
真逆をやっている、つまりそうせざるをえない理由がある 利益向上のカギはそうだけど、性能向上の王道はダイ面積大きくしてエンジン多く積むだと思う Ampereなら7nmじゃなくてサム8
言うなら10nm++よ
EUV 7nmのRDNA2が負けたら凄まじく恥ずかしいだけ RTX3000は初っ端から超ビッグダイとか7nm世代舐めすぎ、それともNvidiaの技術力を過信しすぎてるのか
AMDはミドル(Navi10)やスモールダイ(Navi14、Renoir、チップレット)で時間をかけて熟成した上でビッグダイのBigNaviを投入する
まあ、性能や歩留まりはBigNaviの圧倒だろうな、計画性と経験値に差がありすぎる >>265
bignaviは出せないで出せても7nm使って450Wオーバーとかそんなゴミしか出せんよ
nvidiaの判断が正しく明らかにBignaviはゴミで消費電力が多いから安区する反面熱設計は高めにしただけだよ
nvidiaは来年から2〜4個のチップレット方式に移行しさらに性能上がるし もうbignaviもAIBでベンチ回してる段階だろ
double32含めて30シリーズのほぼ全て当ててたリーカーが
両方のスコア把握してるみたいだし RTX2000→RTX3000はワッパ10-20%の改善
RDNA1→RDNA2はワッパ50%の改善
これだけでRDNA2の優秀さが分かる >>269
GeForceがZen+からZen2へ
RadeonがTrinityからKaveriになった感じか
やはりZen2よりスチームローラーだな >>264
10n改良でも密度は出てるじゃねぇの
言い訳になってない まあ、今のAMDは後出し出来る立場じゃないけどなー。3000シリーズ捌かれた後に追い付いても客奪えんぞ この状況でAMDはだんまりし続けるって事はもうそういう事だよね
ビッグナビちゃん可哀想・・・ >>275
「Ampereが本当にあのスペックならRDNA2に勝ち目はないと思っているようだね」みたいな不穏なツイートしてる社員いなかった? つまりZen3もダンマリしてるから失敗ということかあ
まあ、RTX3000は歩止まり悪いのに安売りして速攻売り切れて来年以降じゃないとまともに買えなさそうだからRDNA2を急ぐ必要がないだけなんだけどね 確かにSAMSUNG8nmに対してTSMC7nmでGPU製造して
性能で負けるようだと恥ずかしくて出せないな
無理なシェア争いして安売りしても何のメリットもないし RTX 2000に引き離されてたところに3000でさらに引き離されただけなのにな
出てもいないBigBulldozer2なんかスペックわからんだろ CDNAと同じようにCU構成してたらbignaviも10000コア超えてる可能性が高いからな >>275
逆。
リリースが近くもないのに饒舌なのは、ヤバい時。
順調な時は、直前まで黙っている。 AMDがコスパをアピールする時は性能や消費電力でかなわないとき ついにAMDが革ジャンを圧倒する時代が来るのか
信じていいんですよね?
今まで新作出るたびに裏切られてるけど 起死回生にはZen3買うとオマケに1個付いてくるキャンペーンでもやらないと駄目だろ >>283
それはない
今回の発表でbignaviは契約済みのスパコン以外提供しない可能性の方が高いからな CU80にしたって理論値でRTX3070に負けてるからお蔵入りは確定していると思う RTX3000のCUDAコア数やTFLOPSの値は計算方法を変えただけで
レイトレ抜きの性能は数値の半分程度では… Volta以降FP32とINT32が同時実行できるようになってたのが、FP32のコア数を倍に
してクロックごとにFP32コアを全部使うか、FP32半分とINT32を使うかを選択できる
ようになった。純粋なFP32処理ならほぼ倍の性能を発揮できる。 Ampereも年内は供給が絞られ、実質来年発売と大差ないところに
Zen3とRDNA2が揃って出るだけでも、AMDとしては十分だと思うけどな。
しかしdGPUでの趨勢で、「AMDがRadeon辞める」って考えるのは頭湧いてるとしか言い様がないけど
APU(CS含む)には、当たり前だけどGeforceは対抗モデル無しだから
GeforceがdGPUでいくらイキがっても無駄なんだが、nvTrollにはそこら辺が分からないらしい。 RTXの追加のINTやFPを使うには専用のAPIを使わないと無理
既存のゲームや普通のゲームじゃ効果はない、カタログスペックの半分の性能しか出ない
しかし最近のNvidiaは独自機能に拘りすぎて空回りしてるなあ
MSとSIEと一緒に業界標準を作り込んでるAMDに対抗するためには仕方ないけど、そろそろ限界を迎えそうだ BigNavi $549だってさ
これ完全に3070と競合する程度しかなさそうだな BigNaviそんなに悪いのかね。いやドライバのチューニングはまあアレでしょうけど。
80CUでかつRDNA1より50%効率向上なんでしょ?
Radeon7よりRDNAで1.3倍効率上がって、RDNA2で更に1.5倍、でCUで1.3倍なんで
2.5倍位になるわけっしょ。まぁこの計算超人パワー的掛け算ですけど。 GCN以降はDX12をターゲットに作り込んでるから、DX11やGameWorksだとイマイチにしかならん
RDNA2はDX12Uをターゲットにしてるから、やっぱり再来年くらいまでは性能を活かせない
PCゲーム市場を支配しているNvidiaがDX12Uを無視してDLSSにばっかり力入れてるからどうにもならん
レイトレもDXR1.0のRTXばかりになりそう、DXR1.1対応とかいつになるやら RTXの仕様当てまくったリーカーが強いって言ってるから
ジャンプアップは果たしてるんじゃないの
MI100と同世代のコアなら3080競合にはなりそう CU内の構成次第だが
恐らくとうとう演算器本体に手を入れるんじゃ無いかな
GCNから基本構造は変わらず、GCNの演算器はTeraScaleから引き継いだものだし GCNもRDNAも演算器自体はそのまま使ってるということは、元から高効率なんだろう
下手に手を入れるより、そのまま使いまわしたほうが最適化しやすくて開発も楽だろう レンダリング性能もだけどdirectstorageをサポートすんのかも気になるよな
箱からフィードバック得てるんだろうからサポートするだろうけども DirectStorageはVegaから搭載してるHBCCのDirectX版だよ
サポートするも何も本家本元で上位版とも言える
RTX IOはSSDだけだけど、HBCCはメインメモリやオンラインストレージにも対応できる
https://hardzone.es/app/uploads-hardzone.es/2020/05/AMD-HBCC-1-e1590397768256.jpg
下手すりゃXBOX版だけじゃなく更に高性能なPS5の高速SSDと同等の方式に対応している可能性すらある
更に言うなら、Pro SSGのようにBigNaviに内蔵している可能性もある
まあ、流石にそこまでしたら、$2000くらいにはなりそうだから、今回は無いと思うけど それはシステムRAMの一部をVRAM代わりにもらう技術だから別物では?
directstorageはWindowsにおいてストレージにあるゲームアセットをGPUに直読みさせるにあたって
発生するボトルネックを解消する為の新しいAPIでRTX IOはそのプラグイン
根本的な機能自体はPCIeに元々備わってるものだからしようと思えばAMDも簡単にサポートできるはず 中身としてはDMAとGPUにファイルの展開を実行させるAPIでしょ
NVIDIAは商業的な名前を独自に付けてるだけで >>307
ttps://devblogs.microsoft.com/directx/directstorage-is-coming-to-pc/
directstorageに関してはMSのブログで説明されてる
RTX IOはこれを利用したGPUによる解凍アクセラレーション そらGPUだろ
この方式の明確な弱点は脆弱性に対し無防備になる事
というかGPUの脆弱性がそのままクリティカルになる
原理上CPUとそのメモリはCPU側により保護されているが
逆に言えばそれ以外はアクセス出来る CPUとSSDの接続はどうなるんだろう
維持されたままなのか、切断されるのか
その場合、切断、再接続の時間はどうなんだろう >>311
ファイルシステムまでGPU側でめんどう見ないと駄目みたいな作りにはさすがにしないだろ。クラスタ番号指定して読み出すだけだろうからCPU側で書き換えないようにすれば制限は無いと思うけどな。 米アマの値段らしい
ZOTAC Gaming GeForce RTX 3090 Trinity 24GB: $2415.18(MSRP$1299)
ZOTAC Gaming GeForce RTX 3080 Trinity 10GB $1211.37(MSRP$699)
ああ、うん、まあね、こんなことだろうと思ったよ
これだと3070も$799か$899くらいしそうだ
まあ、これでも販売数がかなり少ないからすぐに売り切れそう
$499や$699に期待していた大量の難民は、1000や2000で我慢するかBigNavi待ちに移行だろう
BigNaviをバカにしていた連中は、3000を買えず、BigNaviを買わず、1000や2000のコスパサイコーって叫び続けそう >>313
CPUによる通常のIO制御と、GPUによる専用API(DirectStrage)による制御の両立とか可能だろうか
それに帯域や制御の大半をGPU側に持っていかれるから、CPU側はかなりの性能ダウンになりそう
AMDはCPU+GPUのバランス制御はAPUやゲーム機で長年やってきたからお手の物で、いい感じで両立させそうだけど
革ジャンはGPU至上主義だからCPUなんか無視してGPU最優先で帯域も制御も独占しそう >>313
違うプログラム側でCPU指定してコア占有する形だよ >>311
多分されない
通信経路はGPU-NB-SSD
アクセス元はSSDから言えば変わらん >>314
革ジャンのMSRPはチップ単体の出荷価格に定義変更されたんじゃ? >>320
チップ単価とかユーザーには不要な情報だろ
ほしいのは搭載ボードの小売や標準価格
しかし、12pin、FP32倍増、価格はチップ単価とか何処を向いてGPU作ってるのやら
少なくともユーザーの方は向いてないよね >>321
競合がRTX3070と競合できるかもしれない程度で
それ以上の上位製品出せないのがほぼ確定しているから
攻めすぎた製品作ってるだけでしょ >>325
では何故$599ドルのBignaviをRTX30発表後にいきなり$549にしたのかね? 噂話に振り回されすぎ。
実物レビューも主観に左右されるのに。 BigNaviはまだ発表もされてないのに妄想だけは凄いなササは
値段まで妄想か 製造単価とか関係なくゲフォのベンチと同レベルの製品を少し安い値段で出すしかない
RAMの容量でちょっと上乗せするくらい EPYC(鯖用CPU)>>>RyzenAPU(ノート)>RyzenCPU(デスクトップ)>>>Radeon
AMDが確保できたTSMCラインの中でブランド力維持以外に取れる要素ある? CDANとはいえNVに完勝したのに
BigNaviだけ期待できないってのは流石にどうかと
NVと違って、株主の前でワッパ50%上昇と言ってるしね
RTX3070の20TFLOPSで2080Tiと同等のfps、TGP 220W
というのは、RDNA2と競り合うには厳しいと思うよ nvみたいにRNDA1のGPUの最大性能と同じ性能時の消費電力が2/3でワッパ50%アップとかいいださないよね。 > CDANとはいえNVに完勝したのに
CDNAの事だと思うが、物が出てもいないのに何を完勝したんですかね…? そういう意味ではINTEL Xeでも勝ってますねw >>335
想像でしかないけど、米エネルギー省のスパコンに採用決定したことを以て勝利認定してるんじゃない?
Frontier、ElCapitanと続けて採用されたし。 >>337
それはCPUも自社製で揃えられる点の方が採用された要因としては大きいと思う MI100はFP32の演算能力でA100の倍以上なのがデカい
RTX3000シリーズはやられた事をやり返したようなもん スパコンってのは低精度やるもんじゃ無いからな
一々スパコンがいるような高精度つったら最低でも32、マジなとこは64
加えてA100は低精度/テンソルに振り過ぎな上に強制NV-link、構成CPU機数も少ない上に限定される
FP64としてもほぼMI60とワッパ変わらん代物だし
更に言えばCUDAによるプロプライエタリな環境が推奨
これはスパコンには採用しづらいだろう
1ラック程度のシステムで低精度シム回すには高性能だけどさ AMDのエンタープライズ向けのGPUの性能がNVIDIAに勝ってるのはわかったが
個人向けのディスクリートGPUのほうも本気出してほしいな
利幅が薄くて儲からないからやりたくないのはわかるけどさ 開発は本気出してるぞ、マーケティングは超手抜きだけど CS向けに作った物のついでをリテールに出してるとしか思えない CS向けってことは次世代ゲーム向けに超特化、超最適化ということだぞ
必要な機能や技術は全部載せ、性能はコストの限界まで上げる
当然PCゲームでもその威力は最大限に発揮されるようになってる
もちろん次世代最新API(DX12/DX12U)を使ったゲームにならであって、他社独自API(GameWorks)には全く意味がない
アンペア vs RDNA2は、要するにDLSS vs DX12Uということでもある CS最適化なんてPCゲームになると全く関係なくなるけどね
AMDはGameWorksみたいなことやらんのか?
昔BF4やCrysisでやってたような記憶があるが Intelの最適化はダメだけどRadeonの最適化は良い理屈 自社への最適化ってより他社に性能出させないのを重視みたいなことされると応援できない >>344
でもそのDX12Uって新機能ほぼnVidia基準だし・・・ 結局、GCN世代はシェアでも標準化でも完敗してCS機に逃げ込んで何とか生き残っただけの世代としかいえないな
標準は能書きでなく結果で作られる >>349
お前がそう思ってんならそうなんだろう
お前の中ではな 悪く言えばnvidiaは出来合いのものを売りつけるしか能か無いのよね
カスタムやシュリンクの交渉受け付け無いし
任天堂も次どうすんのかね?脆弱性の問題でMSやソニーと同じ目にあってるし >>351
CDNAがスパコンのおまけで採用されただけで、それ以外は全方面の市場で全敗してるじゃんGCN世代 >>352
シュリンクは受け付けるでしょ
実際PS3のRSXは90nmから最終的に28nmになってるし
CPUとの1チップ化は受け付けなかったみたいだけど VirtualLink USB Type-C connector is officially dead
https://videocardz.com/newz/virtuallink-usb-type-c-connector-is-officially-dead
nVidiaがVRの為に作ったVirtualLinkが公式に死亡確認、だとか。 >>355
ありゃ受け付けなかったんじゃなくてそも出来なかった
nvidiaはSOI使ったことないし、Cellはバルクじゃ作れない
工場の問題もあるしDRAMの問題もある
Cellは割と融通効くだろうがG70はそういう世代でもないし
>>354
アレがオマケに見えるなら相当だわ
そもそもスパコンっつーのは規模が無いと計算できないから組むもんだからな
オマケ程度でいいならCPUでゴリ押す、逆に言えばアレの演算性能はGPUに拠る
市場で言えばまだ有効なdGPU出せてるし、HP-CS独占出来てるのはデカい
競合が多重軽演算重視とかアホ設計やったおかげで大規模/高精度用途ではほぼ独占
大事なのは勝つことじゃない、作り続けることだ
グラフィック用dGPU市場や流行モノなんて不安定なトコ足場にしてないから、そう見えるだけだ
初めから全部ひっくるめた汎用のアーキ、グラもコンピュートも低精度も高精度もな >>356
NAVI10には機能は持ってたのにRadeon RXにはコストと消費電力を考慮して採用しなかったみたいだね。 >>356
NVIDIA AMD Microsoft Oculus Valveの5社だぞ
このメンツで失敗するとは思わなかったな… VR自体がエンスー向けだし、接続の煩雑さは可搬性を持つモノじゃないから障害じゃないしな
今なら無線技術の方がマストだろうし >>360
さすがにGPUに付かなきゃ意味がないからね。 またAMDが業界の足を引っ張ったのか
ダメだなダメなのは産廃Bignaviだけにしておこうよ >>360
NVIDIA Oculus Valve「GPUにVR用の端子付けようか、規格作ったよ」
MS「一応のっとくか」
AMD「MSがのるから一応乗っとくか、GPUに付けるのは様子見しとこ」
とかかな 発表当時から失敗臭が酷かったからなあ
ほんと、Nvidiaは業界の足を引っ張るのが得意だなあ USB4がTBベースになるのに劣化TBのVirtualLinkが残ると思ってたのか とは言え、言い出しっぺのnVidiaも、2060以下には付けてないからな。
あと、Valveは去年の今頃、VirtualLink対応のVRヘッドセットを断念してるから
色々と問題があって、修正する価値はないと判断したんだろう。
>>363
ってことで、原因は失敗規格をぶち上げたnVidiaにある。 USB4はユニバーサルケーブルで最大2mだからな。それ以上は光ケーブルになるんだろ。 Microsoft、「Xbox Series S」を正式発表
https://game.watch.impress.co.jp/docs/news/1275718.html
廉価版のXBoxSeriesSが正式発表。
299ドルでフルHDでXSXと同世代のゲームが動く、らしい。
廉価版って事で、CU52のXSXをカットダウンしたようなチップを使うのだろうけど、PS5と同じCU36だったりしてな。
ただ、4K環境は思ったよりも少なく、PS5やXSXがオーバースペックになる可能性もあるんだとか。
そういう意味で、フルHDをターゲットにXSX世代のゲームを動かすニーズはありそう。
フルHDで動かすなら4Kの半分以下の性能でも足りるワケだし、狙いとしては悪くは無さそうな。
PS5なら、単純にクロックを大人しくさせることで足りそうな気はするし、「XSSで、4Kで動かないぞゴルァ」が誘発されそうな気がw >>369
FLOPS準拠でいけば現行のXbox並なんじゃないっけ
流石にこの価格では限界があるね >>369
その市場はPS4の支配下だからどうにもならんだろう >>371
CPUは上位と一緒のもん積んでるから性能的にはPS4とは段違いだけどな いや別にNVIDIAは勝ってない
ただ買ったフェイク、ブラフがすごくてみんな騙されてるだけ
@2080tiと3070は性能同じ
Aそれより高性能な3080と3090は性能同じで3070×130%の性能
B250wの2080ti互角の3070は220w、3080/3090は300-500wとかいう馬鹿GPU
これは完全に性能やiPCがほぼ伸びてないことを意味する
Cまたサムスン8nmは実10nmであり、10nmコアのiPCは12nm比10%も伸びないため
RTX3000の実ワッパがたいして伸びてないことを裏付ける
・SPが多い
・バカでかいサイズ
・499$/699$提示でやすい
の錯覚で3000がすごいGPUに見えるフェイクがあるが、事実上性能は100-130%とほぼ向上できてない
例えるならRTX2080tisuperとRTX2090、2090tiを出したくらいたいして性能は伸びてない
ところが「新しい名前とプロセス」「似非やすさ」「でかさ」にみんな騙されて、ワッパ性能伸びてないことを理解できてない たいしてAMDのポテンシャルはrx5700XTの時点でRTX2080ti同等の250wまで引き伸ばせば
2.1-2.2ghz、外れコアでも2.1ghzまで性能向上可能で、RTX2080super同等、2080ti85%の性能をだせた
そしてRDNA2の理論性能のiPC向上値を想定すれば、250wと同等馬力なら2080ti、300wなら3080に並ぶGPUはだせる
無論NVIDIAよりもやすい価格で
NVIDIAはゴミ性能をすごいと見せるペテンが天才的だっただけ 400mm2のビッグダイをサムスンがまともに量産できるわけないだろ >>375
400どころじゃ無いからなアレ
しかもサムはHPの経験が浅い 400mm2は3070のこと
3090や3080は630mm2とかだからもうヤバイほど悪そう RDNA2はともかく、bigNavi敵前逃亡って噂あるじゃん。実際にDBに出て来てないし そりゃZen3を先に発表するからな、RDNA2の情報なんか出すわけがない
それともZen3の情報がなかなか出ないのも敵前逃亡で失敗作だとでもいうのか? 3080のベンチで始めたけど2080Tiから25%前後みたいだし
敵前逃亡する程差があるとは思えんな AMDでゲーミングソリューションとマーケティング担当してる人が
アニーのTomorrowを引用してツイートしてるから明日なにか発表するかもな 3080はゲーム以外の部分は2080の2倍ですが肝心のゲームは1.5倍くらいですって感じだ 明日Bignaviはごめんなさい発表あるかもしれないからほぼbignaviは産廃だったって結論でいいと思うよ >>370
続報で、WQHDで144Hzらしいので、思ったよりはパワーあるか、疑似WQHDみたいなテクニック使ってそう。
>>371
コンセプトが、「PS5のゲームが動くPS4」みたいなものだから。
そのセグメントが、PS4の支配下でどうにもならないって部分は同意するけど。 Big Naviは来週出るApple WatchのS6 GPUより速いのは確実らしいな nVIDIAはDLSSとかVRSとかMesh shaderとか描画コストを下げる技術で先行しているんだよな。
RDNA2がDX12 ultimateのスペックをフル実装してくれていれば良いんだが。
D-SYNCが後追いのFreeSyncに屈服したようなコースが理想的。 代償有りで描画コストを下げても意味がない
DLの為に載ってるTC除ければ遥かに電力も面積も改善する
VRSはそもそもアプローチが数段遅い
Meshはそもソコだけ何とかしたとしてもどーせVSしか使わない >>373
そう、クーダコアが2倍になったんだけど、キャッシュなどが二倍になっていない
意味不明な事をしてるんだよ
↓ソース
https://www.youtube.com/watch?v=dxFQURAVT_A >>383
逆転するよ、というかRDNA2世代で既にしてる
DX12の普及が邪魔されたのは、ゴミワークスと(この点は褒めるべきだけど)マクスウェル以降
ワッパがNVに軍配が上がったため >>373>>392
2080Ti=3070 , x1.3倍=3080 or 3090
結局これからはストレージからのアセットデータ読込み遅延をどうにかしないと性能向上の幅が小さいって事だな。
今まではアセットデータ読込み遅延を読込んだ後の演算処理を短縮する事で性能を伸ばしてきた。
それがもう限界なんだろう。
ストレージ側がボトルネックで、そこを抜本的に改善しないと
トランジスタ数に対する適正な性能向上は望めないよとNVIDIA自身が証明してくれた形なのは皮肉な事だな。 データ量は何とでもなるだろう
丁度いい感じに圧縮出来そうなモノ積んでるからな >>394
単にサム8だからワッパが大して向上しなかっただけでは >>396
ワッパの問題ではないだろう
あれだけSPを増やしておいて性能向上幅1.3倍程度なのは、
処理する演算器に対して処理すべきデータ量が足らないから。
1フレームにおける処理時間の大半をデータの読込みで消費してる。
この次元まで遂に来てしまった感じだね。それを証明したのがNVIDIA自身というのも皮肉だね。 SMあたりの別にコア数は増えてないっしょ。TuringのINT32専用がFP32と兼用になっただけ。 >>392
ttps://ascii.jp/elem/000/004/025/4025911/
この記事が分かりやすいけど別に意味不明な事はしてないだろ バランスが著しく変わってる
最大限の柔軟性を持たせてあると言える RTX3000の最大の改良点はFP32の倍増だけど、それが何のためなのかがイマイチ分からん
FPとINTを並列にしたのも効果があったのかよく分からん
何か演算器をホイホイ倍増していってるけど、効率悪いのを物量でなんとかしようとしてるようにしか見えん
AMDはAsync機能で演算器を効率良く並列動作させられるから、無理して倍増とかの追従はしなさそう >>401
何のため、ゲームグラフイックスレンダリングは今でもFP32が主流
その為に決まってるで
そこまで増やしても性能の伸びが悪い
GPUとは別の箇所システム全体でボトルネックを潰さないともう駄目な時に来ている >>401
単にゲームじゃFP32の重要度が高いから増やしたってだけじゃね FP32を倍増しても実際は1.2倍とかしか向上してない
だったら1.2倍程度で良かったんじゃないかと思う
まあ、構造上倍増しか出来なかったから仕方なく倍増したんだろうけど
今の所RTX3000のFP32の数字は見せかけのハッタリスペックでしか無いな
将来は活用できるようなゲームも出るだろうけど、当分は無理かな >>401
SM当たりのTuringの性能の伸びはINT専用のコア追加によるFPとIN並列処理によるといころが大きいと思うよ
でも実際のゲームの処理はFPの割合のほうが大きかったので遊んでるコアがあった。Ampereでは追加コアを
INT専用でなくFPも使えるようにすることで全部のコアが動くようにした。それで消費電力も増えちゃったんだろうけど まあ、熱くなるのは分ってたのであんなエアーフロー考えて載せてきたんだろうけど。 コスト重視でSamsung 10nm選んだのも原因だけど どっちかというとGPUに虎徹みたいなのがくっついててそっちが気になりすぎる >>408
一般的な発熱の範疇で熱くはない
Bignaviが産廃だったことを気にした方がいいぞ GPGPU一点豪華主義のGCNの改良版でしかないのが露呈したわ ハイエンドでメモリバスが256bitしかないのか? AMDは公式Twitterにおいて、次期CPU「Zen 3」を10月8日、次期GPU「RDNA 2」を10月28日に発表すると予告した。
同社CEOであるLisa Su氏も、「ゲーマーにとってエキサイティングな秋になる」とツイートをしている。 ラデユーザーにはエキサイティング、ゲフォユーザーには阿鼻叫喚だろうな
BigNaviは5700XTから大幅な性能アップだからこぞって買い換えるやつが続出
ゲフォは、3070 8GB/3080 10GBが発売されたすぐ後に3070s 16GB/3080s 20GBが出てきて、情弱情強のアオリ合戦
特に3070s 16GB vs 3080 10GBは性能やメモリ量で賛否両論のクソ面倒なことになりそう >>421
RTX3070tiを年のためだしたからもう産廃bignaviが入るゾーン消えたけどね BignaviのPCB基板はOEMに未だに提供されてないから少なくとも産廃だから誰も作りたいとは思わないけどオリファン出ても1月以降で年内は不可能
リファもすぐに出せる状態じゃないからこのままbignaviは忘れされるのは間違いない信者お布施用の地位は変わらないw 海外でもZEN3はかなり期待されてるがBigNaviは誰も期待してないような書き込みばかり
ファンボーイって指摘されてる人だけ勝ち誇ってる RDNA2がスペックでRTX3000に負ける気は全く無いから、値段とラインナップの発表待ち
今一番気になるのは、DLSS対抗機能を用意しているかどうか
流石に性能が大幅に上がってゲーム開発の囲い込みを強化するDLSSを野放しには出来ないだろう
多分AMD独力じゃ不可能だから、MSと協力してまずはXBOXsX向けにDirectMLベースで作ってそう
多分DLSSみたいにMSのサーバーで事前学習させてサンプルデータを作って、それをゲームプレイ時に利用する形になると思う
そして恐らくマルチゲームならXBOX向けとデータを共有できるようにするだろう
ちなみにRISは超解像技術で、低解像度からアップスケールするDLSSとは競合しないから、別の技術が必要
RISは4kを8kっぽくする技術で、DLSSは4kのAA負荷を大きく下げる技術 >>427
それなら、PS4Proのチェッカーボードレンダリング使えばいいんじゃない?
WQHDを4Kに、それっぽくアップスケールする技術だし、PS4Pro(つまりGPUはRadeon)で既に使われてるし。
XSS見ると4Kはアップスケーリング使うらしいので、それをPCでも投入してくる可能性はあるよ。 チェッカーボードでもいいけど、4kレンダリングに拘り持ってる人が多いから微妙
5700XT+チェッカーボードで4kゲームやるのを気にする人は多分いないけど、BigNaviでチェッカーボードは使いたくない人が多いだろう
DLSSは一応4kレンダリングのAAの部分だけを低解像度でやる技術だから、4kネイティブと言えるし受けもいい
だから、似たような機能を用意しないと太刀打ちできない
まあ、DLSSの有効性はAMDもMSも十分承知してるだろうし、似たようなAAをそのうち実装すると思う
というか、NvidiaはDX12Uに割く労力を全部DLSSに使っているからね、DX12U対応に忙しいAMDがすぐに対応は無理
MSの開発力に頼る以外方法がないし、MSもXBOXの性能アップと宣伝材料のためにDLSS対抗機能はほしいだろう >>428
XSX(S)はMLアップスケーリング前提でINT8/INT4演算向けの独自拡張が施されてるって話があるから
市販品のRDNA2で同じことが出来るかは微妙じゃね? INT4/INT8系の演算命令はNavi14から対応してる
Navi10は対応してないけど
まあRDNA2では問題無いはず DX12_2の機能はフルサポート確定してるからXsXの機能が無いとは思えないが >>431
演算モード自体はあってもどういう単位やレベルで実行できるのかは変わってくる可能性があるからな DLSSは理屈としてはTAAU+DLみたいなもんだね。
https://www.youtube.com/watch?v=d5knHzv0IQE
理屈はなんとなくわかるけど出てくる絵がやばい。 シェーダー自体のカスタムは面倒臭すぎてしないでしょ
基本的な構造はRDNA2シリーズで共通にしてるはず
MSの思惑はXBOXsXの技術は全部そのままPCゲームでも使いたいから、XBOXsXとBigNaviの差は最小限にする DLSS2.0はDLSS1.0+RISのパクリでしょ
DLSSだけだとボケまくりだからRISのシャープ化をパクって誤魔化してる
まあ、ゲフォでも使えるフリー素材みたいにしてるからパクられても仕方ない >>429
そこはネイティブと疑似でバーターできればアリにはなる人は一定数は居るでしょ。
例えば、ネイティブ4K60Hzと疑似4K120Hzで、両者が間違い探しレベルでほぼ同じ画質を提供出来れば
「疑似でもOK」って人は結構いそうだし、PS4Proでネイティブ4Kじゃないことを理由に不満は出てない。
ま、PS4Proでその手の不満は出ようがないけどw
>>436
西川善司の3DGE:赤と緑のケンカ再び。NVIDIAが「Navi」の特徴や「Radeon Software」の新機能に反論する
https://www.4gamer.net/games/337/G033715/20190614139/
この記事で、nVidia側の反論の一つに、「RISと同等の機能は数年前から実装済み」と言うのがあるけど
あれの本当にマズイ部分って、「機能は実装したけれど、ユーザーは認知してないし、nVidiaも使い方を今ひとつ分かってなかった」って部分だろう。
つまり、AMDに使い方を提示されて、初めて本当の使い方を知ったって事。 9月10日はリーク解禁日だったかのように情報出てきてるな
NAVI21は160CU 128ROPでHBM2とか そういえば、その記事でNVIDIAがAnti-Lagに相当する機能持ってるって主張してたけど嘘だったよな 革ジャンは大げさで嘘つきだから何も信用しないことにしている
ラデ使いとしてはGameWorksがマジでクソ邪魔だから早く排除されてほしい https://twitter.com/_rogame/status/1304620727665078273?s=21
"Navi22 SKUs should compete with 3060Ti/3070/3070Ti
Navi21 SKUs should compete with 3080 and up"
これは期待していいのか?
https://twitter.com/5chan_nel (5ch newer account) bignaviってもメインストリームの方
vegaでいうと56の方
ミドルから切崩すのはAMDとしては正しい戦略だと思うよ Navi22か21かわからんが2080tiクラスの謎RADEONがベンチマーク出てきたぞ Bulldozer発表前にIntelが焦って3950Xとか出したけど、所詮6コアだし8コア4.2GHzのブルドーザー発売直後に半額値下げくるかw 3種類あるらしいし
BigNavi Navi21 3080/3090対抗、5700XTx2
MiddleNavi Navi22 3070対抗、2080Tiくらい、5700XTx1.4
SmallNavi Navi23 3060対抗、5700XTx1.1
とかかな 転送データ遅延によって性能がスポイルされている現状、
RTX3090使っても2080Tiの1.3倍しか性能向上が出来ない。
その為のRTX I/O(DirectStorage API使用)も備えるが(@ABをGPUソフトウェア代替)
DS API使用開始時期は2021年以降。それを採用してくるゲームもそこから開発して2〜3年後。
演算器増やしても処理するデータが遅延して来ないんじゃ演算のしようもないのが現状で1.3倍に収まると。
下記は上記RTX I/Oの元とも言うべきPS5 I/O Hardware Unit
カーマックが64コアthreadRipperで同様の事をしても無圧縮時M.2で4GB/s、キャッシュが効いて6.5GB/s。
RTX I/Oは1/2圧縮時14GB/s(threadRipper24コア相当但しCPU1/2コア占有)
どうみてもPS5の専用I/O Unitには勝てない。
今RTX I/Oも使えない状態で高いGPU買う必要はないってのが正解だろう。
コスパ悪すぎる。
【Storage I/O Unit】
@2つの専用I/Oコプロセッサ[メモリ,SSD](ハードウェア)
AメモリSSD間DMAコントローラ(ハードウェア)
Bkraken圧縮展開エンジン(ハードウェア)
CSRAM[展開作業エリア]
Dコヒーレンシーエンジン
EGPUキャッシュカスタムスクラバー
【SSDコントローラー】
FSSD Custom Flash コントローラー(ハードウェア)
※Optimus Data placement Unit >転送データ遅延によって性能がスポイルされている現状、
ロード中以外に読み込みは大して発生していないから関係無いだろう
演算ユニットの構成が変わってFP32の理論性能が数値上は倍になったけど
実際にはそこまで性能が出ないだけでは
>GA102では、16-wayの32-bit整数ユニットが、整数演算だけでなくFP32浮動小数点演算積和算も実行できるようになった
https://pc.watch.impress.co.jp/docs/column/kaigai/1275220.html >>453
それならそれで昔のGeforce FXと同じ失敗をまた踏んだのか
余計にRTX3000番台は買う必要がないな FP32は理論上倍になったけどINT32はそのまま
今まではFP32とINT32が大体1.0対0.4の比率で動作していたのが
>>453の改良で1.43対0.57で動くようになった…と考えると
FP32の数値程ベンチで数字が出ないのも説明できるのでは
>実際のシェーダ処理において,INT32演算は画像テクスチャ処理に関連した各種論理演算などでけっこう使ったりする。
https://www.4gamer.net/games/421/G042134/20180913178/
https://www.4gamer.net/games/421/G042134/20180913178/SS/009.jpg まあ純粋なFP32演算させれば倍近くでるんでないの? https://www.reddit.com/r/Amd/comments/iqx4h7/rdna_2_is_monstrous_insane_cache_system/g4vb9ke/
・メモリ帯域幅は512bitではない。128MBものキャッシュで補う。
・GDDR6。HBM2は来ない。
・クロックはGPUにしては高い。バス幅抑えてクロック上げたかった?
・RX6900, 6800, 6700はそれぞれRTX 3090, 80, 70とぶつかる。
・価格がRTXより高くなることはない。
どのスレッドに貼られてたか忘れたけど、あまり話題になってないね。
リーカーの話題にAMD公式がredditで反応したらしい。 >>458
ソースはリーカーじゃなくてアクセス稼ぎのYoutuberちゃうのん? そもそもパイプライン固定機能ユニットを偏重して使用させることにより他社の排除を行ってきたのは他でもないnvidiaだ
RDNA1でROP盛りされたから演算重視にシフトさせるんだろう
まぁもう遅いと思うけどね 最近のリークって脳内妄想ばっかりでリークって感じがしないんだよな >>458
3090が2ダイでメモリクロックが21Gbpsだと偽リークを流した奴を鵜呑みにしちゃうのか…
Nvidia Ampere 3090 Contains Second Die & 21Gbps RAM Confirmed | Spencer Discusses PS5 Design
https://www.youtube.com/watch?v=Ric5AzKRynw NVIDIA、最近Appleよりもリークさせないで発表に持ち込めるの上手い気がする
頭悪い日本メディアに謎の半導体企業なんて言われてるのに titanから90にしなきゃならないほど追い込まれてたんかい
知らんけど AMD有識者によれば、RDNA1の256bitバスはRDNA2の128bitバスの帯域しか出ないらしいぞ >>458
128MBものキャッシュを実装したら、それだけでダイサイズがはね上がりそうな気はするが。
確か、Vega10のL2キャッシュが4MB、Polaris10が2MBだったはずで、L0+L1+L2で128MBだとしても
素直に512bitのGDDR6使った方が安上がりになりそうな気はするが。
Navi10ってキャッシュ量(L0、L1、L2)、どれぐらいだっけ? VRAMをキャッシュとして使うという意味とか
ならキャッシュじゃなく普通にアクセスしろよって私も思うけど
キャッシュと名ばかりの何かと予想 >・価格がRTXより高くなることはない。
高かったらラデなんて誰も買わんのだから当たり前だよな Bignavi $999
MiddleNavi $699
SmallNavi $399
とかだろうな、これ以下だと利益でないだろうし出す意味がなくなる
ここで安売りしすぎると、来年の5nm RDNA3が更にコスト増大になるのに安売りしないとならなくなって苦しくなる
サムスン8nmをヤケクソ安売りしてるRTX3000に無理して付き合う必要はない
Nvidiaは再来年の5nm ホッパーでコストがかなり悪くなって、そこで多分死ぬほど苦労するだろうな
サムスン8nmとTSMC 5nmを同じコストで製造できるわけがないんだから、ゲフォユーザーは絶望しそう >>467
16x40/128x4/256x16
640/512/4096=5248/40CU
L3迄付くかは微妙だがキャッシュはまぁ増えるだろうな
128MBまで行くかはわからんが
予測が当たってりゃデータフローがローカルでブン回るから
全域キャッシュをリッチにせんとデータバスに待避したデータがゴリゴリに圧迫してくれる RDNA2のレイトレ、infinity cacheのおかげで速そうだな >>471
流石に128MBはふかしすぎだなぁ。
RDNA1では、Wave32×2で回すと、L0/L1キャッシュがつまってストールするのでGCN互換モードで動いているそうだから
L0の容量か速度を倍にしないと、せっかくのWGP構造が殆ど意味が無いとかで、キャッシュ周りには手を入れてくるとは思うけれど。 一万円クラスのGPUが全然進化しない。7万もするようなもんは買えないから低クラスが底上げされてほしい 旧世代GPUの投げ売りとか中古とか買えば、元値7万位のハイエンド品でも3〜4万で買えるぞ、っとマジレス RX6000のボードがFortnite内で公開されてるけれど、見た感じVIIと同じような形をしてるので
性能は不明だけど、クラスと消費電力としてはVIIの後継になるカードだろうね。
ただ、仮に性能が2080Tiと同等のカードが出たとして、それが300ドル(アスク税込みで4万円)ぐらいなら
十分にAmpereを吹き飛ばすインパクトはあるだろうね。 >>478
ワッパ50%削減して2080tiレベルならあんなクーラにしないと思うけどな あのベンチマーク結果は初期ES品故に7割から8割くらいのクロックのもの
製品版に向けてクロックと電圧をもってった結果熱々だから3連ファンとかのほうが可能性高そう ワッパは50%よくなるのであって、50%削減すると悪くなるやろ アーキテクチャ改良とクロック向上があるから最低でも10%は性能アップはしてるはず >>478
話わからん奴のようだが最上位の999ドルのモデルは2080tiほぼ同等意味わかる
産廃なの意味わかる? 5700XTの2倍の性能で2080Tiの40%〜50%上っていう当初の話はどこいった >>485
2080tiレベルのものは出てきたがこれがどのグレードなのか不明なんで妄想してるだけ AMD CEO Dr. Lisa Su to Receive Semiconductor Industry's Top Honor
https://www.techpowerup.com/272223/amd-ceo-dr-lisa-su-to-receive-semiconductor-industrys-top-honor
リサ・スーが半導体業界の最高栄誉である、ノイス賞を受賞、だとか。
AMD Radeon RX 6000 Series RDNA2 Pictured Some More, Including a Smaller Twin Fan Variant
https://www.techpowerup.com/272216/amd-radeon-rx-6000-series-rdna2-pictured-some-more-including-a-smaller-twin-fan-variant
あと、トリプルファンの下のモデルとして、デュアルファンも出てきた。
何というか、フェイク臭しかしない画像だが。 3080が10万円前後だそうだ
RX6800はどう出る? 3080のレビューが出たけれど、消費電力に目を瞑れば、概ね公称通りの性能アップとは言えそう。
AMDとしては、Ampereはあまり警戒しないでも良さそうなことを分かっていたからの沈黙、と今ならそういう見方も出てきそうな。
Ampereスレでは、nVidiaがBigNaviを警戒しているのもさもありなん、って感じの阿鼻叫喚な様子。 >>490
産廃しか出せないんだが
navi21の競合が実性能だと3070に到達できるかもしれないってぐらい産廃で699ドル以上するんだぞ?
お前期待とかそんなこと言えるのか?
Nvidiaに対抗できるのは天才Rajaが作ったXeだけなんだよわかるかな?わからねーだろうなー RTX3080のカタログスペックで実性能あれだけ?ワッパよくなってない?なのは
やり場のない気分になるよねw 旧世代のボードに100w盛ってぶん回したのか頑張ったなw Radeon VIIを導入するのに、電源交換したり、初めてステイを導入したりしたのが今では可愛く思えるなw >>490
FX-8150(RX 5700)とIvy(RTX 2000)が対抗してて、先にHaswell(RTX 3000)が出ちゃって、FX-8350(RX 6000)を待っている状態なんだが PS5は11月12日発売。通常モデルは税別49,980円/BDなしは39,980円
https://pc.watch.impress.co.jp/docs/news/1277596.html
>GPUがRadeon RDNA2-based graphics engine(最大2.23GHz、10.3TFLOPS)
まぁ、普通にGPU部はRDNA2だよね。 >>497
RDNA1でしょ
RDNA2なら196bitか128bitのどちらかなので違う そらそうやろ
RT適用するにあたり相応のテクスチャとジオメトリー組んどるんやから そういやRADEON VIIも699ドルだったな
震えて眠る https://www.ys-consulting.com.tw/news/91715.html
「TSMCが5nmを6割増産」
AMDも大型顧客だそうですが、何作るんだろ、と考えると
やっぱHPCのためのCDNAですかね。ZEN4はまだテープアウト済んでないでしょうし。
なおPS5やXsXのAPUは$199位なんでしょうから、$399位で5700XTは普通に
超えるボードは作れる・・・のかなぁ。 >>506
出荷規模的にx86-CPUとスマホ向けSoCが大半かと RDNA2からAV1のHWデコーダがつくみたいですね。 >>506
AMDの製品の8-9割はCPUだぞ、GPUは1-2割程度だ
CPUもGPUも9割くらいが一般向け、HPCやサーバー向けは1割くらいしか無い
優先順位や需要はZen>>RDNA>>CDNAくらいだし、増産したら当然Zenを最優先で作る 林檎ちゃんのチップ⭐︎ 7mmと5mmは設計に互換があるらしいから
ダイサイズで問題でなければ切り替えも数ヶ月で出来るのでは?
テスト自体は前からしてるんだし >>513
初代Pentiumと競ったK6で350nm/250nm
50分の1になったんだな >>514
N7>N7P>N6とN7+>N5がそれぞれ互換だったような
N7PはAPUで使ってるからRDNA2はZEN3と同じN7+と予想してた ゲーム機向けAPUはN7Pだけど
PC向けAPUは7nmじゃなかったっけ? https://www.freepatentsonline.com/y2020/0293445.html
キャッシュに関する新特許らしい。
「Adaptive Cache Reconguration via clustering」で、クラスタリングによるキャッシュ再構成と和訳するべきか。
キャッシュ回りを触ることで、IPCは上がるだろうから、性能的には上振れ要素と言える。 >>518
そうだけど今更N7は無いと思うから触れなかった >>519
これ誰も触れないけど凄いことだよね。
キャッシュラインのクリアを任意の場所を選んで消したり残したり出来るって書かれてるので局所性が高いデータを残してレイトレ性能を上げる事が容易になるし >>519
https://adwaitjog.github.io/docs/pdf/sharedl1-pact20.pdf
その特許に関する論文もあるよ
パフォーマンス22%向上(最大52%)
特定のアプリでエネルギー効率49%アップだって
これ程の効果が1CUあたり0.09mm2増やすだけで得られるってのも凄い いいね
ほとんど興味なかったけどテンション上がってきた キャッシュは、性能を左右する重要な要素だから。
「Adaptive Cache Reconguration via clustering」の、Clusutering(纏める)とvia(貫通する)から
「キャッシュを纏めて縦断的に使って再構成する」って感じだと、HBCCの延長線上にある思想に思えるね。 そりゃキャッシュの構造なんて毎回変わるし改良もされていくもんだからな
HBCCもあれで完成じゃなく、あれがベースになって今後発展していく
それがPS5やXBOXの高速SSDでありPCのDirectStrageなんだろう >>527
キャッシュが重要なのは分かってはいるんだけど、
例えばHBCCはHPCなどでしか有効に動かなかったから
キャッシュ内容に手を入れる技術には半信半疑というか、なんというかね フロー上は十分なキャッシュがあれば下位帯域だけでなく、内部帯域も節約出来るから
GPUにとっては今後マストになりそうではある
配線地獄を配線マジ卍くらいには出来るだろう >>529
既存のゲームはVRAMの少ない容量でデータをやりくりするように作られてるから、
HBCCでメモリ空間が512TBになってもVRAMしか使わないよ
HPCとかは、そのへんを柔軟に設計するから、HBCCでSSDやメインメモリも活用することが出来る
DX12やVulkanとかもメモリ管理をHPC並に柔軟に設計できるから、HBCCを有効に使えるゲームを作れる
PS5やXBOXとのマルチゲームならHBCCとの相性も良さそうだけど、ゲフォに忖度してキャンセルされるだろうな >>531
自分的にはあれはHBMメモリをケチっても
性能に悪影響がでないようにするのも目的の一つだったと思う
だけど、当初言われてた2GB/4GB版がでついぞ出なかったのは、
想定通りに動かなかったのか、あるいはHBMメモリの高騰が原因なのか分からないけど 想定通りには動くだろう
そういう風に設計してんだから
ただまぁ想定通りに使えるSWと、それを書ける奴が居るかどうか その調整(アプリごとの)に苦労してたらしいよ
自動振り分け出来れば夢のような技術だったと思うけど
手動調整を求められるんじゃあね 今回の特許はHBCCの外部キャッシュがメインじゃないから気にする必要ないと思うが vram増やせばいいという逃げ道がないぶん不安しかないんだが どちらにせよエンスー向けは300W超で回せるだけ回すよ
意外と3090に並んじゃうかもよ? Adaptive Cacheって複数のCUを大型L1 cacheに繋ぐってだけの話だぞ
その結果内部帯域が改善されてパフォーマンスが向上するってわけ
似たようなことはRDNA1からやってる >>538
>521の書き込みによると、キャッシュライン単位で管理するものらしい Navy Flounderは40CU 32ROPかな Navi2xシリーズは結局ハイエンドじゃなくてミドルクラスだな
RX6900やRX6800というよりRX6700とRX6600とRX6500か >>541
2080tiレベルちょい超えだからなー APU用と考えれば、開発リソースはミドルハイ以下で十分というのも理解はできる。後はコスパ APUも8000円のローエンドGPUに少し劣る程度を統合してわずか4万円という高コスパだし、6000シリーズも期待できるな 最近ふと思ったのだけど、WGP構造ってGPU版Bulldozerって気はしてきた。
構造的に、CU=コア、WGP=モジュール、共有L1キャッシュ=共有L2キャッシュと
どことなくクラスタードアーキテクチャを連想させる。
CPUでは失敗作の烙印(商業的には実際に失敗作だったが)を押されたクラスタードアーキテクチャだが、GPUだとどうだろうな。
bulldozer系はSIMD使ったエンコードやスループットの処理能力は良好だったので
SIMD系の処理がメインのGPUなら、CPUとは打って変わって輝きそうではある。 PS5がストレージから読み込んだデータのマッピングを専用ユニットがGPUに通達してGPUはメモリの書き換えられたキャッシュラインだけフラッシュしてパフォーマンス落とさない仕組み持ってるけど
この仕様地味にAMDから採用された製品出るかもねって説明の時匂わせてたから似たような機能はありそう >>545
アレが優秀だったのは整数とIO
適したコードだと軽くSB抜いてるのもあった
WGPは多分RDNA2で大分見直されてると思うよ
CU自体が色々変わってるみたいだし
>>546
似たような機構は仮想化で使うからGCN1くらいには付いてなかったか RTX3090の話。
PALIT launches GeForce RTX 30 GameRock series, with TDP up to 420W
https://videocardz.com/newz/palit-launches-geforce-rtx-30-gamerock-series-with-tdp-up-to-420w
TGPは420Wだとか。
凍ったようなデザインが、まるでギャグのようだ。
>>547
ま、なんとなく似たような構造してるな、って思ったぐらいでしかないから。
ただ、Wave32×2で回すとストール起こすし、そのため2つあるスカラユニットも1つしか使わないとか
結局はGCN互換モードで使ってる、ってのは些か本末転倒な気はするけれど。 Wave32x2で回すとストール起こすってソースあるの?
初めて聞いたが >>547
整数というかマルチスレッド環境での総スループットかな(FPU酷使するエンコードも速かったから)
結局CPUのスループット特化はイラネされてzenになったけど
GPUのスループット特化(これは「特化」というかそのための「効率的な設計」と言うべきか)は間違ってないから
そう否定的な根本的な構造変更はされないと思う >>550
んー
スループットを維持するためのメインバス以下が逼迫してるからな
否定的とまでは言わんが結構手が入ると思うぞ ぶっちゃけRTX3000出た時点でBignaviは出なくてもゴミだって分かったし何をどうやっても改善できないから終わってる 自分も>>549と同じ疑問がある
RDNA1はwave32x2だとストールするからwave64が基本ってソースあるの? RadeonSIのいわゆるオープンドライバがw64動作
その方が性能良いそうだ いやだからソースを……
匿名で根拠もない話をそう鵜呑みはできんて AMD Navi 21 to feature 80 CUs, Navi 22 - 40 CUs and Navi 23 - 32 CUs - VideoCardz.com
https://videocardz.com/newz/amd-navi-21-to-feature-80-cus-navi-22-40-cus-and-navi-23-32-cus
Navi10からCU2倍クロックも上昇でこの消費電力ってワッパがヤバいぞ RTX30対抗でクロック押し上げた感じか
5700XT OCがあれだし実行性能は大して出ないだろうな フェイクだとしてもたかだかワッパ1.5倍で2.5GHzとか浪漫があってええやん ワッパ1.5倍でクロック2.5GHzだと、CUの性能がかなり落ちてることになる
40CUで2GHz、CU80で1.8GHzくらいになると思う Navi22のクロック2500MHz?
すでに出てるベンチ結果はNavi22かなぁ クロックそれだけ上げて、ワッパ50%アップならマジックだな。 キャッシュラインを見直して余計なメモリアクセスを減らした結果なんでは
特許の通りなら ターボクロックはあまり期待しない方がいい気がする
水冷使った場合のみ達成できるクロックとかネタありそう これ5700XTが定格以下のクロックでリストアップされてるから
Navi22の2500MHzもまだ最高到達点では無い可能性も…いやいや流石にそんな ハイクロックは割と十八番なとこあるからな
DEC/Alpha系列を思い出す ハイクロックとGPU内でのデータの再利用に重点置いていて、
演算効率が良いというのが段々判明してきて興奮してる。ほんま名機HD4800シリーズの再来 LinuxのNCNNベンチ(ニューラルネットワーク系)だとVega7のほうがTitanRTXよりも
早いんだそう。
https://www.phoronix.com/scan.php?page=article&item=realsr-ncnn-vulkan&num=1
やっぱRadeonってドライバの出来が悪いだけでハードの素性は悪くないんじゃないですかね。
それも今スパコン絡みで徐々に手が入ってちょっとずつ前進ギミなのでは。 >>560
RX 5000シリーズの販売妨害はやめろ! >>574
vulkan使ってるからなあ
Windowsのゲームでもvulkanだとradeon結構強いし XsXの新機能がRDNA2頼りだからDX12でも差が縮まると良いんだが
ValveのACO版ドライバもくるからVRも行けそうだし DX12の差が縮まったらダメだろ
今以上に突き放すべき GameworksとCudaの問題。
オープンでは遜色ないが囲い込みで真価を発揮できない >>570
WGP=モジュール構造といい、ハイクロック志向といい、Bulldozerの特徴にますます似てきてるな。
>>549
直接のソースは忘れたが、AMDのGPUドライバ担当者の言ってること聞いてると、ストールは起きてる。
単純に考えても、1クロックあたりでSIMD16だったのが、1クロックでSIMD64(32×2)が来たらL0キャッシュが足りなくなる。
それに、当面の解決は難しいのか、GCN互換モードでも性能出るような改良にしてきてるし
根本的な解決は、L0キャッシュの増量or速度上昇だが、どっちも全体のバランスが変わるので難しいだろう。
2つあるスカラユニットを、1つしか使わない、ってのもストールを防ぐ為にそういう動作にしてると考えると合点はいく。
それでもL1キャッシュのお陰で、レイテンシがGCN比44%削減出来てるので、そのあたりをどう解決するのか、だなぁ。 RTX 3080 Crash to Desktop Problems Likely Connected to AIB-Designed Capacitor Choice
https://www.techpowerup.com/272591/rtx-3080-crash-to-desktop-problems-likely-connected-to-aib-designed-capacitor-choice
Ampereは、やはりBigNaviのプレッシャーで相当無理してたんだろうな。
nVidiaって定期的にハードウェア的なやらかしをやるなぁ。
2代続けてやらかした、ってのはBigNaviの性能次第だとかなり苦しい立場になりそうな気はするが。 >>580
ストールが起こるとして、RDNAではWave64をWave32x2に分解して実行するから変わらなくね?
それにSIMD16で実行するとしたらSIMDユニットの効率は半分に落ちるから恐ろしく無駄だと思う
https://gpuopen.com/wp-content/uploads/2019/08/RDNA_Architecture_public.pdf >>583
それ自分で書いてて答えになってると思うのか 答えではないが、実際の実装がどうなってるかなんて誰にも分からんでしょ
wave64時とWave32x2時でキャッシュの持ち方が変わるとかはあり得るとは思う Wave32x2でのゲーム開発のサポートはリソースが足りないから、当面はゲーム機向け(PS5/XBOX)でやって、PCゲームはWave64を継続してそう
それともWave64→Wave32x2の切り替えはワンボタンや自動的にとかで簡単にできるのかな >>582
SIMDユニット32に対し64と32x2で前者がHighとLowに分割実行される
つまり32を二基引っ付けて動かすのではなく32x2サイクルで実行される
ここでこの64は「同じグループのデータを2回」実行する事になる
wave32式だとデータの局在性は前後に依存するが、wave64代替式だと強制的に同一の2命令が連続する
インストラクションフィードはwave32に対し半分、データフィードは各ユニットLow側処理が実行された時点で次に移行する
wave64でデータが纏まっている関係上、Low側実行の際には64wave全てのデータが揃っている
そして4サイクルでLowを処理するとHighは既にGPRに有り、依存関係のないLow側の該当GPRは解放されて次サイクルに移行する
利用効率は現状64モードの方が大分良いと思われる ちなみに今んとこ割と確度あるデータとしては、RDNA2ではwaveの保持数が20→16に減ってる
これはインフライトwaveに依存するからCUが無変更だと矛盾する
ScalerユニットがSIMDユニット統合型である可能性がある、もちろん他もありえる
一方SIMD32はそのままで、今んとこSIMDsp構成の変更点は見受けられない
他方ではPackerなるものが2→4に倍増してる
これはL1で括った時の同グループ配分のブロックで、RDNA1のスライドに拠ればラスタライザやプリミティブユニット(←PDAだとすると増量が合理的、オヌヌメ)、当該部データ圧縮装置が該当する
それとRBとやらが半減されてる、該当はレンダーバックエンドくらいだがSEあたり8基から4基へと減少
これは正直謎だがtccsの数値が倍規模で同数を維持している事から、データ移動の削減とキャッシュの増強もしくは類似ないし同様の効果の技法が適用されている
これに伴い不要になった可能性がある、要は「要らんもの計算しない」がより前段で実装されていると思われる >>582
スカラユニットは1つしか使わない。
だから、GCNと同じSIMD16×4クロックで処理する。
RadeonSI ドライバーでは RDNA GPU も Wave64モードで各シェーダーを実行するように
https://www.coelacanth-dream.com/posts/2020/07/02/radeonsi-shader-wave64-with-rdna/
・多くのスレッドが同じ CU で実行されるため、L0キャッシュにヒットする確率が高まる
・スカラ命令は 64スレッドあたり 2回ではなく、1回だけしか実行できない
・Wave64 の場合に割り当てられるベクタレジスタ(VGPR) の粒度は Wave32 の半分であるため、1 Wave64 が使用するベクタレジスタの量は 2 Wave32 よりも少なくなることがある
・NGGカリングを有効にして TessMark X64 を実行した時、Wave64 の方が速い
だそうで。
多分、ユニット効率が落ちてもキャッシュヒットが続くならそれをカバー出来る Newegg Insider lists AMD Radeon RX 6000 series specifications
https://videocardz.com/newz/newegg-insider-lists-amd-radeon-rx-6000-series-specifications
ホンマかいな、って感じのリーク情報。
相変わらずnavi21が256bitGDDR6。
過去には、「256bitのRX580と互角だった192bitの1060」なんて事があったけど
本当に256bitGDDR6で3080/3090に対抗出来るなら、HBM2Eや512bitGDDR6を使っていたらどうなるんだ?って感じの情報。
ちなみに、過去のHBM系搭載製品の価格を見て見ると、750ドルならHBM2Eを2スタックは余裕。
初代HBMを4スタックのFijiが549/649ドル、HBM2を2スタックのVega10が399/499ドル、HBM2を4スタックのVIIが699ドルなので
販売価格が500ドル以上であれば、2スタックHBM2Eは載せても赤字にはならない。 ナンバリング見るとRX6900XTが3090対抗?でも性能的には
RX5700XTの2.5倍程度ですよね。3090までいくのかな。いくのか。
値段は安いでしょうし。 性能2.5倍だとワッパ50%アップでもTGP350Wやん。 oneAPIがRadeonでもサポートされる模様
Intel's oneAPI Is Coming To AMD Radeon GPUs - Phoronix
https://www.phoronix.com/scan.php?page=news_item&px=oneAPI-AMD-Radeon-GPUs いいねぇ
ついでRyzen + Radeon環境でもGPUアクセラレート使えるなら素晴らしい >>594
OneAPIはクロノスのSYCL対応で、SYCLはOpenCL1.2ベースのGPGPUで、CPUとGPU間のメモリ共有が出来ない(SVM非対応)
多分One APIではIntel CPU + Intel GPUでのみメモリ共有が可能で、AMD CPU + AMD GPUは出来ないだろうな
多分Intelの独自機能と独自バス限定での対応だと思う
AMDが対応するのはSYCLベースでのGPGPU機能だけだろうな
AMDでのCPU + GPUのメモリ共有はOpenCL2.xかROCm4.0とかを待たないとダメそう DLはTensorFlow-Directmlに期待してる
プレビュー版はPlaidMLより遅かったが正式版はどうなるかね >>596
そのへんはIntelの規格だからしょうがない
だけどOpenCLが身近になるだけも儲けもの SYCL2.2は暫定バージョンで、正式バージョンの最新はSYCL1.2.1らしい
https://jp.khronos.org/news/press
クロノスのプレスリリースにSYCL2.2は無いし、SYCLの最新の発表は
July 12th, 2018 クロノス・グループ、SYCL 1.2.1コンフォーマンス・テストを公開
ちなみに>>599の発表はMay 17th, 2017
どうやらSYCLは1.2.1が当面の最新バージョンで、OpenCL1.2対応で留まるつもりのよう
多分OpenCL2.xは欲張りすぎて多機能で複雑になりすぎてSYCLに組み込むのが難航してそう HWアクセスにOpenCLを使ってるだけで
メモリ共有などはOneAPI側でフォローするってことでいいのかな? >>48で書いた、「AVアンプ+テレビにFreeSync?」で、デノンに続いてヤマハもPS5を見据えた実装する様子。
ヤマハ、10年ぶり新デザインAVアンプは“中も別物”。ゲームも最高な新世代機
https://av.watch.impress.co.jp/docs/review/review/1274345.html
デノン、ヤマハ、と来たので、次はマランツかオンキヨーかな?
PS5が出たことで、AVアンプ+テレビにFreeSyncがもたらされることで、ゲーミングPCの強みは一つ無くなることになりそう。 6万もするアンプやその他もろもろ揃えるくらいなら普通にゲーミングマシン組むわ RTX3070の解禁を10/29(米時間)に延期したってよ
数揃えるためってことになってるけど
意識もしてるよねw ハイエンドでビッグダイとかならまだしも
ミドルクラスの3070でも予定通り数が揃えられないとなると
SAMSUNGの歩留まりって本当に悪いってことかね
TSMCより製造コストが安いはずが実際は高く付いてるんじゃないか さすがに高かったらメリットが無くなるだろうから意地でも下げさせるんでね >>606
3070は400mm2でビッグダイと言える
ミドルダイは200-350mm2くらいのサイズで5700XT 250mm2やRadeonVII 330mm2のことをいう
3060は多分300mm2くらいでミドルダイだろうな クソデカダイだろうとその時点で最高の性能がある物がほしい
コスパとかいう言葉はいらない VEGA64ぐらいまで500mm2ぐらい普通だったんじゃね 5700XT 8GBが250mm2で当初$449だったんだが
すぐに$399に値下げしたけど、250mm2ですら$400前後のコストになるのに500mm2を$549-$599だと赤字じゃないにしろほぼ原価そのままになりそう
出すだけ意味がない存在になって、少量生産ですぐに製造中止になりそう
3080を超えるなら$999とかでも売れそうだし、無理して安売りしなくていいだろう ファーウェイがごっそり抜けた影響で
RDNA1のRadeonより大量に作れて原価下がったとか でもATi時代から革ジャンにはプロセスシュリンクで遅れ取ったことはなかったはずなので
本気なら前世代単純シュリンクまでしてw >>616
XsXのAPUが52CUで多分$199程度で卸しているので、
$399で40CU、$699で80CU位のが出来るんじゃない?
結局、ゲーム機分含める量産効果があるって事じゃないでしょうか。
NVIDIAもそれわかってるから3090なんてアフォなGPU作ったわけでしょうし。 >>615
頭湧いてんのかボケ
7nmArFの250ならどんだけ高くとも$150-$200程度
それ以上じゃ採算に乗らないから「一つ前のノードで馬鹿でかい」ダイ作った方が倍以上優れる事になる そういやNavi2xがHDMI2.1のGame Mode VRRに対応しない理由はないと思うけど30x0世代は対応してんのかねえ。
4kのG-SYNC対応モニタを買うのって相当の苦行だろう。 >>623
Turingから対応済みでしょ。HDMI版G-Sync コンパチはHDMI2.1のVRR 何言ってんだこいつ
turingはHDMI2.1に対応していないぞ https://www.coelacanth-dream.com/posts/2020/10/04/aco-ngg-gfx10/
前に話題になった64 x1と32 x2でのパフォーマンスの違いについての
よく似た事例が書かれてる
フロムスクラッチとはいえ細かい部分はGCNから移植したのかね >>625
HDMI2.1のVRRの仕組みってことでしょ。XBOX ONE XがHDMI2.1のVRRとHDMIのFreeSyncに
対応しているようなもの。 >>624
ちがうぞ。
HDMIトランスミッターのプロトコルの問題だから、GPU側の機能は似ててもHDMI2.0でのFreesyncと2.1でのVRRは別物。
結局G-SYNCモニタは市場で受け入れらず、実装にコストのかからないfreesyncに普及度で負けた。
敗北を認めたnVIDIAがTuringで対応したのはFreesync over HDMIの方。
どのみち、HDMIでfreesync対応のTVも、さほど出なかったので(PCモニタはたくさんあった)本格的に普及するのは次世代CSが出るこれからだ。 LG 2019年モデルはHDMI2.1のVRR対応でG-Syncコンパチ認定だったはず。FreeSync over HDMはSamsung製TV 雑な推測ですが、RX5700XTがRTX2080の2割減位だから周波数2割程度アップで
大体RX6800XT=RTX2080、CUが倍なんでRX6900XT=3080程度になるんでしょうか。 無難なところで3070程度じゃないの
プロセッサ数倍増させてもゲーム性能がそのまま上がってないのでワンチャン AMD Big Navi gets Infinity Cache?
https://videocardz.com/newz/amd-infinity-cache-coming-to-big-navi
Navi21は大容量のInfinity Cacheを搭載することで
メモリバスの帯域不足を解消すると記事に書かれてるけど
本当にこんなのでRTX3080と互角の性能になるのかね?
かつてのPOWERVRのZバッファ不要タイルレンダリングで
メモリ帯域と容量節約で高性能と宣伝してたのと似てるけど
肝心の性能は大したことなかったような RDNA2の標準仕様が大容量SRAMと高速低速帯域混成のGDRR6
Navi21はそれ+HBM2を使ったキャッシュ拡張とかなら
帯域のネガほとんど無いと思うが難しいだろうな >>632
メモリ帯域と容量節約が目的ならどう頑張っても性能は上がらない
キャッシュ効率を上げるのが目的なら性能が上がる余地は十分にある 今回のトレンドは、キャッシュ云々より、どちらかというとSSDからGPUへのデータ直送の方じゃないかねえ。
PS5やXSXの仕様を見る限り、bigNaviにも載るのは確実だろうけど。
しかし、リーク情報では同じようなAPUなのに速度に差があるんだよなあ。
APIなんかの実装で差が出るのかな。 >>637
いや、キャッシュでこんだけ効率上がるならそんなもんより遥かにヤバいパラダイムシフトだぞ 512bitバスより256bitバス+インフィニティキャッシュとやらのほうが低コストで高性能なんだろう
その機能はPS5やXBOXにも搭載されてるはずだけど、XBOXのダイ写真にそれらしい巨大キャッシュは無さそう
https://cdn.mos.cms.futurecdn.net/sxYFVg6RJTviZ93MC8aYLE-970-80.png >>519-523が実装されて実質的な容量が増えただけとか つまり
BigNavi Navi21 RX6900XTは250mm2くらいで5700XTの後継か
どうやって倍の80CUものシェーダーを搭載するんだろう
シェーダーの規模や性能を半分にしてるんだろうか
6800XTは200mm2で5600XTの後継、6700XTは150mm2で5500XTの後継というところかな そうなるとハロー製品(フラグシップ)の500mm2な製品がNavi21とは別に存在するんだろうか
さしずめNavi20といったところかな、それが3080や3090対抗製品なんだろう 今までの情報考えると
21か22かはずっと伏せられてるが恐らくはすぐ出てくるのは3070対抗のモデルだけってとこだろうか 大方機能制限付きES機の性能だろうぜ
コレで漏れた所がわかるってもんよ >>641
Kopiteがnavi21対抗のGA103が来るって言ってるから
文面通り3070より速いのは確実じゃね >>641
Navi21 XT 16GB (AIB - faster than 3070) >>639
CSだと巨大キャッシュを搭載した箱1がPS4にボロ負けの実績残してるんで
インフィニティキャッシュみたいなのはCSだと嫌う可能性高いのよね
まぁだからからかPS5はRDNA1だって言われ続けてるけど 箱の解説見るとレイトレユニットが特許通りテクスチャユニットの横に付いてんなくらいしか見どころなくて
他はほぼRDNA1そのまんまだったからあれがそのままRDNA2ならここまで出てきてる話はほとんど嘘ということになる >523によると、増えるのは1CUあたり0.09mm2らしいから
目視で分かるかというと分からないと思う Intel Sapphire Rapids: MCM Design, 56 Golden Cove Cores, 64GB HBM2 On-Board Memory, Massive IPC Improvement and 400 Watt TDP
https://wccftech.com/intel-sapphire-rapids-mcm-design-56-golden-cove-cores-64gb-hbm2-on-board-memory-massive-ipc-improvement-and-400-watt-tdp/
CPUの話でかなり飛ばし気味の記事だが、SapphireRapidではHBM2Eが使われる、だそう。
構造もZenライクなものとなり、14コアを1チップとした最大4チップ構成。
GPUではなくCPUでHBM2Eが使われる、と言うのも不思議な感じ。
GDDR系などGPUに使われるメモリは、レイテンシが大きくCPU向けには難しい作りになってると聞くし
HBM系もご多分に漏れず、そういう作りのハズ。
ただ、データセンターやHPC向けとなると、細々としたランダムアクセスよりも、ある程度まとまったシーケンシャルアクセスが重要になってくるかもしれないので
これが一般向けに影響を与えることは無さそうなのが残念。 AMDもEPYCでHBM使う話があっただろう
富嶽のA64FXでもHBMが採用されている
CPUで並列演算しようとしたらやはりHBMになるのだろう >>652
ソースもとがzen2 でデマ流したサイトなんだよなぁ >>648
SIE公式のPS5分解動画でRDNA2って書いてあったね 別にレイテンシが大きいということは無い筈
DRAMのレイテンシは少なくともDDR2以降明確に変わってない
駆動周波数変わって無いからな、バスは高速化してるけど
HBMはバス幅が問題になる
実装されてるDRAMは32bitだが一層あたり4枚だったか8枚だったか、で128bitないし256bitを形成してその4スタックで512bitだの1024bitだのを形成する
バージョンとか仕様で変わったと記憶してるが定かではない、調べてくれ
兎に角DDR4/5と比較して幅が広い、吸収のためのキャッシュとのプロトコルが鍵になるだろう GDDR5はDDR4よりレイテンシは大きいけど、周波数が高いから、実際にかかる時間は短いってPS4の時に2chで書いてるの見たことある ハイエンドで3070届くかどうかって、また差が開いてない? >>659
bignaviだぞ80CU使っても3070に勝てるか不明なんだぞsmallhqもっと遅い >>660
3070って言ってたとこが訂正しましたん >>657
つまりパワーでゴリ押しということか... Faster thanだぞ
AIBは3070より速いと言う所まではお漏らしOKってAMDに言われてたんじゃない https://news.mynavi.jp/article/20201009-1387569/
Borderlands 3の結果だけ見る限り、GeForce RTX 3080といい勝負ができそうな感じ
ええぇ? しかしAMDの情報殆どリークで漏れなくなったな
特にベンチスコアに関してはbignaviでもまたなんか起こるかも知れないなこりゃ >>665
CS機の方からもお金が流れてるから期待していいんじゃないかな >>657
実際にかかる時間は短いのではなくてほぼ同等なのだけど見かけ上効率よくできる機能が追加されてるというところだと思うんだよね。プリフェッチだとか。 >>602
家電に付いてる液晶って何で未だに単色なんだろう >>669
そりゃ安いしそこまでマジマジと見るものじゃないしな RDNA2はキャッシュ増大するし、7euだからコストが高くなる
7euで推定130%高くなるらしいがキャッシュ込みで140-150%高くなってもいい
但しHBMを撤廃するから市場価格ではRADEON7同等くらいまでの値段に収まるだろう
問題はGDDR6XとビッグコアのNVIDIAよりも、高くてキャッシュでかいRDNA2のほうが生産性が遥かに高いってことだ
年末緊急投下で供給不安定な3000よりも、AMDのほうが安く大量供給でシェア伸ばせるだろう
AMDにびびって価格その他牽制で3000出したのはわかるが、量産供給で惨敗確定だぜ
突貫工事でビッグコア活かしきれてないし、生産性も非常に悪い
これ多分サムスンとは年末商戦だけの少量生産で提携してて、来年になったらTSMC7nmか、サムスン再設計のAMpereのどちらか投下だろう
供給性の高いRDNA2は3000が市価税込み900-2500$ラインの釣り上げをしたのにたいし、AMDは500-800$帯で同性能だして価格を吊り下げる
そしたらNVIDIAも500-800$のコスパいいカード入れないと詰む自体になる
500-800$で3080並の性能だせる3070sとか投下するしかないやん?
3080路線は無視されて4000sp×2ghzで3070並なのに399$ですとかそういう路線変更だろ >>652
理論上なくもないぞ、HBMメモリは高いとはいえ、高すぎる7nmEUVの1CCXと値段がたいさないんだ
1チップ4-8GBのやつでな
「GPUとメモリ原価は150$だけどカード市場価格は400$です」なdGPU市場よりマシ
PSとかが安いのはあれ原価でチップ仕入れてるからよ
そしてスペースも1CCXとHBM1枚大差ないから、4CCX載せれるTR4用ダイならばHBM1枚は搭載できる
ZEN4×14コア×2の28コア
HBM2E×8GB×1枚
ミニマムなデータ用CDNA1枚
こんな構成のAPU?は作れるわけだし、これでも市価499-799$で飛ぶように売れる。
グラボって市価800$でもAMDとかはチップを100-150$でおろして利益でないの
だけど自社のHBM搭載CPUは原価400$でも500-700$で売れるから遥かに美味しいし手堅く利益でる
なんでAMDもINTELもそういう路線に必死だよ HBMチップは高くて少々でかいが
CPU1CCX50$で8-14コア
HBMで1CCX+のスペースを埋める
スペース足りないからミニマムGPUを乗せる。あるいはでかいiO小さくしてGPUスペース確保
GPU1000spでAPUの販売価格は350-499$、OEM供給価格は259-299$で搭載ノートは999$
こういう路線は現実的になるかもしれない、それのほうがAMD儲け出せるからな
おまけにいまのGPUアーキテクチャ限界でHBM必須+ASICやFPGA必須+コントローラARMもほしいところまでいって構造が変わってしまって
単体GPUのせても売れなくなった
ならビッグAPU路線にはしってTR4標準化とかのほうが合理的でやすいかもしれないと >>673
面白いがCCXとMCMの意味から間違えてる RDNAとか結構手を入れてるのはZENのヒットで資金的余裕ができたからですよねぇ。
昔だったらRX6000シリーズなんてリネーム商法になってそうですが。
売上はNVIDIAの1/5程度のAMDでも食らいついていたり、HPC分野で圧倒してたり
最近は頑張ってるなーという印象。
最近のGPUシェア低下はそりゃ3月に「半年後にスゲーの出るよ」と言ったら
誰も買わないでしょ、という事だと思ってます。 >>677
AMDは新発売イベントで次期製品のレビューしちゃうからな、毎回
次世代はワッパ50%アップ!50%悪い現行製品買ってね!だからな GPUの開発はゲーム機とAPUとHPC向けの需要が大きいし、それなりに売上もあるからな
GCN以降はNvidiaとの競争より、CPUとの連携やゲームやHPC向けに必要な性能と機能を実装することを優先している
サムスン8nm採用やRTX3000の見切り発売とか、最近はNvidiaの方が焦って右往左往して先走って失敗しまくってるよ
AMDはとっくの昔に勝ちを確信して、GPU業界と連携して次世代GPUをマイペースに開発してる RX 590「AMDはとっくの昔に勝ちを確信した」 次世代でわっぱ50%アップなら現行製品はわっぱ33%悪いとマジレス シェーダーコンパイラに機械学習使ってWave32/64を選択したりNGGカリングを強化することが計画されてるらしい >>679
ミスってるね。ARM買収してもここ失敗するかもよ。クアルコム買ったわけじゃないし
クアルコム買収とARM買収の違いは、クアルコムなら「年産3億枚チップだしてるからそれ全部NVにしましょう」→ってなったら年産256-512sp×3億枚の1000億枚のGPUシェアを獲得できる
ところがNVARMはスイッチのほかに別途自社ARMAPUをつくって市場開拓もしないといけない
そういう動きは緩慢だから当面チップつくっても1億枚も売れないよ
いやそれだけポテンシャルあるならとっくに出すよ
だからARM買収しても当面2年はシェア伸ばせな
い。スイッチチップやTV、組み込み、スマホチップを統合しても
年産5000万枚もシェアを確立できない
ところがAMDはAPU中心に世界最大のGPUチップ製造メーカーになってる。
CSで500億sp
APUで300億sp
GPUで200億sp
その他込みで1000-1500億spも製造してる
たいしINTELは年産500億sp、クアルコムは年産600億sp、NVIDIAはたった300億spしか生産してない
AMDはGPU世界一の生産メーカーで、これからさらにシェア伸ばせる
FPGA載せたらどこまで化けるか なんかここ来てRTX3080並のスコアを出せるという噂も出てきたとか。
えー?嘘でしょ?と思ってしまうワタシ。
まぁ実際はわからないが徐々に差が縮まっているのは事実だとは思います。
GPU部門の売上は1/5程度だというのによく食らいついてますよねぇ。
普通だったら無理ですよ。
イメージとしては富士通にバンダイナムコが食らいついているよーな規模ですもん。 Nvidiaは更に上位のダイを用意したらいいだけ
信者の信仰心と金があれば負けないよw >>685
性能は元々互角以上だったよ
GameWorksでクソみたいな性能に劣化させられてただけ
それもDX12世代だとほぼ無効になるから、すごく性能が上がったように見えるだけ BigNaviはDX11のFireStrikeのほうが
DX12のTimeSpyよりスコアが伸びてるんだが
なぜ今更DX11に最適化してるのか TimespyはDX12もどきだからな、意味はほぼ無い Radeonはシェーダクラスタ単位で切替が出来るのに、GPU全体でのグラフィックスモードとコンピュートモードを切り替える性能測定になんの意味が?
こんな切替を多用してたらパフォーマンスの無駄でしかない
自動でタイミングを計ってくれるHWSも積んだしシェーダクラスタ単位で切替を行う様にした方がよい CSがRDNA2なんだからGameWor糞の偽DX12じゃ本当のDX12であるbig naviの足元にも及ばない
AAAタイトルが本当のDX12へ移行するからRADEON6000シリーズを以てAMDが覇権を握るのは間違いないだろうね >>692
VEGAちゃんは続投なんじゃなかった? 正直RDNA2が出て半年後には「半年後には5nmEUVで効率50%アップ」とか言い出して
RDNA2の在庫品が積み上がると思ってるがどうか<どうかと言われても さて、答え合わせ直前だけれど、BigNaviの256bitGDDR6
a-誤報で512bitGDDR6か2スタックHBM2Eを使う(一番ありそう)
b-正しいけれど、全てアップスケーリング(4K出力ならWQHDをアップスケーリング)することで、負荷そのものが半分程度だから十分
c-正しくて、尚且つ競合は3080ではなく、3070Tiレベル
さあどうだろう?
少なくとも、山盛りキャッシュでどうにかなるってことは無いだろうし。 d - キャッシュシステムのテコ入れで256bitでどうにかする >>696
それはないと思うねぇ。
GPUの場合、データ量が多いから、MB単位のキャッシュならすぐに使い切ってしまうから。
キャッシュで何とかするなら、せめて2GBは欲しいところだけど、山盛りキャッシュと言いつつ、たったの128MBらしいから。 ゲーム専用ならメモリ帯域小さくても済むかもしれないね。GPGPU的には厳しいかもだけど。
RDNA系はゲーム特化だからいいんでしょうけどね。 HBM説は無いんじゃね?
真実なら、見事だわ、情報統制 >>698
そのキャッシュが溢れるまでの時間稼ぎと
同じタイミングでのメモリアクセスを避けれたら効果は大きい
先の特許が実装されてるかは不明だけど infinity cache含めVRAMかなり大きくしてきましたね
メモリ容量が多いため一度に行うBVHの生成数を多くとるBOX交差が速いレイトレのRDNA2
VRAMが少ないためにBVHの生成を少なくしこまめに行う
BOX交差よりプリミティブ交差が速いAmpere
ダイレクトストレージが基本になってくると
事前に生成しておける容量に余裕が出来るので
BOX交差が速いレイトレに軍配が上がってくると思いますね 2021年にRNDA3出ますかね。
今の感じだと5nmでCache増やして128CU位載っけてくる感じ?
同じくNVIDIAも8nmから7nmEUVで攻勢かけるでしょうし、
来年の今頃は3090買ったやつ涙目、とか言ってそうですね。 3090買うようなやつは4090出たら買うだろ
というか、Smart Access Memoryを打ち出したから、今後のNvidiaの敵はRadeonだけじゃなくZenやマザーボードも含めたAMDプラットフォーム全体が敵になる
CPUとGPUがメモリアクセスでダイレクトに連携できるなら、GPU同士も当然緊密に連携できるだろう
多分近いうちにマルチGPUに関する何らかの大きな発表があるだろうな >>706
Zen4とRDNA2は2022年予定じゃないすかね。GPUもMCM化してくるかもね。 >>707
マルチGPUは、まずはCDNAかなと思ってます。ゲーム側の対応が必要なので。
それよりもDX12対応、VRS対応、RADEON boost対応かと
RADEON boostが発表通りの効果なら、ユーザーとしては非常にありがたい infinitycacheってdGPUでも「恩恵はないこともない」機能であって
真価としてはSoCとかAPU向けの機能だと思ってるけどどうなん? 確かにcpuとgpuでバスを取り合ってバス幅が
相対的に低くなるAPUの方が美味しい技術ですね。 >>710
あの論文の通りの効果があるなら
「恩恵はないこともない」ではないレベルの恩恵があると思うのだが GPUの泣きどころを緩和出来る機構なんだからGPU全体にとって今後のマストクラスの構造変更だと思う
ぶっちゃけレイトレだのDLSSだのの100倍は価値がある
ここ数年全く変わってなかったデータフィードに対するレンダリング効率が上がったことを意味するからな 次世代はRX-78 RX-77 RX-75のV作戦だぞ
緑のジ軍は壊滅よ Wave32で処理の完了が速くなった分、Infinity Cacheの低レイテンシによって実行ユニットの使用率を高められるとかいう話が 本当に山盛りキャッシュで出してきたことに驚きつつも、実のところnVidiaにとっては悪夢の序章だったかもしれないな。
APUでもキャッシュ山盛り(今だとCU20に32MBぐらい)してきたら、ローエンドだけでなくミドルクラス(ゲフォなら50Tiあたりまで)のdGPUの存在価値が無くなってしまい
所謂ゲーミングノートでのdGPUに革命的なシェア変動が起きそうな。
ラジャはXeのキャッシュに結構な解説入れてた記憶があるので、XeもRDNA2と似たような巨大キャッシュ積んでくる予感はあるよね。
AMDとintelの両方の統合型GPUが、ミドルクラス並みに強化される道筋が示されたことは
nVidiaが勝負出来る領域が小さくなっていく予測が出来るけど、どうなることやら。 NVはそもそももうミドル、ローエンドにあまりやる気がないように見えるが。 既にDG1は演算性能に対しては大きい16MBのキャッシュを持ってる 熱密度で困るぐらいなら、キャッシュ山盛りや!という割り切りなんだろうか? nVが一番危機感抱いているAMDの一番ヤベー所は、新製品の性能アップが計画通りなことだよ
CPUもGPUも、RyzenとRDNA世代に入ってから全てが計画通り
工場生産性も含めて計画・設計されているよ。
リサCEOの手腕もあるが、基礎技術力がハンパない
IntelもnVも簡単には追いつけない 演算で使うバッファが増えてるからキャッシュも増やしてるだけじゃない レイトレ専用コアもテンサーコアも乗ってないのにトランジスタ数的にはNavi21はGA102とそんなに
変わらないんだな。コストはNavi21のほうが高そう。 山盛りキャッシュは、Vegaから続いているHBCCの系譜と考えると
無くなったかと思われていたHBCCの意外な逆襲、って側面も垣間見えて面白い。
当時のHBCCの説明では、「実際に使われるメモリは確保された容量の半分程度」と説明してるし
https://www.4gamer.net/games/337/G033714/20170101002/SS/017.jpg
「頻繁に使われるデータ」と「そうでは無いデータ」があり、そこら辺の制御が上手くいく算段がついたんだろうな。
仮にnVidiaが7nm版Ampereで同じように山盛りキャッシュにしたとして、どうなるだろうね? https://news.infoseek.co.jp/article/toyokeizai_20201029_383482/
TSMCはファーウェイ向け受託製造を停止した後、
その分の生産余力を7nm(ナノメートル)プロセスはメディアテックやアメリカのアドバンスト・マイクロ・デバイセズ(AMD)、
5nmプロセスはクアルコムからの受注でほぼ穴埋めできたという。
謎のメーカーは7nmも5nmも確保できなかった模様 >>723
キャッシュやプリフェッチなどの制御技術は基本的にCPU側の技術だからな
それもいわゆるハイパフォーマンス側、ソコが出来るかどうかだな
正直nvにコレが出来るとは思えん、この分野で言えばIntelの方がまだ期待できる >>722
でも6x00シリーズとしては競合製品よりコストやや↓かもよ
メモリ配線少なめ&GDDR6だし >>723
これなんだよな
発表見てて胸が熱くなっちまったぜ... RDNA2のメモリ機能はCDNAでより生きてきそう MCM化、というかチップレットをAPUに使うものと共通化して
組み替えでGPUにもAPUにも対応出来ると夢が広がりそう あっちはHBMだろうな
グラボ系とちがって結構金かけられるし 今回の高クロック、低消費電力ってやっぱりCPUの経験が大きいんでしょうね。
細かく細かく不要な回路のゲートをオフしたり、高クロックにするために
要所要所で高クロックなトランジスタ使って∞Cacheは低消費のセル使ったり
してて、それってZenでの経験が生きてるんだろうなーと。
多分Zenで使ったトランジスタ回路とか結構流用してんじゃないですかね。 実際問題TBP内でブーストクロックってホントに回るの? 使用回路とその稼働率による
要は稼働率が低くデータ密度が低くなったら消費が下がって、そうなるとハイクロックで回せる
こと処理の速さに関してはこの方式でバランスを取る以上に合理的な動作はない
現行の可変クロックはもうそういうレベルまで来てる
だから回るか回らんかで言えば回るとしか
どっちかというとハイサイクル偏重設計だけどね、面積増えるとGPUは増えた面積に対し余剰な面積が必要になるから
有効率が低下するので 今回、Rageモードなる名称出してきたけど、旧ATiで使ってた名称よね。
あと使えそうなモノで言うと、All-In-WonderとMAXXだな。
今後予定されてるであろう、Radeon6900XT-X2は意外とRadeon6900-MAXXとか付きそうだし
AIWの方は、RadeonSettingの方で、Radeon-All-In-Wonder-Settingとか言って使いそうな気はするな。
それと、X2の方は目盛りにはHBM2Eを2スタック使ってきそうではある。
メモリコヒーレントの関係で、メモリアクセスはキャッシュでは吸収出来ないぐらいに増えそうだし。 >>739
GCN化以降比率には意味があるけどソコ直接繋がってはないぞ >>740
ごめん何と勘違いしてるのか分からない
それまでRBは4pix/cだったのが8pix/cになったって話なんだけど >>741
あんまり意味が無いって事
ソコのバランスは幾らでも変わるし変えられる >>742
あーmacからリーク情報で64ROPとか言われてたけど、実際はリーカーが無知でRBあたりの性能を高めてたって話 NVもSmart Access Memoryみたいのやるみたいやん
しかもIntelでもできるっていう >>744
それいつものネガキャンプレスじゃねえの?
実際にはNVIDIAの方がゴミカスになる定番のヤツ ああ、もしかしてResizable BARなのか
https://composter.com.ua/documents/ECN_Resizable_BAR.pdf
SAMがResizable BARだとすると
Zen3とRX6000限定なのは相性検証が大変だからだと言われてたわ
なおこれの提唱者はHPとAMDである …
○Gefo+Ryzen
○Gefo+Core i
○Rade+Ryzen
×Rade+Core i
AMDだけ損するのでは そんな構成がデフォだったアップルとかいう世界最大企業 先に実装すれば競合に対する優位点になるのに
実装しなかったということは何か技術的な問題がありそう >>673
目が滑って大変だった
どうなってんのこれゲハ板の人?
>>749
今は技術的な問題点は解決したという事なん? >>750
いつも仮定に仮定を重ねた妄想レス垂れ流してる人だろ
RX5000スレとかでよく見る >>751
> 単に後回し
ところがどっこい
PCIeには規格として存在するけど
誰も実装してない規格ってのが割とあるんだぜ
採用一社のみとかもある
素の性能で追い抜かれそうな上にブーストもかかるとわかって
慌てて革ジャンがFUD飛ばしてるんやろ 実装してない規格といえばx32のスロットってどんな形になるんだろ? >>747
PCIe3止まりのIntelの選択肢なんて無いだろ
そもそも最新ハイエンドCPU+PCIe4+最新ハイエンドGPUの組合せでも5〜10%の向上だぞ
それ以下の組合せじゃ1%や2%程度になって誤差程度や意味がほぼ無くなるだけだろう >>754
PCIeって×1の所に電源集中してあとはひたすらデータ線ずらずら並んでるだけだしなあ。長いのでもAGPみたいに二重でもどっちでも行けそう。 折れないでしょ
GPUみたいに巨大なヒートシンク付いてると思ってるのか? GPUスレでGPUの話するとGPUの話してんのか?とか突っ込まれる
ふぇぇぇぇ Windows陣営はSmart Access MemoryだとかRTX IOなんかを繰り出してパフォーマンスアップを図ろうとしてるけど
アップルが出してきた答えは、もはやPCIe経由のdGPUってもの自体が時代遅れだよってことなんかな
567 名無しさん@編集中 2020/11/12(木) 14:37:21.97 ID:vSWHdmqlM
アップリシリコンMacは軒並みeGPU非対応で動画クリエーターらはがっかりモードっぽい
626 名無しさん@編集中 2020/11/15(日) 13:58:27.99 ID:1JlzEzAtM
DaVinci ResolveがM1/BigSurネイティブ対応したとかで一部動画界隈がザワつき始めたな
https://dotup.org/uploda/dotup.org2308783.png
https://youtu.be/SDaUGNoXcb0?t=15m30s
627 名無しさん@編集中 2020/11/15(日) 14:43:39.12 ID:KXgBPPA00
ゲームチェンジャーになりそうだな
628 名無しさん@編集中 2020/11/15(日) 14:44:41.82 ID:KXgBPPA00
ついでに、M1対応のx265とかが出たらさらに変わるだろうね
630 名無しさん@編集中 2020/11/15(日) 15:30:00.97 ID:KXgBPPA00
一応貼っておくか
・ビデオ編集ソフト「DaVinci Resolve」、バージョン17.1でApple Silicon最適化 M1搭載Macで最大5倍の性能向上
https://www.itmedia.co.jp/news/spv/2011/15/news019.html M1はiGPUとしては速いけど
Tiger LakeやRyzen 7 4700GのiGPUの2割増し程度に過ぎないから
dGPUには全然かなわないでしょ。 >>762
M1はこれ以上性能を下げようが無いローエンドなんだから、Renoirを上回ってりゃ御の字だろ >>763
そりゃそうだがTSMC 5nmで作ってるわけで
Intel 7nmやAMD 5nmで追いつくんじゃないの、知らんけど。
AppleはdGPUつけられるモデルをいつ出すんだろうねえ。 >>764
CeleronみたいなM1に対して、上位チップにはPCI-Eバスも統合するだろうし、15Wや28Wといった爆熱TDPまで上げてくるだろ
dGPUは来年らしいよ
それより、頼みの綱の5nm APUは再来年か? まあ、相手が14nmだから来年はリフレッシュでも十分だよな >>765
お、来年なのか。
わりと早いね。
Appleから発表があったの?
それともリーク?
> それより、頼みの綱の5nm APUは再来年か?
dGPUつければいいから、iGPU は今程度で十分だけど
それよりも同一TDPだとシングルスレッド性能で負けてる方が気になる。 >>761
メモリショボいのにDaVinciなんかマトモに動くのか? 動くわきゃねーわな
ただ基幹アーキは同じだから今後手を入れなくて良い
M1x2くらいのが出てきてようやく軽ユースに堪えるかどうかってとこでしょ
そも重演算がクソ苦手だし 5倍軽快に編集できて5倍のエンコード時間がかかりそう。 >>761
旧世代機種比較で最大5倍
対抗馬はIntel UHD Graphics 617
400GFlop7クラス
Apple M1 LPDDR5-5500
2600GFlops
妥当というか出たばかりで不安定だから、性能を出し切れなかった感がすごい
LPDDR4X-4266のvega8の1700GFlopsより上だけどそれだけでない? >>771
M1はMacにとって、Celeronやi3クラスだよ
変に対抗しなくていいぜ あんなチップにどんな夢見てんだか
半導体に魔法は無ぇ エンコードやデコードはハードウェアのもの使えるだろうし、デノイザーやフィルターもテンソルチップが使えるので
それなりには動くのかも TSMC5nmとか7nmの交渉してるIntelからすれば魔法に見えるだろうな >>772
スレ名とレスの内容を読めiGPU性能の話だぞ
Intel UHD 617がそんな高性能だったというのかい?
比較対照のMacBookAirは、TDP7WのCore i5 8210Yだぞ
ttps://ark.intel.com/content/www/jp/ja/ark/products/189912/intel-core-i5-8210y-processor-4m-cache-up-to-3-60-ghz.html 比較対象はアイスレイクのG4かG7だろ、何言ってんだこいつは ttps://www.apple.com/jp/newsroom/2020/11/apple-unleashes-m1/
Apple M1チップと8コアGPU搭載MacBook AirおよびMac miniの試作モデル、
1.2GHzクアッドコアIntel Core i7搭載13インチMacBook Airおよび3.6GHzクアッドコアIntel Core i3搭載Mac miniの量産モデルでテストを実施。
すべてのシステムに16GBのRAM、2TBのSSD、リリース前のmacOS Big Surを実装。
リリース前のSafari 14.0.1を使用し、WPA2 Wi-Fiネットワークに接続してテストを実施。
パフォーマンスはシステム構成、ネットワーク構成、ネットワーク接続、その他の要素によって異なります。
Intel 第10世代Core i7-1060NG7 4Core 1.2GHz
ttps://ark.intel.com/content/www/us/en/ark/products/196596/intel-core-i7-1060ng7-processor-8m-cache-up-to-3-80-ghz.html
Intel 第8世代Core i3-8100B
ttps://ark.intel.com/content/www/jp/ja/ark/products/189980/intel-core-i3-8100b-processor-4m-cache-3-60-ghz.html >>778
G4かG1と書いてれば良いのに、G7とi5以上と認めてて草生え散らかすわwww CDNAは情報量がまだ少なすぎて語りづらいな
FP16がマトリクス演算に対応しててbfloat16が非対応って妙な感じだし
素のFP16がbfloat16と同じだとするとFP32の4倍になるしでどういう構成だこれ > また、HPユニット (half-precision, FP16, 半精度) を別に 32基持ち、恐らくは SPユニットでの Packed実行と合わせて、184.6TFLOPS というピークFP16演算性能が可能になっていると思われるが、どのような処理フローになっているかは不明。
どんな実装になってんだ CSみたいに超軽量OS作って最適化すれば速くなるんだろうけど、新OSもBSDベースから変えるのか? 大原さんも最近ボケが激しいよね。
>前略)ダイサイズはおよそ24.0mm×31.8mmで763.2平方mmと推定される。(中略)7nmでここまで巨大なダイはこれが最初であろう。
GA100はTSMC N7で826mm2でしたけど。 A100のSXM4版のTDP400Wと比べてるけど、SXM4版とスペック的には一緒の
PCIe版のA100(TDP250W)と比べるべきじゃないかな。 チップ同じだけどクロック違うじゃん>A100 PCIe ブーストクロックも同じですよ。違うのはTurbo Boost時の余裕でしょ。 売れるのかねぇ
データセンターでも存在感増すといいんだが ROCmでいいというところがどんだけあるかだね。学術利用のところはある程度対応してくれるだろうけど
商用だときびしいかもね。 アメリカ海軍がエクサスパコンに向けてMI50とROCmを導入したレポート
https://emerging-architectures.github.io/amd_mi50_benchmarks/
一応言うとレポートではROCm3.3が使われてるけど現在はROCm3.9.1で進んでる それより今年納品のPerlmutter向けのZen3 EPYCがまだ出てないのはまずくないのか。4月の時点で
あと契約終わってあと数週で詳細を発表と言ったきりになってる。
https://www.nersc.gov/systems/perlmutter/ >>796
今回のTop500に間に合わなかったってことはスケジュール遅れなんだろうね。
ググったら来年に延びたっぽい。
ttps://www.hpcwire.com/2020/11/18/mlperf-debuts-hpc-training-benchmark-with-small-but-impressive-list-of-participants/
our announced next machine coming online in 2021: Perlmutter
Zen 3自体は市販始まってるし、chiplet方式だからEPYCの生産もできてるだろうから
ちょっと遅れて稼働するんでしょ。
Aurora みたいなリスクはないと思う。 GCNからRDNA1または2へとグラボ交換予定だけど
INT16の処理能力はさほど変わらないですか?
具体的に言うとVEGA56→5700XTまたは6700XT予定で
使用ソフトはmadVRです
VEGA56と5700XTのINT16の理論性能は余り変わらないですけど >>796
AMDは既に第3世代のEPYCであるMilanを、
特定顧客向けにサンプル出荷を開始している
ので、まぁ大丈夫なんとちゃう? >>747
SAMに相当する機能はBIOSが対応しないとインテル環境でも使えないのでは intelともNVIDIAとも共同作業中ってどこかでみたなあ。 GPUってCPUみたいにチップレット構成にしてパフォーマンス出せるのかな?
コア部分とIO+キャッシュに分たら、歩留まり的に有利になりそうだけど。 >>802
グラフィクスでは無謀
再帰的に同じデータを繰り返し参照するから旧いCF/SLIと同じような事になる
面積の代償が大きいが多段階の大容量高速キャッシュでUMC/IFとEngineにダイを分割する事自体は不可能では無い
但し、スケジューラのとAPI側の高度化が必須な点が問題
地味にこのレベルのキャッシュ制御と高度なGPUが実装できる企業が著しく限定されるってのもデメリット
ここで使用されるキャッシュ関連は基本的にCPU側の技術だからな、両方出来るようなトコは限定されるから普及し難い >>789
あれは今年PNFの人が書いてたけど
「どこが250Wなんだ?熱が大変なんだが」てことだそうで
正直なんで250W表記のままにNVがしてるのか謎
まあけどAMDも爆熱グラボTDPをそのようにモニョモニョしてたことあるから
やってもいいことなんでしょうな >>803
>ここで使用されるキャッシュ関連は基本的にCPU側の技術だからな、両方出来るようなトコは限定されるから普及し難い
両方できるトコって、AM... >>804
もともとGPUにファン無いんだから筐体のファンがダメなんじゃないか?最近のNVもRadeonも
ボード全体の電力で制御してるのでそんなに発熱量はぶれないはず そのうちintelCPUと組み合わせるとパフォーマンス半分以下とかなったりして >>805
他でも一応intel、IBMあたりがこの辺をクリア出来るクラスの設計を経験してる
ただ一番材料が揃ってるのはその通りで、この方面で行くならAMDがトップ走ってる
やろうと思えばRDNAで言えば3-4くらいには可能と見るね
現状、あまりにもコストが高いんでやるかどうかは別だが Intelは来年Aurora用に出すんじゃないのMCM GPU。NvidiaもHOPPERのHPC向けは来年という噂も。 データセンターはどうせ1チップで済むわけじゃないものだから、ボード、ラック全体でどこになにを組合せてどうつなぐかが問題。 >>809
演算用じゃコレは問題にならんのよ
演算対象をローカルに置いてローカルに吐けば済むから
グラフィクス用だとそのデータを全ブロックが読む可能性があるし、出力先がローカルでは無い可能性が高い
だから共用キャッシュが効くけど帯域が大き過ぎてとんでも無い事になる
故に制御が重要 >>810
だからNvidiaはMellanoxを買ったんだよな
GPUをinfinibandで直接繋ぐ Edge Computing用ボードはA100チップでinfinibandインターフェイスじゃなかったっけ。 >>806
いや、400Wと変わらない消費電力だったて話なのねこれ データセンター用のCPUやGPUのTDPで電源や冷却機器エアコンまで設計の基礎数値だから
違ってたらえらいこっちゃねんで。 バッテリー駆動のノートにやってるみたいに辻褄合わなくなったらパフォーマンス激烈に落として誤魔化すから平気平気 >>815
となると、TDPが不正確だと言われがちなインテルで組んだとこはどうしてんの?
本当は正しい? 割と正しいと思うけどな。廃熱としては。まあ
消費電力としては当てにならないけど。何せアイドルで稼いでた熱容量をあっという間に食い潰すから。 演算に伴う廃熱以外に消費電力何に使われるんだろう?。あ、ファンやLEDのピカピカか LEDで消費する電力なんて誤差よ。
それにデータセンターの場合は窓がなく
光が外部に逃げないので
光のエネルギーも結局熱になる。
Intel のアレは瞬間的にはTDPをオーバーするけど
ある程度の長さで平均するとTDPにおさまるという話なのでは?
電源容量として必要なのは瞬間値だけど
冷却能力として必要なのは後者なので。 >>762
ほぼたいさないよ
2200g、4300uのGPUが基準性能なら、4900hsもm1も誤差程度でしかない
これ以上の性能となると、MX450を最低限超えないと厳しい
そしてAPPLEにそこまでカード、アイディアはない
APPLEのはただの最適化と微細化だけで、高性能化するための取り組みは弱い AMPEREもRDNA2もポテンシャルあるから、次はノートで25-35w、性能はGTX1650-1660くらいのカード出してくるわけよ
次世代MX500とかは1650maxq並みで15wとかやるんよ
たいし林檎はカードない。仮に3nmとLPDDR5載せても、GPU性能はMX450止まりだろう
2年後にその程度で勝負するのは無謀 あとはAMPEREもAMDも微細化で伸びしろが悪化していってる
これを超越するにはもう別のアプローチしかなくて微細化リードはできない
APPLEやARMがすでに微細化での性能向上に停滞していて、スマホやタブレットはコストあがるのに性能伸びないからと
未だに12-28nmプロセスでアークてくちゃ作ってる始末
これがいまの業界の惨状で、いまの微細化路線は失敗しそう
NVIDIAが実10nmの8nm選ぶように、コスパ重視路線のほうが流行りそう 例えば現状求められる需要やら性能のアーキテクチャは
・ただやすいだけの旧世代
・高い超省エネモデル
・AI特化アーキテクチャ
とかになる。この上で微細化はコスト倍数倍に高くなるから、手段としては微妙なんだ
12-16nmのコストが100、歩留まりが90%、性能が100
10nmのコストが120、歩留まりが85%、性能が110
7nmのコストが135、歩留まりが75-80%、性能が125
7nmEUVのコストが180、歩留まりが85-90%、性能が135
5nmEUVのコストが200、歩留まりが85%、性能が145
3nmEUVのコストが250-300、歩留まりが82%、性能が160
2nmEUVのコストが300-350、歩留まりが80%、性能が180
こうなると微細化するたびにコスパが悪化して、いまの微細化は商用システムとしても微妙だろう
というか、7nm→2nmよりも、7nm→7nmガリウムのほうが性能、省エネ、冷却すべて改善
12nmガリウムなら、7nmEUVをコスパ性能で圧倒できる理論、その上電力半分以下
ガリウムのほうがポテンシャル大きい 微細化だけでは語れなくなってるのは10年前からそうなってきているよ。 アムダーはアホなので最近知ったガリウムという単語を使えばなんかすごいぐらいにしか考えてない 窒化ガリウムGaNや酸化ガリウムGa2O3は
パワー半導体(DC-DCコンバーターとか)で使うもので、どちらかといえば強電の分野での方が活用が大きいもので、ロジック回路のための技術そのものじゃない、という認識 ガリウム=大電力という連想と90年代の知識しかないから???だったわ
>>824 にはどんな思い込みがあったのか GaAsは一応LSIでも使われているけど高価だからな
身近なガリウムを使った半導体というとGaNのAC-DC変換回路かな ガリウムは省電力と冷却性が劇的に改善する
これとダイヤモンドアルミニウム冷却版を組み合わせると
ガリウム素材→50%以下の温度、50%の消費電力、IPC10%以上向上
ダイヤモンドアルミ冷却板→銅の2.5倍の移熱力で大雑把に水冷並の冷却性
これを合わせると
ガリウム素材は14nm→7nm、あるいは7nm→3nmEUV以上に効率が改善する
ダイヤモンド合金で熱が抑止できればIPC3-5%、消費電力を1%カットしつつ
ノートパソコンならばただの風冷で水冷並の効力を実現
これくらいの効率改善ができる ACDCアダプタの回路に使うと熱損失が少ないから熱くないという話が
どこをどう解釈したらそういう話になるのかポエマー君の頭の中身どうなってんだろう >>833
純金で回路作ったら効率がいい見たいなはなしで、とんちんかんだと思うよ CDNAのCUは行列演算部以外はGCNとほとんど変わんないらしい >>840
これGPUをMCMで構成するには、という特許ですけど、当然帯域が不足するわけで
InfinityCacheはこれを見越した構成だったのかなー。 https://www.cryengine.com/marketplace/product/neon-noir
Neon Noir Ray Tracing Benchmark - RX 6000 And RTX 30 Series Tested
https://www.youtube.com/watch?v=_QUdZ6-EvS8
レイトレ性能差ありすぎでは。
バウンティングBOX用でも三角形用のBVH構築時間を軽減する為に、
RDNA2はBVHのノード数をあらかじめ16GBいっぱいになる用に作成しておかないと。
AmpereはTAA応用の位置ズラしで1トレース3交差で精度は落ちるがBVH構築回数を軽減してるから、
少ないメモリーでも速度が出る。
左が標準仕様、RDNA2もこれ。右がAmpereが改良した手法。
https://img.nga.178.com/attachments/mon_202009/23/9aQ5-57qfK2kT3cSrw-k0.jpg
現段階だとデノイズしなければならない位にレイトレに完璧な精度は求めていないので、位置ズラし交差判定は上手いやり方だと思う。
いくらInfinity Cacheがあると言っても同メモリー使用量だと三角形交差の時点で差が出てしまう。
GodfallのRDNA2最適化レイトレの様に
16GB一杯までメモリーを使うレイトレをしてもらう様に
ゲームメーカーに促せればだが、どうなるのやらだな RTコアは固定ハードウェアなので、その中に固定機能として位置補間Unitを追加している。
ttps://img.nga.178.com/attachments/mon_202009/23/9aQ5-4vllK1wT3cSxh-k0.jpg
RDNA2はWGP内のLDSを共有して動くモードがあるので
レイアクセラレーターと一体となっているテクスチャユニットを、
CU0がレイトレ用にレイアクセラレーターとして使用。
CU1がレイトレシェーダーテーブル内のシェーダー処理として
テクスチャユニットとして使うなどRDNA2用にさらに最適化してもらえるなら差は詰まるとは思うのだが。
ttps://www.hardwaretimes.com/wp-content/uploads/2020/08/fqvK7bgMNGxQdNKNnHKZHQ-1920-80.jpg
いくら2大家庭用ゲーム機がRDNA2だとしても演算器の数が少ない=RA搭載数が少ないのに
マルチタイトルのゲームで積極的にレイトレを使っていくゲームが増えるのか、
AMDの政治的手腕が問われるところだし、何より後発なら競合より強烈なレイトレーシング機構積んでこいよって言いたい。 位置ずらし法みたいな、人間の視覚への説得力だけ保ってれば真面目な実装は必要ナシ、的な手法はAMDがやるイメージだったな
レイトレ頑張ってくれ >>844
それは無理じゃね
あっちは次の性能64Ttlops確定で勝てる要素ないんだし競ったところでシングルお化けと比較できないから
チップレット路線で逃げるしかないでしょ その高クロックを生かしたラスタライズ性能とInfinity Cacheで、
UE5のマイクロポリゴンジオメトリに焦点を絞った造りの様な気がしないでもないが。
マイクロポリゴンジオメトリ発表後の巷の評判は、
解像度は意味をなさない今後はジオメトリ密度だ、みたいな反応だったし、
まだ静的オブジェクトにしか適用できないマイクロポリゴンジオメトリが果たして本当にレイトレーシングを凌駕するインパクトを与えてくれるのかな。
現段階で、
マイクロポリゴンジオメトリは静的オブジェクト(背景)
レイトレーシングは動的オブジェクト(人)にも対応
2021年になった事だし、どちらが見栄えがより凄いと思えるのだろうかな。 マイクロポリゴンとレイトレは競合する技術じゃないだろ
両方対応すればすごいグラフィックになるけど、それは無理だから当面は片方だけ採用する方向だろう ゲームメーカーも金がないとアセットデータ用意できないから大手以外はレイトレのほうが取っつき安いんじゃね アセットはレイトレだろうがポリゴンだろうが変わらん。 ところでただでさえ入手性悪いRX5000ががが
もうRX480を2倍くらいに拡大した「マイニングに特化したグラボ」をGF12nmででっち上げてそっちの需要を満たしてほしい >>851
今のAMDならいくらで買わせていただけるでしょうか 実はRDNAとポラリスのマイニング性能は大差ないからな
NVIDIAひっくるめて、マイニング性能はメモリが牽引するから、ポラリスに高速メモリのせれば解決する
単にTURING、在庫VEGA、在庫ポラリスを3GBGDDR6の400gb/sに切り替えれば
十分なマイニング性能ははっきできてわっぱも最適化すれば互角になる
ここらへんミスリードなんだけど、メーカーはわざと対応しない。次世代プロセス売るために
それこそ無理なGDDR6のまま700gb/sだとか爆熱めざせばさらに伸びる 量産効果高めたいんだろ
それに今から作って需要なくなったら
大量の在庫(しかもゲームでの競争力ゼロ)を抱えることになるし @レイトレの大きな負荷増加要因はStep2とStep3の処理
ttps://i.imgur.com/zQaA2LY.jpg
AレイトレSampleを増やした場合の処理負荷経過
ttps://i.imgur.com/JQjRwYM.jpg
ttps://i.imgur.com/CR66518.jpg
BAmpereから追加されたレイトレ用ハードウェア
NEW:MOTION BLUR HARDWARE ACCELERATION
[interpolate tri position(time) Unit]
1ray tracing 3 output samples
ttps://i.imgur.com/GhPH5hW.jpg
ttps://i.imgur.com/CjWezQu.jpg
ttps://i.imgur.com/zreRBfH.jpg
RDNA2はBASIC Ray tracing:1レイトレ1output Sample
AmpereはRay tracing with Motion Blur:1レイトレ3output Samples
ここで差が付く
Ampereほどレイトレに重きを置いてないRDNA2はその代わりラスタライズ性能が高い
RDNA2はUE5との仮想化マイクロポリゴンレンダリング連携を見越してのGPU設計なんだろうか ソースがある図表はソースのURL使った方がええんちゃうか? ソース貼られてもどこ見りゃいいかわからんからこっちの方がいいな というか荒らしの可能性があるからimgurの画像は開く気にならない >>855
マイクロポリゴンとかはあんまり考えてないと思う
俺を含めて皆忘れていたような気がするがRDNAはモバイルもカバーするアーキテクチャと最初に発表されていた
https://www.itmedia.co.jp/mobile/articles/2101/13/news069.html
その後のSamsungとの提携は続報が無く正直死産かと思っていたが次のExynosでRDNAを使用するらしい
リサもRDNA3はRDNA2に続いてワッパに重点を置いていると発言してるし
まずスマホに積む前提という視点なら得心がいくアーキ スマホ前提じゃなくカスタムすれば対応できるってだけだろう 860の「モバイル」はノートPCのモバイルだと思うぞ Intelのラジャ御大にRadeonRX6000が贈られたって事は
ラジャ御大、RDNA2までは設計してたんでしょうねぇ。
(RDNA3も?)
そりゃRX5xxシリーズが遅いじゃないかとか言われても
困るわな。前任者の仕事じゃんというね。 >>865
FX-9370より8370の方がうれしいだろ? ラジャ御大が関わったのがRX6800の論理設計で、
RX6900はその後(論理設計が)作られた、とかじゃないかな・・・ 単位億ドル
【intel】 売上高 /当期利益 /データセンター / クライアントコンピューティング
2020年Q4 200.00 /59.00 /61.00 /109.00
2020年Q3 183.00 /43.00 /59.00 /98.00
2020年Q2 197.00 /51.00 /71.00 /95.00
2020年Q1 198.00 /57.00 /70.00 / 98.00
2019年Q4 202.09 /69.05 /72.00 /100.00
https://www.intc.com/investor-relations/financials-and-filings/earnings-results/default.aspx
第4四半期の売上高は、過去最高のPC中心の売上高に牽引され、以前の予想を26億ドル上回りました。
これは、記録的なノートブックの売上高に牽引され、PCの販売台数が前年比33%増加したことによるものです。
同社はまた、Mobileyeの記録的な収益など、予想を上回るデータ中心の結果を達成しました。
1/26発表予定(米国時間)
【AMD】 売上高 /当期利益 /EESC /コンピューティングおよびグラフィックス部門
2020年Q4 / / /
2020年Q3 28.01 /3.90 /11.30 /16.70
2020年Q2 19.30 /1.57 /5.56 /13.70
2020年Q1 17.90 /1.62 /3.48 /14.40
2019年Q4 21.30 /1.70 /4.70 /16.60
https://ir.amd.com/ AMDデータセンタ系の伸びが凄い事になってんなー。
クライアントはやっぱTSMCのキャパがあるから後回しになってんでしょうね。 AMDってEPYCとコンソールのAPUが同じ部門で決算も同じじゃなかったっけ? ゲーム機のようなRadeon使う組み込みは
グラフィックのほうに統合したんじゃなかったっけ The Enterprise, Embedded and Semi-Custom(EESC) segment, which primarily includes server and embedded processors,
semi-custom System-on-Chip (SoC) products, development services and technology for game consoles. From time to time,
the Company may also sell or license portions of its IP portfolio. じゃああくまで作業しやすくするためだけか
AMD、グラフィックス事業を集約した「Radeon Technologies Group」を設立
https://www.itmedia.co.jp/pcuser/articles/1509/10/news152.html 株主からはエンタープライズとゲーミングコンソールは分けろって文句言われてるけどね。
実際のそれぞれの売り上げや利益が見えないから。 ゲーム系GPUそんなに利益率良くないからデータセンターに混ぜ込んで
希釈してんだと思ってますが。
株主としては(利益率が高くないから)ゲームGPUは止めろと言いたくなるでしょうが
そのおかげでゲーム機取れたんだし、そのおかげでZENの開発資金が
調達できたんだからやめるわけにはいかんでしょ。 PS5のジオメトリエンジンって、PS独自の機能だとずっと思ってたけど、設計者の解説だとAmp mesh shaderと全く同じ機能にしか聞こえんかったわ
RDNA3の機能を先取りしたみたいな話聞いてたから、拍子抜けだわ いや違うだろ無制限LoDを勘違いしてる
ドローコールのGPU自身作製を行えるAMP Shaderと
テッセレーションにて頂点増減をしLoDを行うMesh Shader
PS5の独自機能はキャッシュスクラバーで
PS5の特徴はその任意に残せるキャッシュデータを使っての再帰処理
で、Meshと違うのはポリゴンの増減でLoDを作るのではなく
ラスタライズにピクセル変換時に、任意の条件に従って同一ピクセルにまとめてLoDを行う点
ラスタライザがプログラマブルになっているし、Naniteの様にソフトラスタライズでも補完できる
無制限のポリゴンって、キャッシュとLDSをつかった高速処理が出来るから
これはPS3のSPE(SPU+LS)で行っていたPS Edgeの頂点処理概念を基本としている 今年前半は品薄解消は難しいなんて言ってないで
AMDとしてもなんか仲介するとか積極的に動いてほしいわ
TSMCも旧プロセスは値段次第でライセンスする気はあるだろうし >>880
みんな苦しいからなんとかしよ うという発想は日本人くらいのもので
世界では値段を上げて売るのが普通なんだよね。 >>880
馬鹿なの?
AMDも最大限に動いた上での現状だろうしこれ以上はどうにもならんだろ
ちなみにTSMCの16nm以前のプロセスではAMDはCPUは作ってないからライセンスもクソもない
それ向けに再設計する時間も需要も多分ないからやるだけ無駄 GFが作れるのはZEN第1世代だけど、それで充当できる用途って組み込み用位じゃないんですかね。
さすがにそれでノート作っても売れないでしょう。 >>885
amdのgpuめっちゃ買ってくれてたのに 次世代GPUでchiplet化する噂もあるから今年出せるだろうか RDNA 3はChiplet設計
https://translate.google.com/translate?sl=auto&tl=ja&u=http://www.redgamingtech.com/amd-warhol-release-date-rdna-3-chiplet-info-performance-targets-exclusive/
RDNA 3の性能目標はRDNA 2の2.5倍
RDNA 3世代ではRay Tracingは“NVIDIA like”な性能
FiidelityFX Super Resolutionが導入されるが、NVIDIAのDLSSが勝る
インフィニキャッシュの改善
はるかに高いクロック(5nmのおかげ)
Navi 31およびNavi 32はチップレット(チップレットあたり80CU)
Navi 33(ローエンド)はモノリシック
RDNA 3のリリース日は2021年ではない チップレット化するなら、80CUは粒度がでか過ぎて意味ないから、40CU程度でミドル1,ゲーミングハイエンド2,エンタープライズ4(ただし低クロック下)とかかねえ。
ローエンドはAPUに任せるのでその下は作らないとして。 意味なくもないだろう
7nmの80CUで500mm2程度で、それが5nmで250mm2
Chiplet MCM実装のコストもかかるからミドルはそれ一個、ハイエンドは2個
ミドルのロー以下は80CUの一部無効や専用ダイ RDNA2の線対称構造が試作品なのかもな。ソフト的に上下の間の帯域絞れるようにして、性能どのくらいまで行けるか測ってたりするかも。
もし40CU単位で量産できるなら完品の80CUでもコストかなり安くなりそうだしな。 元々GPUは製品として全CU使え完全体が少ないから歩留まり上昇によるコスト削減はあんま期待出来ない気がする。 チップレットということは必然的にメモリがHBMになるから、高コストになってハイエンドでしかしか使われなくなるな
そもそもGPUのチップレット化はデメリットが大きいからミドル以下では無理
正直、500mm2位のハイエンドダイとHBM2x2、それのMCMが最適解だろうな GPUのチップレット化で低コストで高性能なんてマルチGPUに否定的なNvidiaが存在する限り不可能ということ GPUのチップレット化やマルチGPUにはDX12のEMAと対応ソフトやゲームが必須だけど、AMDがやる気があってもNvidiaが全くやる気ない
NvidiaがやってることといえばクソみたいなレイトレやDLSSばかりで、マルチGPUに関連することなんてDX12登場以来全く無い
RTX3000に至ってはSLI端子は3080にすらなく3090だけというクソっぷり
AMDはXDMAという機能を実装して特別な端子無しでPCIE経由でのマルチGPUが可能
そっち方面じゃ負けるのがわかってるからNvidiaは今後もマルチGPU関連は無視し続けるし邪魔し続けるだろうね なんでマルチGPUの話が出てくるんだ?
チップレットとなんの関係もないじゃん Navi21だけど、何処をチップレット化できるかな
https://tpucdn.com/gpu-specs/images/g/923-block-diagram.jpg
大半が制御、演算、キャッシュが占めててそれらは分割出来ないし、メモコンやIOは1/5くらいしかない
演算部分をチップレット化しても、チップレット毎に制御部やキャッシュも必要だから、実際にはミニGPUのマルチGPUみたいにしかならない
つまり 6900XTを作るか、6700XTx2のマルチGPUを作るみたいにしかならない
そうなると、マルチGPU対応のドライバやエンジンやゲームが必要になってくる
それともコマンドプロセッサやインフィニティキャッシュもチップレットに分割するのかな?
それで性能が出るとは到底思えないけど 少し前に出た、RDNA3で使われるChiplet化の特許によると
GPUコア側にメモコン、他のGPUとクロスバーで結合し、クロスバー前にL2、後にL3・メモリって構造にするみたいだけれど。
https://videocardz.com/newz/amd-patents-gpu-chiplet-designs-a-future-of-rdna-architecture
この特許では、CU40×4になってるけど、CU80×2って構成も可能なはず。
仮にIOダイ側にL3キャッシュが載るなら、128MB×GPUコア数(CU80×2ならL3は256MB)ってことも可能な気が。
あと、この特許の図ではメモリの種類を判定することは難しいし、特定する意味は無さそうだけど、GDDR6って気はする。
>>894
仮に5nmでCU80なら、250mm2までシュリンク出来ず350mm2程度に止まるのでは?
IOを外せば250mm2ぐらいにはなりそうだけど、CPUで言うところのCCX跨ぎを減らす為にL2キャッシュはそれなりに大きくなりそうで
結果として350mm2前後って気はする。 >>902,904
メモコンにひっついてるL3 (Infinity Cache)は確実に分離できるぞ
それにただのMCMじゃなくEMIB/SI的な近接実装だろうから
マルチGPU云々やCCX跨ぎの問題はは想定的に小さいと思われる
もっとも、そのへんは5nm製造コストや実装コスト次第だから第三者は想像しかできないけど InfinityCacheを分けても、Zen2/3みたいにチップレット毎に大容量キャッシュが必要になるからあまり意味がないんだけど >>904
CPU
|
マスターGPUチップレット(親機)
| (HBX パッシブクロスリンク)
スレーブGPUチップレット x3(子機)
L3(Infinity Cache)はRDNA2同様各チップレットに内包
但し、HBX クロスリンクによってUnified(結合)L3と振る舞う
※これって該当GPUチップレットのL3にデータが無い際はHBXクロスリンクを介して
他GPUチップレット内にあるL3にアクセスしてデータを取って来ないといけないので効率落ちると思われ
それでもメモリアクセスよりは速いとは思われ
Navi 21の80CU L3 128MB x2チップレットだった場合
ちょうどL3 256MBとなり4Kで不足していたキャッシュ容量が賄える ラジャさんが公開したIntelのGPUのような近接実装なら
Chiplet毎に巨大L2がなんて間抜けなことにはならないでしょ
無論1ダイ/80CUである必要性もないけど、そこはコストの問題 理論上は分散キャッシュで演算命令レベルでコヒーレンシが保ててれば、クロスフィードは最小限で済むんだけどな
そうはい神崎 昨今のディファードレンダリングとかだとバッファにあるポリゴン全体を何度もナメるので
分散っぽいGPUって実装は困難なはずで・・・・
まぁ5nmと物理設計でサイズを1/2にしてギリギリ詰め込んでクロック上げれば
2.5倍になるでしょ<無茶言うな >>904
過去のマルチCPUが出たての頃だとL3は各CPUが共有して、L2キャッシュはCPU毎という構成でした。
この場合、L2とL3のコヒーレントをどう取るかという問題があります。
ハード的にサポートしてもいいがキャシュ間の通信量が大きくなるんでどうでしょうか。
AMDはまだまだソフトサポート力は弱いのでハード的に作るかもしれませんが・・・ 15万円位なら人柱になる準備はできてる
が、不安感が高まる! >>905
InfintyCache(L3キャッシュ)は、確か32MBで27mm2みたいなことをAMDは言ってるので、128MBなら約110mm2、Navi21が約520mm2なので
L3無しのNavi21なら約410mm2、7nm→5nmではハーフノード並にしかシュリンクしないのでダイサイズは2/3の約280mm2。
そこに、L2キャッシュの増強やHBXクロスバーを実装すれば350mm2ぐらいになる気はする。
>>911
CPUは初代Zenの頃から、L3にはL2のデータタグの関連付け(各L2の先頭128KB分をL3に格納)をさせていたはず。 >>913
繰り返しになるけど、そこは実装コストとプロセスの価格次第だからなんとも
コストがある程度以上高いならハイエンド以上をターゲットに80CU基準
foveros的近接実装をミドルまで降ろせるなら40CU単位が便利
自分はfoveros的近接実装をミドルで使えるほど安くはならないだろうから
>さてそのN5、TSMCによればN7比でエリアサイズを45%削減
https://news.mynavi.jp/article/20210101-1620478/
プロセスは↑だから約半分になると思うし、最終的なCUが増えると必要なメモリ帯域も増えるから 書き足してるうちに書き込んでしもうた
>自分はfoveros的近接実装をミドルで使えるほど安くはならないだろうから80CUと読む
>>さてそのN5、TSMCによればN7比でエリアサイズを45%削減
>https://news.mynavi.jp/article/20210101-1620478/
>プロセスは↑だから約半分になると思うし、
>最終的なCUが増えると必要なメモリ帯域も増えるから、倍のメモコン+倍のInfinity Cacheを別ダイにできるだけで十分なはず tsmc、歩留まりどんなもんなんだろうな
何でこんなにPS5の生産が間に合っていないんやろ 7nm以外でも生産追いついていないみたいだから歩留まりは関係ないでしょ
素材不足が原因よ クアッドパターニングだしN7
14/12の頃はよく歩留まりツイしてたAMDの中の人がしなくなったし下がってはいるんだろな?
液浸の限界に挑戦ってN7とIntel10nmだと思うわ >>916
PS5は転売屋が買い占めてるからだろ
確かソフトの売上が本体の1割しかないとか nvが3060のハッシュレート落としてマイニング向けGPU出すとか。
ゲーム向け品の争奪戦は終わるのかな。
終わんねぇか。
GeForce Is Made for Gaming, CMP Is Made to Mine https://blogs.nvidia.com/blog/2021/02/18/geforce-cmp/ >>921
でもそのマイニング向け製品も結局TSMCで作るんだろ? 味の素のせいじゃないぞ
PC用はシェア100%だけど、車載用は独占してないから、車が減産するのはおかしい
味の素は増産を頼まれてないし、頼まれた分は出荷してると言ってる >>923
GA102,104,106の回らないor画面出力できない石の再利用らしいから非TSMC
それで歩留まり上がるんならみんな損しないけど >>925
思ったわけじゃないな。味の素に取材した人が言ってた
YouTubeで味の素と半導体で検索すれば出るよ
車載じゃないが、味の素のIRでPC用は強いが、スマートフォンでシェアが高くないとは明言してる >>927自己レス
GA102なのは上1製品だけで
下3製品はTuring(RTX2x00)らしいね
じゃ12FFNの有効活用か? 元々、Turingは「異次元のマイニング性能をもたらす」って触れ込みで売り出す予定だったからな。
意外とレイトレ関連のハードウェアがマイニングにも効果があったのかもしれない。
その前にマイニングバブルは崩壊したけれど。 Turingのマイニング性能はVega以下だっただろ、異次元とか盛りすぎ マイニングではRadeon強いという話は要するに、ゲームやAIなんかの積み重ねが
効かないから素のGPUのちからが出た、ということはないのかな。
つまりNVIDIAのソフト開発者がシャカリキになってRADEONドライバ書けば
NVIDIAを圧倒できるという可能性・・・・無いっすか。無いか。 戦略だから仕方ない部分もあるけど、nVidia は製品ブランドによってHWのポテンシャル抑えたりするからなあ。
Quadro では OpenGL 利用でフルに性能が出るけど GeForce では性能出ないように抑えてるとか。
マイニング向けのやつも、需要が云々は半分くらいは便乗じゃないのって思ってる(笑) >>933
マイニングはAMDがセミナーしたりチューニング講座を開いたり、全力投球だからですよ? 昔のAMDはGPGPUがクソ強かったからね、マイニングも強かった
今はマイニング対策とゲーム特化でGPGPUは控え目にしてるからマイニングも弱いけどな 多方面にイイ顔すると発熱がやばくなるので辞めたんでしょ、 発熱はあまり関係ないな
ゲームがGPGPUをあまり使わないし、マイニングが強いとユーザーから文句が出るから制限しただけ
結果的に発熱も低くなっただけ 今の所、5nmで今年GPUが出て、5nmでZen4の習熟のため、Zen3+たるwarholが出て
2022年ZEN4が出る(クロック15%増し?それともDDR5でアクセススピード15%増し?)
って理解で良いんですかね。 ■CPUロードマップ
2021年
ロケットレイク(コメット比でIPC1.1倍) RYZEN 6000
CPU(Cyperss Cove)x8コア(14nm) CPU(ZEN3+)x16コア(6nm)
GPU(Xe搭載) . GPU無し
メモリーDDR4-3200 メモリーDDR5-4800
PCIe 4.0 . PCIe 4.0
ソケットLGA1200 .ソケットAM5
USB 3.2 Gen2 USB 3.2 Gen2
脆弱性あり 脆弱性なし
2021-22年
アルダーレイク-S RYZEN 7000(ZEN2比29%のIPC向上)
CPU 8大コア+8小コア(10nm) CPU(ZEN4)x24コア(5nmEUV)
GPU(Xe搭載) GPU無し
メモリーDDR5-4800 . メモリーDDR5-4800
PCIe 5.0 PCIe 5.0
ソケットLGA1700 . ソケットAM5
USB4.0 .USB 4.0
脆弱性あり . 脆弱性なし HBMだったからメモリ帯域で結果的にマイニング強かっただけじゃね?
GDDRになったRDNA→さらに物理メモリ幅が細くなったRDNA2
グラはインフィニティキャッシュでカバーできてもマイニングはたぶん無理 Polarisも売り切れたしアーキテクチャ由来のものでしょ RX6700が3/3に出るらしいという噂を見て
「あれ?RX6700って出てなかった?」とちょっとビビった。
確かRNDA2発表のときに3シリーズ出てた気がしてたんで
6900,6800,6700だと思い込んでいたのでした。 Aldebaran could be AMD’s Multi-Chip Instinct MI200 accelerator with HBM2E memory
https://videocardz.com/newz/aldebaran-could-be-amds-multi-chip-instinct-mi200-accelerator-with-hbm2e-memory
Arcturusの次は、MI200となるAldebaranだそう。
大雑把に言うと、MI100をチップレット構造でニコイチにする、らしい。
かませ扱いだけど、デバフかかってる(1/100に力が抑えられてる)のに掠っただけでバラバラになりそうだ、とか言わしめる
当れば強いであろうグレートホーンと微妙に被りそうな気はする。 >>947
いやMI100とは別モンだぞ
フルレートFP64にパックドFP32もサポートしてるし機能はMI100からかなり強化されてる >>948
そういう細かいところを無視して大雑把に、ってこと。
それぐらいは別物というほどの違いでは無いだろう。 >>950
GPGPUなんだからむしろそこが一番気になるところの筈なのにな。
細かいところ扱いか... 真面目にソフトの方も力入れて欲しい
PytorchとONNXRuntimeは使う機会が増えているから
早目に対応しないとNVIDIAの牙城が崩せない
plaidmlやTensorFlow-DMLでもCPUよりは速いんだが インストールコマンド一発で使えるのと
自ビルドして漸く使えるのでは大きく違う
その差がシェアにも表れている AMDの体力の問題もあるだろ。
ソフトはリリースしたらサポートもしないといけないし NVに勝つには、仕様をオープンにして開発者の協力をしてもらうしかないね。圧倒的負け
もう勝負は捨てるしかない。今勢いがあるから、放置してもいいかもね。
あとはインテルと組むかラジャが移籍したから、それが狙いかもね Intelとの戦争で忙しくて革ジャンごときの相手なんかは後回しなだけ >>958
> NVに勝つには、仕様をオープンにして開発者の協力をしてもらうしかないね。圧倒的負け
アメリカの国家研究機関とCrayのエリート連中が総出で最適化してるぞ
> もう勝負は捨てるしかない。今勢いがあるから、放置してもいいかもね。
捨てるどころか、数年後には逆転すらしてるかもな
> あとはインテルと組むかラジャが移籍したから、それが狙いかもね
Intelは、ハイエンドじゃ虫の息で、ミドル以下を安売りしてシェアと売上だけは維持している状況でしかない まずマイニングバブルが終わらなきゃ・・・
RX5700ですら3倍どころじゃない値段になってるし NVIDIA、決算好調で56%増で160億ドルって、ぶっちゃけ来年はAMD追いつくじゃん。
なんか結構差がついてたと思ったらいつの間にか同等まで来てたんね。 >>964
昔はnVidiaよりもAMDの方が大きかったからな。
Ati買収後のゴタゴタとBulldozer時代で、もたついていただけで
それらが解消されたら普通に追いつくだろうよ。
LENOVO announces its custom Radeon RX 6800/6900 XT which look just like Radeon VII
https://videocardz.com/newz/lenovo-announces-its-custom-radeon-rx-6800-6900-xt-which-look-just-like-radeon-vii
レノボがNavi21のAIBに参入?ってニュース。
それだけならフーンだけど、VII風なRX6800XT。
これが単独で販売されることは無いそうだけど、これは欲しいかもしれないw TSMCのスループットが上限に達してるんだから、安くなっても数が出せない。
高い値段にしてオーダーを絞らせるしかAMDは取れる手段が無いでしょ。
ここは結局はASMLの決死の増産に期待するしか無いわけで・・・・ EUV光源が足りないんじゃないの?
ASMLも増産したくてもできない状況だった気がするんだが >>968
あれ年間で数十台で
しかもフルオーダーだろ どこまでホントかわかりませんが、
https://eetimes.jp/ee/articles/2012/10/news046_4.html
によると、TSMCが60台、サムが20台ASMLに要求してるが、50台くらいが
いいとこ・・・という話も。 まあ一応IntelもASMLから買ってるはずだからね ニコンがEUV露光装置の開発に失敗したのが一番でかいでしょ
Intel今までニコンの露光装置買ってたし ASML以外もEUV生産できるようにならないとこの先ずっと供給不足になりそうだが ニコンも今ヤバいからな
業務機材が売れずカメラも売れずで泥舟状態 この状態じゃ特許切れとかなればやるとこも出てくるだろうけど
どこまで時間かかるか分からんからな EUVについては2016年頃には実用化は銀河系の反対側にある(そんだけ遠い)と
言われていて、ASMLはファウンダリ企業やらアメリカ軍やらから資金援助もらいまくりで
実用化にこぎつけたわけですし・・・・
ニコン1社でどうにかなるレベルではなかった。
バブル後の日本では資金援助する銀行にも全く体力無かったわけですし・・・・ >>971
一番恐ろしいのは今年IntelはEUV1台も買わないらしいんですよ。
マジで7nmから先は捨ててるとしか思えない。 次世代の露光装置は一台500億円ぐらいするんでしょ。 >>977
むしろどっかのFoundryやメーカーは液浸7nmと量産で乗り切る可能性もあるぞ
どうみても量的供給事情の問題で、液浸7nmはコスパや装置で使える
1台50億で7nmeuvの半分の生産力×歩留まりでトータル40%の生産力
たいし1枚の原価は液浸100%のeuvが150%
つまり原価コスパはEUVが70%の液浸100%くらい
市場価格なら液浸は100$から、euvは150$からよ
但し設備代と装置の数で当面1-2年勝負できる。いまはeuvメモリと液浸soc全ブリでもいいだろうと
いやそうみなすメーカーはないのさ、euvで確実に利益を狙いに来てる
EUV装置1台でうまくまわせば年産100万枚レベルで、投資の高さは長期的には回収できつつ
EUVプロセスは歩留まり高く支配的地位をきづける
但し液浸はそのカウンターアタックで一定の地位は維持できる
液浸7nmのコスパは液浸12-14nmに並びつつあるからだ >>963
それは落ち着くさ
既に規制前でRX5700の採掘量は月0.08枚の15万レートで1.2万の採掘
規制×ハッシュ増加で推定0.3枚レートの月4000円までレートは下がる
これだけ下がれば、RX5700が中古5-7万
6700XTが新品6万くらいまで落ち着くだろう
というかRX6000はマイニング性能低いからそこまで悪影響ない 確かに無理してEUVになる必要はない。
が、しかし5nmはEUVじゃないと無理だろうし、結局EUVに習熟せんとあかんのは変わらない。
そして今Intelがやる事はEUVに習熟する事。
大丈夫かな・・と不安にはなる。札束でひっぱたくという手はありますが。 RX6600出ないかなーとか思っておりましたが、多分安いグラボってもう需要ないですよね。
内蔵のGPUでちょろいゲームはなんとかなる時代ですし・・・・
そうなるとRX6600ってOEM以外に需要ないんじゃないかな、という疑惑が・・・ >>982
RX 6600は出るぞ?
ただ安くない 6700が全世代のハイエンドより高いので、6600も5600より高いのは間違いない CDNA2は命令のプリフェッチ機能追加したりキャッシュラインサイズ変更したりでRDNAの要素も含んでるっぽいな 安いdGPUの寿命が更に縮んでしまったのは間違いないな
RDNA3とかローはOEMと選別落ちだけで先進国リテールに出ないと予想 コストと製造量の問題で最新プロセスはハイエンド限定になっていきそう PS5が落ち着いてきた感じがあるし
次はEPYC/Ryzenだろうけど
Radeonもそれなりには作ってくるんじゃ? AMD FidelityFX Super Resolution to launch as cross-platform technology
https://videocardz.com/newz/amd-fidelityfx-super-resolution-to-launch-as-cross-platform-technology
DLSS対抗のFidelityFX SRについて。
どうやらCSでも使えるようになるみたい。
オープンになるだろうからnVidiaも使えるし、実際に対応してくるだろうけれど、nVidiaはどう出るかな。
仮にnVidiaが対応したら、FidelityFXの動作保証をしてしまう形でAMDに塩を送る形になりそうだが。
Vegaまでは、こういうの(DX12とか)は無視してしまっていたから、ゲームでの対応は限定的だったが
nVidiaが乗ってくるなら、FidelityFXSRがDLSSに取って代わるだろう。
>>985
RDNAもゲーム(グラフィックス)の為に、と言いつつ強化点はGPGPUにも有用なモノが基本だから。 FidelityFXって言いにくくて仕方ないんだけど
なんて略するの?FFXとか? ネーミングセンスで負けてる感は否めない
伸びしろではあるが >>989
XBOXが対応するなら一気に普及しそうね >>338
亀だけど、欧州でエクサスケール目標のプロジェクトにも、CDNA第一世代が採用されたね‥‥ >>977
とはいえ、5nmはともかくそれ以降のプロセスの製品は
現実的な値段でPCに降りて手にすることができるのであろうか疑われる状況になってきたわけだな
appleが突っ込む限りはスマホにはくるが >>994
MI100採用のスパコンって今の所あったっけ?
プリエクサスケールのLUMIはMI200(CDNA2)採用だけど >>997
GFの偉いさんがいってたように
ロジックのみ最新世代でそれ以外は旧プロセスなchipletにするしかない このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 215日 0時間 38分 36秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。