AMDの次世代APU/CPU/SoCについて語ろう 295世代
■ このスレッドは過去ログ倉庫に格納されています
!extend:checked:vvvvv:1000:512
___
\._ | 荒らし・煽り・厨房は放置が一番
/|_| | 釣られずにスルーしましょう
|_/\! sage進行でマターリいきますお
前スレ
AMDの次世代APU/CPU/SoCについて語ろう 294世代
https://egg.5ch.net/test/read.cgi/jisaku/1537091701/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured HBM2はAMD、nvidia、intelなんかですでにかなり使われてるよ。
問題は汎用のパッケージには実装出来ないこと。お高い用途では問題なし HBM1の頃からメモリメーカーやIOメーカーと密接に開発を続けていて、標準規格よりも高クロックで高品質な独自技術をモノにしている
HBM3どころかHBM4も開発中、多分HBM5とかもそろそろ始めてる頃だろうか
多分GDDRは6で打ち止めで、それ以降はHBM系を使っていくつもりだろうね >>320
Intelやゲフォ使いには妄想にしか思えないだろうね
まあ、スリッパやEPYCの4ダイ構成や、Romeの9チップ構成とかAMD使いでも発表直前までは妄想の類だったから仕方ない
AMDはいつも想像の斜め上を行くし、AMD自体がローコストHBMを否定しない限り開発は続けて実現するよ ええ、NVIDIAもHBM2の大手ユーザーなの知らんの? メモリメーカーはIntelの要望に応じてHBM3を開発してるという噂 >>325
HBMはあくまで高性能&高価格路線で進められている。
ローコストHBMは顧客が付かずに、既に終わった話しだ。 >>313
作ってくれるFabも使ってくれる顧客もないのにローコストHBMとか
どうやって調達して誰が使うのかと >>327
妄想君の中ではAMDか自腹切って開発進めるらしいw >>313
そこら編はGDDR6との兼ね合いよ。GDDR6が現状だめな理由は、
・ZENのCCXが65平方mm規格
・HBM2が75-85平方mm規格で4GBの現状70-75$、量産次第で50-60$にはなる
・同サイズのGPUがVEGAで1500sp?NAVIで3000sp?らしい
→→→なのにGDDR6は1GB12-15$だがチップサイズは120-150平方mmからで、将来1GBチップを多層化で増やせるがそれでもベースサイズがでかい
というネックがある。
サイズ許容制でAMDAPUはHBMしか選択肢がない。
スリッパレベルまでいかなくても、おそらくやろうとおもえば
・am4でCCXダイは3-4個詰める。CCX+GPU+HBM+容量が許せばさらにCCXおまけでもう一個
定価3.2-3.7万くらい
・スリッパで4-8CCX+GPU2-4個+HBM2-4個いけてコストは最小定価6万の最大12万程度でこれが行ける
データセンター、オフィス需要ならば「冷却と騒音対策簡単なAPU一本化ええし、グラボ買うより安いし、冷却取れるからグラボより寿命はええ」
となるわけだ
またAPU一本化してない従来のグラボとCPUのシステムはTDP関係なしにサーバーブレードに1セットしかのらない
ところがAPU一本化してくれれば4-9本搭載できるため商用性が高いとなる
汎用、家庭用としても鯖、データセンター用としてもコストパフォーマンス的にも一本化APUの恩恵は大きい。
従来のGPUのように1-2年のフル稼働でコアではなくコンデンサやファンがイカれエラーがなくシステム次第で5-10年連続稼働できると
そういう恩恵は鯖、データセンサー、オフィス用として大きなアドバンテージになるからAMDはEPICの進化系としてHBM3載せるだとか構想してるだろう
スリッパが10-20万する実情からすれば50-70$のHBMはそこまで大きなコスト負担にならないし
l3キャッシュレス構造にできるからそういう面でも恩恵がある 例えばZEN1なんかCCX全体におけるl3キャッシュの割合は25-30%もあった。
CCXからl3キャッシュ外せばさらに小型化できるんだよな。
その上でCCX2-3個のl3キャッシュダイとHBM4GBダイのサイズが同じならHBM詰むだろうと
CCXを8-16も積むスリッパはHBMとGPUを3-5枚搭載できるくらい無駄にスペースを食う。
なのでZEN3はl3キャッシュレス構造にしてコア数稼ぐ戦略なのかもしれない
zen2のAM4版は2CCXで頑張れば4CCXいけそうな空間猶予があるが
l3キャッシュレスのCCXダイならば余裕で4CCXないし16コアCCXを2枚詰める。で空いた空間を整理すれば別途HBMとGPUを摘むスペースは稼げる
あと論理的に64コアromeが256mbもキャッシュがあり、ナチュラルにマルチにキャッシュサイズが不可欠な存在で
コアが多いほどスペース、電力や歩留まり、コスト上の都合HBM2-3載せたほうが安いんだろ >>323
ただのユーザーだけどね
最大手はAMDだし、開発もAMDとメモリメーカーでやってるからね >>327
HBM1が似たような状況だったけど、きっちり製品化して販売していたけどね
DDRメモリもGDDRも当初はAMDしか使ってなかったけど、後からIntelもNvidiaも追従してきたのも知らないんだな
前例なんかいくらでもあるし、ローコストHBMの開発も明言してるんだから、そのうち実用化するでしょ
というか、技術の進歩なんて小型化やローコスト化とコモディティ化に行き着くんだから、否定する意味がわからない >>330
マルチコアCPUでL3キャッシュ外すとか無茶言うな
HBMとL3なんて帯域やレイテンシで圧倒的に差があるから代替にはならない >>334
1GBで約50mm2として、8GBで400mm2、16GBで800mm2で、その実装総面積はさらに数倍になる
HBM2なら8GBも16GBも2スタック 200mm2で済む つーかGDDR6ってHBM2より安くなるはずだから生まれたんやろ?
HBM2に容量あたりの単価で負けてるとは思えないんだが
もちろんコストはボリュームによるんだろうけど 最もAMD的にスリッパマルチやHBM載せるのを目指す最大の理由はカスタムAPUに応じれること
1000ロット×10-20万の1-2億規模の開発用システムとかのオーダーに合わせて選択カスタマイズとか効くんだろこれ
HBM3をつかう使わない。GPUダイを増やす増やさない
企業がグラボを足したり減らしたり、そういう無駄なコストや手間かけずに最適化したAPUあるいはCPU単体を5000万-数億くらいでオーダーできてカスタマイズ環境行けますよって
そういう強みもあるシステムなんだこれ
スリッパはカスタムCPUを安くオーダーできるって強みがあんの >>336
GDDR6は単にGDDR5の強化版
HBMはGDDRの後継として開発中
コストは開発が進めばいずれ差がなくなるし、性能や消費電力でかなり有利
HDDとSSDの関係と一緒
容量やコストはHDDの方が上だけど、システムドライブとしてはSSDの方がいいし、高性能版のNVMeとかも出ている
HBM2も現時点で$399のVega56に8GBも載せられるんだから、HBM3以降なら$300以下のミドルレンジやAPUにも載せられるようになるでしょ 彼らはプロだから私たちが考えるよりもっとスマートにメモリ帯域問題を解決するでしょ とりあえずAMDが中止を明言しないなら、APUとdGPUとヘテロジニアスのためにローコストHBMの開発は継続中
AMD以外の発言とか参考にもならないから無視していい
否定したいなら、AMDの中の人のコメントを教えてくれ >>340
先のことはわからないけど、現時点での解決法がHBMとHBCCとInfinity Fabricの組み合わせ まずはAMDがローコストHBMを開発してるというソースをくれよ >>339
GDDR6は7nmのCPUチップと比べると大きくなってしまったがそれでも
GDDR5より1チップのビットを増やせたので実装面積を減らせる効果が期待できるのが大きい
14インチでGTX1060搭載も夢ではない、熱を除いてだけどね >>343
このへんかな
http://eetimes.jp/ee/articles/1707/26/news054_2.html
要約すると、既存の2.5Dはハイエンド向けでコストが高い
2.1Dは各方面で開発中で期待できそう、実用化には後数年かかるらしい 当初の予定の、HBM自体のbit数や機能を削減した低コスト化は多分やめてると思う
2Hi/4Hiとインターポーザー削減での低コスト化で多分十分だからそれで進めてるんじゃないかな
インターポーザー削減の2.1Dパッケージングが後2年くらいかかるからそれ待ち
要はIntelのEMIBと似たようなのをAMDも開発中 長々とすまんね
そういえばHBM自体の低性能化も含まれていたことを思い出した
APUに付けるなら、2GBで150GB/s程度のHBMで十分だから2Hiとかの安いのでいい
それでインターポーザーを無くせば、実現可能な低コストになると思う >>332
ローコストHBMの開発名言とかどこ情報かな?
それが確かなら可能性はあるけどついぞ聞いたことがないんだけど >>347
その記事にHBMとか欠片も出てないんだけど
メモリ接続方法の模索をしてるとしか書かれてないように読めるんだが
その中でHBMも選択肢にあるよ、と強弁したいだけ? ローコストHBMというか、正確にはローコストパッケージングだな、インターポーザー使わない2.1Dのこと
2.1DはIntelやGFやTSMCで開発が進んでいるらしいし、ペーパーマスターも発言しているからAMDも関わってるでしょ
こっちのローコストHBMはどうでもいい
https://pc.watch.impress.co.jp/img/pcw/docs/1112/395/2_o.jpg そもそもECCなしとかアホすぎる、そんなの誰も使わないだろ
キャンセルされて当然、誰だこんなクソ考えたバカは
ECCが付いてたらまだ可能性はあったけど、流石にこれは無理 AMDは革命を起こせちゃったんだよな。
・以下にしてコストカットを図るか
・高くなりすぎる次世代システムをどうすれば安く作れるか→旧世代コントローラと最小限の7nm化部品とCCXの多コア化インフレで工数を激減させコストカット。
無駄な機能も拡張命令も殺すインテルと逆戦略
・多コア量産で企業、データセンター需要と一般用ハイエンドの統合かと量産戦略
・TR4のAPU化すら可能でより企業と一般ユーザーに恩恵を与える。これでNVIDIA、intelのdGPUにコスパで圧勝
・一般ユーザーのWINDOWSアプリレベルでバックグラウンドでゲームや作業などのあらゆるあぷりけーしょんを同時に実行可能であり
ほぼ待機レスなマルチスレッドシステムを構築。アプリを開く閉じる際の読み込み手間がなく、全アプリを同時並行可能に
それ向けのソフト開発やアップデートもはかどり、WINDOWSとDIRECTXはAMD最適化される
→→→ムーアの法則関係なく理論的にまだまだパワーアップ可能に
対しINTELとAPPLEとarmは限界が来てる。それは構造限界上今以上高性能、あるいは安く作れなくて
需要がどんどん減ってまだ利益は出てるけど、将来的に危うくなるが
需要が縮むスマホ、ノート、タブレットの狭いジャンルで安売り競争が待っている
そして独特なAMD式構造にARM、APPLE、INTEL切り替えるにはもう5年の期間を要するが
その間にAMDはシェアを倍数倍、利益を10倍レベルで激増させることが可能で、真似できない独創ができる
すげーカウンターだよ。そしてこのレベルの物事を他社は模倣追随できない これでWINDOWSやオフィスソフトがマルチ最適化がはかどった場合、アプリケーションの使い方が変わってきて
個人なら2ch、CHROME、オフィスアプリ、エンコ、録画の同時並行とマルチコア活かして個人レベルで情報収集や整理、通知だとかのアプリケーションを
そこそこ高度なaiを駆使して行えるとなる
つまりネットとPCの概念が変わり、arm、スマホのai化がいまいちで不完全なのに対して
AMDマルチコアと次世代WINDOWSの組み合わせは生活に欠かせない高度なaiを個人レベルで利用できるようになると
これが実現すると、ノート、スマホがあればにならなくなるし、aiに仕事を指せるというより、aiとマルチコアで無駄な手間、処理をぶん投げするのが容易になるから
処理待機時間と、無駄な作業手間を排除できて個人でまとめサイトやGOOGLEよりも高度な
「秘書やアシスタント的に機能しカスタマイズできるアプリケーションシステム」みたいなものを運用できるようになると
あとはソフト開発サイドが頑張れば業務用のアプリとかも進化して仕事が早くなって時間を作りやすくなるだとかの恩恵が生まれると
そういうai、シンギュラリティ前段階のWINDOWS二次革命が起こるで、AMDさえあればってのがAMDが目指す先のラウンドな
最低でも過去のマルチコアシステムが1年の仕事量を100時間、1日30分減らすだけの恩恵があったとしても100万したら個人じゃ導入できなかった。
ところがスリッパにより一式15万程度でそんな環境が組めるとしたら、それだけのビジネス上の恩恵は生まれる
過去20年オフィス業務でノートの利用率は非常に高く、あらゆるレベルで遅く無駄な処理時間が発生した
ところが次世代5gで高速なリモプ環組んでスタンダードなノートより圧倒的に早いデスクトップマルチで環境くんで
1日30分も仕事量が減るなら最小でもその程度の経済価値はある
AMDが到達したのはそういうラウンド 煽りとか半分ネタとかじゃないマジモンのAMD信者初めて見た… ブルドーザーの頃からAMD使ってるやつとかヤバい奴しかいねーからな
だって別にスペック求めてないもん
zenユーザーはスペック求めて使ってるやつら多いけど >>363
苦汁を飲みつつ、信仰ゆえにAMD使ってた人はまだ分かる。
ブルのが性能良いからと脳内補完して使ってた奴は危険。例えば、この妄想君みたいな人ね。 >>365
苦渋を飲みつつっていうかエンコ目的ではコスパがアホみたいに高かったから買ったよ俺は >>353
それとHBMとは全然違うだろう
自分が認めてることをなんで強弁し続けてきたのかね ぶっちゃけ高性能追い求めるような使い方してなかったしなあ
極論すればatomでも事足り…いやatomでは無理だな
でもブルで困ることはなかった なんやかんやでAMDのコスパは大体良いからな
ちょっと込み入った要件が絡むと特に
Intelは鯖とかワークステーション向けの機能をコンシューマ用、特にエントリーには一切寄越さないし CPUもGPUも発売前から明確に競合他社の製品を名指しで出して
それでコスパが悪かったら流石に頭が悪すぎるよ Am5x86や其れ以前から使っているがPhenom II X6で止まってブルはパスしていたな… >>367
2.1DとかAMDはHBM関係以外じゃ使わないでしょ
ローコストHBMそのものじゃないけどHBMの低コスト化には関係あるし
まあ勘違いだったということでスレ汚しすまんね CPUダイの放熱追いつくのかな?
AMDのヒートスプレッダ優秀だから大丈夫か
Intelに遅れ続けたプロセスでなんとかクロック絞り出すための長年の小細工が逆転する今花開くw この長文君は少し前はcoreMがスマホ駆逐して小型ゲーミングノートで天下取るからAMDは所詮ニッチ産業の王にしかなれないとか言ってたのをEPYCのリークから急にコストが下がるから最強だとか言い始めてずっといるよ >>366
分かる
しかし俺は発熱と消費電力に戦慄してi5使ってた
でもi5はCPU使用率100%でパソコンモッサリで辛かった
今使ってる1700は並列エンコードでCPU使用率100%でも快適に動くから満足。zen2にも期待してる >>365
5800Kで初自作なんだが…
まあ、ジャンクマザボに中古の8320Eにしちゃったんだけど。 俺もエンコの効率がいいからとか思って買ったけど安サバでエンコ放置したほうがいいな
しかもAMDだと中古の売値がゴミすぎて買ったら損だなって思っちゃった Intelはコア増やしても世代ごとにある程度差別化して旧製品の価格維持してるしな
商売が上手いよ i9ですら液化窒素使わないとパフォーマンス出ないゴミだってバレたところに
品薄商法で価格吊り上げるのは本当に上手いと思った
AMDはそういう商品戦略が弱いね
顧客のためにいい製品を作ってるんじゃだめだよ。性能は出し惜しみして利益は貪らないと。 4コア8スレッドでさえ出し惜しみしてるIntelは素晴らしい企業だと思うわ >>307
こけたのはローコスト向けHBMで、PS5はPC向けと同じパフォーマンス向けのHBM使うって方向らしいよ。
次期CS機がGDDR6って情報はどこにも無かったはず。 >>387
寒は日本の制裁発動でメモリ製造不可能になるのに? ,.‐''" ̄`丶、 ひどい…!ひどすぎるっ……!
/ \ こんな話があるかっ…!
/´ \
/ |\_>、_ 、r‐、 \ 命からがら… やっとの思いで…
レ! ||_| |/_ ヽ\} \ 辿り着いたのに… やり遂げたのに……
|八|-/>、∪_ u`i ト、 \
/ / ,くィ夕u' | |/ ``‐- 、_.、__\ AMDの新製品Zen2…!
|/ / /_ヽ┐u | ,| / ,-,.=====ゝ
ヾ' / r┘|.l__人 | /\// \ ライバル企業の新製品がもぎ取ってしまった……!
\ ) | N / //\./´ ̄`丶
|u | /|(l(l「| | | | せっかく手にした
| u| / | ヾ-イ .|| l、 インテルの未来…希望っ…
_| |/| | \_|_|,. く. \っ
ハ.___ハ >、 \ \ \ 将来を……! >>383
顧客のために?AMDの株買っちゃったやつら馬鹿にしてんのか >>383
この戯けが
インテルは最近の記事でVMWareのCEOを引き合いに出される形で
顧客やパートナーを見ず株価対策のみって酷評されているぞ
AMDは規模が小さいから優先度厳しく決めてリソース投入しているだけだ やっぱVegaって糞だわ
AMD's Radeon MI60 ResNet 50 AI Benchmark Caveat - Tensor Was Not Used For NVIDIA's V100 GPU
https://wccftech.com/amd-radeon-mi60-resnet-benchmarks-v100-tensor-not-used/ >>386
PS5はGDDR6とHBM3両方の噂があるからどっちとも言えんけど
HPC等向けHBM使うならコスト上がりそうだなぁ >>393
Mixed Precision Trainingすると4〜6倍高速化されるけど
制約あるから単純に評価できないしFP32同士で比較でいいと思うよ?
ちなみにPytouchの場合8の倍数単位って制約ついているけどね
Pytorch is using tensor cores on volta chip as long as your inputs are in fp16 and
the dimensions of your gemms/convolutions satisfy conditions for using
tensor cores (basically, gemm dimensions are multilple of 8, or,
for convolutions, batch size and input and output number of channels is multiple of 8). テンサーは無い物とする、にしても
12nm250W VS 7nm300W +20%
で
DGEMM 6.627 6.717 +1.4%
SGEMM 13.106 14.047 +7.2%
RESNET 357/s 334/s -6.5%
これじゃあな、とても一年後発+次々世代プロセス使った製品には見えん >>396
V100は210億トランジスタで15Tflops、Vega20は130億トランジスタで13Tflops
シュリンクしようが基本スペックの差はどうにもならんよ
Vegaの真価はSSDやHBCCを使っての広大なメモリ空間だから、それを無視したら大したことはない
というか、トランジスタ数でかなり劣るVega20を無理にOCしてV100にブツケなくてもいいだろうに
330mm2程度のダイサイズで300Wになるということは、1800MHzは相当無茶なOCになってるね >>398
ROCmにHBCCのコード無いから使えないけどね
定格1350MHzから1400Mhzみたいだから
かなり無茶していると思う
V100が110万ぐらいで買えるからそれの半値ぐらいなら需要あるとは思うよ ,..-‐−- 、、 ヽ ー-‐'^ー‐'`ー‐'`ー-‐'`ー‐∠/
,ィ":::::::::::::::::::;;;;;:ii>;, _) 見ろ!!! (__ .. ┐
/:::::::::::::::;;;;;;;;iii彡" :ヤi、 〕 インテルがゴミのようだ! 〔 ,. ‐'´ ノ
i::::::::::::;:"~ ̄ ::i||li ∠ _ . -''´ .-'´
|:::::::::j'_,.ィ^' ‐、 _,,. ::iii》 )-‐-v-‐-v-‐‐-v-ー./ _r‐'「`r、
|:::i´` `‐-‐"^{" `リ ´ , -‐''フ7´ 、 'ーl、 l } l
ヾ;Y ,.,li`~~iノ _. -''"´ l | `'ーく/ ノ ノ
|`i、 ・=-_、, .:/ _.. -‐''´;;;;;;;;;;;;;;;;;;;;;;;;;;| l、_ ‐、___[])''''´
l ヽ '' ,:/-ァ''´ ̄_ユ‐'"´;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;'、 `‐ニエエソ´
_⊥-…` ‐-、 ノ/l;;;;/;;;;;;/;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;`'==''ソ
/---─=ニニ,..7;l;;;l;;;;;;;l;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;:::::_: -‐'"´
_.. - -‐ ナ/´゙i ̄ヽ;;;;;;;;;;;/;;;l;;;l;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;::::_: -''"´
/´;;;;;;;;;;;_゙、;;;/ ! ヽ 〉'´`ーc、`、;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;;:::_: -‐'"´
. l;;;;;;;;;;;;;;;ヽ;;;;| ! ,-‐´/;;/;;;;;;;;;;;` ‐;;;;;;;;;;;;;;;;;;;_ -‐''"´
|;;;;;;;;;;;;;;;;;ヽ;`ー'、_ノ;;;;;;;/;;;;;;;;;;;;;;;;;;;;;;;;ミ三三/´ Compaqのpen133をバッファローの下駄付きk6-2 266に交換してからのAMD愛好家だわ。 >>402
このパテントはインテルとクロスライセンス対象になってる http://ascii.jp/elem/000/000/805/805916/index-3.html
昔のインテルの鯖用チップセットみたいにキャッシュを載せるって事かな。
ある程度キャッシュが高速化されたらオーバーヘッドは気にならなくなるっぽいね。14nmだと速度も早そうだし。 L4キャシュ128MiBだな。8コア のL3キャッシュと同量かな。CCXまたぎ時の弊害が軽減されるんだろうな >>391
寧ろ無理やり走らせないようにしない限り走るぞ
同じもん組み合わせるのがZENシリーズの思想だし たとえばメモリだ。Rome(Zen2)がDDR4対応というのは納得できる話だが,Milan(Zen3)でもプラットフォームを共用するということは,
そのタイミングでもDDR4を使うと予告しているにほぼ等しい。
https://www.4gamer.net/games/380/G038060/20181107128/
上記の記事で分かる事はZen3世代もソケット互換でメモリはDDR4のまま。
従って、雷禅のソケットAM4もZen3世代まで使えるということだ。
DDE5メモリがサポートされるのは、早くてもZen4世代からと言う事になった。 >>409
後藤さんはこう書いてるけどね
>AMDは、Romeを現在のEpycプラットフォーム互換と、次世代のMilanプラットフォーム互換の2つの方法で提供する。
https://pc.watch.impress.co.jp/docs/column/kaigai/1151995.html
時期的にMilanがDDR5に対応しないとは考えにくいから
たぶんこっちの解釈が正解でしょ? 2020にDDR5は早くないかね。2021でも十分。2022には絶対だろうけど。 メモコンはすでにDDR5対応していて、後はDDR5のリリース待ちなんだろうな 最近は既に作ったのを持ち込んで策定してるからマイクロンと協力してやってんじゃね? >>402
ryzenシリーズはL4キャッシュ省いて発売かもなぁ ■ このスレッドは過去ログ倉庫に格納されています