AMDの次世代APU/CPU/SoCについて語ろう 281世代 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
___
\._ | 荒らし・煽り・厨房は放置が一番。
/|_| | 釣られずにスルーしましょう。
|_/\! sage進行でマターリいきますお。
★前スレ
AMDの次世代APU/CPU/SoCについて語ろう 280世代
http://egg.2ch.net/test/read.cgi/jisaku/1500803461/ アスペか
CUDAは糞以下なんて言ってる時点で気づくべきだった >>198
ゲフォ厨はさっさと失せろ
実際に外部メモリへのアクセスに関してはCUDAは糞なだけだ 2TB of NAND flash storage plugged into a pair of M.2 ports
つまり最大PCIe3.0の4lanでも片方向4GB/sペアで8GB/s
あくまでM.2の理論値
RAID0でもつかうのか?
それでも実速度は半分程度だろうが >Vega 10では、PCのメインメモリなどを仮想ビデオメモリとして利用できるHigh-Bandwidth Cache Controller(HBCC)という機能を新たにサポートし、この機能を利用するさいはGPUに直結されたHBM2をキャッシュメモリのようにあつかう。
>この機能はRadeon Settingから有効化できるが、将来的により多くのビデオメモリを必要とする場面で使用することを想定した機能であり、今回のテストではこの機能は使用していない。
>Radeon SettingのHBCC設定「HBCC Memory Segment」。
>標準では無効化されており、有効化するとHBCCで利用するメモリの容量を設定できるようになる
http://pc.watch.impress.co.jp/img/pcw/docs/1075/646/i02.png GPUがテラバイトのフレームバッファを扱うことができるのが強みなのだ
接続してるバスインターフェイスのどうのこうの話ではない その強みは具体的にどういう場面で活きてくるの?
8K編集かな?w 実際に8K編集で役に立ってたな
nvidiaはまた1つ引き離された訳だ 高解像度対応の需要は尽きることはないしな
実際編集は高解像度で行って使うのはダウンコンバートしたものとか当たり前になってるし pcie自体も早くなるぞ
来年にはGEN4
2019年には(いけるが知らんが)GEN5の予定
GEN5の4chでDDR4の1chと同じスピード出るし、ハナから帯域不足の前提でプログラムするしな まぁNVLINKは、どっちかってとHPC向けだし、POWERのプラットフォームで真価を発揮するものだろう。
8K編集とかに使うようなもんじゃないでしょ。 >>208
大分問題があってな
PCI-SIG握ってんの事実上intelなのよ
アレを速くすると自社の製品を喰われる他社製が出張ってくるから、なるたけ引っ張るか遅くするか
動画クリエーター周りだけ言えばアレらはXEON出したいから&今AMDとガチンコやってるから他が出て来てもらっちゃ困る
多分露骨には出来ないから引っ張ると思うよ
AMDがCPUGPU問わず色々仕込んでるのは大体コレが原因
規格周り殆ど握られてるからね、裏道探して出し抜くしか無い ソケットFM2+のA10-7870KとAM4のA12-9700で
A10にDDR3-2166、A12にDDR4-2400のメモリ積んで同一ベンチ走らせると
A10が半分以上勝つらしいけど
これってAM4マザーのインターフェイスに設計ミスとかあるんじゃないかなあ?
Ryzenのベンチでも7700Kにぼろ負けしてるし
CPUの性能をチップセット側で活かせてない気がするなあ 自作用のAPUはずっと4コアだろうな
次のXBOX買えば?
8コア版のAPUだろうし APUにメモリ直接積んでハイパーメモリCPUやってほしい 8コアですら使いみちがないのに、売れないと困るAPUで冒険なんかするわけねえ
12コアAPU、12万円として誰が買うんだそんなもん >>212
AVX絶対殺すマンと化した超低レイテンシなGPUならワンチャンあるかも
その場合は全部のモデルに載るだろうし
インテルHDより更に貧弱なFLOPSだろうけどw HBCCはIntelがOptaneでやろうとしてることの凄い版
あれは、HDDの高速化だけど、HBCCはメインメモリとSSDの高速化
NVMe SSD(5GB/s)/メインメモリ(50GB/s)→PCIe(16GB/s)→HBM2(500GB/s)
CPUのキャッシュ制御と大体一緒だから、実装は楽だろうね
ただ、CPUとGPUの違いに合わせたドライバの調整が面倒そうだけど >>217
デバドラやめて、x64にGPUコントロールの拡張命令でも追加するといいよ。 >>220
それは考えてると思うよ、APUの構造的にそれがあるのが一番いいからね
草案作りとか根回しとか大変だろうから当分先だろうけど >>222
いあ、ごめんネタだから、現時点でAMDがそれをやるほど愚かじゃないのは明白。
なぜなら、そんなことした時点でGPUの機能を変更できなくなる。
やるとしたらGPU自体が枯れて、これ以上機能の刷新も新機能も必要ないところまできてから。 >>223
AVXはAVX→AVX2→AVX512って拡張し続けてるんだけど
それ以外でも、仮想関係やセキュリティもAMDとIntelは独自に実装している
そういう前例があるから、GPGPUを標準化しても拡張はし続けていける
AMDのGPUは機能的な拡張し続けて、VegaでほぼCPUと遜色ないくらいになってる
そろそろCPUとGPUでISAの統合が出来る頃合いだと思うんだよね >>224
AVX512はインテルさえ「コスト高すぎて実装は考えていない」つってるけどね
そもそもロード/ストアユニットが128ビット×4構成のインテルでさえ、512命令来ると4基フルで
1命令しかこなせないし
128ビットのLSU×2基しかないRyzenがシングルコアのベンチで負けるのは当然として
512命令が来るとRyzenは1回で処理出来ずここで渋滞するんだよな
ていうかAVX2もRyzenではここがボトルネックになってる
AMDも妙なところでケチるよなあ 言いたいのは、x64本体に組み込むんじゃなく、AVXや仮想機能みたいな拡張機能とするってこと
その先は、更に5年後くらいにx64+AVX2+GPGPUを統合した、新x64とか作れるかもしれないかな
今時GPU内蔵CPUなんて普通だし、GPGPUもかなりCPUに近くなってるから、統合ISAは時間の問題と思う
それの先陣を切るのは、AMD64やmantleを出したAMD以外ないだろう >>224
CPUのSIMD命令は、レジスタ等への前準備は必要とは云え、単一の命令だよ。
そんなのの拡張とGPUってユニットの拡張を同列にするかね?
そもそも、ついこないだVEGAで大掛かりな仕組みの変更をしたとこじゃないか。
それとも、後方互換製のために、古くなったらほとんど使わない回路をどんどん肥大化させていくつもりかね?
沢山のコアが一斉に肥大化してくんだよ? AMDとMSとLinux勢も多分望んでそうだから、動いてそうな気はする
いい加減GPGPUの使い辛さをどうにかしたいと思ってそうだし
そうすればゲームや技術計算やディープラーニングとか今よりずっと楽に開発できるだろうね >>229
それは多分、Larrabeeが見た夢だろう。
GPUとして失敗した時点でタダの計算機になって、一般消費者向けではなくなってしまった。
ARMコアで似たような構想を抱けば、もしかしたらモダンなものになるのかもしれないね。 >>228
x64はx86を内包してるけど別に騒ぐほど肥大化してないよ
x87は切り捨てた、SSE2を標準にしたから、それ以前のMMXやSSEも捨てた
標準化するのはシェーダーモデル6とIEEE754対応とGPU仮想化全般でいい
あとはCPU-GPU間の連携用の命令くらいか >>231
肥大化するのはCPUコアじゃなくてGPUコアのほうだよ。
CPU側はほぼデコーダの拡張だけでしょ。
MMXやSSEは捨てたってよりも、uOPの組み合わせなんだから残そうがどうしようが大勢に影響ないよ。
連携ではなく内包でないと、制御命令をCPU側に追加する意味が薄いと思うけど?
AVXとGPGPUのレスポンスを同じにしたいんでしょ?
コマンド生成して放り込む方式だったら、ドライバでやっといたほうがよっぽど柔軟性があるよ。 つまり、CPUでGPUをコントロールするってのは、GPUのデコーダの機能をCPUのデコーダに統合するって意味で書いたよ。
x86のソースの中にGPUのコマンドも含まれている状態。
それしかレスポンスでAVX対抗はないと思うけども。
そして、それって現実的かな?と思うけども。 かつてCPUはコプロを外部に追いやった
現代はコプロを内臓する時代へ (ていうか、そういえばAVX2ってエンコ以外で何に使うの?) >>236
有名ベンチマークテストのソフトが使ってるから
もしかしたら必要以上にRyzenは実力を低く見積もられてるかも知れない >>232
レスポンスはどうでもいいよ、それはバスと距離の問題だし
結局はメモリ関係が独立していてプログラムが特殊で面倒なのを、シェアードメモリでアドレス共有してプログラムが共通になって楽になって欲しいってだけ
GPGPU関連はほぼ全てがシェアードメモリ関連で苦労してるし
標準化すれば、各社が独自で細かく考えなくていいし、強化点も分かりやすくなるからいい事ずくめだと思うけどね
言いたいのは、シェアードメモリのハードウェア対応と標準化
DX12のように対応できないNvidiaに邪魔されるのはいい加減うんざりなので、AMDとMSとLinux勢でAMD64みたいにとっととやってほしい所 AMDの市場シェアが上がれば当然
昔みたいに相手してもらえるようになるでしょ >>234
AVX対抗というよりAVXの拡張かなあ
AVXの処理を一部GPGPUに振り分けるというふうに
まあ、どういう実装が一番効率いいかは知らないけど、対抗するより共存させたほうがいいと思う
言いたいのは、せっかくGPU内蔵していて巷にもSocが溢れてるんだから、ISAも統合して活用しようぜってこと
活用されたら困ることなんてないでしょ >>239
レスポンスが距離?そのレスポンスじゃなくてね
GPUにコマンド一つ送って処理させるのに、どれだけCPUが仕事するのかって話、のレスポンス。
AVX命令一回で済む規模の計算を、GPUでやるとどんだけ時間がかかるか。
そもそも、オレが書き出した発端は >>217 だから、レスポンス関係ないってなら論点がずれちゃった。
なら、現状統合の必要はない、の意見にする。
外部デバイスはめんどくさいけど、自由度が高いから。外付けなら、計算規模に合わせて組み合わせすら変更できるよ。 コレでコテ隠して他人になったつもりなのか?逆神糞コテ様は >>241
そのとおり、CPUのSIMDは使いやすいよ。
なんせ、ソースにぽんと埋め込めば、並列化云々考えなくていいもの。
でも、なぜかここの板では、いつもAVX対GPGPUの構図をとりたがる人達がいるんだよ。 >>240
AMD64作ったときも、DX12のときもAMDは弱小でしか無かったよ
シェアじゃなく方向性や技術力の問題 >>244
そこまで簡単じゃねぇよ
性能出そうと思ったらキチンと調整しねぇと
まぁ折角腐る程演算機載ってんだ
使えるなら使った方がいい
SIMDは多くの場合並列性で伸びるし >>247
ごめんごめん、使用方法のはなし。
GPUは手続きが多いでしょって部分での比較。 AVXの何が嫌いって、わざわざ専用に演算機積んでる事だわ
低レイテンシGPUの何が良いって、そもそもGPUとして使える事だと思う
エンコ以外使われない回路とか9割9分ゴミじゃんw AMDの初期設計の問題でボトルネックが発生してるから
AMDの得意分野に最適化して欲しいって論旨は
まずAMDがその開発言語にコンパイルオプション一発で最適化するぐらいの
状況を提供しろって話でしょ
現代の標準的な開発オプションで実力が出ないなら
それは設計か商売、どっちかが下手だって話であってさ
誰かがやってくんねえかなー?ってのは論外 SIMDを活かすためには足回りも揃えないといけなくて、
それをCPU全体に配備することの費用対効果が問われてるんでないの? (何かAVX絶対殺すとか言っちゃったからか、スゲーレス伸びてんだけど…どないしよ) >>242
あなたはGPGPUが活用されるのが嫌なんですか?
AVX性能が一番大切ならIntel使ってればいいと思います
AVXは私もAMDも互換が取れれば性能とか気にしてないので特に話題にしなくていいです、どうでもいいので >>248
だから頑張って簡単にしようとしてるけどね
ぶっちゃけた話、AVX512なんて馬鹿みたいに幅広げるより、先ずは実装効率を向上させるべきかと
逆にGPUは使い易い場所に置くべき
まぁコレを馬鹿正直に実装するとデカいBulldozerになるけどさ
AMDがCPUをCCXで纏めたのは将来的にそういう実装を補助するためじゃないかと思わんこともない >>242
なんで好き嫌いな話になる?
APUの内蔵GPUのリソースをOpenCLに全部回そうとおもって、ラデ追加したよ。
笑うやついるけどwww
AVXとGPGPUなんて排他関係にないでしょ?って立場なだけだよ。 そもそも皆んなAVX使う?
セレロンとかペンティアムに載って無いじゃん
結局いつもループ入れて終わってるわ、俺 標準化の一番のネックはシェアードメモリだろうなあ
ページフォルトとコヒーレンシだっけか
GPGPUの性能はどうにでもなるから、標準化して今よりプログラミングが楽になってほしいところ >>257
AVX周りの話題なんて
プロのレビュワーの記事か、動画をエンコードする人間にしか話題にしてない気がする
まあゲーム系ベンチで「Ryzenはシングルコアが弱い」的な話題がでるとき
裏ではこの辺の事情と、CCXのレイテンシあたりが絡んでるんだろうけど
どっちにしろ、2年弱先のAMDのロードマップでは
APUは最大4コアでvega10搭載の、ノート用のAPUしか姿見えてないし
ソケットAM4のリテール用APU出すらしいけど
未だに発表しないって事はクリスマス商戦に間に合わない訳だから
早くたって来年3月くらいまでお預けなんじゃないの? >>257
AMDファンなら気づかないうちに使ってるしょ
AMDのIntelに対するアドバンテージのひとつが
全ラインナップでAVXに対応してることだし >>260
最低限の互換を確保してるだけで、8コアあたりでは切った方が早い
我らが天才ジムおじさんが切り捨てたのも頷ける
ソフト屋の視点では共存でいいかもだけど、CPUに実装するとなると費用効率悪すぎだもの あー、インテルだとブラックシリコンの解消になんのかな?
RyzenはIF使ってMCM出来るしな、そりゃ捨てるわ LSから全てへばりついたSIMDエンジンにオフロードすればキャッシュの汚染も無駄な帯域も無くなるわな >>226
2コアでAVX512ユニットを共有すればいいんじゃね? 君たちの理想のcpuは総合すると
中国の太湖之光じゃん >>264
AVX512処理を現状
命令>処理>処理>処理>処理
でやってるのに、それだと
命令>分析>同期>処理>処理>分離
のサイクルでやることになるからかえって遅くなるかな AVX512って32bitx16個か64bitx8個の処理をやってるだけでしょ?
多くなるほど効率悪化してスケーリングが落ちるから、ベンチか特定演算専用にしかなってない
256bit命令や512bit命令があるわけじゃなし、無理して実装するものでもないでしょ >>266
ブルドーザーさん……
>>267
VLIWとは何が違うんや >>267
お客が、インプレスやら4gameやらの新製品レビューのスコアを鵜呑みにせず
消費マインドを冷やさないんだったら、AVX命令によるスコアの低下なんて
無視して全く構わないと思う
あと、世間ですでに
「Ryzenはシングルコア性能では7700Kにさえ劣るからゲーミングだったら7700K一択」
ってのが常識になってるけど、こう言うのも顧客に影響ないなら
全く構わないと思う >>266
Bulldozerはそんな実装じゃないだろ つーかAVXとHDグラフィックスで(可能な部分の)共用化できないんかい?w
よっぽど縦割りひどいんかな 現実的にそれできる材料持ってる会社がAMDぐらいしかないんだがなぜかIntelに先こされそうと言う >>24
vegaはgpuだし、bullはcpuだろ
bull系はapuでまだガンバてるし、bullには9590というコレクターズアイウテム A12欲しかったのに出さないのね
AM4の新チップセットと不具合でも出したのかな? スーパーコンピュータみたいに、HPCアプリのタスクスイッチの間隔を1秒程度にするなら、
レジスタの退避・復帰コストが増えても問題ないだろうが、
一般のOSだと、レジスタの退避・復帰コストも考えないと >>271
独立して動いてるものを共有化とは、これいかに。
しかもクロック違うし。 むかしのhd graphicsは頂点処理にsse使ってましたがね AMDもCPUのデコーダにGPUを統合しようと最初は考えていたから、
SSE5を策定して発表したけど、効率的じゃないと判断して
取り止めてAVXを採用した。
変わりに出てきたのが、HSA。
HSAでは、CPUとGPUでメモリを共有するハードウエアについても
定義されている。
これを実装したのがKaveriや鰤。おそらくRaven Rigdeにも載る。 >>280
世代がかわることに開発環境がころころかわって互換性のない環境でHSAプログラミング? RavenではVegaとInfinityFabricで繋がるっていうから
オンダイGPUをコプロ的に動作させる拡張命令くらいはすぐできるでしょ
つか、もうできてるのかもしれない
問題はワッパと使い勝手とAMDの「やる気」
IntelのAVX512は電気バカ食いするらしいけど同様の処理をオンダイGPUに丸投げしたところでどれだけメリットがあるか
キャッシュコヒーレンシのコストに見合う性能が発揮できるか
CPUでも十分速い加減算だと何千bitに拡張したところで電力と時間を無駄にするだけだろうし
>>233
水道管を敷設するまでは早いのに蛇口からおいしい水が出てくるのが遅いのがAMDw 店で見てると未だにIntel買ってる奴が多いんだけど情弱なんか? >>283
多くの人は8C16Cも必要ない
シングルスレッド性能はインテルが速い
多くのGUIアプリはシングルスレッド性能が重要
AMDは現状APU出しておらずiGPUがついてるIntelを買う >>279
それ、頂点処理をドライバ(=ソフトウェア)でやってる話じゃないのかね? >>281
HSAでは、開発環境まで定義してないからね。
決まっているのは、
コンパイラの吐き出す中間コードと、それを実行するソフトウェアレイヤー、
ハードウェアはキャッシュコヒーレンスやコマンドキューイング等の定義。
開発環境が変わるのは、プログラマーには迷惑だけど、そういうものでしょ。 HSAの殆どの機能はOpenCL2.xに盛り込まれてたはず
というか、OpenCL2.1 + Vulkan = SPIR-VがAMDが欲しかった環境そのものかな
http://www.4gamer.net/games/293/G029343/20150304076/SS/002.jpg もうHSAとか言ってAMDが一人で頑張る必要ないんだよな
クロノスがやってることがAMDの理想そのものだから、後はハードウェア開発とサポートに専念して完成度を上げたほうがいい 自作でもCPUに一万円以上出すのが馬鹿らしい層は確実にいるからな >>291
そう言う奴らはインテルに投げとけ
相手にしても金にならないからな、CPUはメインストリームで戦うよりハイエンドを掻っ攫った方が金になる 材料は揃ってる!これができるのはAMDだけ!とか信者が熱弁するものは何一つ実現されない ■ このスレッドは過去ログ倉庫に格納されています