AMDの次世代APU/CPU/SoCについて語ろう 281世代 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
___ \._ | 荒らし・煽り・厨房は放置が一番。 /|_| | 釣られずにスルーしましょう。 |_/\! sage進行でマターリいきますお。 ★前スレ AMDの次世代APU/CPU/SoCについて語ろう 280世代 http://egg.2ch.net/test/read.cgi/jisaku/1500803461/ ゲームグラフィックはまぁ現状のソフトの最適化のターゲットになってるnVが勝つのはいいとして、 今時分GPGPUの最大ユーザーっていうとDeepLearningではないかと思うけどそっちはどうなの? 主要なDeepLearningフレームワークでVegaが使えるようになるのか、そしてnVに性能で勝つことができるのか? DoTa2でプロがAIに負けたらしいから そのうち無茶強いAI搭載のゲームが出るかもよw これからは基本AIがさして人間は予想外の変数入れる役目になるのかもな >>167 ディープラーニングで勝てるかどうか、と言うと、多分フレームワークが対応してないだろうから勝てないと思う。 今後、対応するフレームワークが出てくる可能性はあるけど。 AMDのスレッドリッパーでのプレゼン見ると ゲーミング(x16のRXVegaを2つ、x4のSSDを1つ) http://pc.watch.impress.co.jp/img/pcw/docs/1075/501/html/32.png.html 3DCGコンテンツ(x16のProを2つとx8のProを2つ、x4のSSDを3つ) http://pc.watch.impress.co.jp/img/pcw/docs/1075/501/html/30.png.html データサイエント(x8のMI25を6つ、x4のSSDを1つ) http://pc.watch.impress.co.jp/img/pcw/docs/1075/501/html/34.png.html 多分、ゲーミングは捨て玉、ディープラーニングも見せ球で、本命はCG方面で、特にレンダーファーム。 レーン数をアピールする割にM.2NVMeのRAIDに対応してない(Intelは対応済み)とかチグハグなんだよな… オープンソースのRadeon ProRenderはOpenCLベースだからどのGPUでも動くけど 無償提供ってのが逆にトラブルが起きたときに対応で逆にネックになりそうな予感がする ハードウェア非依存型。ご使用のコンピューターがOpenCL 1.2対応の場合、Radeon ProRenderをご利用いただけます。 http://www.amd.com/ja-jp/innovations/software-technologies/radeon-pro-technologies/radeon-prorender https://pro.radeon.com/en-us/software/prorender/ 商用GPUレンダラーはCUDAのCC2.0以降(Fermi)になってる OctaneRender requires a CUDA enabled NVIDIA video card. An up to date list can be found here. OctaneRender can run on most CUDA enabled consumer video cards, instead of only on high-end Quadro cards that most other solutions and middleware require, but it is specifically optimized to run on Kepler (GTX 6xx, GTX 7xx, GTX Titan), Fermi (GTX 4xx, GTX 5xx) and Maxwell GPUs. Redshift Render ビデオカード:CUDA計算能力2.0以上、VRAM 2GB以上のNVIDIAビデオカード Thea Render GPU: Nvidia CUDA graphics card (CUDA 6.5, Compute Capability 2.0 or higher), FurryBall Always use the latest drivers! (some older drivers can cause crashing of FurryBall) NVIDIA GPU - CUDA capability 2.0 or later NVIDIA GTX 4xx or later series NVIDIA Quadro 4xxx or later NVIDIA Tesla CM20xx http://furryball.aaa-studio.eu/products/systemRequirements.html うーん、PCゲームからプロのCG、そしてAIのGPGPUは完全にnVidiaに握られっぱなしだな どんな分野、どんな会社にせよ独占は良くないので コンシューマゲーム機以外でも存在感を出せるようになって欲しいものだ >>175 現状は会社の規模がね、人手が足りてない感はある。 CPUとGPUで十分なソフトウェア・サポートをしようと思うと、大雑把に言って、インテル+ヌビと同等のマンパワーが必要でしょ。 まぁ、人手は金だからさ、順調に業績を延ばしていければついてくるんじゃないかな。 GPUの少量なローカルメモリで済んでる間は無理だな HBCC使ったSSGみたいに数100GBや数TBのメモリやキャッシュが必要な用途が増えればワンチャンあり ゲファやテスラは、直接使えるのはローカルだけで、メインメモリを使うには酷いペナルティがあるし、ストレージなんて不可能 それを無理してやりくりするのがCUDAで、それが楽なのがAMDとopenCL/ROCmの組合せ V100は16GB、SSGは16GB+メインメモリ+2TB(SSD)、RX Vegaは8GB+メインメモリ しょせんpcieブリッジ接続のssdでは糞遅い メリットはメインメモリ圧迫しなということだけ cudaはメインメモリ扱えるがし nvlinkでつないだGPUのメモリも使える radeonのようにブリッジ接続で8GB/sのSSDだけが頼りなわけじゃない >>180 テキトーなこと言ってるけど ソースあんの? >>184 ソース出してみなって言われて出せないなら また団子と同じ奴が現れてテキトーな事言ってるとしか思われないよ ソースもなにも、nvの製品ならnvの公式サイトで派手に宣伝してるよ。 過ちを気に病むことはない。ただ認めて、次への糧とすればいい。それが、大人の特権だ ソースはAMDと同じように動画で出してもらいたいな まあ、それが使い物になるレベルならとっくにアナウンスしてるわ nvidiaのアナウンス 8K動画編集はAMDのSSGを使わなくても、nvidiaのグラボとAMDのスリッパでイケます! http://news.mynavi.jp/articles/2016/10/12/gtcjapan2016_unifiedmemory/002.html デマンドページングは便利な機能であるが、オーバヘッドも大きいので、使い方には注意が必要である。 HBCCぽい動きが出来そうだけど、ハードじゃなくソフト的にやってるから遅延が大きいんだろうな >>193 XEONでもいいんじゃない? 16コアのCPUの覇権はスリッパだけどさw たったの8GB/sのSSDにアクセスしてどれだけ効果があるんですか アスペか CUDAは糞以下なんて言ってる時点で気づくべきだった >>198 ゲフォ厨はさっさと失せろ 実際に外部メモリへのアクセスに関してはCUDAは糞なだけだ 2TB of NAND flash storage plugged into a pair of M.2 ports つまり最大PCIe3.0の4lanでも片方向4GB/sペアで8GB/s あくまでM.2の理論値 RAID0でもつかうのか? それでも実速度は半分程度だろうが >Vega 10では、PCのメインメモリなどを仮想ビデオメモリとして利用できるHigh-Bandwidth Cache Controller(HBCC)という機能を新たにサポートし、この機能を利用するさいはGPUに直結されたHBM2をキャッシュメモリのようにあつかう。 >この機能はRadeon Settingから有効化できるが、将来的により多くのビデオメモリを必要とする場面で使用することを想定した機能であり、今回のテストではこの機能は使用していない。 >Radeon SettingのHBCC設定「HBCC Memory Segment」。 >標準では無効化されており、有効化するとHBCCで利用するメモリの容量を設定できるようになる http://pc.watch.impress.co.jp/img/pcw/docs/1075/646/i02.png GPUがテラバイトのフレームバッファを扱うことができるのが強みなのだ 接続してるバスインターフェイスのどうのこうの話ではない その強みは具体的にどういう場面で活きてくるの? 8K編集かな?w 実際に8K編集で役に立ってたな nvidiaはまた1つ引き離された訳だ 高解像度対応の需要は尽きることはないしな 実際編集は高解像度で行って使うのはダウンコンバートしたものとか当たり前になってるし pcie自体も早くなるぞ 来年にはGEN4 2019年には(いけるが知らんが)GEN5の予定 GEN5の4chでDDR4の1chと同じスピード出るし、ハナから帯域不足の前提でプログラムするしな まぁNVLINKは、どっちかってとHPC向けだし、POWERのプラットフォームで真価を発揮するものだろう。 8K編集とかに使うようなもんじゃないでしょ。 >>208 大分問題があってな PCI-SIG握ってんの事実上intelなのよ アレを速くすると自社の製品を喰われる他社製が出張ってくるから、なるたけ引っ張るか遅くするか 動画クリエーター周りだけ言えばアレらはXEON出したいから&今AMDとガチンコやってるから他が出て来てもらっちゃ困る 多分露骨には出来ないから引っ張ると思うよ AMDがCPUGPU問わず色々仕込んでるのは大体コレが原因 規格周り殆ど握られてるからね、裏道探して出し抜くしか無い ソケットFM2+のA10-7870KとAM4のA12-9700で A10にDDR3-2166、A12にDDR4-2400のメモリ積んで同一ベンチ走らせると A10が半分以上勝つらしいけど これってAM4マザーのインターフェイスに設計ミスとかあるんじゃないかなあ? Ryzenのベンチでも7700Kにぼろ負けしてるし CPUの性能をチップセット側で活かせてない気がするなあ 自作用のAPUはずっと4コアだろうな 次のXBOX買えば? 8コア版のAPUだろうし APUにメモリ直接積んでハイパーメモリCPUやってほしい 8コアですら使いみちがないのに、売れないと困るAPUで冒険なんかするわけねえ 12コアAPU、12万円として誰が買うんだそんなもん >>212 AVX絶対殺すマンと化した超低レイテンシなGPUならワンチャンあるかも その場合は全部のモデルに載るだろうし インテルHDより更に貧弱なFLOPSだろうけどw HBCCはIntelがOptaneでやろうとしてることの凄い版 あれは、HDDの高速化だけど、HBCCはメインメモリとSSDの高速化 NVMe SSD(5GB/s)/メインメモリ(50GB/s)→PCIe(16GB/s)→HBM2(500GB/s) CPUのキャッシュ制御と大体一緒だから、実装は楽だろうね ただ、CPUとGPUの違いに合わせたドライバの調整が面倒そうだけど >>217 デバドラやめて、x64にGPUコントロールの拡張命令でも追加するといいよ。 >>220 それは考えてると思うよ、APUの構造的にそれがあるのが一番いいからね 草案作りとか根回しとか大変だろうから当分先だろうけど >>222 いあ、ごめんネタだから、現時点でAMDがそれをやるほど愚かじゃないのは明白。 なぜなら、そんなことした時点でGPUの機能を変更できなくなる。 やるとしたらGPU自体が枯れて、これ以上機能の刷新も新機能も必要ないところまできてから。 >>223 AVXはAVX→AVX2→AVX512って拡張し続けてるんだけど それ以外でも、仮想関係やセキュリティもAMDとIntelは独自に実装している そういう前例があるから、GPGPUを標準化しても拡張はし続けていける AMDのGPUは機能的な拡張し続けて、VegaでほぼCPUと遜色ないくらいになってる そろそろCPUとGPUでISAの統合が出来る頃合いだと思うんだよね >>224 AVX512はインテルさえ「コスト高すぎて実装は考えていない」つってるけどね そもそもロード/ストアユニットが128ビット×4構成のインテルでさえ、512命令来ると4基フルで 1命令しかこなせないし 128ビットのLSU×2基しかないRyzenがシングルコアのベンチで負けるのは当然として 512命令が来るとRyzenは1回で処理出来ずここで渋滞するんだよな ていうかAVX2もRyzenではここがボトルネックになってる AMDも妙なところでケチるよなあ 言いたいのは、x64本体に組み込むんじゃなく、AVXや仮想機能みたいな拡張機能とするってこと その先は、更に5年後くらいにx64+AVX2+GPGPUを統合した、新x64とか作れるかもしれないかな 今時GPU内蔵CPUなんて普通だし、GPGPUもかなりCPUに近くなってるから、統合ISAは時間の問題と思う それの先陣を切るのは、AMD64やmantleを出したAMD以外ないだろう >>224 CPUのSIMD命令は、レジスタ等への前準備は必要とは云え、単一の命令だよ。 そんなのの拡張とGPUってユニットの拡張を同列にするかね? そもそも、ついこないだVEGAで大掛かりな仕組みの変更をしたとこじゃないか。 それとも、後方互換製のために、古くなったらほとんど使わない回路をどんどん肥大化させていくつもりかね? 沢山のコアが一斉に肥大化してくんだよ? AMDとMSとLinux勢も多分望んでそうだから、動いてそうな気はする いい加減GPGPUの使い辛さをどうにかしたいと思ってそうだし そうすればゲームや技術計算やディープラーニングとか今よりずっと楽に開発できるだろうね >>229 それは多分、Larrabeeが見た夢だろう。 GPUとして失敗した時点でタダの計算機になって、一般消費者向けではなくなってしまった。 ARMコアで似たような構想を抱けば、もしかしたらモダンなものになるのかもしれないね。 >>228 x64はx86を内包してるけど別に騒ぐほど肥大化してないよ x87は切り捨てた、SSE2を標準にしたから、それ以前のMMXやSSEも捨てた 標準化するのはシェーダーモデル6とIEEE754対応とGPU仮想化全般でいい あとはCPU-GPU間の連携用の命令くらいか >>231 肥大化するのはCPUコアじゃなくてGPUコアのほうだよ。 CPU側はほぼデコーダの拡張だけでしょ。 MMXやSSEは捨てたってよりも、uOPの組み合わせなんだから残そうがどうしようが大勢に影響ないよ。 連携ではなく内包でないと、制御命令をCPU側に追加する意味が薄いと思うけど? AVXとGPGPUのレスポンスを同じにしたいんでしょ? コマンド生成して放り込む方式だったら、ドライバでやっといたほうがよっぽど柔軟性があるよ。 つまり、CPUでGPUをコントロールするってのは、GPUのデコーダの機能をCPUのデコーダに統合するって意味で書いたよ。 x86のソースの中にGPUのコマンドも含まれている状態。 それしかレスポンスでAVX対抗はないと思うけども。 そして、それって現実的かな?と思うけども。 かつてCPUはコプロを外部に追いやった 現代はコプロを内臓する時代へ (ていうか、そういえばAVX2ってエンコ以外で何に使うの?) >>236 有名ベンチマークテストのソフトが使ってるから もしかしたら必要以上にRyzenは実力を低く見積もられてるかも知れない >>232 レスポンスはどうでもいいよ、それはバスと距離の問題だし 結局はメモリ関係が独立していてプログラムが特殊で面倒なのを、シェアードメモリでアドレス共有してプログラムが共通になって楽になって欲しいってだけ GPGPU関連はほぼ全てがシェアードメモリ関連で苦労してるし 標準化すれば、各社が独自で細かく考えなくていいし、強化点も分かりやすくなるからいい事ずくめだと思うけどね 言いたいのは、シェアードメモリのハードウェア対応と標準化 DX12のように対応できないNvidiaに邪魔されるのはいい加減うんざりなので、AMDとMSとLinux勢でAMD64みたいにとっととやってほしい所 AMDの市場シェアが上がれば当然 昔みたいに相手してもらえるようになるでしょ >>234 AVX対抗というよりAVXの拡張かなあ AVXの処理を一部GPGPUに振り分けるというふうに まあ、どういう実装が一番効率いいかは知らないけど、対抗するより共存させたほうがいいと思う 言いたいのは、せっかくGPU内蔵していて巷にもSocが溢れてるんだから、ISAも統合して活用しようぜってこと 活用されたら困ることなんてないでしょ >>239 レスポンスが距離?そのレスポンスじゃなくてね GPUにコマンド一つ送って処理させるのに、どれだけCPUが仕事するのかって話、のレスポンス。 AVX命令一回で済む規模の計算を、GPUでやるとどんだけ時間がかかるか。 そもそも、オレが書き出した発端は >>217 だから、レスポンス関係ないってなら論点がずれちゃった。 なら、現状統合の必要はない、の意見にする。 外部デバイスはめんどくさいけど、自由度が高いから。外付けなら、計算規模に合わせて組み合わせすら変更できるよ。 コレでコテ隠して他人になったつもりなのか?逆神糞コテ様は >>241 そのとおり、CPUのSIMDは使いやすいよ。 なんせ、ソースにぽんと埋め込めば、並列化云々考えなくていいもの。 でも、なぜかここの板では、いつもAVX対GPGPUの構図をとりたがる人達がいるんだよ。 >>240 AMD64作ったときも、DX12のときもAMDは弱小でしか無かったよ シェアじゃなく方向性や技術力の問題 >>244 そこまで簡単じゃねぇよ 性能出そうと思ったらキチンと調整しねぇと まぁ折角腐る程演算機載ってんだ 使えるなら使った方がいい SIMDは多くの場合並列性で伸びるし >>247 ごめんごめん、使用方法のはなし。 GPUは手続きが多いでしょって部分での比較。 AVXの何が嫌いって、わざわざ専用に演算機積んでる事だわ 低レイテンシGPUの何が良いって、そもそもGPUとして使える事だと思う エンコ以外使われない回路とか9割9分ゴミじゃんw AMDの初期設計の問題でボトルネックが発生してるから AMDの得意分野に最適化して欲しいって論旨は まずAMDがその開発言語にコンパイルオプション一発で最適化するぐらいの 状況を提供しろって話でしょ 現代の標準的な開発オプションで実力が出ないなら それは設計か商売、どっちかが下手だって話であってさ 誰かがやってくんねえかなー?ってのは論外 SIMDを活かすためには足回りも揃えないといけなくて、 それをCPU全体に配備することの費用対効果が問われてるんでないの? (何かAVX絶対殺すとか言っちゃったからか、スゲーレス伸びてんだけど…どないしよ) >>242 あなたはGPGPUが活用されるのが嫌なんですか? AVX性能が一番大切ならIntel使ってればいいと思います AVXは私もAMDも互換が取れれば性能とか気にしてないので特に話題にしなくていいです、どうでもいいので >>248 だから頑張って簡単にしようとしてるけどね ぶっちゃけた話、AVX512なんて馬鹿みたいに幅広げるより、先ずは実装効率を向上させるべきかと 逆にGPUは使い易い場所に置くべき まぁコレを馬鹿正直に実装するとデカいBulldozerになるけどさ AMDがCPUをCCXで纏めたのは将来的にそういう実装を補助するためじゃないかと思わんこともない >>242 なんで好き嫌いな話になる? APUの内蔵GPUのリソースをOpenCLに全部回そうとおもって、ラデ追加したよ。 笑うやついるけどwww AVXとGPGPUなんて排他関係にないでしょ?って立場なだけだよ。 そもそも皆んなAVX使う? セレロンとかペンティアムに載って無いじゃん 結局いつもループ入れて終わってるわ、俺 標準化の一番のネックはシェアードメモリだろうなあ ページフォルトとコヒーレンシだっけか GPGPUの性能はどうにでもなるから、標準化して今よりプログラミングが楽になってほしいところ >>257 AVX周りの話題なんて プロのレビュワーの記事か、動画をエンコードする人間にしか話題にしてない気がする まあゲーム系ベンチで「Ryzenはシングルコアが弱い」的な話題がでるとき 裏ではこの辺の事情と、CCXのレイテンシあたりが絡んでるんだろうけど どっちにしろ、2年弱先のAMDのロードマップでは APUは最大4コアでvega10搭載の、ノート用のAPUしか姿見えてないし ソケットAM4のリテール用APU出すらしいけど 未だに発表しないって事はクリスマス商戦に間に合わない訳だから 早くたって来年3月くらいまでお預けなんじゃないの? >>257 AMDファンなら気づかないうちに使ってるしょ AMDのIntelに対するアドバンテージのひとつが 全ラインナップでAVXに対応してることだし >>260 最低限の互換を確保してるだけで、8コアあたりでは切った方が早い 我らが天才ジムおじさんが切り捨てたのも頷ける ソフト屋の視点では共存でいいかもだけど、CPUに実装するとなると費用効率悪すぎだもの あー、インテルだとブラックシリコンの解消になんのかな? RyzenはIF使ってMCM出来るしな、そりゃ捨てるわ LSから全てへばりついたSIMDエンジンにオフロードすればキャッシュの汚染も無駄な帯域も無くなるわな >>226 2コアでAVX512ユニットを共有すればいいんじゃね? 君たちの理想のcpuは総合すると 中国の太湖之光じゃん >>264 AVX512処理を現状 命令>処理>処理>処理>処理 でやってるのに、それだと 命令>分析>同期>処理>処理>分離 のサイクルでやることになるからかえって遅くなるかな AVX512って32bitx16個か64bitx8個の処理をやってるだけでしょ? 多くなるほど効率悪化してスケーリングが落ちるから、ベンチか特定演算専用にしかなってない 256bit命令や512bit命令があるわけじゃなし、無理して実装するものでもないでしょ ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる