AMDの次世代APU/CPU/SoCについて語ろう 281世代 [無断転載禁止]©2ch.net

**Socket774** · 2017/08/15(火) 05:19:26.78

**Socket774** · 2017/08/17(木) 23:07:49.49

ゲームグラフィックはまぁ現状のソフトの最適化のターゲットになってるnVが勝つのはいいとして、
今時分GPGPUの最大ユーザーっていうとDeepLearningではないかと思うけどそっちはどうなの？

主要なDeepLearningフレームワークでVegaが使えるようになるのか、そしてnVに性能で勝つことができるのか？

**Socket774** · 2017/08/17(木) 23:15:23.06

DoTa2でプロがAIに負けたらしいから
そのうち無茶強いAI搭載のゲームが出るかもよｗ

**Socket774** · 2017/08/17(木) 23:16:02.95

これからは基本AIがさして人間は予想外の変数入れる役目になるのかもな

**Socket774** · 2017/08/17(木) 23:26:51.84

誰も勝てないコンピュータ将棋とか誰がやるんだろ…

**Socket774** · 2017/08/17(木) 23:42:26.88

>>167
ディープラーニングで勝てるかどうか、と言うと、多分フレームワークが対応してないだろうから勝てないと思う。
今後、対応するフレームワークが出てくる可能性はあるけど。
AMDのスレッドリッパーでのプレゼン見ると

ゲーミング(x16のRXVegaを2つ、x4のSSDを1つ)
http://pc.watch.impress.co.jp/img/pcw/docs/1075/501/html/32.png.html

3DCGコンテンツ(x16のProを2つとx8のProを2つ、x4のSSDを3つ)
http://pc.watch.impress.co.jp/img/pcw/docs/1075/501/html/30.png.html

データサイエント(ｘ8のMI25を6つ、x4のSSDを1つ)
http://pc.watch.impress.co.jp/img/pcw/docs/1075/501/html/34.png.html

多分、ゲーミングは捨て玉、ディープラーニングも見せ球で、本命はCG方面で、特にレンダーファーム。

**Socket774** · 2017/08/17(木) 23:58:06.26

マトモなサポートが付いてる商用GPUレンダラーは現状
軒並みCUDA専用なんですがAMDが入り込める余地があるのでしょうか
https://home.otoy.com/render/octane-render/faqs/
https://www.borndigital.co.jp/software/4444.html
https://www.thearender.com/site/index.php/products/thea-for-blender.html
http://furryball.aaa-studio.eu/aboutFurryBall/benchmarks.html

**Socket774** · 2017/08/18(金) 00:02:21.08

レーン数をアピールする割にM.2NVMeのRAIDに対応してない（Intelは対応済み）とかチグハグなんだよな…

**Socket774** · 2017/08/18(金) 00:16:57.64

オープンソースのRadeon ProRenderはOpenCLベースだからどのGPUでも動くけど
無償提供ってのが逆にトラブルが起きたときに対応で逆にネックになりそうな予感がする

ハードウェア非依存型。ご使用のコンピューターがOpenCL 1.2対応の場合、Radeon ProRenderをご利用いただけます。
http://www.amd.com/ja-jp/innovations/software-technologies/radeon-pro-technologies/radeon-prorender
https://pro.radeon.com/en-us/software/prorender/

商用GPUレンダラーはCUDAのCC2.0以降(Fermi)になってる

OctaneRender
requires a CUDA enabled NVIDIA video card. An up to date list can be found here.
OctaneRender can run on most CUDA enabled consumer video cards, instead of only on high-end Quadro cards that most other solutions and middleware require,
but it is specifically optimized to run on Kepler (GTX 6xx, GTX 7xx, GTX Titan), Fermi (GTX 4xx, GTX 5xx) and Maxwell GPUs.

Redshift Render
ビデオカード：CUDA計算能力2.0以上、VRAM 2GB以上のNVIDIAビデオカード

Thea Render
GPU: Nvidia CUDA graphics card (CUDA 6.5, Compute Capability 2.0 or higher),

FurryBall
Always use the latest drivers! (some older drivers can cause crashing of FurryBall)
NVIDIA GPU - CUDA capability 2.0 or later
NVIDIA GTX 4xx or later series
NVIDIA Quadro 4xxx or later
NVIDIA Tesla CM20xx
http://furryball.aaa-studio.eu/products/systemRequirements.html

**Socket774** · 2017/08/18(金) 00:46:19.14

うーん、PCゲームからプロのCG、そしてAIのGPGPUは完全にnVidiaに握られっぱなしだな

どんな分野、どんな会社にせよ独占は良くないので
コンシューマゲーム機以外でも存在感を出せるようになって欲しいものだ

**Socket774** · 2017/08/18(金) 01:48:21.30

>>175

現状は会社の規模がね、人手が足りてない感はある。
CPUとGPUで十分なソフトウェア・サポートをしようと思うと、大雑把に言って、インテル+ヌビと同等のマンパワーが必要でしょ。
まぁ、人手は金だからさ、順調に業績を延ばしていければついてくるんじゃないかな。

**Socket774** · 2017/08/18(金) 02:45:03.91

GPUの少量なローカルメモリで済んでる間は無理だな
HBCC使ったSSGみたいに数100GBや数TBのメモリやキャッシュが必要な用途が増えればワンチャンあり

ゲファやテスラは、直接使えるのはローカルだけで、メインメモリを使うには酷いペナルティがあるし、ストレージなんて不可能
それを無理してやりくりするのがCUDAで、それが楽なのがAMDとopenCL/ROCmの組合せ

V100は16GB、SSGは16GB+メインメモリ+2TB(SSD)、RX Vegaは8GB+メインメモリ

**Socket774** · 2017/08/18(金) 04:52:20.00

しょせんpcieブリッジ接続のssdでは糞遅い
メリットはメインメモリ圧迫しなということだけ

**Socket774** · 2017/08/18(金) 05:31:26.64

それ言ったらCUDAは糞以下なんですがね

**Socket774** · 2017/08/18(金) 06:04:38.67

cudaはメインメモリ扱えるがし
nvlinkでつないだGPUのメモリも使える

radeonのようにブリッジ接続で8GB/sのSSDだけが頼りなわけじゃない

**Socket774** · 2017/08/18(金) 06:07:50.37

>>180
テキトーなこと言ってるけど
ソースあんの？

**Socket774** · 2017/08/18(金) 06:16:43.76

CUDAを知らない奴が妄想でCUDA叩き

**Socket774** · 2017/08/18(金) 06:21:03.70

CUDA危機だな

**Socket774** · 2017/08/18(金) 06:32:03.63

>>181
マジで知らないのかよ

**Socket774** · 2017/08/18(金) 06:39:13.52

>>184
ソース出してみなって言われて出せないなら
また団子と同じ奴が現れてテキトーな事言ってるとしか思われないよ

**Socket774** · 2017/08/18(金) 06:45:23.66

まずは出来ないことを証明しないとｗ

**Socket774** · 2017/08/18(金) 06:58:50.25

ソースもなにも、nvの製品ならnvの公式サイトで派手に宣伝してるよ。

**Socket774** · 2017/08/18(金) 07:12:07.54

過ちを気に病むことはない。ただ認めて、次への糧とすればいい。それが、大人の特権だ

**Socket774** · 2017/08/18(金) 07:28:14.76

ソースはAMDと同じように動画で出してもらいたいな

**Socket774** · 2017/08/18(金) 09:44:41.95

団子またかよ

**Socket774** · 2017/08/18(金) 10:49:42.05

ファンボーイのスレなんだからどうでもいいだろ

**Socket774** · 2017/08/18(金) 10:59:57.30

まあ、それが使い物になるレベルならとっくにアナウンスしてるわ

nvidiaのアナウンス
8K動画編集はAMDのSSGを使わなくても、nvidiaのグラボとAMDのスリッパでイケます！

**Socket774** · 2017/08/18(金) 11:56:20.68

デモに使われたのはDellのXeon搭載WSだけど、スリッパはどこから出てきたの
http://www.fudzilla.com/news/44284-quadro-p6000-can-render-uncompressed-8k
http://www.get-pc.net/Precision-Tower-7910/index.htm

**Socket774** · 2017/08/18(金) 12:13:08.89

http://news.mynavi.jp/articles/2016/10/12/gtcjapan2016_unifiedmemory/002.html
デマンドページングは便利な機能であるが、オーバヘッドも大きいので、使い方には注意が必要である。

HBCCぽい動きが出来そうだけど、ハードじゃなくソフト的にやってるから遅延が大きいんだろうな

**Socket774** · 2017/08/18(金) 12:43:52.87

>>193
XEONでもいいんじゃない？
16コアのCPUの覇権はスリッパだけどさw

**Socket774** · 2017/08/18(金) 12:49:28.39

たったの8GB/sのSSDにアクセスしてどれだけ効果があるんですか

**Socket774** · 2017/08/18(金) 12:53:37.40

>>196
だからソース持ってこいよ

**Socket774** · 2017/08/18(金) 12:56:42.64

アスペか
CUDAは糞以下なんて言ってる時点で気づくべきだった

**Socket774** · 2017/08/18(金) 13:28:15.68

>>198
ゲフォ厨はさっさと失せろ
実際に外部メモリへのアクセスに関してはCUDAは糞なだけだ

**Socket774** · 2017/08/18(金) 13:44:15.23

2TB of NAND flash storage plugged into a pair of M.2 ports
つまり最大PCIe3.0の4lanでも片方向4GB/sペアで8GB/s
あくまでM.2の理論値
RAID0でもつかうのか？
それでも実速度は半分程度だろうが

**Socket774** · 2017/08/18(金) 13:48:31.26

>>182
ラデ信は哀れ・・・

**Socket774** · 2017/08/18(金) 13:48:36.01

>Vega 10では、PCのメインメモリなどを仮想ビデオメモリとして利用できるHigh-Bandwidth Cache Controller(HBCC)という機能を新たにサポートし、この機能を利用するさいはGPUに直結されたHBM2をキャッシュメモリのようにあつかう。

>この機能はRadeon Settingから有効化できるが、将来的により多くのビデオメモリを必要とする場面で使用することを想定した機能であり、今回のテストではこの機能は使用していない。

>Radeon SettingのHBCC設定「HBCC Memory Segment」。
>標準では無効化されており、有効化するとHBCCで利用するメモリの容量を設定できるようになる
http://pc.watch.impress.co.jp/img/pcw/docs/1075/646/i02.png

**Socket774** · 2017/08/18(金) 13:59:43.09

GPUがテラバイトのフレームバッファを扱うことができるのが強みなのだ
接続してるバスインターフェイスのどうのこうの話ではない

**Socket774** · 2017/08/18(金) 14:11:57.52

AGPメモリかよ

**Socket774** · 2017/08/18(金) 14:27:15.09

その強みは具体的にどういう場面で活きてくるの？
8K編集かな？w

**Socket774** · 2017/08/18(金) 14:54:06.65

実際に8K編集で役に立ってたな
nvidiaはまた１つ引き離された訳だ

**Socket774** · 2017/08/18(金) 15:06:57.15

高解像度対応の需要は尽きることはないしな
実際編集は高解像度で行って使うのはダウンコンバートしたものとか当たり前になってるし

**Socket774** · 2017/08/18(金) 16:12:27.74

pcie自体も早くなるぞ
来年にはGEN4
2019年には(いけるが知らんが)GEN5の予定

GEN5の4chでDDR4の1chと同じスピード出るし、ハナから帯域不足の前提でプログラムするしな

**Socket774** · 2017/08/18(金) 17:14:46.96

まぁNVLINKは、どっちかってとHPC向けだし、POWERのプラットフォームで真価を発揮するものだろう。
８K編集とかに使うようなもんじゃないでしょ。

**Socket774** · 2017/08/18(金) 17:29:48.21

>>208
大分問題があってな
PCI-SIG握ってんの事実上intelなのよ
アレを速くすると自社の製品を喰われる他社製が出張ってくるから、なるたけ引っ張るか遅くするか
動画クリエーター周りだけ言えばアレらはXEON出したいから&今AMDとガチンコやってるから他が出て来てもらっちゃ困る
多分露骨には出来ないから引っ張ると思うよ

AMDがCPUGPU問わず色々仕込んでるのは大体コレが原因
規格周り殆ど握られてるからね、裏道探して出し抜くしか無い

**Socket774** · 2017/08/18(金) 17:48:55.90

ソケットFM2+のA10-7870KとAM4のA12-9700で
A10にDDR3-2166、A12にDDR4-2400のメモリ積んで同一ベンチ走らせると
A10が半分以上勝つらしいけど
これってAM4マザーのインターフェイスに設計ミスとかあるんじゃないかなあ？
Ryzenのベンチでも7700Kにぼろ負けしてるし
CPUの性能をチップセット側で活かせてない気がするなあ

**Socket774** · 2017/08/18(金) 17:49:02.54

12コアのスリッパAPUとか出るかな？

**Socket774** · 2017/08/18(金) 17:58:40.29

自作用のAPUはずっと4コアだろうな
次のXBOX買えば？
8コア版のAPUだろうし

**Socket774** · 2017/08/18(金) 18:02:18.62

APUにメモリ直接積んでハイパーメモリCPUやってほしい

**Socket774** · 2017/08/18(金) 18:02:40.63

8コアですら使いみちがないのに、売れないと困るAPUで冒険なんかするわけねえ
12コアAPU、12万円として誰が買うんだそんなもん

**Socket774** · 2017/08/18(金) 18:08:07.16

>>193
いちゃもんつけたAMDは赤っ恥ですな

**Socket774** · 2017/08/18(金) 18:11:26.94

>>212
AVX絶対殺すマンと化した超低レイテンシなGPUならワンチャンあるかも
その場合は全部のモデルに載るだろうし
インテルHDより更に貧弱なFLOPSだろうけどw

**Socket774** · 2017/08/18(金) 18:15:33.82

10コアでベース3Ghz以上のapu欲しいわ

**Socket774** · 2017/08/18(金) 18:19:55.70

HBCCはIntelがOptaneでやろうとしてることの凄い版
あれは、HDDの高速化だけど、HBCCはメインメモリとSSDの高速化
NVMe SSD(5GB/s)/メインメモリ(50GB/s)→PCIe(16GB/s)→HBM2(500GB/s)

CPUのキャッシュ制御と大体一緒だから、実装は楽だろうね
ただ、CPUとGPUの違いに合わせたドライバの調整が面倒そうだけど

**Socket774** · 2017/08/18(金) 18:24:38.29

>>217

デバドラやめて、x64にGPUコントロールの拡張命令でも追加するといいよ。

**Socket774** · 2017/08/18(金) 18:50:04.84

>>220
正解

**Socket774** · 2017/08/18(金) 18:51:56.46

>>220
それは考えてると思うよ、APUの構造的にそれがあるのが一番いいからね
草案作りとか根回しとか大変だろうから当分先だろうけど

**Socket774** · 2017/08/18(金) 18:55:19.51

>>222

いあ、ごめんネタだから、現時点でAMDがそれをやるほど愚かじゃないのは明白。
なぜなら、そんなことした時点でGPUの機能を変更できなくなる。

やるとしたらGPU自体が枯れて、これ以上機能の刷新も新機能も必要ないところまできてから。

**Socket774** · 2017/08/18(金) 19:08:00.97

>>223
AVXはAVX→AVX2→AVX512って拡張し続けてるんだけど
それ以外でも、仮想関係やセキュリティもAMDとIntelは独自に実装している
そういう前例があるから、GPGPUを標準化しても拡張はし続けていける

AMDのGPUは機能的な拡張し続けて、VegaでほぼCPUと遜色ないくらいになってる
そろそろCPUとGPUでISAの統合が出来る頃合いだと思うんだよね

**Socket774** · 2017/08/18(金) 19:13:32.26

ふぃるへすたー「sse5 」

**Socket774** · 2017/08/18(金) 19:14:37.29

>>224
AVX512はインテルさえ「コスト高すぎて実装は考えていない」つってるけどね
そもそもロード/ストアユニットが128ビット×4構成のインテルでさえ、512命令来ると4基フルで
1命令しかこなせないし
128ビットのLSU×2基しかないRyzenがシングルコアのベンチで負けるのは当然として
512命令が来るとRyzenは1回で処理出来ずここで渋滞するんだよな
ていうかAVX2もRyzenではここがボトルネックになってる

AMDも妙なところでケチるよなあ

**Socket774** · 2017/08/18(金) 19:16:10.08

言いたいのは、x64本体に組み込むんじゃなく、AVXや仮想機能みたいな拡張機能とするってこと
その先は、更に5年後くらいにx64+AVX2+GPGPUを統合した、新x64とか作れるかもしれないかな

今時GPU内蔵CPUなんて普通だし、GPGPUもかなりCPUに近くなってるから、統合ISAは時間の問題と思う
それの先陣を切るのは、AMD64やmantleを出したAMD以外ないだろう

**Socket774** · 2017/08/18(金) 19:18:39.55

>>224

CPUのSIMD命令は、レジスタ等への前準備は必要とは云え、単一の命令だよ。
そんなのの拡張とGPUってユニットの拡張を同列にするかね？

そもそも、ついこないだVEGAで大掛かりな仕組みの変更をしたとこじゃないか。
それとも、後方互換製のために、古くなったらほとんど使わない回路をどんどん肥大化させていくつもりかね？
沢山のコアが一斉に肥大化してくんだよ？

**Socket774** · 2017/08/18(金) 19:25:10.67

AMDとMSとLinux勢も多分望んでそうだから、動いてそうな気はする
いい加減GPGPUの使い辛さをどうにかしたいと思ってそうだし
そうすればゲームや技術計算やディープラーニングとか今よりずっと楽に開発できるだろうね

**Socket774** · 2017/08/18(金) 19:30:55.12

>>229
それは多分、Larrabeeが見た夢だろう。
GPUとして失敗した時点でタダの計算機になって、一般消費者向けではなくなってしまった。

ARMコアで似たような構想を抱けば、もしかしたらモダンなものになるのかもしれないね。

**Socket774** · 2017/08/18(金) 19:31:41.68

>>228
x64はx86を内包してるけど別に騒ぐほど肥大化してないよ
x87は切り捨てた、SSE2を標準にしたから、それ以前のMMXやSSEも捨てた

標準化するのはシェーダーモデル6とIEEE754対応とGPU仮想化全般でいい
あとはCPU-GPU間の連携用の命令くらいか

**Socket774** · 2017/08/18(金) 19:41:20.95

>>231

肥大化するのはCPUコアじゃなくてGPUコアのほうだよ。
CPU側はほぼデコーダの拡張だけでしょ。
MMXやSSEは捨てたってよりも、uOPの組み合わせなんだから残そうがどうしようが大勢に影響ないよ。

連携ではなく内包でないと、制御命令をCPU側に追加する意味が薄いと思うけど？
AVXとGPGPUのレスポンスを同じにしたいんでしょ？
コマンド生成して放り込む方式だったら、ドライバでやっといたほうがよっぽど柔軟性があるよ。

**Socket774** · 2017/08/18(金) 19:50:17.24

先見性はAMD

**Socket774** · 2017/08/18(金) 19:50:50.73

つまり、CPUでGPUをコントロールするってのは、GPUのデコーダの機能をCPUのデコーダに統合するって意味で書いたよ。
ｘ８６のソースの中にGPUのコマンドも含まれている状態。
それしかレスポンスでAVX対抗はないと思うけども。

そして、それって現実的かな？と思うけども。

**Socket774** · 2017/08/18(金) 19:58:25.48

かつてCPUはコプロを外部に追いやった

現代はコプロを内臓する時代へ

**Socket774** · 2017/08/18(金) 19:59:00.06

(ていうか、そういえばAVX2ってエンコ以外で何に使うの？)

**Socket774** · 2017/08/18(金) 20:07:05.29

>>236
有名ベンチマークテストのソフトが使ってるから
もしかしたら必要以上にRyzenは実力を低く見積もられてるかも知れない

**Socket774** · 2017/08/18(金) 20:11:11.26

>>225
10年経っても実現しなかったね

**Socket774** · 2017/08/18(金) 20:11:54.69

>>232
レスポンスはどうでもいいよ、それはバスと距離の問題だし
結局はメモリ関係が独立していてプログラムが特殊で面倒なのを、シェアードメモリでアドレス共有してプログラムが共通になって楽になって欲しいってだけ
GPGPU関連はほぼ全てがシェアードメモリ関連で苦労してるし
標準化すれば、各社が独自で細かく考えなくていいし、強化点も分かりやすくなるからいい事ずくめだと思うけどね

言いたいのは、シェアードメモリのハードウェア対応と標準化
DX12のように対応できないNvidiaに邪魔されるのはいい加減うんざりなので、AMDとMSとLinux勢でAMD64みたいにとっととやってほしい所

**Socket774** · 2017/08/18(金) 20:14:19.22

AMDの市場シェアが上がれば当然
昔みたいに相手してもらえるようになるでしょ

**Socket774** · 2017/08/18(金) 20:20:19.79

>>234
AVX対抗というよりAVXの拡張かなあ
AVXの処理を一部GPGPUに振り分けるというふうに
まあ、どういう実装が一番効率いいかは知らないけど、対抗するより共存させたほうがいいと思う

言いたいのは、せっかくGPU内蔵していて巷にもSocが溢れてるんだから、ISAも統合して活用しようぜってこと
活用されたら困ることなんてないでしょ

**Socket774** · 2017/08/18(金) 20:24:13.38

>>239

レスポンスが距離？そのレスポンスじゃなくてね
GPUにコマンド一つ送って処理させるのに、どれだけCPUが仕事するのかって話、のレスポンス。
AVX命令一回で済む規模の計算を、GPUでやるとどんだけ時間がかかるか。
そもそも、オレが書き出した発端は >>217 だから、レスポンス関係ないってなら論点がずれちゃった。

なら、現状統合の必要はない、の意見にする。
外部デバイスはめんどくさいけど、自由度が高いから。外付けなら、計算規模に合わせて組み合わせすら変更できるよ。

**Socket774** · 2017/08/18(金) 20:25:35.45

コレでコテ隠して他人になったつもりなのか？逆神糞コテ様は

**Socket774** · 2017/08/18(金) 20:27:12.39

>>241

そのとおり、CPUのSIMDは使いやすいよ。
なんせ、ソースにぽんと埋め込めば、並列化云々考えなくていいもの。

でも、なぜかここの板では、いつもAVX対GPGPUの構図をとりたがる人達がいるんだよ。

**Socket774** · 2017/08/18(金) 20:29:13.92

バレバレすぎる

**Socket774** · 2017/08/18(金) 20:31:43.92

>>240
AMD64作ったときも、DX12のときもAMDは弱小でしか無かったよ
シェアじゃなく方向性や技術力の問題

**Socket774** · 2017/08/18(金) 20:40:22.54

>>244
そこまで簡単じゃねぇよ
性能出そうと思ったらキチンと調整しねぇと

まぁ折角腐る程演算機載ってんだ
使えるなら使った方がいい
SIMDは多くの場合並列性で伸びるし

**Socket774** · 2017/08/18(金) 20:43:30.97

>>247

ごめんごめん、使用方法のはなし。
GPUは手続きが多いでしょって部分での比較。

**Socket774** · 2017/08/18(金) 20:44:11.05

AVXの何が嫌いって、わざわざ専用に演算機積んでる事だわ
低レイテンシGPUの何が良いって、そもそもGPUとして使える事だと思う
エンコ以外使われない回路とか9割9分ゴミじゃんw

**Socket774** · 2017/08/18(金) 20:45:04.91

AMDの初期設計の問題でボトルネックが発生してるから
AMDの得意分野に最適化して欲しいって論旨は
まずAMDがその開発言語にコンパイルオプション一発で最適化するぐらいの
状況を提供しろって話でしょ
現代の標準的な開発オプションで実力が出ないなら
それは設計か商売、どっちかが下手だって話であってさ

誰かがやってくんねえかなー？ってのは論外

**Socket774** · 2017/08/18(金) 20:46:54.93

SIMDを活かすためには足回りも揃えないといけなくて、
それをCPU全体に配備することの費用対効果が問われてるんでないの？

**217の人** · 2017/08/18(金) 20:50:37.33

(何かAVX絶対殺すとか言っちゃったからか、スゲーレス伸びてんだけど…どないしよ)

**Socket774** · 2017/08/18(金) 20:53:23.05

>>242
あなたはGPGPUが活用されるのが嫌なんですか？
AVX性能が一番大切ならIntel使ってればいいと思います
AVXは私もAMDも互換が取れれば性能とか気にしてないので特に話題にしなくていいです、どうでもいいので

**Socket774** · 2017/08/18(金) 20:59:48.69

>>248
だから頑張って簡単にしようとしてるけどね

ぶっちゃけた話、AVX512なんて馬鹿みたいに幅広げるより、先ずは実装効率を向上させるべきかと
逆にGPUは使い易い場所に置くべき
まぁコレを馬鹿正直に実装するとデカいBulldozerになるけどさ
AMDがCPUをCCXで纏めたのは将来的にそういう実装を補助するためじゃないかと思わんこともない

**Socket774** · 2017/08/18(金) 21:00:51.46

>>242

なんで好き嫌いな話になる？
APUの内蔵GPUのリソースをOpenCLに全部回そうとおもって、ラデ追加したよ。
笑うやついるけどwww

AVXとGPGPUなんて排他関係にないでしょ？って立場なだけだよ。

**Socket774** · 2017/08/18(金) 21:01:37.32

>>242 →>>253

**217の人** · 2017/08/18(金) 21:06:31.49

そもそも皆んなAVX使う？
セレロンとかペンティアムに載って無いじゃん
結局いつもループ入れて終わってるわ、俺

**Socket774** · 2017/08/18(金) 21:25:07.56

標準化の一番のネックはシェアードメモリだろうなあ
ページフォルトとコヒーレンシだっけか
GPGPUの性能はどうにでもなるから、標準化して今よりプログラミングが楽になってほしいところ

**Socket774** · 2017/08/18(金) 21:28:26.91

>>257
AVX周りの話題なんて
プロのレビュワーの記事か、動画をエンコードする人間にしか話題にしてない気がする
まあゲーム系ベンチで「Ryzenはシングルコアが弱い」的な話題がでるとき
裏ではこの辺の事情と、CCXのレイテンシあたりが絡んでるんだろうけど

どっちにしろ、2年弱先のAMDのロードマップでは
APUは最大4コアでvega10搭載の、ノート用のAPUしか姿見えてないし
ソケットAM4のリテール用APU出すらしいけど
未だに発表しないって事はクリスマス商戦に間に合わない訳だから
早くたって来年3月くらいまでお預けなんじゃないの？

**Socket774** · 2017/08/18(金) 21:37:05.24

>>257
AMDファンなら気づかないうちに使ってるしょ
AMDのIntelに対するアドバンテージのひとつが
全ラインナップでAVXに対応してることだし

**Socket774** · 2017/08/18(金) 21:49:24.44

>>260
最低限の互換を確保してるだけで、8コアあたりでは切った方が早い
我らが天才ジムおじさんが切り捨てたのも頷ける
ソフト屋の視点では共存でいいかもだけど、CPUに実装するとなると費用効率悪すぎだもの

**Socket774** · 2017/08/18(金) 21:55:26.52

あー、インテルだとブラックシリコンの解消になんのかな？
RyzenはIF使ってMCM出来るしな、そりゃ捨てるわ

**Socket774** · 2017/08/18(金) 21:56:35.41

LSから全てへばりついたSIMDエンジンにオフロードすればキャッシュの汚染も無駄な帯域も無くなるわな

**Socket774** · 2017/08/18(金) 22:23:21.77

>>226
2コアでAVX512ユニットを共有すればいいんじゃね？

**Socket774** · 2017/08/18(金) 22:36:16.43

君たちの理想のcpuは総合すると
中国の太湖之光じゃん

**Socket774** · 2017/08/18(金) 22:38:13.80

>>264
AVX512処理を現状
命令＞処理＞処理＞処理＞処理
でやってるのに、それだと
命令＞分析＞同期＞処理＞処理＞分離
のサイクルでやることになるからかえって遅くなるかな

**Socket774** · 2017/08/18(金) 23:07:04.45

AVX512って32bitx16個か64bitx8個の処理をやってるだけでしょ？
多くなるほど効率悪化してスケーリングが落ちるから、ベンチか特定演算専用にしかなってない
256bit命令や512bit命令があるわけじゃなし、無理して実装するものでもないでしょ