X



AMDの次世代APU/CPU/SoCについて語ろう 281世代 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0001Socket774
垢版 |
2017/08/15(火) 05:19:26.78ID:no/7PwyS
___
\._  | 荒らし・煽り・厨房は放置が一番。
/|_| | 釣られずにスルーしましょう。
|_/\! sage進行でマターリいきますお。


★前スレ
AMDの次世代APU/CPU/SoCについて語ろう 280世代
http://egg.2ch.net/test/read.cgi/jisaku/1500803461/
0132Socket774
垢版 |
2017/08/17(木) 18:57:56.55ID:8bqs4SXf
ボトルネックつぶすためにチューニングする必要が出てくるときって
そんな小さい処理で済むことなんかまずなさそう
どうしてもGPGPUになっちゃいそう
0133Socket774
垢版 |
2017/08/17(木) 19:07:36.30ID:pEIwrtSh
ネックになるのは逐次処理だよ
0134Socket774
垢版 |
2017/08/17(木) 19:17:49.90ID:ui/DyGJF
>>131

まぁ演算にループを使うくらいならってもんだからなぁ、SIMDって。

GPGPUは結局OSを介さないと使えないもんだし・・・
コール準備してるひまがあったら、SIMDで処理が完了しちゃうって場面もあるだろし・・・
やっぱ比較できるもんじゃないと思うけどもね。
0135Socket774
垢版 |
2017/08/17(木) 19:28:48.65ID:Vo3PgBAs
>>132
ボトルネックになる要素が多くて使い方によっては(SMDもGPUも使わない時より)遅くなる事もあるけど、最大性能は高くてCPUのリソースを使わないので処理によっては大きな効果が見込めるのがGPGPU
大きな効果は期待できないけど、(SIMDもGPUも使わない時と比べて)少なくとも遅くなることは無いSIMD
チューニングが大変だからという理由で使われなくなるならGPGPUの方だぞ
0136Socket774
垢版 |
2017/08/17(木) 19:34:55.31ID:qW3DX4HE
レイテンシと帯域でどれほどの差があるかだよね
でもそれは、演算性能で大体カバーできると思う
演算の並列化って遅延を隠す意味もあるし

まあ。一番の理由はGPGPUを一般化したらAMDに支配されちゃうからだろうな
だからAVX推しだし、CUDAで排除するしかない
困ったもんだ
0137Socket774
垢版 |
2017/08/17(木) 19:35:31.11ID:g5zcCyAE
ですからデスクトップ版RYZENAPU待ちなので
0138Socket774
垢版 |
2017/08/17(木) 19:46:04.32ID:ui/DyGJF
>>136

だから、その遅延を隠蔽するだけの量のデータって、何?ってことなんだよ。
正直、ゲームグラフィックくらいの規模がちょうど良い状態。

逆にCPUのSIMDがGPGPU必要ないくらい使えるってなら、すなわちDXをソフトウェアドライバで処理しちゃえばいいってことになりかねない。
CPUが8個もあるんだから、スレッド分けれるでしょ?って話は、いくらなんでも現実的ではない、ってのがCPUのSIMD命令。
0139Socket774
垢版 |
2017/08/17(木) 20:04:32.01ID:qW3DX4HE
>>138
思いつくのはエンコとレンダリングと動画編集かな
GPUのローカルメモリ量がネックらしいけど、それはHBCCで解消できる
後は負荷に応じてGPGPUに投げればいい

その分CPUに余裕ができるから、他の作業をやるのもいいね
暇つぶしにYoutube見たり、ネットブラウジングしたりゲームしたり、オフィスで他の作業でもいい
0140Socket774
垢版 |
2017/08/17(木) 20:13:49.80ID:LC7IMrJ8
いつになったらGPGPU対応のエンコソフト出るの
フィルタ処理の一部にGPGPU使うのはあるが、
肝心のエンコはCPUオンリーしかないのはなぜなのか
0141Socket774
垢版 |
2017/08/17(木) 20:16:41.39ID:dn9P38YS
>>140
CPUが一番綺麗だからだろ
CUDAエンコみたいな糞ぶち撒けた画質なんて誰が使うんだっつーの
0142Socket774
垢版 |
2017/08/17(木) 20:24:58.21ID:qW3DX4HE
>>140
GPUは整数弱いしビデオメモリ2GBや4GBでエンコやレンダリングとか無茶言うなだから
ラデは整数そこそこだしメモリ制限なくなるから、今後は対応していくんじゃなかろうか
ゲフォはその辺クソだから一生無理
0143Socket774
垢版 |
2017/08/17(木) 20:31:38.64ID:+DYJiBvU
エンコードは離散コサイン、離散サインの塊だから
超越関数扱えるユニット型極端に少ないGPUには効率がわるい

まぁ専用回路あるからどうでもいい話だが
0144Socket774
垢版 |
2017/08/17(木) 20:32:17.71ID:dn9P38YS
つーか円盤がオワコン化したし、エンコなんて使うやつ殆どいないだろ
ネット配信がメインストリームなんだから
0145Socket774
垢版 |
2017/08/17(木) 20:33:11.47ID:yFEcB1ZF
エンコはやはり整数多用してるのがネックになるんだな
0146Socket774
垢版 |
2017/08/17(木) 20:33:38.72ID:ui/DyGJF
>>144

ネット配信用のデータを作るんでしょうよ。
Youtuberみたいな人達が。
0147Socket774
垢版 |
2017/08/17(木) 20:36:32.40ID:dn9P38YS
>>146
需要として少なすぎ
商用として作ったらエンコソフト1本で何十万とかになんぞ
0148Socket774
垢版 |
2017/08/17(木) 20:37:57.23ID:WNn+LMWg
>>147
アクションカムで撮った動画をたくさん保存するためにエンコしたりとか、普通にあるっぽい
YouTubeにあげなかったとしても
0149Socket774
垢版 |
2017/08/17(木) 20:42:52.75ID:ui/DyGJF
>>147

需要の多い少ないでいえばそのとおり。
だけどそれは円盤オワコンと関係なくない?
むしろ、微々とはいえ今後伸びていく気がする。
0150Socket774
垢版 |
2017/08/17(木) 20:43:14.58ID:nx80C0Gg
まあ、一般じゃ8コアですら使いみちはあまりないからな・・・
16コアなんてなおさらよ
0151Socket774
垢版 |
2017/08/17(木) 20:43:55.70ID:yc6ih3K+
>>141
NVEncとかはGPGPUじゃなくてGPUのエンコ専用回路使ってるよ
逆に言うとGPUに負荷掛けないからShadowPlayのようにゲームしながらエンコできるわけだけど
ちゃんとGPGPUでプログラム動かすなら実際の速度はともかく画質はCPUと比べても劣らないはず
0152Socket774
垢版 |
2017/08/17(木) 20:45:16.08ID:dn9P38YS
何がひでえってAVX付きの4コアより、付いてない8コアの方がエンコ性能高いことだな
インテルはさっさとAVX捨てて8コアをメインストリームにすべきだったわ
0153Socket774
垢版 |
2017/08/17(木) 20:49:20.53ID:ui/DyGJF
>>151

それはCPUとGPUの分業になるだろうけどね。
レイトレースでもそうだけど、前処理として解析データをテーブル化するとか、得意だと思うよ。
0154Socket774
垢版 |
2017/08/17(木) 21:02:30.50ID:v587SF55
>>147
4K、8Kが普及してコンテンツのデータ量増加が
ストレージ容量の進歩を追い越せば需要が…
0155Socket774
垢版 |
2017/08/17(木) 21:04:26.07ID:dn9P38YS
>>154
そん時はテープだろ
5インチベイで500TBから1PBぐらいは入るし
0156Socket774
垢版 |
2017/08/17(木) 21:10:44.91ID:ui/DyGJF
>>155

ネタだとは思うが、それはちょっと遠慮したいwww
0158Socket774
垢版 |
2017/08/17(木) 21:27:42.06ID:ui/DyGJF
>>157

それ知ってるけどもさ、容量だけ増やしたけりゃ採用すればいいって代物でしょ?しかもバックアップに。
まぁ、15年ほど前に会社のサーバーがテープ採用してたけど、3年くらいして復旧に使ったらデータとんでて、以後定期的にベリファイとらないと怖くて使えなかったよ。
容量増えたってことは、伸びとかもっとシビアなことない?一般家庭で常用できる代物なのかね。
0159Socket774
垢版 |
2017/08/17(木) 21:36:07.00ID:MTFFA7qJ
>>158
5年経った知識は無いに等しい
この業界だと当たり前の事だと思うが?
0160Socket774
垢版 |
2017/08/17(木) 21:38:47.54ID:dn9P38YS
15年か…
あれ?Core2DUOってもう出てたっけ?w
0161Socket774
垢版 |
2017/08/17(木) 21:51:24.46ID:ui/DyGJF
んで、結局一般家庭で使えるの?使ってるの??
0162Socket774
垢版 |
2017/08/17(木) 21:56:38.69ID:A2uhetzq
すれ違い
0163Socket774
垢版 |
2017/08/17(木) 22:04:05.41ID:Vo3PgBAs
>>139
エンコードはGPGPUに向かない処理の代表じゃないか
向くのはノイズリダクションやリサイズといった『エンコードと同時に行う可能性のある処理』だよ

>>141
『GPGPUだと画質が悪い』のではなく、『GPGPUだと非常に遅い』ので実用的な速度にしたらクソ画質になるが正解だ
0164Socket774
垢版 |
2017/08/17(木) 22:22:12.29ID:UMoiInEi
GPUがエンコードしてるのではなく
VCEって専用回路がエンコードしてるんだぞ
0165Socket774
垢版 |
2017/08/17(木) 22:38:44.83ID:Vo3PgBAs
>>164
いきなりどうしたんだ?
VCEやNVENCがGPGPUエンコードなどと言っているのは一人もいないのだが

>>140
TMPGEncの『古いバージョン』ならh.264のCUDA(GPGPU)エンコード対応しているよ
クソ画質過ぎて、今のバージョンでNVEnc対応すると同時に非対応になったけど
0166Socket774
垢版 |
2017/08/17(木) 22:41:46.77ID:g5zcCyAE
その件につきましてはデスクトップ版RYZENAPU待ちでございますので
0167Socket774
垢版 |
2017/08/17(木) 23:07:49.49ID:ZU06pgC/
ゲームグラフィックはまぁ現状のソフトの最適化のターゲットになってるnVが勝つのはいいとして、
今時分GPGPUの最大ユーザーっていうとDeepLearningではないかと思うけどそっちはどうなの?

主要なDeepLearningフレームワークでVegaが使えるようになるのか、そしてnVに性能で勝つことができるのか?
0168Socket774
垢版 |
2017/08/17(木) 23:15:23.06ID:OAlDfWxD
DoTa2でプロがAIに負けたらしいから
そのうち無茶強いAI搭載のゲームが出るかもよw
0169Socket774
垢版 |
2017/08/17(木) 23:16:02.95ID:+muKTfdi
これからは基本AIがさして人間は予想外の変数入れる役目になるのかもな
0170Socket774
垢版 |
2017/08/17(木) 23:26:51.84ID:tOHf7W9m
誰も勝てないコンピュータ将棋とか誰がやるんだろ…
0171Socket774
垢版 |
2017/08/17(木) 23:42:26.88ID:vSEROZxJ
>>167
ディープラーニングで勝てるかどうか、と言うと、多分フレームワークが対応してないだろうから勝てないと思う。
今後、対応するフレームワークが出てくる可能性はあるけど。
AMDのスレッドリッパーでのプレゼン見ると

ゲーミング(x16のRXVegaを2つ、x4のSSDを1つ)
http://pc.watch.impress.co.jp/img/pcw/docs/1075/501/html/32.png.html

3DCGコンテンツ(x16のProを2つとx8のProを2つ、x4のSSDを3つ)
http://pc.watch.impress.co.jp/img/pcw/docs/1075/501/html/30.png.html

データサイエント(x8のMI25を6つ、x4のSSDを1つ)
http://pc.watch.impress.co.jp/img/pcw/docs/1075/501/html/34.png.html


多分、ゲーミングは捨て玉、ディープラーニングも見せ球で、本命はCG方面で、特にレンダーファーム。
0173Socket774
垢版 |
2017/08/18(金) 00:02:21.08ID:ifPp60jP
レーン数をアピールする割にM.2NVMeのRAIDに対応してない(Intelは対応済み)とかチグハグなんだよな…
0174Socket774
垢版 |
2017/08/18(金) 00:16:57.64ID:4jhZfxM3
オープンソースのRadeon ProRenderはOpenCLベースだからどのGPUでも動くけど
無償提供ってのが逆にトラブルが起きたときに対応で逆にネックになりそうな予感がする

ハードウェア非依存型。ご使用のコンピューターがOpenCL 1.2対応の場合、Radeon ProRenderをご利用いただけます。
http://www.amd.com/ja-jp/innovations/software-technologies/radeon-pro-technologies/radeon-prorender
https://pro.radeon.com/en-us/software/prorender/


商用GPUレンダラーはCUDAのCC2.0以降(Fermi)になってる

OctaneRender
requires a CUDA enabled NVIDIA video card. An up to date list can be found here.
OctaneRender can run on most CUDA enabled consumer video cards, instead of only on high-end Quadro cards that most other solutions and middleware require,
but it is specifically optimized to run on Kepler (GTX 6xx, GTX 7xx, GTX Titan), Fermi (GTX 4xx, GTX 5xx) and Maxwell GPUs.

Redshift Render
ビデオカード:CUDA計算能力2.0以上、VRAM 2GB以上のNVIDIAビデオカード

Thea Render
GPU: Nvidia CUDA graphics card (CUDA 6.5, Compute Capability 2.0 or higher),

FurryBall
Always use the latest drivers! (some older drivers can cause crashing of FurryBall)
NVIDIA GPU - CUDA capability 2.0 or later
NVIDIA GTX 4xx or later series
NVIDIA Quadro 4xxx or later
NVIDIA Tesla CM20xx
http://furryball.aaa-studio.eu/products/systemRequirements.html
0175Socket774
垢版 |
2017/08/18(金) 00:46:19.14ID:yZmFXrUu
うーん、PCゲームからプロのCG、そしてAIのGPGPUは完全にnVidiaに握られっぱなしだな

どんな分野、どんな会社にせよ独占は良くないので
コンシューマゲーム機以外でも存在感を出せるようになって欲しいものだ
0176Socket774
垢版 |
2017/08/18(金) 01:48:21.30ID:x2o59Lzn
>>175

現状は会社の規模がね、人手が足りてない感はある。
CPUとGPUで十分なソフトウェア・サポートをしようと思うと、大雑把に言って、インテル+ヌビと同等のマンパワーが必要でしょ。
まぁ、人手は金だからさ、順調に業績を延ばしていければついてくるんじゃないかな。
0177Socket774
垢版 |
2017/08/18(金) 02:45:03.91ID:1Hi1LVjY
GPUの少量なローカルメモリで済んでる間は無理だな
HBCC使ったSSGみたいに数100GBや数TBのメモリやキャッシュが必要な用途が増えればワンチャンあり

ゲファやテスラは、直接使えるのはローカルだけで、メインメモリを使うには酷いペナルティがあるし、ストレージなんて不可能
それを無理してやりくりするのがCUDAで、それが楽なのがAMDとopenCL/ROCmの組合せ

V100は16GB、SSGは16GB+メインメモリ+2TB(SSD)、RX Vegaは8GB+メインメモリ
0178Socket774
垢版 |
2017/08/18(金) 04:52:20.00ID:anultAp6
しょせんpcieブリッジ接続のssdでは糞遅い
メリットはメインメモリ圧迫しなということだけ
0179Socket774
垢版 |
2017/08/18(金) 05:31:26.64ID:WR/H7WIx
それ言ったらCUDAは糞以下なんですがね
0180Socket774
垢版 |
2017/08/18(金) 06:04:38.67ID:anultAp6
cudaはメインメモリ扱えるがし
nvlinkでつないだGPUのメモリも使える

radeonのようにブリッジ接続で8GB/sのSSDだけが頼りなわけじゃない
0181Socket774
垢版 |
2017/08/18(金) 06:07:50.37ID:x6fgrX/t
>>180
テキトーなこと言ってるけど
ソースあんの?
0182Socket774
垢版 |
2017/08/18(金) 06:16:43.76ID:fdgBiNUO
CUDAを知らない奴が妄想でCUDA叩き
0183Socket774
垢版 |
2017/08/18(金) 06:21:03.70ID:BLjUNCqz
CUDA危機だな
0184Socket774
垢版 |
2017/08/18(金) 06:32:03.63ID:anultAp6
>>181
マジで知らないのかよ
0185Socket774
垢版 |
2017/08/18(金) 06:39:13.52ID:x6fgrX/t
>>184
ソース出してみなって言われて出せないなら
また団子と同じ奴が現れてテキトーな事言ってるとしか思われないよ
0186Socket774
垢版 |
2017/08/18(金) 06:45:23.66ID:csOSFCE2
まずは出来ないことを証明しないとw
0187Socket774
垢版 |
2017/08/18(金) 06:58:50.25ID:x2o59Lzn
ソースもなにも、nvの製品ならnvの公式サイトで派手に宣伝してるよ。
0188Socket774
垢版 |
2017/08/18(金) 07:12:07.54ID:1L+CWnHn
過ちを気に病むことはない。ただ認めて、次への糧とすればいい。それが、大人の特権だ
0189Socket774
垢版 |
2017/08/18(金) 07:28:14.76ID:0EgLoucX
ソースはAMDと同じように動画で出してもらいたいな
0190Socket774
垢版 |
2017/08/18(金) 09:44:41.95ID:yrx+Gd/a
団子またかよ
0191Socket774
垢版 |
2017/08/18(金) 10:49:42.05ID:/ocHNZ8F
ファンボーイのスレなんだからどうでもいいだろ
0192Socket774
垢版 |
2017/08/18(金) 10:59:57.30ID:WR/H7WIx
まあ、それが使い物になるレベルならとっくにアナウンスしてるわ

nvidiaのアナウンス
8K動画編集はAMDのSSGを使わなくても、nvidiaのグラボとAMDのスリッパでイケます!
0195Socket774
垢版 |
2017/08/18(金) 12:43:52.87ID:WR/H7WIx
>>193
XEONでもいいんじゃない?
16コアのCPUの覇権はスリッパだけどさw
0196Socket774
垢版 |
2017/08/18(金) 12:49:28.39ID:lDY2j2+C
たったの8GB/sのSSDにアクセスしてどれだけ効果があるんですか
0197Socket774
垢版 |
2017/08/18(金) 12:53:37.40ID:heeiC4Eu
>>196
だからソース持ってこいよ
0198Socket774
垢版 |
2017/08/18(金) 12:56:42.64ID:d2F+sDgw
アスペか
CUDAは糞以下なんて言ってる時点で気づくべきだった
0199Socket774
垢版 |
2017/08/18(金) 13:28:15.68ID:RZzLOxX0
>>198
ゲフォ厨はさっさと失せろ
実際に外部メモリへのアクセスに関してはCUDAは糞なだけだ
0200Socket774
垢版 |
2017/08/18(金) 13:44:15.23ID:lDY2j2+C
2TB of NAND flash storage plugged into a pair of M.2 ports
つまり最大PCIe3.0の4lanでも片方向4GB/sペアで8GB/s
あくまでM.2の理論値
RAID0でもつかうのか?
それでも実速度は半分程度だろうが
0201Socket774
垢版 |
2017/08/18(金) 13:48:31.26ID:ftXGIfde
>>182
ラデ信は哀れ・・・
0202Socket774
垢版 |
2017/08/18(金) 13:48:36.01ID:GGtdT67s
>Vega 10では、PCのメインメモリなどを仮想ビデオメモリとして利用できるHigh-Bandwidth Cache Controller(HBCC)という機能を新たにサポートし、この機能を利用するさいはGPUに直結されたHBM2をキャッシュメモリのようにあつかう。

>この機能はRadeon Settingから有効化できるが、将来的により多くのビデオメモリを必要とする場面で使用することを想定した機能であり、今回のテストではこの機能は使用していない。

>Radeon SettingのHBCC設定「HBCC Memory Segment」。
>標準では無効化されており、有効化するとHBCCで利用するメモリの容量を設定できるようになる
http://pc.watch.impress.co.jp/img/pcw/docs/1075/646/i02.png
0203Socket774
垢版 |
2017/08/18(金) 13:59:43.09ID:W19VvSM6
GPUがテラバイトのフレームバッファを扱うことができるのが強みなのだ
接続してるバスインターフェイスのどうのこうの話ではない
0204Socket774
垢版 |
2017/08/18(金) 14:11:57.52ID:lDY2j2+C
AGPメモリかよ
0205Socket774
垢版 |
2017/08/18(金) 14:27:15.09ID:d2F+sDgw
その強みは具体的にどういう場面で活きてくるの?
8K編集かな?w
0206Socket774
垢版 |
2017/08/18(金) 14:54:06.65ID:UeJq6mlb
実際に8K編集で役に立ってたな
nvidiaはまた1つ引き離された訳だ
0207Socket774
垢版 |
2017/08/18(金) 15:06:57.15ID:XJ96p1h1
高解像度対応の需要は尽きることはないしな
実際編集は高解像度で行って使うのはダウンコンバートしたものとか当たり前になってるし
0208Socket774
垢版 |
2017/08/18(金) 16:12:27.74ID:dWaMnR3v
pcie自体も早くなるぞ
来年にはGEN4
2019年には(いけるが知らんが)GEN5の予定

GEN5の4chでDDR4の1chと同じスピード出るし、ハナから帯域不足の前提でプログラムするしな
0209Socket774
垢版 |
2017/08/18(金) 17:14:46.96ID:x2o59Lzn
まぁNVLINKは、どっちかってとHPC向けだし、POWERのプラットフォームで真価を発揮するものだろう。
8K編集とかに使うようなもんじゃないでしょ。
0210Socket774
垢版 |
2017/08/18(金) 17:29:48.21ID:6upwYL0a
>>208
大分問題があってな
PCI-SIG握ってんの事実上intelなのよ
アレを速くすると自社の製品を喰われる他社製が出張ってくるから、なるたけ引っ張るか遅くするか
動画クリエーター周りだけ言えばアレらはXEON出したいから&今AMDとガチンコやってるから他が出て来てもらっちゃ困る
多分露骨には出来ないから引っ張ると思うよ

AMDがCPUGPU問わず色々仕込んでるのは大体コレが原因
規格周り殆ど握られてるからね、裏道探して出し抜くしか無い
0211Socket774
垢版 |
2017/08/18(金) 17:48:55.90ID:BLjUNCqz
ソケットFM2+のA10-7870KとAM4のA12-9700で
A10にDDR3-2166、A12にDDR4-2400のメモリ積んで同一ベンチ走らせると
A10が半分以上勝つらしいけど
これってAM4マザーのインターフェイスに設計ミスとかあるんじゃないかなあ?
Ryzenのベンチでも7700Kにぼろ負けしてるし
CPUの性能をチップセット側で活かせてない気がするなあ
0212Socket774
垢版 |
2017/08/18(金) 17:49:02.54ID:pAa1vzZ6
12コアのスリッパAPUとか出るかな?
0213Socket774
垢版 |
2017/08/18(金) 17:58:40.29ID:qVfpcgqg
自作用のAPUはずっと4コアだろうな
次のXBOX買えば?
8コア版のAPUだろうし
0214Socket774
垢版 |
2017/08/18(金) 18:02:18.62ID:FrkpUUdZ
APUにメモリ直接積んでハイパーメモリCPUやってほしい
0215Socket774
垢版 |
2017/08/18(金) 18:02:40.63ID:h9R4wKYX
8コアですら使いみちがないのに、売れないと困るAPUで冒険なんかするわけねえ
12コアAPU、12万円として誰が買うんだそんなもん
0216Socket774
垢版 |
2017/08/18(金) 18:08:07.16ID:ZAMfdzfE
>>193
いちゃもんつけたAMDは赤っ恥ですな
0217Socket774
垢版 |
2017/08/18(金) 18:11:26.94ID:qVfpcgqg
>>212
AVX絶対殺すマンと化した超低レイテンシなGPUならワンチャンあるかも
その場合は全部のモデルに載るだろうし
インテルHDより更に貧弱なFLOPSだろうけどw
0218Socket774
垢版 |
2017/08/18(金) 18:15:33.82ID:RZ+UOaqG
10コアでベース3Ghz以上のapu欲しいわ
0219Socket774
垢版 |
2017/08/18(金) 18:19:55.70ID:1Hi1LVjY
HBCCはIntelがOptaneでやろうとしてることの凄い版
あれは、HDDの高速化だけど、HBCCはメインメモリとSSDの高速化
NVMe SSD(5GB/s)/メインメモリ(50GB/s)→PCIe(16GB/s)→HBM2(500GB/s)

CPUのキャッシュ制御と大体一緒だから、実装は楽だろうね
ただ、CPUとGPUの違いに合わせたドライバの調整が面倒そうだけど
0220Socket774
垢版 |
2017/08/18(金) 18:24:38.29ID:x2o59Lzn
>>217

デバドラやめて、x64にGPUコントロールの拡張命令でも追加するといいよ。
0221Socket774
垢版 |
2017/08/18(金) 18:50:04.84ID:F2q9hCz6
>>220
正解
0222Socket774
垢版 |
2017/08/18(金) 18:51:56.46ID:1Hi1LVjY
>>220
それは考えてると思うよ、APUの構造的にそれがあるのが一番いいからね
草案作りとか根回しとか大変だろうから当分先だろうけど
0223Socket774
垢版 |
2017/08/18(金) 18:55:19.51ID:x2o59Lzn
>>222

いあ、ごめんネタだから、現時点でAMDがそれをやるほど愚かじゃないのは明白。
なぜなら、そんなことした時点でGPUの機能を変更できなくなる。

やるとしたらGPU自体が枯れて、これ以上機能の刷新も新機能も必要ないところまできてから。
0224Socket774
垢版 |
2017/08/18(金) 19:08:00.97ID:1Hi1LVjY
>>223
AVXはAVX→AVX2→AVX512って拡張し続けてるんだけど
それ以外でも、仮想関係やセキュリティもAMDとIntelは独自に実装している
そういう前例があるから、GPGPUを標準化しても拡張はし続けていける

AMDのGPUは機能的な拡張し続けて、VegaでほぼCPUと遜色ないくらいになってる
そろそろCPUとGPUでISAの統合が出来る頃合いだと思うんだよね
0225Socket774
垢版 |
2017/08/18(金) 19:13:32.26ID:ZAMfdzfE
ふぃるへすたー「sse5 」
0226Socket774
垢版 |
2017/08/18(金) 19:14:37.29ID:BLjUNCqz
>>224
AVX512はインテルさえ「コスト高すぎて実装は考えていない」つってるけどね
そもそもロード/ストアユニットが128ビット×4構成のインテルでさえ、512命令来ると4基フルで
1命令しかこなせないし
128ビットのLSU×2基しかないRyzenがシングルコアのベンチで負けるのは当然として
512命令が来るとRyzenは1回で処理出来ずここで渋滞するんだよな
ていうかAVX2もRyzenではここがボトルネックになってる

AMDも妙なところでケチるよなあ
0227Socket774
垢版 |
2017/08/18(金) 19:16:10.08ID:1Hi1LVjY
言いたいのは、x64本体に組み込むんじゃなく、AVXや仮想機能みたいな拡張機能とするってこと
その先は、更に5年後くらいにx64+AVX2+GPGPUを統合した、新x64とか作れるかもしれないかな

今時GPU内蔵CPUなんて普通だし、GPGPUもかなりCPUに近くなってるから、統合ISAは時間の問題と思う
それの先陣を切るのは、AMD64やmantleを出したAMD以外ないだろう
0228Socket774
垢版 |
2017/08/18(金) 19:18:39.55ID:x2o59Lzn
>>224

CPUのSIMD命令は、レジスタ等への前準備は必要とは云え、単一の命令だよ。
そんなのの拡張とGPUってユニットの拡張を同列にするかね?

そもそも、ついこないだVEGAで大掛かりな仕組みの変更をしたとこじゃないか。
それとも、後方互換製のために、古くなったらほとんど使わない回路をどんどん肥大化させていくつもりかね?
沢山のコアが一斉に肥大化してくんだよ?
0229Socket774
垢版 |
2017/08/18(金) 19:25:10.67ID:1Hi1LVjY
AMDとMSとLinux勢も多分望んでそうだから、動いてそうな気はする
いい加減GPGPUの使い辛さをどうにかしたいと思ってそうだし
そうすればゲームや技術計算やディープラーニングとか今よりずっと楽に開発できるだろうね
0230Socket774
垢版 |
2017/08/18(金) 19:30:55.12ID:x2o59Lzn
>>229
それは多分、Larrabeeが見た夢だろう。
GPUとして失敗した時点でタダの計算機になって、一般消費者向けではなくなってしまった。

ARMコアで似たような構想を抱けば、もしかしたらモダンなものになるのかもしれないね。
0231Socket774
垢版 |
2017/08/18(金) 19:31:41.68ID:1Hi1LVjY
>>228
x64はx86を内包してるけど別に騒ぐほど肥大化してないよ
x87は切り捨てた、SSE2を標準にしたから、それ以前のMMXやSSEも捨てた

標準化するのはシェーダーモデル6とIEEE754対応とGPU仮想化全般でいい
あとはCPU-GPU間の連携用の命令くらいか
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況