GPUアーキテクチャについて語れ [無断転載禁止]©2ch.net

**Socket774** · 2017/07/20(木) 14:15:26.36

未来あるGPUを語り合いましょう

**,,・´∀｀・,,）っ-○○○** · 2017/07/20(木) 16:14:31.72

未来ないGPUは語ってはいけません

**Socket774** · 2017/07/20(木) 18:57:43.09

>>1
乙

で、いきなり糞コテかよｗ

**Socket774** · 2017/07/20(木) 19:12:18.01

翻訳くん絶賛のVega、いざ出て見れば期待外れ
RyzenがSEGVバグを除いていい石なのに、GPUはなんでこうもだめなんだ

**Socket774** · 2017/07/20(木) 19:18:15.24

**Socket774** · 2017/07/20(木) 19:32:44.01

>>5
一日中張り付く糞コテは異常
オマケに糖質

**Socket774** · 2017/07/20(木) 20:23:25.77

新しい次世代のコンピューティングコアと最大16GBのオンパッケージ高帯域幅メモリ（HBM2）を採用し、
Vega GPUを搭載したiMac Proは、最大で11テラフロップスという単精度の計算能力を発揮し、
リアルタイムの3Dレンダリングや臨場感あふれる高フレームレートのVRを実現します。
さらに機械学習に最適な半精度の計算処理では、iMac Proは最大で22テラフロップスという圧倒的なパフォーマンスを提供します。

**Socket774** · 2017/07/20(木) 20:30:56.90

個人的に正直pythonで叩ければハードは
何でも良いけど、やっぱりインテル依存とかは
将来性を警戒するんだよね～ｗ

多メーカー参入可能かつ自由度高い
GPGPUの方が使い勝手が色々と良い

**Socket774** · 2017/07/20(木) 20:36:18.29

スゲエ連投ｗ

ちなGPGPUは広義のヘテロジニアスね
ハードは1メーカー限定なんて良くない

**Socket774** · 2017/07/21(金) 09:13:04.46

VEGAがアレなのは、やはり設計者の技量かな？？？

**Socket774** · 2017/07/21(金) 17:06:48.08

>>10
悉く各社が失敗して来た壁に漸くRADEONが当たったってだけ
良くここまで引っ張ったよ、間違いなく腕自体は良い
後はコレをモノに出来るかだ

**Socket774** · 2017/07/21(金) 18:28:44.26

VEGAはGPGPUに力を入れているというが、実際はどうなんだろ？
そもそもGPGPUはnVidiaが強いけど

**Socket774** · 2017/07/21(金) 18:57:27.44

nvidiaがteslaとgeforce間で設計が違うぐらいにはGPGPUしてると思う
思うにnvは需要を自ら作り出し続けないと突然死しそう

まあ、それはIntelだろうがAMDだろうがそうなんだけど
nvは傾いたら一気にコケそうな気がする。根拠は無いけどね

**Socket774** · 2017/07/21(金) 20:08:35.00

VEGAのまだ有効でない機能って凄いの？

**Socket774** · 2017/07/21(金) 20:12:47.23

>>14
結構キモの部分だけど問題はそこじゃ無くて
そこの開発が終わってない程ドライバに難儀してるということでも有る
同時に他の機能も動いてはいるがキチンと想定通り動作してるか怪しい

HD79の時のすごーいドライバは何ヶ月掛かったか、リソース注ぎ込んでるとはいえアレより早くは終わるまいて

**Socket774** · 2017/07/21(金) 20:18:29.36

VEGAはアーキテクチャ的に素晴らしい
所ってやっぱりHBMなのかね？

**Socket774** · 2017/07/21(金) 21:27:25.71

>>16
いやいやもっと他にあるでしょ？ｗ

**,,・´∀｀・,,）っ-○○○** · 2017/07/21(金) 22:56:36.22

倍精度がたった768GFLOPSしかないところ！

**,,・´∀｀・,,）っ-○○○** · 2017/07/21(金) 22:57:04.26

↑これが現行ハイエンドの実力

**Socket774** · 2017/07/22(土) 09:18:26.04

エンコは速いんだよね

**Socket774** · 2017/07/22(土) 12:56:06.41

>>20
GPGPU向けだから
しかもまだバケるよ

**Socket774** · 2017/07/22(土) 15:04:29.13

今度GPGPU4倍速をんう゛ぃが
出すんだっけ？

**,,・´∀｀・,,）っ-○○○** · 2017/07/22(土) 15:43:25.57

>>13
どう考えても需要を自ら作れないところのほうが死ぬっしょ

Atomはモバイルこそ撤退したがIoTゲートウェイ/エッジサーバの分野でもトップシェア
Bobcat系アーキはPS4とXbox以外では事実上絶滅した

大型スパコンや大規模データセンターの案件が取れないからFirePro S9170以降倍精度強化版GPUが出せていないのもAMDのGPU

口を開けて待ってないで働けニート企業

**Socket774** · 2017/07/24(月) 03:07:10.71

糞コテの書き込みは禁止されております

**,,・´∀｀・,,）っ-○○○** · 2017/07/24(月) 09:14:45.83

旧世代の法人むけハイエンドGPUの不良在庫が捌けずリネームして売ってるような未来のないGPU

**Socket774** · 2017/07/24(月) 14:02:53.40

Intel的には200チップセットの不良在庫を捌きたいし100は売れすぎただろう

**,,・´∀｀・,,）っ-○○○** · 2017/07/24(月) 14:16:21.93

200チップセットにGPUは載ってませんが？
スレタイも読めないのか？

**Socket774** · 2017/07/24(月) 14:22:49.73

0582 ,,・´∀｀・,,）っ-○○○ 2017/07/24 11:20:06
クロックが下がってもAVX512の方が速いから問題ない。同じことはAVX512を削ってAVX2を2サイクルで実行するZenには出来ない。

**Socket774** · 2017/07/24(月) 14:27:25.30

0573 ,,・´∀｀・,,）っ-○○○ 2017/07/24 09:17:26
構成依存なのに「クロスバーだから並列に動作する」もたいていガバガバですけどね
それこそECC関係ないがメモリコマンドによるオーバーヘッドで8割くらいの実効レートに落ち着くのは結果的には確からしい

**,,・´∀｀・,,）っ-○○○** · 2017/07/24(月) 14:34:12.84

>>25はどこの会社とも言ってないのに火病がわかりやすすぎ

**Socket774** · 2017/07/24(月) 21:46:32.99

クソ団子が本スレでフルボッコされててワロタｗ

**Socket774** · 2017/07/24(月) 22:35:29.68

糞団子ちゃんガバって弱気ｗｗｗ

**Socket774** · 2017/07/25(火) 01:48:01.77

団子既にフルボッコｗｗｗ

**Socket774** · 2017/07/25(火) 02:28:37.49

ぜっかくRyzenの出来がよかったのに、Vega糞すぎるだろ

**Socket774** · 2017/07/25(火) 20:36:48.98

VEGAはこれから

**,,・´∀｀・,,）っ-○○○** · 2017/07/25(火) 20:54:12.16

VEGAは波動拳でしにました

**Socket774** · 2017/07/26(水) 02:32:12.58

糞コテのせいでつまらない件

**Socket774** · 2017/07/26(水) 02:39:55.97

vegaも2GHzまでOCすりゃノーマルの1080Tiに勝てるだろ

**Socket774** · 2017/07/26(水) 03:50:32.68

490 名前：Socket774[sage] 投稿日：2017/07/26(水) 03:36:29.73 ID:dFG7dSez
一般的なマルチスレッドによる処理は平行処理、AVXなどのSIMD命令による処理が並列処理

coffeeスレのこれ、団子のレスやろ

**,,・´∀｀・,,）っ-○○○** · 2017/07/26(水) 10:53:10.68

知らんな
データレベル並列とタスクレベル並列くらい知っとるわ

**Socket774** · 2017/07/26(水) 20:56:01.91

>>40
とぼけんなよ

490 名前：Socket774[sage] 投稿日：2017/07/26(水) 03:36:29.73 ID:dFG7dSez [1/3]
一般的なマルチスレッドによる処理は平行処理、AVXなどのSIMD命令による処理が並列処理

507 返信：Socket774[sage] 投稿日：2017/07/26(水) 08:17:46.75 ID:dFG7dSez [2/3]
>>505
エンコは典型的なSIMDライクの並列処理、一般的なマルチスレッドはMIMDな平行処理
まあ一般には、並列処理 ⊆ 平行処理の関係ではある
要するに、並列は同時に平行でもあることが多い、あるいは並列は平行の特殊な場合と考えればわかりやすい

なんだよｗ平行処理って初めて聞くわｗ

**,,・´∀｀・,,）っ-○○○** · 2017/07/26(水) 21:02:49.23

俺知らんがな

**Socket774** · 2017/07/26(水) 21:05:38.68

>>42
こんな頓狂なこと書くのあんただろ
平行処理って何だよ？

**,,・´∀｀・,,）っ-○○○** · 2017/07/26(水) 21:15:00.45

ちなみに上の書き込みの正しい用語はデータレベル並列とタスクレベル並列な

**Socket774** · 2017/07/26(水) 22:34:19.10

>>44
じゃあ何かよ？エンコードはAVXが担当しててx86やx64は並列処理じゃなくて平行処理とやら
って俺の読解力不足かもしれんが

> 一般的なマルチスレッドによる処理は平行処理、AVXなどのSIMD命令による処理が並列処理

そう聞こえるんだけどなあ
AviUtlはAVXなどの拡張命令のみで処理してるとか作者のKENくんが聞けばおかしいと言われるよ

**,,・´∀｀・,,）っ-○○○** · 2017/07/26(水) 22:37:45.57

俺の書き込みじゃねーものを俺と決めつけんな

**Socket774** · 2017/07/26(水) 22:45:44.52

エンコはタスク並列とデータ並列の2タイプあったと思うけど
AviUtlのフィルター処理はデータ並列だったはず

**Socket774** · 2017/07/26(水) 23:52:55.74

>>46
オマエいらねぇから

**Socket774** · 2017/07/27(木) 12:03:40.00

>>16
gcnはずっとそうだがスケジューラーがマルチコアなのは大きい
nvidiaはhsaに協力してcpuのスケジューラー機能強化しないと壁にぶち当たると思ってる
(特にgpgpuマルチスレッド関係)

**Socket774** · 2017/07/27(木) 12:54:12.02

機能は良いの持ってて理論性能もかなり高いのに実性能では置いてかれるってのは悲しいね

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 13:55:19.07

HSAって活動停止してるし活動してた時期ですらIntelやNVIDIA単独の予算の方が多いだろう

ヘテロジニアスコンピューティングはFPGAやASICも含めてやるもんだ
GPGPUありきで考えるものではない

**Socket774** · 2017/07/27(木) 16:21:12.10

GCN系が素晴らしいのは仮想メモリにハードウェアで対応できるということ
HBCC以前でも、AMD CPUとのセットで対応することが出来る
HBCCはそれを効率よく出来るようになった

ゲフォはV100でもそんな仕組みは非搭載、今後も搭載できない(してもIntelもAMDも無視するから)

**Socket774** · 2017/07/27(木) 16:26:07.88

Intelはx86に絶望的だからFPGAやASICに向かうらしい
AMDはゲーム機やARMサーバー狙えるから、気にしなくても良い

K12がZenとFabric互換だから、APUもEPYCもコア取り替えるだけで作れるし、AM4とEPYCプラットフォームをそのまま使える
InfinityFabric様様だね、ジムケラーマジ天才

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 16:49:12.56

HSA Foundationは事実上解散しました（爆笑）

**Socket774** · 2017/07/27(木) 17:11:28.95

Infinity Fabricはダイ間接続のレイテンシの時点で既にXeon UPIのソケット間接続のレイテンシより遅い
https://www.servethehome.com/wp-content/uploads/2017/07/AMD-EPYC-Infinity-Fabric-on-Package-v-Intel-4P-8180-UPI-Latency.jpg

**Socket774** · 2017/07/27(木) 18:13:00.33

>>55
UPIやGMIを経由せず同じダイのメモリへアクセスする場合のレイテンシ差が一番大きい傾向があるので、
レイテンシの差はダイ内部のアクセス時間の差を反映してると考えるのが普通
XeonだとUPIやメモリに1hopでアクセスできるコアもあれば、5hop以上かかるコアもあるので精査が必要

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 18:40:50.77

精査しても救いにならんと思うけどね。UPI間接続なんてソケットまたぎ通信にしか使わないし、UPIとメモリコントローラ間だって1ホップでつながってるわけではない（＝メッシュのレイテンシはある程度織り込まれている）

そしてGMIのレイテンシはシングルダイのXeonでは発生しないコストだ
その辺加味してもXeon Goldの4ソケットはEPYCの2ソケットより割りがいいかもしれないね

**Socket774** · 2017/07/27(木) 18:42:20.44

UPI=10.4GT/sだけど、これは8.3GB/sなのか8.3Gbit/sなのかよく分からない
ググってみたけど両方の解釈が存在していて、どちらが正解なんだろうか

InfinityFabricはGMIと一緒で約40GB/s
帯域で数倍の差があるから多少のレイテンシの差なんか屁でもないと思う

**Socket774** · 2017/07/27(木) 18:46:17.57

>>52
カタログスペックでできたとして、まともな開発環境も無くだれも使わない機能じゃん

**Socket774** · 2017/07/27(木) 18:48:24.66

コア数少なくて低性能なGoldで4ソケットなんて誰もしないだろうな
それならPlatinumで2ソケット構成にするわ
4ソケット以上組むなら多コアで高性能なPlatnumだろ普通、何のための4ソケットだよ

迷走してんなIntelは、EPYC対抗にGoldぶつけようとしてPlatinum殺してるし

**Socket774** · 2017/07/27(木) 18:51:00.32

>>59
ゲーム機で普通に使われてるけど
DX12なら普通にマルチでPCに持ってこれるけど、DX11に拘るゲフォのせいで持ってこれないだけ
PS4の開発環境が整ってないと言うならバカにしすぎだし、マルチできないと言うならゲームエンジンバカにしすぎ

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 18:51:23.10

>>59
ほんこれ
AMD敗北プギャー

**Socket774** · 2017/07/27(木) 18:52:49.88

ちなみにCPUとGPUのメモリ共有はPS3やXBOX360で既にやってたから、PS4でやらない理由がない

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 18:53:55.47

>>61
Radeon迂回してPS4とGeForceのマルチ実現したFF14は素晴らしいゲームですね
ドラクエ無双もあっさりSwitchに移植できてるし
自社ハード独占のソフト環境整備できないAMDの無能ぶりが際立つな

**Socket774** · 2017/07/27(木) 19:08:44.49

>>62
そう思うなら去年のQ4あたりになぜGoogleやアリババが採用したの？

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 19:17:38.34

NVIDIAから値切るためのいつものポーズ

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 19:39:31.51

MI25とV100じゃDL用の半精度ですら8倍の差があるぜ
「キープ君」以外の何でもないのわかるだろ

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 19:49:24.82

さらに言うとcuDNN相当のライブラリすら未整備でソフト開発の工数まで考えたらとても元なんてとれないよ

**Socket774** · 2017/07/27(木) 20:15:18.12

お前がそう思ってるだけじゃん

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 20:15:50.09

否定する事実もないだろ

**Socket774** · 2017/07/27(木) 20:26:15.49

GoogleやアリババはNvidiaを見限ったんだよ

**Socket774** · 2017/07/27(木) 20:26:37.32

また団子ちゃんガバりすぎｗｗｗ

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 20:32:34.80

>>71
＞GoogleやアリババはNvidiaを見限ったんだよ
キープ君の虚しい妄想に呆れる

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 20:38:45.68

http://m.hexus.net/tech/news/industry/105838-google-cloud-tpu-takes-machine-learning-lead-tesla-v100/

It will facilitate the mixing-and-matching of Cloud TPUs with Skylake CPUs, NVIDIA GPUs, and all of the rest of our infrastructure and services to build the best ML system.
Furthermore, Cloud TPUs "are easy to program via TensorFlow, the most popular open-source machine learning framework," says Google.

だそうだ。

ところで未だにGCPのComputeインスタンスにVegaは見えないが
絶望的な性能の低さからいってVegaじゃなくて実はAlcohol（死兆星）なんじゃないの？

**Socket774** · 2017/07/27(木) 20:43:00.52

?Alcohol
○Alcor

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 20:44:48.75

やだ突っ込まれた

**Socket774** · 2017/07/27(木) 20:45:17.23

>>74
翻訳してみて

**Socket774** · 2017/07/27(木) 20:45:49.26

×口先八寸
◯？？？？！？！？！！？？

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 20:46:10.09

翻訳（笑）ならAMDファンボーイの首領様の出番だろ

**Socket774** · 2017/07/27(木) 20:49:25.84

団子も機械翻訳もどっちも日本語できないからなw

**Socket774** · 2017/07/27(木) 20:49:53.50

MSはDX12押しだし、PS5はZen+Naviだろうし、ゲーム業界がAMDに傾倒するのは当然だろう
団子はGPUの何を見てるんだろうな

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 20:52:44.39

PS5はAMDやめるらしいよ

**Socket774** · 2017/07/27(木) 20:54:23.15

ウソ
大げさ
紛らわしい

糞団子ちゃんｗｗｗ

**Socket774** · 2017/07/27(木) 21:05:06.13

もう今となっては団子は嘘つきとしか思われてないよね

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 21:12:12.64

いいよ、否定できない事実を突きつけてやれば認めざるを得ないだろ

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 21:16:06.18

https://github.com/hsafoundation

何ヶ月更新ないのここ？

価値のないソフトはいくらオープンソース化しても誰も開発継続しない。
それが上のレポジトリだ

**Socket774** · 2017/07/27(木) 21:16:58.81

だから捏造ベンチの否定できない証拠は何処だよ
本当にバカだな

**Socket774** · 2017/07/27(木) 21:18:15.38

串を使って団子団子
デマを並べて団子団子
AA貼り付け団子団子
団子3兄弟

いちばん上は雑音雑音
いちばん下は田村田村
あいだにはさまれ権田権田
団子3兄弟

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 21:21:38.53

ソフト環境が圧倒的にゴミだから企業に相手にされない
AMDのハードがダメなのを語るのにハードのカタログスペックなんて語る必要はないんだ
それいぜんの問題だからな

**Socket774** · 2017/07/27(木) 21:21:45.45

0085 ,,・´∀｀・,,）っ-○○○ 2017/07/27 21:12:12
いいよ、否定できない事実を突きつけてやれば認めざるを得ないだろ
ID:f4XhJ3cf(15/16)

0086 ,,・´∀｀・,,）っ-○○○ 2017/07/27 21:16:06
https://github.com/hsafoundation

何ヶ月更新ないのここ？

価値のないソフトはいくらオープンソース化しても誰も開発継続しない。
それが上のレポジトリだ
返信 ID:f4XhJ3cf(16/16)

ｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗｗ

**Socket774** · 2017/07/27(木) 21:23:55.20

誰か京空冷発言の全ログはってくんないかな？

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 21:28:35.92

GPGPUがクソという現実に反論できないんですね

**Socket774** · 2017/07/27(木) 21:33:20.74

現状VEGAがクソ臭漂ってるのは明らかだろ
クソコテとIntel,amd両社はなんの関係も無いけどな

**Socket774** · 2017/07/27(木) 21:35:03.50

何故かIntelに自己投影してるのが怖いよね

**,,・´∀｀・,,）っ-○○○** · 2017/07/27(木) 21:38:28.30

AMDに自己投影してるアホと歩調合わせてるだけですよ
もっとも、俺の場合は利害関係も一致してるけどな

**Socket774** · 2017/07/27(木) 21:41:22.25

そんなバカ機械翻訳とポエマーぐらいしかいないけどな
同レベルじゃん。良かったなお仲間がいて。

**Socket774** · 2017/07/27(木) 21:53:42.20

ryzen持ってないのにsegvスレを荒らすなよな
しかもツイッターのフォロワー数とか本当どうでもいい話
お前のアカウント晒してから偉そうなこと言えってのバカw

**Socket774** · 2017/07/27(木) 23:32:30.74

そもそもGPUアーキテクチャで語れるのってラデくらいだし
Intelは論外だし、ゲフォは固定機能がすごいだけで、シェーダー関係別に大したことないからね
Voltaも凄いのはテンサーコアとかいう機械学習専用の固定機能だけだから、これもGPUアーキテクチャとはまた違う

AsyncとかハードウェアスケジューラーとかHBCCとかInfinityFabricとかプリミティブシェーダーとか、そういう面白機能ゲフォは積んでないよね

**Socket774** · 2017/07/27(木) 23:35:17.17

現実は>>86

**Socket774** · 2017/07/27(木) 23:46:05.09

>>99
顔真っ赤だからｗｗｗ
コテ忘れてるぞ(笑)