GPUアーキテクチャについて語れ [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
翻訳くん絶賛のVega、いざ出て見れば期待外れ
RyzenがSEGVバグを除いていい石なのに、GPUはなんでこうもだめなんだ 新しい次世代のコンピューティングコアと最大16GBのオンパッケージ高帯域幅メモリ(HBM2)を採用し、
Vega GPUを搭載したiMac Proは、最大で11テラフロップスという単精度の 計算能力を発揮し、
リアルタイムの3Dレンダリングや臨場感あふれる高フレームレートのVRを実現します。
さらに機械学習に最適な半精度の計算処理では、iMac Proは最大で22テラフロップスという圧倒的なパフォーマンスを提供します。 個人的に正直pythonで叩ければハードは
何でも良いけど、やっぱりインテル依存とかは
将来性を警戒するんだよね〜w
多メーカー参入可能かつ自由度高い
GPGPUの方が使い勝手が色々と良い スゲエ連投w
ちなGPGPUは広義のヘテロジニアスね
ハードは1メーカー限定なんて良くない VEGAがアレなのは、やはり設計者の技量かな??? >>10
悉く各社が失敗して来た壁に漸くRADEONが当たったってだけ
良くここまで引っ張ったよ、間違いなく腕自体は良い
後はコレをモノに出来るかだ VEGAはGPGPUに力を入れているというが、実際はどうなんだろ?
そもそもGPGPUはnVidiaが強いけど nvidiaがteslaとgeforce間で設計が違うぐらいにはGPGPUしてると思う
思うにnvは需要を自ら作り出し続けないと突然死しそう
まあ、それはIntelだろうがAMDだろうがそうなんだけど
nvは傾いたら一気にコケそうな気がする。根拠は無いけどね >>14
結構キモの部分だけど問題はそこじゃ無くて
そこの開発が終わってない程ドライバに難儀してるということでも有る
同時に他の機能も動いてはいるがキチンと想定通り動作してるか怪しい
HD79の時のすごーいドライバは何ヶ月掛かったか、リソース注ぎ込んでるとはいえアレより早くは終わるまいて VEGAはアーキテクチャ的に素晴らしい
所ってやっぱりHBMなのかね? >>20
GPGPU向けだから
しかもまだバケるよ >>13
どう考えても需要を自ら作れないところのほうが死ぬっしょ
Atomはモバイルこそ撤退したがIoTゲートウェイ/エッジサーバの分野でもトップシェア
Bobcat系アーキはPS4とXbox以外では事実上絶滅した
大型スパコンや大規模データセンターの案件が取れないからFirePro S9170以降倍精度強化版GPUが出せていないのもAMDのGPU
口を開けて待ってないで働けニート企業 旧世代の法人むけハイエンドGPUの不良在庫が捌けずリネームして売ってるような未来のないGPU Intel的には200チップセットの不良在庫を捌きたいし100は売れすぎただろう 200チップセットにGPUは載ってませんが?
スレタイも読めないのか? 0582 ,,・´∀`・,,)っ-○○○ 2017/07/24 11:20:06
クロックが下がってもAVX512の方が速いから問題ない。同じことはAVX512を削ってAVX2を2サイクルで実行するZenには出来ない。 0573 ,,・´∀`・,,)っ-○○○ 2017/07/24 09:17:26
構成依存なのに「クロスバーだから並列に動作する」もたいていガバガバですけどね
それこそECC関係ないがメモリコマンドによるオーバーヘッドで8割くらいの実効レートに落ち着くのは結果的には確からしい >>25はどこの会社とも言ってないのに火病がわかりやすすぎ ぜっかくRyzenの出来がよかったのに、Vega糞すぎるだろ vegaも2GHzまでOCすりゃノーマルの1080Tiに勝てるだろ 490 名前:Socket774[sage] 投稿日:2017/07/26(水) 03:36:29.73 ID:dFG7dSez
一般的なマルチスレッドによる処理は平行処理、AVXなどのSIMD命令による処理が並列処理
coffeeスレのこれ、団子のレスやろ 知らんな
データレベル並列とタスクレベル並列くらい知っとるわ >>40
とぼけんなよ
490 名前:Socket774[sage] 投稿日:2017/07/26(水) 03:36:29.73 ID:dFG7dSez [1/3]
一般的なマルチスレッドによる処理は平行処理、AVXなどのSIMD命令による処理が並列処理
507 返信:Socket774[sage] 投稿日:2017/07/26(水) 08:17:46.75 ID:dFG7dSez [2/3]
>>505
エンコは典型的なSIMDライクの並列処理、一般的なマルチスレッドはMIMDな平行処理
まあ一般には、並列処理 ⊆ 平行処理 の関係ではある
要するに、並列は同時に平行でもあることが多い、あるいは並列は平行の特殊な場合と考えればわかりやすい
なんだよw平行処理って初めて聞くわw >>42
こんな頓狂なこと書くのあんただろ
平行処理って何だよ? ちなみに上の書き込みの正しい用語はデータレベル並列とタスクレベル並列な >>44
じゃあ何かよ?エンコードはAVXが担当しててx86やx64は並列処理じゃなくて平行処理とやら
って俺の読解力不足かもしれんが
> 一般的なマルチスレッドによる処理は平行処理、AVXなどのSIMD命令による処理が並列処理
そう聞こえるんだけどなあ
AviUtlはAVXなどの拡張命令のみで処理してるとか作者のKENくんが聞けばおかしいと言われるよ エンコはタスク並列とデータ並列の2タイプあったと思うけど
AviUtlのフィルター処理はデータ並列だったはず >>16
gcnはずっとそうだがスケジューラーがマルチコアなのは大きい
nvidiaはhsaに協力してcpuのスケジューラー機能強化しないと壁にぶち当たると思ってる
(特にgpgpuマルチスレッド関係) 機能は良いの持ってて理論性能もかなり高いのに実性能では置いてかれるってのは悲しいね HSAって活動停止してるし活動してた時期ですらIntelやNVIDIA単独の予算の方が多いだろう
ヘテロジニアスコンピューティングはFPGAやASICも含めてやるもんだ
GPGPUありきで考えるものではない GCN系が素晴らしいのは仮想メモリにハードウェアで対応できるということ
HBCC以前でも、AMD CPUとのセットで対応することが出来る
HBCCはそれを効率よく出来るようになった
ゲフォはV100でもそんな仕組みは非搭載、今後も搭載できない(してもIntelもAMDも無視するから) Intelはx86に絶望的だからFPGAやASICに向かうらしい
AMDはゲーム機やARMサーバー狙えるから、気にしなくても良い
K12がZenとFabric互換だから、APUもEPYCもコア取り替えるだけで作れるし、AM4とEPYCプラットフォームをそのまま使える
InfinityFabric様様だね、ジムケラーマジ天才 HSA Foundationは事実上解散しました(爆笑) >>55
UPIやGMIを経由せず同じダイのメモリへアクセスする場合のレイテンシ差が一番大きい傾向があるので、
レイテンシの差はダイ内部のアクセス時間の差を反映してると考えるのが普通
XeonだとUPIやメモリに1hopでアクセスできるコアもあれば、5hop以上かかるコアもあるので精査が必要 精査しても救いにならんと思うけどね。UPI間接続なんてソケットまたぎ通信にしか使わないし、UPIとメモリコントローラ間だって1ホップでつながってるわけではない(=メッシュのレイテンシはある程度織り込まれている)
そしてGMIのレイテンシはシングルダイのXeonでは発生しないコストだ
その辺加味してもXeon Goldの4ソケットはEPYCの2ソケットより割りがいいかもしれないね UPI=10.4GT/sだけど、これは8.3GB/sなのか8.3Gbit/sなのかよく分からない
ググってみたけど両方の解釈が存在していて、どちらが正解なんだろうか
InfinityFabricはGMIと一緒で約40GB/s
帯域で数倍の差があるから多少のレイテンシの差なんか屁でもないと思う >>52
カタログスペックでできたとして、まともな開発環境も無くだれも使わない機能じゃん コア数少なくて低性能なGoldで4ソケットなんて誰もしないだろうな
それならPlatinumで2ソケット構成にするわ
4ソケット以上組むなら多コアで高性能なPlatnumだろ普通、何のための4ソケットだよ
迷走してんなIntelは、EPYC対抗にGoldぶつけようとしてPlatinum殺してるし >>59
ゲーム機で普通に使われてるけど
DX12なら普通にマルチでPCに持ってこれるけど、DX11に拘るゲフォのせいで持ってこれないだけ
PS4の開発環境が整ってないと言うならバカにしすぎだし、マルチできないと言うならゲームエンジンバカにしすぎ ちなみにCPUとGPUのメモリ共有はPS3やXBOX360で既にやってたから、PS4でやらない理由がない >>61
Radeon迂回してPS4とGeForceのマルチ実現したFF14は素晴らしいゲームですね
ドラクエ無双もあっさりSwitchに移植できてるし
自社ハード独占のソフト環境整備できないAMDの無能ぶりが際立つな >>62
そう思うなら去年のQ4あたりになぜGoogleやアリババが採用したの? MI25とV100じゃDL用の半精度ですら8倍の差があるぜ
「キープ君」以外の何でもないのわかるだろ さらに言うとcuDNN相当のライブラリすら未整備でソフト開発の工数まで考えたらとても元なんてとれないよ GoogleやアリババはNvidiaを見限ったんだよ >>71
>GoogleやアリババはNvidiaを見限ったんだよ
キープ君の虚しい妄想に呆れる http://m.hexus.net/tech/news/industry/105838-google-cloud-tpu-takes-machine-learning-lead-tesla-v100/
It will facilitate the mixing-and-matching of Cloud TPUs with Skylake CPUs, NVIDIA GPUs, and all of the rest of our infrastructure and services to build the best ML system.
Furthermore, Cloud TPUs "are easy to program via TensorFlow, the most popular open-source machine learning framework," says Google.
だそうだ。
ところで未だにGCPのComputeインスタンスにVegaは見えないが
絶望的な性能の低さからいってVegaじゃなくて実はAlcohol(死兆星)なんじゃないの? 翻訳(笑)ならAMDファンボーイの首領様の出番だろ MSはDX12押しだし、PS5はZen+Naviだろうし、ゲーム業界がAMDに傾倒するのは当然だろう
団子はGPUの何を見てるんだろうな もう今となっては団子は嘘つきとしか思われてないよね いいよ、否定できない事実を突きつけてやれば認めざるを得ないだろ https://github.com/hsafoundation
何ヶ月更新ないのここ?
価値のないソフトはいくらオープンソース化しても誰も開発継続しない。
それが上のレポジトリだ だから捏造ベンチの否定できない証拠は何処だよ
本当にバカだな 串を使って 団子 団子
デマを並べて 団子 団子
AA貼り付け 団子 団子
団子3兄弟
いちばん上は 雑音 雑音
いちばん下は 田村 田村
あいだにはさまれ 権田 権田
団子3兄弟 ソフト環境が圧倒的にゴミだから企業に相手にされない
AMDのハードがダメなのを語るのにハードのカタログスペックなんて語る必要はないんだ
それいぜんの問題だからな 0085 ,,・´∀`・,,)っ-○○○ 2017/07/27 21:12:12
いいよ、否定できない事実を突きつけてやれば認めざるを得ないだろ
ID:f4XhJ3cf(15/16)
0086 ,,・´∀`・,,)っ-○○○ 2017/07/27 21:16:06
https://github.com/hsafoundation
何ヶ月更新ないのここ?
価値のないソフトはいくらオープンソース化しても誰も開発継続しない。
それが上のレポジトリだ
返信 ID:f4XhJ3cf(16/16)
wwwwwwwwwwwwwwwwww 現状VEGAがクソ臭漂ってるのは明らかだろ
クソコテとIntel,amd両社はなんの関係も無いけどな AMDに自己投影してるアホと歩調合わせてるだけですよ
もっとも、俺の場合は利害関係も一致してるけどな そんなバカ機械翻訳とポエマーぐらいしかいないけどな
同レベルじゃん。良かったなお仲間がいて。 ryzen持ってないのにsegvスレを荒らすなよな
しかもツイッターのフォロワー数とか本当どうでもいい話
お前のアカウント晒してから偉そうなこと言えってのバカw そもそもGPUアーキテクチャで語れるのってラデくらいだし
Intelは論外だし、ゲフォは固定機能がすごいだけで、シェーダー関係別に大したことないからね
Voltaも凄いのはテンサーコアとかいう機械学習専用の固定機能だけだから、これもGPUアーキテクチャとはまた違う
AsyncとかハードウェアスケジューラーとかHBCCとかInfinityFabricとかプリミティブシェーダーとか、そういう面白機能ゲフォは積んでないよね >>99
顔真っ赤だからwww
コテ忘れてるぞ(笑) ■ このスレッドは過去ログ倉庫に格納されています