CPUアーキテクチャについて語れ 42

**Socket774** · 2018/01/09(火) 12:45:35.96

**Socket774** · 2018/04/11(水) 12:50:55.43

ベンチも古い命令が多いんで
長期的な成長を妨げる要素になってたりするんだよな

AVX512が有効なベンチだと圧倒的なんだけど

**Socket774** · 2018/04/11(水) 15:09:06.97

科学、金融計算は、AVX512が有効になってるのが多い
GROMACSやEuropean-Optionのベンチで凄まじいからね
んでIntelのDC部門は絶好調
この方向でいいんじゃね、てのが今のところの見解

**Socket774** · 2018/04/11(水) 16:56:36.08

ゲームでavx512以降がどれほど有効かわからんけど
ゲーム抜きにしてもamdはavx2のネイティブ対応すべき。
それこそzen5までには。

**Socket774** · 2018/04/11(水) 17:37:56.95

avxよりCPUにGPUのCUでもぶら下げればいんじゃね
クロック上げられなくなって丸ごと遅くなるよか該当部非同期にした方が建設的だろ

**Socket774** · 2018/04/11(水) 18:12:05.06

avx512は、デスクトップ用/サーバ用でやらずに、
xeon phiみたいなやつでやればいい
けどxeon phiなくなったんだよな

**Socket774** · 2018/04/11(水) 19:23:01.06

レガシー命令多いんだしクロック下がるよりは下がらない方が良いじゃん

**Socket774** · 2018/04/11(水) 19:34:54.78

>>670
>ゲームでavx512以降がどれほど有効かわからんけど
AVX128すらほぼ使われていない
市場を席巻してるのはAVX無しのCPUですし、AVX非サポートによる性能的な不満は誰一人として口にしていない
AVX2のネイティブ対応で最大クロック落とすより、ブースト100～200MHｚでも伸ばした方が歓迎されるのが現状

>>669
GROMACSならGPUで回した方が3倍速いよ。と聞いて噴いた
ごく一握りの金融計算でGPUよりAVX512が速いのがあるっぽいけど、それでもEPYCと比べて1.4倍くらい
7nmのダイ跨ぎが解消されたEPYCとか出れば差は縮みそう

**Socket774** · 2018/04/11(水) 19:54:45.95

>>674
レス番付けてのレスというわけじゃないが、>>660のようにリッチコアと書いたら
>>662のような書き込みがあったので>>670のように書いた。

しかしそうなるとやはり分岐予測にトランジスタ割くような在来的なアプローチを強化するしかないのかね。
クロック上昇はプロセス技術にも依存しちゃうのでどうにもやりにくいだろうし。

**Socket774** · 2018/04/11(水) 20:07:35.24

コアを2個引っ付け
SMTのスレッド数を倍に
キャッシュを4段化

**Socket774** · 2018/04/11(水) 20:38:09.41

>>674
そもそもセレやペンはAVX切って出してるのがねえ
やる気あるならさっさと解放しているはず

**Socket774** · 2018/04/11(水) 20:50:33.73

>>670
ZENはネイティブ対応してる
遅いけど

**Socket774** · 2018/04/11(水) 20:53:00.30

>>673
レガシーコードはいずれ消える
先を考えないと大きな進歩は無い

**Socket774** · 2018/04/11(水) 20:57:02.93

そもそもレガシーコード動かせるっていうのがx86の利点の1つでもあるんだし
ただし16bitコードはそろそろ切ってもいい気がする
32bitのレガシーコードを切るのは時期尚早でしょう

**Socket774** · 2018/04/11(水) 20:58:27.44

>>676
そこらじゅうに手を入れなきゃならんし
メリットもいまいちわからん

**Socket774** · 2018/04/11(水) 21:00:13.69

>>680
32bitは当分切らない
でも性能アップには力を入れない

**Socket774** · 2018/04/11(水) 21:03:05.44

>>674
ほとんどの人は200MHz速くなっても気づかない
喜ぶのはベンチマニアくらい

**Socket774** · 2018/04/11(水) 21:23:55.99

32bitと64bitは依存する形で拡張された関係上
32bit切ってもそれほど性能向上できないんじゃないか

16bitはどうか知らん。こっちはこっちで実装コスト低そうだが。

**Socket774** · 2018/04/11(水) 21:31:23.52

>>683
それで良いと思います

**Socket774** · 2018/04/11(水) 21:53:05.70

>>674 IntelはAVXと非AVXでターボ上限別に設定できるから問題ないんじゃないか。
Sky-Xだと、AVX比率低いときはAVX間引き実行して、AVX一杯使ってる部分では
AVX本気モードになってAVX Offsetに従ってクロック落とすとか結構上手く機能してるようだよ。
電圧ケチり過ぎると、AVX一杯使ってる部分でAVX本気モードにならないことがあって、
それをファントム・スロットリングと呼んでいる。
こういう制御が面倒なのもAMDがAVX2を頑張らない理由かね。

**Socket774** · 2018/04/11(水) 22:02:39.68

>>684
サポートコストが省ける

**Socket774** · 2018/04/11(水) 22:08:18.04

バリデーションコストもだな
回路も微妙に削れる

でも32bitは切らんよ
少なくともあと10年は

**Socket774** · 2018/04/11(水) 22:09:25.64

>>681
充填率とスケジュール性能の向上
デメリットとして多分キューめっちゃ深くなるからレイテンシの悪化と、それから面積の消費
シングルは、向上する筈(有意な差があるとは言ってない

**Socket774** · 2018/04/11(水) 22:10:51.79

なんかCPUの構造を知らずに適当言ってるな

**Socket774** · 2018/04/11(水) 22:43:46.65

>>690
どうだろ?
無理くり上げろっつわれたらこんなん出来上がるんじゃねーのと適当に思った
基本アホな発想ベースやからな、フワッと

32切り捨てはどうかと思うけど
それで保ってるようなもんやし

**Socket774** · 2018/04/11(水) 23:10:36.63

コアニコイチはBulldozerの前例があるのでどうも悪い印象しかないわな
キャッシュ多階層化はやりようによってはイケるだろうが。

**Socket774** · 2018/04/12(木) 05:03:06.57

ブルさんも、半導体のプロセスが追い付いてたら、もっとクロックあがるとかコア数増えるとかで
インテルに劣らない性能出てたと思うよ。　というか逆にCoreシリーズと同等の設計してても
あの当時のプロセスでは勝負にならなかった

**Socket774** · 2018/04/12(木) 06:47:00.99

もうプロセス技術に過剰な期待はできないからなぁ

**Socket774** · 2018/04/12(木) 07:15:25.32

>>688
むしろ「脆弱性32bitをいつ切るか？」って考えるにはいい時期なんじゃね？

**Socket774** · 2018/04/12(木) 07:20:41.23

Microsoftも32bit切れてないし、まだ5年ぐらいは難しそう

**Socket774** · 2018/04/12(木) 08:09:02.71

「脆弱性32bit」ってなんだ？

**Socket774** · 2018/04/12(木) 09:59:02.52

IntelはGPGPUを使わせないように圧力かける
NvidiaはGPGPU勢を取り囲んでCUDAに専念させる
二大企業がこんなクソみたいな競争してるからGPGPUの普及が全く進まないんだよね

**Socket774** · 2018/04/12(木) 12:49:44.00

全然違います。どんな教育を受けるとそんなに物が見えなくなるのでしょうか。

**Socket774** · 2018/04/12(木) 12:56:36.82

Intelは次のCPUはダメなのも分かりきってる
SandyBridgeの開発者が退社してるからな
むしろ期待してるのはGPUの方だな
AMDのGPUの天才Raja Koduriをヘッドハンティングしたからな
今とは比較にならん程のGPU性能アップになるよ
CPU内蔵向けローエンドのみならずdGPU向けハイエンドのグラボも開発してるよ恐らく

**Socket774** · 2018/04/12(木) 13:33:12.37

ただまぁ
intel製のRajaグラフィックってなんかこう
ヤバそう、色んな意味で

**Socket774** · 2018/04/12(木) 13:46:22.02

>>700
IntelのGPUがクソなのは設計というより社内政治的なもの
人やコスト的に最低限しか使えないし、動作でもCPUを最優先にされてGPUは最低限しか割り当てられない

ラジャ引き抜きもAIや車載目的で、GPU的には良くなればいいくらいでしか無いだろう
AMDみたいにCPUとGPUでバランス良くリソース制御できるならいいけど、CPU優先なIntelじゃいくらGPUを強化しても大したことにはならない

そもそもGPGPU憎しでSIMDを強化しまくってるからね、GPU強化してAVXも強化続けたら、バランスどころじゃなく、社内外で派閥戦争みたいになって収集つかなくなるよ

**Socket774** · 2018/04/12(木) 14:15:36.50

既に収集つかなくなってる気がする

**Socket774** · 2018/04/12(木) 14:31:03.03

エンコ厨的にはavxもqsvもgpgpuも使えるとなれば最高の単一環境になるかもしれない。
まあエンコ厨はどれか抜きん出た性能を求めるだろうけど

**Socket774** · 2018/04/13(金) 01:43:09.57

今のところは独自のデスクトップ・サーバーのCPUをデザインできるのは４社？

ARM
AMD
Intel
（Apple？）

モバイルでのIPU統合チップも含むならGoogle

Google
https://www.theverge.com/2017/10/17/16487834/google-pixel-visual-core-ipu-custom-processor-chip

CPUを作るベンチャーが日本でも次々と現れることを期待したいが難しいだろう

Pezyの独自アプローチは、言論の暴走によって何か新しいものを作ると低レベルで根拠のない批判にさらされると
いう前例を作ったことで、新たなCPUアーキテクチャを作ることに萎縮するものもいるだろう

**Socket774** · 2018/04/13(金) 06:17:13.91

華僑に近く政治力のイマイチな国が頑張ったところで無駄
そういう意味じゃ民間は傀儡と変わらん

**Socket774** · 2018/04/13(金) 08:57:59.09

>>705
デスクトップorサーバーの意味ならARM謹製はまだないし、ISAだけ採用した独自MAは数社ある。
富士通もISAだけ採用陣営に入るし、IBMは全部独自がある。
PEZYはあくまでアクセラレータだからその中には入れない。

**Socket774** · 2018/04/13(金) 09:38:48.70

サーバー向けは、IBM、Intel、AMD
デスクトップ向けは、Intel、AMD
スマフォ以下は、ARM系 (Nvidia除く)

**Socket774** · 2018/04/13(金) 15:10:56.51

SPARC64がSpectre脆弱性に関してまだ確認中になってるな。
いつ確認が終わるんだ

Intelのスレッドに誤爆してしまった

**Socket774** · 2018/04/13(金) 18:32:09.72

http://www.itmedia.co.jp/news/articles/1804/13/news111.html
スパコン「暁光」撤去へ　20ペタFLOP達成、世界3位相当の性能

**Socket774** · 2018/04/13(金) 18:42:52.21

は…?撤去……?

**Socket774** · 2018/04/13(金) 19:03:05.69

どういういきさつがあったか知らんが、性能出てるなら使えばいいのに
壊しちゃったらそれこそムダ金じゃん

**Socket774** · 2018/04/13(金) 19:48:18.67

はい
才能の海外流出決定

**Socket774** · 2018/04/13(金) 20:17:57.32

どうも移設らしいな
別の場所で稼働させる可能性あるとか
まあ誰も受け入れなくて自己資金でも出来ずこのままお蔵の方がありそうだが。

運用にもカネがかかるから使う根拠のない機材を使い続けるわけにもいかんのだろうね

**Socket774** · 2018/04/13(金) 22:10:29.72

日本にスパコン持たせない、新技術は奪いたいどっかの国とかが関与でもしてるんじゃね？

**Socket774** · 2018/04/14(土) 00:17:59.19

Cellも潰されたね

**Socket774** · 2018/04/14(土) 01:09:58.23

CELLは潰されたというか自滅したというか潰れるべく潰れたというか……
当時最強クラスのBDプレイヤーを非常に廉価で提供してくれたのは有り難かったがｗ

**Socket774** · 2018/04/14(土) 04:33:57.12

>>716
マジIBMにキレていいと思うよその件はｗ
ファブごとGFに放り投げたんだけどね

**Socket774** · 2018/04/14(土) 06:23:09.87

放送局がDVDレコーダーを潰したのがSOCを潰してルネサスを潰す結果になったんだよな。
そこのとこ理解しておくように。

**Socket774** · 2018/04/14(土) 11:50:56.03

ヤフォークでSolaris2.2を入手したけどmicroSPARCアーキテクチャの
マシン持ってないぞ…

**Socket774** · 2018/04/14(土) 17:47:41.01

>>718
あの件はSonyの関与が一番の害だよ
そもそもIBMはもっと小さくまとめようとしてた

**Socket774** · 2018/04/14(土) 17:59:43.65

ソニー（SCE）が求める仕様のものを作ったんだから
害もなにもないでしょ

**Socket774** · 2018/04/14(土) 18:04:42.22

>>722
だからそれが誤りだったつーてるんや

**Socket774** · 2018/04/14(土) 18:34:40.99

久夛良木潰しとも言えるからな

**Socket774** · 2018/04/14(土) 19:50:33.90

>>723
なら話に逆行してるのでは？
アンカ先の>716は「IBMにキレていい」なんだから

**Socket774** · 2018/04/14(土) 20:18:20.72

Cellは単にPS3以外需要がないから消えていっただけ
エンコーダーやHPC向けのアクセラレーターにも使われたけど、存在感が全く無かった
Cellの思想的なものはPS4を介してGCNに受け継がれAPUになっている

Cellの経験を元にPS4でGCNのACEを8基にして、CPUと組合せてCellの発展型的なAPUを作ったらしい

**Socket774** · 2018/04/14(土) 20:30:25.57

Cell REGZAとかあったけどいつの間にか消えてたな

**Socket774** · 2018/04/14(土) 21:42:45.89

Cellっぽい構造は、中国のスーパーコンピュータ用CPUとして採用されて成功してる

**Socket774** · 2018/04/14(土) 22:50:40.22

いわゆる「ヘテロジニアス系のマルチコア」プロセッサは今花開きつつある分野だねぇ
早すぎたんだろう

**Socket774** · 2018/04/14(土) 22:57:18.10

ヘテロジニアスはSoCをかっこいい名前にしただけだから
本格的に普及するには、異種プロセッサを同等に扱えるOpenCLの普及が必要だけど、CUDAのせいで環境が全く整ってない状況
ゲーム面でもVulkanやDX12の普及が進まないとマルチコアやメモリ共有とかの高性能なことが出来ない

**Socket774** · 2018/04/14(土) 23:51:20.65

Cellを語るならせめてアドレス空間やデータフローには触れないと物足りない

**Socket774** · 2018/04/14(土) 23:57:26.03

>>730
SoCだと範囲が広すぎるから不適切かと
CPU + NB/SB をヘテロジニアス・プロセッサと呼ぶ必要はないしさ

**Socket774** · 2018/04/15(日) 00:02:27.82

>>730
いや、流石に括りが雑過ぎる気がするが
ヘテロジニアスといってもそいつはCPU+GPU
アレは異種のCPU混載、ないし全部纏めてのプロセッサだろう
分類が大分違う

**Socket774** · 2018/04/15(日) 00:46:14.12

つまりホモジニアスマルチプロセッサはかっこ悪い名前って事？

**Socket774** · 2018/04/15(日) 00:47:10.99

たしかに大雑把すぎたかな
ただ、ヘテロジニアスって言いにくいし書きづらいからSoC呼びが今後も続いていくと思う
AMDだけはAPUという使いやすい呼称を使っているからそれが定着しているけど

**Socket774** · 2018/04/15(日) 00:48:32.47

>>734
殆ど使われてないということはそういうこと

**Socket774** · 2018/04/15(日) 02:09:43.43

Cellみたいにアセンブラで組んでくださいっていうのはちょっときついのでは？
OpenCLとかで組めないと

**Socket774** · 2018/04/15(日) 08:46:24.03

わざわざわけわからん言葉を使わなくても

非対称コア
異種コア

で良いよなあ

**Socket774** · 2018/04/15(日) 08:47:31.92

ホモ言いたいだけちゃうか

**Socket774** · 2018/04/15(日) 08:50:31.37

レズのがいい

**Socket774** · 2018/04/15(日) 09:30:52.53

>>737
AMD的にはOpenCLより
コンパイラによる自動振り分けに軸足を移したみたい

**Socket774** · 2018/04/15(日) 09:32:25.58

レズはホモ

思うにAMDのAPUが行き着く先は何となくCell的に動いてグラフィックもできる的なパターンだと思うんだよね
SoCはまた分類が違う、当たり前のようにGPUや他が無くともアレは成立するケースもあるんでアーキテクチャ特性分類に適用するのは無理だろ
厳格な分類で言えば昨今の端末で必要とされる能力では誰も作れてないし

**Socket774** · 2018/04/15(日) 10:30:49.05

Cellって、Dragonballの流れをくむ名前なんかねえ

**Socket774** · 2018/04/15(日) 10:31:07.27

？？？？？

**Socket774** · 2018/04/15(日) 10:31:49.87

非対称コアの分野ではARM勢の方が進んでない？
GPUの積極利用はiOSからの流れで一気に進んだし、最近はディープラーニング向けに専用コア積んだり
Snapdragonは専用コアは積まないけど既存の各プロセッサを組み合わせた利用を進めてて凄くそれっぽい
http://www.itmedia.co.jp/mobile/articles/1712/18/news111.html

**Socket774** · 2018/04/15(日) 10:44:53.43

片方が動いている間はもう一方が停止するセガサターン方式のマルチプロセッサ

**Socket774** · 2018/04/15(日) 12:14:39.00

>>743
結局完全体にはなれなかった

POWER7とGeforceを吸収する前に倒された

**Socket774** · 2018/04/15(日) 14:03:10.05

>>745
確かに進んでると言えはするね
ARMのコアがミニマルだからこそ可能とも言えるけど
その点で言えばApple-A系とかは従来型なんだろうが
だけど重要なポイントとして、それだけ積んでも結局は一定の処理をさせるだけの単純回路って事
寧ろ分けて仕舞えば使わん間は無駄になっちまう

そこで第3のアプローチだ、最大公約数となる最低限の種類だけで良い
デバイスである限りCPUとGPUは必ず要る、これにまとめようとしてんのがAMDがやってるモノ

**Socket774** · 2018/04/15(日) 15:53:25.49

最大公約数？

**Socket774** · 2018/04/15(日) 17:35:13.09

dragonballってなんぞやと思ったら傑作すぎてこれ以外と知らんうちに使ってそうだな

**Socket774** · 2018/04/15(日) 19:38:11.57

DragonBallの時点でColdFireを開発出来ていればまた時代も変わったんだろうがなあ。

**Socket774** · 2018/04/15(日) 20:38:42.47

cellとAPUって似てるか？
汎用+シンプル沢山
APUは単にCPU+GPUで思想が全然違うと思うが
まあ、どうしてもCellが素晴らしくて引き継がれてると思いたいなら仕方ないけど
正直、反面教師くらいにしかなってないと思うわ

**Socket774** · 2018/04/15(日) 21:49:55.39

GPGPUやAPUをCellの延長線上で捕えようとするのは
PC Watchの後藤氏流の解釈だね
PS3のCellがヘテロジニアス・コンピューティングの先鞭をつけたのは確かだろうけど
シングル重視とマルチ特化のハイブリッドが（計算上は）ベストというのは当然の帰結のように思える

**Socket774** · 2018/04/16(月) 00:37:03.60

かつてのAMD
↓
GPUの完全解体（ドヤ

**Socket774** · 2018/04/16(月) 00:40:42.19

GPGPUに関して昔からの疑問がある

８Kでのレンダリングなどの重いグラフィック処理をリアルタイムでこなしながら、
さらに重い物理演算を並列させて動作させつつ、フレームレートを240fpsを維持できるのかと？

**Socket774** · 2018/04/16(月) 00:41:44.77

2020年には８Kディスプレイ6面構成が当たり前になるし

**Socket774** · 2018/04/16(月) 01:03:10.31

>>756
8Ｋは10年早い。

**Socket774** · 2018/04/16(月) 01:20:33.85

>>756
「当たり前」の日本語の定義を知りたいものですなぁ
GPU側のレンダリング能力も、なにより人間の視覚・知覚能力も追いつかんだろう
スケーリングして使うなら4kだろうが8kだろうが見た目には分からんだろう
GPU処理能力を余分に必要とする分だけ8kのほうが無駄だとしか言えんわ

**Socket774** · 2018/04/16(月) 08:56:14.41

>>753
まぁ本来は逆なんだろうけどな
Cellがそこを目指したんだろう、だから帰結の一つとしては似てるモノも有り得る

ともあれ汎用でないものを載せるほど面積コストが下がる算段があるわけでも無し
異種CPU混合かCPU-GPU連結かのどっちかですな
コスト制約がゆるけりゃ専用回路の山載せりゃ良いんだろうがな

**Socket774** · 2018/04/16(月) 10:47:55.84

>>755
>８Kでのレンダリングなどの重いグラフィック処理をリアルタイムでこなしながら、
>さらに重い物理演算を並列させて動作させつつ、フレームレートを240fpsを維持できるのかと？

それはある意味で「維持できるの？」以上に、それに近いことを実現できるソリューションはGPGPUしかないでしょ

**Socket774** · 2018/04/16(月) 11:30:53.44

もともとCellは

東芝SCEはSPUのみのメニーコア
IBMはPOWER4のみのマルチコア

案があって一旦IBM案で固まるも
クタタンの鶴の一声で
PPU + SPUなヘテロになった

ヘテロなんて妥協の産物

**Socket774** · 2018/04/16(月) 13:10:10.84

>>755
それするために並列実行関係を強化して来たわけで
nvidiaはvoltaでやっと実装
pascalはできなかった

**Socket774** · 2018/04/16(月) 13:16:25.35

nvがレイトレおしてるのも
何気にtensor core普及させる為だったり

**Socket774** · 2018/04/16(月) 13:42:42.76

トイレかと思った

**Socket774** · 2018/04/16(月) 13:53:12.02

レイトレ普及はかなり先だから
当面はラスタライズと一部レイトレになりそうだし、その場合物理演算やAI、音響とレイトレの複合処理になるからクソ重くなってくる
DX12のAsyncを使って効率的に並列処理しないとこれ以上はゲームが進化しないだろうな

**Socket774** · 2018/04/16(月) 15:34:39.94

>>761
それなんか違うと思う
開発の最初期はそうだったのかもしれないけど・・
Cellとしての形がきまってからは、IBMはSPEを5か6か忘れたけどSPEを少なくしてPPUを強化する案を出したけど
SCEの久夛良木社長が2のべき乗である8にするべきって主張して今の形になったと
団子が鬼の首を取ったように話してのを覚えてる

**Socket774** · 2018/04/16(月) 17:10:49.01

>>766
まぁ当初GPUに使おうとしてたようだから、マジだろうな、、、
というかIBMプランなら割とまともなプロセッサだな、bullの逆っぽい

**Socket774** · 2018/04/16(月) 18:36:46.15

解像度いくらあげても
驚くほどのものはなく

レンダリング自体変えるってのはアリだな