CPUアーキテクチャについて語れ 53

**Socket774** (ﾜｯﾁｮｲ dfbf-EggC) · 2021/09/18(土) 16:22:40.66

!extend:checked:vvvvv:1000:512

↑
次のスレを立てる時に上の文字をコピーしてください

前スレ
CPUアーキテクチャについて語れ 52
http://egg.5ch.net/test/read.cgi/jisaku/1623126064/

VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured

**MACオタ＞97 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 08:44:19.77

>>97
>ってことはスレッド性能のために演算粒度を上げないようにしてるってことか？
>Power系　それだからSIMDも64-128bit止まり。

時間的粒度(一つのチップ上で動かす複数スレッドを切り替えるタイミング)の話なので全然関係無いす。

下記リストから用語を見繕って検索すると情報わ見つかるので読んで妄想カキコミを減らしてくれるコトを祈るばかりす
- CGMT (IBM PowerPC RS64-II “Northstar”, 等)
- FGMT (Sun “Niagara”, Intel “Larrabee”, 等)
- SMT (Intel HyperThreading Technology, 等)

**MACオタ＞99 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 08:48:29.10

>>99
>命令が増え過ぎたら滅多に使わない命令は削って未定義命令実行例外割り込み

そのやり方でわ廃止命令のオペコードが無駄になるので新命令用のオペコードを確保するために命令長がどんどん伸びていくすけど良いすか？

**Socket774** (ﾜｯﾁｮｲ 4576-ter9) · 2021/11/14(日) 09:20:39.16

>>102
exeヘッダとCPUID命令でバージョン相当が確認出来れば競合しないのでは？
いやよく知らんが

**MACオタ＞103 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 09:59:22.27

>>103
>exeヘッダとCPUID命令

未定義命令トラップわ使えないかと。
あと廃止命令だけで無く、exe ファイル内の全命令を確認／変換する必要があるので別の ISA でエミュレーションするのと変わらないのでわ？

**Socket774** (ﾜｯﾁｮｲ d5da-iDG6) · 2021/11/14(日) 10:03:28.12

廃止命令による命令空間汚染なんかより
継ぎ接ぎによる今の非効率な命令エンコードを気にしろよ
木を見て森を見ず

今時数ビットを気にする時代でもないし

**MACオタ＞105 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 10:11:26.89

>>105
>今時数ビットを気にする時代でもないし

命令長 32-bit の制限に縛られる RISC で「数ビット」わ深刻な問題すけど。。。

**Socket774** (ﾜｯﾁｮｲ d5da-iDG6) · 2021/11/14(日) 10:16:18.45

32bitに制限してることが問題

**MACオタ＞107 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 10:20:34.37

>>107
命令長を変えると完全に互換性を失うので、廃止命令をエミュする理由すら無くなるす

**Socket774** (ﾜｯﾁｮｲ a3c8-aH2J) · 2021/11/14(日) 10:21:51.88

固定長だと命令デコード数をもりもり増やせる事はARMが証明してしまった。いくらL0があるとはいえ可変長は嫌ね

**Socket774** (ﾜｯﾁｮｲ d5da-iDG6) · 2021/11/14(日) 10:24:07.04

>>108
32bit固定長が元々が失敗だったってこと

>>109
固定長はいずれ破綻する

**Socket774** (ﾜｯﾁｮｲ d5da-iDG6) · 2021/11/14(日) 10:25:48.32

x86が固定長だったらとっくの昔になくなってる
なくなってた方が良かったかもしれんが

**MACオタ＞110 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 10:28:15.58

>>110
>固定長はいずれ破綻する

ARM わ破綻せずにモダンな ARMv8 に移行したし、そもそも ISA ごと乗り換えても問題無いのわ Apple が証明した歴史的事実かと

**Socket774** (ﾜｯﾁｮｲ 4576-ter9) · 2021/11/14(日) 10:37:25.20

>>104
未定義命令トラップ誰か使っちゃってるの？
暴走防止用？
あれ１命令でサブルーチンコール出来るから便利なのに。

どーせ訳わかんねーCPU買わされるんだろーからメッチャイタズラしちゃえｗ
PCと全レジスターを全部MRAM 化ｗMRAM１２８ＭＢをCPU内臓ｗ
ソフトを128MB以内にすればいつ電源切れても再開出来る「マイクロUPS」を実装ｗ

ついでにPS Vitaをネイィティブ実行できるようにしちゃえｗファミコンとかろっぱー等よそのCPUのバイナリをウルトラ高速実行出来るよう、命令ビットテーブルをソフトで指定出来るようにしちゃえｗ
テレビラジオ録画CPU でふぉｗxbox kinnectまるまるCPUに入れて超高速人体認識ｗ
汎用レジスター8 bit長CPUたくさんいれちゃえｗ

windows で使ってるサービスぜんぶチップセットあたりにぜんぶ常駐ハードウェアワンチップ化してcpuかえら追い出しちゃえｗ

**MACオタ＞113 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 10:46:27.74

>>113
>未定義命令トラップ誰か使っちゃってるの？

「exeヘッダとCPUID命令」で ISA のバージョンを判定する場合に使えないというだけす。

ただし近年の OS で未定義命令トラップによるシステムコールを使わなくなった理由わ、スーパースカラが普通になった現在のプロセッサでわ割込によるパイプラインフラッシュで動作が激遅になるからす

**Socket774** (ﾜｯﾁｮｲ d5da-iDG6) · 2021/11/14(日) 10:52:21.93

AVXやAVX512の機能は32bit固定長じゃどう頑張っても不可能
汎用整数でも64bit CPUが32bit即値すら指定出来ないって

バックエンドの効率化のためにフロントエンドの回路比率が高まって来たのに
フロントエンドをわずかに効率化するために
バックエンドが犠牲になるのは本末転倒

**Socket774** (ﾜｯﾁｮｲ d5da-iDG6) · 2021/11/14(日) 10:54:14.25

>>112
使い捨て命令セットを作りたいならどうぞご自由に

**Socket774** (ﾜｯﾁｮｲ 1b58-bPZJ) · 2021/11/14(日) 11:03:18.13

結局、ISAなんて、エコシステムをどの程度整備できるかでしかないんだから、Appleがやったように、自社とその影響範囲をすべて差し替えられると確信できたら乗り換えてもなんも問題ない
中国だって同じように、Sunwayは独自…まぁあれはalpha感があるが…のもので事足りてるんだから、そういうことだろ

ていうかいつまでRISCとかCISCとか言ってんだよ今令和だぞ？

**MACオタ＞115 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 11:17:52.19

>>115
>AVXやAVX512の機能は32bit固定長じゃどう頑張っても不可能
>[中略]
>バックエンドが犠牲になるのは本末転倒

一つの回答わ富士通/ARM の SVE すけど、そもそもこの手の用途わアクセラレータへ移行というのが流行す

AVX512 やらで電力効率が上がるなら Aurora が Larrabee の後継チップから GPU に置き換えられるコトも無かった訳だし、当の Intel すら AMX でそっちに舵を切ったす

**MACオタ＞117 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 11:21:02.97

>>117
>結局、ISAなんて、エコシステムをどの程度整備できるかでしかないんだから、Appleがやったように、自社とその影響範囲をすべて差し替えられると確信できたら乗り換えてもなんも問題ない

Apple 以前に Windows ユーザーのお馴染みの GPU がソレす。
皆さん何の疑いもなく使ってるのでわ？

**Socket774** (ﾜｯﾁｮｲ 4576-ter9) · 2021/11/14(日) 11:46:44.95

>>114
ふーん。

命令とオペコードがぐちゃぐちゃであっちこっちの企業や個人で拡張し過ぎて収拾つかなくなってるんだね。つまりは好き勝手にオペコードを決めていいという事だよね。
互換性は動かしてみないと分からん、と....

**Socket774** (ﾜｯﾁｮｲ 1b58-bPZJ) · 2021/11/14(日) 11:52:31.24

うるせーぞクソコテそれはそれとしてお前は消えろ

**MACオタ＞120 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 11:59:27.61

>>120
>命令とオペコードがぐちゃぐちゃであっちこっちの企業や個人で拡張し過ぎて収拾つかなくなってるんだね。

何処をどう読んだらその結論に？

**Socket774** (ﾜｯﾁｮｲ 4576-ter9) · 2021/11/14(日) 12:06:11.48

AVX512ねぇ。512ビット制御たって。
そこらうろついてる汚い格好したおばちゃんがこぞって買うような物にはなんないと思うけど。

光速度測定であっちこっちで重力変異を測定出来るんならいいけど、ここらの測定はたいがいは何やってもムダ
分子微細系計測も難しい
数学研究でテイラー展開やらで精度上げて新しい成果が出るとも思えないし

うーん。光の指向性分散具合の計測ってわけにもいかんし

**MACオタ** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 12:11:47.04

ウェハ丸ごと一枚使った AI プロセッサ "WSE" で名を挙げた Cerebras が時価総額4兆円企業に成り上がったとのコトす
https://www.anandtech.com/show/17061/cerebras-completes-series-f-funding-another-250m-for-4b-valuation
先日次世代品の “WSE-2” も発表して順調そのもの。
Jim Keller が CTO を務めるTenstorrent より投資家を集めたと言うのわ興味深いす
https://images.anandtech.com/doci/17061/AI%20PurePlay.png

**Socket774** (ｽﾌﾟｯｯ Sd03-iDG6) · 2021/11/14(日) 12:21:50.94

流行らん

**Socket774** (ｱｳｳｨﾌ FFa9-D258) · 2021/11/14(日) 12:34:12.08

アクセラレーターへの移行って言ってもワンホップ増えるわけでしょ
データ移動にコストかけてる世界でそれ本当に性能出せるの？

**Socket774** (ｽﾌﾟｯｯ Sd03-iDG6) · 2021/11/14(日) 12:36:29.26

移行しない
GPUにすら移行出来てないのに

**MACオタ＞125-127 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 13:05:21.91

>>125-127
ちょうど大原氏がこの辺の現状と動向についてまとめた記事があるす
https://www.itmedia.co.jp/news/spv/2011/25/news055_2.html
ーーー
ヘテロジニアス環境の理想で言えば、CPUとGPU、NPUその他が並列に並び、1つのメモリをCache CoherencyにUnified Accessできることが望ましいし、長期的には命令セットが共通化きれればより好ましい。
ーーー
Intel AMX わ正にコレを実現しているす

**Socket774** (ﾜｯﾁｮｲ a34d-fAyS) · 2021/11/14(日) 13:20:26.42

大規模なVLIWかベクトルプロセッサかな

**Socket774** (ｱｳｳｨﾌ FFa9-D258) · 2021/11/14(日) 13:22:19.47

それはワンホップ増やさないで済むようにアクセラレーターまで統合という構想だと思う。
PezyだってWarrior統合とかやってたのも同じ理由だろう。

**Socket774** (ﾜｯﾁｮｲ 1b58-bPZJ) · 2021/11/14(日) 13:44:14.34

そりゃ、メモリ空間が統合されていてデータの置き場所を意識しないでよく、かつ、どこに置かれていようと十分なレイテンシと帯域でデータにアクセスできるのなら、それは理想的なメモリシステムだわな
今のところそれに一番近いのはNVIDIAのUnified Memoryだが、とはいえPCIeの帯域で律速するわけで…
その辺の問題は、NVIDIAはGraceで解決しようとしてるし、PowerであればNVLinkを内部バスに取り込むことでボトルネックを軽減しようとしている
最近って言いながら十年前の記事を上げるなよ…

**MACオタ＞131 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 13:58:58.56

>>131
>最近って言いながら十年前の記事を上げるなよ…

未来から来られた方とわお見それしたす(笑)

ちなみに2021年時点で IBM わスーパーコンピュータ案件が取れなくなったのでアッサリ POWER10 から NVLink を削除したす。2030年11月の情報をご存知の様すからその後の展開を講釈して頂きたいモノす
IBM の言い訳わこちら
https://www.hardwareluxx.de/index.php/news/hardware/prozessoren/53864-ibm-power10-bietet-30-kerne-mit-smt8-pcie-5-0-und-ddr5.html
ーーー
IBM and NVIDIA initially partnered to develop NVLINK host-to-GPU attach technology to overcome performance bottlenecks caused by the insufficiency of PCIe Gen3 capabilities.
While this provided substantial differentiation relative to PCIe Gen3 and Gen4, the industry accelerated the pace of PCIe development. With the advent of PCIe Gen5, both IBM and NVIDIA determined that PCIe is once again sufficient for eliminating performance bottlenecks in host-to-GPU attach.
Therefore a proprietary solution such as NVLINK is no longer a strong differentiator for host-to-GPU attach, and the POWER10 processor will not exploit NVLINK for host-to-GPU attach.
ーーー

**Socket774** (ﾌﾞｰｲﾓ MM6b-fiLq) · 2021/11/14(日) 14:12:07.31

coherency 維持するにもコストかかるからな。
ノード外まで coherenct なシステムも昔は存在したが滅びたわけで
規模が大きくなると諦めないといけなくなるぜ

**Socket774** (ｱｳｳｨﾌ FFa9-D258) · 2021/11/14(日) 14:37:35.89

その手のをAMDがやるとしたらHPC向けAPUという事になるんだろうが
報道記事も2015年あたりでぱったりだなぁ

**MACオタ＞133 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 14:42:35.25

>>133
>規模が大きくなると諦めないといけなくなるぜ

POWER10 の話をしているなら IBM の目論見わ、その真逆す
https://www.nextplatform.com/2021/08/13/the-power-of-power10s-memory-inception-clustering/
ーーー
This 2 PB can be spread over the memory of multiple systems in IBM’s memory cluster, and all of it directly accessible from a Power10 core within any one of them.
ーーー
IBM 的にわデータ処理をアクセラレータで行い、サーバープロセッサわアクセラレータにメモリや IO 資源を提供するハブ化すると考えている模様す

**MACオタ＞134 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 14:54:37.20

>>134
>報道記事も2015年あたりでぱったりだなぁ

先日発表された HPC 向け MCM GPU もチップ間接続わ Zen のチップレット間インタコネクトと同じ Infinity Fabric す。
同 GPU と Zen 3 を採用したスーパーコンピュータ “Frontier” わ CPU-GPU 間インタコネクトにやはりメモリコヒーレンシをサポートしたInfinity Fabric を採用するとアナウンスされているす
https://www.hpe.com/us/en/newsroom/press-release/2019/05/cray-to-deliver-record-setting-frontier-supercomputer-at-ornl.html
ーーー
The new accelerator-centric compute blades will support a 4:1 GPU to CPU ratio with high speed AMD Infinity Fabric links and coherent memory between them within the node.
ーーー

**Socket774** (ｱｳｳｨﾌ FFa9-D258) · 2021/11/14(日) 14:57:20.03

>>136
仰せはわかるが、APUにはならんよね
インターコネクト改善でレイテンシも削れるようにできてるんだろうけど、
まあ性能が出るかモノが出てきてから考えましょう、と。

**MACオタ＞137 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 15:04:19.41

>>137
>仰せはわかるが、APUにはならんよね

IBM 渡来の思想でオンダイのインタコネクトも Infinity Fabric なので一緒かと
https://pc.watch.impress.co.jp/docs/column/kaigai/1053318.html
ーーー
Infinity Fabricは、1つにはオンダイのインターコネクトの拡張だ。しかし、その一方でソケット間もサポートする。ソケットでは、CPUとCPUの間、CPUとGPUの間、CPUと他のアクセラレータの間をInfinity Fabricで接続する。
ーーー

**Socket774** (ｱｳｳｨﾌ FFa9-D258) · 2021/11/14(日) 16:07:21.07

じゃあInfinity Fabricでレイテンシ極減して性能出るのに期待するとしよう。
PezyにせよEuroProcessorにせよアクセラレーター自体は流行っている。
個人的には富岳のような構成を支持するがそういう環境ばかりが正義ではないのは理解している。

**MACオタ＞139 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 16:23:26.94

>>139
>個人的には富岳のような構成を支持するがそういう環境ばかりが正義ではないのは理解している。

富岳の A64FX もノードあたりのメモリが 32GB しか無い段階で伝統的なサーバープロセッサと言うより、NIC を統合すればアクセラレータだけでスーパーコンピュータを作れる的な思想を感じるす。。。

**MACオタ** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 16:26:55.47

ところでココって妙に SIMD 推しのヒト達が多い様に感じるすけど、現在一般的なアーキテクチャで最弱の SIMD である NEON 採用の Apple Silicon が良い性能を発揮しているのをどう見ているすか？

**Socket774** (ﾜｯﾁｮｲ d558-WW/G) · 2021/11/14(日) 16:30:54.96

命令セットなんて性能に関係しないってこと

**MACオタ＞142 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 16:46:13.29

>>142
SIMD 演算ユニットの幅やら数やらサポートする数値型などわ単純にピーク性能に直結するマイクロアーキテクチャ上の問題なので、ISA の優劣とわ別かと

**Socket774** (ﾜｯﾁｮｲ 23f3-7Kr9) · 2021/11/14(日) 17:13:46.72

>133
かろうじて絶滅はまだしてないよー　32ソケットだからもう大規模とは言えないけど。
買収された先で生き残ってる。少ないけど需要はあるからね。
　HPE Superdome Flex
　https://assets.ext.hpe.com/is/content/hpedam/documents/a50000000-0999/a50000523/a50000523jpn.pdf

**Socket774** (ﾜｯﾁｮｲ 23f3-7Kr9) · 2021/11/14(日) 17:34:09.34

>144　補足
SGI UV 300の高速インターコネクト技術を継承
クロスバーチップSuperdome Flex ASIC
クロスバーファブリックSuperdome Flex Grid
https://h50146.www5.hpe.com/doc/catalog/proliant/pdfs/jhs15139.pdf

**Socket774** (ﾜｯﾁｮｲ a3c8-aH2J) · 2021/11/14(日) 18:09:40.39

>>141
SIMDに関しては128bitの add/mul + fma * 3という演算器数に振った構成そのままの性能というイメージ。
AVX2は256bitと言ってもデスクトップ用途でリニアに性能2倍になるアプリなんてほぼ無いし

**Socket774** (ｱｳｳｨﾌ FFa9-D258) · 2021/11/14(日) 18:59:16.11

>>146
エンコの話題でAVX2で1.4倍くらいになりました、ってベンチ見て
凄いと思う人としょぼいと思う人で意見割れてたな。

**Socket774** (ﾜｯﾁｮｲ 4576-ter9) · 2021/11/14(日) 19:27:53.65

ビットマップの拡大縮小命令(というかサブルーチン) とかどうだろｗここの高速化回路検討ｗ
ソースビットマップのアドレスとサイズ、拡大縮小率を指定すると出力先RAMにサイズ変更したビットマップを出力してくれるみたいなの。
問題は中間補正値をどうするかだけどこれも指定出来るように....

字が小さくてよく読めない俺向けw
windowsも拡大縮小率を指定出来るけどけっこー重くなるんだよな
ジジババおれうれしいｗ

**Socket774** (ｱｳｱｳｱｰ Saab-Mtit) · 2021/11/14(日) 19:32:16.23

解像度下げれば万事おけ。

**Socket774** (ﾜｯﾁｮｲ a3c8-aH2J) · 2021/11/14(日) 19:34:17.10

>>148
GPUってご存知無い？

**Socket774** (ﾌﾞｰｲﾓ MM43-fiLq) · 2021/11/14(日) 19:35:28.54

>>145
おお生き延びてたのか。
知らなかった。ありがとう

**Socket774** (ﾜｯﾁｮｲ 4576-ter9) · 2021/11/14(日) 20:42:17.60

>>150
そうか！
GPUつきのノート買えば字が読みやすくなるのか！

そういやでっかいテレビ買えばいいだけじゃん。なんだぁ～。

**Socket774** (ﾜｯﾁｮｲ ed58-jdJP) · 2021/11/14(日) 21:47:12.43

AVXって独立した計算装置で
CPUのコアと密接に繋が無くても良いんだろ

**MACオタ＞153 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 21:57:02.59

>>153
命令とレジスタ自体わ定義されてても元々 FPU わ別チップで割り込み経由で呼び出していたすから、そういう実装がありえるのわ否定しないす

性能低下が大きいので誰もやらないと思うすけど。。。

**Socket774** (ｽｯｯﾌﾟ Sd43-iDG6) · 2021/11/14(日) 22:19:19.72

私は小数計算をたくさんやるからSIMD推し
単精度ならCUDAを使ったりもするけど

**Socket774** (ｽｯｯﾌﾟ Sd43-iDG6) · 2021/11/14(日) 22:21:59.92

NEONはうんこ
機能的にはAVX512が強い

**Socket774** (ｽｯｯﾌﾟ Sd43-iDG6) · 2021/11/14(日) 22:25:48.87

普通に庶民が手に入る範囲だと10980XEが最強
1コアでAlderLakeのPコアの倍の性能、Eコアの4倍の性能
これが18コア

**Socket774** (ﾜｯﾁｮｲ a3c8-aH2J) · 2021/11/14(日) 22:30:10.52

どの辺がウンコ？ shuffle?
と思ったら純粋にFlopsの話も含んでるのか

**Socket774** (ｽｯｯﾌﾟ Sd43-iDG6) · 2021/11/14(日) 22:31:52.55

>>158
全てがうんこ
なんか良い点思いつく？

**Socket774** (ｽｯｯﾌﾟ Sd43-iDG6) · 2021/11/14(日) 22:34:21.95

shuffle最強はAVX512

**Socket774** (ﾜｯﾁｮｲ a3c8-aH2J) · 2021/11/14(日) 22:43:31.81

>>159
NEONは書いたことないからわからん

**MACオタ＞155-156 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 23:26:57.27

>>155
>私は小数計算をたくさんやるからSIMD推し

>>156
>NEONはうんこ
>機能的にはAVX512が強い

ところが SPECfp2017 でも Apple M1 シリーズが良い結果を出していると言う事実が。。。
https://images.anandtech.com/graphs/graph17047/117493.png

**MACオタ** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/14(日) 23:50:07.27

Mediatek の ARMv9 SoC “Dimensity 2000” がAntutu Benchmark で 1,000,000 超えたという噂が話題す
Qualcomm の Snapdragon 888 で 858,734 程度なんだとか
https://www.digitaltrends.com/mobile/mediateks-upcoming-flagship-soc-appeared-antutu/
ーーー
According to unverified leaks, the Dimensity 2000 will allegedly feature a Cortex-X2 core at 3.0 GHz, three Cortex-A710 cores, and four A510, similar to Qualcomm’s Snapdragon 898.
ーーー
NEON → SVE2 で ARM は更なる進歩を実現するすかね？果たして正しい情報なのか腐れルーマーの類なのか。。。

**Socket774** (ﾜｯﾁｮｲ d5da-iDG6) · 2021/11/14(日) 23:54:23.40

SkylakeX/CascadeLakeのコアの半分以下の性能
糞だよ

コンシューマー系intelはHaswellから性能があがってないからねえ
なんとかしてほしいねえ
AVX512搭載のRocketLakeですら本来の半分の性能だし

**Socket774** (ﾜｯﾁｮｲ d5da-iDG6) · 2021/11/15(月) 00:08:03.01

10980XEが今時点では最強

>>163
SVE2は基本SoA前提で応用範囲が狭い
期待してない

**Socket774** (ﾜｯﾁｮｲ e57e-dCeX) · 2021/11/15(月) 00:15:58.64

何を測ってるのか不明なウンコベンチをさらに全部足し合わせてしまう総合スコアでは何もわからんな

**MACオタ＞165 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/15(月) 00:28:20.54

>>165
>[i9-]10980XEが今時点では最強

コレ、SPECint2017 と SPECfp2017 合わせて幾何平均を取った結果なので直接比較わできないすけど、それほど輝かしい結果にわ見えないす
https://images.anandtech.com/graphs/graph15785/116118.png

**MACオタ＞166 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/15(月) 00:32:05.57

>>166
SPEC CPU 2017 ベンチマークの詳細わこちら
https://www.spec.org/cpu2017/Docs/overview.html#benchmarks

ソースも購入できるす。
https://www.spec.org/order.html

**Socket774** (ｱｳｳｨﾌ FFa9-D258) · 2021/11/15(月) 00:32:46.71

SVE2は性能出るか出ないか言うなら、NEONより向上するかというのを考えたい。
いや、特に論拠を持ってるわけじゃないけど。

**Socket774** (ﾜｯﾁｮｲ 2b81-09aj) · 2021/11/15(月) 02:37:21.27

>>167 それが18Cあるからってことじゃない？

**MACオタ＞170 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/15(月) 03:19:31.73

>>170
コア性能の比較ということで。
一応1スレッドで SPECfp2017 を測定した結果すから、turbo boost も込みす。

**Socket774** (ﾜｯﾁｮｲ 2b81-09aj) · 2021/11/15(月) 03:26:33.22

>>171 最初から>>157氏は>>157のように書いてるんだし(10980XEはAVX512が36基)、そんな話は不要でしょ。
それより、そういう前提で>>159の下記に何か言える人は言ってあげればいいんじゃない。
＞なんか良い点思いつく？

**Socket774** (ﾜｯﾁｮｲ 2b81-09aj) · 2021/11/15(月) 05:06:39.57

ちなみに、Geekbenchには7980XE～10980XEやW-3175XのHackintoshが沢山居るね。

**Socket774** (ﾜｯﾁｮｲ a3c8-aH2J) · 2021/11/15(月) 06:48:46.49

そりゃ倍精度演算繰り返すような処理のピーク性能では10980EXの方が高いでしょ。MACヲタはSPECfpで計測に使われてるソフト見てない疑惑。
個人的にはさらに高性能な3970Xや3990Xだって庶民に買えるじゃんとは思うけど。

**Socket774** (ﾜｯﾁｮｲ a3c8-aH2J) · 2021/11/15(月) 06:53:44.26

間違えた
s/10980EX/10980XE/

**Socket774** (ﾜｯﾁｮｲ 2b81-09aj) · 2021/11/15(月) 06:56:09.26

>>174 3970X以上だとAVX512固有の機能が使えず、fp性能が同等クラスの3970Xでも価格が倍近くだから>>157氏の選択肢に入らないってことかと思った。
あと、3980X/3990Xとかだとコア性能は高くても計算内容によってはメモリ4chしかないのがネックになるかも。

**Socket774** (ﾜｯﾁｮｲ a3c8-aH2J) · 2021/11/15(月) 07:01:04.63

>>176
それはあるかも。
そのへん本人が説明してくれればな～

**MACオタ＞174 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/15(月) 07:24:43.60

>>174
>MACヲタはSPECfpで計測に使われてるソフト見てない疑惑。

伝統的に SPECfp わオープンソースの科学技術計算用ソフトで構成されるていたす。>>168 のリストにある通り2017年版わマルチメディア系ソフトも増えて、
- 511.povray_r
- 526.blender_r
- 538.imagick_r
あたりが単精度浮動小数点性能が効くすけど、残りの10個のサブベンチわ主として倍精度性能を求められるかと。

**Socket774** (ﾜｯﾁｮｲ 2b81-09aj) · 2021/11/15(月) 07:35:39.50

まぁ、>>157やその後の話見たら、>>176くらいのことは考慮してレスしないと話が変な方向に行きそうだね。

**MACオタ＠補足** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/15(月) 07:36:54.68

>>178 の補足す
もっとも SPECfp わ SPEC95 の頃から『メモリ速けりゃ全部OK』的な傾向わあったすから、Apple M1 シリーズの好成績わソレが理由という可能性も考えられるす

Anandtech.com わベンチ結果のページ (http://www.anandtech.com/Bench)で自前で行った SPEC CPU のサブベンチの個別結果も公開しているすから、興味のある方わ i9-10980XE とM1 を比較して特徴を抽出できるす

**Socket774** (ﾜｯﾁｮｲ a3c8-aH2J) · 2021/11/15(月) 07:45:31.23

>>178
SIMDのピーク性能を測るようなベンチでは無いよねという話。まぁ当の157が出てこないし、なんでも良いんだけどさ

**MACオタ＞172 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/15(月) 07:54:35.50

>>172
>そんな話は不要でしょ。

コア性能が高いと語っている様な。。。
>>157
>1コアでAlderLakeのPコアの倍の性能、Eコアの4倍の性能

**Socket774** (ﾜｯﾁｮｲ 1b58-bPZJ) · 2021/11/15(月) 07:54:42.81

まーたこの知恵遅れはネットにある情報をつなぎ合わせてオナニーしてるよ…キモすぎ…

**Socket774** (ﾜｯﾁｮｲ 2b81-09aj) · 2021/11/15(月) 07:57:13.16

>>182 あんた大丈夫か？>>157って書いたのに「これが18コア」を見てない。>>170でもそれを指摘済み。

**MACオタ＞181 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/15(月) 08:00:13.56

>>181
>SIMDのピーク性能を測るようなベンチでは無い

>>157 に書いてある主張わ上で書いた通りかと

アプリベースのベンチで SIMD のピーク性能が測れないと言うことわSIMD の有用性そのものが疑われるすけど、そう言うコトが言いたいすか？
Intrinsic 必須という意見わあるかと思うす

**Socket774** (ﾜｯﾁｮｲ 2b81-09aj) · 2021/11/15(月) 08:08:27.74

>>185 >>157氏は自分で書いたプログラムを実行しているようなので、その内容も詳しく聞かず話を進めることに意味はないでしょ。
既に書いてある内容からすると、AVX512気に入ってて、SIMD使用率が高いので、価格含めてそういう選択したのかな？
って感じじゃない。特に現段階であーだこーだ言う話ではない。

**MACオタ＞184 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/15(月) 08:08:43.60

>>184
>>>170でもそれを指摘済み。

そこに拘るのわ自由すけど、複数のプロセッサを比較するなら条件を揃えるのが科学的態度す。

anandtech.com でわ n-way の SPECfp rate の計測も行なっているすけど、ココであえて 1-T の結果で比較しているのわマイクロアーキテクチャ的要素を比較する目的す

**Socket774** (ﾜｯﾁｮｲ 2b81-09aj) · 2021/11/15(月) 08:39:58.92

ちなみに、Linpackなら10980XE定格（PL1 165W、PL2はXeon系なので1.2倍か？）で1000GFlops近く出そう。
前にこの辺りに書いたけど、うちの7980XEでPL1=PL2=165Wで、メモリとメッシュOCしてて1030GFlopsとか。
OCすれば1200～1300GFlopsくらいは比較的容易。全力（実用性なし）で1700GFlops。
Alder 8+8定格（爆熱）は700GFlopsくらいだっけ。
CGレンダリングの定格比較だとCHINEBENCHなんかはAlder 8+8の方が圧倒的に速いね。

**Powerスキヤキ** (ﾜｯﾁｮｲ ed58-qaXb) · 2021/11/15(月) 15:34:39.47

POWER9で自作してるか、自作したいって人、日本におるんかいな。

**Socket774** (ﾜｯﾁｮｲ a3c8-aH2J) · 2021/11/15(月) 15:50:10.52

そんなのよりCortex-X系搭載のチップで自作したい

**Socket774** (ｱｳｳｨﾌ FFa9-D258) · 2021/11/15(月) 16:40:16.95

ソケット規格が現状ないしオンボかな
TrustZoneは使えるんだよね？

**Socket774** (ﾜｯﾁｮｲ d558-09aj) · 2021/11/15(月) 18:54:56.57

>>189
例のアメリカで売ってるBTOキット
個人輸入してるのもいるかな？
50万ぐらいするけど

**Socket774** (ﾜｯﾁｮｲ ed58-jdJP) · 2021/11/15(月) 19:09:36.16

ThreadRipperより安いな

**Socket774** (ﾜｯﾁｮｲ 23f3-7Kr9) · 2021/11/16(火) 03:03:05.77

SPEC fp って少なくとも昔は単精度、倍精度入り交じりで参考にし辛かったから
追いかけてないんだけど、今でも入り交じりなのかね

**Socket774** (ﾜｯﾁｮｲ a3c8-aH2J) · 2021/11/16(火) 07:00:17.85

富岳が4期連続でスパコンランキング4冠
https://pc.watch.impress.co.jp/docs/news/1366/476/amp.index.html

富岳の天下ってもっと短いと思ってたけど、これで4期目か。半導体不足が要因？

**MACオタ＞195 さん** (ﾜｯﾁｮｲ 2df5-ryRh) · 2021/11/16(火) 08:12:40.51

>>195
TOP500 Nov.2021 版わこちら
https://www.top500.org/lists/top500/2021/11/
top10 が変わり映えしないので面白みが無いすけど、11位以下にわ “Zen3” EPYC や “Ice Lake” Xeon の構成がチラホラと。。。

中国わ完全にステルスモードに入った感じす。
あと、それなりに海外にも売れていると聞く A64FX のシステムわ、まだ国内案件ばかりす

**Socket774** (ﾜｯﾁｮｲ d558-09aj) · 2021/11/16(火) 10:30:39.62

まだ調整不足かGreen500での数値はパッとしないけど
スキャンダル以降開発の継続が危ぶまれていたPEZY-SC3リリースできたんだな…

**Socket774** (ﾜｯﾁｮｲ d558-09aj) · 2021/11/16(火) 11:51:44.69

SpecCPUでの結果は、同世代/同コア数/動作周波数が近い
x86と同等以上なのに、アプリケーションベンチ。特にマルチメディア系
だと大敗するPower9

**Socket774** (ｽﾌﾟｯｯ Sd03-iDG6) · 2021/11/16(火) 12:13:36.34

富岳って自作出来る？
富岳ってPC？

**Socket774** (ｱｳｳｨﾌ FFa9-D258) · 2021/11/16(火) 13:11:37.17

>>199
自作できないアーキなんて何度も出てきているので
たまにそういうツッコミ入れてもらうのは構わないが、半ば諦めるくらいに構えておけ。