X



CPUアーキテクチャについて語れ 53
■ このスレッドは過去ログ倉庫に格納されています
0101MACオタ>97 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 08:44:19.77ID:XItMWShS0
>>97
>ってことはスレッド性能のために演算粒度を上げないようにしてるってことか?
>Power系 それだからSIMDも64-128bit止まり。

時間的粒度(一つのチップ上で動かす複数スレッドを切り替えるタイミング)の話なので全然関係無いす。

下記リストから用語を見繕って検索すると情報わ見つかるので読んで妄想カキコミを減らしてくれるコトを祈るばかりす
- CGMT (IBM PowerPC RS64-II “Northstar”, 等)
- FGMT (Sun “Niagara”, Intel “Larrabee”, 等)
- SMT (Intel HyperThreading Technology, 等)
0102MACオタ>99 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 08:48:29.10ID:XItMWShS0
>>99
>命令が増え過ぎたら滅多に使わない命令は削って未定義命令実行例外割り込み

そのやり方でわ廃止命令のオペコードが無駄になるので新命令用のオペコードを確保するために命令長がどんどん伸びていくすけど良いすか?
0104MACオタ>103 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 09:59:22.27ID:XItMWShS0
>>103
>exeヘッダとCPUID命令

未定義命令トラップわ使えないかと。
あと廃止命令だけで無く、exe ファイル内の全命令を確認/変換する必要があるので別の ISA でエミュレーションするのと変わらないのでわ?
0105Socket774 (ワッチョイ d5da-iDG6)
垢版 |
2021/11/14(日) 10:03:28.12ID:pSOqtrqk0
廃止命令による命令空間汚染なんかより
継ぎ接ぎによる今の非効率な命令エンコードを気にしろよ
木を見て森を見ず

今時数ビットを気にする時代でもないし
0106MACオタ>105 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 10:11:26.89ID:XItMWShS0
>>105
>今時数ビットを気にする時代でもないし

命令長 32-bit の制限に縛られる RISC で「数ビット」わ深刻な問題すけど。。。
0108MACオタ>107 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 10:20:34.37ID:XItMWShS0
>>107
命令長を変えると完全に互換性を失うので、廃止命令をエミュする理由すら無くなるす
0109Socket774 (ワッチョイ a3c8-aH2J)
垢版 |
2021/11/14(日) 10:21:51.88ID:T6CBbs+F0
固定長だと命令デコード数をもりもり増やせる事はARMが証明してしまった。いくらL0があるとはいえ可変長は嫌ね
0111Socket774 (ワッチョイ d5da-iDG6)
垢版 |
2021/11/14(日) 10:25:48.32ID:pSOqtrqk0
x86が固定長だったらとっくの昔になくなってる
なくなってた方が良かったかもしれんが
0112MACオタ>110 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 10:28:15.58ID:XItMWShS0
>>110
>固定長はいずれ破綻する

ARM わ破綻せずにモダンな ARMv8 に移行したし、そもそも ISA ごと乗り換えても問題無いのわ Apple が証明した歴史的事実かと
0113Socket774 (ワッチョイ 4576-ter9)
垢版 |
2021/11/14(日) 10:37:25.20ID:yLJ7E/ep0
>>104
未定義命令トラップ誰か使っちゃってるの?
暴走防止用?
あれ1命令でサブルーチンコール出来るから便利なのに。


どーせ訳わかんねーCPU買わされるんだろーからメッチャイタズラしちゃえw
PCと全レジスターを全部MRAM 化wMRAM128MBをCPU内臓w
ソフトを128MB以内にすればいつ電源切れても再開出来る「マイクロUPS」を実装w

ついでにPS Vitaをネイィティブ実行できるようにしちゃえwファミコンとかろっぱー等よそのCPUのバイナリをウルトラ高速実行出来るよう、命令ビットテーブルをソフトで指定出来るようにしちゃえw
テレビラジオ録画CPU でふぉwxbox kinnectまるまるCPUに入れて超高速人体認識w
汎用レジスター8 bit長CPUたくさんいれちゃえw

windows で使ってるサービスぜんぶチップセットあたりにぜんぶ常駐ハードウェアワンチップ化してcpuかえら追い出しちゃえw
0114MACオタ>113 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 10:46:27.74ID:XItMWShS0
>>113
>未定義命令トラップ誰か使っちゃってるの?

「exeヘッダとCPUID命令」で ISA のバージョンを判定する場合に使えないというだけす。

ただし近年の OS で未定義命令トラップによるシステムコールを使わなくなった理由わ、スーパースカラが普通になった現在のプロセッサでわ割込によるパイプラインフラッシュで動作が激遅になるからす
0115Socket774 (ワッチョイ d5da-iDG6)
垢版 |
2021/11/14(日) 10:52:21.93ID:pSOqtrqk0
AVXやAVX512の機能は32bit固定長じゃどう頑張っても不可能
汎用整数でも64bit CPUが32bit即値すら指定出来ないって

バックエンドの効率化のためにフロントエンドの回路比率が高まって来たのに
フロントエンドをわずかに効率化するために
バックエンドが犠牲になるのは本末転倒
0117Socket774 (ワッチョイ 1b58-bPZJ)
垢版 |
2021/11/14(日) 11:03:18.13ID:MlN7vwq20
結局、ISAなんて、エコシステムをどの程度整備できるかでしかないんだから、Appleがやったように、自社とその影響範囲をすべて差し替えられると確信できたら乗り換えてもなんも問題ない
中国だって同じように、Sunwayは独自…まぁあれはalpha感があるが…のもので事足りてるんだから、そういうことだろ

ていうかいつまでRISCとかCISCとか言ってんだよ今令和だぞ?
0118MACオタ>115 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 11:17:52.19ID:XItMWShS0
>>115
>AVXやAVX512の機能は32bit固定長じゃどう頑張っても不可能
>[中略]
>バックエンドが犠牲になるのは本末転倒

一つの回答わ 富士通/ARM の SVE すけど、そもそもこの手の用途わアクセラレータへ移行というのが流行す

AVX512 やらで電力効率が上がるなら Aurora が Larrabee の後継チップから GPU に置き換えられるコトも無かった訳だし、当の Intel すら AMX でそっちに舵を切ったす
0119MACオタ>117 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 11:21:02.97ID:XItMWShS0
>>117
>結局、ISAなんて、エコシステムをどの程度整備できるかでしかないんだから、Appleがやったように、自社とその影響範囲をすべて差し替えられると確信できたら乗り換えてもなんも問題ない

Apple 以前に Windows ユーザーのお馴染みの GPU がソレす。
皆さん何の疑いもなく使ってるのでわ?
0120Socket774 (ワッチョイ 4576-ter9)
垢版 |
2021/11/14(日) 11:46:44.95ID:yLJ7E/ep0
>>114
ふーん。

命令とオペコードがぐちゃぐちゃであっちこっちの企業や個人で拡張し過ぎて収拾つかなくなってるんだね。つまりは好き勝手にオペコードを決めていいという事だよね。
互換性は動かしてみないと分からん、と....
0122MACオタ>120 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 11:59:27.61ID:XItMWShS0
>>120
>命令とオペコードがぐちゃぐちゃであっちこっちの企業や個人で拡張し過ぎて収拾つかなくなってるんだね。

何処をどう読んだらその結論に?
0123Socket774 (ワッチョイ 4576-ter9)
垢版 |
2021/11/14(日) 12:06:11.48ID:yLJ7E/ep0
AVX512ねぇ。512ビット制御たって。
そこらうろついてる汚い格好したおばちゃんがこぞって買うような物にはなんないと思うけど。

光速度測定であっちこっちで重力変異を測定出来るんならいいけど、ここらの測定はたいがいは何やってもムダ
分子微細系計測も難しい
数学研究でテイラー展開やらで精度上げて新しい成果が出るとも思えないし

うーん。光の指向性分散具合の計測ってわけにもいかんし
0124MACオタ (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 12:11:47.04ID:XItMWShS0
ウェハ丸ごと一枚使った AI プロセッサ "WSE" で名を挙げた Cerebras が時価総額4兆円企業に成り上がったとのコトす
https://www.anandtech.com/show/17061/cerebras-completes-series-f-funding-another-250m-for-4b-valuation
先日次世代品の “WSE-2” も発表して順調そのもの。
Jim Keller が CTO を務めるTenstorrent より投資家を集めたと言うのわ興味深いす
https://images.anandtech.com/doci/17061/AI%20PurePlay.png
0126Socket774 (アウウィフ FFa9-D258)
垢版 |
2021/11/14(日) 12:34:12.08ID:d2K9AXmlF
アクセラレーターへの移行って言ってもワンホップ増えるわけでしょ
データ移動にコストかけてる世界でそれ本当に性能出せるの?
0128MACオタ>125-127 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 13:05:21.91ID:XItMWShS0
>>125-127
ちょうど大原氏がこの辺の現状と動向についてまとめた記事があるす
https://www.itmedia.co.jp/news/spv/2011/25/news055_2.html
ーーー
ヘテロジニアス環境の理想で言えば、CPUとGPU、NPUその他が並列に並び、1つのメモリをCache CoherencyにUnified Accessできることが望ましいし、長期的には命令セットが共通化きれればより好ましい。
ーーー
Intel AMX わ正にコレを実現しているす
0130Socket774 (アウウィフ FFa9-D258)
垢版 |
2021/11/14(日) 13:22:19.47ID:d2K9AXmlF
それはワンホップ増やさないで済むようにアクセラレーターまで統合という構想だと思う。
PezyだってWarrior統合とかやってたのも同じ理由だろう。
0131Socket774 (ワッチョイ 1b58-bPZJ)
垢版 |
2021/11/14(日) 13:44:14.34ID:MlN7vwq20
そりゃ、メモリ空間が統合されていてデータの置き場所を意識しないでよく、かつ、どこに置かれていようと十分なレイテンシと帯域でデータにアクセスできるのなら、それは理想的なメモリシステムだわな
今のところそれに一番近いのはNVIDIAのUnified Memoryだが、とはいえPCIeの帯域で律速するわけで…
その辺の問題は、NVIDIAはGraceで解決しようとしてるし、PowerであればNVLinkを内部バスに取り込むことでボトルネックを軽減しようとしている
最近って言いながら十年前の記事を上げるなよ…
0132MACオタ>131 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 13:58:58.56ID:XItMWShS0
>>131
>最近って言いながら十年前の記事を上げるなよ…

未来から来られた方とわお見それしたす(笑)

ちなみに2021年時点で IBM わスーパーコンピュータ案件が取れなくなったのでアッサリ POWER10 から NVLink を削除したす。2030年11月の情報をご存知の様すからその後の展開を講釈して頂きたいモノす
IBM の言い訳わこちら
https://www.hardwareluxx.de/index.php/news/hardware/prozessoren/53864-ibm-power10-bietet-30-kerne-mit-smt8-pcie-5-0-und-ddr5.html
ーーー
IBM and NVIDIA initially partnered to develop NVLINK host-to-GPU attach technology to overcome performance bottlenecks caused by the insufficiency of PCIe Gen3 capabilities.
While this provided substantial differentiation relative to PCIe Gen3 and Gen4, the industry accelerated the pace of PCIe development. With the advent of PCIe Gen5, both IBM and NVIDIA determined that PCIe is once again sufficient for eliminating performance bottlenecks in host-to-GPU attach.
Therefore a proprietary solution such as NVLINK is no longer a strong differentiator for host-to-GPU attach, and the POWER10 processor will not exploit NVLINK for host-to-GPU attach.
ーーー
0133Socket774 (ブーイモ MM6b-fiLq)
垢版 |
2021/11/14(日) 14:12:07.31ID:DAPkPcIJM
coherency 維持するにもコストかかるからな。
ノード外まで coherenct なシステムも昔は存在したが滅びたわけで
規模が大きくなると諦めないといけなくなるぜ
0134Socket774 (アウウィフ FFa9-D258)
垢版 |
2021/11/14(日) 14:37:35.89ID:d2K9AXmlF
その手のをAMDがやるとしたらHPC向けAPUという事になるんだろうが
報道記事も2015年あたりでぱったりだなぁ
0135MACオタ>133 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 14:42:35.25ID:XItMWShS0
>>133
>規模が大きくなると諦めないといけなくなるぜ

POWER10 の話をしているなら IBM の目論見わ、その真逆す
https://www.nextplatform.com/2021/08/13/the-power-of-power10s-memory-inception-clustering/
ーーー
This 2 PB can be spread over the memory of multiple systems in IBM’s memory cluster, and all of it directly accessible from a Power10 core within any one of them.
ーーー
IBM 的にわデータ処理をアクセラレータで行い、サーバープロセッサわアクセラレータにメモリや IO 資源を提供するハブ化すると考えている模様す
0136MACオタ>134 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 14:54:37.20ID:XItMWShS0
>>134
>報道記事も2015年あたりでぱったりだなぁ

先日発表された HPC 向け MCM GPU もチップ間接続わ Zen のチップレット間インタコネクトと同じ Infinity Fabric す。
同 GPU と Zen 3 を採用したスーパーコンピュータ “Frontier” わ CPU-GPU 間インタコネクトにやはりメモリコヒーレンシをサポートしたInfinity Fabric を採用するとアナウンスされているす
https://www.hpe.com/us/en/newsroom/press-release/2019/05/cray-to-deliver-record-setting-frontier-supercomputer-at-ornl.html
ーーー
The new accelerator-centric compute blades will support a 4:1 GPU to CPU ratio with high speed AMD Infinity Fabric links and coherent memory between them within the node.
ーーー
0137Socket774 (アウウィフ FFa9-D258)
垢版 |
2021/11/14(日) 14:57:20.03ID:d2K9AXmlF
>>136
仰せはわかるが、APUにはならんよね
インターコネクト改善でレイテンシも削れるようにできてるんだろうけど、
まあ性能が出るかモノが出てきてから考えましょう、と。
0138MACオタ>137 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 15:04:19.41ID:XItMWShS0
>>137
>仰せはわかるが、APUにはならんよね

IBM 渡来の思想でオンダイのインタコネクトも Infinity Fabric なので一緒かと
https://pc.watch.impress.co.jp/docs/column/kaigai/1053318.html
ーーー
Infinity Fabricは、1つにはオンダイのインターコネクトの拡張だ。しかし、その一方でソケット間もサポートする。ソケットでは、CPUとCPUの間、CPUとGPUの間、CPUと他のアクセラレータの間をInfinity Fabricで接続する。
ーーー
0139Socket774 (アウウィフ FFa9-D258)
垢版 |
2021/11/14(日) 16:07:21.07ID:d2K9AXmlF
じゃあInfinity Fabricでレイテンシ極減して性能出るのに期待するとしよう。
PezyにせよEuroProcessorにせよアクセラレーター自体は流行っている。
個人的には富岳のような構成を支持するがそういう環境ばかりが正義ではないのは理解している。
0140MACオタ>139 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 16:23:26.94ID:XItMWShS0
>>139
>個人的には富岳のような構成を支持するがそういう環境ばかりが正義ではないのは理解している。

富岳の A64FX もノードあたりのメモリが 32GB しか無い段階で伝統的なサーバープロセッサと言うより、NIC を統合すればアクセラレータだけでスーパーコンピュータを作れる的な思想を感じるす。。。
0141MACオタ (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 16:26:55.47ID:XItMWShS0
ところでココって妙に SIMD 推しのヒト達が多い様に感じるすけど、現在一般的なアーキテクチャで最弱の SIMD である NEON 採用の Apple Silicon が良い性能を発揮しているのをどう見ているすか?
0143MACオタ>142 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 16:46:13.29ID:XItMWShS0
>>142
SIMD 演算ユニットの幅やら数やらサポートする数値型などわ単純にピーク性能に直結するマイクロアーキテクチャ上の問題なので、ISA の優劣とわ別かと
0146Socket774 (ワッチョイ a3c8-aH2J)
垢版 |
2021/11/14(日) 18:09:40.39ID:T6CBbs+F0
>>141
SIMDに関しては128bitの add/mul + fma * 3という演算器数に振った構成そのままの性能というイメージ。
AVX2は256bitと言ってもデスクトップ用途でリニアに性能2倍になるアプリなんてほぼ無いし
0147Socket774 (アウウィフ FFa9-D258)
垢版 |
2021/11/14(日) 18:59:16.11ID:d2K9AXmlF
>>146
エンコの話題でAVX2で1.4倍くらいになりました、ってベンチ見て
凄いと思う人としょぼいと思う人で意見割れてたな。
0148Socket774 (ワッチョイ 4576-ter9)
垢版 |
2021/11/14(日) 19:27:53.65ID:yLJ7E/ep0
ビットマップの拡大縮小命令(というかサブルーチン) とかどうだろwここの高速化回路検討w
ソースビットマップのアドレスとサイズ、拡大縮小率を指定すると出力先RAMにサイズ変更したビットマップを出力してくれるみたいなの。
問題は中間補正値をどうするかだけどこれも指定出来るように....

字が小さくてよく読めない俺向けw
windowsも拡大縮小率を指定出来るけどけっこー重くなるんだよな
ジジババおれうれしいw
0152Socket774 (ワッチョイ 4576-ter9)
垢版 |
2021/11/14(日) 20:42:17.60ID:yLJ7E/ep0
>>150
そうか!
GPUつきのノート買えば字が読みやすくなるのか!

そういやでっかいテレビ買えばいいだけじゃん。なんだぁ〜。
0154MACオタ>153 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 21:57:02.59ID:XItMWShS0
>>153
命令とレジスタ自体わ定義されてても元々 FPU わ別チップで割り込み経由で呼び出していたすから、そういう実装がありえるのわ否定しないす

性能低下が大きいので誰もやらないと思うすけど。。。
0157Socket774 (スッップ Sd43-iDG6)
垢版 |
2021/11/14(日) 22:25:48.87ID:OxLBdDUCd
普通に庶民が手に入る範囲だと10980XEが最強
1コアでAlderLakeのPコアの倍の性能、Eコアの4倍の性能
これが18コア
0162MACオタ>155-156 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 23:26:57.27ID:XItMWShS0
>>155
>私は小数計算をたくさんやるからSIMD推し

>>156
>NEONはうんこ
>機能的にはAVX512が強い

ところが SPECfp2017 でも Apple M1 シリーズが良い結果を出していると言う事実が。。。
https://images.anandtech.com/graphs/graph17047/117493.png
0163MACオタ (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/14(日) 23:50:07.27ID:XItMWShS0
Mediatek の ARMv9 SoC “Dimensity 2000” がAntutu Benchmark で 1,000,000 超えたという噂が話題す
Qualcomm の Snapdragon 888 で 858,734 程度なんだとか
https://www.digitaltrends.com/mobile/mediateks-upcoming-flagship-soc-appeared-antutu/
ーーー
According to unverified leaks, the Dimensity 2000 will allegedly feature a Cortex-X2 core at 3.0 GHz, three Cortex-A710 cores, and four A510, similar to Qualcomm’s Snapdragon 898.
ーーー
NEON → SVE2 で ARM は更なる進歩を実現するすかね?果たして正しい情報なのか腐れルーマーの類なのか。。。
0164Socket774 (ワッチョイ d5da-iDG6)
垢版 |
2021/11/14(日) 23:54:23.40ID:pSOqtrqk0
SkylakeX/CascadeLakeのコアの半分以下の性能
糞だよ

コンシューマー系intelはHaswellから性能があがってないからねえ
なんとかしてほしいねえ
AVX512搭載のRocketLakeですら本来の半分の性能だし
0166Socket774 (ワッチョイ e57e-dCeX)
垢版 |
2021/11/15(月) 00:15:58.64ID:5xdC8x9N0
何を測ってるのか不明なウンコベンチをさらに全部足し合わせてしまう総合スコアでは何もわからんな
0167MACオタ>165 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/15(月) 00:28:20.54ID:zVsSKx9Q0
>>165
>[i9-]10980XEが今時点では最強

コレ、SPECint2017 と SPECfp2017 合わせて幾何平均を取った結果なので直接比較わできないすけど、それほど輝かしい結果にわ見えないす
https://images.anandtech.com/graphs/graph15785/116118.png
0169Socket774 (アウウィフ FFa9-D258)
垢版 |
2021/11/15(月) 00:32:46.71ID:xm8PFLQUF
SVE2は性能出るか出ないか言うなら、NEONより向上するかというのを考えたい。
いや、特に論拠を持ってるわけじゃないけど。
0171MACオタ>170 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/15(月) 03:19:31.73ID:zVsSKx9Q0
>>170
コア性能の比較ということで。
一応1スレッドで SPECfp2017 を測定した結果すから、turbo boost も込みす。
0172Socket774 (ワッチョイ 2b81-09aj)
垢版 |
2021/11/15(月) 03:26:33.22ID:ke2lnjB50
>>171 最初から>>157氏は>>157のように書いてるんだし(10980XEはAVX512が36基)、そんな話は不要でしょ。
それより、そういう前提で>>159の下記に何か言える人は言ってあげればいいんじゃない。
>なんか良い点思いつく?
0174Socket774 (ワッチョイ a3c8-aH2J)
垢版 |
2021/11/15(月) 06:48:46.49ID:wCkMfqh90
そりゃ倍精度演算繰り返すような処理のピーク性能では10980EXの方が高いでしょ。MACヲタはSPECfpで計測に使われてるソフト見てない疑惑。
個人的にはさらに高性能な3970Xや3990Xだって庶民に買えるじゃんとは思うけど。
0176Socket774 (ワッチョイ 2b81-09aj)
垢版 |
2021/11/15(月) 06:56:09.26ID:ke2lnjB50
>>174 3970X以上だとAVX512固有の機能が使えず、fp性能が同等クラスの3970Xでも価格が倍近くだから>>157氏の選択肢に入らないってことかと思った。
あと、3980X/3990Xとかだとコア性能は高くても計算内容によってはメモリ4chしかないのがネックになるかも。
0178MACオタ>174 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/15(月) 07:24:43.60ID:zVsSKx9Q0
>>174
>MACヲタはSPECfpで計測に使われてるソフト見てない疑惑。

伝統的に SPECfp わオープンソースの科学技術計算用ソフトで構成されるていたす。>>168 のリストにある通り2017年版わマルチメディア系ソフトも増えて、
- 511.povray_r
- 526.blender_r
- 538.imagick_r
あたりが単精度浮動小数点性能が効くすけど、残りの10個のサブベンチわ主として倍精度性能を求められるかと。
0180MACオタ@補足 (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/15(月) 07:36:54.68ID:zVsSKx9Q0
>>178 の補足す
もっとも SPECfp わ SPEC95 の頃から『メモリ速けりゃ全部OK』的な傾向わあったすから、Apple M1 シリーズの好成績わソレが理由という可能性も考えられるす

Anandtech.com わベンチ結果のページ (http://www.anandtech.com/Bench)で自前で行った SPEC CPU のサブベンチの個別結果も公開しているすから、興味のある方わ i9-10980XE とM1 を比較して特徴を抽出できるす
0181Socket774 (ワッチョイ a3c8-aH2J)
垢版 |
2021/11/15(月) 07:45:31.23ID:wCkMfqh90
>>178
SIMDのピーク性能を測るようなベンチでは無いよねという話。まぁ当の157が出てこないし、なんでも良いんだけどさ
0182MACオタ>172 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/15(月) 07:54:35.50ID:zVsSKx9Q0
>>172
>そんな話は不要でしょ。

コア性能が高いと語っている様な。。。
>>157
>1コアでAlderLakeのPコアの倍の性能、Eコアの4倍の性能
0183Socket774 (ワッチョイ 1b58-bPZJ)
垢版 |
2021/11/15(月) 07:54:42.81ID:NR3TTRoN0
まーたこの知恵遅れはネットにある情報をつなぎ合わせてオナニーしてるよ…キモすぎ…
0185MACオタ>181 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/15(月) 08:00:13.56ID:zVsSKx9Q0
>>181
>SIMDのピーク性能を測るようなベンチでは無い

>>157 に書いてある主張わ上で書いた通りかと

アプリベースのベンチで SIMD のピーク性能が測れないと言うことわSIMD の有用性そのものが疑われるすけど、そう言うコトが言いたいすか?
Intrinsic 必須という意見わあるかと思うす
0186Socket774 (ワッチョイ 2b81-09aj)
垢版 |
2021/11/15(月) 08:08:27.74ID:ke2lnjB50
>>185 >>157氏は自分で書いたプログラムを実行しているようなので、その内容も詳しく聞かず話を進めることに意味はないでしょ。
既に書いてある内容からすると、AVX512気に入ってて、SIMD使用率が高いので、価格含めてそういう選択したのかな?
って感じじゃない。特に現段階であーだこーだ言う話ではない。
0187MACオタ>184 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/15(月) 08:08:43.60ID:zVsSKx9Q0
>>184
>>>170でもそれを指摘済み。

そこに拘るのわ自由すけど、複数のプロセッサを比較するなら条件を揃えるのが科学的態度す。

anandtech.com でわ n-way の SPECfp rate の計測も行なっているすけど、ココであえて 1-T の結果で比較しているのわマイクロアーキテクチャ的要素を比較する目的す
0188Socket774 (ワッチョイ 2b81-09aj)
垢版 |
2021/11/15(月) 08:39:58.92ID:ke2lnjB50
ちなみに、Linpackなら10980XE定格(PL1 165W、PL2はXeon系なので1.2倍か?)で1000GFlops近く出そう。
前にこの辺りに書いたけど、うちの7980XEでPL1=PL2=165Wで、メモリとメッシュOCしてて1030GFlopsとか。
OCすれば1200〜1300GFlopsくらいは比較的容易。全力(実用性なし)で1700GFlops。
Alder 8+8定格(爆熱)は700GFlopsくらいだっけ。
CGレンダリングの定格比較だとCHINEBENCHなんかはAlder 8+8の方が圧倒的に速いね。
0189Powerスキヤキ (ワッチョイ ed58-qaXb)
垢版 |
2021/11/15(月) 15:34:39.47ID:Jcpo4tCe0
POWER9で自作してるか、自作したいって人、日本におるんかいな。
0192Socket774 (ワッチョイ d558-09aj)
垢版 |
2021/11/15(月) 18:54:56.57ID:73S5fnju0
>>189
例のアメリカで売ってるBTOキット
個人輸入してるのもいるかな?
50万ぐらいするけど
0194Socket774 (ワッチョイ 23f3-7Kr9)
垢版 |
2021/11/16(火) 03:03:05.77ID:pzuzG95L0
SPEC fp って少なくとも昔は単精度、倍精度入り交じりで参考にし辛かったから
追いかけてないんだけど、今でも入り交じりなのかね
0196MACオタ>195 さん (ワッチョイ 2df5-ryRh)
垢版 |
2021/11/16(火) 08:12:40.51ID:jzy4FEyJ0
>>195
TOP500 Nov.2021 版わこちら
https://www.top500.org/lists/top500/2021/11/
top10 が変わり映えしないので面白みが無いすけど、11位以下にわ “Zen3” EPYC や “Ice Lake” Xeon の構成がチラホラと。。。

中国わ完全にステルスモードに入った感じす。
あと、それなりに海外にも売れていると聞く A64FX のシステムわ、まだ国内案件ばかりす
0197Socket774 (ワッチョイ d558-09aj)
垢版 |
2021/11/16(火) 10:30:39.62ID:Y+fwX0xx0
まだ調整不足かGreen500での数値はパッとしないけど
スキャンダル以降開発の継続が危ぶまれていたPEZY-SC3リリースできたんだな…
0198Socket774 (ワッチョイ d558-09aj)
垢版 |
2021/11/16(火) 11:51:44.69ID:O4fF+J3y0
SpecCPUでの結果は、同世代/同コア数/動作周波数が近い
x86と同等以上なのに、アプリケーションベンチ。特にマルチメディア系
だと大敗するPower9
0200Socket774 (アウウィフ FFa9-D258)
垢版 |
2021/11/16(火) 13:11:37.17ID:3AN0WrcmF
>>199
自作できないアーキなんて何度も出てきているので
たまにそういうツッコミ入れてもらうのは構わないが、半ば諦めるくらいに構えておけ。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況