Superπベンチスレ 29回目のループ [転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
Superπさえ速ければ、あとは何も要らない
そう考えていた時代は過去のものとなり、既に5年もの間IPCに変化無し
このスレはIPCに変化が無い事を確認する為のリマインダーです
もしくはSkylakeに失望しAMD Zenの妄想に浸る為でもあります
●スーパーπはこちらから
ttp://www.vector.co.jp/soft/win95/edu/se022882.html
※結果報告用には、↑のver.1.1を使用してください。
●super_pi_mod に付いて
英語版は1/1000秒まで測定しますが、HPETの正しい知識が必要で
_秒単位で正確に計測し比較する事は事実上不可です
●前スレ
Superπベンチスレ 28回目のループ
ttp://potato.2ch.net/test/read.cgi/jisaku/1447911585/
※28回目はカキコミが有った数時間後に何故か落とされました
●報告用テンプレ
【 CPU 】
【 Mem 】
【 M/B 】
【 HDD 】
【 O S 】
【 104万桁】
【 419万桁】
【1677万桁】
【3355万桁】 AMDとintelと言えば、ほぼ同時期、あるいは同価格帯など
性能が近い、あるいは価格で勝負してどちらが性能が良いか?
って比較があったけど、仮に同等とされるCPUであっても
何かとAMDの方はTDP、発熱や消費電力が高い結果だったからな・・・
エンコードになると、もうintel択一 エンコならAMDちゃうの?
コア多い方が有利な場合が多いやん うん、だからAMDは消費電力と発熱がね・・・
いくらCPUの価格が安くても、電気代で高くつくってオチがある RYZENは消費電力と発熱もIntelの同じクラスより低いよ
速度も速いから、エンコ時間も短い
だから電気代も安く済む スーパーπが遅いってのは何処がネックなんだろ
純粋にシングルスレッド性能がゴミなだけなんだろうか >>139
そういう物理法則無視したこというからアホ扱いされるんだよ。 スーパーπはx87命令速度を図るベンチだけど
AVX2効きまくるy-cruncherの方だとRyzenのコアあたり処理速度は
現行インテルの半分ちょっとくらいしかないな
http://potato.2ch.net/test/read.cgi/jisaku/1435886327/242
y-cruncherはマルチスレッド効きまくるからコア数2倍のお陰で
かろうじてSkylake4コアと同等くらいになってるが >>142
同じfloatの計算でもx87命令と新設されたダイレクトな命令があるって聞いたことがあるけど、
AMDはダイレクトな命令に対応しているにもかかわらず無条件でx87命令を実行しているとかあり得る希ガス >>136
何が同等なのかが分からん。
エンコで使うならエンコソフトで評価した上で消費電力を比較しないと意味ないぞ。
たとえば20%消費電力大きくても20%早く完了したら同じだろ。 >>143
いまのCPUだとインテルもAMDも関係ないよ、
AVX SSE等でやるほうがはるかに早いのに古い命令を酷使しても
別の内部命令に変換されるだけ。
そしてx87命令だけの性能ならこういう結果にはならんインテルCPUでも
遅いケースはある。
x87命令ではなくレイテンシーが重要になるベンチマークな。
高性能の拡張命令の競争ならゲームやらエンコードやればいい。
古い円周率アルゴリズムは浮動小数点演算より足回りが重要になる、末尾だけを
計算するタイプじゃなくて全体の桁をすべて計算しなおす重いアルゴリズム、
つまりターボー車のような性能ではなく軽量車体の高リッター車のような
単なる加速性能といえるもの。ポルシェが400mの距離を競うようなタイプな。 正直レイテンシなんて変わらんのですよ。スループット性能が重要なんですよ。
エロい人にはそれが分からんのです。
Kaby Lake-S
MOV r32, imm32 L: 0.06ns= 0.3c T: 0.06ns= 0.25c
MOV r64, imm64 L: 0.24ns= 1.0c T: 0.15ns= 0.64c
MOV r32, r32 L: 0.24ns= 1.0c T: 0.06ns= 0.25c
MOV r64, r64 L: 0.24ns= 1.0c T: 0.08ns= 0.32c
ADD r32, r32 L: 0.24ns= 1.0c T: 0.06ns= 0.25c
ADD r64, r64 L: 0.24ns= 1.0c T: 0.07ns= 0.31c
Summit Ridge
MOV r32, imm32 L: 0.10ns= 0.3c T: 0.10ns= 0.32c
MOV r64, imm64 L: 0.32ns= 1.0c T: 0.32ns= 1.00c
MOV r32, r32 L: 0.32ns= 1.0c T: 0.08ns= 0.24c
MOV r64, r64 L: 0.32ns= 1.0c T: 0.08ns= 0.25c
ADD r32, r32 L: 0.32ns= 1.0c T: 0.14ns= 0.45c
ADD r64, r64 L: 0.32ns= 1.0c T: 0.13ns= 0.40c 実アプリでは影響がないため両者ともずっと放置されてる領域の命令、かつ、今となってはキャッシュに丸々治まってしまうサイズなので、キャッシュベンチ
エンコードはグラボにブン投げたほうがCPUより速いから、10%や20%処理速度が向上しても・・・というジレンマ GPUエンコなんて汚くて見れたもんじゃねーよ
適当な事言ってんなアホが 同一ビットレートで比較したらだろ、量子化15とかにして盛れば良いだけ
つべに上げても強制再エンコードだし用途によるわ GPUエンコって、あれはどちらかというとデコードで活きる機能であって
エンコでは、キャプの時に無圧縮だとHDDを圧迫するとか
書き込み速度の問題で、一時的に適当な形式にするのに使う程度
最終的には、画質とファイルサイズを適当に決めて
ソフトウェアエンコにするわ >>146
両者ともに得意、不得意な処理があるし
発売時期や価格なども考慮すると
同等なものなんて存在しないから
例えば特定の処理に於いて
ほぼ同等の処理能力を持ったCPU同士で比較するとか
色々とベンチマークはあったけど
AMDはCPUの価格がintelのより安くても
TDPと発熱が高いという結果が過去にあったんだが
今まで君は何を見て選んで来たんだね? >Intelの方が命令デコード帯域が広く、浮動小数点演算ユニット(FPU)の規模は倍という違いがある@後藤記事
シングルコアのπはインテルの倍時間がかかってもおかしくない
そして予想通りに最適化未完成のH265エンコはマルチコアでコア半分の7700Kと互角
上記のことから、双方設計どおりの性能を発揮してると言えるんじゃないか? 3355万桁で5分切るのももうすぐだな。
2050年位までには1分切れるかな? 「HITAC S-3800/480 で πの100万桁の計算は5秒でできます。」
定格だと20年以上のスパコンにはまだ追いつけてないのね
6GHzくらいにならんと無理か 古典プログラムで計算して8秒くらいってだけで、拡張命令使えばコンマ数秒やろ。 並列演算okならCPU内臓のGPGPU使える。数百G〜1TFLOPS近いだろう。 >>160
スパコンは専用のコンパイラ使って最適化させて実行するから、
公平な比較するためには拡張命令を活用してコンパイルしたバイナリが必要だよ
y-cruncherとかいうやつみたいに。
Athlon64あたりの世代ですでに百万桁一秒未満だったはず? 2000年って…Pentium3 700MHzくらいがメジャーだった頃?
それから比べれば今のCPUスペックやばいよな… 2000年ごろのスパコンでは、どれぐらいの速度だったっけ? >>167
2000年スパコンは7Tフロップス、6950Xが480Gフロップスです。 GTX 1080 TiSLIなら10年前の平均的なスパコンぐらいありそう。 そら1と0しか分からんアホだもん。
超速度で計算出来るだけ。 並列処理が基本のスパコンにシングルスッドレのsuperπ走らせたの? あの頃のスパコンは、CPUが4個くらいだったみたいよ
まあ、それでも並列だけど。
スパコン用はマルチCPU用のプログラムだったけど、
PC用はシングルCPU(シングルスレッド)しか存在してなかったから
それ用にコンパイルしたんじゃないの? そもそもスパコンはベクトル演算ユニットが常備されてて、
それを使って演算するのが基本だよ
つまり、SIMDとかGPGPUを駆使しないとスパコンとの公平な比較にはならないんだ
その辺の比較は別スレがあるので、そちらで比べてくるように
ここはSIMDもGPGPUもなしの条件でPC用のCPUのみを比較するスレだ スパコンとの比較をしたいなら、とりあえず
【パイ焼き】y-cruncherベンチスレ【1億桁】 [転載禁止]©2ch.net
http://potato.2ch.net/test/read.cgi/jisaku/1435886327/
にでも行け >>178
SuperπのアルゴリズムならスパコンよりPCのほうが早い
スパコンは並列プロセッサ用のアルゴリズム使うだろうから一瞬で計算可能だ。
このスレのSuperπは円周率の計算速度を出す目的じゃないことぐらい理解できない池沼には
理解できないんだろうけど。
古い効率の悪いシングルスレッド用の性能評価ができるという点でいままで支持された
ベンチマークであってその計算した円周率なんてどうでもいい話さ。 >>172
0と1を大量に、しかも正確に記憶し、高速に読み出せるコンピューターは
どう考えても超賢いと思う つか、このベンチがウィンドウズ専用だからスパコンでは動かないよな
同一条件になるように再コンパイルするとして、
SIMD使用禁止とかマルチスレッド禁止とかやっていくと、
スパコンの利点がほとんど使えないんだよな >>187
まだベクトル演算(SIMD)のみでスパコンがもつ行列演算はXeonPhiしか実装していない。
行列演算で評価されないならXeonPhiの価値はないけどね。
SuperPiのそれは演算速度ではなくメモリの足回りの応答性のベンチマークで
あっても浮動小数点機能などの計算速度を計るものではないね。
誰かが移植してx86命令(32bit)をもつスパコンで動かすことができたとしても、
動作周波数が低いスパコンでは低速でしか動かないのは明白。
スパコンはメモリ周りの帯域はあっても、動作周波数が低いから応答速度も遅くなる。
この応答速度は古典的CPUのエミュレータなどがどれだけ早く動くかって指標になる、
コンパイラタイプのエミュレーションが不可能な古典的CPU(キャッシュなしタイプ)では
コード領域とデータ領域が共通なので自己命令語書き換えみたいな動的な作りを
静的(コンパイル)にコード変換できない。 ペン4の時のような、メモリアクセスは速くなったのにパイは遅いシステムもあるのだから、
メモリ速度だけではないのは確かだな
同じメモリ使うランクのAthlon64より倍以上遅かっただろ?
それらと比べてメモリアクセスが大して速くないペンMとかがパイ速かったしな
もっとも、パイのドキュメントにある当時型PCの演算時間については、
ほぼメモリ速度の遅さによるってのも確かだ
なんせメモリ容量が足りなくて仮想メモリにスワップアウトされてるからな
処理時間の大半が仮想メモリ、HDDリードライト時間だ >>189
メモリだけじゃないよ、キャッシュ性能が重要な。
>Athlon64より倍以上遅かっただろ?
サンドラのキャッシュ性能のベンチマークでは常にintelのほうがAMDより倍は
早い現実があった。 そういうことを言ったんじゃなくてな
Sandraとか各種ベンチでメモリアクセスが圧倒的に速いはずのペン4が
πベンチではAthlon64より大幅に遅かったことからもわかるように
πはメモリベンチじゃない、FPU性能を筆頭にいろんな部分の合計性能だといいたくて
誰ぞの言った、FPU性能なんか関係ないメモリベンチだ、という主張に反対したかったんだ >>191
ヒント Pentium4はキャッシュメモリは早いがDRAMはAthlonと同じ程度
それはDOS的なキャッシュに入りきるアプリだけが早いってことな。 Pen4はストールしたときに急激に遅くなるんだよ。 >>192
SDDRAMとかRAMBUSの主メモリだったよな、あれじゃ早いわけ無い。
Pen3が早くブーストしたのはメモリが2ch同時で認識したときだけ。
あの時代はキャッシュ内は早いが外れれば激遅でキャッシュサイズで
ベンチマークが動くかどうかって話だったよな。
いまでもそうだけど2枚同時に同じメモリ刺さない馬鹿っていないよね?
あれって1枚でもOS起動可能だから、遅いだけ。
メモリchが増えると、さらに4枚同時刺ししないと性能がでないとかある。
Core i7の初代は例外的に3枚同時刺しのへんてこ仕様 DDR-SDRAMの2枚ざしとか末期にはDDR22枚ざしとかあったプレスコペン4がAthlon64に惨敗だったことを説明できてない
やっぱりどう考えてもFPU性能の影響が小さくないよ 一瞬DDR二十二枚挿し!?に見えてぎょっとした
さぞ壮観だろうなぁ Pentium4末期の104万桁と現在の419万桁が互角ぐらいか。 i7-8700KのPassmarkシングルスレッド性能かなり凄いので
このベンチもかなり期待できそうだな、 オンダイキャッシュ付きのk6-IIIとキャッシュ無しのk6-2でかなり速度に差があるから
ボトルネックはDDRの速度だろうな >>203
もう完全に死に体なこんな過疎スレに来る方が珍しいだろ。
なので買って報告よろ。 マジ卍ぃぃぃぃぃぃぃぃぃぃ!!
m9 三 9m
彡 〆 ⌒ ヽ ミ
m9 (`・ω・´) 9m
ヾヽ\ y ) 彡
m9/三 9m
∪ ̄ ̄ ̄\) Super PI Mod 1.9WP
7700k 8.11
6700k 8.765
4770k 9.265
6950X 10.546
1700X 11.047
AMD Ryzen 7 1700X review leaks out | VideoCardz.com
https://videocardz.com/66684/amd-ryzen-7-1700x-review-leaks-out
https://cdn.videocardz.com/1/2017/03/33-Super-PI-1M.png
思ったよりは検討しているな 健闘ってか、めっちゃ苦手そう。
※Sandy-E@3.5GHzで11秒弱。CINEBENCHなら1800X定格で
Sandy-E@4.6Ghzくらいのコア性能あるのにね。 自力のあるIntel CPUと道具を使うのが得意な現代っ子AMD CPUってイメージ? PenG4560(定格3.5GHz 7280円)ぐらいだな ZenはIPC上げるの頑張ったけど、まだ捨ててる所も色々あるってことかね。
CINEBENCHで1800X定格(シングルの方が動作クロック高い)がSandy-E@4.6GHz
(シングルもマルチも4.6GHz)くらいってのも、ZenはCINEBENCHでもシングルは
得意じゃないってことだね。
※3960X@4.7GHzで165/1242cb。
165cb*(4.6GHz/4.7GHz)=161cb
1242cb*(4.6GHz/4.7GHz)*(8C/6C)=1620cb
IntelのCINEBENCHのシングル/マルチ同クロック時のMP Ratioは
Sandyの頃からそんな極端に変わってないよね。 >>1
【 CPU 】PentiumG4600 3.6GHz
【 Mem 】DDR4 2400 8GB×2
【 M/B 】ASRock B250M Pro4
【 HDD 】
【 O S 】Ubuntu16.04(wine)
【 104万桁】10s
【 419万桁】52s 【 CPU 】 Core-i9 7980XE@4.2GHz
【 Mem 】 DDR4-3600 8GBx8
【 M/B 】 ASUS RAMPAGE VI EXTREME
【 SDD 】 Intel Optane SSD 900P SSDPED1D280GASX (280GB)
【 O S 】 Win 10 Pro 64 (1709)
【 104万桁】 8s(PI mod 1.5で8.5sちょい)
【3355万桁】 7m 32s
Sky-Xはまだないようなので。 >>216
その環境で8GBx1で3355万桁をやってもらいたい、できれば104万桁も。 >>218 面倒なので、その気になったら。
理論的にはどうだろうね?シングルスレッドの場合、あまり関係ないかな。
※RAMディスクに対してベンチ実行してもマルチchの効果がなく、ベンチ
ソフトを同時複数実行した場合だけ効果がみられるようなことから。
※Sky-Xの中では、一番L3容量が大きいのはこのベンチでは多少有利かね。 >>219
メモリの容量や速度がどれだけ影響するのか知りたいだけです。
速度しか影響しないならそれほど遅くならず、容量が影響すると結構差ができるのかと予想する。 >>220 Super πの3355万桁の使用メモリは、実行時に268435496バイト
(256MBくらい)って表示されるね。古いプログラム(昔のPC環境を想定)
なので大した量は必要としないので、今時のPCなら十分。余計にメモリ
があっても速くはならないよ。3355万桁はメモリの速度はちょっと効く。 >>220 ちなみに、下記のスレでやってるy-cruncherというマルチスレッドの
π等の計算ソフトでは、非常に大きい桁数の場合にメモリが足りない場合
にはHDDやSSDも使って補うようになっている。この場合は、ある桁数の
場合にメモリが十分でHDD/SDD不要な人は速く、メモリが足りずHDD/SDD
を併用する必要がある人は極端に遅くなるというのはあるね。
https://egg.5ch.net/test/read.cgi/jisaku/1435886327/
※このスレでは、今時のPCなら誰でも可能な1億桁(メモリを1GBも使わない)
のベンチをメインにしてる。 >>222
勉強になります、どうやら私の知識はかなり昔で止まっていたようだ。 i7 7700Kです。数か月前までは104万桁が8秒だったのですが i7 7700Kです。数か月前までは104万桁が8秒だったのですが
最近測ったら18秒になりました。
環境に変化はありません。
体感的には遅くはなっていませんが、何が原因でしょうか? スピードが半分以下ってのは、かなりのダウンだな
可能性が高そうなのはたぶん、省電力モードじゃないか?
ベンチ回ってるのに低負荷と判断されてくロック落ちてるとか? >>227
ありがとう。
どこを確認したらいいの? >>228
CPU-Zなんかでベンチ中の周波数を確認したら? CPUのヒートシンクが浮いてるとかで保護機能が作動したか
他に可能性が高くてわかりやすいのは電源が終わりかかっている場合
マザーボードのトラブルだと簡単には絞り込めない >>229さん
>>230さん
ありがとう。
確認してみます。<(_ _)> 【 CPU 】 Core-i9 7900X@5.2GHz(all core)
【 Mem 】 DDR4-4000 8GBx4
【 M/B 】 ASUS RAMPAGE VI Apex
【 SDD 】 Samsung 960 Evo
【 O S 】 Win 10 Pro 64 (1709)
【 104万桁】 6.895s
【3355万桁】 6m2.667s
http://fast-uploader.com/file/7067105753305/
OCしてなんぼのCPUなんで。 >>225
スーパーπで8が18にするにはどうすればいいか考えると、
1つだけある、CPUの冷却能力が恐ろしく下がった
確認する方法は1つ、CPUのコア温度計ソフトで計測中の温度を確認 1M桁は6C化でL3が大きくなって全部L3に載るとかで多少効果あるか? ■ このスレッドは過去ログ倉庫に格納されています