X



【パイ焼き】y-cruncherベンチスレ【1億桁】 [転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0001Socket774
垢版 |
2015/07/03(金) 10:18:47.97ID:rJCPvkgz
ば、ばっかじゃないの、し、シングルスレッド性能がどうしたっていうのよ
わ、y-cruncherさえ速ければ、あとは何も要らないんだから
あ、あんたの、そ、その・・・全部言わせる気?

●y-cruncherはこちらから
ttp://www.numberworld.org/y-cruncher/

●報告は1億桁で
実行手順
1)DLした圧縮ファイルを解凍し y-cruncher.exe を実行
2) 0 [Enter]
3) 1 [Enter]
4) 3 [Enter]

●1億桁のLastDigitsが↓と一致していればどのバージョンでも構いません
9948682556 3967530560 3352869667 7734610718 4471868529 : 99,999,950
7572203175 2074898161 1683139375 1497058112 0187751592 : 100,000,000
                               ↑この部分↑

※SSE3に対応していない古いPCはv.0.6.1以前のバージョンを御使い下さい
http://www.numberworld.org/y-cruncher/versions.html

●報告用テンプレ (解説は>>2

【   CPU  】
【   Mem   】
【   M/B   】
【   O S   】
【  Ver.  】

【HypThread】ON/OFF/無し
【Total Time】seconds
【CPU Utiliz 】%
【Efficiency 】%
0441Socket774
垢版 |
2019/08/13(火) 14:58:53.28ID:zFvNs7K+
エクストリームオナニー
0442イ403
垢版 |
2019/08/13(火) 16:21:22.94ID:OfibAAAj
DownClock & SpreadSpectrum + ECC設定強化で長時間向けの耐久性を強化
管理者権限実行にして、実行優先順位を 通常以下(デフォ) → 通常 に昇格

【   CPU  】 Xeon GOLD 6140 定格 36C/36T AVX512@2.08〜2.1GHz (DownClock & SpreadSpectrum)
【   Mem   】 Micron DDR4-2933 ECC Registerd 16GB 6ch x 2Sockets
【   M/B   】 ASUS WS C621E SAGE (BIOS 5503)
【  SSD  】 Intel Optane 900P 280GB x4
【   O S   】 Windows 10 Enterprise LTSC 2019
【  Ver.  】 v0.7.7 Build 9501
【HypThread】 OFF

■1億桁 (16-KNL) <1憶桁のみPhi用バイナリの方が若干早かった
Total Computation Time: 1.353 seconds
Start-to-End Wall Time: 2.039 seconds
CPU Utilization: 3355.66 % + 155.94 % kernel overhead
Multi-core Efficiency: 93.21 % + 4.33 % kernel overhead

■10億桁 (17-SKX ~ Kotori)
Total Computation Time: 16.565 seconds
Start-to-End Wall Time: 21.744 seconds
CPU Utilization: 3322.04 % + 2.74 % kernel overhead
Multi-core Efficiency: 92.28 % + 0.08 % kernel overhead

■100億桁 (17-SKX ~ Kotori)
Total Computation Time: 217.702 seconds
Start-to-End Wall Time: 280.448 seconds
CPU Utilization: 3432.03 % + 2.35 % kernel overhead
Multi-core Efficiency: 95.33 % + 0.07 % kernel overhead

>>440 には計算時間では勝りましたがトータルで負けてますねOrz。
Start to End に時間が掛かっているのは経過時間の多くを占めるメモリ確保がシングルスレッド〜2スレッドくらいなので低クロック多コアの傾向かと思われます
0443Socket774
垢版 |
2019/08/13(火) 16:28:01.88ID:OfibAAAj
ダウンクロックしたのにコピペ元のまま@定格とか残したままだし、403がアルペシオの影響で誤変換してるし、色々アレな感じに・・・
0444Socket774
垢版 |
2019/08/13(火) 20:24:48.10ID:OfibAAAj
構成は >>442 と同じです

■1千億桁 (17-SKX ~ Kotori)
Total Computation Time: 7652.056 seconds ( 2.126 hours )
Start-to-End Wall Time: 7846.747 seconds ( 2.180 hours )
CPU Utilization: 1406.92 % + 12.25 % kernel overhead
Multi-core Efficiency: 39.08 % + 0.34 % kernel overhead

前半はCPU負荷 90% 以上が長く続きますが、後半はCPU負荷が 4〜9% でディスクアクセスが 90% くらいの状態が続く感じでした
0445Socket774
垢版 |
2019/08/14(水) 11:03:30.16ID:4xzMImpj
>>442 メモリの割り当ては、NUMAでソケット間のレイテンシが大きいのも影響してるかな。
実行時に赤字で表示される注意事項の件を設定(メモリ内のページのロックを許可する設定をして
ラージページ使用可の状態で実行)したら多少速くなるかな?
0446442
垢版 |
2019/08/14(水) 21:53:19.84ID:GDSeVzQY
>>445
ラージページの件は1千億桁向けに対応したのですが、設定変更が面倒なので比較はしてません

仮にレイテンシが影響しているとするなら NUMA よりも ECC Registerd の方で
19-19-19-43-467 ですが、この場合、レイテンシより帯域では?

NUMA NODE 間の UPI 帯域は片側最大 20.8GB/s × 3本なので DDR4-2666 3ch 相当です
0447Socket774
垢版 |
2019/08/15(木) 06:09:06.58ID:N6fvLAeD
i9 7980XE の人も 1000億桁やるべきだな
0448Socket774
垢版 |
2019/08/15(木) 10:59:52.05ID:DpaPy57m
>>447 >>444のSkylake-SP Dualの人はメモリ192GB + Optane 900P 280GBx4(ページファイル)でやったって
ことのようだけど、>>440 の7980XEはメモリ64GB + Optane 900P 280GBx1だから480GB必要な1000億桁は無理。
NAND NVMe 1TBとSATA 480GBのSSDも積んでるけど多分遅すぎ。

>>401-402のW-3175Xの方はメモリ96GB + Optane 905P 960GBx1だから容量は足りるけど、Optane 1個だ時間掛かりそうだね。
0449Socket774
垢版 |
2019/08/15(木) 12:24:38.82ID:DpaPy57m
試しにW-3175の方でSwapモードで1000億桁スタートしてみた。
SwapモードのI/O(Summingステージ)はパフォーマンスモニタで見ると50MB単位くらいのようなので、
シーケンシャル速くて速度落ちないSSDなら何でもよさそう。
0450Socket774
垢版 |
2019/08/15(木) 15:44:43.74ID:DpaPy57m
>>401-402 のW-3175Xで1000億桁(ストレージを使ったSwap mode)。

【   CPU  】 Xeon W-3175X@4.7GHz(10C)〜4.3GHz(28C), AVX/AVX512 offset: 4/7
【   Mem   】 G.Skill F4-4266C17Q-32GTZR (3セット:8GBx12) DDR4-4000 16-17-16-31-290-2T
【   M/B   】 ASUS ROG Dominus Extreme
【  SSD  】 Intel Optane SSD 905P 960GB (HHHL) x1
【   O S   】 Win 10 Pro 64
【  Ver.  】 v0.7.7 Build 9500 (17-SKX ~ Kotori)
【HypThread】 ON

■1000億桁(Swap mode)
Total Computation Time: 11249.010 seconds ( 3.125 hours )
Start-to-End Wall Time: 12206.958 seconds ( 3.391 hours )
CPU Utilization: 1142.59 % + 5.55 % kernel overhead
Multi-core Efficiency: 20.40 % + 0.10 % kernel overhead

https://i.imgur.com/X4V6zCn.png

CPUやメモリの性能は率としてはそれほど効かないので緩い設定(メモリは安定した2Tの設定)。
>>444氏の結果から8〜9時間くらい掛かるかと思ったけど、意外に早く終わった。
速いストレージを幾つか使えば、メインストリームでももっといいタイム出せそう。
0451Socket774
垢版 |
2019/08/15(木) 20:32:10.06ID:N6fvLAeD
リサスーの言う Cascade Lake の2倍の性能は y-cruncher でも証明(残念ながら3倍の性能ではない)

本家サイトに先ほど EPYC 7742 の結果が掲載されてた
Zen2最適化後なら更に差が拡大する予感

同表で現時点1000億桁最速はメモリ 2TB 搭載 Haswell-EX 機の 4,442秒 = 1時間14分
EPYC 7742 で Zen2 最適化後なら 1000億桁が 20分程度になると予想
0452Socket774
垢版 |
2019/08/15(木) 21:54:41.32ID:DpaPy57m
>>451 EPYC 7742 Dual(64Cx2)はうちの>>401-402とメモリ上で出来る範囲だとそんなに違わないね。
Cascade Lake-APの56C DualならEPYC 7742 Dualといい勝負しそう。
Cascade Lake-APって売れのか怪しいけど。

8180M Dualの4%OC(>>403氏と同じM/BでメモリはOCじゃないよう)が>>401-402より少し遅いくらい。
https://hwbot.org/submission/3856433_h2o_vs_ln2_y_cruncher___pi_10b_2x_xeon_platinum_8180m_2min_54sec_831ms
0453Socket774
垢版 |
2019/08/22(木) 23:57:41.22ID:+1hJyopA
W-3175Xでメモリch数を変えて測定。
CPUは28C/56Tで緩めの設定。メモリは10億桁まで動く程度でy-cがこの環境で一番速い設定。

【   CPU  】 Xeon W-3175X@4.7GHz(10C)〜4.3GHz(28C), AVX/AVX512 offset: 4/7
【   Mem   】 G.Skill F4-4266C17Q-32GTZR (3セット:8GBx12) DDR4-4000 16-17-17-32-300-1T
【   M/B   】 ASUS ROG Dominus Extreme
【  SSD  】 Intel Optane SSD 905P 960GB (HHHL) x1
【   O S   】 Win 10 Pro 64
【  Ver.  】 v0.7.7 Build 9501 (17-SKX ~ Kotori/14-BDW ~ Kurumi)
【HypThread】 ON

ch  1b             10b
   AVX256  AVX512  AVX256   AVX512
-----------------------------------------
1  5.278    4.404    68.101    54.849
2  2.780    2.353    34.383    28.115
4  1.623    1.409    19.599    15.859
6  1.278    1.087    15.653    12.135

※1ch当たり8Gx2枚の構成
※AVX256は 14-BDW ~ Kurumi
0454Socket774
垢版 |
2019/08/22(木) 23:59:11.14ID:+1hJyopA
>>453 間違えた。
1b → 100M
10b → 1b
0455Socket774
垢版 |
2019/08/23(金) 06:16:30.60ID:KCQdM1M6
日記帳
0456Socket774
垢版 |
2019/09/22(日) 07:47:30.52ID:FFxHe6m+
久々の一般CPU部門

【   CPU  】 Core i7-8700 (Power Limit 120W)
【   Mem   】 DDR4 2666 CL19 8GBx2
【   M/B   】 PRIME B360M-C
【  SSD  】 PX-256M5S
【   O S   】 Win 10 Pro 64
【  Ver.  】 v0.7.7 Build 9501 (17-ZN1 ~ Yukina)
【HypThread】 ON

■1億桁
Total Computation Time: 5.363 seconds
Start-to-End Wall Time: 5.920 seconds
CPU Utilization: 1108.52 % + 4.95 % kernel overhead
Multi-core Efficiency: 92.38 % + 0.41 % kernel overhead

■10億桁
Total Computation Time: 69.793 seconds
Start-to-End Wall Time: 73.602 seconds
CPU Utilization: 1147.01 % + 1.03 % kernel overhead
Multi-core Efficiency: 95.58 % + 0.09 % kernel overhead

>>410
やっぱり8700じゃRyzen 3600には勝てないな
0457Socket774
垢版 |
2019/09/22(日) 07:49:06.78ID:FFxHe6m+
>>456
訂正
【  Ver.  】 v0.7.7 Build 9501 (14-BDW ~ Kurumi)
0458Socket774
垢版 |
2019/10/20(日) 11:20:57.27ID:lSXqmLVY
次のバージョンがほぼ完成してるけど、欲しいZen2が手に入らないのでZen2最適化は何も着手してないようだ。
3950Xが欲しいのは、コア数とメモリch数比率が64C EPYCと同じだからということらしい。
EPYCで世界記録狙うような人に一番効果あるようにしたいということか。次バージョンも世界記録狙う人が使うSwapモードの機能強化が中心のよう。
Zen+までと差があればYukinaと別バイナリにするつもりらしい。
https://www.mersenneforum.org/showthread.php?s=b8b6c04f2bcf92b9904de3cda06d0822&;t=24605
※ツイッターでHWBOTの自分のW-3175Xの記録をZen2 EPYCとの比較で引用してたw
0459Socket774
垢版 |
2019/10/27(日) 09:11:54.60ID:QqBNUN2F
Swapモード時にRead/Writeがシングルスレッドなのをどうにかしないと
せめて複数デバイス指定した時にはデバイス数と同数のスレッド立ち上げて並列で読み書きする様な事をしてほしい
0460Socket774
垢版 |
2019/10/31(木) 21:44:39.30ID:N+srFf+W
v0.7.8.9503 (October 27, 2019) リリース
0461Socket774
垢版 |
2019/11/02(土) 01:38:06.17ID:s4qEOANm
新バージョン速くなった。
W-3175X@AVX512 All core 3.6GHzでも、>>401-402のAVX512 All core 4.0GHzと同程度。
桁数少ない方がより速くなった。
0462Socket774
垢版 |
2019/11/11(月) 00:25:16.22ID:BHGANmxJ
HWBOTにEPYC 7742 シングルソケットの結果がアップされてた。
https://hwbot.org/submission/4277756_yosarianilives_y_cruncher___pi_25m_epyc_7742_0sec_463ms
https://hwbot.org/submission/4277755_yosarianilives_y_cruncher___pi_1b_epyc_7742_12sec_913ms
https://hwbot.org/submission/4277757_yosarianilives_y_cruncher___pi_10b_epyc_7742_2min_38sec_844ms

Dualより大分効率よさそう(サーバーCPUのようにコア数勝負だと、桁数が少ないのは効率出ないけど)。
日付的にはy-cruncher最新版のリリース後だけど、一つ前のバージョンのよう。
最新版はメモリ使用量が数%減ったので、W-3175Xや7980XEなんかだとメモリネックが少し解消される分速くなったみたい。
Zen2でもメモリレイテンシ大きいことの影響が緩和されて少し速くなってるんじゃないかな。
0463Socket774
垢版 |
2019/11/24(日) 14:35:00.31ID:Xr6mNT34
ていうか、水冷OCしたXEONと空冷定格EPYCで殆ど差が無い点でEPYC圧勝だろJK
0464Socket774
垢版 |
2019/11/28(木) 00:17:00.44ID:NLtAe+Tx
Micro Centerの在庫6個から4人目で3950Xゲットだって
めっちゃ嬉しそう
0465Socket774
垢版 |
2019/11/28(木) 02:03:43.20ID:CxX/p1gY
ようやくZen2最適化開始かな。
Zen2がどこまでスコア伸ばせるか楽しみだね。Zen2スリッパも出るし。
※このベンチやる人はメモリ構成も重要だね。うちの7980XEとW-3175Xだと、SR 2DIMM/chが速そう。
 設定は速い順に 3800 15-16-16-32-1T>3600 15-16-16-32-1T>4000 16-17-17-34-2T。
 ただ、3800 1Tは今のところ完全には安定させられてない(HCI Memtestで最長でも4hくらいでアウト)。
0466Socket774
垢版 |
2019/11/28(木) 21:37:46.46ID:NLtAe+Tx
AVX2には今のバイナリでもかなり対応できてるみたいだからキャッシュの仕様変更と増加に最適するのが主なのかな
0468Socket774
垢版 |
2019/12/01(日) 22:51:30.22ID:PbZjFK3C
まだ名前決めてないのかな。(バイナリ分離時は、いつもそのマシンの名前にしてるらしい)
0469Socket774
垢版 |
2019/12/05(木) 00:18:24.30ID:vv4YX8HE
グラボの上に車海老乗ってるかと思った
0470Socket774
垢版 |
2019/12/05(木) 00:49:53.45ID:v1l1vNJ+
www
>>360 の7940X機(Kotori)見てれば車海老とは思わなかったかも。

>>440 の7980XE機のM/BをEncoreに交換して電源1200Wにしたら全力時の消費電力150Wくらい減った。
最新Ver.で1億 1.38X秒、10億 16.4XX秒、100億212.4XX秒くらい出る。
0471Socket774
垢版 |
2019/12/10(火) 00:56:38.96ID:0cVS4YmQ
>>459 その件、>>458の板で聞いたのかな?
自分の環境は、それなりに空きがあって高速なドライブを複数積んでないから試せない。
0472Socket774
垢版 |
2019/12/16(月) 22:17:18.68ID:j3FKVce8
【   CPU  】 Core i9 7980XE@4.8GHz(8C)〜4.4GHz(18C), AVX/AVX512 offset: 1/2
【   Mem   】 G.Skill F4-4266C17Q-32GTZR(8GBx8) DDR4-3800 15-16-16-32-275-1T
【   M/B   】 ASUS Rampage VI EXtreme Encore (BIOS: 0401)
【  SSD  】 Intel Optane 900P 280GB(PCIe)
【   O S   】 Win 10 Pro 64
【  Ver.  】 v0.7.8 Build 9503 (17-SKX ~ Kotori)
【HypThread】 ON

■1億桁
Total Computation Time: 1.381 seconds
Start-to-End Wall Time: 1.704 seconds
CPU Utilization: 3155.28 % + 27.16 % kernel overhead
Multi-core Efficiency: 87.65 % + 0.75 % kernel overhead

■10億桁
Total Computation Time: 16.368 seconds
Start-to-End Wall Time: 17.908 seconds
CPU Utilization: 3432.04 % + 12.22 % kernel overhead
Multi-core Efficiency: 95.33 % + 0.34 % kernel overhead

■100億桁
Total Computation Time: 211.803 seconds
Start-to-End Wall Time: 226.099 seconds
CPU Utilization: 3493.79 % + 2.29 % kernel overhead
Multi-core Efficiency: 97.05 % + 0.06 % kernel overhead

https://i.imgur.com/N9CfYBL.png
https://i.imgur.com/luKjORS.png
https://i.imgur.com/QY1zczq.png

>>440 の7980XE機のM/BをEncoreに、電源を1200Wに換装して最新バージョンで全力。
AVX512 all core 4.2GHzの設定だが4.1GHzで頭打ち。FIVRの出力限界か?
現状のパーツでやれることはすべてやった感じ。
0473Socket774
垢版 |
2020/01/27(月) 18:24:16.01ID:CJvk7z6k
Ryzen7 1700 からの載せ替え、メモリとクーラは交換予定
メモリが足引っ張ってるのか?クロック下げてSMTをOFFにした方が何故か早いOrz

【   CPU  】 Ryzen9 3950X (Wraith Spire)
【   Mem   】 DDR4 2666 CL19 4GBx2
【   M/B   】 ASRock Fatal1ty AB350 Gaming K4
【  SSD  】 Intel
【   O S   】 Win 10 64
【  Ver.  】 v0.7.8 Build 9503 (17-ZN1 ~ Yukina)
【HypThread】 OFF @3GHz(down clock)

■1億桁
Total Computation Time: 3.566 seconds
Start-to-End Wall Time: 4.320 seconds
CPU Utilization: 1359.31 % + 5.70 % kernel overhead
Multi-core Efficiency: 84.96 % + 0.36 % kernel overhead


【HypThread】 ON @3.5GHz(定格)

■1億桁
Total Computation Time: 3.816 seconds
Start-to-End Wall Time: 4.645 seconds
CPU Utilization: 2931.67 % + 18.02 % kernel overhead
Multi-core Efficiency: 91.61 % + 0.56 % kernel overhead

数秒の負荷だからなのか Wraith Spire でも CPU 温度は 30℃くらい。冬?
0474Socket774
垢版 |
2020/01/27(月) 18:32:48.38ID:CJvk7z6k
定格にしてCPBをAutoにすると全コア4GHz超え、けどメモリが2400動作になってしまう。
メモリ相性かな( ^ω^)・・・
DDR4-3200以上のメモリ買って再チャレンジ予定
0475Socket774
垢版 |
2020/01/27(月) 22:41:21.55ID:jw8xjSEv
>>473 コア数多いCPUだと1億桁は効率が出ないね。
上の方に書いたけど、>>472の7980XEでも1億桁はHTT Disableにするか、y-cruncherのスレッド数を半分に減らすともっと速い。

更にコア数が多いと、10億桁でも効率が上がらなくなるようだ。
https://hwbot.org/benchmark/y-cruncher_-_pi-1b/rankings?start=0#start=0#interval=50
Zen2 最強EPYC 7H12 Dual(128C/16ch)よりW-3175X(28C/6ch)@OCの方が速いとか、
Zen2 7742(64C/8ch)でも7980XE(18C/4ch)@OCより少し速いだけとか。

※Zen2 3970XでメモリOCすれば>>472を抜けそうだね。
 https://hwbot.org/benchmark/y-cruncher_-_pi-10b/rankings?start=0#start=0#interval=50  ※3min 33sec 283ms が>>572のPC(HPET Enable)
0476Socket774
垢版 |
2020/01/27(月) 23:39:02.69ID:CJvk7z6k
【   CPU  】 Ryzen9 3950X (Wraith Spire)
【   Mem   】 DDR4 2666 CL19 4GBx2
【   M/B   】 ASRock Fatal1ty AB350 Gaming K4
【  SSD  】 Intel M.2
【   O S   】 Win 10 64
【  Ver.  】 v0.7.8 Build 9503 (17-ZN1 ~ Yukina)
【HypThread】 OFF

■1億桁
Total Computation Time: 3.054 seconds
Start-to-End Wall Time: 3.588 seconds
CPU Utilization: 1458.78 % + 8.70 % kernel overhead
Multi-core Efficiency: 91.17 % + 0.54 % kernel overhead

UEFI/BIOS 設定を全部デフォに戻して SMT だけ OFF にしたらスコア縮んだ
てか Wraith Spire でも 3950X が 30℃台で 4.2GHz なんだけど、冬だから?それともグリスをダイヤモンドなんとかってのにしたのが効いてるのか?暖房22℃設定だよ?

作者と同じCPUなので次期Ver期待して待とう(´;ω;`)
0477Socket774
垢版 |
2020/01/30(木) 21:59:49.75ID:6nrk87xT
昨日、記録が更新されたっぽい
0479Socket774
垢版 |
2020/02/11(火) 09:08:30.44ID:7+Qaqf9B
その後>>472の環境で試したら、0→1→Xの実行バターンだと、10億桁もHTT Offの方が速かった。
HTT Onで3→3→桁数(100m/1b/10b)→4(※)→0(※)→9→2→スレッド数→6→Max Sequential Dispatch数→0→0
のパターンでスレッド数とMax Sequential Dispatch数を調整して実行すると、1億 1.14X秒、10億 15.5xx秒、100億 208.xx秒で更に速かった。
※16進数出力抑止
0480Socket774
垢版 |
2020/02/18(火) 21:34:07.31ID:QuCcNgl4
>>1
0481Socket774
垢版 |
2020/02/18(火) 22:05:04.83ID:lYUS0bGN
>>1
言わせる気です。
全部言ってよ。
0482Socket774
垢版 |
2020/02/19(水) 23:48:32.57ID:YzdAbzHl
作者の3950Xは、ようやく本命のメモリ(128GB構成)入手したって。
Zen2最適化についてはツイッターや>>458のスレで音沙汰ないね。
0483Socket774
垢版 |
2020/02/20(木) 01:16:11.79ID:l3X6X5Gk
ポケモンやってて時間なかったから
0484Socket774
垢版 |
2020/02/26(水) 01:08:28.50ID:3NAGL+Om
Zen2最適化で10%速くなったって。
0485Socket774
垢版 |
2020/02/28(金) 23:18:50.06ID:eUvRQxdI
>>484
other priorities in life
やっぱりポケモンやってたんですね

自前の自動最適化ツールみたいの?だけで10%アップみたいだけど手直しすればもう少し速くるのかな
0487Socket774
垢版 |
2020/03/01(日) 20:43:16.78ID:0eZkELfj
【 CPU 】AMD Ryzen 7 3700X 8-Core Processor (Wraith PRIZM)
【 Mem 】CRUCIAL DDR4 2666 8 * 4
【 M/B 】TUF B450-PLUS GAMING
【 HDD 】PLEXTOR PX-256M8PeG
【 OS 】Windows10 Pro(64bit)
【 Ver 】v0.7.8 Build 9503

【 HypThread 】ON
【 ComputeT. 】4.024 seconds
【Total Time 】5.941 seconds
【CPU Utiliz 】1279.57 % + 5.83 % kernel overhead
【Efficiency 】79.97 % + 0.36 % kernel overhead
0488Socket774
垢版 |
2020/03/13(金) 07:44:06.02ID:5zJk4Tq2
v0.7.8.9506 (March 1, 2020) 出てるよ。
Current Release: の所のバージョン番号が更新されてなくて気が付かなった。

Zen2速くなったのはL3のサイズとかかな。
17-SKX ~ Kotori はL3がNot inclusiveで小さくてレイテンシ大きいので効果少なくてL2のサイズでチューニング
されているのか Tuning.txt に下記が書いてある。
Cache / Threads : 512 KB / thread
0489Socket774
垢版 |
2020/05/23(土) 06:10:58.12ID:re3UtMd7
インストールしてもウイルスバスターがウイルスとして削除されてしまう。
0490Socket774
垢版 |
2020/05/24(日) 13:52:33.85ID:b5Z9pIKP
ノートンでもメインexeが2種類検出で削除された。
0491Socket774
垢版 |
2020/09/20(日) 08:56:04.45ID:JxqA9RRY
はい次
0492Socket774
垢版 |
2020/10/29(木) 07:42:42.76ID:ueB4pkyT
【   CPU  】 Core i5 9400F
【   Mem   】 G.Skill F4-2666C19D-32GIS (16GBx4)
【   M/B   】 MCJ(Mouse) Z390M-S01
【  HDD  】 WD20EARX
【   O S   】 Win 10 home 64
【  Ver.  】 y-cruncher v0.7.8.9507
【HypThread】 無し


■100億桁
Total Computation Time: 1160.698 seconds
Start-to-End Wall Time: 1271.381 seconds

CPU Utilization: 573.80 % + 0.23 % kernel overhead
Multi-core Efficiency: 95.63 % + 0.04 % kernel overhead

CドライブはSSDなんだけどフリーソフトは古いHDDに入れていたからHDDディスクで測定ね
0493Socket774
垢版 |
2020/11/24(火) 22:55:10.55ID:C3eGDdDz
日本人技術者、円周率を「約31兆桁」計算 世界記録塗り替える
https://www.bbc.com/japanese/47552083
日本出身の女性技術者が「3.14」でおなじみの円周率を小数点以下約31兆4000億桁まで計算し、世界記録を更新したことが14日分った。これまでの約22兆桁を大幅に上回る記録となった。
--中略--
今回の計算には170テラバイトのデータが必要で、25のバーチャルマシンを使って121日間かけて行なわれた。
0494ネハの64Bitが走る
垢版 |
2021/03/29(月) 12:15:11.28ID:os9INNoY
【   CPU  】 BCM2711 1.5GHz アルミパッシブヒートシンク
【   Mem   】 Micron D9ZCL LPDDR4 8GB
【   M/B   】 Raspberry Pi 4 Model.B Sony UK
【   HDD   】 SanDisk Extreme PRO 64GB
【   O S   】Windows10 Arm64 Enterprise Insider Preview 21343
【  Ver.  】 v0.7.8 Build 9507 08-NHM Ushio

【 HypThread 】ない
【 ComputeT. 】305.401 seconds
【Total Time 】313.788 seconds
【CPU Utiliz 】291.42 % + 0.41 % kernel overhead
【Efficiency 】72.85 % + 0.10 % kernel overhead

実性能的にはPenD3GHzレベルだが消費電力6W〜7W
0495Socket774
垢版 |
2021/03/29(月) 13:22:34.44ID:os9INNoY
【   CPU  】 BCM2711 1.5GHz アルミパッシブヒートシンク
【   Mem   】 Micron D9ZCL LPDDR4 8GB
【   M/B   】 Raspberry Pi 4 Model.B Sony UK
【   HDD   】 SanDisk Extreme PRO 64GB
【   O S   】Windows10 Arm64 (19041)
【  Ver.  】 v0.7.8 Build 9507 04-P4P 名無し(´;ω;`)

【 HypThread 】ない
【 ComputeT. 】492.182 seconds
【Total Time 】506.975 seconds
【CPU Utiliz 】380.20 % + 0.09 % kernel overhead
【Efficiency 】95.05 % + 0.02 % kernel overhead

現行版のArm64版Win10だと未だx86しかエミュできないけど
PenIIIやK7の3倍の性能がある
こちらのパターンでも消費電力 7Wくらい
0496Socket774
垢版 |
2021/05/04(火) 02:41:19.99ID:2RA3WhNj
【   CPU  】 Ryazen 9 5900X
【   Mem   】 DDR4-3600(8GBx4) 16-16-16-36-1T
【   M/B   】 GIGA B550M AORUS PRO
【  SSD  】 CSSD-S6T480NRG4Q
【   O S   】 Win10Pro 20H2(Build 19042.964)
【  Ver.  】 v0.7.8 Build 9507(19-ZN2 ~ Kagari)
【HypThread】 ON
◆1億桁
【ComputeT.】 2.658 seconds
【Total Time】 3.952 seconds
【CPU Utiliz 】 2106.95 % + 29.98 % kernel overhead
【Efficiency 】 87.79 % + 1.25 % kernel overhead

ようやくZen3買えた
0498Socket774
垢版 |
2021/08/22(日) 17:27:09.42ID:FBuVa3Qz
>>497 ストレージに掛けられる費用の問題で速度上げられないようだね。

https://www.fhgr.ch/fileadmin/_processed_/8/7/csm_image2021-8-16_14-48-58_49a065db2d.png

CPU使用率33%だから、ストレージにもっと金掛けられれば更に速くできそう。
24ポートのRAIDカードを8枚くらい付けて、そこに速度落ちないSATA SSD(870EVOとか??)を
沢山ぶら下げればIO性能7倍くらいになって実行時間が半分以下になりそうだけど、1500万
くらい掛かりそう。(50日くらいならNAND SSDでも寿命は大丈夫か?)
※今回のだとストレージ周り300万くらいか。
0499Socket774
垢版 |
2021/08/26(木) 14:04:30.92ID:JBK4SBO0
素人質問なんですが、2.5兆桁以上を計算する方法を教えていただけませんか?
0500Socket774
垢版 |
2021/08/26(木) 18:06:01.91ID:82rfKUd0
>>499 2.5兆以上が分からないって、どういうこと?
2.5兆未満、例えば2兆はできるの?2兆出来る方法しているなら、2.5兆以上も同じ方法でできると思うけど。
0501Socket774
垢版 |
2021/08/26(木) 18:38:02.47ID:82rfKUd0
>>499 もし、単純にy-cruncherを起動した後、0→1と入力すると、そこに2.5兆桁までしかないことを言っているなら、
最初に0を入力するのはメモリ上で計算する基本的なパターン(多分作者が最初にπの計算をメモリだけでやる
機能を組み込んだので、それが基本機能として一番上に位置付けられている)で、そこを見ると分かるように、
この機能ではとてつもない量のメモリを積んでないと兆の桁は計算できない。

メモリが足りなくなるような桁数を計算するときは、HDDやSSDを大量に用意して、メモリに収まらない分をHDDやSSDに
追い出してたり、メモリに戻したりしながら計算するSwap Modeというのでやる。
実際には、y-cruncherを起動するときに管理者モードで起動した上で、最初のメニューで3を選び、その先で桁数(3や4)や
Swap Modeでやること(8)、HDD/SDDのフォルダのパス(結果を格納するところ(5)や計算に使う分ところ(8をSwap Modeに
すると現れる11のメニュー))などを指定する。必要な設定がすんだら0でスタート。
0502Socket774
垢版 |
2021/08/26(木) 19:03:46.88ID:82rfKUd0
>>450がうちのでSwap Modeで1000億桁やったやつ(ストレージとしてOptane SSD 905Pを使用)だけど、
たまたま夕べ同じPCでHDD(6TB 7200rpmを1個だけ、外周が220MB/sくらいのやつ)使ってSwap Modeで
1000億桁やってみたので、その結果。24時間くらい掛かるかと思ったけど、意外に速かった。
https://i.imgur.com/7y0VY8I.png
0503Socket774
垢版 |
2021/08/26(木) 23:02:36.59ID:0eZJ/VPw
なるほど。参考になりました!
富岳で計算する予定です!
0504Socket774
垢版 |
2021/08/26(木) 23:20:34.85ID:82rfKUd0
>>503 y-cruncherって富岳で動くの?x86のWindowsとLinuxしかサポートしてないと思うけど。
何かエミュレータが用意されてる?それとも作者に富岳用にコンパイルして貰う?
0505Socket774
垢版 |
2021/08/27(金) 00:00:21.60ID:1H68r9by
まぁ、富岳使えるような人がこんなところでしょうもない質問しないと思うけどw
(自分のPCに富岳って名付けてるのでもないかぎり)
0506Socket774
垢版 |
2021/08/27(金) 09:08:25.74ID:lMRqTFad
友達に「富岳でワンチャンマイニングできるんじゃね?w」と言われたので、
そんなら円周率計算しようぜという謎のノリになりました。
で、ググった感じだとredなんてらっていうlinuxでした。
富岳は、申請して許可をもらうことができれば無料で一年間使え、
100TBの容量の容量が無料で使えるそうです。
0507Socket774
垢版 |
2021/08/27(金) 09:09:51.54ID:lMRqTFad
あ、富岳でする前に自分のゴミスペPCでするべきですねw(当たり前)
ちょっとやってみます
0508Socket774
垢版 |
2021/08/27(金) 10:57:14.52ID:1H68r9by
富岳はARM系プロセッサなのでy-cruncherは動かなそうだね。
確かソースコードは公開してなかったと思うけど、もしソースコード貰えてもx86前提で書かれててすごく手間が掛かりそう。
(SSEやAVX使ってるところはSVEに書き換えるとか?)

>>502でHDD使ったのが意外に速かったのは、半分のIOがデフォルトでy-cruncherのフォルダ(Optane SSD 905P)に
割り振られていたからのよう。
0509Socket774
垢版 |
2021/08/27(金) 11:37:53.30ID:lMRqTFad
難しいことはわからないので、もう諦めた方がいいのでしょうか?


富岳壊したくないですしw
0510Socket774
垢版 |
2021/08/27(金) 11:46:47.75ID:1H68r9by
私程度が言ってるようなことについて自分で気付いてスラスラ調査・確認できないようじゃ、まったくダメだと思いますw
0511Socket774
垢版 |
2021/08/27(金) 15:01:23.99ID:lMRqTFad
反論できねえw
0512Socket774
垢版 |
2021/08/27(金) 19:00:13.26ID:1H68r9by
>502 のSwap mode 1000億桁のHDDを6TBx1から3TBx7(Windowsストライプボリューム)に変更してやってみた。
https://i.imgur.com/KJczElm.png

Optane 905PとHDDにIOが半分ずつ分配され、HDDの速度がOptaneの1/2より少し遅い(シーケンシャル1000MB/s)
ので、Optaneオンリーの>>450より少し遅い結果になったみたい。
その後3TB HDDがもう1台見つかったので、3TBx8台で1兆桁スタートしてみた。1兆桁だとHDD比率が大幅に上がる
ので、何日も掛かりそう。使ったHDDは2011年頃に買って8年くらい365日24h回していたものなので障害が起きるかも。
0513Socket774
垢版 |
2021/08/30(月) 08:50:04.62ID:sqyq85NX
皆さんはパソコンの用意をどうしましたか?
また、「普段使いのパソコンと、円周率の計算用のパソコン」のように、
使い道を分けていますか?
0514Socket774
垢版 |
2021/08/30(月) 21:31:09.82ID:Fvs2TsIr
桁数の世界記録狙う人でもない限り、専用はないんじゃないw
自作板はPC複数持ってる人も多いと思うけど、ここにアップする人は下記のようなときだろうね。
・このスレ(y-ceyncher)を知ったので動かしてみた
・新しいPCを組んだ
・CPUやメモリを変えたり、OCレベルの進展があった
・y-ceyncherのアップデート
・古いPCで実行して最新のと比較してPCの進歩を感じたり、ノスタルジーに浸る

>>512 の1兆桁はまだ終わらない。最初、Swapにy-cruncherを置いてるOptane 905Pがデフォルトで
設定されてるままやってしまい、12h過ぎにOptane 905Pがパンクして止まった。再度HDDのみを
Swapに設定して再スタートし、現在68hでSumming 58%。CPU使用率は10%未満。あと2日くらいかな。
0515Socket774
垢版 |
2021/08/30(月) 22:01:58.82ID:sqyq85NX
なるほどです。
回答ありがとうございました。
0516Socket774
垢版 |
2021/08/30(月) 22:11:43.29ID:Fvs2TsIr
y-cruncher作者のサイト見たら、5兆、10兆、12.1兆桁の記録出した近藤氏が今年10980XEのベンチ結果報告してた。
まだ自作続けてるようだけど、こっそりこの板にも書いてたりするのかな。
※y-cruncherのソースコードの件、作者のサイトに提供するつもりはないと(ちょっと辛辣な表現で)書いてあるね。
0517Socket774
垢版 |
2021/08/31(火) 17:53:47.52ID:k2nctc6S
そうなんですね。。。
0518Socket774
垢版 |
2021/09/02(木) 00:28:33.34ID:YDJYY9Fy
Swap modeの1兆桁は、Series/Large Division/InvSqrt が終わり、Large Multiply 実行中。
まだ大分掛かりそう。
0519Socket774
垢版 |
2021/09/02(木) 19:24:10.45ID:YDJYY9Fy
Swap modeの1兆桁

【   CPU  】 Xeon W-3175X@4.7GHz(10C)〜4.3GHz(28C), AVX/AVX512 offset: 4/7
【   Mem   】 G.Skill F4-4266C17Q-32GTZR (3セット:8GBx12) DDR4-3800 15-16-16-32-275-2T
【   M/B   】 ASUS ROG Dominus Extreme
【SSD/HDD 】 Intel Optane SSD 905P 960GB (HHHL) x1: 起動ディスク、y-cruncher格納
         HGST HDS723030ALA640(HDD、3TB、7200rpm) x8(Windowsストライプ): Swap用、結果出力
【   O S   】 Win 10 Pro 64
【  Ver.  】 v0.7.8 Build 9507 (17-SKX ~ Kotori)
【HypThread】 ON

■1兆桁(Swap mode)
Total Computation Time: 473536.795 seconds ( 5.481 days )
Start-to-End Wall Time: 495826.904 seconds ( 5.739 days )
CPU Utilization: 397.13 % + 6.84 % kernel overhead
Multi-core Efficiency: 7.09 % + 0.12 % kernel overhead

Logical Largest Checkpoint: 0 ( 0 bytes)
Logical Peak Disk Usage: 5,011,880,284,072 (4.56 TiB)
Logical Disk Bytes Read: 249,011,847,573,320 ( 226 TiB)
Logical Disk Bytes Written: 217,988,129,146,616 ( 198 TiB) ※SSDでやる人はTBW消費率算出の目安に

https://i.imgur.com/kHSGVP4.png
https://i.imgur.com/jT8Fpll.jpg    HDDx8台。PCの電源に届かないため別電源に接続。

取り敢えずスポットチェック問題なしで完了。
CPU性能に対してストレージ性能が低すぎだが、近藤氏が5兆桁実行時のテストランの1兆桁13日よりは速かった。
短縮のため16進数出力とチェックポイント情報の記録なし。
この程度の日数ならnon-ECCでもビット化け遭遇確率は小さいか?
0520Socket774
垢版 |
2021/09/05(日) 20:31:16.85ID:5CI8tk7N
>>519 に下記外付けストレージをThunderbolt接続して1000億桁。
areca ARC-5028T2 (6TB HDD x6、RAID5、Thunderbolt 2/USB3.0対応)
※普段はSandy-E機にUSB3.0接続。これやR6E(初代)で使えるThunderbolt 2/3カードの入手が
  今後難しくなりそうなので今回確保。容量を半分くらい使用していて遅いので、全体の1/7だけ
  負担させたので効果は小さ目。Optane 905Pは4/7、3TB HDD x8は2/7。

Total Computation Time: 6901.595 seconds ( 115.027 minutes )
Start-to-End Wall Time: 7556.399 seconds ( 2.099 hours )
CPU Utilization: 1892.06 % + 13.70 % kernel overhead
Multi-core Efficiency: 33.79 % + 0.24 % kernel overhead

https://i.imgur.com/CobBW2q.png
0521Socket774
垢版 |
2021/09/09(木) 11:56:38.07ID:Ey9kJqrV
>>520 に2.5インチSATA SSD(870EVO 4TB)x2のRAID0(USB3.1Gen2接続)を2台追加して1000億桁。

Total Computation Time: 5889.466 seconds ( 98.158 minutes )
Start-to-End Wall Time: 6448.675 seconds ( 107.478 minutes )
CPU Utilization: 2263.73 % + 13.90 % kernel overhead
Multi-core Efficiency: 40.42 % + 0.25 % kernel overhead

Logical Disk Bytes Read: 10,497,042,725,016 (9.55 TiB)
Logical Disk Bytes Written: 8,945,657,129,368 (8.14 TiB)
0522Socket774
垢版 |
2021/09/22(水) 06:37:02.59ID:CO67WJTf
>>519 の1兆桁をストレージを追加して実行

【SSD/HDD 】 Intel Optane SSD 905P 960GB (HHHL) : 起動ディスク、y-cruncher格納
         3TB HDD x8(Windowsストライプ): Swap、結果
         areca ARC-5028T2 (6TB HDD x6、RAID5、Thunderbolt 2): Swap
         2.5インチSATA SSD(870EVO 4TB)x2のRAID0(USB3.1Gen2) x2台: Swap

Total Computation Time: 189695.213 seconds ( 2.196 days )
Start-to-End Wall Time: 204944.302 seconds ( 2.372 days )
CPU Utilization: 1028.23 % + 10.46 % kernel overhead
Multi-core Efficiency: 18.36 % + 0.19 % kernel overhead

Logical Largest Checkpoint: 1,445,538,214,144 (1.31 TiB)
Logical Peak Disk Usage: 5,011,880,284,072 (4.56 TiB)
Logical Disk Bytes Read: 250,958,484,230,952 ( 228 TiB)
Logical Disk Bytes Written: 219,104,283,780,384 ( 199 TiB)

24h経過した頃にストレージ障害で1時間弱中断後再開。10進数結果のハッシュ値は前回と同一。
870EVO 4TB 1台当たりTBWの1%強の書き込み(Swapの1/8を負担)で寿命の大幅な減少なし。
SwapのIOはピーク3400MB/s程度。
開始後6h30mからの画面の動画(5MB、960x1042、59秒、3000倍速)
https://i.imgur.com/K4c2XbB.mp4
0523Socket774
垢版 |
2021/10/24(日) 16:19:19.77ID:Tq0kLS93
>>519 のVGA以外のPCIeレーン全部(x32)にストレージを接続して1000億桁

Total Computation Time: 3228.720 seconds ( 53.812 minutes )
Start-to-End Wall Time: 3435.375 seconds ( 57.256 minutes )
CPU Utilization: 4362.82 % + 34.10 % kernel overhead
Multi-core Efficiency: 77.91 % + 0.61 % kernel overhead

https://imgur.com/a/ZrZ9oHT
0524Socket774
垢版 |
2021/10/25(月) 19:19:36.48ID:hf9wC/RF
>>523 のストレージ構成で1兆桁

Total Computation Time: 56871.440 seconds ( 15.798 hours )
Start-to-End Wall Time: 59375.921 seconds ( 16.493 hours )
CPU Utilization: 3880.11 % + 52.67 % kernel overhead
Multi-core Efficiency: 69.29 % + 0.94 % kernel overhead

https://imgur.com/a/vbX3YWB
0525Socket774
垢版 |
2022/03/15(火) 03:02:06.08ID:ixvtNJup
v0.7.9.9509 (March 14, 2022) リリース
Zen3、Tiger Lake (& Cannon Lake) 最適化版追加。(Zen3用はZen2用より遅い場合もあるとのこと)
メモリ使用量削減、他。
00-x86は削除。
0526Socket774
垢版 |
2022/03/17(木) 22:10:32.94ID:WXBQ+uD0
めっちゃ久しぶりに更新されたじゃん
以前ほど完璧に最適化してないみたいだけど
0527Socket774
垢版 |
2022/04/23(土) 16:18:00.88ID:MClaGeOx
テストです
0528Socket774
垢版 |
2022/06/24(金) 03:20:44.58ID:figG0CWB
>>75
まあDAPPI的なのは男なんやな
0529Socket774
垢版 |
2022/06/24(金) 03:20:50.06ID:3GK924MI
皮肉にもesportsの世界では聞いたことがあるし
0530Socket774
垢版 |
2022/06/24(金) 03:23:25.41ID:d7l1PUln
キモオタ特有なんだが…
0531Socket774
垢版 |
2022/06/24(金) 03:24:21.13ID:Fs5nJy4z
やべぇこと言って支持されるの気持ちいい
0532Socket774
垢版 |
2022/06/24(金) 03:24:49.95ID:E0LAv69l
この件で冷静になれる方が人来るのかね
0533Socket774
垢版 |
2022/06/24(金) 03:24:55.65ID:U00l6apl
学者って基本思想で動いてないんよ意味がわからない
0534Socket774
垢版 |
2022/06/24(金) 03:25:14.09ID:sliUw6ed
>>79
この人過去に何回も問題発言してきてる数字と合わなかったから放置してたのに
0535Socket774
垢版 |
2022/06/24(金) 03:25:22.83ID:E1/1z4+s
まさに積み重ねてきたのは良い事
0536Socket774
垢版 |
2022/06/24(金) 03:26:14.49ID:Jb0REGEQ
>>71
リベラルあいつらが悪だとわかってるなら
0537Socket774
垢版 |
2022/06/24(金) 03:26:33.62ID:u2lVsfOX
>>106
そこをあいまいにしてるのがキツい
0538Socket774
垢版 |
2022/06/24(金) 03:27:56.49ID:GuymDqoS
>>70
まあSNSでフェミ活動するのをやめれば無くなるんじゃないのか
0539Socket774
垢版 |
2022/06/24(金) 03:27:59.20ID:kNDgU81c
数メートルおきにテント張るようなキャンプ場でソロキャンだったらクソ笑うわ
0540Socket774
垢版 |
2022/06/24(金) 03:28:28.44ID:YEJ2ppvM
もう30なんだよこれは
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況