【パイ焼き】y-cruncherベンチスレ【1億桁】 [転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
ば、ばっかじゃないの、し、シングルスレッド性能がどうしたっていうのよ
わ、y-cruncherさえ速ければ、あとは何も要らないんだから
あ、あんたの、そ、その・・・全部言わせる気?
●y-cruncherはこちらから
ttp://www.numberworld.org/y-cruncher/
●報告は1億桁で
実行手順
1)DLした圧縮ファイルを解凍し y-cruncher.exe を実行
2) 0 [Enter]
3) 1 [Enter]
4) 3 [Enter]
●1億桁のLastDigitsが↓と一致していればどのバージョンでも構いません
9948682556 3967530560 3352869667 7734610718 4471868529 : 99,999,950
7572203175 2074898161 1683139375 1497058112 0187751592 : 100,000,000
↑この部分↑
※SSE3に対応していない古いPCはv.0.6.1以前のバージョンを御使い下さい
http://www.numberworld.org/y-cruncher/versions.html
●報告用テンプレ (解説は>>2
【 CPU 】
【 Mem 】
【 M/B 】
【 O S 】
【 Ver. 】
【HypThread】ON/OFF/無し
【Total Time】seconds
【CPU Utiliz 】%
【Efficiency 】% DownClock & SpreadSpectrum + ECC設定強化で長時間向けの耐久性を強化
管理者権限実行にして、実行優先順位を 通常以下(デフォ) → 通常 に昇格
【 CPU 】 Xeon GOLD 6140 定格 36C/36T AVX512@2.08〜2.1GHz (DownClock & SpreadSpectrum)
【 Mem 】 Micron DDR4-2933 ECC Registerd 16GB 6ch x 2Sockets
【 M/B 】 ASUS WS C621E SAGE (BIOS 5503)
【 SSD 】 Intel Optane 900P 280GB x4
【 O S 】 Windows 10 Enterprise LTSC 2019
【 Ver. 】 v0.7.7 Build 9501
【HypThread】 OFF
■1億桁 (16-KNL) <1憶桁のみPhi用バイナリの方が若干早かった
Total Computation Time: 1.353 seconds
Start-to-End Wall Time: 2.039 seconds
CPU Utilization: 3355.66 % + 155.94 % kernel overhead
Multi-core Efficiency: 93.21 % + 4.33 % kernel overhead
■10億桁 (17-SKX ~ Kotori)
Total Computation Time: 16.565 seconds
Start-to-End Wall Time: 21.744 seconds
CPU Utilization: 3322.04 % + 2.74 % kernel overhead
Multi-core Efficiency: 92.28 % + 0.08 % kernel overhead
■100億桁 (17-SKX ~ Kotori)
Total Computation Time: 217.702 seconds
Start-to-End Wall Time: 280.448 seconds
CPU Utilization: 3432.03 % + 2.35 % kernel overhead
Multi-core Efficiency: 95.33 % + 0.07 % kernel overhead
>>440 には計算時間では勝りましたがトータルで負けてますねOrz。
Start to End に時間が掛かっているのは経過時間の多くを占めるメモリ確保がシングルスレッド〜2スレッドくらいなので低クロック多コアの傾向かと思われます ダウンクロックしたのにコピペ元のまま@定格とか残したままだし、403がアルペシオの影響で誤変換してるし、色々アレな感じに・・・ 構成は >>442 と同じです
■1千億桁 (17-SKX ~ Kotori)
Total Computation Time: 7652.056 seconds ( 2.126 hours )
Start-to-End Wall Time: 7846.747 seconds ( 2.180 hours )
CPU Utilization: 1406.92 % + 12.25 % kernel overhead
Multi-core Efficiency: 39.08 % + 0.34 % kernel overhead
前半はCPU負荷 90% 以上が長く続きますが、後半はCPU負荷が 4〜9% でディスクアクセスが 90% くらいの状態が続く感じでした >>442 メモリの割り当ては、NUMAでソケット間のレイテンシが大きいのも影響してるかな。
実行時に赤字で表示される注意事項の件を設定(メモリ内のページのロックを許可する設定をして
ラージページ使用可の状態で実行)したら多少速くなるかな? >>445
ラージページの件は1千億桁向けに対応したのですが、設定変更が面倒なので比較はしてません
仮にレイテンシが影響しているとするなら NUMA よりも ECC Registerd の方で
19-19-19-43-467 ですが、この場合、レイテンシより帯域では?
NUMA NODE 間の UPI 帯域は片側最大 20.8GB/s × 3本なので DDR4-2666 3ch 相当です i9 7980XE の人も 1000億桁やるべきだな >>447 >>444のSkylake-SP Dualの人はメモリ192GB + Optane 900P 280GBx4(ページファイル)でやったって
ことのようだけど、>>440 の7980XEはメモリ64GB + Optane 900P 280GBx1だから480GB必要な1000億桁は無理。
NAND NVMe 1TBとSATA 480GBのSSDも積んでるけど多分遅すぎ。
>>401-402のW-3175Xの方はメモリ96GB + Optane 905P 960GBx1だから容量は足りるけど、Optane 1個だ時間掛かりそうだね。 試しにW-3175の方でSwapモードで1000億桁スタートしてみた。
SwapモードのI/O(Summingステージ)はパフォーマンスモニタで見ると50MB単位くらいのようなので、
シーケンシャル速くて速度落ちないSSDなら何でもよさそう。 >>401-402 のW-3175Xで1000億桁(ストレージを使ったSwap mode)。
【 CPU 】 Xeon W-3175X@4.7GHz(10C)〜4.3GHz(28C), AVX/AVX512 offset: 4/7
【 Mem 】 G.Skill F4-4266C17Q-32GTZR (3セット:8GBx12) DDR4-4000 16-17-16-31-290-2T
【 M/B 】 ASUS ROG Dominus Extreme
【 SSD 】 Intel Optane SSD 905P 960GB (HHHL) x1
【 O S 】 Win 10 Pro 64
【 Ver. 】 v0.7.7 Build 9500 (17-SKX ~ Kotori)
【HypThread】 ON
■1000億桁(Swap mode)
Total Computation Time: 11249.010 seconds ( 3.125 hours )
Start-to-End Wall Time: 12206.958 seconds ( 3.391 hours )
CPU Utilization: 1142.59 % + 5.55 % kernel overhead
Multi-core Efficiency: 20.40 % + 0.10 % kernel overhead
https://i.imgur.com/X4V6zCn.png
CPUやメモリの性能は率としてはそれほど効かないので緩い設定(メモリは安定した2Tの設定)。
>>444氏の結果から8〜9時間くらい掛かるかと思ったけど、意外に早く終わった。
速いストレージを幾つか使えば、メインストリームでももっといいタイム出せそう。 リサスーの言う Cascade Lake の2倍の性能は y-cruncher でも証明(残念ながら3倍の性能ではない)
本家サイトに先ほど EPYC 7742 の結果が掲載されてた
Zen2最適化後なら更に差が拡大する予感
同表で現時点1000億桁最速はメモリ 2TB 搭載 Haswell-EX 機の 4,442秒 = 1時間14分
EPYC 7742 で Zen2 最適化後なら 1000億桁が 20分程度になると予想 >>451 EPYC 7742 Dual(64Cx2)はうちの>>401-402とメモリ上で出来る範囲だとそんなに違わないね。
Cascade Lake-APの56C DualならEPYC 7742 Dualといい勝負しそう。
Cascade Lake-APって売れのか怪しいけど。
8180M Dualの4%OC(>>403氏と同じM/BでメモリはOCじゃないよう)が>>401-402より少し遅いくらい。
https://hwbot.org/submission/3856433_h2o_vs_ln2_y_cruncher___pi_10b_2x_xeon_platinum_8180m_2min_54sec_831ms W-3175Xでメモリch数を変えて測定。
CPUは28C/56Tで緩めの設定。メモリは10億桁まで動く程度でy-cがこの環境で一番速い設定。
【 CPU 】 Xeon W-3175X@4.7GHz(10C)〜4.3GHz(28C), AVX/AVX512 offset: 4/7
【 Mem 】 G.Skill F4-4266C17Q-32GTZR (3セット:8GBx12) DDR4-4000 16-17-17-32-300-1T
【 M/B 】 ASUS ROG Dominus Extreme
【 SSD 】 Intel Optane SSD 905P 960GB (HHHL) x1
【 O S 】 Win 10 Pro 64
【 Ver. 】 v0.7.7 Build 9501 (17-SKX ~ Kotori/14-BDW ~ Kurumi)
【HypThread】 ON
ch 1b 10b
AVX256 AVX512 AVX256 AVX512
-----------------------------------------
1 5.278 4.404 68.101 54.849
2 2.780 2.353 34.383 28.115
4 1.623 1.409 19.599 15.859
6 1.278 1.087 15.653 12.135
※1ch当たり8Gx2枚の構成
※AVX256は 14-BDW ~ Kurumi >>453 間違えた。
1b → 100M
10b → 1b 久々の一般CPU部門
【 CPU 】 Core i7-8700 (Power Limit 120W)
【 Mem 】 DDR4 2666 CL19 8GBx2
【 M/B 】 PRIME B360M-C
【 SSD 】 PX-256M5S
【 O S 】 Win 10 Pro 64
【 Ver. 】 v0.7.7 Build 9501 (17-ZN1 ~ Yukina)
【HypThread】 ON
■1億桁
Total Computation Time: 5.363 seconds
Start-to-End Wall Time: 5.920 seconds
CPU Utilization: 1108.52 % + 4.95 % kernel overhead
Multi-core Efficiency: 92.38 % + 0.41 % kernel overhead
■10億桁
Total Computation Time: 69.793 seconds
Start-to-End Wall Time: 73.602 seconds
CPU Utilization: 1147.01 % + 1.03 % kernel overhead
Multi-core Efficiency: 95.58 % + 0.09 % kernel overhead
>>410
やっぱり8700じゃRyzen 3600には勝てないな >>456
訂正
【 Ver. 】 v0.7.7 Build 9501 (14-BDW ~ Kurumi) 次のバージョンがほぼ完成してるけど、欲しいZen2が手に入らないのでZen2最適化は何も着手してないようだ。
3950Xが欲しいのは、コア数とメモリch数比率が64C EPYCと同じだからということらしい。
EPYCで世界記録狙うような人に一番効果あるようにしたいということか。次バージョンも世界記録狙う人が使うSwapモードの機能強化が中心のよう。
Zen+までと差があればYukinaと別バイナリにするつもりらしい。
https://www.mersenneforum.org/showthread.php?s=b8b6c04f2bcf92b9904de3cda06d0822&t=24605
※ツイッターでHWBOTの自分のW-3175Xの記録をZen2 EPYCとの比較で引用してたw Swapモード時にRead/Writeがシングルスレッドなのをどうにかしないと
せめて複数デバイス指定した時にはデバイス数と同数のスレッド立ち上げて並列で読み書きする様な事をしてほしい v0.7.8.9503 (October 27, 2019) リリース 新バージョン速くなった。
W-3175X@AVX512 All core 3.6GHzでも、>>401-402のAVX512 All core 4.0GHzと同程度。
桁数少ない方がより速くなった。 ていうか、水冷OCしたXEONと空冷定格EPYCで殆ど差が無い点でEPYC圧勝だろJK Micro Centerの在庫6個から4人目で3950Xゲットだって
めっちゃ嬉しそう ようやくZen2最適化開始かな。
Zen2がどこまでスコア伸ばせるか楽しみだね。Zen2スリッパも出るし。
※このベンチやる人はメモリ構成も重要だね。うちの7980XEとW-3175Xだと、SR 2DIMM/chが速そう。
設定は速い順に 3800 15-16-16-32-1T>3600 15-16-16-32-1T>4000 16-17-17-34-2T。
ただ、3800 1Tは今のところ完全には安定させられてない(HCI Memtestで最長でも4hくらいでアウト)。 AVX2には今のバイナリでもかなり対応できてるみたいだからキャッシュの仕様変更と増加に最適するのが主なのかな まだ名前決めてないのかな。(バイナリ分離時は、いつもそのマシンの名前にしてるらしい) www
>>360 の7940X機(Kotori)見てれば車海老とは思わなかったかも。
>>440 の7980XE機のM/BをEncoreに交換して電源1200Wにしたら全力時の消費電力150Wくらい減った。
最新Ver.で1億 1.38X秒、10億 16.4XX秒、100億212.4XX秒くらい出る。 >>459 その件、>>458の板で聞いたのかな?
自分の環境は、それなりに空きがあって高速なドライブを複数積んでないから試せない。 【 CPU 】 Core i9 7980XE@4.8GHz(8C)〜4.4GHz(18C), AVX/AVX512 offset: 1/2
【 Mem 】 G.Skill F4-4266C17Q-32GTZR(8GBx8) DDR4-3800 15-16-16-32-275-1T
【 M/B 】 ASUS Rampage VI EXtreme Encore (BIOS: 0401)
【 SSD 】 Intel Optane 900P 280GB(PCIe)
【 O S 】 Win 10 Pro 64
【 Ver. 】 v0.7.8 Build 9503 (17-SKX ~ Kotori)
【HypThread】 ON
■1億桁
Total Computation Time: 1.381 seconds
Start-to-End Wall Time: 1.704 seconds
CPU Utilization: 3155.28 % + 27.16 % kernel overhead
Multi-core Efficiency: 87.65 % + 0.75 % kernel overhead
■10億桁
Total Computation Time: 16.368 seconds
Start-to-End Wall Time: 17.908 seconds
CPU Utilization: 3432.04 % + 12.22 % kernel overhead
Multi-core Efficiency: 95.33 % + 0.34 % kernel overhead
■100億桁
Total Computation Time: 211.803 seconds
Start-to-End Wall Time: 226.099 seconds
CPU Utilization: 3493.79 % + 2.29 % kernel overhead
Multi-core Efficiency: 97.05 % + 0.06 % kernel overhead
https://i.imgur.com/N9CfYBL.png
https://i.imgur.com/luKjORS.png
https://i.imgur.com/QY1zczq.png
>>440 の7980XE機のM/BをEncoreに、電源を1200Wに換装して最新バージョンで全力。
AVX512 all core 4.2GHzの設定だが4.1GHzで頭打ち。FIVRの出力限界か?
現状のパーツでやれることはすべてやった感じ。 Ryzen7 1700 からの載せ替え、メモリとクーラは交換予定
メモリが足引っ張ってるのか?クロック下げてSMTをOFFにした方が何故か早いOrz
【 CPU 】 Ryzen9 3950X (Wraith Spire)
【 Mem 】 DDR4 2666 CL19 4GBx2
【 M/B 】 ASRock Fatal1ty AB350 Gaming K4
【 SSD 】 Intel
【 O S 】 Win 10 64
【 Ver. 】 v0.7.8 Build 9503 (17-ZN1 ~ Yukina)
【HypThread】 OFF @3GHz(down clock)
■1億桁
Total Computation Time: 3.566 seconds
Start-to-End Wall Time: 4.320 seconds
CPU Utilization: 1359.31 % + 5.70 % kernel overhead
Multi-core Efficiency: 84.96 % + 0.36 % kernel overhead
【HypThread】 ON @3.5GHz(定格)
■1億桁
Total Computation Time: 3.816 seconds
Start-to-End Wall Time: 4.645 seconds
CPU Utilization: 2931.67 % + 18.02 % kernel overhead
Multi-core Efficiency: 91.61 % + 0.56 % kernel overhead
数秒の負荷だからなのか Wraith Spire でも CPU 温度は 30℃くらい。冬? 定格にしてCPBをAutoにすると全コア4GHz超え、けどメモリが2400動作になってしまう。
メモリ相性かな( ^ω^)・・・
DDR4-3200以上のメモリ買って再チャレンジ予定 >>473 コア数多いCPUだと1億桁は効率が出ないね。
上の方に書いたけど、>>472の7980XEでも1億桁はHTT Disableにするか、y-cruncherのスレッド数を半分に減らすともっと速い。
更にコア数が多いと、10億桁でも効率が上がらなくなるようだ。
https://hwbot.org/benchmark/y-cruncher_-_pi-1b/rankings?start=0#start=0#interval=50
Zen2 最強EPYC 7H12 Dual(128C/16ch)よりW-3175X(28C/6ch)@OCの方が速いとか、
Zen2 7742(64C/8ch)でも7980XE(18C/4ch)@OCより少し速いだけとか。
※Zen2 3970XでメモリOCすれば>>472を抜けそうだね。
https://hwbot.org/benchmark/y-cruncher_-_pi-10b/rankings?start=0#start=0#interval=50 ※3min 33sec 283ms が>>572のPC(HPET Enable) 【 CPU 】 Ryzen9 3950X (Wraith Spire)
【 Mem 】 DDR4 2666 CL19 4GBx2
【 M/B 】 ASRock Fatal1ty AB350 Gaming K4
【 SSD 】 Intel M.2
【 O S 】 Win 10 64
【 Ver. 】 v0.7.8 Build 9503 (17-ZN1 ~ Yukina)
【HypThread】 OFF
■1億桁
Total Computation Time: 3.054 seconds
Start-to-End Wall Time: 3.588 seconds
CPU Utilization: 1458.78 % + 8.70 % kernel overhead
Multi-core Efficiency: 91.17 % + 0.54 % kernel overhead
UEFI/BIOS 設定を全部デフォに戻して SMT だけ OFF にしたらスコア縮んだ
てか Wraith Spire でも 3950X が 30℃台で 4.2GHz なんだけど、冬だから?それともグリスをダイヤモンドなんとかってのにしたのが効いてるのか?暖房22℃設定だよ?
作者と同じCPUなので次期Ver期待して待とう(´;ω;`) その後>>472の環境で試したら、0→1→Xの実行バターンだと、10億桁もHTT Offの方が速かった。
HTT Onで3→3→桁数(100m/1b/10b)→4(※)→0(※)→9→2→スレッド数→6→Max Sequential Dispatch数→0→0
のパターンでスレッド数とMax Sequential Dispatch数を調整して実行すると、1億 1.14X秒、10億 15.5xx秒、100億 208.xx秒で更に速かった。
※16進数出力抑止 作者の3950Xは、ようやく本命のメモリ(128GB構成)入手したって。
Zen2最適化についてはツイッターや>>458のスレで音沙汰ないね。 >>484
other priorities in life
やっぱりポケモンやってたんですね
自前の自動最適化ツールみたいの?だけで10%アップみたいだけど手直しすればもう少し速くるのかな 【 CPU 】AMD Ryzen 7 3700X 8-Core Processor (Wraith PRIZM)
【 Mem 】CRUCIAL DDR4 2666 8 * 4
【 M/B 】TUF B450-PLUS GAMING
【 HDD 】PLEXTOR PX-256M8PeG
【 OS 】Windows10 Pro(64bit)
【 Ver 】v0.7.8 Build 9503
【 HypThread 】ON
【 ComputeT. 】4.024 seconds
【Total Time 】5.941 seconds
【CPU Utiliz 】1279.57 % + 5.83 % kernel overhead
【Efficiency 】79.97 % + 0.36 % kernel overhead v0.7.8.9506 (March 1, 2020) 出てるよ。
Current Release: の所のバージョン番号が更新されてなくて気が付かなった。
Zen2速くなったのはL3のサイズとかかな。
17-SKX ~ Kotori はL3がNot inclusiveで小さくてレイテンシ大きいので効果少なくてL2のサイズでチューニング
されているのか Tuning.txt に下記が書いてある。
Cache / Threads : 512 KB / thread インストールしてもウイルスバスターがウイルスとして削除されてしまう。 ノートンでもメインexeが2種類検出で削除された。 【 CPU 】 Core i5 9400F
【 Mem 】 G.Skill F4-2666C19D-32GIS (16GBx4)
【 M/B 】 MCJ(Mouse) Z390M-S01
【 HDD 】 WD20EARX
【 O S 】 Win 10 home 64
【 Ver. 】 y-cruncher v0.7.8.9507
【HypThread】 無し
■100億桁
Total Computation Time: 1160.698 seconds
Start-to-End Wall Time: 1271.381 seconds
CPU Utilization: 573.80 % + 0.23 % kernel overhead
Multi-core Efficiency: 95.63 % + 0.04 % kernel overhead
CドライブはSSDなんだけどフリーソフトは古いHDDに入れていたからHDDディスクで測定ね 日本人技術者、円周率を「約31兆桁」計算 世界記録塗り替える
https://www.bbc.com/japanese/47552083
日本出身の女性技術者が「3.14」でおなじみの円周率を小数点以下約31兆4000億桁まで計算し、世界記録を更新したことが14日分った。これまでの約22兆桁を大幅に上回る記録となった。
--中略--
今回の計算には170テラバイトのデータが必要で、25のバーチャルマシンを使って121日間かけて行なわれた。 【 CPU 】 BCM2711 1.5GHz アルミパッシブヒートシンク
【 Mem 】 Micron D9ZCL LPDDR4 8GB
【 M/B 】 Raspberry Pi 4 Model.B Sony UK
【 HDD 】 SanDisk Extreme PRO 64GB
【 O S 】Windows10 Arm64 Enterprise Insider Preview 21343
【 Ver. 】 v0.7.8 Build 9507 08-NHM Ushio
【 HypThread 】ない
【 ComputeT. 】305.401 seconds
【Total Time 】313.788 seconds
【CPU Utiliz 】291.42 % + 0.41 % kernel overhead
【Efficiency 】72.85 % + 0.10 % kernel overhead
実性能的にはPenD3GHzレベルだが消費電力6W〜7W 【 CPU 】 BCM2711 1.5GHz アルミパッシブヒートシンク
【 Mem 】 Micron D9ZCL LPDDR4 8GB
【 M/B 】 Raspberry Pi 4 Model.B Sony UK
【 HDD 】 SanDisk Extreme PRO 64GB
【 O S 】Windows10 Arm64 (19041)
【 Ver. 】 v0.7.8 Build 9507 04-P4P 名無し(´;ω;`)
【 HypThread 】ない
【 ComputeT. 】492.182 seconds
【Total Time 】506.975 seconds
【CPU Utiliz 】380.20 % + 0.09 % kernel overhead
【Efficiency 】95.05 % + 0.02 % kernel overhead
現行版のArm64版Win10だと未だx86しかエミュできないけど
PenIIIやK7の3倍の性能がある
こちらのパターンでも消費電力 7Wくらい 【 CPU 】 Ryazen 9 5900X
【 Mem 】 DDR4-3600(8GBx4) 16-16-16-36-1T
【 M/B 】 GIGA B550M AORUS PRO
【 SSD 】 CSSD-S6T480NRG4Q
【 O S 】 Win10Pro 20H2(Build 19042.964)
【 Ver. 】 v0.7.8 Build 9507(19-ZN2 ~ Kagari)
【HypThread】 ON
◆1億桁
【ComputeT.】 2.658 seconds
【Total Time】 3.952 seconds
【CPU Utiliz 】 2106.95 % + 29.98 % kernel overhead
【Efficiency 】 87.79 % + 1.25 % kernel overhead
ようやくZen3買えた >>497 ストレージに掛けられる費用の問題で速度上げられないようだね。
https://www.fhgr.ch/fileadmin/_processed_/8/7/csm_image2021-8-16_14-48-58_49a065db2d.png
CPU使用率33%だから、ストレージにもっと金掛けられれば更に速くできそう。
24ポートのRAIDカードを8枚くらい付けて、そこに速度落ちないSATA SSD(870EVOとか??)を
沢山ぶら下げればIO性能7倍くらいになって実行時間が半分以下になりそうだけど、1500万
くらい掛かりそう。(50日くらいならNAND SSDでも寿命は大丈夫か?)
※今回のだとストレージ周り300万くらいか。 素人質問なんですが、2.5兆桁以上を計算する方法を教えていただけませんか? >>499 2.5兆以上が分からないって、どういうこと?
2.5兆未満、例えば2兆はできるの?2兆出来る方法しているなら、2.5兆以上も同じ方法でできると思うけど。 >>499 もし、単純にy-cruncherを起動した後、0→1と入力すると、そこに2.5兆桁までしかないことを言っているなら、
最初に0を入力するのはメモリ上で計算する基本的なパターン(多分作者が最初にπの計算をメモリだけでやる
機能を組み込んだので、それが基本機能として一番上に位置付けられている)で、そこを見ると分かるように、
この機能ではとてつもない量のメモリを積んでないと兆の桁は計算できない。
メモリが足りなくなるような桁数を計算するときは、HDDやSSDを大量に用意して、メモリに収まらない分をHDDやSSDに
追い出してたり、メモリに戻したりしながら計算するSwap Modeというのでやる。
実際には、y-cruncherを起動するときに管理者モードで起動した上で、最初のメニューで3を選び、その先で桁数(3や4)や
Swap Modeでやること(8)、HDD/SDDのフォルダのパス(結果を格納するところ(5)や計算に使う分ところ(8をSwap Modeに
すると現れる11のメニュー))などを指定する。必要な設定がすんだら0でスタート。 >>450がうちのでSwap Modeで1000億桁やったやつ(ストレージとしてOptane SSD 905Pを使用)だけど、
たまたま夕べ同じPCでHDD(6TB 7200rpmを1個だけ、外周が220MB/sくらいのやつ)使ってSwap Modeで
1000億桁やってみたので、その結果。24時間くらい掛かるかと思ったけど、意外に速かった。
https://i.imgur.com/7y0VY8I.png なるほど。参考になりました!
富岳で計算する予定です! >>503 y-cruncherって富岳で動くの?x86のWindowsとLinuxしかサポートしてないと思うけど。
何かエミュレータが用意されてる?それとも作者に富岳用にコンパイルして貰う? まぁ、富岳使えるような人がこんなところでしょうもない質問しないと思うけどw
(自分のPCに富岳って名付けてるのでもないかぎり) 友達に「富岳でワンチャンマイニングできるんじゃね?w」と言われたので、
そんなら円周率計算しようぜという謎のノリになりました。
で、ググった感じだとredなんてらっていうlinuxでした。
富岳は、申請して許可をもらうことができれば無料で一年間使え、
100TBの容量の容量が無料で使えるそうです。 あ、富岳でする前に自分のゴミスペPCでするべきですねw(当たり前)
ちょっとやってみます 富岳はARM系プロセッサなのでy-cruncherは動かなそうだね。
確かソースコードは公開してなかったと思うけど、もしソースコード貰えてもx86前提で書かれててすごく手間が掛かりそう。
(SSEやAVX使ってるところはSVEに書き換えるとか?)
>>502でHDD使ったのが意外に速かったのは、半分のIOがデフォルトでy-cruncherのフォルダ(Optane SSD 905P)に
割り振られていたからのよう。 難しいことはわからないので、もう諦めた方がいいのでしょうか?
富岳壊したくないですしw 私程度が言ってるようなことについて自分で気付いてスラスラ調査・確認できないようじゃ、まったくダメだと思いますw >502 のSwap mode 1000億桁のHDDを6TBx1から3TBx7(Windowsストライプボリューム)に変更してやってみた。
https://i.imgur.com/KJczElm.png
Optane 905PとHDDにIOが半分ずつ分配され、HDDの速度がOptaneの1/2より少し遅い(シーケンシャル1000MB/s)
ので、Optaneオンリーの>>450より少し遅い結果になったみたい。
その後3TB HDDがもう1台見つかったので、3TBx8台で1兆桁スタートしてみた。1兆桁だとHDD比率が大幅に上がる
ので、何日も掛かりそう。使ったHDDは2011年頃に買って8年くらい365日24h回していたものなので障害が起きるかも。 皆さんはパソコンの用意をどうしましたか?
また、「普段使いのパソコンと、円周率の計算用のパソコン」のように、
使い道を分けていますか? 桁数の世界記録狙う人でもない限り、専用はないんじゃないw
自作板はPC複数持ってる人も多いと思うけど、ここにアップする人は下記のようなときだろうね。
・このスレ(y-ceyncher)を知ったので動かしてみた
・新しいPCを組んだ
・CPUやメモリを変えたり、OCレベルの進展があった
・y-ceyncherのアップデート
・古いPCで実行して最新のと比較してPCの進歩を感じたり、ノスタルジーに浸る
>>512 の1兆桁はまだ終わらない。最初、Swapにy-cruncherを置いてるOptane 905Pがデフォルトで
設定されてるままやってしまい、12h過ぎにOptane 905Pがパンクして止まった。再度HDDのみを
Swapに設定して再スタートし、現在68hでSumming 58%。CPU使用率は10%未満。あと2日くらいかな。 y-cruncher作者のサイト見たら、5兆、10兆、12.1兆桁の記録出した近藤氏が今年10980XEのベンチ結果報告してた。
まだ自作続けてるようだけど、こっそりこの板にも書いてたりするのかな。
※y-cruncherのソースコードの件、作者のサイトに提供するつもりはないと(ちょっと辛辣な表現で)書いてあるね。 Swap modeの1兆桁は、Series/Large Division/InvSqrt が終わり、Large Multiply 実行中。
まだ大分掛かりそう。 Swap modeの1兆桁
【 CPU 】 Xeon W-3175X@4.7GHz(10C)〜4.3GHz(28C), AVX/AVX512 offset: 4/7
【 Mem 】 G.Skill F4-4266C17Q-32GTZR (3セット:8GBx12) DDR4-3800 15-16-16-32-275-2T
【 M/B 】 ASUS ROG Dominus Extreme
【SSD/HDD 】 Intel Optane SSD 905P 960GB (HHHL) x1: 起動ディスク、y-cruncher格納
HGST HDS723030ALA640(HDD、3TB、7200rpm) x8(Windowsストライプ): Swap用、結果出力
【 O S 】 Win 10 Pro 64
【 Ver. 】 v0.7.8 Build 9507 (17-SKX ~ Kotori)
【HypThread】 ON
■1兆桁(Swap mode)
Total Computation Time: 473536.795 seconds ( 5.481 days )
Start-to-End Wall Time: 495826.904 seconds ( 5.739 days )
CPU Utilization: 397.13 % + 6.84 % kernel overhead
Multi-core Efficiency: 7.09 % + 0.12 % kernel overhead
Logical Largest Checkpoint: 0 ( 0 bytes)
Logical Peak Disk Usage: 5,011,880,284,072 (4.56 TiB)
Logical Disk Bytes Read: 249,011,847,573,320 ( 226 TiB)
Logical Disk Bytes Written: 217,988,129,146,616 ( 198 TiB) ※SSDでやる人はTBW消費率算出の目安に
https://i.imgur.com/kHSGVP4.png
https://i.imgur.com/jT8Fpll.jpg HDDx8台。PCの電源に届かないため別電源に接続。
取り敢えずスポットチェック問題なしで完了。
CPU性能に対してストレージ性能が低すぎだが、近藤氏が5兆桁実行時のテストランの1兆桁13日よりは速かった。
短縮のため16進数出力とチェックポイント情報の記録なし。
この程度の日数ならnon-ECCでもビット化け遭遇確率は小さいか? >>519 に下記外付けストレージをThunderbolt接続して1000億桁。
areca ARC-5028T2 (6TB HDD x6、RAID5、Thunderbolt 2/USB3.0対応)
※普段はSandy-E機にUSB3.0接続。これやR6E(初代)で使えるThunderbolt 2/3カードの入手が
今後難しくなりそうなので今回確保。容量を半分くらい使用していて遅いので、全体の1/7だけ
負担させたので効果は小さ目。Optane 905Pは4/7、3TB HDD x8は2/7。
Total Computation Time: 6901.595 seconds ( 115.027 minutes )
Start-to-End Wall Time: 7556.399 seconds ( 2.099 hours )
CPU Utilization: 1892.06 % + 13.70 % kernel overhead
Multi-core Efficiency: 33.79 % + 0.24 % kernel overhead
https://i.imgur.com/CobBW2q.png >>520 に2.5インチSATA SSD(870EVO 4TB)x2のRAID0(USB3.1Gen2接続)を2台追加して1000億桁。
Total Computation Time: 5889.466 seconds ( 98.158 minutes )
Start-to-End Wall Time: 6448.675 seconds ( 107.478 minutes )
CPU Utilization: 2263.73 % + 13.90 % kernel overhead
Multi-core Efficiency: 40.42 % + 0.25 % kernel overhead
Logical Disk Bytes Read: 10,497,042,725,016 (9.55 TiB)
Logical Disk Bytes Written: 8,945,657,129,368 (8.14 TiB) >>519 の1兆桁をストレージを追加して実行
【SSD/HDD 】 Intel Optane SSD 905P 960GB (HHHL) : 起動ディスク、y-cruncher格納
3TB HDD x8(Windowsストライプ): Swap、結果
areca ARC-5028T2 (6TB HDD x6、RAID5、Thunderbolt 2): Swap
2.5インチSATA SSD(870EVO 4TB)x2のRAID0(USB3.1Gen2) x2台: Swap
Total Computation Time: 189695.213 seconds ( 2.196 days )
Start-to-End Wall Time: 204944.302 seconds ( 2.372 days )
CPU Utilization: 1028.23 % + 10.46 % kernel overhead
Multi-core Efficiency: 18.36 % + 0.19 % kernel overhead
Logical Largest Checkpoint: 1,445,538,214,144 (1.31 TiB)
Logical Peak Disk Usage: 5,011,880,284,072 (4.56 TiB)
Logical Disk Bytes Read: 250,958,484,230,952 ( 228 TiB)
Logical Disk Bytes Written: 219,104,283,780,384 ( 199 TiB)
24h経過した頃にストレージ障害で1時間弱中断後再開。10進数結果のハッシュ値は前回と同一。
870EVO 4TB 1台当たりTBWの1%強の書き込み(Swapの1/8を負担)で寿命の大幅な減少なし。
SwapのIOはピーク3400MB/s程度。
開始後6h30mからの画面の動画(5MB、960x1042、59秒、3000倍速)
https://i.imgur.com/K4c2XbB.mp4 >>519 のVGA以外のPCIeレーン全部(x32)にストレージを接続して1000億桁
Total Computation Time: 3228.720 seconds ( 53.812 minutes )
Start-to-End Wall Time: 3435.375 seconds ( 57.256 minutes )
CPU Utilization: 4362.82 % + 34.10 % kernel overhead
Multi-core Efficiency: 77.91 % + 0.61 % kernel overhead
https://imgur.com/a/ZrZ9oHT >>523 のストレージ構成で1兆桁
Total Computation Time: 56871.440 seconds ( 15.798 hours )
Start-to-End Wall Time: 59375.921 seconds ( 16.493 hours )
CPU Utilization: 3880.11 % + 52.67 % kernel overhead
Multi-core Efficiency: 69.29 % + 0.94 % kernel overhead
https://imgur.com/a/vbX3YWB v0.7.9.9509 (March 14, 2022) リリース
Zen3、Tiger Lake (& Cannon Lake) 最適化版追加。(Zen3用はZen2用より遅い場合もあるとのこと)
メモリ使用量削減、他。
00-x86は削除。 めっちゃ久しぶりに更新されたじゃん
以前ほど完璧に最適化してないみたいだけど 皮肉にもesportsの世界では聞いたことがあるし >>79
この人過去に何回も問題発言してきてる数字と合わなかったから放置してたのに >>70
まあSNSでフェミ活動するのをやめれば無くなるんじゃないのか 数メートルおきにテント張るようなキャンプ場でソロキャンだったらクソ笑うわ ■ このスレッドは過去ログ倉庫に格納されています