X



【エラッタ?】Ryzen SEGV検証Part.3【おま環?】 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0001Socket774 転載ダメ©2ch.net (ワッチョイ 833e-GoLR)
垢版 |
2017/06/30(金) 18:32:08.07ID:V+GW3dep0
!extend:on:vvvvv:1000:512
↑を2行冒頭に書いて下さい。(1行分は消えて表示されません)

次スレは>>960を目処に。重複防止の為、宣言してからスレ立てをお願いします。

前スレ:
【エラッタ】Ryzen SEGV問題 Part.2【AMD】
http://egg.2ch.net/test/read.cgi/jisaku/1498476311/

参考リンク:
gcc segmentation faults on Ryzen / Linux
https://community.amd.com/thread/215773
Ryzenにまつわる2つの問題 - 覚書
http://satoru-takeuchi.hatenablog.com/entry/2017/04/24/135914
日記 (2017 年 6 月下旬) - hdk のページ
http://www.e-hdk.com/diary/d201706c.html
GitHub - hayamdk/ryzen_segv_test: RYZEN SEGV test code
https://github.com/hayamdk/ryzen_segv_test
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured
0030Socket774 (ワッチョイ 6d84-DVJb)
垢版 |
2017/07/01(土) 01:05:07.75ID:JvIBA16V0
>>26
それはコンパイルした結果のコードを実行した際にSEGVが出る原因を解説した記事であって
プログラムの書き方とかIntelコンパイラの仕様の話だと
前スレでも指摘されてるのに懲りないのな
0034Socket774 (ワッチョイ 6e74-uerO)
垢版 |
2017/07/01(土) 09:00:16.45ID:FeGnnQ6k0
4コアの不良品を2コアとして低級品に再利用してるのも不良品の有効活用なわけで
別にCPUに限った話じゃなく、建材だってA級品B級品あるわけで、抵抗やコンデンサ、コイルやFETもそうでしょ
んな当たり前のこと知らない人居るのかな
0036Socket774 (ワッチョイ 4267-vtNh)
垢版 |
2017/07/01(土) 09:20:55.33ID:748LpSbW0
>>27
今回の件は不具合の出やすい個体/出にくい個体があるみたいだから
これを選別してるんじゃないかと勘繰るのは仕方がない。
特定の回路でタイミング制約を間違って論理合成したか
メタステーブル対策をミスったんだろう。
まともに選別すると歩留まりが悪すぎたんで、ごく稀に誤動作する程度のものは
出荷することにしたんだと思う。
0040Socket774 (ワッチョイ 2e5c-uerO)
垢版 |
2017/07/01(土) 10:34:36.96ID:OjOE6K1F0
>>34
AMDのRyzenは8コアダイしかないんだろ。それの不良品やコア殺しを下位に回すって感じだからな
Intelの105xものは4コア、2コアダイがあるって聞いたことがあるが。
まぁ、安くてx8より個数が出るであろうRyzenの6・4コアを8コアダイの不良を期待して作るって
かなりの不良率期待になるからな。で、生産コストは上位の8コアと一緒
0046Socket774 (ワッチョイ 2e5c-uerO)
垢版 |
2017/07/01(土) 13:06:21.30ID:yLFoOiqi0
AMDのLinuxでコンパイルするときはGCCではなく、AMD提供のAOCCを使えってこどだな。
このClang/LLVMコンパイラはカーネルもビルドできるようにAMDが頑張ったんだろな
0049Socket774 (アウーイモ MM25-+k/C)
垢版 |
2017/07/01(土) 17:48:10.11ID:6XGs0OJCM
RYZEN用に最適化が完全にできてないだけ
最初からわかってる事
新しいアーキテクチャなんだからよくあること

交換騒いだやつは土下座
0050Socket774 (ワッチョイ 2d63-CicO)
垢版 |
2017/07/01(土) 18:36:05.32ID:IrZEpoL90
結局はエラッタじゃなくコンパイラーが腐ってただけか
そりゃ環境や状況揃えても再現出来ないわな
0052Socket774 (ワッチョイ 2e63-k1q/)
垢版 |
2017/07/01(土) 18:50:00.93ID:WW/T/mcD0
>>50
んなわけねーだろ
どんな腐ったプログラム実行しても、命令ポインタがずれて実行されるなんてことは起こらない
0053Socket774 (ワッチョイ 2e63-k1q/)
垢版 |
2017/07/01(土) 18:56:09.96ID:WW/T/mcD0
アーキテクチャが変わって最適化が不十分でパフォーマンスが発揮されない、
とかの問題と、
そもそもプログラムが正常に動作しないってことの違いぐらいは区別付けてくれ

百歩譲って対応してない命令を実行したとかで動作しないことがあったとしても、
(実際にFXで対応していたいくつかの命令はZENで非対応になってる)
それと命令ポインタがずれることは全くレベルが違う問題
0054Socket774 (ブーイモ MMb6-ovUu)
垢版 |
2017/07/01(土) 18:57:19.79ID:Y/Kt/HDRM
エラッタをソフト側で吸収してくれるコンパイラってことかもな
そもそもエラッタではなく仕様ですAMDのコンパイラ使ってくださいと言われたら終わりな話に
0062Socket774 (オッペケ Sr71-E8g9)
垢版 |
2017/07/01(土) 19:58:50.21ID:CEGrKWBJr
5/1付でAMDの対応は終わっていた訳だな
そりゃあフォーラムから追い出されたりAMDに塩対応されたりしても仕方無いわ
0065Socket774 (ワッチョイ 426e-D66J)
垢版 |
2017/07/01(土) 20:38:18.70ID:ejAhFLTl0
素人ながらに少し調べてみたんだが
AMDフォーラムではLow-Latence-Kernel(ASLRオフ)で60時間以上エラーなしということで
このカーネルがどう違うのかという所でubuntu studioのwikiより

・カーネルにCONFIG_PREEMPT_RTパッチを適用したリアルタイムカーネルを利用する
・カーネルの設定を変更しタイマー割り込みの頻度を増やす
・PAMの設定を変更し、アプリケーションのカーネル・スケジューラー内での処理の優先度を変更する

ここでタイマー割り込みの頻度を増やすという所をまず調べてみた
かなり古い記事なんだけどここを見ると
http://www.atmarkit.co.jp/flinux/rensai/watch2005/watch08a.html
カーネル2.6.13-rc1にて、タイマー割り込みの頻度「HZ」がデフォルト1000から250に変更されている
今現在のカーネルのデフォルト値がどうなのか分からないが取りあえず1000に戻してみるのもいいかもしれない
(ubuntu studioは1000)

>割り込み頻度(つまりHZの値)を歴史的に見ると、
>例えばi386アーキテクチャにおいては「100」というように、
>アーキテクチャごとにそれぞれの値が設定されていました。

ともあるようにデフォルト値ではZenアーキにそぐわない値なのかもしれない

PAM設定というのがよくわからないのだけれども
処理の優先度を変更は具体的にどう変更したらいいのかはわからない

詳しい人補足・修正よろしく
0068Socket774 (ワッチョイ 425f-X7Kb)
垢版 |
2017/07/01(土) 20:46:14.24ID:0on31ltG0
>>67
自分のSEGV出る1700も同じだったよ
メモコンの出来にバラツキがあってメモリとの相性が悪いだけなのかも
0069Socket774 (ワッチョイ 2e5c-uerO)
垢版 |
2017/07/01(土) 20:59:41.84ID:fg4ZRu/30
まとめるとこんな感じかな。
WinでもLinuxでも汎用カーネル使うと色々問題が起こるから
Zen用にチューンしたカーネルをWinでもLinuxでも使ってね(ASLRがOFFってセキュリティ的にどうなんだ感があるが)。
そして、汎用カーネルだと既存のソフトで問題が生じる場合があるから、その時は
Zen用のWin/Linuxコンパイラでコンパイルしたのを使ってねと言うことだろう。
と言ううことで、時期にMSがZen用Winカーネル、そして、AMDがWin用コンパイラ出すだろう。
0072Socket774 (ワッチョイ 6187-k1q/)
垢版 |
2017/07/01(土) 21:29:40.66ID:EEZQHSVK0
>>69

まとめるまえに、カーネルがなんなのかを勉強したほうがいいよ。
0073Socket774 (ワッチョイ 2e63-k1q/)
垢版 |
2017/07/01(土) 21:38:33.40ID:WW/T/mcD0
>>71
大きけりゃいいってもんじゃないからな
リアルタイム用途、デスクトップ、サーバーでは最適な値は異なる

Windowsも単純に1msの割り込みということではなかったはずだが?
timeBeginPeriodの設定値とかによって変動するはず

そして、Linuxでは最近は一定の割り込み周期じゃないTicklessカーネルになってたような
0074Socket774 (ワッチョイ 6d84-DVJb)
垢版 |
2017/07/01(土) 21:41:47.97ID:JvIBA16V0
AMDがどうのではなく
検証コードをclangでビルドしても再現しないってだけじゃないのという気もする
0076Socket774 (ワッチョイ 426e-D66J)
垢版 |
2017/07/01(土) 21:53:06.39ID:ejAhFLTl0
>>73
分からないので調べた
ticklessでアイドル時間を長くして消費電力を抑えるということですな
これだけがエラーを引き起こす原因だとは言えないのですね
http://sssslide.com/www.slideshare.net/hirakutoyooka/toyooka-kernelvm-fulltickless
http://mako-limone.blogspot.jp/2010/06/ticklesskernel.html

それとは関係なくPAM設定による優先設定なんかは分かりますか?
0077Socket774 (ワッチョイ c103-edpK)
垢版 |
2017/07/01(土) 21:54:33.13ID:rzVPMPVv0
clangでもmakeでエラー出たって
amdの公式スレに書かれてたから
gccだけの問題ではないかもしれないし
別かもしれない
0078Socket774 (ワッチョイ 2e5c-wjSU)
垢版 |
2017/07/01(土) 21:59:14.16ID:nlNUMe+k0
AMDはもうとっくに原因解析してわかってるはず
なぜダンマリなのかはわからん

1.BIOSアップデートで対応可能、後日発表

2.BIOSで修正不可、コストがかかる全数リコールしなくてもいいように、
  法務や弁護士等と対応策を打ち合わせてる

このどちらかとおもう

案外2.なのでは?
0079Socket774 (ワッチョイ 6d84-DVJb)
垢版 |
2017/07/01(土) 22:02:56.96ID:JvIBA16V0
一応補足
例の検証コードはCPUの内部状態がある特定の状態になったら異常が起きるのではという仮定のもと
最小限の特定の命令パターンを実行することでそれを再現しようとしているので
コンパイラが変わることで微妙に動作が変わり再現しなくなってもおかしくはない
よって、あるコンパイラでこの検証コードをビルドしてもNGが出ないからといって
検証コード以外でもそのコンパイラを使えば常にOK、という話ではない
0080Socket774 (ワッチョイ c103-edpK)
垢版 |
2017/07/01(土) 22:16:27.48ID:rzVPMPVv0
>>78
せめてAMD公式スレに社内で再現した再現しないよ程度のレスは欲しいですね
見落としかもしれませんが
0081Socket774 (ワッチョイ 428c-jrEh)
垢版 |
2017/07/01(土) 22:17:56.07ID:iXGoeVAy0
ポインタが不可解にズレること自体は事実なんだよね?
そこんとこはっきりしてほしい
0083Socket774 (ワッチョイ c103-edpK)
垢版 |
2017/07/01(土) 23:47:22.10ID:rzVPMPVv0
スレの範疇を超えてるので回答がないね

>>76
済まない何が知りたいのか良く解らないけど
見てると思われるubuntu studio wikipedia日本語の内容は古いので
PAM認証は忘れて英語版を見て欲しいってのと
公式スレでlowlatencykernelって言ってる人は
perf: interrupt took too longメッセージを
回避するにはコアのロックが問題っぽいので
方法としてコレを試したら安定したって所を
ゆっくり読んで欲しい
(内容が正しいとは言ってない)

なんとかtimerのdefault設定とか知りたいならできるだけ
新しいmenuconfigによるkernel設定などをググってみると
全貌が掴めるかも
0084Socket775 (ワッチョイ 61be-+k/C)
垢版 |
2017/07/02(日) 00:19:17.03ID:YLeJweeH0
>>75
結論はそういうことだ
コンパイラ側の調整不足
AMDはRYZEN用にコンパイラ公開してるし答える必要も無いと判断してると思うぞ
0085Socket774 (ワッチョイ c103-edpK)
垢版 |
2017/07/02(日) 00:23:30.61ID:MBJ3PhJy0
って書いてたらsegfault出てた

kernelソース一式をwd740 (raptor) に入れて-j16
internal compiler error: segmentation fault
1回/33回

■環境 要望あれば詳細も
1700@3.0GHz&Spire, AB350M Pro4
Corsair VenLPX M2Z 2666 8GBx2
960EVO (, WD740),ファンx2(open)
SST-ET550-B 1系統専有/接地無/50Hz
xubuntu 17.04 & apt upgrade済
tmpfs無し、涼し目の環境

■履歴
テストa) -j16で1/50 ill inst
テストb) -j1 *16 で1/64 segf
テストc) -j4 *1で0/10(遅過ぎで中断)
 ここまで全て960evoのみ接続
テストd) evo+hdd -j16で1/33 segf

後はなんだっけ?
0090Socket774 (ワッチョイ c5c8-a07H)
垢版 |
2017/07/02(日) 02:25:42.36ID:tU+tq0050
というかEPYCのレビュー色々見たけどSEGVのことスルーして絶賛ばかりだな
それもWindows上のベンチだけじゃなくSPECとか測ってるような連中が
サーバーで致命的とかいう話は何処にいったんだろう
0091Socket774 (ワッチョイ 6e74-uerO)
垢版 |
2017/07/02(日) 03:42:37.41ID:TZ+M2J1n0
>>88
VisualStudio2015とか7zipとか古い結果と比較できるように2年以上前の使ってるんじゃないかな
全部取り直すなら最初からVS2017使えば良いわけで
SDKも15063使わないならスレッドの割り当てうまくいかなくて遅くなるかもね
まぁ2017は拡張機能とか対応してるのが2015より少ないから手動で環境変数設定したりちょっと面倒な点はあるけど
それが出来ないほどアホじゃないだろうし
0092Socket774 (ワッチョイ 61be-+k/C)
垢版 |
2017/07/02(日) 03:55:02.16ID:YLeJweeH0
この騒動は次のステージに突入
交換要求したがB1送られる
石はテストで問題無い物が送られてるのは当然でB1には問題ないことが判明
交換品で問題出たらコンパイラ側の設定や最適化に問題
AMDはryzen用に謹製コンパイラ公開済み
satと取り巻きは早とちりの土下座レベル
0093Socket774 (ワッチョイ b16a-ImDA)
垢版 |
2017/07/02(日) 05:28:31.26ID:UbBDqQPp0
メモリ、マザーボードの初期不良同様3回目の修理に出して販売店や代理店に任せておけばいいものを
早とちりというよりはフリーランスになったから自分の宣伝をしたかったんだろう
6月24日に広報とか言ってるツイートがあるが、この言葉が本音を表しているとしか思えない
0094Socket774 (ワッチョイ 425f-X7Kb)
垢版 |
2017/07/02(日) 12:43:13.22ID:rzgx1i0Q0
替えのCPU届いた人、交換後はエラー出てないようだ
エラッタじゃなくて不良品だったということなのかな
0095Socket774 (ワッチョイ c5c8-a07H)
垢版 |
2017/07/02(日) 13:26:46.87ID:tU+tq0050
中身はRyzenPro同等品だったりして
企業向けな分選別厳しそうだからそれをクリアしたものなら出無さそう
0096Socket774 (ワッチョイ 6174-R8v4)
垢版 |
2017/07/02(日) 13:39:30.12ID:MItDo5em0
ryzen買ったらgccで動作確認するのが当たり前だよね

ってか?
0099Socket774 (ワッチョイ 6e74-d1DY)
垢版 |
2017/07/02(日) 14:51:39.49ID:TZ+M2J1n0
>>94
世の中には定格だから動いて当たり前と思っていてPrime95すら回さない馬鹿が居る
そういうやつは初期不良の切り分けも出来ない、さっさと初期不良交換してもらえば済む話なのにな
うちの1700もメモリOCしたりしてPrime95でエラー吐く設定ならNG出ることあるけど、
Prime95でエラー吐かない設定ならNG出ないし
RyzenはDDR4-3200 CL16でOCCT:CPU/Linpackが1時間通っても、
Prime95 FFTsize=384を回すと即エラー出たりするからね(CL緩めると出ない)
AVX頼みのIntel用の負荷テストプログラムじゃまともに負荷かからんのよ
Prime95みたいにカスタム設定あるやつはまだ何とかなるけどOCCTみたいな細かい設定が出来ないやつはRyzenだとエラー出にくいブロックサイズで延々回すだけだし
問題無いように見えてもopcache切ってキャッシュヒット率下げてメインメモリのアクセス頻度上げたらPrime95即落ちってのもあった
0108Socket774 (ワッチョイ c5c8-a07H)
垢版 |
2017/07/02(日) 16:53:47.45ID:tU+tq0050
このスレの人たちですら実用上問題ないと言ってるからな、普通に使ってる人はSEGVの存在すら知らないだろう
0110Socket774 (ワッチョイ 2e5c-+k/C)
垢版 |
2017/07/02(日) 18:42:44.53ID:lyWo1AGy0
段々とsatと取り巻きのエラー検証に無理が来てるのが分かる
普通に考えて交換品で問題あるやつ送るわけないだろ
さっさと土下座しとけって
0111Socket774 (ワッチョイ c103-edpK)
垢版 |
2017/07/02(日) 18:50:40.64ID:MBJ3PhJy0
吉報かな?
gcc 7.1.1 (fedora26beta)
56scriptでkernel make -j16
1100回回してエラー0
環境は前回と同じ(hddは外した)

一周20秒ってなんか爆速なんだが
make cleanはしてるみたいだ

出来る人は追試頼みます
0112Socket774 (ワッチョイ c103-edpK)
垢版 |
2017/07/02(日) 19:00:37.61ID:MBJ3PhJy0
厳密にはmake対象のstable kernelが
.7から.8に変わってる(kernel.org側)
fedora側も同じ系統

後はカーネル屋さん達に任せよう
0114Socket774 (ワッチョイ c23b-WwN4)
垢版 |
2017/07/02(日) 19:04:44.82ID:Vq/ULSbh0
なんか、linuxの環境変数が変な値を設定していて
それを忘れていて、実行してエラーとか、
そういう気配すら感じる

ハード的・ソフト的両面でおま環・・・・
0116Socket774 (ワッチョイ c103-edpK)
垢版 |
2017/07/02(日) 19:19:26.07ID:MBJ3PhJy0
fedora25/CentOS7では試してないので
比較したら面白いかも

でもなんでこんなに早くなったのか
全然わからん
0118Socket774 (ワッチョイ b1c0-ImDA)
垢版 |
2017/07/02(日) 19:50:59.86ID:YN7u6avN0
B2送られてくると思い込んでたら送られてきたのがB1だから目論見外れて日和ってんだろ
0120Socket774 (ワッチョイ 6e74-d1DY)
垢版 |
2017/07/02(日) 22:08:47.00ID:TZ+M2J1n0
そもそもSEGVを理由にすれば当りを引けるまで何度でもおかわり出来る時点で問題だな
そのうち交換品を代理店側でチェックしてからじゃないと発送しないとかになりそう
0123Socket774 (ワッチョイ 2e63-izR5)
垢版 |
2017/07/02(日) 22:15:49.34ID:BTrSzPRI0
どんな不具合があろうと、AMDが公式に記載するまではエラッタではない
エラッタってどういう意味の言葉だと思ってる?
0124Socket774 (ワッチョイ 2d63-CicO)
垢版 |
2017/07/02(日) 22:49:04.33ID:SH3p82Xk0
調べてきた

エラッタ 【 errata 】 エラータ
誤字、誤植、誤写などの意味を持つ英単語。
また、転じて、印刷物の誤字などの訂正表、正誤表という意味もある。
“errata” は複数形(「正誤表」の意味では単数形)で、単数形は “erratum”。

半導体の分野では、LSIチップの論理回路などに存在する
構造上の欠陥や設計ミスなどのことをエラッタということがある。
また、出荷後の製品に存在するそうした欠陥や本来の仕様との相違などを
まとめた文書のことをエラッタという場合もある。

ふんわりしててよくわからないや
0126Socket774 (ワッチョイ 2e63-k1q/)
垢版 |
2017/07/02(日) 22:54:51.64ID:BTrSzPRI0
本来は正誤表という意味
そこから派生して、「本来の仕様との相違などをまとめた文書」が半導体の文脈でいうエラッタ

つまり文章にまとめられるまではいくら状況証拠的に不具合があろうとそれはエラッタではない
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況