Intelの次世代技術について語ろう 91©2ch.net
レス数が900を超えています。1000を超えると表示できなくなるよ。
Intelの次世代製品や、それに関連する技術についてのスレッドです。
■前スレ
Intelの次世代技術について語ろう 90
http://egg.2ch.net/test/read.cgi/jisaku/1499796238/ AVX512のせいでコアサイズが5〜6割も大きくなる訳じゃないからいんじゃない
ってのが>>812氏の話かな。
Sky-SPはL2比率が大きい(これもAVX512のためか)のもサイズに効いてくる? Intel「Core i9-7980XE」、「Core i9-7960X」、「Core i9-7940X」
ついにきた18コア「Core i9-7980XE」など3モデルが発売
http://ascii.jp/elem/000/001/575/1575938/ x64命令はintelのEPICアーキテクチャに対するamdのアンチテーゼなのだからx86の呪縛から逃れられないのは当たり前
中長期視野に立った改革でなく目の前の利益を狙ったものだ。だが、それが大いに受けたそれだけ
惜しむらくはintelがitaniumをEPICでなく普通にRISCにして置けば今のような状況には陥らなかったと思う(結果論) >>819
内部ってuOPのこと
IACAを見ればuOPが別な事がわかる x86の呪縛と言っても…
それはアーキテクチャを研究する人の認識であって
アーキテクチャで研究する人とは違うのだから
その辺の齟齬理解しないと >>821
そういうことらしいな。
8C/18C AVX512では残りの10コアが、nonAVXではどちらも
SIMDエリアが遊んでいるからクロックをあげられる、と 28コアのXeon Gold 8180の動作周波数について漏れなく伝えるためには
nonAVAに6種、AVX2に7種、AVX512に9種、合計22種もの数値が必要になった。
コア数とAVXとで2次元の表になっちゃったからな。
2007年まではたったひとつの数字で事足りていた。 >>820
ごめん、一般的なエンコードを想像しながら書いた
(出典のよくわからないデータは読み飛ばすに限る)
>>826
それはL2、L3とかインターコネクトも含めての比較ではってこと?
それはちょっとに比較としてはナンセンスかと >>831 まぁ、元々AVX2→AVX512の話だから、君の話はずれてる。 >>832
TSMCの7nmはビアのみCo、GFの7nmはCuのまま
想定される電流密度にもよるはず / /,, __ `ヽ、
/ /// .. ... ヽ
/ ,、i i / /// / 'ヽ
/ i,,/ ``、ヽl i i / ノ ノ ノ / ヽ
/( i' ..::::::``ii, , //ノノ/,; ',,, ノノ l
iヽ/ ..::: ::: ) ) 彡 彡' |
;ミ! :: ..: :: /ノ 彡 _,, ' .ノ
;ミi(((ii,、 : : :::: /. 彡 _,, ' .ノ ;IntelがAI向けプロセッサをCPUに統合する可能性を示唆!
__,,, --------;ミlヽi_\(( O .: 彡 ノノ.ノ
::::::::::::::::::::::::::::::`| ''\u`、ミi、' i、_,,,,, -'''))) ヽン / ノ
_________::::::::::::::::::|  ̄~/ ミ `、ーu-';_,;;;;''' ),ノ) ノ、
|:::::::::::::::::| .......:: / '~ :::ヽ ̄~~~ /__ノー'---、__
. !:::::::::::::: l| .: , ./、 、 :. ..:;;/、 `:: ヽ
i:::/ ̄'i | ::.ヽ ヽ ー'''' : .::;i~ :: ::. ::
:.. ヽ : ,i | .~''- ,,,,___ ,;/`::.. :::__,, ----=
:::::::... ヽ : i ::| .:"'' ..,,, /i`:::::: .::::::./
\::::::... \| :::| ::: ,, -''"::: \ :::::::/
https://pc.watch.impress.co.jp/docs/column/ubiq/1088131.html IntelがAI向けプロセッサをCPUに統合するとしたらdesktopでAVX512に何をやらせるつもりなのかな? >821 >829
Xeon ScalableのSpecification Updateというドキュメントから
Platinum XCC die
Glod 61xx XCC die
Glod 51xx XCC die、HCC die
Silver HCC die、LCC die
Bronze LCC die
Gold、Platinumでは、HCCやLCCのコア数で
足りるからそちらを使う、とはなっていないらしい 機械学習には学習処理と推論処理があって学習の方ははAVX使うんじゃないの? >>839 6150と6144はどっちもXCCだね。他の事情かね。
※Thermal Guide はS-Specじゃなくてモデル名でダイ種別が書いてあるので分かり易かった。
HCC以下はUPIが2つでGold 5100以下でしか使えないんだっけ。 あとは単純にTDPの差がAVX512 8C動作辺りだと影響してくるとかかね。 AIっつーても半精度のベクトル演算追加程度のもんでしょ
部分的にFPGAみたいなの載せて設定可能なデータフロープロセッサとかやってきたら面白いけど Nervana NNPは結局学習もできるみたいだよ
Xeonだと現行ので深層学習関連のはINT16、INT8サポートしか今のところないけど(4VNNI等はPhi専用だろうし) しかもそれも、AVX2で似たようなのが元々あったものだし >>833-835
skylake-xの上はアンコアっぽいから無視するとしても、最終的に倍近くなってない? メモコンのタイルと見比べると、各タイルの右上か左上にある領域がルーター部で、それ以外はコアとキャッシュ領域な感じ
>>833の解析はたぶん間違い そんなスライドがあったのか
てっきり整然と並んでる上の二段がL2とL3かと思ってたよ
でもルーター部の下と横にSRAMがあればその上の層に配線を通せるから理に叶った配置か
L2がごちゃごちゃして見えるのはバス幅を増やしてるせいかもしれないね >>848
初めて見た
データバスはどうなってるんだろう
skylakeの時点でAVX512に対応できるように
あらかじめ拡張済みだったんかいな 僕たちRyzenブラザーズ!
 ̄ ̄∨ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
AmD AmD
( ・∀・) AmD (・∀・ )
( つ )つ ( ・∀・) /( б ) age
l⌒__ノ (○ ) ∪⌒__ノ age
し' し' (_)`∪ノ (_/ ヽ_)
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
AMD,ノートPC向けの新世代APU「Ryzen Processor with Radeon Vega Graphics」発表。「性能はKaby Lake-Uを上回る」
http://www.4gamer.net/games/300/G030061/20171025016/ >>843
AI向けプロセッサをCPUに統合するとしたら「サファイアラビッド」からの可能性大! SkylakeでAVX-512は実装済
HTTや64bitのようにオフにしてただけ skylakeにはAVX-512の回路が載ってるコアと載ってないコアの2種類がある
これについては>>848の記事に詳しく書いてある 疑問に思ったのはデータパスなどだってばよ
port5にFMAユニット追加ということは
port5は元から256bit FMAユニットを使いこなせるように作られてたの?ってこと
つまりポン付けでFMAついかすればいいようになってたのかってこと 載ってる・載ってないの違いがあるのは2つめのFMA演算器で、内部的にはAVX-512対応済みで無効化しているだけだと思う(有効化してもAVXとスループット変わらんけど) なんか不正確
AVX512はSkylakeから載っている(と思われる)
演算ポートが1個の物と2個の物がある
Skylakeは1個、SkylakeXは2個
1個だと256bit 2個からは性能が上がらない
性能の低いAVX512のリリースはAVX512の普及を妨げる為、マーケティング上の戦略で無効にしたんでしょう その割にはXeon SilverとかGold下位とかFMAポート1個しかないのも売ってるけどなんでかな(差別化要因?) その辺は、アホがAVX512は使えないって騒ぐことは無さそうだから
とか? 当然、バリバリ演算するならもっと上を買えって意味も > 疑問に思ったのはデータパスなどだってばよ
何語だ?
日本語でいいよ AI新命令のターゲットは、推論+小規模な学習じゃないの?
エッジ用の
大規模な学習は、専用のDNNアクセラレータなり、nvidiaのカードなり使うでしょ? >>857
誰もskylakeに実行可能命令としてAVX512が実装されているかどうかを聞いてるんじゃない
早い話が>833,848のスライドでいう追加されたAVXユニットの隣が
そのAVXユニットにデータを供給するために追加されたバスの可能性はないの?ってこと http://www.numberworld.org/y-cruncher/news.html#2017_8_15
メモリ帯域がボトルネックになるプログラム
1 billion digits of Pi - Core i9 7900X @3.8GHz
AVX2 2133MHz メッシュ2.4GHz
51.624s
AVX512 2133MHz メッシュ2.4GHz
45.468s
AVX2 2133MHz メッシュ3.2GHz
50.448s
AVX512 2133MHz メッシュ3.2GHz
44.291s
AVX2 3400MHz メッシュ2.4GHz
47.233s
AVX512 3400MHz メッシュ2.4GHz
38.405s
AVX2 3400MHz メッシュ3.2GHz
45.451s
AVX512 3400MHz メッシュ3.2GHz
36.355s
L2に最適化すればもう少しどうにかできるかもしれないらしい
いまのところ多コアのXeonでクロック下がる分は取り戻せない http://www.numberworld.org/y-cruncher/news.html#2017_7_6
メモリ帯域がボトルネックにならないプログラム
10 billion Hex-Digit of Pi - Plouffe's 4-term BBP Formula
Core i9 7900X @4.0GHz
4 threads/4 cores
AVX2
113.700s 94W
AVX512
59.900s 134W
8 threads/8 cores
AVX2
57.146s 159W
AVX512
30.061s 239W
こっちはかなり効果的 性能上がる分そのまんま消費電力も増えてる感
これがAVXと通常命令混雑の時、どうなるか…… >>870 交じり具合によってはy-cruncherの人が書いてる"Phantom throttling"
にするってことなんだろうね。
AVX512の高消費電力命令が来たとき、直ぐに電圧上げたりクロック落としたり
できないから、その間は通常命令はそれまでのクロックで実行し、AVX512は
半速で処理して電圧が下がるの防ぐってことかね?
>>867のは十分電圧上げた設定で"Phantom throttling"にならないようにして
全力性能出させたみたいだね。 >>873
上と下でタイム全然が違うのは
上Chudnovskyの公式
http://円周率.jp/formula/ramanujan.html
普通のπの計算
下BBPの公式
http://円周率.jp/formula/bbp.html
16進数表記でn桁目の値だけを求める
で計算してるものが違うから
>>867のBBP Formulaの方はプログラムとデータがほとんどキャッシュに収まってAVX512で性能上がった分がかなりタイム上昇につながってる
純粋なSIMD性能に近いのはこっち
>>866のメモリ帯域ベンチ色が強くなるChudnovsky Formulaモードだとメモリ帯域足りなくて使い切れてない
シングルスレッドならそれが緩和されてそれなり?に速くなってる >Memory bandwidth is a significant bottleneck:
>y-cruncher was already slightly memory-bound on Haswell-E.
>Now on Skylake X, it is much worse. While I had anticpiated a memory bottleneck on Skylake X with AVX512,
>it seems that I've underestimated the severity of it:
>
>
>(The CPU frequencies in this benchmark were chosen to be low enough to avoid any throttling or phantom throttling.)
1 billion digits of Pi - Core i9 7900X @ 3.8 GHz
1 thread 2133 MHz
AVX2
444.434s
AVX512
325.543s
20 threads 2133 MHz
AVX2
51.884s
AVX512
45.658s
って書いてあるしPhantom throttlingは起きてないんじゃないかな
>>866
1 billion digits of Pi - Core i9 7900X @3.8GHz
AVX2 2133MHz メッシュ2.4GHz
51.624s
AVX512 2133MHz メッシュ2.4GHz
45.468s
メッシュを3.2GHz、メモリを3400MHzより上に設定すると不安定になり始めるみたいだけど
http://hwbot.org/submission/3593822_mysticial_y_cruncher___pi_1b_core_i9_7900x_38sec_522ms
https://d1ebmxcfh8bf9c.cloudfront.net/u45658/image_id_1868317.jpg
y-cruncherの作者Mysticialさんの環境だとChudnovsky Formulaモードでサーマルスロットリングが起きないぎりぎりのラインが4GHz
それで3.8GHzまで落としてる http://www.overclock.net/t/1634045/skylake-x-phantom-throttling
http://cdn.overclock.net/5/50/50df5c97_phantom-throttling.png
Phantom Throttlingってのはクロックは変化せず温度と消費電力が急激に低下する現象につけた名前らしいね
それにともなって性能も半分以下に低下
負荷がかかってVCCINが1.65v辺りまで低下すると起きるとか
解決方法は上に書いてあるけどOCする人ならいじる設定なのでそういう人は起きにくいはず
こっちが普通のサーマルスロットリング、クロックダウンしてるけど性能低下はPhantom Throttling程ではない
http://cdn.overclock.net/e/e3/e38d087c_phantom-throttling2.png
y-cruncherのサイトの"Phantom throttling" of performance when certain thermal limits are exceeded:の項に行って
Clock Speedの4GHzの数字のリンクでクロックは変化してないのに温度と消費電力は下がってる所のモニタリングソフトの画像が見られる
http://www.numberworld.org/y-cruncher/news.html#2017_7_6 >>874 いや、>>866がメモリ帯域ネックなのは理解してて、"Phantom throttling"で
AVX512が性能出てないと言ってるわけじゃない。
あくまで、「>>867は」"Phantom throttling"の影響がほとんどない状態の結果のようだ
と言っただけ。
"Phantom throttling"は、>>873に書いたように意図的にそうしてるんだと思ってる。
ベンチマーカーなんかは、Xeonの定格なんかからかなり外れたところで動かすから、
y-cruncher、Sandra、IntelのLinpackとかAVX512使ったベンチでは設定に注意が
必要そうだね。Sandarだと7900Xの人達は大分限界まで追い込んでる感じがする。 Intel 10 nm CPUs to See Very Limited Initial Launch in 2017
https://www.techpowerup.com/238307/intel-10-nm-cpus-to-see-very-limited-initial-launch-in-2017
誰でも目にできるのか分からないが今年中に出ることは出る模様
大量に店頭に並ぶのは来年後半 >>877
こっちの読み方が悪かった、ごめんね
Phantom throttling中でもAVX性能だけ下げてAVX使わない処理はクロック表示分の性能出るかもしれないってことね
y-cruncherの作者によれば実際はクロックダウンしてるけどモニタリングソフトだと読めないらしんだけど、どうなんだろう
結構謎が多い現象 >>880 先週末はSkylake-Xスレで買った人の話があって、OCで一般命令の
クロックを(無駄な電圧掛けないようにして)上げられるところまで上げて、
かつAVX512も上げられるところまで上げる上手い方法がないようだった。
消費電力が何倍も違う命令が入り混じってるのは難しそうだね。
※FIVRがどんなに速くても、出力変化させるのに百クロック単位の時間が
掛かりそう。 それこそヘテロジニアスマルチコアにした方がよかったんでは
AVX512処理専用コア コア別れてるとレイテンシが大きいしプログラミングもめんどいからそれGPGPUでよくね?
ってなってしまうしそこは譲れないところな気がする / ̄\
| 淫厨 | ____
\_/ / 時 .あ ま ヽ
| .| 間 .わ だ |
/  ̄  ̄ \ .| .じ て |
/ ::\:::/:: \ | ゃ る |
/ .<●>::::::<●> \ | な よ |
| (__人__) | ヽ い う /
\ ` ⌒´ / \ な /
, __. ィイ´ |:|: 〃 `i,r-- 、_  ̄ ̄
〃/ '" !:! |:| :、 . .: 〃 i // ` ヽヾ
/ / |:| ヾ,、` ´// ヽ !:! '、`
! |:| // ヾ==' ' i i' |:| ',
| ...:// l / __ , |:|::.. |
とニとヾ_-‐' ∨ i l ' l |< 天 ヾ,-、_: : : .ヽ
と二ヽ` ヽ、_::{:! l l ! |' 夂__ -'_,ド 、_}-、_:ヽ
“Cannon Lake”は今年中にごく少量出荷される模様―本格出荷は'18Q2
https://www.techpowerup.com/238307/intel-10-nm-cpus-to-see-very-limited-initial-launch-in-2017 >>885
なぁに
重SIMDアレイなんて下手すりゃL3よりレイテンシあるようなもん
ノーカンノーカン >>881
skylake-xでFIVR復活してたんだ
初めて知った
>>888
一般向けに(安価に)出回らなかったのが痛い
もっともCPUクロックと大きく乖離したコプロは使いずらそうではある Knights LandingはフロントエンドがAtomだから貧弱すぎて2ポートあるAVX-512のポートを埋めづらいので性能を出しにくいらしいね データシートのVoltage and Current Specificationsによると、電圧の種類は
Haswell の1+1(memory) ほど極端ではなくIOやSystem Agent の電圧は
別で入力するみたいだ >>890
まあただGPGPUよりかは良さげだが
スケーラビリティでも今のとこペタスケールのDL出来てるのってPhiだけだし >>890
人間が気合と根性入れないと性能が出ない
古き良きプロセッサみたいですな >>889
LGA2066環境はFIVRのskylak-Xと非FIVRのkabylake-Xの両環境に対応している! Skylake-X乗ってるときはIVRにとってのinput電圧となる1.55〜1.8Vほどを印加
KabyLake-X乗ってるときはVIDに従い直でCPU Voltageを供給 Google Pixel 2にはPixel Visual CoreというGoogleが開発した画像処理ASICが載ってるんだけど
分解してみたらこのチップにintelのロゴが付いていた模様
開発にまで関与しているのか製造を請け負っただけなのかは不明
https://www.ifixit.com/Teardown/Google+Pixel+2+XL+Teardown/98093 リスク生産開始が来年Q2って誰も使わなくね?
Intelはもうファブに投資するのやめるの? これ見るとIce Lakeは2019年Q2か…
その頃Zen2出てるから負ける >>899
せっかくインテルFab使う気だったとこが続々とファウンドリに切り替えてるらしい >>902
そういうソースはないけど、そこで作るとしていたメーカーがtsmc向けに設計しなおしてるって噂はあった つまるところ「続々と切り替えてる」は誇張という訳ね 確かに誇張だろうな
続々というほどIntelに顧客はいないからね PanasonicやARMどうなった?
Intel使った製品は出てきて無いよな
┼/\ ___ ヽ _|_ ___ -┼- ヽ __ .―フ
┼ .土 / |_ |/―┐ / ヽ .田  ̄/ / ∠_
.、| 口 \ 、_) /|. 〈_、 \ //|\ /´ヽ_ \ o_)
r‐┐ r‐┐ r‐┐
|_|. __ .__| |__ .| |
| ̄| | ̄!'´. `ヽ |__ __| | |
| | |. .r"⌒ヽ .| | |. ___ | |
| | | | | | | | ,r''" .`ヽ | |
| | | | | | | !__i'. ,r"⌒ヽ i| |
|_| |_| |_| !、___ _ ̄ ̄ __.,|
! !、 ̄ ̄,―,
ゝ、_  ̄ _ノ
_ ._l_ ._l_  ̄ ̄
\/\// /|\ /|\ / __ _/_ │ │ ─┼─ | _/__
/ ┬┬ \ 二二二二 | / \ L │ ─┼─ | ./ __
─┼┼─ / | ヽ | / ___| │ r―┼ヽ | /
/ |_/ / 、| ヽ レ \_ \ノ\ ノ \ノ \ ヽ_ノ ./ \__ >>900
珈琲8コアとZ380の投入時期は18年8月と予想されてらから、アイス登場の19年4月以降まで7か月以上のブランクが生じる事になる。 自分たちの製品の方が調整が早く終わるんだからよその製品より早く出るに決まってるだろ
ICEは17Q4か18Q1 >>912
すごく間違えた
ICEは18Q4か19Q1 >>914
たぶんね。10nm今年出すとかいってるみたいだけど、この段階で特定モバイル向けに
ごく少量しか出せないようじゃどうあっても来年全量まかなえないし。
となれば、当然一番熱の拘束緩いデスクトップ向けが置いて行かれるのは必然。
バックアッププランとしてRefresh版くらいは用意してるだろ。Icelakeは2019年とみる。 レス数が900を超えています。1000を超えると表示できなくなるよ。