Intelの次世代技術について語ろう 90 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
Intelの次世代製品や、それに関連する技術についてのスレッドです。
■前スレ
Intelの次世代技術について語ろう 89
http://egg.2ch.net/test/read.cgi/jisaku/1498367186/ 見どころが山盛りある
second FMA outside of Skylake coreってことは、クライアント向けは今後も1FMA(port 0/1)で行くのだろうか
L2が増えたのもサーバ向けが特別という感じの表現だ
Skylake-SP自体も興味深いが、セットのLewisburgがクローズアップされてるのは面白い Broadwell-EP(intel Broadwell) VS Skylake-SP(intel Skylake) VS EPYC(AMD Zen)
デュアルXeon E5-2699v4 VS デュアルXeon 8176 VS デュアルEPYC 7601
メモリーサブシステム帯域幅
http://images.anandtech.com/graphs/graph11544/87247.png
マルチスレッド整数パフォーマンス
http://images.anandtech.com/graphs/graph11544/67413d.png
Javaのパフォーマンス「販売時点リクエスト、オンライン購入、およびデータ・マイニング・オペレーションのミックスを扱うITインフラストラクチャと世界的なスーパーマーケットの会社に基づいて使用モデル」
MultiJVM SPECJbbテストの最大スループット数
http://images.anandtech.com/graphs/graph11544/67413maxjops.png
応答時間制約の下でのスループット数
http://images.anandtech.com/graphs/graph11544/67413criticaljops.png
浮動小数点パフォーマンス
浮動小数点C線4K
http://images.anandtech.com/graphs/graph11544/78012.png
浮動小数点:POV-Ray 3.7
http://images.anandtech.com/graphs/graph11544/87248.png
浮動小数点:NAMD
このベンチマークの最初のショットでは、古いデータセットと比較できるようにバージョン2.10を使用しました。
http://images.anandtech.com/graphs/graph11544/78011.png
バージョン2.12は「インテルのコンパイラのベクトル化を利用し、自動ディスパッチはAVX命令をサポートするIntelプロセッサのパフォーマンスを向上させている」と思われます。だからもう一度試してみましょう
http://images.anandtech.com/graphs/graph11544/87250v212.png
システム消費電力比較
SKU TDP
アイドル消費電力
最低のレスポンスでの消費電力
100%CPU負荷での消費電力
デュアルXeon E5-2699 v4 2×145W 106 412 425
デュアルXeon 8176 2x165W 190 300 453
デュアルEPYC 7601 2x180W 151 321 327
http://www.anandtech.com/show/11544/intel-skylake-ep-vs-amd-epyc-7000-cpu-battle-of-the-decade/22
デュアルXeon 8176 TDP165Wが453WでTDPよりかなり高めの消費電力で詐欺が判明
デュアルEPYC 7601 TDP180Wが327WでTDPよりかなり低めの消費電力が判明 Xeon 8176消費電力高すぎ
お願いだからTDP165Wとか詐欺やめてくれ
https://goo.gl/n5SMvc EPYC の UP モデル安いな
安価サーバーは結構な割合でこっちに流れるか? Platinumだけが8S以上対応で、Goldだと4Sまでっぽい
サーバベンダが出してくる4Sサーバの価格がどうなるかは気になるところ ,/:::::::::::::::::::::::::::::::::::::::::::::::::\
/::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::\
/::::::::::::::::::::::::::::::::::::::::::::::::淫厨:::::::::::::::ヽ
./::::::::::::::;ハ:/ゝ、::::::::::__:::::::::::::::::::::::::::::::::::::ヽ
i::::::::::::;ヘl ヾ ,,'ニ¨--¨ニ、‐-''´ヽ:::::::::::::::::!
!:::::::::::l ヽ. 7"::;:::::_::、ヾ゙i _ヾ、:::::::ハ
::::::::::::i丶. l::::k'_´_o__゙,!:::7 7;:::\゙¨" ,l,
::::::::::::l丶 ゙ー───‐' . k'^ヽ、゙i ノ
::::::::::::ゝ ,ァ''''" ̄ ̄ ̄''ー''¨ヽ`゚'-゙_,! 丿
:::::::::::::::〉 ,.'",n. rャ ,-、 ゙ヽ、 ,ノ
l:::::::::::::i |:::| |::::| .i:::::| ;ヘ _ヽ.,!
|::::::::::::l _,レヘ. |:::::! !:::::l ,l:::;! i:.:i 〉 兄(インテル)より優れた
}::::::::::::! '´ ,} |:::::l !::::::! ,!:::;! ;': 7,! 弟(AMD)などいない!!
!::::::::::::l ,/l. !:::::! l::::::l ,!:::;! 〃.7.l ,ハ
:::::::::/i. ,/::::ゝ.l::::::し'::::::i. ,!:::;!.〃,/ `ー‐'" ,}
:::/ `ー、":::::::::::::::::::::::::::::::¨:::::レ'!_/ ,/
:::l : : :: ゞ、:::::::::::::::::::::::::::::::::::::::/ゝ.,,,_,,,,/
:;' ; : :: `ヽ、::::::::::::_::::::::/ l
; ,' ; : ::  ̄ ̄:::: ,'  ̄ ; i、 L2/LLCの変更の件、
SPECint_rateは強い局所性があるはずで、そりゃあLLCが減っても影響小さいだろうという気はする
http://pc.watch.impress.co.jp/img/pcw/docs/1070/037/html/11.jpg.html
Intelの主張する結論は大枠で違和感ないけど、もうちょっと泥臭いプログラムでの結果を見たいところではある
LLCの減少で割りを食うアプリケーションもあるはず? 強い局所性というか論理コア数ぶんシングルタスクプログラム並列で走らせるだけですけどね。
スレッド共有メモリの同期がネックになるアプリこそ強そうだけどな
Non-inclusiveなのでL2+L3の容量は2.375MB/core
向き不向きはあるだろうがL2の容量を大きくしたのはデータ解析のトレンドに合わせたといったところでは
GCPの早期アクセス版のSkylake XeonがLinpackで82%高速、実効メモリバンド幅が2倍とか書いてある(いずれもBroadwell比)
更に生命情報学のアプリでAVX-512最適化時、AVX2比の2.2倍とか
いずれもcloud.google.com/intelより
※vCPUの表記が気になるが32コアは実マシンと一致してないかも >>16
どこ読んでんだ?
そこのサイトGoogle翻訳かけたらこう書いてあるぞw
*「Broadwell」というコードネームのIntel Xeonプロセッサ「Skylake」と旧世代Intel XeonプロセッサのIntel Xeonプロセッサ間のGCP 32 vCPUマシンタイプインスタンスの比較に基づくすべての測定値 SpecINTに基づいて20%。
AVX512を搭載した4ノードクラスタの高性能Linpackベースで82%パフォーマンスの向上には、特定のコンピュータシステム、コンポーネント、ソフトウェア、操作、
および機能を使用して測定され、インテルマイクロプロセッサ上でのみパフォーマンスが最適化されている可能性があります。
これらの要因のいずれかが変更されると、結果が異なる場合があります。 >>18
間違い指摘されたからって逆ギレするなよw SKXが追記された最適化マニュアル
https://software.intel.com/sites/default/files/managed/9e/bc/64-ia-32-architectures-optimization-manual.pdf
AVX-512は予想通りport0/1の256bit x2のデータパスとport5に増設された512bitデータパスを使って2命令分の帯域を確保しているようだね
でエラッタ対策であるとは言及されてないけどLSDが無効化されてる L1DのSustained bandwidthが133 [bytes/cycles]
なんでこんなに落ちるの? 最大の問題はTDP160Wx2で450Wも消費するところかな、EPYCは330W
TDP205Wの8180とかどんな消費電力になることやら あひゃひゃひゃ
たけー
https://response.jp/article/2017/07/11/297307.html
市販車で世界初の自動運転「レベル3」実現…アウディ A8 新型、バルセロナで初公開
新型A8は2017年晩秋からドイツ市場で販売を開始。A8は9万0600ユーロ(約1178万円)から、
A8Lは9万4100ユーロ(約1223万円)から。 >>25
A8でそんくらいなら妥当なところのような気がする
A7だったかが近所に居たけどアレもめっちゃ高そうだった まずはコスト上昇を吸収できるだけの富裕層顧客のいるブランドは欠かせないのでBMW抑えただけでも御の字というかヒュンダイとかじゃダメというか
なお長安汽車はスズキ、マツダ、フォード、PSAなどと提携 「トラフィックジャムパイロット」と呼ばれるこの機能は、「中央分離帯のある比較的混雑した高速道路を60km/h以下で走行しているとき、ドライバーに代わって運転操作を引き受ける」
乗る側の知的水準もある程度必要とされそうだな >>28
A8って自動運転が付いてなくても普通に1000万超えてたしな >>31
やっぱりか
ちょっと調べてみたら数字増えるほど値段が上がるのと同時にゴツくなってて笑える、めっちゃゴッツいやんけA8
5か6くらいが色々限界だわ、それ以上は見かけたらちょっと引くデザイン
個人的趣味の領域ではあるけど これからのネットワークは実質的に10GbE以上が標準になるのか
PCHを複数個積んだ構成パターンはネットワーク機器向けを想定しているのかな >>16
Primity Bioとかいうバイオベンチャーのソフトなんでこんな効率良いの? vpermb/vpermi2bという、1バイトchar×64並列でzmmレジスタに展開した64/128要素のテーブルをルックアップする命令がある。どうもこれがかなり効いてそう。
AltiVecやCellにも同様のpermute命令を使ったBLASTの最適化テクニックがあった。 あ、バイオ分野では塩基配列を文字列でデータベース化してるのね
使う文字の種類はASCIIで数種類しかない
こういう用途ではSIMDの並列度あげて物理で殴るアプローチが非常に有効 > IntelによればLewisburgは14nmプロセスルールで製造される。多数のPCI Expressコントローラ、4つの10Gigabit Ethernetの内蔵、QATの内蔵などの強化点を考えれば、現時点でのIntelの最新プロセスルールで製造する必要があるということだ。
PCHの製造は古いファブでっていうのが変わったのか ま こ 爆 ひ わ な ン",,,、'" ミミ` 匁 iii''' iiiiiハ jt, 近 死 わ
っ の 熱 と .た .ら (ン` ":: ::''" `ミ -''、 い 期 た
と 生 C .つ .し .ば ヒメ ヽ r"""'''' """""'i :::: :: t" ! ! は し
う を. P .の も / / | i__,,,,,,,,,,,,,,,,,,ノ| |_|, ii, ii, ::::: `、,,、 の
し U ( ソ | ti'| t、t i9 7900X |i| iii|; ||~' -、 :: :: ヽ、ヽ
た と ) |i i'|ii | ソ――-ー ''''''''t、t,,t:t ti-,gi |i :| ヽソ
い . し ン,, リ )リノ/、、,,,,,t 、、;;;;;;;;;;ニ=ー-、))ノ ) し
て (iii ノ''z-モェテ''、'i ~i'';;rzニ'-''ニゝ'' フ"/y" `'く
リ ::: ミi '~~~~::::ノ| ,i''''"'""'''''' :::メ, ::: ;; )
`ソ ::: iii''t ::::::::::::j,, " " ::::::::ノ リノ ハ `、,
tii リ (/ );;; :::::::: 、、_,,,、:)、;; :::::::::`'y / リ,, j}リ
) ( リt" ::::: ,,,,;;'i、、;;" " ( i|}}! /'( t、,
/ ;;;; ソ;t ii",;;ヨ<、:;;,,"'i! 、|i リ') i!}}i ヽ;;,, ))
,/" ノ/ ii|リ;;|!,, ii ´;;;;;;;;;; ~'ji ,,iijj}|ノ 亦,,, )ツ ツ (
i|i|/|i :::: 、|i|:::ヽ!!,iii "::( ~'ー }} ii}|j、-''(ii iiii ツ / ''"、、, いちおうQuarkがまだ32/22nmだし、アルテラもCyclone11くらいにはまだ22nm使えそう > So #EUV still seems to be at least 2 years away from commercial relevance...not a great sign.
https://twitter.com/thekanter/status/884660666761531392
EUVは相変わらず難航中なのか 10nm世代も長命になるのかもしれんね。もともと++まで使われ続ける予定とはいえ >>37
Atomとか縮小、14nmのファウンドリもうまくいかず、PC需要やらあってキャパを埋めるために使わざる得ないんだろう 14nmで製造してさえTDP 20W超えるSKUもあるような大量IO捌くチップを
旧世代のファブに持って行くという選択肢はもともと無理っぽさある サーバのチップセットはPC向けと比べれば出荷個数は桁が下がるし、バスライセンス結んで独自のIOコントローラ作ってるサーバ屋もあるんで、ただちにバランスに影響は与えないと思いますが。
むしろEMIBの適用が本格化すれば旧世代プロセスと新世代のいいとこどりのSiPは増えてきそう Lewisburgは10gbeのPHYまで内蔵してるならMCMかもしれない TSMCはApple A10Xで10nmでの製造をしてる
年内には7nmの製造も立ち上げるとか、そして5nmまでは既に目処は立ってるみたい
ただ微細化による配線抵抗が一番の課題になるみたいね
ttp://pc.watch.impress.co.jp/docs/column/kaigai/1043026.html >>41みたいにまたまたEUVの遅延の歴史が繰り返されると
EUV前にアクセル全開で密度上げてるTSMCの作戦勝ちになりそう
Apple、MediaTek、Huaweiに加えてQualcommも次はTSMCとか言ってるし
http://eetimes.jp/ee/articles/1706/17/news010.html モバイル向けはそもそも選択肢がsamsungかTSMCしかないし
samsungは今はNANDフラッシュで忙しいんじゃないかな http://jp.techcrunch.com/2017/07/13/20170712nvidia-is-powering-the-worlds-first-level-3-self-driving-production-car/
Nvidiaのチップ、Audiのレベル3自動運転車に搭載
Nvidiaはこれ以外にもA8のさまざまな能力を支えている。
実際A8はNvidiaのチップを6基搭載しており、交通渋滞に対処するだけでなく、
インフォテインメントシステム、バーチャルコックピット表示、
後部座席用ヘッドレスト裏のタブレットなどを駆動する。
http://car.watch.impress.co.jp/docs/news/1070366.html
市販版A8に搭載したNVIDIA製のSoCは「Tegra K1」とのこと。 >>49
むしろいまどきモバイル向けに力を入れてないファブなんて無いでしょ
intelもARMと契約して10nmでLGのスマホチップ製造を受注って発表したし
GFだって一番上に書かれてるのがモバイルだし
https://www.globalfoundries.com/market-solutions/mobility
メモリ製造とロジック製造はそもそも別物だし
Samsungはファウンドリ事業の運営を独立させたからNAND関係ないし >>51
メジャーなメーカーで使ってる所聞かないけど
どこがGFで作ってるんだろう? >>53
IBMの製造引き継いでるからIBMは付いてくるわな
あとONセミのSoCってHPにはあったのと、SOIが有るから航空宇宙産業用とかか?
意外と手広いね スマフォ向けはとにかく省電力最優先だからサムスンやGFは選択肢になりにくいんだろうな
同じプロセスだとTSMCの方がサムスンやGFより省電力みたいだし
Intelも省電力かというと、Intel CPUがAMD CPUにワッパで負けてるからファブの中では一番悪そう
Intelはあくまで高電力高クロックでハイパフォーマンス向けになってる
Ryzen相手に苦戦してるようじゃ正直スマフォ向け作っても駄目だろうね 戦略的切り捨てと技術的限界の区別が付かないのは流石にかわいそう。かわいそうなだけだけど。 技術的限界→ GoogleやAWSから採用されない AVXなんてCPU内GPGPUみたいな物w
ワッパ悪いしダイ面積取るし
多コア進めばいらねー遺産w
SSEぐらい迄がバランス良い
次はAVX1024にでもするの?www 売り込み技術の限界の話だっけ。
あー、AVX最先端インテル最強みたいな売り込み用技術だったな。 AVXなんてCPU内GPGPUみたいな物w
ワッパ悪いしダイ面積取るし
多コア進めばいらねー遺産w
SSEぐらい迄がバランス良い
次はAVX1024にでもするの?www スパコン向けにハイエンドサーバAPUとか作ってどこにも採択されなくて投資が無駄になった会社があったね Xeon Phiは本流のXeonより数倍程度flopsとコア数が多くて、
結果的には将来のXeonの課題を先に潰す役割分担になっているようには見える
穏当なメニーコア化だと、逆に言うと数倍、時間にして数年程度の効率改善しかないんだろうな。バカにできるほど小さい差でもないが
そういう意味でKLHがどういう方向性になるかは注目だ >>67
ふつーにGoldmontベース改ベースだと思ってますけど
2FMA+スカラorマスクの3命令発行ならまあまあバランス良くなるかな
Skylakeからの逆輸入でNon-InclusiveなL3キャッシュでも入れるんじゃないかと思ってる
あとは半精度積和サポートかな リングバス→メッシュネットワークなんてXeon Phiも通った道だし
それ以外にもKNLは
・コアのOoO化
・コアあたりのVPU2倍化
・AVX2までの32ビット/64ビットISA完全互換化
・StormLakeによるOmni-Path対応(オプション)
その他諸々を22nm→14nmですべてやってその上クロックもコア数もメモリ帯域も増し増しで前世代より消費電力落としてる
Skylake-SPは詰め込むものは詰め込んで電力コストの増大などはシュリンクに解決を委ねた感じに見えるけどね
最大手顧客のGoogleは早期評価を行なった上で全面採用を決めた時点で、設計の方向性に間違いは微塵もないわな
スパコンやクラウド大手の大口採用とれてないCPUと比較して、彼ら顧客が求めてない基準のベンチでどうこう語ったところで所詮的はずれにしかならん Intelが値下げしない理由分かったわ
Ryzen、スリッパ、EPYC争奪戦に破れた大多数相手だから、高くても売れるんだな
市場規模的にAMDがカバーできるのは3割位だから、残りの7割はボッタクリのIntelを買うしか無い Ryzen Threadripper (16C/32T) ($999) - 3046
Ryzen Threadripper (12C/24T) ($799) - 2431
CinebanchR15のスコア実演比較
Skylake-x i9 7900x (10C/20T) ($999) - 2186
https://videocardz.com/70933/amd-ryzen-threadripper-and-ryzen-3-product-updates
あ、本命のZen2来る前の前座のZenにやられてるじゃん 争奪戦(笑)でなくなる程度の供給の細さじゃどのみちシェア一桁がいいところだわな >>77
だがそれ以上に驚くのはほんのわずかなOCでも消費電力が激増する点だ。
今回コア電圧はAutoのままでテストしたが、Core i9-7900Xを全コア45倍動作にしただけでも消費電力は倍近くに激増している。
http://ascii.jp/elem/000/001/514/1514627/index-3.html
注目したいのはSkylake-XをOCするとCPUパッケージ温度は100℃を軽く超えてくるという点だ。
ヒートスプレッダー中央温度なのでダイ温度はそれよりも微妙に低いが、Core i7-7800Xの場合最大104℃まで確認できた。HWiNFO64によると
Skylake-XのTjmaxは105℃らしいので限界温度まで1℃を残してサーマルスロットリングがかかっている状態だが、この温度上昇っぷりは凄まじい。
Skylake-XをOCして使うには、水冷化はほぼ必須。ファンの回転数などもキッチリチューニングする必要があると言える。 とりあえずw/flopsとかの適当な尺度を使わないとあんまり意味ないんじゃないかなあ
もうちょっとちゃんと見るにはカテゴリごとにベンチマークスイート選ばないとだけど AnandもたいがいC-ray好きだけどSIMD対応のメンテもされてなくて業務用途で誰も使ってないもの選んでどうする
SSEやAVXに最適化する修正入らないってそれ要するに需要ないってことだから
本当に必要とされてるオープンソースのレンダラはIntelやNVIDIAも加わってメンテされ続ける 【CPU】「Core i9-7900X」「Core i7-7740X」4Gamerレビュー後編
ピーク190W、発熱かなり大きい すぐにi9-7900Xへ飛びつくのは得策ではない
http://egg.2ch.net/test/read.cgi/bizplus/1499959922/ >>74
Skylake-SPの上位SKUって、もはや比較対象がPOWERとかなんで別に今回が高価というわけでも……
Xeon E7の方が性能が良いわけでもないけど、それ以上に安いという扱いが多いと思う (まあそもそもサーバーベンダーやクラウドベンダー大手は値引きして買い付けているっぽい、というのもある) ソケット税撤廃でBroadwellで2ソケットの22コアとか選んでた客層は4ソケット選んでくれって感じの価格設定だしな
(20コア以上の2ソケットが割り高で10コア台の4ソケットの方が割りがいい) _ ―- ‐- 、
(r/ -─二:.:.:ヽ インテル終わったな
7''´ ̄ヽ-─<:.:.', __
. 〈t< く=r‐、\:く _ ...-::‐::¬::::: ̄:::::::::::::::::::::::::::::::
∠j ` / ,j={_/ヽヽr' >:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
. っ Y _/ ヽ了 /:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
. し イ --─¬ /::::::/:/|:::/::∧:::∧:::::::::::::::::::::::::::::::::::
f: :_: : :_:_:_└ 、 |/f|/|/ .|/ |/ ∨ ヽ|\:::::::::::::::::::::::::
/-ー/: : : : : : :\ { ヘ:::::::::::::::::::::
/7: : : :r: : : : : : : : : } ', .j / } .}:::::::::::::::::::: あぁ
/: : : : : :.|: :j: : : :\: : j } /_ ミ ヘ::::::::::::::::::
/: : : : : : : j: ヘ、: : : : \| /く<l´::<ニ二 ̄`> ミ:::::::::/
./: : : : : : : \::::ヘ: : : : : : :ヽ {::ア{:::::::}厂¨,`_______j:::::://
{: : : : : : : : : : ヘ:::ヘ: : : : : : :', V ヘ::::ノ` ̄  ̄ ̄ ̄ ̄ .{::::|ヽ
',: : : : : : : : : : : :\ヘ: : : : : :ヘ. / ヘ¨ //:}::::|/
',: : : : : : : :::::::::::::::::::〉: :_:_.r--―く >ヽ / _ノ::::{ _/
'; : : : :.::::::::::::::::::::::r</ :.:.. `ー¬\__ /::::/
〈: : : : :ー---‐‐r―'´ :.:.:. ヘ: . ヽ . . }ー、 ./::::< トータルコア数が同じなら2ソケットEPYCよりも4ソケットXeon GoldのほうがCPU価格安いのはAMDにとって都合の悪い事実
そもそも4〜8ソケット用に割高になってるPlatinumより
2ソケットまでしか組めないEPYCのほうがコア数多いとかそれこそ的はずれなわけで
4Pを1パッケージ化しただけにすぎない事実を忘れたファンボーイが「4ソケットは反則だから正々堂々2Pで勝負しろ」とかアホ言うまではワンセット 何だこいつ
4ソケットにした場合の消費電力が見えてないのか? intelのSkylakeの場合1ソケットで200Wだから4ソケットなら800Wだなw
EPYCの場合1ソケットなら165Wで2ソケットなら330Wだなw
しかも4ソケットのXeonより性能高くて消費電力半分以下 >>90
冗長化電源使うから、2系統以上要るって事を鑑みるとすごい事になるな
参考までにsupermicroのEPYC-Dual2Uで1.6kwのリダンダント
標準構成でCPU以外に凡そ400引いた1200wを配分可能
supermicroのPSUは上限2kw、800引いて1200wを配分
つまりCPU数は倍で周辺の構成は同一迄が上限、、、 正々堂々2Pで勝負しろってだれか言ってたっけ?
生産能力と利益のバランスからEPYC2ソケットまでで様子見という話をしていた人は居たが >>93
そんなんあてにしてたのか?i9-7900XですらTDP140Wが190Wを超えてる現実なのにw ■ このスレッドは過去ログ倉庫に格納されています