Intelの次世代技術について語ろう 91©2ch.net
レス数が1000を超えています。これ以上書き込みはできません。
Intelの次世代製品や、それに関連する技術についてのスレッドです。
■前スレ
Intelの次世代技術について語ろう 90
http://egg.2ch.net/test/read.cgi/jisaku/1499796238/ ZenとZen2では仕様が違う
Zenの弱点はZenリフレッシュ(Zen+)の時点で解消済みと言う事だ メモリってDDRの世代進んでも、そんなに速くなってないよね。
Sandraのメモリ帯域でみるとDDR3-1600(Sandy-EPの頃)→DDR4-2666(現在)
で5年掛けてch当たり1.6倍程度。
コア当たりのキャッシュ大きくするとかってのは、そういう面での対策の一つか? >>932 まあ、自称7nmで低コストでどんだけ集積できるか見せてもらおうじゃないか
ってとこか。
※L3がダイ毎に分断されてて、L3極端に増やすのは効果あるんだろうか?
元記事は読んでないが。 >>935
奴らは最終的に共通キャッシュとしてHBMを使う
m3は言うなればCCX単位のキャッシュで、m3同士のやり取りは必要無いと思われる なるほど。今後キャッシュの階層を増やすのは必要なのかも知れないね。
問題はプログラム書く人がそれを活かせるかどうかかな。 DDR5は容量は増えないんだっけ
相当な高帯域になるのはいいけど、容量が増えた方が嬉しいような 容量を増やすには、Flashみたいに○層積層DRAMを作るか、
1パッケージに複数ダイを詰めるのがいいのでは? _,. -‐/ヽ‐- 、
,. '´ / ヽ 丶、__
/ ハ \ 、 `く ̄ ̄\
/ _/, l { ハ ヽ \ ヽ.\ ヽ
/ / / .i! 八 |ト、 .ハ ヘ ヘ \ /
. i { ,' lト、 ヽ l,.rヒナ|ト. ハ ハ ハ
r‐┴r=y┴ 、 |__,LL ハ ,'リ|八 |Nl | l / ',
ヽrf十 | 'Y´|l | |ヽ. l| .///,ィfiヽ | ,'| | |
|:::::}ト| l| リ|// ノ|/ ' {トr} } | /ハ ,' ,'
_/ヽ八l| リ〈 ____ 弋ノ ,,,l/\|/ /
´ ̄`ト、__| 八{トィf'¨¨` 、 八ー┴' /
/,.r‐┘ {ヽ.\ヾ゛ r‐=ァ ,.イハ ト、 淫厨のばーかww
,r‐< \ ノヽ-<´ ̄`ヽ乂ソ /::,':.:.|:.:.:ヽ
rfヽ. ヽ. 〉 ___,. rくァーく/:::/ :;小、:.:ハ
ト、 \ V / /「ヽ\ \_|「>-く:_//lノ┴┴―‐‐、_
. _| \ __)ーく¨´ / | ハ::::\ ヽ \ヽ ヽハ'"¨¨¨¨¨¨`リ┴-、
//\_ _,.>-‐く / .∧::::::\}!〉 〉ト、 八 /ー‐‐|
/ .//: :/ \__/ ./ / ヽ::::::リ\八_ヽ\.ヽrzzzイー―‐' |
. / //: ::/::::/.:/ト、_/ ,' ヽ/ ::::::ヽ ヽヾ: \ \'´ ̄`¨ }
/ //: ::/::::/.:/: :.:./`ヽ ̄ ̄ .{ ./∧ ::::::ハ ! |:::::::| ハ|「`¨ /|
/ 〃: : ,'::::/.:/: :.:./::/ ::::\ 八 ∧::::::::l! i |:::::::l ∧ー‐‐' /! 現状128GB DIMMあるけど、これを2DIMM/ch刺せるのはSky-SPではM付きだけだね。
Mなしは768GBまで。 Qualcommはいつまで市場を支配できるかわからんしね
今売るのもありかと 格安スマホは、MediaTekつかったり、
最近の中華スマホ勢が自社SoCつくりはじめた モデム部門をintelに売却した
BroadcomがQualcommを買収ねぇ >>934
消費電力に対する容量の増加にほぼ全振りしてるような進化の仕方だしね。 >>927
Phiの利点は高ベクタ(AVX512)の多コアだから
フルコアでAVX256(FPUは128bit)止まりなEpycとは市場が被らない B/Fは低いけども、なんであんなにMHDで強いのか >>951
欠点の固まりにしか見えないシロモノが利点に見えてるのはスペックオタだけだろ GPGPUの方がよっぽど使えるってな
本当に64コアが3GHz越えで動くならXeonゴミになりそうなもんだが ,,从.ノ巛ミ 彡ミ彡)ミ彡ミ彡ミ彡)彡)''"
人ノ゙⌒ヽ 彡ミ彡)ミ彡)ミ彡)'
. __ ゴオオオオオ ,,..、;;:〜''"゙゙ ) 从 ミ彡ミ彡)ミ彡,,)i
|\_\ ,,..、;;:〜-:''"゙⌒゙ 彡 ,, ⌒ヽ ミ彡"
|IN|.◎:::゙:゙ ) ミ彡)彡''"
|л.: |``゙⌒`゙"''〜-、:;;,_ ) 彡,,ノ彡〜''"
. \|.≡...| ゙⌒`゙"''〜-、,, ,,彡⌒''〜''"人彡ヽノ
 ̄ ̄ / ゚ u 。\
l゚ ./ ・ ・,ヽ |
| | ; 。 ゚ u |゚ |
\\=====/ノ
(m) (m)
(__)(__)
/ \ ── / / /  ̄/
_/| / ―┬─ / / /―― ―― ―/ ――
| _/ _/ / /_/ /__ _/ >>959 訂正。EPYCは8ノードNUMAで相当効率落ちてるとしても3GHzより低いね。2.7GHzくらいか? >>954
Phiは悪くないだろPhiは
団子みたいにi9のAVX512とPhiのAVX512を一緒くたにするのはナンセンスだよ Knights Hillの中止の噂は最近あちこちで散見される発表したのでKnights Millも仕方が無しに開発している状態
intelはその方面でのNVIDIA(GPU)との直接競合を避けるらしい
x86+AVX512だと電力効率が劣ってスケールの拡張が出来ないらしい(効率は劣るがx86命令が実行出来ますよが売りだったし)
実際 Xeon Phi 7200-Series Knights Landing(PCIe接続)は廃止されたらしい >>963
だって遅いんだもの。
AVXのようなベクトル命令はハマれば速いが、普通の命令は遅い。かつてのcellを彷彿とされる。
まあcellよりははるかに実用的だけど。
まだXeon4コアにヘテロで68コアとかすれば良いかもな。
32GBのMCDRAM積めば、HPCでの需要はあるよ。
消費電力250Wにはおさまるでしょ。 普通のXeonにMCDRAMくっつけた方がコスパいいんじゃないかなあ。 SIMDは256bitまでは使い道があるけど512bitになると使用頻度がぐっと落ちるから対応したハードウェアを実装しても効率が落ちるんだよな。
基本データ型が64bitのdouble/long longまでで満足されているから、そのx4ベクトルまでは需要があってもx8ベクトルが必要なケースはあまりなくて結局繰り返し演算の展開にしか使われない。
ならばSIMTでもいい。 intelはx86に執着せず普通にGPUを拡張したりARMSoC作ったりした方が儲かってたと思う ま こ 爆 ひ わ な ン",,,、'" ミミ` 匁 iii''' iiiiiハ jt, 近 死 わ
っ の 熱 と .た .ら (ン` ":: ::''" `ミ -''、 い 期 た
と 生 C .つ .し .ば ヒメ ヽ r"""'''' """""'i :::: :: t" ! ! は し
う を. P .の も / / | i__,,,,,,,,,,,,,,,,,,ノ| |_|, ii, ii, ::::: `、,,、 の
し U ( ソ | ti'| t、t i9 7980X |i| iii|; ||~' -、 :: :: ヽ、ヽ
た と ) |i i'|ii | ソ――-ー ''''''''t、t,,t:t ti-,gi |i :| ヽソ
い . し ン,, リ )リノ/、、,,,,,t 、、;;;;;;;;;;ニ=ー-、))ノ ) し
て (iii ノ''z-モェテ''、'i ~i'';;rzニ'-''ニゝ'' フ"/y" `'く
リ ::: ミi '~~~~::::ノ| ,i''''"'""'''''' :::メ, ::: ;; )
`ソ ::: iii''t ::::::::::::j,, " " ::::::::ノ リノ ハ `、,
tii リ (/ );;; :::::::: 、、_,,,、:)、;; :::::::::`'y / リ,, j}リ
) ( リt" ::::: ,,,,;;'i、、;;" " ( i|}}! /'( t、,
/ ;;;; ソ;t ii",;;ヨ<、:;;,,"'i! 、|i リ') i!}}i ヽ;;,, ))
,/" ノ/ ii|リ;;|!,, ii ´;;;;;;;;;; ~'ji ,,iijj}|ノ 亦,,, )ツ ツ (
i|i|/|i :::: 、|i|:::ヽ!!,iii "::( ~'ー }} ii}|j、-''(ii iiii ツ / ''"、、, Phiのカード版廃止は予想通りというか意味がないから当たり前じゃないの
ってスレの最初の方で書かれてるけど
スケールの拡張ってコア数なのか大量ノードによる処理なのか、どっち方面指してんの
あとKNMは昨年には発表されてて、最近発表した云々ではないけれど >>963
またソースも何もなく自分の願望を「らしい」を付けて語る君か…
最後の一文だけ皆知ってる事実を混ぜ合わせる辺り、デマ屋の中では優秀なのかもしれないがね >>953
B/Fが低いからといって低性能なわけじゃないでしょう
むかしのHPCは、日本勢が十分に高速なメモリ帯域を実現してたのでB/Fが高かった
ところが、最近は、日本勢はメモリ帯域に比べて最低限度のCPU性能しか無いのでB/Fが高い(かといってメモリ帯域が高いわけじゃない)っていう、
むしろマイナスな状況になってた ああそれとPhiが遅いということはどういったソフトで検証したの
スケーラビリティも含めて書いてるの
何を主張したいのかよく分からない 主張したいことが無さそ人の相手をするのが間違い・・かもよ
GPGPUはディープラーニング系という超巨大市場を味方にしたのが大きい
それに比べPhiは旧来のコンピューティング(用途)に縛られてる感じがする >>934
Sandyのメインストリームは1333だからその5年前のDDR2-800から1.6倍程度で同じ >>975
GPUはISAを露出しないのが良い方向に出たね
用途に特化した専用の演算器をホイホイ付けられる >>976 このまま行くとサーバはコア数増加でch数増加させないといけないから、
CPUの周りが大量のメモリになってデカい箱じゃないと入らなくなりそうだね。
そういう意味でもL4や大容量&コンパクトなNVDIMMが必要ってことかね。 >>967
> x8ベクトルが必要なケースはあまりなくて
そうだろうか。4次元を扱う機会は多いだろう。
ベクトル・ベクトルと行列・ベクトルが2:1 の比率で出てくれば
x4 と x8 の使用頻度は並ぶ。1:1 ならx8 が2倍 >>967
素人が多いからって適当なことを書いて印象操作しようとか
しね >>979
4x4ベクトルは使うけどそれをx16で扱うと計算しにくいんだよ。
x8ベクトルでしかも精度が必要なものの具体例を説明してよ。 ガシガシにベクタ長に依存した糞コードを書いてるアホの戯言 ほらね具体例が説明できないんだよ。
物理世界が3次元で時間を入れて4次元、画像がARGBの4次元なのだから
各要素が不可分の基本データがx4 に集中するのは仕方のないこと。
それが組み合わさって複雑な構造になるにしても
逆にそれは単純にSIMDで扱うのは難しくなってくる。
512bit化でmask/swizzleが強化されるのもそれに対応した面がある。
その際には512bitの能力が十分に発揮されず効率が落ちても
純粋な性能そのものは256bitより高くなるからそれでよい。
同じ理屈で将来的には1024bit化もあると見られる。 もう256で良いから山程並べとけばいーじゃん
タダでさえリソース馬鹿喰いする x86に64拡張した上でAVXを上乗せしてるんだから
これ以上重ねんな、デコーダの設計屋が死ぬ >>983
恥ずかしいからこれ以上語らない方が良いかと CUDAはひとつのベンチ動かすのに、KNCの倍以上のコード書かなきゃならんし
そもそも動かないというときもよくある
これがベターな選択には見えないが あ、やっぱり団子か
知らないなら無理に書かなきゃ良いのに >>983
普通、物理計算では時間はマトリックスの外なんだけどなぁ。空間座標にスカラーの物理量1次元入れて4次元でしょ?時間入れちゃったら物理量計算できないじゃん。 >>983は団子じゃないだろ
むしろ彼との逆の立ち位置 このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 69日 6時間 27分 48秒 レス数が1000を超えています。これ以上書き込みはできません。