Intelの次世代技術について語ろう 87 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0001Socket774
垢版 |
2017/04/11(火) 14:02:05.06ID:VXH5x9UO
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
Intelの次世代製品や、それに関連する技術についてのスレッドです。    

■前スレ
Intelの次世代技術について語ろう 86
http://egg.2ch.net/test/read.cgi/jisaku/1476083004/
0493Socket774
垢版 |
2017/05/10(水) 23:32:15.76ID:Qu89MyK5
レツノ使ってるけど、至って健康だが?
0494,,・´∀`・,,)っ-○○○
垢版 |
2017/05/10(水) 23:32:45.08ID:b6+5S9tA
数字見ても普通にNECレノボが国内シェアトップですよ。
中華リスクを逆手にとって米沢生産モデルをプレミアムモデルとして出してるし、ほんと上手いね。
0495Socket774
垢版 |
2017/05/11(木) 00:10:50.94ID:bwi3PDGL
>>492
誇張しすぎだろう…
0496Socket774
垢版 |
2017/05/11(木) 00:17:33.11ID:2m7Mp3t1
>>495
いやあ同時代の他社の液晶と比べたら一目瞭然よ
このころはノート向けでもsRGB100%が見えてきたときにこの画質は言い訳できんよ
0497Socket774
垢版 |
2017/05/11(木) 00:19:05.45ID:2m7Mp3t1
SXのころからパナのLet'sの出来を疑う人が出始めたからなあ
このあたりでMacとかThinkPadとか見始める人が出てきてるし
ただ企業向けがNECや富士通東芝が次々バタバタいってたから
消極的選択でレッツえらばれてたので結構売れてるんだがね
0498Socket774
垢版 |
2017/05/11(木) 01:30:18.47ID:2m7Mp3t1
。。。
すまんノートで厚くなりすぎた次言ってどうぞ
0499Socket774
垢版 |
2017/05/11(木) 02:50:19.80ID:MFM2gpiw
板違い他所でやれ
0501Socket774
垢版 |
2017/05/11(木) 02:52:04.12ID:PBxB3Lt5
レッツノートは落としたりぶつけたりしても壊れる確率が少ないので使ってた人や会社は多いはず
本当にPCを外に持ち運ぶ使い方をしてる人の場合ね

まあ日本の場合、ノートPCをずっと家でつかって持ち出さない人が多いので、
そういった人は大画面高性能バッテリー持たないタイプが最適だろうが、
頻繁に持ち出す人はレッツノートが人気があった
0502Socket774
垢版 |
2017/05/11(木) 03:56:36.44ID:Ni6OXHpU
VoltaのV100が発表されたらしい
7.5TFlops(DP)、HBM2 16GB(900GB/s)ということで、
とても大雑把に見てKNLの2倍ぐらいか

ディープラーニングとしては、概要発表だけされてるLake CrestみたいなASICアプローチと比べてどうなのかは気になる
汎用アクセラレータという面では、Knights Hillが2018年?だとして、
これぐらいかもう少し上の規模にはなるのかなあ
0503Socket774
垢版 |
2017/05/11(木) 05:48:25.59ID:PBxB3Lt5
既存の単精度・倍精度・半精度コアだけじゃなく、機械学習用コアも追加すればいいのに
もちろんcudaもそのコアを効率よく使えるように拡張して

個人向けGPUには、機械学習用コアの開発用として使えるくらいの最低限のコアだけ入れて置いて、
tesla系で機械学習コア山盛りバージョンを出せばいい
0504Socket774
垢版 |
2017/05/11(木) 06:32:12.11ID:fS5q89D6
Xavierにはある
0505Socket774
垢版 |
2017/05/11(木) 06:47:46.37ID:avJGXr5/
ダイサイズがでか過ぎる……KNLでもでか過ぎるとしてぶっ叩かれてたのに
0507Socket774
垢版 |
2017/05/11(木) 09:10:39.69ID:JGz11xEe
その論理で行けばFP64とINTとFP32もそれぞれ専用ユニットということになる
さすがにないだろ
0508Socket774
垢版 |
2017/05/11(木) 09:27:17.90ID:vX3x9BlJ
シリコンインターポーザー使ってるんだからダイを分割すればよかったのに
0509Socket774
垢版 |
2017/05/11(木) 09:49:50.63ID:/Uq5JQbd
そしてそのダイ間接続にもSiを使い高コストになるんですね
0510Socket774
垢版 |
2017/05/11(木) 12:06:04.90ID:7hU/qJuV
>>507
nvのFP64はもともと専用ユニット
0511Socket774
垢版 |
2017/05/11(木) 14:53:11.06ID:Ni6OXHpU
>>505
KNLもたぶんそうだけど、この手のプロセッサは並列度が高いタスクしかやらない前提で、
演算器詰め込めるだけ詰め込みたいわけだから、でかいこと自体は正当化される気がする。高く売れるし

とはいえ公称815mm^2って聞いたことがない。前例あるんだろうか
(2017年に使える技術で頑張れるだけ頑張ったらこうなるという感じか)
0513Socket774
垢版 |
2017/05/11(木) 15:33:52.13ID:vX3x9BlJ
この前発表されたSPARC64 XIIが794mm2
0514Socket774
垢版 |
2017/05/11(木) 15:40:27.16ID:pdsYL7yR
>>513
24時間以上連続稼働できてかつ壊れないという、GPUとはまた違った方面だからなあ
0515Socket774
垢版 |
2017/05/11(木) 15:47:46.95ID:pdsYL7yR
>>506
多分、CUDA8コアで1コア分カウントしてるんじゃない?
トランジスタ数はCUDAコアみたら、まあ概ねその通りの増加量だし
なにか別のコア付けたという風には考えにくいんじゃね
あとHPCアプリはP100比でこんなもんなのか
こらあKNHの方が遥かに筋が良さそうですな
0516Socket774
垢版 |
2017/05/11(木) 15:55:47.76ID:Ni6OXHpU
>>513
そんなのが発表されてたのか。でかいなあ
0517Socket774
垢版 |
2017/05/11(木) 18:48:51.32ID:5yjlGMZ1
intも別ユニット

Unlike Pascal GPUs, which could not execute FP32 and INT32 instructions simultaneously, the Volta GV100 SM
includes separate FP32 and INT32 cores, allowing simultaneous execution of FP32 and INT32 operations at full throughput, while also increasing instruction issue throughput.
Dependent instruction issue latency is also reduced for core FMA math operations, requiring only four clock cycles on Volta, compared to six cycles on Pascal.
0518Socket774
垢版 |
2017/05/11(木) 19:11:04.83ID:rl+mXQIe
Radeon方式で行くのか
0519Socket774
垢版 |
2017/05/11(木) 19:15:00.74ID:fS5q89D6
tensorも別ユニット
pascalのfp32のトレーニングに対して12倍
fp16に対して6倍

120TFLOPSってvoltaの15tflopsを8倍しないと無理な数字
int8出すらないし、そもそもint8でトレーニングは出来ない


専用機能のユニット
0520Socket774
垢版 |
2017/05/11(木) 19:16:12.77ID:fS5q89D6
そもそもflopsだしな
0521Socket774
垢版 |
2017/05/11(木) 19:23:50.38ID:PBxB3Lt5
DL専用コアは、1つの命令で○FLOPS相当の計算をやるから
とかそういった換算をしてるのでは?
0522Socket774
垢版 |
2017/05/11(木) 19:27:26.24ID:rl+mXQIe
CUDAコアにDL用の手入れをしているんじゃないんかね
まあだからトランジスタ数はCUDAコアに比例してるだけの感じ
0523,,・´∀`・,,)っ-○○○
垢版 |
2017/05/12(金) 00:20:23.68ID:TKuab0Cs
IntelはAVX512BWでバイト単位のプレディケーションやデータ並び替えに対応するがこいつはどうだろうか
0524Socket774
垢版 |
2017/05/12(金) 00:32:10.87ID:v+lQ1EuR
Tensor Coreって4x4の行列演算器のことじゃないの
通常はその一部を使用
FP64がFP32演算機の一部を使うような感じで、完全独立じゃないでしょ
(完全独立だったら別チップ作ったほうが良いし)
0525Socket774
垢版 |
2017/05/12(金) 05:32:17.89ID:tmUW54Wp
まあね
CUDAの拡張でしょう、517もこれは独立してるか否かのことであって
CUDAではないという訳じゃないからねえ
Radeonと同じ構成になってるだけ、あっちはINT24だけれとも
別コアの場合、トランジスタはもっと増えなければおかしいし
0526Socket774
垢版 |
2017/05/12(金) 06:37:51.32ID:4nWchDpi
アクセラレータです
0527Socket774
垢版 |
2017/05/12(金) 07:07:50.61ID:pAp4b84p
DLはそのうちASICになるっていわれてたしな
FP64も専用つかって電力効率第一にするnvとしては当然の選択

INTもわけたのか
0531Socket774
垢版 |
2017/05/12(金) 08:51:39.84ID:S/h12faE
ただなんでも詰め込んでちょいと不格好にはなったと思う
DGX-1の960TOPSは3Uで2100TOPSの一応専用機に比べたら、不利だし
スパコンとしてみたらジャンプアップは微妙でもある、HPCにおいてKeplerの20倍やら50倍やらとかいう話はどこへ?
0532Socket774
垢版 |
2017/05/12(金) 09:21:37.95ID:mJ0xVJcu
トランジスタ密度を計算してみた
800mm2で210億トランジスタだから、100mm2あたり26億でVega相当の500mm2だと130億くらい
Vegaが500mm2で150億くらいだから、密度というか集積度合いはVegaの方が1割以上上

TSMC 12nmは16nm+みたいなものだから、ディープラーニング向け以外、ゲーム性能は実質Pascal程度と見たほうがいい
Pascal Refresh + ディープラーニング向け機能 = Voltaかな
0533Socket774
垢版 |
2017/05/12(金) 11:05:54.33ID:umNQoBVA
>>532
えぇ・・・
何の為に16→12にしたんですかね・・・
0534Socket774
垢版 |
2017/05/12(金) 11:19:54.70ID:mJ0xVJcu
そりゃ宣伝文句のためだよ
バカ正直に16nm+とか言ったら皆んなシラケるだろ
0535Socket774
垢版 |
2017/05/12(金) 11:24:07.97ID:mJ0xVJcu
ちなみにソースはコレ
http://pc.watch.impress.co.jp/docs/column/kaigai/1059175.html
>プロセスはTSMCの“12nm” FinFETプロセス。
>このプロセスは、16nm世代プロセスをマージンの切り詰めや回路設計、セルライブラリの縮小などによって高密度化したものだ。
>技術の根幹部分は成熟した16nmである

後藤氏が予想ではなく断言しているから本当だろう
0536Socket774
垢版 |
2017/05/12(金) 11:26:58.12ID:mJ0xVJcu
まあ、ゲーム向けの性能向上はSkylake→Kabylakeみたいになりそう
GDDR6対応の分高性能化するけど、それはAMDも一緒だから差別化にはならない
PasclaとVegaが同等なら、Volta相手でも善戦するねこりゃ
0537Socket774
垢版 |
2017/05/12(金) 11:28:14.77ID:umNQoBVA
>>534
熱いinteldisでもあるわけか

新プロセスで12nmにした上で800mm^2
とっても嫌な予感がする
0538Socket774
垢版 |
2017/05/12(金) 11:32:29.61ID:mJ0xVJcu
トランジスタ的には熟成させた16nmだから、800mm2でもなんとか作れるんだろうくらいで考えていい
ぶっちゃけディープラーニング強化したPascalだな
0539Socket774
垢版 |
2017/05/12(金) 11:40:46.80ID:nkrAQ5Jc
12nmのVoltaはTeslaだけでコンシューマ向けは16nmFinFET使うって話もあるね
まあコンシューマモデルは劇的な性能向上はないかもしれないな、それなりには上がるだろうが
0540Socket774
垢版 |
2017/05/12(金) 12:05:08.25ID:Av/xzRtH
4x4行列演算ってことは、単純に考えると積和演算器が並んでるのかなと思ったけど、
深層学習向けってことで精度とかの工夫ができるのね

確かに、なんとなくだけど(ハードウェアの都合だけで言えば)専用のASIC起こした方が効率良さそうな気はする
Lake Crestとかも含めた専用アーキテクチャの着眼点はその辺なのかな
0542Socket774
垢版 |
2017/05/12(金) 12:30:14.50ID:mJ0xVJcu
IntelもNvidiaも自社のクソ高いCPU/GPUを売らないといけないから内蔵している
両社ともコンパイラとプロセッサのセットで囲い込んでるから強いんであって、専用ASICとか売っても意味はない
0543Socket774
垢版 |
2017/05/12(金) 13:06:55.00ID:X4vGHYrf
 ディープラーニングへと大きく舵を切ったNVIDIA。
現在ディープラーニングでは、トレーニングにおいてGPUが確固とした位置を確立し、
従来のHPC(High Performance Computing)市場だけでなく、一般のデータセンターにまでディープラーニング向けとして浸透を始めている。

NVIDIAは、IntelやAMDといったほかの大手CPU/GPUメーカーが打ち手を間違えた敵失もあって、
トレーニングにおいてはかなり優位に立っている。
0544Socket774
垢版 |
2017/05/12(金) 13:36:37.39ID:mJ0xVJcu
AMDの本格参入は7nmからだろうね
DL専用コアも要はFP16専用のユニットだからそう難しいものじゃないし、AMDが開発していてもおかしくない
Async機能使えば、DL、GPGPU、グラフィックの並列運用も可能
HBCCで膨大なストレージやメインメモリ使用も可能

基本的にAMDはNvidiaやIntelが作れるものは同様に作れる
+アルファでAPUやHSA的なことが出来るのが強み
IntelやNvidiaは単体しか無いからそれが弱点

Naplesや16コア相手にXeonが厳しいのは確かだから、当然それに頼っているTeslaも厳しくなる
0545Socket774
垢版 |
2017/05/12(金) 13:56:54.26ID:X4vGHYrf

だれがAMDで動くライブラリやその他ソフトサポートするの
0546Socket774
垢版 |
2017/05/12(金) 14:00:49.95ID:Av/xzRtH
突如として現れるAMDポエム
0547Socket774
垢版 |
2017/05/12(金) 14:04:30.32ID:VkeZ2F8D
>>545
ソフト面はPS4が何とかしてくれるって昔言ってたような、その認知バイアス君
0548Socket774
垢版 |
2017/05/12(金) 14:15:23.84ID:mJ0xVJcu
Naplesや16コアのやつとVegaはセットだからな、売るために必死にサポートするよ
そもそもV100とはサイズもコストも違いすぎるから競合はしない
性能で勝てるP100やGDDR系のGP102が相手だから余裕
0549Socket774
垢版 |
2017/05/12(金) 14:22:04.39ID:mJ0xVJcu
800mm2でHBM2 4StackのV100がそんな簡単に量産できて大量に売れるわけもない
P100も似たようなもんだから、市場に出回るのは大した量じゃない
MI25とかは一般向けGPUの選別品でしか無いから、数的にはだいぶ余裕がある
0551Socket774
垢版 |
2017/05/12(金) 15:00:07.52ID:nkrAQ5Jc
HBMはEMIBや類似の技術が盛り込まれてからが本番だね
つまりはkabylake-Gがその急先鋒に・・・
0552Socket774
垢版 |
2017/05/12(金) 15:06:31.17ID:GhzE890s
>>541
我々の10nm技術は1平方ミリあたり約1億トランジスタ、他の10nmとはほぼ一世代違い
ワイヤは細くすればするほど遅くなりインターコネクトも遅くなる
もうスケーリングではトランジスタは高速化しない
静電容量はまだ自然に下がるので動作電力は削減できる
シングルスレッドに頼るCPUよりもパラレルコンピューティング
スケーリングはグラフィックス回路で上手く働く

EMIBといいトランジスタ密度といいもうAMDやNVIDIAに使わせた方がいいんじゃね?
インテルの言う通りの密度格差ならGV100とか3分の1の面積で作れるぞ
0553Socket774
垢版 |
2017/05/12(金) 16:04:23.57ID:aScQOfU3
まあ本命はFPGAじゃないんかね
0554Socket774
垢版 |
2017/05/12(金) 17:15:27.05ID:X4vGHYrf
xavierにはtensorもついてるんだろうな
GV100からFP64だけ抜くとつじつまが合う
0555Socket774
垢版 |
2017/05/12(金) 17:26:44.75ID:v+lQ1EuR
Tensor CoreはFP16とFP32の混合でXavierはINT8だから違うよ
0557Socket774
垢版 |
2017/05/12(金) 19:12:19.75ID:v7ndr5O2
将来は高クロックなコンポーネントとその他でプロセス分離したのが出てくるのかもね
iGPUのバリエーションが増えたりするのかなあ
0558Socket774
垢版 |
2017/05/12(金) 19:23:13.76ID:4nWchDpi
tegraはもう車載ようで、ゲームようじゃないからなぁ

ゲーム向けのGV104とかはtensorないだろうし
0559Socket774
垢版 |
2017/05/12(金) 19:37:57.62ID:1Cx+07S9
いい加減スレ違い
0560,,・´∀`・,,)っ-○○○
垢版 |
2017/05/12(金) 19:50:09.25ID:7QMnwoTE
ピクセルシェーダは16ビットや12ビット程度でも十分使えるぞ
当然TensorCoreもゲームで有効活用できる、
AMDが無駄と切り捨てた256ビットや512ビットのSIMDエンジンも使いどころがあるからこそやってる

ひとつも大型案件取れてない製品になんの脅威を感じる必要があるんだと。
0562Socket774
垢版 |
2017/05/12(金) 20:23:02.14ID:/6g9UTyX
パフォーマンス次第ではタブレットとかはこれになりそうだな
0563Socket774
垢版 |
2017/05/12(金) 20:25:07.72ID:4nWchDpi
これってどういうこと
--------
 Volta世代では、スレッド実行アーキテクチャも変わった。従来は、1個のwarpの中の32スレッドはプログラムカウンタ(PC)を共有し、マスクレジスタによるプレディケーションでコントロールフローを制御してきた。

 それに対して、Volta世代では、warp内の各スレッドレーンがそれぞれPCを持つようになり、個々にスケジューリングが可能となった。
0565Socket774
垢版 |
2017/05/12(金) 20:57:57.29ID:HdYwAiDg
>>559
じゃあNervanaの話でも出すか
0566Socket774
垢版 |
2017/05/12(金) 21:17:21.31ID:mNFxmDMz
>>563
これ、トランジスタ効率悪ぅなるんちゃう?
いくらGPUコンピューティングが複雑になって条件分岐が増えるとはいえ。
0567,,・´∀`・,,)っ-○○○
垢版 |
2017/05/12(金) 21:32:42.02ID:2A3Ii64m
>>562
Win10S+ApolloLakeでいい気が
まあポストCherryTrailがなくなった今、8インチクラスのSurface出すならSnapdragonは有力候補ではあるんだよな
0568Socket774
垢版 |
2017/05/12(金) 21:37:25.91ID:TiGGF2s7
Asyncで動くのかどうかってこと
0569Socket774
垢版 |
2017/05/12(金) 21:44:25.81ID:mJ0xVJcu
プログラムカウンターとスケジューラーを個別に持つからAsync動作は可能
0570Socket774
垢版 |
2017/05/12(金) 22:15:23.57ID:umNQoBVA
>>569
PCは持ってるがスケジューラが個別とは言ってないな

だんだん近くなーる
0572Socket774
垢版 |
2017/05/12(金) 23:22:40.35ID:4nWchDpi
warpないのスレッドを
同じ処理するグループ毎に小分けして(sub warp)処理できるらしい

演算パーティションあたり16個のspだが
subが8スレッド毎とかはわかるんだけど
0573Socket774
垢版 |
2017/05/13(土) 11:44:05.20ID:GhpfgHAj
>>569 >>570
スケジューラが頑張るのでAsync動作できるっぽいね
頑張るのはいいけど>>566の言う通りトランジスタ効率悪くなる気が…
0574Socket774
垢版 |
2017/05/13(土) 14:47:13.14ID:1P/npIvu
プレディケーション付きSIMDのハードでSPMDをやるってのがGPGPUのテンプレートだと思うんだけど
ハードもSPMD側に寄ると実行時コンパイルでwarp自体がバラバラにされんの?
0575Socket774
垢版 |
2017/05/13(土) 15:17:55.72ID:1P/npIvu
どうもそういうことではないのかな
粒度がwarp単位だったのがwarp内の分岐方向の同じスレッド単位になるというのが正しいっぽい
0576Socket774
垢版 |
2017/05/13(土) 15:17:57.06ID:HeQJ9Mrl
i9で素数括り崩壊か
iと被るから11にしなかったのかな
AMDの方はRyzen 11でも問題無い
0577Socket774
垢版 |
2017/05/13(土) 15:27:00.52ID:vgtG88B+
また暖房路線に回帰するのかよw
あれなら多少スペック良くてもRYZENのがいいよ
0578Socket774
垢版 |
2017/05/13(土) 15:28:07.72ID:JE+hnSyQ
i9かっけぇ〜!
0579Socket774
垢版 |
2017/05/13(土) 15:31:50.86ID:YN2bDcGg
なんかそういうリークあったらしいけど、果たして >i9

Intelの普遍性のあるブランディングのお手本は自動車のBMWかと思ってたけど、そうでもないのかな
Gulftownだったっけ? の頃にもi9という噂だけあったような
0580Socket774
垢版 |
2017/05/13(土) 15:36:22.46ID:1P/npIvu
クロック高いな
0582Socket774
垢版 |
2017/05/13(土) 17:12:50.09ID:9lZsj4ZY
i9出すのはいいけど値段どうすんだよ
AMDに合わせる訳にいかんだろうに
0583Socket774
垢版 |
2017/05/13(土) 17:22:57.39ID:1P/npIvu
このスペックなら別に値下げしないんじゃない?
同価格帯でコアが増える程度になるのでは
$1109 8C16T 3.2-3.7GHz -> 10C20T 3.3-4.3GHz
$628 6C12T 3.6-3.8GHz -> 8C16T 3.6-4.3GHz
$441 6C12T 3.4-3.6GHz -> 6C12T 3.5-4.0GHz
CoffeeLake-Sがすぐ出るんならHEDTをこれ以上下げても仕方ない
0584Socket774
垢版 |
2017/05/13(土) 18:56:24.26ID:koiSDZhT
8コア以上でもOC前提でいいならほぼ確実に4.2-4.5Ghz全コア回せるし特にAMDに価格合わせる必要ないだろ
0585Socket774
垢版 |
2017/05/13(土) 19:44:27.61ID:MRGvh9E4
12cで殻割りOC前提とか恐すぎだろ
0586Socket774
垢版 |
2017/05/13(土) 19:44:54.91ID:yNUsZnHI
どうせ今回もi7なんだろ
もういいよi9出る詐欺は
0587Socket774
垢版 |
2017/05/13(土) 20:07:52.67ID:1P/npIvu
KBL-Xの方はパッケージをハンダにしてOCer向けに売るのかな
そうじゃないと存在意義あんまりないよね
0588Socket774
垢版 |
2017/05/13(土) 20:15:31.42ID:yG2baxpE
95W越えは皆等しくソルダリングだよ
0589Socket774
垢版 |
2017/05/13(土) 20:37:21.29ID:HeQJ9Mrl
i7が4C8Tから10C20Tまでカバーしてるのがおかしんだよ
0590Socket774
垢版 |
2017/05/13(土) 21:06:07.15ID:koiSDZhT
IPC 10%up + メモコン性能向上にクロック実質全コア0.5〜1.0Ghz増量だから
安売りする必要はないと思うけどねこの性能なら同じ同じコア数で最大45%ぐらいは速いだろうし
0591Socket774
垢版 |
2017/05/13(土) 21:35:25.56ID:vCUuOfg1
なおTDPは
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況