X



Intelの次世代技術について語ろう 91©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0761Socket774
垢版 |
2017/10/22(日) 04:59:24.83ID:aDtk1TrE
人権なんてあったもんじゃない
人権無視の国日本!

広告配信システムのOpenXにバックドアが仕掛けられる
電通のおわり!
OpenXは2010年8月より電通子会社のサイバー・コミュニケーションズとアドエクスチェンジの独占的パートナーシップを締結、広告リクエストは開始当初より600%と急成長を遂げてきた・・・・
だってお!wwwwwwwwwwwwwwwwwwwwww

嘘も百回言えば真実となる広告産業のナチス的手法
電通自殺者を
ホロコーストを忘れるな諸君!
芸術よ永遠なれ!
自由主義者よ永遠なれ!
0762Socket774
垢版 |
2017/10/22(日) 05:00:06.95ID:CP1PtYmC
intel fin heightの遷移
34nm(22nm)→42nm(14nm)→46nm(14nm+)→46nm(10nm)→53nm(10nm+or++)?
0763Socket774
垢版 |
2017/10/22(日) 05:05:40.61ID:CP1PtYmC
これで10nmが14nm++に比べて冴えないのがなんとなく理解できるし性能が飛躍する10nm++でfin heightを53nmにする計画?
0764Socket774
垢版 |
2017/10/22(日) 05:21:02.01ID:T2Alynt9
>>759
x64がひどいのは事実だが今さら変えられん。
SSEのオペコードもどうしようもない。
SSEのプリフィクスだけはAVXで整理して
拡張部分のエンコーディングはまあ許容範囲内だから
AVXだけなら合格点だ。
0766名無しさん@そうだ選挙に行こう! Go to vote!
垢版 |
2017/10/22(日) 09:33:57.77ID:GJbGnSVo
>>759
実際にそれを用いる人らにとってはどうでもいいというか
整理されてスマートになったアーキテクチャとやらで
RISCみたいにプログラムを行う実際の顧客が発狂するような仕様になるだけ
0768名無しさん@そうだ選挙に行こう! Go to vote!
垢版 |
2017/10/22(日) 10:43:30.13ID:Fivg/45z
そうじゃなくてAVX512のサブセットのことだろ
0770名無しさん@そうだ選挙に行こう! Go to vote!
垢版 |
2017/10/22(日) 11:22:52.81ID:SuQE2G6v
SSEは最低でもSSE命令のプリフィクスとREXプリフィクスの2つのプリフィクスを処理しないといけない。
AVXにはREXプリフィクスは付かないからデコードが楽になる。
何種類かあるAVXプリフィクスはプリデコーダで較的容易に一番長いタイプに変換可能であり、SSEもREXプリフィクスの処理の分遅くなってもAVXに準拠した命令に変換可能なのでデコーダ以降は一種類でいい。
厳密にはSSEとAVXでレジスタの未使用bitの扱いに非互換の部分があるがこれは内部命令が両方に対応しているがAVX命令の方が処理が軽くて速いまたは消費電力が少ないようになっている。
今後はAVXのSSE代替命令を使うようにすればいい。少なくともコンパイラは対応している。
すでにMMXとx87は代替命令を用意して発展的解消している。互換処理で遅くなっても過去のCPUよりは速いので問題はない。
0771名無しさん@そうだ選挙に行こう! Go to vote!
垢版 |
2017/10/22(日) 11:36:46.69ID:e74GobY0
x64は大枠においては良いのだがプリフィクスの整理をしなかったのと64bitモードからシームレスに16モードに移れず32bitOSと互換性をなくしてしまったのが問題。
Microsoftはこの問題に対して最終的に仮想マシンを立ち上げて32bitOSを走らせるという力業で対応したが、そのサポートもWindows7のProfessional以上にのみ限定で終わった。
0775名無しさん@そうだ選挙に行こう! Go to vote!
垢版 |
2017/10/22(日) 18:31:47.41ID:CP1PtYmC
AV-X
0776Socket774
垢版 |
2017/10/22(日) 20:49:34.71ID:C6KnrsZQ
                                /\  100%
むしろIntelの方がシェアが高く感じられる  /.   \
                          /.         \
                          /            \
                          /                  \
                    /                  \
                    /                        \
                    /                        \
                    /                              \
              /                  ,────>     \ 0%
              /                      /            /
              /                    /            /
.           /               / ̄ ̄ ̄             /
        /               / ̄ ̄ ̄                 /
.     /            /                    /
.     /              /                    /
  /      ____/                    /
  \    /                        /
.     \                              /
.     \                        /
        \                        /
.           \                  /
              \                  /
              \            /
              \.         /
                    \.   /
                    \/
0777Socket774
垢版 |
2017/10/22(日) 22:06:14.87ID:7cRNMLyZ
64bitだとSSEも16レジスタじゃないけ?
AVX512は32本
0778Socket774
垢版 |
2017/10/23(月) 05:59:34.26ID:Leuerpyw
>>777
SSEのレジスタ16本は手作業での最適化を32bit版と別にコーディングしないといけない上にCPUによっては逆に遅くなるから使ってないソフトも多いだろう。
0779Socket774
垢版 |
2017/10/23(月) 08:49:00.61ID:XnHIKQgn
visual studioなんかだと、32ビット版でSIMDを使おうとすると、関数の引数に制限があったりと、コードの互換性にかなり手間だった記憶があるな。
0780Socket774
垢版 |
2017/10/23(月) 09:25:30.13ID:UWmeXaZE
>>753-754
Raven RidgeのiGPUがMX150(≒GT1030)に迫る性能という話を聞くと、IntelとAMDの奇跡の融合がただのガセネタだったのはちと残念
0781Socket774
垢版 |
2017/10/24(火) 02:14:29.90ID:7Cgx/1z2
>>778
Intrinsic使えばそんなことはない
逆に言えばアセンブリで書く人は32bitと64bitで別々に最適化したい人
0782Socket774
垢版 |
2017/10/24(火) 02:36:33.31ID:nHbAxdto
>>781
AVX非対応のx64てWindowsだとほとんど32bitで使われてるんじゃない?
SandyBridgeが圧倒的すぎて64bitを使うような人は皆買い換えちゃったでしょ。
誰も使ってない狭い市場向けにオプションを開発しても割に合わないよ。
0783Socket774
垢版 |
2017/10/24(火) 06:40:16.50ID:nI0eXKjY
Intrinsicとアセンブラはまだまだ差が大きい
0784Socket774
垢版 |
2017/10/24(火) 06:44:37.28ID:nI0eXKjY
32bitはオワコン
レジスタ数も8本から増やしてもらえない
IntelやAMDからも見捨てられてる
パフォーマンスが必要なソフトで32bit環境なんて
考えられない

32bit版の最適化は手を抜いて
64bit版に注力するのが良い
0785Socket774
垢版 |
2017/10/24(火) 07:17:00.75ID:HGmekzDA
      """リ"(( (''|ii,,,、-'ー-''(:ノノ
     ii、-'"―、;; ii、〉   ひ 7;;
     省 媚 `(`ノ    :  {彡
     み び  {;;;;)   退  >彡
     ぬ ぬ i"::/ ! !. か (:::;;;
      ! !.   | ;;;ヽ_ ぬ / |
    マ-i,、-、r''" ;;;;;;ノYi )''"  し
    ::::、 ii、 t;;; :::::;;;;i':::::U  ::::::::
    ::::::ヽ ヽ,,~ヽー、;; ::::::(  ::::::::r
    ::U::: `' 、ヽ、、 t;;;|ヽ;;;ヽ淫ノ;;;
   ::::::::::;;、、、;;;;≧ミ=、,n,|ヽ;}ii |;;;;;
    Z:r"タ"'",=、''''ー、~'ー、ノノ|,i;ー
    三>'=='="チ=ー':`'"、;;;;;ン
   U  "  ::::::::::::::;;;;;;'''"ヽ|;;j彡"
   、:::  ::::::::::::::,イ:::;;;;;;;~'-、,j;;jー''":
  :、 ', U ::::::::::::::U::;;;;;;;;;;;、 リ;;;| :"
  :::t ':, ::::::::::::::::::::''"(⌒ /;;ヽ
  :::::t ヽ ::::::::(j:   ::::ヽ`'(;;;;;;;)''"
  ::::::::t U:::::::::  _,,,、;;_゙' 、;;;;;;;、ノ
  ::::::::::',  :::::::: イ'r、、"'''ー―ー-''"
  ::::::::::::ヽ ::::::: ij('ブ `""`´´"´
   ::::::::::::::ヽ u ......~'''""~~ ̄ ̄ ̄
   :::::::::::::::::ヽ :::::J::::::::::::r;;;;;;;;;;;;ヽ
 |.| ::::::::::::::::::::::ヽ::::::::;;;;;::::;;;;;
 U ::::::::::  :::::::::::::ヽ
0786Socket774
垢版 |
2017/10/24(火) 16:00:54.45ID:35GFKLe2
>>782
Pentium、Celeronとかは今もAVX非対応
0787Socket774
垢版 |
2017/10/24(火) 16:39:24.72ID:JX6pZFw1
AVXが効果あるような用途でPentium?
とりあえず動くようにするだけでパフォーマンスは考えなくていい
もともとパフォーマンスとか気にしてない人たち用なんで

最適化が重要なのは、新しいCPUの64bit環境
0788Socket774
垢版 |
2017/10/24(火) 19:54:28.51ID:ealZZ3Z5
パフォーマンスが必要な一部のソフト以外32bitで問題ない

VMとかで32bitXP動かして、XP時代のMSVCをつかって32bitでビルドすれば
ほとんどの環境で動作する
0789Socket774
垢版 |
2017/10/24(火) 19:59:30.83ID:JX6pZFw1
パフォーマンスが必要な一部のソフトの為のハイパフォーマンスCPUだろうが
0790Socket774
垢版 |
2017/10/24(火) 20:00:19.66ID:JX6pZFw1
VS2017でもXP用のビルドが出来る
0791Socket774
垢版 |
2017/10/24(火) 20:01:54.02ID:JX6pZFw1
Windows 10 64bit
VS2017

でも
32bit XPで動作するバイナリがビルドが出来る
0792Socket774
垢版 |
2017/10/24(火) 20:04:15.57ID:JX6pZFw1
パフォーマンスが不要ならネイティブアプリである必要も無いけど
0793Socket774
垢版 |
2017/10/24(火) 20:58:11.97ID:ft3LShqs
>>786
全ラインナップでAVX対応してるのはAMDだけだしな
0794Socket774
垢版 |
2017/10/25(水) 00:12:06.94ID:BQP7s2ja
CoffeeのPenGはAVXとHTT有効
CeleronはAVXとHTTと引き換えに1コアにデグレードでいいよ
AVX有効2コアHTT無しだと旧PenG喰っちゃいかねないから
0795Socket774
垢版 |
2017/10/25(水) 06:05:47.83ID:HC2gKRtI
   ガタガタ    オロオロ
   /In_/    ガタガタ
  <<``ДД´´;>>   /In_/,‐,   グラグラ
  //    \\  {{∩∩;`Д´ >ノノノ  オロオロ
 ⊂⊂     lノつ'  ヽヽ     l'
   | |  (⌒)) }}   | |  (⌒)) }}
    ,,し'⌒^       ,,し'⌒^
0796Socket774
垢版 |
2017/10/25(水) 13:13:04.64ID:stCaZOvH
つかよくレジスタ16本とかでAVX命令行けるよね(512は別だけど)
この辺は可変長の恩恵なんだろうか
0797Socket774
垢版 |
2017/10/25(水) 14:15:45.32ID:N591h8ji
どの辺に感心してるのかよくわからん
0798Socket774
垢版 |
2017/10/25(水) 14:19:29.23ID:N591h8ji
AVX512は512bitレジスタがスレッドごとに32本
各コア、クロックごとに512bitFMAを2個ずつ実行可能
0799Socket774
垢版 |
2017/10/25(水) 14:21:08.40ID:N591h8ji
命令はプレフィックスによる拡張で非常に複雑
8bit時代をいまだに引きずっている
0800Socket774
垢版 |
2017/10/25(水) 15:07:40.66ID:hZIKC/1J
64bitは固定長+SIMD
32bitはエミュ
で良かったのに
0801Socket774
垢版 |
2017/10/25(水) 15:29:31.22ID:ZV+rfLTP
itanium(ボソッ)
0802Socket774
垢版 |
2017/10/25(水) 15:49:34.08ID:LPcCGriA
>>801
核地雷はNG
0803Socket774
垢版 |
2017/10/25(水) 16:56:16.11ID:w5QlKHmW
AVX512のクロックの下がり方はかなり大きいな。
ベクトルが2倍になっても性能は1.45〜1.68倍くらい

              AVX512/AVX2 base/T all/T one              2→512
Xeon Gold 6126F 12C   1.7/2.2   2.6/3.3/3.7    135W 652.8GFLOPS 1.5454 $1931
Xeon Gold 6130F 16C   1.3/1.7   2.1/2.8/3.7    125W 665.6GFLOPS 1.5294 $2049
Xeon Gold 6142F 16C   1.6/2.2   2.6/3.3/3.7    160W 819.2GFLOPS 1.4545 $3101
Xeon Gold 6138F 20C   1.3/1.6   2.0/2.7/3.7    135W 832.0GFLOPS 1.6250 $2767
Xeon Gold 6148F 20C   1.6/1.9   2.4/3.1/3.7    150W 1024.0GFLOPS 1.6842 $3227

Xeon Platinum 8160F 24C 1.4/1.8  2.1/2.8/3.7    160W 1075.2GFLOPS 1.5555 $4856
Xeon Platinum 8176F 28C 1.3/1.7  2.1/2.8/3.8    173W 1164.8GFLOPS 1.5294 $8874
0804Socket774
垢版 |
2017/10/25(水) 17:33:10.05ID:IFv63dLB
AVXに絡まない処理が巻き添え食らうペナルティーも見落とせない
0805Socket774
垢版 |
2017/10/25(水) 17:38:35.72ID:c8hsFevA
内部命令にコード変換する時点で外部命令は自由に変えて良かった。
AMDはそこを理解せずに古いコードをそのまま64bitに持ち込んで失敗した。
0806Socket774
垢版 |
2017/10/25(水) 17:56:17.36ID:Rg8LLKBd
失敗……?
0807Socket774
垢版 |
2017/10/25(水) 18:12:16.50ID:qKeeZnlv
x64命令は、駄作ではないが最良でもない、ほどほどの出来栄えの命令セットとして
長く使われる
0808Socket774
垢版 |
2017/10/25(水) 18:39:14.88ID:xlm64wKS
高ベクトル計算を活かすにはRISCじゃ無理
HPC-ACEみたいにレジスタ拡張しまくればいけるかもしらんが
0809Socket774
垢版 |
2017/10/25(水) 19:02:57.93ID:hZIKC/1J
メモリーなオペランドもOK(パイプラインストールしまくり
レジスター(SIMD)はどうせ肥大化しまくるし
あとはメニーコア
0810Socket774
垢版 |
2017/10/25(水) 19:08:40.35ID:txjqPuv1
つまりitaniumサイッキョってことですね
0811Socket774
垢版 |
2017/10/25(水) 19:32:41.23ID:8hLmlGUK
VLIWにするよりメモリアクセスを含めてOoOするほうが速いってわかっちゃったからなぁ
0812Socket774
垢版 |
2017/10/25(水) 19:38:21.39ID:g//edBSJ
>>803
微妙なトランジスタの増加でその性能なら十分すぎる
コア数を1.5倍にするよりはるかに効率的
0813Socket774
垢版 |
2017/10/25(水) 19:38:22.62ID:hZIKC/1J
メモリーなオペランドあるx86のほうがOoOのありがたみがあるという
0814Socket774
垢版 |
2017/10/25(水) 21:11:51.60ID:N591h8ji
メモリーなオペランドは、内部的には複数命令に分かれる
0815Socket774
垢版 |
2017/10/25(水) 22:57:53.56ID:MkjbHn5L
実計算ソフトでSkylake-SPはBDW-EPより最大+138%のパフォーマンスアップ
さらにCST等、自分達の方がIntelライブラリよりさらにXeonのパフォーマンスを向上出来てると宣伝
サードパーティ含めこんだけ上げまくれるのに、ダメ路線とするのは流石にどうかしてる
0816Socket774
垢版 |
2017/10/26(木) 00:27:51.34ID:dM+rDRoG
>>812
微妙なトランジスタの数?

ま、3〜4割の性能向上というのは大きくはあるけど
それに必要なトランジスタ数は少なくはないはず
0817Socket774
垢版 |
2017/10/26(木) 00:44:28.54ID:e8NR+cwx
BDW-EP 485mm^2、7.2B transistors
てのは出てたが(うろ覚え)
Skylake-SPに関しちゃ何もなかったな
けっこう増えてると思う
まあその分きちんと伸ばしてるんでいいんだけど
0818Socket774
垢版 |
2017/10/26(木) 00:49:40.55ID:3bof4Je+
                nonAVX           AVX512
             base/all T/8C T/1C T base/all T/8C T/1C T
Xeon Gold 6144 08C  3.5/4.1/4.1/4.2      2.2/2.8/2.8/3.5    $2925
Xeon Gols 6150 18C  2.7/3.4/3.4/3.7      1.9/2.5/3.2/3.5    $3358

nonAVXではどの動作でも6144/8Cの方が動作周波数が高い。
AVX512ではbase clockは6144/8C の方が高いが8C Turbo clockは
6150/18Cの方が高い。逆転している。面白いな
0819Socket774
垢版 |
2017/10/26(木) 01:07:05.41ID:+z1W+A9a
>>814
いつの話をしてるんだ。今は1命令で処理してるだろ。
0820Socket774
垢版 |
2017/10/26(木) 01:22:22.02ID:PsJ4pHb/
>>816 ダイサイズはAMDツェッペリンと大差なさそう。28Cが700平方mm、18Cが480平方mm。
ツェッペリンはインタコネクトとかPCIeの多さで面積食ってるようだけど。
>>803は3〜4割じゃなくて5〜6割りでしょ。なぜ小さくなるw
0821Socket774
垢版 |
2017/10/26(木) 01:29:01.22ID:PsJ4pHb/
>>818 8C稼働/10Cダイ、8C稼働/18Cダイで、放熱は後者が楽だからとか。
0822Socket774
垢版 |
2017/10/26(木) 01:35:29.50ID:CDgOrjq7
コア間のインターコネクトでも面積に差が出るので
ちゃんと見積もるならコアとキャッシュの面積で比べないと駄目
0823Socket774
垢版 |
2017/10/26(木) 01:42:49.41ID:PsJ4pHb/
AVX512のせいでコアサイズが5〜6割も大きくなる訳じゃないからいんじゃない
ってのが>>812氏の話かな。
Sky-SPはL2比率が大きい(これもAVX512のためか)のもサイズに効いてくる?
0824Socket774
垢版 |
2017/10/26(木) 01:56:48.87ID:J08Grn7K
Intel「Core i9-7980XE」、「Core i9-7960X」、「Core i9-7940X」
ついにきた18コア「Core i9-7980XE」など3モデルが発売
http://ascii.jp/elem/000/001/575/1575938/
0825Socket774
垢版 |
2017/10/26(木) 05:26:18.16ID:AoN6+0O0
x64命令はintelのEPICアーキテクチャに対するamdのアンチテーゼなのだからx86の呪縛から逃れられないのは当たり前
中長期視野に立った改革でなく目の前の利益を狙ったものだ。だが、それが大いに受けたそれだけ
惜しむらくはintelがitaniumをEPICでなく普通にRISCにして置けば今のような状況には陥らなかったと思う(結果論)
0826Socket774
垢版 |
2017/10/26(木) 06:28:05.60ID:vmcnV0At
>>816
ダイの写真から推測すると1割程度
0827Socket774
垢版 |
2017/10/26(木) 06:31:33.66ID:vmcnV0At
>>819
内部ってuOPのこと
IACAを見ればuOPが別な事がわかる
0828Socket774
垢版 |
2017/10/26(木) 08:40:29.04ID:a6fr07Wd
x86の呪縛と言っても…
それはアーキテクチャを研究する人の認識であって
アーキテクチャで研究する人とは違うのだから
その辺の齟齬理解しないと
0829Socket774
垢版 |
2017/10/26(木) 10:08:07.01ID:3bof4Je+
>>821
そういうことらしいな。
8C/18C AVX512では残りの10コアが、nonAVXではどちらも
SIMDエリアが遊んでいるからクロックをあげられる、と
0830Socket774
垢版 |
2017/10/26(木) 10:36:51.54ID:3bof4Je+
28コアのXeon Gold 8180の動作周波数について漏れなく伝えるためには
nonAVAに6種、AVX2に7種、AVX512に9種、合計22種もの数値が必要になった。
コア数とAVXとで2次元の表になっちゃったからな。
2007年まではたったひとつの数字で事足りていた。
0831Socket774
垢版 |
2017/10/26(木) 11:28:54.92ID:dM+rDRoG
>>820
ごめん、一般的なエンコードを想像しながら書いた
(出典のよくわからないデータは読み飛ばすに限る)

>>826
それはL2、L3とかインターコネクトも含めての比較ではってこと?
それはちょっとに比較としてはナンセンスかと
0835Socket774
垢版 |
2017/10/27(金) 00:58:38.49ID:Xl2imQlU
>>831 まぁ、元々AVX2→AVX512の話だから、君の話はずれてる。
0836Socket774
垢版 |
2017/10/27(金) 01:13:55.43ID:6iEedVMA
>>832
TSMCの7nmはビアのみCo、GFの7nmはCuのまま
想定される電流密度にもよるはず
0837Socket774
垢版 |
2017/10/27(金) 03:16:18.87ID:kxBYCJWS
            /    /,, __     `ヽ、
           /  ///      ..   ... ヽ
          / ,、i i  / /// /      'ヽ
         / i,,/ ``、ヽl i i  /  ノ ノ ノ /  ヽ
         /( i'   ..::::::``ii, , //ノノ/,; ',,,  ノノ   l
          iヽ/  ..::: :::     ) )    彡 彡'  |
         ;ミ!   :: ..: ::   /ノ    彡 _,, '  .ノ
        ;ミi(((ii,、 : : :::: /.      彡 _,, ' .ノ ;IntelがAI向けプロセッサをCPUに統合する可能性を示唆!
__,,, --------;ミlヽi_\((  O .:      彡  ノノ.ノ  
::::::::::::::::::::::::::::::`| ''\u`、ミi、' i、_,,,,, -'''))) ヽン / ノ 
_________::::::::::::::::::|    ̄~/ ミ `、ーu-';_,;;;;''' ),ノ) ノ、
    |:::::::::::::::::| .......:: / '~ :::ヽ ̄~~~  /__ノー'---、__
  .  !:::::::::::::: l| .: , ./、  、 :.     ..:;;/、  `::    ヽ
     i:::/ ̄'i | ::.ヽ ヽ ー'''' :     .::;i~ :: ::. ::
:..    ヽ :  ,i |  .~''- ,,,,___    ,;/`::..   :::__,, ----=
:::::::...   ヽ : i ::| .:"'' ..,,,     /i`:::::: .::::::./
\::::::...   \| :::|   :::     ,, -''"::: \ :::::::/
https://pc.watch.impress.co.jp/docs/column/ubiq/1088131.html
0838Socket774
垢版 |
2017/10/27(金) 05:36:02.15ID:E+m7nxzS
IntelがAI向けプロセッサをCPUに統合するとしたらdesktopでAVX512に何をやらせるつもりなのかな?
0839Socket774
垢版 |
2017/10/27(金) 06:20:54.85ID:7DwEnlWP
>821 >829
Xeon ScalableのSpecification Updateというドキュメントから
 Platinum  XCC die
 Glod 61xx XCC die
 Glod 51xx XCC die、HCC die
 Silver          HCC die、LCC die
 Bronze                LCC die
Gold、Platinumでは、HCCやLCCのコア数で
足りるからそちらを使う、とはなっていないらしい
0840Socket774
垢版 |
2017/10/27(金) 06:26:07.52ID:Qsk9kSM+
機械学習には学習処理と推論処理があって学習の方ははAVX使うんじゃないの?
0841Socket774
垢版 |
2017/10/27(金) 07:38:11.63ID:Xl2imQlU
>>839 6150と6144はどっちもXCCだね。他の事情かね。
※Thermal Guide はS-Specじゃなくてモデル名でダイ種別が書いてあるので分かり易かった。
 HCC以下はUPIが2つでGold 5100以下でしか使えないんだっけ。
0842Socket774
垢版 |
2017/10/27(金) 08:39:09.02ID:Xl2imQlU
あとは単純にTDPの差がAVX512 8C動作辺りだと影響してくるとかかね。
0843Socket774
垢版 |
2017/10/27(金) 11:29:02.00ID:b7ARz0sz
AIっつーても半精度のベクトル演算追加程度のもんでしょ
部分的にFPGAみたいなの載せて設定可能なデータフロープロセッサとかやってきたら面白いけど
0844Socket774
垢版 |
2017/10/27(金) 13:01:58.40ID:aYa0elpK
Nervana NNPは結局学習もできるみたいだよ
Xeonだと現行ので深層学習関連のはINT16、INT8サポートしか今のところないけど(4VNNI等はPhi専用だろうし)
0845Socket774
垢版 |
2017/10/27(金) 13:02:33.39ID:aYa0elpK
しかもそれも、AVX2で似たようなのが元々あったものだし
0846Socket774
垢版 |
2017/10/27(金) 13:37:36.10ID:OCyc7hN3
>>833-835
skylake-xの上はアンコアっぽいから無視するとしても、最終的に倍近くなってない?
0847Socket774
垢版 |
2017/10/27(金) 14:22:48.87ID:6iEedVMA
メモコンのタイルと見比べると、各タイルの右上か左上にある領域がルーター部で、それ以外はコアとキャッシュ領域な感じ
>>833の解析はたぶん間違い
0849Socket774
垢版 |
2017/10/27(金) 14:53:41.36ID:6iEedVMA
そんなスライドがあったのか
てっきり整然と並んでる上の二段がL2とL3かと思ってたよ
でもルーター部の下と横にSRAMがあればその上の層に配線を通せるから理に叶った配置か
L2がごちゃごちゃして見えるのはバス幅を増やしてるせいかもしれないね
0850Socket774
垢版 |
2017/10/27(金) 17:28:19.60ID:OCyc7hN3
>>848
初めて見た
データバスはどうなってるんだろう
skylakeの時点でAVX512に対応できるように
あらかじめ拡張済みだったんかいな
0851Socket774
垢版 |
2017/10/27(金) 17:37:19.97ID:kxBYCJWS
 僕たちRyzenブラザーズ!
 ̄ ̄∨ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
  AmD           AmD
 ( ・∀・)  AmD    (・∀・  )  
 ( つ  )つ ( ・∀・)  /(  б ) age
 l⌒__ノ  (○   ) ∪⌒__ノ    age
 し'  し'  (_)`∪ノ  (_/ ヽ_)
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
AMD,ノートPC向けの新世代APU「Ryzen Processor with Radeon Vega Graphics」発表。「性能はKaby Lake-Uを上回る」
http://www.4gamer.net/games/300/G030061/20171025016/
0852Socket774
垢版 |
2017/10/27(金) 18:11:44.00ID:kxBYCJWS
>>843
AI向けプロセッサをCPUに統合するとしたら「サファイアラビッド」からの可能性大!
0853Socket774
垢版 |
2017/10/27(金) 18:58:57.58ID:F2tIKNJc
SkylakeでAVX-512は実装済
HTTや64bitのようにオフにしてただけ
0854Socket774
垢版 |
2017/10/27(金) 19:24:34.78ID:Qsk9kSM+
skylakeにはAVX-512の回路が載ってるコアと載ってないコアの2種類がある
これについては>>848の記事に詳しく書いてある
0855Socket774
垢版 |
2017/10/27(金) 20:35:04.35ID:OCyc7hN3
疑問に思ったのはデータパスなどだってばよ
port5にFMAユニット追加ということは
port5は元から256bit FMAユニットを使いこなせるように作られてたの?ってこと
つまりポン付けでFMAついかすればいいようになってたのかってこと
0856Socket774
垢版 |
2017/10/27(金) 20:43:13.41ID:9hWLHZFr
載ってる・載ってないの違いがあるのは2つめのFMA演算器で、内部的にはAVX-512対応済みで無効化しているだけだと思う(有効化してもAVXとスループット変わらんけど)
0857Socket774
垢版 |
2017/10/27(金) 20:45:33.77ID:yRCn9Mbr
なんか不正確

AVX512はSkylakeから載っている(と思われる)
演算ポートが1個の物と2個の物がある
Skylakeは1個、SkylakeXは2個

1個だと256bit 2個からは性能が上がらない
性能の低いAVX512のリリースはAVX512の普及を妨げる為、マーケティング上の戦略で無効にしたんでしょう
0858Socket774
垢版 |
2017/10/27(金) 20:54:17.36ID:9hWLHZFr
その割にはXeon SilverとかGold下位とかFMAポート1個しかないのも売ってるけどなんでかな(差別化要因?)
0859Socket774
垢版 |
2017/10/27(金) 20:56:54.44ID:yRCn9Mbr
その辺は、アホがAVX512は使えないって騒ぐことは無さそうだから

とか?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況