X



CPUアーキテクチャについて語れ 40©2ch.net
レス数が900を超えています。1000を超えると表示できなくなるよ。
0806Socket774
垢版 |
2017/10/21(土) 04:54:57.72ID:EJ+tDdsw0
AVXってGPGPUするほどじゃないときに使うものでしょ。
0807Socket774
垢版 |
2017/10/21(土) 04:59:31.59ID:TWi0OczI0
DBなんかはむしろAVX、TSX、persistent memoryの3点セットが最強になるんじゃない。
0808Socket774
垢版 |
2017/10/21(土) 05:20:54.07ID:TWi0OczI0
AVXは単純にGPGPU的な物って思たったら的外れになるんじゃないかね。
ちなみに、Skylake-SP/Wのダイ使ったSkylake-Xの高クロック耐性がかなり非凡だけど、
あれはHPC向けで採用されたとき何かに高クロックで性能稼ぐとかの目的もあるのだろうか?
一般向けSKUのスペックだと過剰としか思えない。
0809Socket774
垢版 |
2017/10/21(土) 08:44:24.11ID:u83AJQZe0
AVX大好き団子
0810Socket774
垢版 |
2017/10/21(土) 10:17:49.70ID:48l7D4Fk0
>>808
逆なんじゃねーかな
ぶん回せるようにに作っておけば多少品質がわるくてもそうやってラインナップを作れる
0811Socket774
垢版 |
2017/10/21(土) 10:33:49.82ID:lB+keWS+0
top500 に載るような規模のシステムは、その時点の高クロックXeonや
最多コア Xeonをほとんど使わない傾向がある。2.xGHzが
選ばれている理由は、たぶんFLOPS/ドルを優先しているからだろう

> TOP500 Xeonシステム アクセラレータなし
>      ソケット総数 平均コア数 平均クロック周波数
> 2007/11  約57万    2.79コア   2.68GHz
> 2011/11  約80万    5.03コア   2.73GHz
> 2015/11  約153万    8.37コア   2.47GHz

> Xeon 多コア      高クロック
> 2007  4コア(3.2GHz) 3.4GHz(2コア)
> 2011 10コア(2.4GHz) 3.6GHz(4コア)
> 2015 18コア(2.6GHz) 3.7GHz(6コア)
http://potato.2ch.net/test/read.cgi/jisaku/1447725141/777
0812Socket774
垢版 |
2017/10/21(土) 10:49:51.36ID:TWi0OczI0
>>810の件は心配ないくらい回るみたいだよ。Sky-Xだけそんな超選別してるってことはないよね。
1Vくらいで全コア4GHz回って1.2V辺りで全コア4.5GHzくらい回るみたい。
単純にメインストリームと同じ物理設計にしてるだけなのかね。
0813Socket774
垢版 |
2017/10/21(土) 12:07:52.05ID:DSBCbTgfa
SKL-SPはなんもベクトル拡張命令使わなかったら
20コア以上でも特に電圧盛らなくても全コア3Ghz以上回るみたいだし
やはり選別品なんでは
0814Socket774
垢版 |
2017/10/21(土) 12:56:11.97ID:TWi0OczI0
Xeonはロックされてるから(パワーリミットの制限)、多コアになるほど上限クロックが
低いのは当然だけどね。大半のSkylake-SPは少数コアターボ3.7GHzだけど
Plutinum 8180は3.8GHz。8180もロック外したら結構回りそうな感じがする。
0815Socket774
垢版 |
2017/10/21(土) 13:55:14.38ID:Bjia1mM40
>>804
そらまあ90年代と比べたら遅くはなったけど
でもこの2010年代だけでも、AVX等のおかげで4倍くらいのパフォーマンス上昇は出来てると思うよ
何よりも特化型を作ると潰しが効きにくく、むしろ今は専用回路屋さんは苦しくなってると聞くけれど(流行りの機械/深層学習関連とかはともかく)
0816Socket774
垢版 |
2017/10/21(土) 15:44:04.32ID:qYfCv+auM
そうなるとZen2のAVX2対応が気になるな
時流のSIMD強化に乗ってくるのか、それともノンネイティブのままなのか
0817Socket774
垢版 |
2017/10/21(土) 15:54:11.85ID:TWi0OczI0
AVX2 1クロック、AVX512 2クロック、ダイ当たりメモリ4chくらいにしないと凡庸過ぎるかね。
0818Socket774
垢版 |
2017/10/21(土) 19:52:02.50ID:GBvNy1ML0
>>815
え?
プログラムなんてもんが必要な分だけ汎用回路のほうがイロイロ不利ですけど、それ事実?
0819Socket774
垢版 |
2017/10/21(土) 20:42:04.00ID:lB+keWS+0
組込の低電力汎用プロセッサの電力性能比が高まったから、
以前なら電力的に汎用が避けられた領域にある程度汎用が食い込んだ、
ということはあったと思う。専用ならもっと低電力にできるが
そこまで下げる必要はない、という分野もあるから。

しかし、今から成長が見込まれるIoTではそこまで下げたい場合の方が多いだろう。
0820Socket774
垢版 |
2017/10/21(土) 21:13:27.47ID:mfQ2h99Q0
汎用つってもARMだけなんだけどね
0821Socket774
垢版 |
2017/10/21(土) 21:15:27.10ID:Bjia1mM40
>>818
少なくともXilinxの人は、自分らが成長している要因としてんなこと言ってたけど
0822Socket774
垢版 |
2017/10/21(土) 23:01:24.05ID:fk7naOrSa
>>820
ARMのIoT部門の売上高ってどんなもんなの?
0827Socket774
垢版 |
2017/10/26(木) 17:09:26.76ID:ZIlFRc+l0
>>826
記事読んだけど、そもそも来年に7nmとか可能なの?
SamsungやTSMCのインチキ7nmですら、搭載スマホが出るのは再来年だと思ってた
0828Socket774
垢版 |
2017/10/26(木) 17:18:43.62ID:yKcBEK7Z0
そもそも何億台とか必要なスマートフォンと
1万台程度必要なCPUとでは単価は違い過ぎるし出せるだろう
0829Socket774
垢版 |
2017/10/26(木) 18:16:22.61ID:zXq0ytmn0
>>821
FPGAの汎用性とCPUの汎用性は、ちと意味が違うんでないの?
0830Socket774
垢版 |
2017/10/26(木) 18:34:14.00ID:3bof4Je+0
LSIを起こしていたけどやめちゃってFPGAに移行した例
 新 ttp://www.altima.jp/products/design/case1.html
 旧 ttp://www.itmedia.co.jp/lifestyle/articles/0709/27/news121.html
0831Socket774
垢版 |
2017/10/26(木) 18:56:43.38ID:FclP1ytI0
NEC SXの新型来たな
アクセラレータ型になるからどうすんだろと思ったが、なるほどアプリ丸投げか
というかアクセラレータ型とホスト型の中間といった感じかな?
0832Socket774
垢版 |
2017/10/26(木) 20:12:07.10ID:9Vu7SezM0
>>830
少量生産品はFPGAが低コストだが、量産品はASICが低コスト
また量産品では低消費電力も求められるためにASIC有利
0833Socket774
垢版 |
2017/10/26(木) 20:19:07.40ID:9Vu7SezM0
NECの新型スパコンは、メモリにHBM2を採用
団子押しのHMCは採用されず
0834Socket774
垢版 |
2017/10/26(木) 22:34:07.54ID:6NPm5mWXa
>>833
ベクトルCPUのメモコンは超リッチだからとにかく帯域だけあればいいんだろう。
量積むにしてもHBMの方が安く済むしな。
0835Socket774
垢版 |
2017/10/26(木) 23:36:09.91ID:fTOeRoS60
競争が善≠フ時代は第三次世界大戦を持って終わらせる!
人類を、滅亡させる
0836Socket774
垢版 |
2017/10/27(金) 06:01:13.52ID:h5TI6LRZ0
まあHMCは実質死んじゃったしな
0837Socket774
垢版 |
2017/10/27(金) 08:35:50.76ID:bLi6ZmQPa
Bytes/FLOPSはSX-ACEより悪化したが
テラスケールノードで、演算性能当たりのメモリ帯域がリッチな構造ないしね
てか前の発表だとコア性能は半分だったんだが、上げられたんだね
0838Socket774
垢版 |
2017/10/27(金) 22:57:41.16ID:9hWLHZFr0
ベクトルプロセッサで1コア当たりの性能とか言われてもなって感はあるが
0840Socket774
垢版 |
2017/10/28(土) 02:22:15.54ID:htVMYtmP0
          Byte/Flop TB/s  GB TFlops
SX-Aurora 10A   0.49   1.2   48  2.45
SX-Aurora 10B   0.56   1.2   48  2.15 
SX-Aurora 10C   0.35   0.75  24  2.15
Tesla P100 PCIe  0.18   0.72  16  4.036

過去のSXの4B/Fとか1B/Fとかに比べたら下がってしまったが、
今そんなことをやろうとしたら、容量が少な過ぎるとかレイテンシが
大き過ぎるとかになってしまうんだろうな
0841Socket774
垢版 |
2017/10/28(土) 03:00:42.57ID:/OrcDhJk0
NECの新製品、ノード間通信がInfinibandになったとか、ますますNECらしさがなくなったな
コスト当たりの性能で、nvidiaに勝てるのかどうか心配

また、忘れたころ(5年とか)に後継機を出すNECとちがって、毎年新機種を出すnvidiaは進化の速度が速い
0842Socket774
垢版 |
2017/10/28(土) 03:14:56.56ID:1cW/17cX0
まあ現状NVIDIAに対抗できてそうなのIntelぐらいしかないし…
0843Socket774
垢版 |
2017/10/28(土) 04:21:24.73ID:htVMYtmP0
PEZY-SC2 暁光/Gyoukou
         6月    11月
GFLOPS/W 10.226  14.69
  LINPACK 1.67713 14.13PFLOPS
   理論値 3.20768 19.89PFLOPS

TSUBAME3.0 14.111GFLOPS/W (6月 Green500 1位)

ttp://www.pezy.co.jp/news/PEZY_PR_20171026.pdf
ttp://www.pezy.co.jp/
0844Socket774
垢版 |
2017/10/28(土) 04:39:16.11ID:1cW/17cX0
すごいけど11月のTop500/Green500にはTesla V100で組んだのが出てくるんじゃないかな…
0845Socket774
垢版 |
2017/10/28(土) 07:35:43.08ID:iQNfFpfBa
PEZYのがどんな規模なのしらんが
基本、規模の小さなクラスタほど電力効率は高くなるから
そういうの抜きに発表だけされてもね
理研はこういうとこがなあ
0846Socket774
垢版 |
2017/10/28(土) 07:37:07.10ID:iQNfFpfBa
それと今の時代にHPLとか……最早全く役に立たなくなった指標を出されても……
0847Socket774
垢版 |
2017/10/28(土) 07:48:34.88ID:1cW/17cX0
規模小さいって言っても密度が高いから演算能力は国内トップクラス
HPLはこれだけを指標にするのは意味がないとはいえ、演算能力の上限を見るくらいには今も使える
0848Socket774
垢版 |
2017/10/28(土) 09:32:48.81ID:4wm1UyAva
>>847
まあその意味のない上限とやらを見るくらいですな
0849Socket774
垢版 |
2017/10/28(土) 11:27:31.94ID:htVMYtmP0
> 14.13PFLOPS
この実測値は今年6月のリストなら世界で6番目に相当する「大きな」システム
PEZY-SC2 7056個、Xeon D 882個、962.3kW
0850Socket774
垢版 |
2017/10/28(土) 11:31:49.76ID:htVMYtmP0
暁光の関係機関はExaScaler、JAMSTEC、JST、NEDO
0851Socket774
垢版 |
2017/10/28(土) 11:48:39.07ID:htVMYtmP0
LINPACK様の処理とHPCG様の処理は科学技術計算で「同じくらい」に重要。
top500の公開が始まるよりも前から分かっていたこと。
0852Socket774
垢版 |
2017/10/28(土) 12:57:09.58ID:nLS9mFVF0
よう
0853Socket774
垢版 |
2017/10/28(土) 13:02:52.58ID:NlK3dXZRa
全然同じくらい重要じゃねえよw
0854Socket774
垢版 |
2017/10/28(土) 15:44:28.24ID:N0Np442Rd
>>830
>>815にはAVX云々とあるが?
どっからFPGAとLSI起こす話になったのか
そもFPGAはCPUでのプログラミングではなく、回路屋よりの開発かと
0856Socket774
垢版 |
2017/10/28(土) 19:21:11.02ID:mIrR/9YH0
>>848
LINPACK番長でも電力効率が高ければ実アプリに強いシステムにレベルを上げて物理で殴れば勝てるから意味はあるよ。
0857Socket774
垢版 |
2017/10/28(土) 19:21:55.05ID:iWrv7V4U0
誤爆
0858Socket774
垢版 |
2017/10/28(土) 19:29:18.07ID:/OrcDhJk0
A Linpack番長 実演算をしたときに効率10%
B Linpack番長では無い、実演算をしたときに効率50%

ただし同じ値段で買えるシステムではAがBの10倍Linpackが早い

たとえばこんなシステムだと、Linpack番長のAのほうが実演算でも早いことになる

Linpack番長だって海外勢を馬鹿にしてたら、実演算でも負けてたりする
0859Socket774
垢版 |
2017/10/28(土) 20:02:03.18ID:ocPFkaadM
ただし消費電力は50倍違うとかありそう。
0860Socket774
垢版 |
2017/10/28(土) 20:06:21.38ID:w1pYB1Dt0
nv $200いった
0861Socket774
垢版 |
2017/10/29(日) 03:22:19.64ID:UFad80Jf0
>>855
>パソコン数百台分の処理を、たった1枚のプロセッサーが行うのです。

Core i7-7700 3.6GHz       230.4GFLOPS
PEZY-SC2 1984core 700MHz 2777.6GFLOPS

NHKの経済社会情報番組部ディレクター 大隅亮は全然だめだな
0862Socket774
垢版 |
2017/10/29(日) 03:26:29.69ID:UFad80Jf0
>>861 にCore i9 も入れたかったのだが、AVX512使用時のクロックに
関する情報が見つからなくて断念
0864Socket774
垢版 |
2017/10/29(日) 04:17:37.16ID:2CWDKhS60
計算速度じゃなくコア数の比較では? 
0865Socket774
垢版 |
2017/10/29(日) 05:10:55.21ID:UFad80Jf0
>>864
処理は仕事をさばくことだ。コンピューターなら命令の実行の事だろう。
OPS /operations per second のことに他ならない
0867Socket774
垢版 |
2017/10/29(日) 09:58:14.58ID:RE30jBre0
大量の中古パソコンをどっかに隠している
0868Socket774
垢版 |
2017/10/29(日) 10:37:06.38ID:eAXOYbAz0
>>863
2018年に7nmで性能5.3倍、電力効率2.6倍、メモリ帯域5.8倍
2020年に5nmで性能2.4倍、電力効率1.5倍、メモリ帯域2倍
16nm→5nmでは性能12.8倍、電力効率4倍、メモリ帯域11.6倍

ずいぶん薔薇色の将来だなw
0869Socket774
垢版 |
2017/10/29(日) 11:48:48.37ID:UFad80Jf0
PEZY-SC2のコア数は一度縮小してるようだな
 2016年4月の記事 8.2TFLOPS(4096コア)
 2017年1月の記事 2048コア 1GHz
 ttp://news.mynavi.jp/articles/2016/04/25/pezy/001.html
 ttp://news.mynavi.jp/articles/2017/01/11/pezy2017/

>843のベンチマークは1984コア(31/32 x 2048)、700MHzだが
1GHzでも動くのかもな、電力効率が悪くなるだけで
0870Socket774
垢版 |
2017/10/29(日) 12:56:30.86ID:Co0KZp7y0
>>856
レベル上げって、スケールアップ?
0871Socket774
垢版 |
2017/10/29(日) 12:57:43.96ID:jtH+f6l40
クロックはパイプラインを深くして1ステージでやることを減らせばあげられるし、
その逆なら下げないといけない

PEZYがどのへんなのかはいまいちわからん
0873Socket774
垢版 |
2017/10/29(日) 13:41:12.15ID:hBFZBP1P0
>>872
>新興スパコン業者に補助金降ろすのに、山口敬之氏が安倍首相の名前を使って介入した。
>普通なら新興の業者が参入する余地がないところを、山口氏がそうやって介入し決めさせ、
バックマージンを貰ってる
こう批判してたけどその補助金というのがNexTEPだったからNexTEPの趣旨を理解してないだけなんじゃで記事が出た当時に片付けられたよ。
0874Socket774
垢版 |
2017/10/29(日) 13:47:26.22ID:UFad80Jf0
PEZY-SCのPE。PEZY-SC2も同じかどうかは未確認
ttp://accc.riken.jp/wp-content/uploads/2015/09/ishii.pdf

 Processor Element
  8スレッドMulti-threading
   4スレッドを順番に切り替え x 2面
   8スレッド分のレジスタファイルを用意
  16 Stage pipelining
  In-order 2way SuperScaler
  例外なし、分岐予測なし
  キャッシュ間コンシステンシはソフトウェア責任
  独自ISAによる必要命令の絞り込み

 Ring + Crossbarを合わせたバス構造
0876Socket774
垢版 |
2017/10/29(日) 14:06:40.41ID:T/10NCuq0
世の中に税金に世話になってないスパコン業者なんているのかね
0877Socket774
垢版 |
2017/10/29(日) 14:24:22.64ID:2CWDKhS60
仮に政府とズブズブで真っ黒だったとしても、それとアーキテクチャとは別の問題
0878Socket774
垢版 |
2017/10/29(日) 14:40:45.41ID:hBFZBP1P0
>>875
ベンチャー企業にありえない支援ってわけじゃないのでロビー活動の範疇だろうって話よ。
0879Socket774
垢版 |
2017/10/29(日) 14:48:22.66ID:mWx8re7va
MACオタは本題からずれた箇所での揚げ足とりしかできない
0880Socket774
垢版 |
2017/10/29(日) 14:58:30.90ID:QL/OYQoba
どっかのクソコテが消えたと思ったら
ppcの終了と共に消えた奴が何で出てくるんですかね
もうお前らの出る幕はないよ
0881Socket774
垢版 |
2017/10/29(日) 15:01:30.39ID:QL/OYQoba
と言うか何で海外で税金のテコ入れ事案は育成支援ってべた褒めして
日本の税金投入は無駄金使いって批判する輩が多いのかね?
金の使い方が下手くそ過ぎるってなら理解できるけど
0882Socket774
垢版 |
2017/10/29(日) 22:20:20.41ID:QZ5r+DPUM
PEZYはほとんど世界で類をみないプロジェクトだからな
語る価値あるだろ。
まあ性能がいいのはあの液浸冷却のおかげかもしれんけど。
0883Socket774
垢版 |
2017/10/29(日) 22:26:19.53ID:29FQkCzF0
>>874
クロスバーの方はやたらポート数が多く、リングバスはポートが少ない
普通は逆の気がするけどどういう思想なんだろうね
0884Socket774
垢版 |
2017/10/29(日) 23:17:34.12ID:TKZ7yhXl0
磁界結合型の2D実装ってなってるから
HBMよろしく超並列で接続できてて問題は少ないとか
んでコア間はリングバスでコンパクトに作ったほうが良いみたいな
0885Socket774
垢版 |
2017/10/30(月) 00:30:34.00ID:6IMmZtgs0
>861 >864 >865
こういうのはマスコミの人間の記事のつくり方に関する根深い問題。
筋書きを予め自分で作ってしまっていて、筋書きを見栄えよく
飾り付けるための単語や数字、感情表現などを拾い集めることが「取材」。

このディレクターは、1コアがこなす処理量の大小に大きな隔たりはないと
無意識に決めつけてしまっているわけだが、己の常識に対する疑いも
虚心で学ぶ心構えも乏しいから誤った決めつけであることに気付けない。
PEZY-SC2のコア数を聞いて、得たりとばかりにご満悦で疑問も持たず筋書き中に
用意してあった空欄(身近なぱそこんとの対比という欄)に入れて記事にしてしまう。
0886Socket774
垢版 |
2017/10/30(月) 01:57:14.09ID:DBPle3f+0
現状磁界結合メモリ動いてないみたいだけど、それなりの実効性能出せてるのはすごいね
0887Socket774
垢版 |
2017/10/30(月) 02:18:12.64ID:A4o6bTSM0
むしろこの程度の研究開発費で世界と戦える計算機が作れるのか?
0888Socket774
垢版 |
2017/10/30(月) 05:04:41.56ID:NP4oJCba0
>>887
寧ろリソースを潤沢に与えると失敗するという日本人特有のジンクスから抑えてるのかもw
0889Socket774
垢版 |
2017/10/30(月) 07:44:41.68ID:UFlZPqyY0
税金でプロセッサ開発してるのは
中国と日本くらいでは
0890Socket774
垢版 |
2017/10/30(月) 08:38:10.49ID:6IMmZtgs0
外国語の情報のうち、日本の中央行政や官僚に対する肯定的な評価に
つながりそうなものは日本語への翻訳が非常に少ない。
これはテレビ、新聞で昔から顕著だったがマスコミがネットに
進出したから今はネットもそうなった。
日本のマスコミはほとんどが反官僚で占められてるからな

アメリカやEUがHPCに向けている予算の情報にも当てはまる
0891Socket774
垢版 |
2017/10/30(月) 08:40:42.39ID:uJBN8pSi0
マスコミに文句言うのはマスコミ関連のスレでやってくれ
0893Socket774
垢版 |
2017/10/30(月) 09:36:05.72ID:xXQscuonM
磁界結合メモリに期待してるんだけど、
なんかトラブってるの?
0894Socket774
垢版 |
2017/10/30(月) 10:02:03.13ID:DkrnGJaJ0
問題は量産性じゃね
0895Socket774
垢版 |
2017/10/30(月) 10:55:37.18ID:kc0C9Y3Xa
DDR5はまだかな
0897Socket774
垢版 |
2017/10/30(月) 13:31:24.14ID:Wt9FZBpra
こち亀はそれがいつ連載されてたのかの時代がわかるなw

DDR5は帯域当たりのレイテンシが大分減るという推測があるが
どれくらいなんだろ
0898Socket774
垢版 |
2017/10/30(月) 17:18:40.52ID:do2/qQepd
帯域あたりのレイテンシって何?
0899Socket774
垢版 |
2017/10/30(月) 18:40:23.52ID:Uu6ZPl2S0
レイテンシあたりの帯域の逆数だぞ
0900Socket774
垢版 |
2017/10/30(月) 19:01:53.52ID:rc2roWl3d
tefuっぽくてスコ
0902Socket774
垢版 |
2017/10/31(火) 00:59:01.62ID:H2olaLsw0
>>899
[レイテンシ]÷[帯域]

単位は
バイト÷秒^2

文字通りの意味だとこうなるが、
これで何を表したい?
0903Socket774
垢版 |
2017/10/31(火) 01:00:37.99ID:H2olaLsw0
秒^2 ÷ バイト

だった
>>899のせいで逆数にしてしまった
0904MACオタ>皆様
垢版 |
2017/10/31(火) 05:15:09.29ID:qX8bHnAa0
>>876-885
同じ開発に国家予算が注ぎ込まれた事例でも、Blue Gene や地球シミュレータは世界的に売れたのに対して、SPARC64-fx のシステムが海外で導入されたとい話は皆無す。PEZY の評価も後々そういった形で明らかにされる筈すから誰が正しかったかを楽しみに待って欲しいす

とわ言えかの小保方事件を経た後でも、学会で実績のある牧野教授のグループよりも学術的な出身の怪しいロビイストが政治案件で国家予算をポケットに入れてるコトを弁護するヒト達を見るのは、ある種の感慨があるす。

ちなみに次回結合インタコネクトはコレの焼き直しなので、仮に実用化されても海外に特許料を貢ぐだけのオチがつくと思われるす
https://www.hotchips.org/wp-content/uploads/hc_archives/hc19/3_Tues/HC19.05/HC19.05.01.pdf
レス数が900を超えています。1000を超えると表示できなくなるよ。

ニューススポーツなんでも実況