CPUアーキテクチャについて語れ 40©2ch.net
レス数が900を超えています。1000を超えると表示できなくなるよ。
【前スレ】
CPUアーキテクチャについて語れ 39
https://egg.2ch.net/test/read.cgi/jisaku/1501219656/
VIPQ2_EXTDAT: checked:verbose:1000:512:----: EXT was configured AVXってGPGPUするほどじゃないときに使うものでしょ。 DBなんかはむしろAVX、TSX、persistent memoryの3点セットが最強になるんじゃない。 AVXは単純にGPGPU的な物って思たったら的外れになるんじゃないかね。
ちなみに、Skylake-SP/Wのダイ使ったSkylake-Xの高クロック耐性がかなり非凡だけど、
あれはHPC向けで採用されたとき何かに高クロックで性能稼ぐとかの目的もあるのだろうか?
一般向けSKUのスペックだと過剰としか思えない。 >>808
逆なんじゃねーかな
ぶん回せるようにに作っておけば多少品質がわるくてもそうやってラインナップを作れる top500 に載るような規模のシステムは、その時点の高クロックXeonや
最多コア Xeonをほとんど使わない傾向がある。2.xGHzが
選ばれている理由は、たぶんFLOPS/ドルを優先しているからだろう
> TOP500 Xeonシステム アクセラレータなし
> ソケット総数 平均コア数 平均クロック周波数
> 2007/11 約57万 2.79コア 2.68GHz
> 2011/11 約80万 5.03コア 2.73GHz
> 2015/11 約153万 8.37コア 2.47GHz
> Xeon 多コア 高クロック
> 2007 4コア(3.2GHz) 3.4GHz(2コア)
> 2011 10コア(2.4GHz) 3.6GHz(4コア)
> 2015 18コア(2.6GHz) 3.7GHz(6コア)
http://potato.2ch.net/test/read.cgi/jisaku/1447725141/777 >>810の件は心配ないくらい回るみたいだよ。Sky-Xだけそんな超選別してるってことはないよね。
1Vくらいで全コア4GHz回って1.2V辺りで全コア4.5GHzくらい回るみたい。
単純にメインストリームと同じ物理設計にしてるだけなのかね。 SKL-SPはなんもベクトル拡張命令使わなかったら
20コア以上でも特に電圧盛らなくても全コア3Ghz以上回るみたいだし
やはり選別品なんでは Xeonはロックされてるから(パワーリミットの制限)、多コアになるほど上限クロックが
低いのは当然だけどね。大半のSkylake-SPは少数コアターボ3.7GHzだけど
Plutinum 8180は3.8GHz。8180もロック外したら結構回りそうな感じがする。 >>804
そらまあ90年代と比べたら遅くはなったけど
でもこの2010年代だけでも、AVX等のおかげで4倍くらいのパフォーマンス上昇は出来てると思うよ
何よりも特化型を作ると潰しが効きにくく、むしろ今は専用回路屋さんは苦しくなってると聞くけれど(流行りの機械/深層学習関連とかはともかく) そうなるとZen2のAVX2対応が気になるな
時流のSIMD強化に乗ってくるのか、それともノンネイティブのままなのか AVX2 1クロック、AVX512 2クロック、ダイ当たりメモリ4chくらいにしないと凡庸過ぎるかね。 >>815
え?
プログラムなんてもんが必要な分だけ汎用回路のほうがイロイロ不利ですけど、それ事実? 組込の低電力汎用プロセッサの電力性能比が高まったから、
以前なら電力的に汎用が避けられた領域にある程度汎用が食い込んだ、
ということはあったと思う。専用ならもっと低電力にできるが
そこまで下げる必要はない、という分野もあるから。
しかし、今から成長が見込まれるIoTではそこまで下げたい場合の方が多いだろう。 >>818
少なくともXilinxの人は、自分らが成長している要因としてんなこと言ってたけど >>820
ARMのIoT部門の売上高ってどんなもんなの? IoT部門つーかCortex-Mは新規契約や出荷数で言うと全体の半分ぐらいになってるみたいね
金額ベースでどれぐらいになってるかは知らん
というかARMって今赤字なのね...
https://www.softbank.jp/corp/irinfo/financials/results/segments/arm/ 現状のIoT用プロセッサに足りないのはセキュリティだな
ザルなセキュリティのシステムがインターネットや無線LANに接続されてる トレンドマイクロがそれ向けに信用できない通信先と通信させないソリューション出してたな
まあ、自作板的にはSophosUTMでも使うんだろうか >>826
記事読んだけど、そもそも来年に7nmとか可能なの?
SamsungやTSMCのインチキ7nmですら、搭載スマホが出るのは再来年だと思ってた そもそも何億台とか必要なスマートフォンと
1万台程度必要なCPUとでは単価は違い過ぎるし出せるだろう >>821
FPGAの汎用性とCPUの汎用性は、ちと意味が違うんでないの? LSIを起こしていたけどやめちゃってFPGAに移行した例
新 ttp://www.altima.jp/products/design/case1.html
旧 ttp://www.itmedia.co.jp/lifestyle/articles/0709/27/news121.html NEC SXの新型来たな
アクセラレータ型になるからどうすんだろと思ったが、なるほどアプリ丸投げか
というかアクセラレータ型とホスト型の中間といった感じかな? >>830
少量生産品はFPGAが低コストだが、量産品はASICが低コスト
また量産品では低消費電力も求められるためにASIC有利 NECの新型スパコンは、メモリにHBM2を採用
団子押しのHMCは採用されず >>833
ベクトルCPUのメモコンは超リッチだからとにかく帯域だけあればいいんだろう。
量積むにしてもHBMの方が安く済むしな。 競争が善≠フ時代は第三次世界大戦を持って終わらせる!
人類を、滅亡させる Bytes/FLOPSはSX-ACEより悪化したが
テラスケールノードで、演算性能当たりのメモリ帯域がリッチな構造ないしね
てか前の発表だとコア性能は半分だったんだが、上げられたんだね ベクトルプロセッサで1コア当たりの性能とか言われてもなって感はあるが Byte/Flop TB/s GB TFlops
SX-Aurora 10A 0.49 1.2 48 2.45
SX-Aurora 10B 0.56 1.2 48 2.15
SX-Aurora 10C 0.35 0.75 24 2.15
Tesla P100 PCIe 0.18 0.72 16 4.036
過去のSXの4B/Fとか1B/Fとかに比べたら下がってしまったが、
今そんなことをやろうとしたら、容量が少な過ぎるとかレイテンシが
大き過ぎるとかになってしまうんだろうな NECの新製品、ノード間通信がInfinibandになったとか、ますますNECらしさがなくなったな
コスト当たりの性能で、nvidiaに勝てるのかどうか心配
また、忘れたころ(5年とか)に後継機を出すNECとちがって、毎年新機種を出すnvidiaは進化の速度が速い まあ現状NVIDIAに対抗できてそうなのIntelぐらいしかないし… PEZY-SC2 暁光/Gyoukou
6月 11月
GFLOPS/W 10.226 14.69
LINPACK 1.67713 14.13PFLOPS
理論値 3.20768 19.89PFLOPS
TSUBAME3.0 14.111GFLOPS/W (6月 Green500 1位)
ttp://www.pezy.co.jp/news/PEZY_PR_20171026.pdf
ttp://www.pezy.co.jp/ すごいけど11月のTop500/Green500にはTesla V100で組んだのが出てくるんじゃないかな… PEZYのがどんな規模なのしらんが
基本、規模の小さなクラスタほど電力効率は高くなるから
そういうの抜きに発表だけされてもね
理研はこういうとこがなあ それと今の時代にHPLとか……最早全く役に立たなくなった指標を出されても…… 規模小さいって言っても密度が高いから演算能力は国内トップクラス
HPLはこれだけを指標にするのは意味がないとはいえ、演算能力の上限を見るくらいには今も使える >>847
まあその意味のない上限とやらを見るくらいですな > 14.13PFLOPS
この実測値は今年6月のリストなら世界で6番目に相当する「大きな」システム
PEZY-SC2 7056個、Xeon D 882個、962.3kW 暁光の関係機関はExaScaler、JAMSTEC、JST、NEDO LINPACK様の処理とHPCG様の処理は科学技術計算で「同じくらい」に重要。
top500の公開が始まるよりも前から分かっていたこと。 >>830
>>815にはAVX云々とあるが?
どっからFPGAとLSI起こす話になったのか
そもFPGAはCPUでのプログラミングではなく、回路屋よりの開発かと このGyoukou(暁光)の正体って何なんですかね
NVIDIAのGPUは使ってないらしいけど全くの独自なんでしょうか?
http://www3.nhk.or.jp/news/web_tokushu/2017_1027.html >>848
LINPACK番長でも電力効率が高ければ実アプリに強いシステムにレベルを上げて物理で殴れば勝てるから意味はあるよ。 A Linpack番長 実演算をしたときに効率10%
B Linpack番長では無い、実演算をしたときに効率50%
ただし同じ値段で買えるシステムではAがBの10倍Linpackが早い
たとえばこんなシステムだと、Linpack番長のAのほうが実演算でも早いことになる
Linpack番長だって海外勢を馬鹿にしてたら、実演算でも負けてたりする >>855
>パソコン数百台分の処理を、たった1枚のプロセッサーが行うのです。
Core i7-7700 3.6GHz 230.4GFLOPS
PEZY-SC2 1984core 700MHz 2777.6GFLOPS
NHKの経済社会情報番組部ディレクター 大隅亮は全然だめだな >>861 にCore i9 も入れたかったのだが、AVX512使用時のクロックに
関する情報が見つからなくて断念 >>864
処理は仕事をさばくことだ。コンピューターなら命令の実行の事だろう。
OPS /operations per second のことに他ならない >>863
2018年に7nmで性能5.3倍、電力効率2.6倍、メモリ帯域5.8倍
2020年に5nmで性能2.4倍、電力効率1.5倍、メモリ帯域2倍
16nm→5nmでは性能12.8倍、電力効率4倍、メモリ帯域11.6倍
ずいぶん薔薇色の将来だなw PEZY-SC2のコア数は一度縮小してるようだな
2016年4月の記事 8.2TFLOPS(4096コア)
2017年1月の記事 2048コア 1GHz
ttp://news.mynavi.jp/articles/2016/04/25/pezy/001.html
ttp://news.mynavi.jp/articles/2017/01/11/pezy2017/
>843のベンチマークは1984コア(31/32 x 2048)、700MHzだが
1GHzでも動くのかもな、電力効率が悪くなるだけで クロックはパイプラインを深くして1ステージでやることを減らせばあげられるし、
その逆なら下げないといけない
PEZYがどのへんなのかはいまいちわからん >>843-871
PEZYって科学予算をお友達に配分するために存在する政治案件なんすけど、アーキテクチャを語る価値はあるすかね?
http://blog.livedoor.jp/googleyoutube/archives/51928087.html 👀
Rock54: Caution(BBR-MD5:25c410b0f26cd44c2938e4abb9639038) >>872
>新興スパコン業者に補助金降ろすのに、山口敬之氏が安倍首相の名前を使って介入した。
>普通なら新興の業者が参入する余地がないところを、山口氏がそうやって介入し決めさせ、
バックマージンを貰ってる
こう批判してたけどその補助金というのがNexTEPだったからNexTEPの趣旨を理解してないだけなんじゃで記事が出た当時に片付けられたよ。 PEZY-SCのPE。PEZY-SC2も同じかどうかは未確認
ttp://accc.riken.jp/wp-content/uploads/2015/09/ishii.pdf
Processor Element
8スレッドMulti-threading
4スレッドを順番に切り替え x 2面
8スレッド分のレジスタファイルを用意
16 Stage pipelining
In-order 2way SuperScaler
例外なし、分岐予測なし
キャッシュ間コンシステンシはソフトウェア責任
独自ISAによる必要命令の絞り込み
Ring + Crossbarを合わせたバス構造 世の中に税金に世話になってないスパコン業者なんているのかね 仮に政府とズブズブで真っ黒だったとしても、それとアーキテクチャとは別の問題 >>875
ベンチャー企業にありえない支援ってわけじゃないのでロビー活動の範疇だろうって話よ。 MACオタは本題からずれた箇所での揚げ足とりしかできない どっかのクソコテが消えたと思ったら
ppcの終了と共に消えた奴が何で出てくるんですかね
もうお前らの出る幕はないよ と言うか何で海外で税金のテコ入れ事案は育成支援ってべた褒めして
日本の税金投入は無駄金使いって批判する輩が多いのかね?
金の使い方が下手くそ過ぎるってなら理解できるけど PEZYはほとんど世界で類をみないプロジェクトだからな
語る価値あるだろ。
まあ性能がいいのはあの液浸冷却のおかげかもしれんけど。 >>874
クロスバーの方はやたらポート数が多く、リングバスはポートが少ない
普通は逆の気がするけどどういう思想なんだろうね 磁界結合型の2D実装ってなってるから
HBMよろしく超並列で接続できてて問題は少ないとか
んでコア間はリングバスでコンパクトに作ったほうが良いみたいな >861 >864 >865
こういうのはマスコミの人間の記事のつくり方に関する根深い問題。
筋書きを予め自分で作ってしまっていて、筋書きを見栄えよく
飾り付けるための単語や数字、感情表現などを拾い集めることが「取材」。
このディレクターは、1コアがこなす処理量の大小に大きな隔たりはないと
無意識に決めつけてしまっているわけだが、己の常識に対する疑いも
虚心で学ぶ心構えも乏しいから誤った決めつけであることに気付けない。
PEZY-SC2のコア数を聞いて、得たりとばかりにご満悦で疑問も持たず筋書き中に
用意してあった空欄(身近なぱそこんとの対比という欄)に入れて記事にしてしまう。 現状磁界結合メモリ動いてないみたいだけど、それなりの実効性能出せてるのはすごいね むしろこの程度の研究開発費で世界と戦える計算機が作れるのか? >>887
寧ろリソースを潤沢に与えると失敗するという日本人特有のジンクスから抑えてるのかもw 税金でプロセッサ開発してるのは
中国と日本くらいでは 外国語の情報のうち、日本の中央行政や官僚に対する肯定的な評価に
つながりそうなものは日本語への翻訳が非常に少ない。
これはテレビ、新聞で昔から顕著だったがマスコミがネットに
進出したから今はネットもそうなった。
日本のマスコミはほとんどが反官僚で占められてるからな
アメリカやEUがHPCに向けている予算の情報にも当てはまる マスコミに文句言うのはマスコミ関連のスレでやってくれ 磁界結合メモリに期待してるんだけど、
なんかトラブってるの? こち亀はそれがいつ連載されてたのかの時代がわかるなw
DDR5は帯域当たりのレイテンシが大分減るという推測があるが
どれくらいなんだろ >>899
[レイテンシ]÷[帯域]
単位は
バイト÷秒^2
文字通りの意味だとこうなるが、
これで何を表したい? 秒^2 ÷ バイト
だった
>>899のせいで逆数にしてしまった >>876-885
同じ開発に国家予算が注ぎ込まれた事例でも、Blue Gene や地球シミュレータは世界的に売れたのに対して、SPARC64-fx のシステムが海外で導入されたとい話は皆無す。PEZY の評価も後々そういった形で明らかにされる筈すから誰が正しかったかを楽しみに待って欲しいす
とわ言えかの小保方事件を経た後でも、学会で実績のある牧野教授のグループよりも学術的な出身の怪しいロビイストが政治案件で国家予算をポケットに入れてるコトを弁護するヒト達を見るのは、ある種の感慨があるす。
ちなみに次回結合インタコネクトはコレの焼き直しなので、仮に実用化されても海外に特許料を貢ぐだけのオチがつくと思われるす
https://www.hotchips.org/wp-content/uploads/hc_archives/hc19/3_Tues/HC19.05/HC19.05.01.pdf レス数が900を超えています。1000を超えると表示できなくなるよ。