X



CPUアーキテクチャについて語れ 43
レス数が1000を超えています。これ以上書き込みはできません。
0001過去スレ垢版2018/04/30(月) 17:56:47.66ID:a2EDvByC
Part42 http://egg.2ch.net/test/read.cgi/jisaku/1515469535
Part41 http://egg.5ch.net/test/read.cgi/jisaku/1510223006
Part40 http://egg.2ch.net/test/read.cgi/jisaku/1503459435
Part39 http://egg.2ch.net/test/read.cgi/jisaku/1501219656
Part38 http://egg.2ch.net/test/read.cgi/jisaku/1500374247
Part37 http://egg.2ch.net/test/read.cgi/jisaku/1498278212
Part36 http://egg.2ch.net/test/read.cgi/jisaku/1495257064
Part35 http://egg.2ch.net/test/read.cgi/jisaku/1491116131
Part34 http://potato.2ch.net/test/read.cgi/jisaku/1488968098
Part33 http://potato.2ch.net/test/read.cgi/jisaku/1480216577
Part32 http://potato.2ch.net/test/read.cgi/jisaku/1467240873
Part31 http://potato.2ch.net/test/read.cgi/jisaku/1447725141
0952Socket774垢版2018/06/28(木) 16:32:21.72ID:rVBJ0CbJ
Pezyってあの液冷のおかげで効率高いだけとかそういう可能性はないの?
Pezyのお仲間でエスペラントってあるけどあっちはどうなのかな
0954Socket774垢版2018/06/28(木) 20:07:39.64ID:k3EgNbxd
そもそも、パイプラインつくって並列実行してる現代のCPUで、
この命令は○クロックで実行っていうときのクロック数の定義はどうするんだ?
0955Socket774垢版2018/06/28(木) 20:52:34.00ID:mC5jUqDk
レイテンシとスループットを併記
0956Socket774垢版2018/06/28(木) 22:29:01.34ID:mC5jUqDk
>>952
公称スペックが正しいならGreen500上位3つとJAMSTECを追い出された暁光はいずれも本来の70%にアンダークロックされてる。
液冷により低温に保ちつつリーク電流削減し、かつ電圧も落とせるならそりゃ効率上がるわな。
なおかつ液冷システムの消費電力はシステムの消費電力に入ってない。
フロリナート自体は前世紀からある冷媒だけどそれほど普及してないのはぶっちゃけるとTCO的に美味しくないから。
0957Socket774垢版2018/06/28(木) 22:48:16.22ID:Y+tztzcH
>>940
いや間違いだろ。
PPEがシングルスレッド苦手で、3.2GHzで動いていながらペンティアム4の2GHz並って。
7個のSPEは融通が利かないし、PPEはもっと強力しておかないと。
0958Socket774垢版2018/06/28(木) 23:36:31.00ID:CA+EZ7Xc
国研に家賃払ってタダでいいから我々のスパコン使ってください、を何年も続けて顧客見つけられないんじゃ手詰まりなんじゃねーの?詐欺事件で大口のVCにも失望されてるようだし

補助金ビジネスとしてはもう奴ら食いあげだよ。大体にIntelもNVIDIAも民業無視して成り上がった会社じゃないから。
0959Socket774垢版2018/06/28(木) 23:43:52.86ID:hmRILUJw
>>957
ありゃアレで良い
そもそもSIMDは多少レイテンシがあっても大量にイケる事が肝要、それは色んな実例が証明してる
SPEから言えばP4はオモチャみたいな性能だし、16B処理でリングバスが8B/cycleで有れば比率としては当時としては悪くない数字になるだろう
PPEは逆にSIMDを可能な限り最低限のサポートとしてもう一発搭載、SPEの担当負担を分散するのが良い
0960Socket774垢版2018/06/28(木) 23:59:25.38ID:sr2VQl+Z
あれは素敵なコンパイラが何もなかったのがいけないのと
倍精度付いたのがだいぶ後だったのがいけなかった
神威は逆に倍精度のみだがw
FEMでもかなりの結果出せてるからまあいいと思う
0961Socket774垢版2018/06/29(金) 00:21:22.05ID:CfTXzaZI
>>958
おっ、魚類今日も元気だな
0962Socket774垢版2018/06/29(金) 01:03:23.53ID:a0Y5HLyd
神威、ある程度シンプルなコアならコントロールフローを単純化するために倍精度だけ対応ってのは一つの方策ではあるんだろうな
0963Socket774垢版2018/06/29(金) 01:40:53.49ID:LqGlr+WO
むしろいまは機械学習のために単精度・半精度が必要になる時代
でも、機械学習なら大型スパコンでやらなくてもnvidiaでやったほうがいいな
0964Socket774垢版2018/06/29(金) 01:53:28.83ID:hs2+6UI+
推論なら構わないけど、学習は倍精度も使うよ
特にデータセンターでよくあるワークロードのRNN、MLPなんかは
しかもこれ、逐次だったりしてCPUでやった方が速かったりする
0965Socket774垢版2018/06/29(金) 01:53:29.79ID:ntS6kfE7
物理的にアクセスできないから意味ないのだが、
現実に存在するアカシックレコードは過去・現在のデータだけでなく、未来のデータも存在する。
もし任意の時点のデータを引き出せたとしたら……
0966Socket774垢版2018/06/29(金) 03:37:20.77ID:91kMG7ct
はいはい団子団子
0967Socket774垢版2018/06/29(金) 06:09:35.25ID:1KZQF0jm
>>962
IEEE754ベースで考案した際に、128ベースとしてSIMDを構築するとすれば
倍精度専門のユニットを用いた場合と単精度兼用した場合は構成数部の問題で4:32:104で140ビット分必要になるのに対し128ビットモロ分だけで済むってのはデカイと思う
相当複雑に組まないといけなくなるし、そう考えると効率はいいのかもな
切り捨てりゃ良いだけで単精度も半精度も同じ性能が出る事は確定してるわけでもあるし

汎用CPUだとどうかな
x86の拡張倍精度にちょっと細工した82ビットが単精度二個倍精度一個を効率よく内包出来て便利だとは思うから、コレ倍にして4:32:128の164ビットが最適解か?
GPUだと単1と半2で2:10:23の35がエコな感じだけどどうなんだろ
0968Socket774垢版2018/06/29(金) 07:42:08.69ID:OL5xB9gw
Ryzenに負けた団子
0969Socket774垢版2018/06/29(金) 08:28:11.67ID:rbJLJuud
intelのプロセス開発の不調にGFの躍進を見るに、
アブラがバックについた資金力でプロセスエンジニア引き抜かれた結果じゃないのかと。
0970Socket774垢版2018/06/29(金) 08:31:05.86ID:UQpilzZ2
単純にステッパの違いだろ
0971Socket774垢版2018/06/29(金) 08:32:46.51ID:VpTJfA+m
露光機はもはや各社ASMLだろ
ニコンは死んだ
0972Socket774垢版2018/06/29(金) 09:52:22.46ID:1KZQF0jm
intelは同じノードでもパラメータを詰めて高密度化し、同時に高性能化して技術的な優位点を得ていた
もちろん寡占化の背景には単純な論理的技術力や販売力及び資金力が有ったのも事実だ
ただその一角として物理的な高性能という面もあった
そして先日まで在任していたCEOは生産管理、つまりはFab側物理系でこれを支えていた人間だ
結果的に会社としてその面を重視した結果、物性限界に迫る領域における超高難易度にぶち当たったというのが真相だろう
無論それ自体は軽視して良い問題ではないけど、本来intelの主力とするようなハイパフォーマンス系のプロセッサは密度で劣るが性能の高いプロセスが必要になる
だが求められる製造キャパシティとNetBurstの失敗によりその技法は高密度高性能プロセスへとシフトしていった
その結果プロセス自体で高密度を、材料及び構造と設計(ココ今怪しいポイント)で高性能を得る方法と結実した
それが忘れられずに、同じ方法を引き摺っている事が現状だと思われる
やり過ぎてるんだよ、どんな高性能でも生産に乗らなければ意味がない

同時にここで設計の無理も出て来た、わかりやすい高性能の為に多幅SIMDを強化しまくった結果としてのAVX
そしてその化け物染みたデータフローを支えるための足回り
コレらは電力と面積を犠牲に成り立つ
高密度プロセス域においてこれを成立させるには莫大な熱密度の解消とデータフローの簡略化が必要
つまりはプロセスの耐久性/ドライブ能力とリングバスのような構造が必要
だけど前者はこの要素もあり破綻、後者は拡張性(正確にはその際のパフォーマンス)に問題があった

何処か一点ないし二点を諦めない限りはこの不調は続くだろう
手っ取り早いのは重演算を棄てる事だが、これは競合に先に手をつけられた、その上あちらの設計は徹底的に効率重視でつけ入るスキが少ない
であれば逆にプロセスを諦めるとなると自社Fabが莫大な負債になる
残る方法は方向の転換
嘗てEPICでやった二の舞になるか、それともこの系統ではかつてない成功になるか
だから競合でやってたの引き抜いたんだろうがな、正確には取引だと思うけど
0973Socket774垢版2018/06/29(金) 11:40:09.80ID:1s3+ZdMV
EPIC?EPYC?どっち
0974Socket774垢版2018/06/29(金) 13:19:54.02ID:UGSsKuvg
>>961
団子の新しい顔文字の半コテって
バナナとかじゃなかった?
0975Socket774垢版2018/06/29(金) 13:34:17.91ID:dBcabzjR
コテ無しでもわかりやすいやんか
0976Socket774垢版2018/06/29(金) 13:56:28.96ID:BAwtDwd+
特徴的な言い回しや特定の状況下でのリアクションという部分で本人は自覚していなくとも永く見てきた奴には判るものがあるんだろう。
0977Socket774垢版2018/06/29(金) 14:55:45.51ID:X0NSLZAj
さんざん名無しの発言に価値が無いとか
俺は長年コテハンやってるとか偉そうな事ほざいてた割に
アッサリとコテハンを捨てたのはやっぱりリアルに影響があったからだろうねえ
0978Socket774垢版2018/06/29(金) 15:13:45.33ID:1kCc9MLE
ZENアーキテクチャに負けた団子
0979Socket774垢版2018/06/29(金) 16:11:48.86ID:VPZMKQBC
>>958
PEZYグループの本命の事業はフロリナートを使った液冷システムだぞ
スパコンは宣伝とデモンストレーションみたいなもんだ
0980Socket774垢版2018/06/29(金) 17:51:27.86ID:jHjYrZcj
>>973
そこはEPICであってる

EPYC式のもどうなるかだな
Xeonがコケてくれれば話早かったんだが、営業力で踏ん張ってるし
オマケでRISCやらARMやら面白くない連中が出てきて邪魔しやがるし
まぁ本気でてるAMDが何処までやれるか
0981Socket774垢版2018/06/29(金) 18:20:35.30ID:48GjYeYx
営業力ってえか単純にOPA等パフォーマンスだと思うけど
EPYCにアクセラレータつけたとして、同一のワークロードに対して
アクセラレータ何万ノードもデータセンターでは処理・運用とかはそうしないわけで(スパコンは別)
0983Socket774垢版2018/06/29(金) 20:25:31.45ID:NqxuL/NE
EPYC搭載スパコン不在のなかARMスパコンがTop500入りしてきたのは苦笑するしかないな
Opteron作ってさえいれば周りが勝手に祭り上げてくれた時代の感覚で案件は取れん。IBMはx86の扱いやめたしCrayは実質Intelの傘下。
0984Socket774垢版2018/06/29(金) 20:46:39.31ID:jHjYrZcj
いや、スパコンは取れんでいい
元々取れる構造でもない
幾らでも電力と予算突っ込めるのであればEPYCにXeonに対するメリット無いもん
デセンとかキチンとしたインフラ向けとか小規模HPCには良好だろうけど
大体そのレンジはそのうち量子系が取って変われるしな
0985Socket774垢版2018/06/29(金) 21:06:28.69ID:WV8qak6/
K
graph500で1位


おめ
0986Socket774垢版2018/06/30(土) 09:59:45.91ID:9+dFpRLP
EPYCは今は色んな所で検証中でしょ
採用が増えるのは来年で、その頃には7nmのROMAを投入して採用をブースト
ROMA発売時に7nm EUVのZen3 EPYCを発表

その頃にはサーバーシェア2割くらいはいってるでしょ
0987Socket774垢版2018/06/30(土) 15:08:41.94ID:B8pHvS5P
Fujitsu-Developed "ABCI" Supercomputer Takes 5th Place in TOP500 Ranking
0988Socket774垢版2018/06/30(土) 22:31:24.19ID:6HQ/AfuC
>>984
現実にはEPYCの32コアよりXeon Goldの18コアのほうが倍のFlops数出るし消費電力も小さいのでした

アクセラレータ母艦としてもXeon GoldならDGX-2でやってるようにブリッジチップに繋がってるPCIe全部束ねて1つのデータストリームを高速転送できるがMCMでメインメモリも分散してるEPYCではそういう構成が不可能。

128レーンを全部活かすにはストレージみたいな低速伝送デバイスを複数並列に繋げるストレージサーバが関の山ということになる。少なくともAzureはそういう判断をしたしアプリ向けの低価格インスタンスのAシリーズ(従来AMD)の後継も結局Skylake
0990Socket774垢版2018/06/30(土) 23:52:07.15ID:TipO08ci
>>988
え、まさにゴミンテルやん…
0991Socket774垢版2018/07/01(日) 02:38:36.62ID:F4mv//wi
>>988
え?お古のOpteron後継が
低能Skylakeなのか
0992Socket774垢版2018/07/01(日) 03:21:01.00ID:+K4edL7o
Azure AシリーズのOpteronは不人気で利用率上がらなかったけど減価償却費残ってるから入れ替えが進まなかったんだが
後期は一部Haswellに置き換えたけどOpteronと比べて性能ですぎないようにパワースロットリングして運用してた
そうまでして償却しないといけなかったんで本当にMSにとって負債同然だったという話
0993Socket774垢版2018/07/01(日) 03:49:34.81ID:UJkYzU0S
EPYCは市場に受け入れられてるから心配すんな
IntelのCEOもそう言ってる
0994Socket774垢版2018/07/01(日) 03:56:40.81ID:wYYzEO6l
AWSもGoogleも足りてるけどな
バックエンドやるにはSIMDの火力が足りないしフロントエンドやるならXeon DやAtom CのQuickAssistのようなTLSアクセラレータくらいは欲しい
0995Socket774垢版2018/07/01(日) 04:10:34.54ID:cMc1Ihc+
団子て本物の馬鹿なんだな
0996Socket774垢版2018/07/01(日) 04:30:22.48ID:UnoY4MvC
団子君のSIMDというかAVX3桁あたりへの過信は何なんだ
0997Socket774垢版2018/07/01(日) 09:26:23.88ID:YXgBiX9c
oakforestで性能出なくて大ひんしゅくのAVX512
0998Socket774垢版2018/07/01(日) 12:59:54.98ID:q9z9Y6a4
なんだかんだでAVX512は必要だっただろうが、必要なセグメントを考えるべきだった
0999Socket774垢版2018/07/01(日) 13:09:44.99ID:Ln71TG1J
>>997
団子を擁護するわけじゃないけど、どこで批判されてんの?
地震解析で2PF以上叩き出してたり、大規模な同ノード数で京より何倍も上の分子起動計算してて
稼働から1年以内で十分過ぎるほどの成果があるんだが
1000Socket774垢版2018/07/01(日) 13:18:12.61ID:H1Pg9Qur
>>999
そりゃGPUより性能出してるからなあ
10011001垢版Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 61日 19時間 21分 25秒
10021002垢版Over 1000Thread
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況