CPUアーキテクチャについて語れ 43
レス数が1000を超えています。これ以上書き込みはできません。
Pezyってあの液冷のおかげで効率高いだけとかそういう可能性はないの?
Pezyのお仲間でエスペラントってあるけどあっちはどうなのかな >>871
Atomですら今はradix-1024 そもそも、パイプラインつくって並列実行してる現代のCPUで、
この命令は○クロックで実行っていうときのクロック数の定義はどうするんだ? >>952
公称スペックが正しいならGreen500上位3つとJAMSTECを追い出された暁光はいずれも本来の70%にアンダークロックされてる。
液冷により低温に保ちつつリーク電流削減し、かつ電圧も落とせるならそりゃ効率上がるわな。
なおかつ液冷システムの消費電力はシステムの消費電力に入ってない。
フロリナート自体は前世紀からある冷媒だけどそれほど普及してないのはぶっちゃけるとTCO的に美味しくないから。 >>940
いや間違いだろ。
PPEがシングルスレッド苦手で、3.2GHzで動いていながらペンティアム4の2GHz並って。
7個のSPEは融通が利かないし、PPEはもっと強力しておかないと。 国研に家賃払ってタダでいいから我々のスパコン使ってください、を何年も続けて顧客見つけられないんじゃ手詰まりなんじゃねーの?詐欺事件で大口のVCにも失望されてるようだし
補助金ビジネスとしてはもう奴ら食いあげだよ。大体にIntelもNVIDIAも民業無視して成り上がった会社じゃないから。 >>957
ありゃアレで良い
そもそもSIMDは多少レイテンシがあっても大量にイケる事が肝要、それは色んな実例が証明してる
SPEから言えばP4はオモチャみたいな性能だし、16B処理でリングバスが8B/cycleで有れば比率としては当時としては悪くない数字になるだろう
PPEは逆にSIMDを可能な限り最低限のサポートとしてもう一発搭載、SPEの担当負担を分散するのが良い あれは素敵なコンパイラが何もなかったのがいけないのと
倍精度付いたのがだいぶ後だったのがいけなかった
神威は逆に倍精度のみだがw
FEMでもかなりの結果出せてるからまあいいと思う 神威、ある程度シンプルなコアならコントロールフローを単純化するために倍精度だけ対応ってのは一つの方策ではあるんだろうな むしろいまは機械学習のために単精度・半精度が必要になる時代
でも、機械学習なら大型スパコンでやらなくてもnvidiaでやったほうがいいな 推論なら構わないけど、学習は倍精度も使うよ
特にデータセンターでよくあるワークロードのRNN、MLPなんかは
しかもこれ、逐次だったりしてCPUでやった方が速かったりする 物理的にアクセスできないから意味ないのだが、
現実に存在するアカシックレコードは過去・現在のデータだけでなく、未来のデータも存在する。
もし任意の時点のデータを引き出せたとしたら…… >>962
IEEE754ベースで考案した際に、128ベースとしてSIMDを構築するとすれば
倍精度専門のユニットを用いた場合と単精度兼用した場合は構成数部の問題で4:32:104で140ビット分必要になるのに対し128ビットモロ分だけで済むってのはデカイと思う
相当複雑に組まないといけなくなるし、そう考えると効率はいいのかもな
切り捨てりゃ良いだけで単精度も半精度も同じ性能が出る事は確定してるわけでもあるし
汎用CPUだとどうかな
x86の拡張倍精度にちょっと細工した82ビットが単精度二個倍精度一個を効率よく内包出来て便利だとは思うから、コレ倍にして4:32:128の164ビットが最適解か?
GPUだと単1と半2で2:10:23の35がエコな感じだけどどうなんだろ intelのプロセス開発の不調にGFの躍進を見るに、
アブラがバックについた資金力でプロセスエンジニア引き抜かれた結果じゃないのかと。 intelは同じノードでもパラメータを詰めて高密度化し、同時に高性能化して技術的な優位点を得ていた
もちろん寡占化の背景には単純な論理的技術力や販売力及び資金力が有ったのも事実だ
ただその一角として物理的な高性能という面もあった
そして先日まで在任していたCEOは生産管理、つまりはFab側物理系でこれを支えていた人間だ
結果的に会社としてその面を重視した結果、物性限界に迫る領域における超高難易度にぶち当たったというのが真相だろう
無論それ自体は軽視して良い問題ではないけど、本来intelの主力とするようなハイパフォーマンス系のプロセッサは密度で劣るが性能の高いプロセスが必要になる
だが求められる製造キャパシティとNetBurstの失敗によりその技法は高密度高性能プロセスへとシフトしていった
その結果プロセス自体で高密度を、材料及び構造と設計(ココ今怪しいポイント)で高性能を得る方法と結実した
それが忘れられずに、同じ方法を引き摺っている事が現状だと思われる
やり過ぎてるんだよ、どんな高性能でも生産に乗らなければ意味がない
同時にここで設計の無理も出て来た、わかりやすい高性能の為に多幅SIMDを強化しまくった結果としてのAVX
そしてその化け物染みたデータフローを支えるための足回り
コレらは電力と面積を犠牲に成り立つ
高密度プロセス域においてこれを成立させるには莫大な熱密度の解消とデータフローの簡略化が必要
つまりはプロセスの耐久性/ドライブ能力とリングバスのような構造が必要
だけど前者はこの要素もあり破綻、後者は拡張性(正確にはその際のパフォーマンス)に問題があった
何処か一点ないし二点を諦めない限りはこの不調は続くだろう
手っ取り早いのは重演算を棄てる事だが、これは競合に先に手をつけられた、その上あちらの設計は徹底的に効率重視でつけ入るスキが少ない
であれば逆にプロセスを諦めるとなると自社Fabが莫大な負債になる
残る方法は方向の転換
嘗てEPICでやった二の舞になるか、それともこの系統ではかつてない成功になるか
だから競合でやってたの引き抜いたんだろうがな、正確には取引だと思うけど >>961
団子の新しい顔文字の半コテって
バナナとかじゃなかった? 特徴的な言い回しや特定の状況下でのリアクションという部分で本人は自覚していなくとも永く見てきた奴には判るものがあるんだろう。 さんざん名無しの発言に価値が無いとか
俺は長年コテハンやってるとか偉そうな事ほざいてた割に
アッサリとコテハンを捨てたのはやっぱりリアルに影響があったからだろうねえ >>958
PEZYグループの本命の事業はフロリナートを使った液冷システムだぞ
スパコンは宣伝とデモンストレーションみたいなもんだ >>973
そこはEPICであってる
EPYC式のもどうなるかだな
Xeonがコケてくれれば話早かったんだが、営業力で踏ん張ってるし
オマケでRISCやらARMやら面白くない連中が出てきて邪魔しやがるし
まぁ本気でてるAMDが何処までやれるか 営業力ってえか単純にOPA等パフォーマンスだと思うけど
EPYCにアクセラレータつけたとして、同一のワークロードに対して
アクセラレータ何万ノードもデータセンターでは処理・運用とかはそうしないわけで(スパコンは別) EPYC搭載スパコン不在のなかARMスパコンがTop500入りしてきたのは苦笑するしかないな
Opteron作ってさえいれば周りが勝手に祭り上げてくれた時代の感覚で案件は取れん。IBMはx86の扱いやめたしCrayは実質Intelの傘下。 いや、スパコンは取れんでいい
元々取れる構造でもない
幾らでも電力と予算突っ込めるのであればEPYCにXeonに対するメリット無いもん
デセンとかキチンとしたインフラ向けとか小規模HPCには良好だろうけど
大体そのレンジはそのうち量子系が取って変われるしな EPYCは今は色んな所で検証中でしょ
採用が増えるのは来年で、その頃には7nmのROMAを投入して採用をブースト
ROMA発売時に7nm EUVのZen3 EPYCを発表
その頃にはサーバーシェア2割くらいはいってるでしょ Fujitsu-Developed "ABCI" Supercomputer Takes 5th Place in TOP500 Ranking >>984
現実にはEPYCの32コアよりXeon Goldの18コアのほうが倍のFlops数出るし消費電力も小さいのでした
アクセラレータ母艦としてもXeon GoldならDGX-2でやってるようにブリッジチップに繋がってるPCIe全部束ねて1つのデータストリームを高速転送できるがMCMでメインメモリも分散してるEPYCではそういう構成が不可能。
128レーンを全部活かすにはストレージみたいな低速伝送デバイスを複数並列に繋げるストレージサーバが関の山ということになる。少なくともAzureはそういう判断をしたしアプリ向けの低価格インスタンスのAシリーズ(従来AMD)の後継も結局Skylake >>988
え?お古のOpteron後継が
低能Skylakeなのか Azure AシリーズのOpteronは不人気で利用率上がらなかったけど減価償却費残ってるから入れ替えが進まなかったんだが
後期は一部Haswellに置き換えたけどOpteronと比べて性能ですぎないようにパワースロットリングして運用してた
そうまでして償却しないといけなかったんで本当にMSにとって負債同然だったという話 EPYCは市場に受け入れられてるから心配すんな
IntelのCEOもそう言ってる AWSもGoogleも足りてるけどな
バックエンドやるにはSIMDの火力が足りないしフロントエンドやるならXeon DやAtom CのQuickAssistのようなTLSアクセラレータくらいは欲しい 団子君のSIMDというかAVX3桁あたりへの過信は何なんだ oakforestで性能出なくて大ひんしゅくのAVX512 なんだかんだでAVX512は必要だっただろうが、必要なセグメントを考えるべきだった >>997
団子を擁護するわけじゃないけど、どこで批判されてんの?
地震解析で2PF以上叩き出してたり、大規模な同ノード数で京より何倍も上の分子起動計算してて
稼働から1年以内で十分過ぎるほどの成果があるんだが このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 61日 19時間 21分 25秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。