【技術】日本のスパコンが世界4位に 日本独自プロセッサ「PEZY-SC2」を搭載した「暁光」
■ このスレッドは過去ログ倉庫に格納されています
日本独自プロセッサ「PEZY-SC2」を搭載したスパコン「暁光」の詳細 - PC Watch https://pc.watch.impress.co.jp/docs/news/1091458.html https://pc.watch.impress.co.jp/img/pcw/docs/1091/458/2_l.jpg 劉 尭2017年11月14日 14:56 世界のスーパーコンピューターランキング「TOP500」の第50回目の結果が、11月13日(中央ヨーロッパ時間)に公開された。 今回のハイライトは、なんと言ってもTOP500で4位、Green500で5位にランクインした、日本の国立研究開発法人海洋研究開発機構(JAMSTEC)横浜研究所に設置した大規模液浸型スパコン「暁光」だろう。PEZY Computingのサイトで、その詳細が明らかにされている。 暁光は、PEZY Computingが新規に独自開発したメニーコアプロセッサ「PEZY-SC2」を基幹プロセッサとして採用した「ZettaScaler-2」シリーズからなり、1つの液浸槽で2PFLOPSクラスのピーク性能を目指して開発されたという。 PEZY-SC2は、従来のPEZY-SCの技術を活かし、コア数を1,024基から2,048基に増やし、16nm FinFETプロセスで製造。PEZY-SC2を搭載したモジュールカードでは、48V給電により基板上の送電電力損失を低減している。 PEZY-SC2の最大動作周波数は1GHzで、理論性能は倍精度浮動小数点数で4.1TFLOPS、単精度浮動小数点数で8.2TFLOPS、半精度浮動小数点で16.4TFLOPS。メモリはDDR4×4で、バス幅は100GB/s、容量は128GBなどとなっている。外部インターフェイスはPCI Express 3.0/4.0 x16×2。制御用CPUとして、MIPS64R6(P6600)を6コア搭載。標準負荷時の消費電力は130Wとされている。 ただし今回の暁光に使われたPEZY-SC2はこのフルスペックのものではなく、1,984コアのものを700MHzで駆動させている。また、8個のPEZY-SC2に対して16コア/1.3GHz駆動のXeon Dを1個使用し、合計1万個のプロセッサ(19.5液浸槽に相当)を実装している。総プロセッサコア数は1,986万コアにのぼり、TOP500ランキング上で最多コア数を記録した。 総主記憶メモリ容量は680TBで、Xeon D 1個につき32GB、PEZY-SC2 1個につき64GBを搭載。理論ピーク性能は28.19PFLOPS、実効性能は19.14PFLOPSとなっている。消費電力は1,350kW、電源は三相200V。ネットワークは8個のPEZY-SC2に対して100GbpsのInfiniBand EDRカードを1枚使用している。 同システムは6月にも、ごく一部の稼働で世界69位にランクインされたのだが、その後のシステムボード全数の各種改良を盛り込んだ「ZettaScaler-2.2」に更新し、稼動システム規模の拡大とソフトウェアの最適化により、今回の結果を達成したという。 今後引き続きJAMSTEC構横浜研究所での開発を継続し、将来的には約100筐体を目標とした増設と、世界で初めてThru Chip Interface(磁界結合インターフェイス)を用いたDRAMとの接続により、超広帯域のメモリバンド幅を実現するとしている。 ES: 256GFLOPSのノードに256GB/sのメモリ 暁光: 4.1TFLOPSのプロセッサに76.8GB/sのメモリ >ただし今回の暁光に使われたPEZY-SC2は >このフルスペックのものではなく まだ2回変身を残してるのか… Pezyはすごいんじゃなかったの? 4位? まだ変身できるの? 横浜とか横須賀なのか。 てっきりPEZY葉山かと。 >>74 消費電力あたりの性能だと1〜3位と5位がPEZY。 採算ベースには乗ってるの?クラウドファンディング? PEZYは、中国のsunwayが旧世代プロセスで作られてる中、いちはやく16nmプロセスで作ったので高性能 中国のsunwayが、新世代プロセスに移行したら抜かれる可能性が高い 仮に、sunwayやPEZYを7nmプロセスで作った大規模HPCをつくれば、ついに夢のエクサスケールに突入する >>77 Sunwayはプロセス古いので、あのアーキテクチャーを本当にアプリで使えるのなら、 プロセス新しくしてシュリンクしてメモリーも今時の速いメモリーにすれば 性能出そうではあるね。 このニュースはGREEN500無双のPEZYが、TOP500でも戦えるマシンを作ってきたってことでいいの? >>80 後継機だから別システム 計画公表されているけどかなり酷い >>11 いや、こんなもんに税金投入する意味ねーよ。 自費でやれ。 >>79 バージョンアップもしているのでアーキテクチャーの改善とかもされているかもね。 >>83 京が「正しい」という路線をゴリ押ししたような雰囲気も。 アクセラレーターも使わないそうだし。 ARMアーキテクチャーは欧州のシステムもその路線になりそうではあるけど、 富士通が拡張したSIMD演算というかベクトル演算というかは採用されるのかどうか。 原子スイッチ、実用秒読み 半導体に置き換わる潜在力 IT(情報技術)社会を支える半導体素子を置き換える可能性がある日本発の電子デバイス「原子スイッチ」が実用段階に入ってきた。 NECが原子スイッチを使った小型・省電力で耐久性が高い大規模集積回路(LSI)のサンプル製造に乗り出した。 原子スイッチが脳神経細胞に似た性質を持つことに注目した「脳型チップ」の開発も期待されている。 https://www.nikkei.com/article/DGXMZO23418090T11C17A1XY0000/ >>1 彡⌒ ヾ ( ^ω^)1,350kWって中小企業の工場なみの電力だな 彡⌒ ヾ ( ^ω^)それと、ジーオンを使わなきゃダメなのか?ショボ過ぎると思うわ >>89 MIPSアーキテクチャーのコントローラー(CPUと呼んでよいのかどうか?)をPEZY-SC2に積んでいるのに、 さらにIntelのXeonが必要なのはなんでなんだろう。 >>90 彡⌒ ヾ ( ^ω^)素直に考えると、x86Windowsでも動かすためだろうとしか思わないよなぁ >>92 スパコンはLinuxを使用したシステムが多いはずだし。 >>31 売れてこそ、実用性。 今はアプリがそろっているインテルが一番人気なんだろう。 富士通が開発するARMアーキテクチャーのスパコン用プロセッサに期待。 海洋関係は、戦中に商船も漁船も撤収でかり出され殆ど全滅した 日本はご自慢の町工場があるんだしハードウェアだけに力入れとけばいいんだよ それなのに米中の土壇場のCPUに力入れちゃってるバカな日本氏ねよ >>100 中身はジャップじゃないでしょ 優秀なジャップとかいないから >>77 sunwayはDDR3なんか使ってるって噂だからな LINPACKで性能出す分には主記憶の速度は割とどうでもいいからね >>103 スパコンはCPUだけ作れば良いのではなく現代では大規模システムなので、システム設計出来る企業が必要。 前回まで日本最速だったCPUにIntelのXeon Phiを使ってインターコネクトにIntelのOmni-Pathを使ったスパコンもシステム構築は富士通。 >>94 彡⌒ ヾ ( ^ω^)んーむ、システムに敢えてWindowsを混ぜてみたいので 彡⌒ ヾ ( ^ω^)x86専用プロセッサーを使ってWindowsだと思ったんだよ 彡⌒ ヾ ( ^ω^)ちょっと日本語が変になったが >>86 富士通のSIMD拡張はARM標準になってるので 256bit以上のSIMDが必要なら採用しない理由はないだろう。 対応する義務があるわけじゃないので用途によっては採用されないが。 >>52 ほとんどビル建てるのが目的になっているなw こういうスパコンなんて、水力発電所近くの寒冷地にでも作ったほうがランニングコストが低いのに、 また天下り官僚の自宅からの通勤圏内ってのが、建築予定地の最優先事項になるのかw >>111 数値演算の主役はアクセラレーターでCPUはその制御に使うだけだからARMでもいいじゃんという流れだと外れるなぁと思いました。 >>113 GPU等のアクセラレーターをキックする場合にもSIMDはあった方がいいぞ データのエンコード、展開処理なんかにも使われるわけで。 ……その程度ならNEONで十分という人もあるかもしれないが。 >>117 『Top500 4位、19.1Pflops、Green 500 1位、17.009GF/W、 並びに2、3、5位おめでとうございます!!!>関係者の皆様。』 http://jun.artcompsci.org/journal/journal-2017-11.html#13 PEZYを7nmプロセスで作ってかつHBM2メモリを乗せたらいいんじゃね? >>119 PEZYグループは、磁界結合インターフェイスという線でつなぐより磁界で信号送った方が速いっていうメモリーを開発しているので、そっちも期待。 http://news.mynavi.jp/series/moore/004/ >>7 厳密にいうと違う。 mipsを多数並べたもの。 基本設計はmipsだから日本は関係ない。 ここ辺は基本スパークのCPUを独自couと言っている富士通も同じ。 >>27 超電導を利用したジョセフソン接合素子が次世代の中核技術になると言っていた時代があったが、結局そんな時代は来なかった。 10年経ってものにならない技術は要素技師がまだ十分ではないか、そもそもその技術に問題がある。 そろそろ目を覚ませ。 >>51 NECのやり方は既存のプログラムからの改修で性能を出しやすい。 現在のメニーコアのモジュールを多数のやり方はそもそも人工知能目的とかでなければオーバーヘッドが大きすぎる。 だから日本に限って言えばNECにはロイヤリティの高い顧客が複数いて、その数で回せる程度の開発体制になっている。 >>123 PEZY-SC2は、6コアのMIPS系コントローラーと、2,048の数値演算コアなので富士通のSPARCをSIMD拡張したのを並べたのとは違うみたいですよ。 http://www.hpc.co.jp/zettascaler2.0_spec.html >>123 命令セットが同じだけど中身が違うものを基本設計は同じ独自とは言えないと 言い出すとはあきれる PEZYはMIPSじゃないから 制御用にMIPSを載せてるだけ 中華Sunwayが、16nmとかの先端プロセスにシュリンクして、メモリにGDDR5とかHMCとかHBM2採用してれば、 2位以下大きく突き放して圧倒的な世界一をとってたはず 逆にPEZYは今後さらに進化するためには、10nmとか7nmへのシュリンクと、 高帯域メモリの採用は必須 PEZYはなんでHPCGやGraph500を発表しないんでしょうか? まさか、はずかしくて発表できない? PEZYには、Graph500やHPCG性能でも頑張ってほしい さらに、最近流行の人工知能・機械学習系性能重視とかも PEZYは1位の中国のマシンと同じでメモリシステムに金かけてないからHPCGみたいなベンチでは全く性能が出ない 来年予定らしい磁界結合の高速メモリを使えるようになってからだな >>133 まだ暁光は完成してないからそこまで手広くできないんだろう。 とりあえずインパクトのあるランキング狙いじゃね? >>128 > 命令セットが同じ なのに独自と言うのもどうかと思うが... >>123 ちゃいますよwwwww 演算部の制御用にmips使ってるだけwwww >>130 ホストのXEONじゃ帯域的に不足する汎用演算もやるっぽい。 >>131 1100億も使うなら2位に10倍以上の差をつけて1位になるくらいのを作れよ ジョセフソン素子どころか、ガリヒ素すら大規模な集積回路に使われた実績がない。 コアの動作クロックが700MHzでしょ? 単にNOP命令を繰り返すかとか、コア間に連携やメモリの排他アクセスが生じない、内部 キャッシュのみで動作するようなベンチマークの結果に総コア数を乗じて、机上計算で架空最高MIPS値をはじき出して、消費電力 で割っただけの数字を自己申告しているのでは? 京はHPCGやGraph500では神威抑えてトップを維持してるんだよね。成果としては上出来では? シリコン半導体、ましてはCMOSではGHz動作なんて無理と言われていた時代もあったなぁ。 >>137 インテルはパクリということでよろしいか? >>143 京のGraph500の結果はプログラムのアルゴリズムまで改善しての性能だから計算内容が変わり過ぎてハードウェアとしての性能比較になっているかどうかわからない。 HPCGもチューニングしてオリジナルコードの27倍ぐらい速くなった結果じゃなかったっけ? 元が遅いとチューニングした成果が誇張できて、一粒で二度おいしい思いができますね。 > 60〜80億円(日経コンピュータ推定)とみられる製造費について、科学技術振興機構(JST)の助成事業からの拠出に加えて、 > 不足部分をグループ企業数社での増資などを通じて調達。地球シミュレータを設置するJAMSTECの施設を間借りする形で設置した。 http://itpro.nikkeibp.co.jp/atcl/column/14/346926/111301198/ 京やめたらこれ15台買えたんじゃぁ・・ >>11 全然ちゃうわw あの騒動で、国の予算を使いまくれるような世論誘導して 声高らかに一位狙う宣言して、予算もぶんどって結果がコレだw >>148 京は稼働当初、1年間の運用にかかる費用が80億と言われていました。 電気料金が値上げになると、運用費はさらに膨らみ、何一つ成果がないまま 国民負担だけ増える。 京のGraph500は九州大学の藤澤克樹さんらがアルゴリズムを含めた改良をやっていて、公式の発表資料でも 「アルゴリズムおよびプログラムの開発が行われ、2014 年 6 月に 17,977GTEPS の性能を達成し第1位、 また「京」のシステム全体を効率良く利用可能にするアルゴリズ ムの改良が行われ 2 倍近く性能を向上させ、2015 年 7 月に 38,621GTEPS を達成し第 1 位でした」 とか書いてある >>149 話題になった次世代スパコンの仕分けで、計画の再考を最初に判断したのは金田教授(Super PIの金田研の金田さん)で蓮舫じゃ無いしね この暁光も、今回のTop 500のランキングでもアクセラレーター使った(京が計画のすんごい初期にはあったけど辞めちゃった)スパコンが主流だけど、 京の方式が正しいということでポスト「京」でもアクセラレーターは使わない予定 一方、NECの次期スパコン Aurora はベクトルプロセッサがアクセラレータボード となって、デスクトップ型PCにも搭載できる。 ポスト京向けに開発しているスパコン用のARMプロセッサが他国のスパコンにもどんどん使われるようになったら一発逆転だけど、 そうならない場合を考えるとNECのベクトル演算スパコンを一枚のアクセラレーターにしたようなのとか、 PEZYとかに金突っ込んだ方が良いような気もする 別にNECのアクセラレーターボードも使われるとは限らんからな SVEが流行るなら初期の実装として富士通コアは少し売れるだろうが。 >>157 ARMコアを使ったスパコンが、コアの演算能力を増やす方向になるのか、アクセラレーターのコントローラーとして使う方向になるのか。 FPGAでアプリケーションに合わせて回路を変える時代がその先にあることを考えると、アクセラレーター方式が有効そうな気がするけど、 現実はそういうあれこれを上手く組み合わせて、何々方式とは簡単には分類出来ないシステムかも 富士通が開発と聴くと商売下手そうだけど、ARMの親会社はソフトバンクなので、 ソフトバンクが富士通のスパコン用ARMチップを押してくれればまだ希望があるような気もする >>142 京の半分じゃなかったっけ。 それでも高過ぎると中国では大問題に発展して責任問題になってる。 >>158 今のところ外販されてるアクセラレーターを制御するのにARMを使う理由もないでしょ 富士通ですらGPGPUスパコンにはIntelを使うと思うよ。 これがARMに置き換わるとしたら高IPCコアでARMがIntelに勝つ事だけど、 富士通のARMにその能力があるのか今ひとつわからない。 >>159 別にどこのARMが勝とうがソフバンは全く困らないわけだし、 ARMがSVEを受け入れてHPC市場への道を開いた事でやるべき事はもうやったとも言える。 >>163 ISC17の話をネットで見ていると、SSLとかの処理をする専用回路を積んでいるっぽいThunderX2とかも話題になっていたので、 外付けのアクセラレーターではなく、オンチップで汎用アクセラレーターではない専用回路を制御する時代なのかなと思った >>164 まだ詳細わからないけど、それはオンチップというよりオンコアじゃないかね? IntelのAES-NIみたいに。 まあ専用回路はあったらいいかもしれないけど、インターコネクトどうするかとか問題もありそう。 >>162 君は世間からずれてるね って言う感想しかないけど w >>166 YesNoで答えられる質問なのになー。 答えると都合悪いのわかるよ! ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.5 2024/06/08 Walang Kapalit ★ | Donguri System Team 5ちゃんねる