X



【コンピュータ工学】中国版エクサスケールスパコンの開発状況 - ISC 2019[07/06]
■ このスレッドは過去ログ倉庫に格納されています
0001一般国民 ★
垢版 |
2019/07/06(土) 00:44:43.43ID:CAP_USER
中国版エクサスケールスパコンの開発状況 - ISC 2019
https://news.mynavi.jp/article/20190704-852188/
https://news.mynavi.jp/article/20190704-852188/2
2019/7/4
マイナビニュース

写真:中国のエクサスケールスパコンの状況について発表するBeihang大学のDepei Qian教授
https://news.mynavi.jp/article/20190704-852188/images/001.jpg
そのた画像多数(英文資料)

【科学(学問)ニュース+】

1.中国がエクサスパコン達成に向けた目標を公開
6月にドイツで開催された「ISC 2019」において北京航天大学(Beihang University)兼 中山大学(Sun Yat-sen University)のDepei Qian教授が中国が進めるエクサスケールスパコンの開発状況について発表を行った。

・中国がエクサスケールを目指す理由
中国のエクサスケールスパコンの開発目標は、自分でコントロールできるテクノロジでエクサスケールのスパコンを作り、国立のHPC環境で使えるようにすることである。また、重要なドメインのアプリケーション開発や研究をサポートすることである。

そのために達成すべき目標として、ピークで1ExaFlopsの演算性能、10PBのメモリ容量、ExaByteのストレージ。電力効率は30GFlops/W、400Gbps以上のインタコネクトを上げた。

日本の次世代スパコン「富岳」はピーク演算性能が約0.4ExaFlops、電力効率は15GFlops/Wであるので、演算性能、電力効率の点で中国の目標は富岳の2倍である。また、富岳のHBM2メモリは0.48PBしか容量が無く、次の階層としてDRAMや高速のNVRAMなどが付けられると思われるが、メモリ容量が小さいのは気になる点である。

そして、Qian教授は、大規模資源の効率的なマネジメント、使いやすい並列プログラム開発環境、巨大システムを高信頼で動かすため、システムの監視や耐故障性などの重要性を指摘した。

アーキテクチャとして重要な点として、計算パワーとメモリ能力をマッチさせることを挙げた。これは中国の巨大スパコンがメモリ能力に比べて巨大な演算能力を積んでTop500のランキングを上げていたことの反省であると思われる。

そして、具体的には計算ユニットとメモリを近づけるDRAM in ProcessorやPIM(Processor in Memory)アーキテクチャを検討項目として挙げている。また、データの移動中にデータを加工するようなアーキテクチャも検討するという。

また、ドメインスペシフィックなアーキテクチャやダイナミックに再構成可能なアーキテクチャを検討する。後者はスイス・アーミーナイフ(マルチツールナイフ)のように、必要となったときに、その用途に向いた機能ユニットを出してきて効率の良い処理を行うというイメージである。

また、新たに広がってきたニューロモルフィックな処理、グラフ処理、マシンラーニングへの対応も必要であるという。

この辺りの指摘は、至極当然であるが、具体的にどのようにやるのかという話はされなかった。

■■以下、小見出しのみ抜粋。続きはソースをご覧ください。

・ボトルネックとなるメモリへのアクセス
・エクサ時代に求められるシステムソフトの有り様
2.中国が進めるエクサスパコンのプロトタイプ機開発
・中国のエクサプロトタイプ機
・Sugonのプロトタイプ機
・Tianheのプロトタイプ機
・Sunwayのプロトタイプ機
0002ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 00:47:04.00ID:Y7302xLN
2位じゃ駄目なんですか!?
0003ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 00:55:48.35ID:QI2fUwaq
2ゲットじゃないと駄目なんですか
0004ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 01:15:15.57ID:fzwCvMSX
キロ<メガ<ギガ<テラ<ペタ<エクサ<ゼタ<ヨタ
0009ニュースソース検討中@自治議論スレ
垢版 |
2019/07/06(土) 20:03:48.04ID:HXYhlr/p
>>7
FLOPS計算だと

FLOPS = コア数 x クロック(GHz) x 1クロックで処理できる命令数

で自分で理論値計算出来る

今年の9月に出るAMDのRyzen 9 3950Xは、コア数16、ベースクロック3.5GHz、
AVX 2で1クロックで処理できる命令数が16なので

16 x 3.5 x 16 = 896 GFLOPS ≒ 0.9 TFLOPS

全コアブーストでクロック上がるなら1TFLOPS超えもあるのかな?



スパコンとのFLOPS比較はメモリ帯域とか絡むから必ずしも正確な優劣にはならないけど
航空宇宙技術研究所の数値風洞(1993)がピーク性能280GFLOPS
地球シミュレータ第一世代(2002)がピーク性能40TFLOPS
0013ニュースソース検討中@自治議論スレ
垢版 |
2019/07/07(日) 17:20:09.67ID:/UdSHXlA
最新鋭の国産計算機Fujitsu PRIMERGY CX2550 M5
 https://www.cc.u-tokyo.ac.jp/supercomputer/obcx/system.php

2.7GHzの28コアのCPU(Intel Xeon Platinum 8280)
を2個載せた1ノードあたりの理論性能上限が4.8384TFLOPS
だということだ。どうしてそうなるのか、説明してみてくれ。

つまりCPU1個あたり2.4TFLOPSを越えてるんだが。
00149
垢版 |
2019/07/07(日) 22:18:38.76ID:PJid7Yq4
>>13
Intel Xeon Platinum 8280は、コア数28、ベースクロック2.7GHz、
AVX-512で1クロックで処理できる命令数が32なので

28(コア) x 2.7(GHz) x 32(命令数/1クロックサイクル) = 2419.2 GFLOPS = 2.4192 TFLOPS

ただし、AVX-512で計算ぶん回すと爆熱らしいので家庭用PCで使うには
液冷にしたりケース内フロー十分気をつけないと厳しいって聞くけどどうなんだろ?
0015ニュースソース検討中@自治議論スレ
垢版 |
2019/07/14(日) 20:49:57.15ID:hKW+WPV3
自分の国でCPUからOSからライブラリからアプリから作ろうとする
中国の真剣さは大したものじゃないか。今後10年20年もすれば、
ひょっとすると日本はもとよりアメリカすら抜いて世界一の
シミュレーション技術、シミュレーションコードの大国になってしまう
かもしれないな。何しろ携わっている人数が多いからね。
0016ニュースソース検討中@自治議論スレ
垢版 |
2019/07/19(金) 23:28:49.37ID:jCbUu7c8
>>8
2050年頃
0017ニュースソース検討中@自治議論スレ
垢版 |
2019/07/20(土) 06:20:50.24ID:P35bT/Fh
方式もシステムもアルゴリズムもソフトウェアも人間が考案して人間が作業して
実現するもの。人間に投資をせずに、パクりもののハード、パクりもののOS、
パクりもののライブラリ、パクりもののアプリ、で金儲けする手段とみてきた
日本じゃ、先陣を切るのは無理。まあアメリカの利権を侵すような
たとえばWindowsを不要にするようなOSを開発しようとすれば、
何らかの妨害工作にあって潰されるのだろうが。
0018ニュースソース検討中@自治議論スレ
垢版 |
2019/08/09(金) 23:18:37.43ID:Snyfb+Yq
>>17
トロンもアメリカにつぶされたしな
0019ニュースソース検討中@自治議論スレ
垢版 |
2019/08/12(月) 02:38:45.81ID:w+E9jqJn
いまはパソコンの多くが実質的に台湾製・中国製であるが、
スパコンだってそうなりかねないのではないか?
既に日立は製造を辞めたし。
0020ニュースソース検討中@自治議論スレ
垢版 |
2019/08/12(月) 03:12:28.74ID:T3awMqFs
>>6
ヨタじゃなくて?
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況