【IT】富士通と理研、ポスト「京」のCPUの試作チップ完成-機能試験の開始を発表[06/22]
■ このスレッドは過去ログ倉庫に格納されています
富士通と理化学研究所(理研)は、2021年頃の共用開始を目指して進めている、
スーパーコンピュータ「京」の後継機となるポスト「京」の開発に関して、
その中核となるCPUの試作チップを完成し、機能試験を開始したことを発表した。
富士通と理研は、2006年より「京」を共同で開発し、2012年に完成、共用が開始された。
「京」はスーパーコンピュータの実用面を示す主要な性能指標で現在でも
世界トップ(2017年11月のランキング)の性能を有しており、
先端的研究において不可欠な研究開発基盤として運用されている。
この「京」の後継機であるポスト「京」は、さまざまな科学的・社会的課題を解決する先端研究開発基盤、
および今後我が国が目指す新たな人間中心の社会"Society 5.0"の実現を支える重要な基盤としても期待されている。
「京」で実現された高いメモリバンド幅と倍精度演算性能をより強化するとともに、
AIなどの分野で重要となる半精度演算にも対応した。
今回、このように設計したCPUの試作チップにおいて初期動作を確認したことで、
システム開発における重要なマイルストーンを順調にクリアしたことになる。
ポスト「京」の中核となるCPUは、Armv8-A SVEアーキテクチャを採用しつつ、
「京」を含むこれまでのスーパーコンピュータ開発で富士通が培ったマイクロアーキテクチャ(ハードウェアの設計)を継承し、
高性能積層メモリと相まったメモリバンド幅と演算性能を備え、
アプリケーションの実行性能が高いレベルで実現できるように最適化されている。
さらに、最先端の半導体技術を用いることと、省電力設計および電力制御機能を盛り込むことで、
高い消費電力あたり性能を実現する。
また、プログラム開発環境を含むシステムソフトウェアは、
「京」と互換性のあるものを富士通が継続して提供する。
これにより、「京」で蓄積されたプログラム資産は、リコンパイルすることで確実な移行と性能確保が可能となる。
また、理研で開発しているシステムソフトウェアMcKernel、XcalableMP、
FDPS(Framework for Developing Particle Simulator)も利用でき、
さらなる実行性能・利便性の向上に役立つものと考えているという。
システムとアプリケーションを協調的に開発し、世界最高水準の汎用性、
および最大で「京」の100倍のアプリケーション実行性能と、
30〜40MWの消費電力(参考:「京」12.7MW)を目指していく。
ポスト「京」は、コンピュータシミュレーションなどで重要となる倍精度演算に加え、
ディープラーニングなどで重要となる半精度演算にも対応でき、AI分野への利用拡大も期待される。
また、ポスト「京」を活用することで、先端的な研究成果を生み出し、
健康長寿、防災・減災、エネルギー、ものづくり分野などの社会的・科学的課題の解決や、
産業競争力の強化に貢献することを目指して、開発を進めていくとしている。
富士通は、今後も引き続き、理研と共にさらなる開発を進めていくとしている。
なお、ポスト「京」の試作機は、6月24日〜28日にドイツにて開催される、
世界的なハイパフォーマンスコンピューティングに関する国際会議・展示会「ISC2018」に出展される予定となっている。
マイナビニュース
https://news.mynavi.jp/article/20180622-652176/
>>53
そんなもんで何するの?
コンピュータ?
制御用?
いずれにせよ競争力なんかまったく期待できねえよ。
無駄にベクトル積んで、メインフレームとSparcと共用設計したARMなんかコスパも悪そう
Fの顧客つなぎ止め製品にしか使えないだろうな。
Nvidiaも今は殿様商売、豪華ハイエンド指向になってしまったけれども、
もとはといえば、個人でも買える程度の価格のグラフィックカードを売っていて
それをマニアや物好きの研究者が買ってなんとかこの並列計算パワーを使えないか
といろいろやってたりしたのがなれそめだからね。テスラとかいうHPC用の
ブランドのカードも出たが、最初のうちはテスラと普通の民生用品の違いは
メモリ容量の大きさ、コア数の大きさ、パリティがあるかどうかぐらいだった。
しかし、だんだんと普通のホビーストや年間研究費が数十万円の研究者には
手に届かない値段になってしまった。 >>53
メモリバンド幅は同じなのにコア数だけ無駄に多いCPUこそ出来損ないなのに、お前馬鹿だな 超大規模な表計算を高速に行うためのアーキテクチャーとかはどのような
ものになるのだろうか。 たとえば、100万行で、100万列あるスプレッドシートの
表の各種計算をものすごく早く行う計算機はどういう風に
すれば良いだろうか? 日本ではスパコン業者が一社だけになってしまって、この分野は衰退してるな。
F社もパソコン部門を売却してしまったりしたそうだが、スパコン事業もあまり
儲かるとは言えないから。 国力を保つためにスパコン開発の技術を維持するのは大切である。
しかし、実際、理研でスパコンが効果的に使われているかとなると大いに疑問である。
理研の情報系の研究室の業績は厳しい審査の目を通されるべきである。
ファースト、ラスト、コレスポ以外の便乗論文は評価してはならない。 しかし、そうだとしても頭が悪すぎるな。
>なのでSPARCのままでよかったんだがそれじゃあ開発予算が取りにくいからARMにしただけ
これでARM採用は頭が悪い。富士通という企業は元はシーメンスと合弁するくらいのドイツ系
なので社風がファブレスの英国風ではないし、コアを簡単に変えること自体がナンセンス。
SPARCならSPARCを長く使うべきで、その先に最近話題のRISC-Vの道筋もあったはず。
ARM採用の富士通HPCは失敗するか最悪のマシンになると思う。
半導体設計も企業組織も組み合わせがよくない。良くないものを掛け合わせると最悪のものが
生まれる。 HDDやめてSSDにしたら早くなるのじゃないの?
特に、SATAじゃなくてPCI-Eのに SPARCだと全部自前で開発しなけりゃだめで重荷になってたんだとさ
ARMはバグ取り済みの資産が盛り盛り開発者も大勢
>>68
じゃあSPARCサーバなんてやめりゃいいのに。
もっともARMにしてベクトル積んで、
ベクトル化フォートランどうやって乗せるのかな?
元々Cかなんかで書いてあるのかな?
ベクトルレジスタの構成や機能を一致させときゃできなくもないか...
性能ロスは出るけど。
HPE、米国エネルギー省向けに、世界最大級のArmスーパーコンピュータを開発:
ベースとなる「HPE Apollo 70 System」を日本でも販売開始
https://www.hpe.com/jp/ja/japan/newsroom/press-release/2018/071701.html
> HPE Apollo 70 System 2P/28コア(2.0GHz)、32GB RAM 1,704,800 円〜 /2018年7月17日
これなら買えるところもあるだろう。 >>68
なんだその嘘
HPC用のARMの命令は今回追加するんで既存コードなんてどこにもないし、あってもキャッシュの
構成が違えば違うコードになるから、高級言語で書けばSPARCもARMも変わりないぞ 早く秋葉原で売られるようになるといいね。
ところで、引退する京はどこにいくのかな? >>71
日経の電子版に書いてあったよもう消えてるけど Requiem for a Phi: Knights Landing Discontinued
https://www.hpcwire.com/2018/07/25/end-of-the-road-for-knights-landing-phi/
βマックスはなくなるの? と似た感じで、
XeonPhiはなくなるの? Google、推論に特化したエッジ向けTPU「Edge TPU」をIoT向けに外販へ
4TOPSの性能を2Wの消費電力で実現
https://cloud.watch.impress.co.jp/docs/news/1134852.html >>47
ファウンダリーが進んでるのはプロセスの名前だけ。ファウンダリーの7nmとインテルの10nmのゲートピッチやメタルピッチはほぼ同じ AMDならインテルと張り合うレベルの技術あるしSOC戦争に参入してほしいわ
天下取れる AMD、999ドルのワークステーション向けGPU「Radeon Pro WX 8200」
https://pc.watch.impress.co.jp/docs/news/1137832.html
米AMDは12日(現地時間)、ワークステーション向けGPU「Radeon Pro WX 8200」を発表した。
米国での推奨小売価格は999ドル。現地の13日より予約開始し、発売は9月を予定している。
コンシューマ向けの「Radeon RX Vega 56」に近い規模のGPUで、56基のコンピュートユニット(CU)、
8GBのHBM2メモリを搭載。最大512GB/sのメモリバンド幅や11TFLOPSの浮動小数点演算性能を実現している。
ディスプレイ出力はMini DisplayPort×4で、8K解像度をサポート。AMDによれば、
NVIDIAより高いドライバの信頼性、Quadro P5000/P4000を凌駕するGPUレンダリング/VR性能を実現。
Radeon用ドライバと切り替えることでゲーム用途にも性能を最適化できる。
また、ACE(Asynchronous Compute Engine)の搭載により、コンピュートタスクとグラフィックスタスクを
同時に実行しても性能低下が少なく、マルチタスクにおいてQuadro P5000と比較して13倍の性能を実現する
という。
消費電力は250Wで、PCI Express補助電源8ピン+6ピンを利用する。
-----------------------
これで倍精度計算がハードでできて、OpenACCでプログラミングが出来れば
最高なんですがね。 32コアの第2世代Threadripperどうだね? 神戸の施設維持に莫大な税金を投じるくらいなら、北海道の寒冷地に量子コンピュータ
施設を作るほうがよほど、低コストで性能もだせるのに 独自規格にこだわる経産省は
世界的に売れないガラパゴススパコンに巨額能の投資するだけ まだ二年も先の話だから、その頃情勢がどう変わっているか分からないよ。
政府が急に緊縮財政をとって、不要不急の投資を全部凍結したりしたら、
不況になるよ。
三重もUMC(台湾)に売っぱらうみたいだし。
なんかやってたのかな?試作とか?
>>82
寒冷地に量子コンピュータ???
北海道の気候くらいじゃ、神戸と比べて量子コンピュータを稼働させるメリットなんか皆無だろ??
データセンターか何かと混同してないか?確かに、これなら一時期寒冷地に設置するのが流行ったね。
でもメンテナンスが大変になるんで、一気に廃れたけど >>78
>AMDならインテルと張り合うレベルの技術
おまえ技術違うだろ、特許だよ
だからいつも上から目線に感じる 別にエラソーに書いてないと思うが気に触ったらスマソコ >>86
技術だよ
ジム・ケラーのいないメーカーには革新がない
だからRyzen作った後でインテルに呼ばれてるんだよ
日本人にはムリw 京なんてもう「うんこ」かな?
日本電信電話(株)と日本アイ・ビー・エム(株)の2社により、
日本情報通信株式会社(略称:NI+C) を設立(本社:東京都港区)
1985年(12月18日)
x86では実現できない、次世代のパフォーマンスを発揮
POWER9/NVIDIA搭載サーバー
IBM Power System AC922
AI・Deep Learningを活用するにあたり、ベストプラクティスなサーバーです。
http://www.niandc.co.jp/sol/product/power9/ ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
富士通、スパコン「京」の後継機用ArmベースCPU「A64FX」の仕様を発表
劉 尭 2018年8月22日 13:03
https://pc.watch.impress.co.jp/docs/news/1139081.html
> 富士通株式会社は、スーパーコンピュータ「京」の次期モデルに
>採用される予定のCPU「A64FX」の仕様を発表した。
> A64FXは、Armとの協業により「Armv8-A」命令セットアーキテクチャを
> スパコン向けに拡張した「SVE(Scalable Vector Extension)」(Armv8.2-A SVE)
> を世界で初めて採用した。コア数はコンピューティングコアが48基、
> アシスタントコアが4基。
> ブロック図を見るかぎり、13コアと8MBのL2キャッシュ、容量8GBで
> バンド幅256GB/sのHBM2をひとまとめとした「CMG」を4基搭載し、
> オンチップネットワークで接続しているのがわかる。
> 製造は7nm FinFETで、約87億トランジスタを集積する。
.....(後略)
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
AMD、次期「Zen 2」および「Navi」はTSMCの7nmプロセスで製造へ
〜GLOBALFOUNDRIESは7nmプロセスの開発を無期限に保留、人員削減
劉 尭 2018年8月28日 12:01
https://pc.watch.impress.co.jp/docs/news/1140080.html
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
ここで疑問が生じる。それは
GlobalFundriesは7nmプロセスの開発を無期限に保留して人員削減
であるならば、A64FXをG.F.で7nmで作る話の方はどうなるのだろうか?
二つの記事の出た日付は1週間程度の違いしかないのだが。まさか 👀
Rock54: Caution(BBR-MD5:1341adc37120578f18dba9451e6c8c3b) コプロセッサーてのは時代遅れですか?使い勝手悪いとか。gfortranは使えないですか? GLOBALFOUNDRIESで新京のための7nmのCPU などのLSIを製造して貰う話に
なったばかりだというのに、G.F.は突如として7nmの開発を放棄するという
話になったようだが、そうなると、新京の完成は予定よりもまた遅れるのじゃ無いかな? 日本よりも先に、中国あたりで先にARMのベクトル拡張を持ったCPUが
大量に使われたスパコンが出て来たらどうなるのだろうか? 中国はライセンスの関係でarm使わないと思う
龍心でアレだった訳だしw
やるならrisc-vとかライセンスフリーの奴じゃないかな >>25
半導体の性能って1年半で倍になるとかじゃなかったっけ?
10年なら2の6〜7乗で100倍まぁ妥当じゃないの?w オープンソースのARMアーキテクチャのソフト資産は沢山あるので、顧客からしてみれば
ARM採用はありがたいと思うな。
拡張命令追加されたところで過去資産はある程度は動くんだからな。
SPARCだとコミュニティが狭すぎるんだよね。 ソフトバンクホークス も改名して、ソフトバンク アームズ にしたらどうかな。 新スパコンの性能がCPUとか思っている馬鹿が多すぎる、
足回りの遅延を早くすることができたのが成果なのに、
CPUスゲーとかいつの時代だよ
これだけのCPUを並列化しているときのボトルネックはそれぞれの通信であり、
その通信遅延が全体の性能になる、CPUの性能あげても意味がない状況になっている。
4個とか16個とかそういう井戸の中の世界じゃない、ありえないほど大量な個数が並列で動いていることも
理解できないとは無知もほどほどにしろよ。
コンピュータの性能は計算性能ではなく、入出力のIO、メモリ、キャッシュ、相互接続の性能であって
同期しない稀なケースしか想像しない馬鹿には馬の耳に念仏だよな。
常時計算以外の遅延で演算部分が停止しているってことだよ、都内の道路が1メートル単位で信号があって
渋滞しないとか考える馬鹿が多すぎる。信号の排除、信号のない高速道路が全体の速度を上げるってことだよ >>103
100億倍ぐらいCPUを並列化すればそれもありだな、
通信経路遅延がそのぐらい遅くなる 昔、コネクションマシンとかNCUBEといった非力なマシンを3次元的に
たくさん並べて配線で結合して超並列計算機だというのを作って居たが、
ああいうのは復活しないのかな。 ■ このスレッドは過去ログ倉庫に格納されています