【IT】富士通と理研、ポスト「京」のCPUの試作チップ完成-機能試験の開始を発表[06/22]
■ このスレッドは過去ログ倉庫に格納されています
富士通と理化学研究所(理研)は、2021年頃の共用開始を目指して進めている、
スーパーコンピュータ「京」の後継機となるポスト「京」の開発に関して、
その中核となるCPUの試作チップを完成し、機能試験を開始したことを発表した。
富士通と理研は、2006年より「京」を共同で開発し、2012年に完成、共用が開始された。
「京」はスーパーコンピュータの実用面を示す主要な性能指標で現在でも
世界トップ(2017年11月のランキング)の性能を有しており、
先端的研究において不可欠な研究開発基盤として運用されている。
この「京」の後継機であるポスト「京」は、さまざまな科学的・社会的課題を解決する先端研究開発基盤、
および今後我が国が目指す新たな人間中心の社会"Society 5.0"の実現を支える重要な基盤としても期待されている。
「京」で実現された高いメモリバンド幅と倍精度演算性能をより強化するとともに、
AIなどの分野で重要となる半精度演算にも対応した。
今回、このように設計したCPUの試作チップにおいて初期動作を確認したことで、
システム開発における重要なマイルストーンを順調にクリアしたことになる。
ポスト「京」の中核となるCPUは、Armv8-A SVEアーキテクチャを採用しつつ、
「京」を含むこれまでのスーパーコンピュータ開発で富士通が培ったマイクロアーキテクチャ(ハードウェアの設計)を継承し、
高性能積層メモリと相まったメモリバンド幅と演算性能を備え、
アプリケーションの実行性能が高いレベルで実現できるように最適化されている。
さらに、最先端の半導体技術を用いることと、省電力設計および電力制御機能を盛り込むことで、
高い消費電力あたり性能を実現する。
また、プログラム開発環境を含むシステムソフトウェアは、
「京」と互換性のあるものを富士通が継続して提供する。
これにより、「京」で蓄積されたプログラム資産は、リコンパイルすることで確実な移行と性能確保が可能となる。
また、理研で開発しているシステムソフトウェアMcKernel、XcalableMP、
FDPS(Framework for Developing Particle Simulator)も利用でき、
さらなる実行性能・利便性の向上に役立つものと考えているという。
システムとアプリケーションを協調的に開発し、世界最高水準の汎用性、
および最大で「京」の100倍のアプリケーション実行性能と、
30〜40MWの消費電力(参考:「京」12.7MW)を目指していく。
ポスト「京」は、コンピュータシミュレーションなどで重要となる倍精度演算に加え、
ディープラーニングなどで重要となる半精度演算にも対応でき、AI分野への利用拡大も期待される。
また、ポスト「京」を活用することで、先端的な研究成果を生み出し、
健康長寿、防災・減災、エネルギー、ものづくり分野などの社会的・科学的課題の解決や、
産業競争力の強化に貢献することを目指して、開発を進めていくとしている。
富士通は、今後も引き続き、理研と共にさらなる開発を進めていくとしている。
なお、ポスト「京」の試作機は、6月24日〜28日にドイツにて開催される、
世界的なハイパフォーマンスコンピューティングに関する国際会議・展示会「ISC2018」に出展される予定となっている。
マイナビニュース
https://news.mynavi.jp/article/20180622-652176/ 何故、富士通なの?
特定の企業に金と技術を注ぎ込むの? 次はRISC-Vアーキテクチャにして、ついでにPCも作ってLinux載せて
政府調達させた方が良い 国民の予算を使って、海外に研究所を作るってどうなんだろう?
日本国外の研究拠点理化学研究所RAL支所(イギリス・Chilton Didcot Oxon)
理研BNL研究センター(アメリカ合衆国ニューヨーク州)
RIKEN-MIT脳科学総合研究センター(アメリカ合衆国マサチューセッツ州・ケンブリッジ)
シンガポール連絡事務所(シンガポール・Biopolis)
理研中国事務所準備室(中華人民共和国・北京市) こんどはMIPS系列か
特許の墓場の富士通はSPARC捨てられるのか? >>8
海外では聞いた事のない悪質な売国行為ですな。
もうGHQ左翼教育に染まった自爆売国バカ団塊が死ぬの待つしかない
>>9
MIPSは既に存続さえ危ぶまれている。RISC-VとARMに挟まれ潰されそう >>11
むしろ3倍に留めたことを褒めるべきだろ?
京の100倍以上の計算性能だぞ >>12
まあ、なんつっても
当社比だからな
京が無駄遣い過ぎたんだろ >>5
そりゃHPCの構成ノウハウがあるからに決まってるじゃん
詳細の発表はまだか?
どうせボロが出るだろw
製造はTSMCだし、TSMCのせいにするかな?
リーク電流が多いとかクロック上がらないとか、TSMCのせい、みたくw
>>19
>なお、ポスト「京」の試作機は、6月24日〜28日にドイツにて開催される、
>世界的なハイパフォーマンスコンピューティングに関する国際会議・展示会
>「ISC2018」に出展される予定となっている。
ドイツに池 インテル NVIDIAなんかと異なり量産小型CPUが創れない
商売にならない 日本が斜陽の理由でもある 今度はarmなのか
最適な命令セットとは何かを先にスパコンで探索した方がいいんじゃね 最適な命令セットって言ったって演算内容によって千差万別だろ
汎用性のある命令セットを用意するしかない 命令セットなんか浮動小数点レジスタさえたくさんあれば何使ったってたいした違いはなくて、浮動小数点
演算モジュールを何個並べるかとメモリバンド幅をどうするかだけの問題
なのでSPARCのままでよかったんだがそれじゃあ開発予算が取りにくいからARMにしただけ 今度のCPUは、クロック落としてメモリバスを1万倍ぐらいに拡張しないとボトルネックだらけで効率上がらなそうだな
そもそも10年前の 京 の100倍程度しか性能向上してないとかどんだけ詐欺なのかと・・・
10年で10億倍ぐらいにしろよ無能 こんな物凄いハードを日本で企画設計し造れるんだから、PCスマフォタブレッ用も部品パーツ、部分技術だけで無く
頑張ってみてよ。消費電力も多く性能頭打ちや不具合多発な院照るやアムドを超える
製品をテクノロジーブレイクスルーで造ってみろ。 そしたら会社株買ったげる
>>20
10中8、9動くものは無いな。
せいぜいモックアップだろw
>および最大で「京」の100倍のアプリケーション実行性能と、
>30〜40MWの消費電力(参考:「京」12.7MW)を目指していく。
腰が引けてるなあw
100倍の「アプリケーション実行性能」?ほお、
従前の尺度で普通に比べたらどんだけ行くんだ?
相応に行くんならそれも言ってるだろ。
なのに言わない、つまり言えないw
「アプリケーション実行性能」だけ言っても、それが何であるかが分からないから
何倍になったのか分からない。
消費電力が京の3倍前後とさらにバカでかくしたのはいいが、
従前尺度の性能を言えないからこういういい方して、
比較の対象が無いから、どんな結果が出ようと、省エネ達成ってわめくつもりだろ。
元々消費電力がでかすぎて民間貸し出しもほとんど活用されなかった京。
それが
>30〜40MWの消費電力(参考:「京」12.7MW)
って、なんだよ、特別運転予算でもつけてやるのか?w
来年出しても、最近のIBMが200PFLOPS、13MWだから
ポスト京は従前尺度性能比京の30倍(300PFOPS)、消費電力横ばい、それ位が妥当な線。
時間の問題だな。
「ARMにするから低消費電力」
のメッキが剥がれるのはw
エクサスケールか〜
シンギュラリティーは前倒しだな どうせまた微細化ではインテルより一世代前のもので作るんだろ。
なんで最先端で作らないかな。できないのかね。
消費電力多くなるし熱持つしクロック上げられないよね。
インテルプロセッサと同じプロセスルールで造った場合
面積当たりのパフォーマンスは優っているのか?
>>35
インテルに頼むしかないなw
ウンと言わないと思うけど。
だからTSMCに製造委託してる。
でもインテルもTSMCもデザインルールは似たようなもんだ。
たぶんどうせどっちもASMLのステッパーで製造するんだから。
差が出るとしたらターゲット(高性能プロセサvs.低消費電力)の違いによるVtの設定値の違いとか、
あとは他の要因による加工精度の差とか、まあ色々。
いずれにしろFがどうのこうの言っても始まらん世界の話になっちまったw
ARMはライセンスニングしかしてないから…つまり仕様書渡して終わりみたいなもん
Qualcommから買って来ればいいんだよ。
その方がまだましかもな。
サーバ用は売りたがってるけどうまく行ってないみたいだし。
もっともSparcやメインフレームは捨てることになるがw
いずれ捨ててもいい時期が来る、そしたらそうするのかな?
IAスパコン(今でもこっそり製品化している)とARMスパコンの二本立てww
FPGAが普及したら、特定の命令セットのコンピュータというものは
意味を失って、解きたい問題に合わせて動的に回路構成や機能が変わるので、
そういう上位層にあるFPGAの回路設定のための命令があっても、
データーを直接いじる固定された命令セットはなくなるのかもしれないな。 FPGAは普及してるとこでは既に普及してるし、わざわざコスト掛けてICのブループリントを作るまでもないところで使われてる
お前は一体何を言ってるんだ>>44?
それにアナログコンピュータでやった方が早い場合も有る 民生品への転用はちゃんとできるんかな?
QualcommやCaviumに追随してMicrosoftのお眼鏡にかなうくらいのHPCちゃんと作れるんかね?
QualcommのARMサーバーSoC「Centriq 2400」、Xeonに性能で迫る
http://tech.nikkeibp.co.jp/it/atcl/news/17/110902630/
サーバー向けArmプロセッサのもう1つの刺客、Cavium「ThunderX2」
https://pc.watch.impress.co.jp/docs/news/1091494.html
MarvellがCaviumを60億ドルで買収
http://eetimes.jp/ee/articles/1711/22/news074.html
マイクロソフトがARMサーバの検証へ (1/2)
http://eetimes.jp/ee/articles/1703/16/news066.html >>38
面積当たりの性能なら勝てるんじゃね?
インテルは鉄壁のシングルコア性能を誇るから、
シングルコア性能と面積当たり性能のバランスが難しいけど
同じプロセスルールで作るのは意味不明。
今はファウンダリのほうがインテルよりプロセスルール進んでいるのだから
ファウンダリのプロセスルール基準で考えるべき SSDがSLC, MLC, TLC となったように、CPUとメモリの間のデータ転送の
バスも二値から多値にすれば、エラーレートは上がるかもしれないが、
電線の本数が一定の場合には、バンド幅が増やせるのではなかろうか?
エラーレートの上昇はECCなどで(僅かな割合のバス幅の増加により)
対処するというのではどうだろうか? そんなにAIとかディープニューラルネットが重要なら、それ専用の計算機を制作して
大規模に建立すれば良いのに。 スーパーコンピュータ「Shoubu(菖蒲)system B」が
スパコン省エネランキングGreen500で2期連続世界第1位と認定
http://pezy.jp/news/release20180625/ 京はついに3位に下がったか
まあ、でも3位なら
まだ買い換えなくてもいいんじゃ メモリ64GB、SSD256GB、ディスプレーカード適当、で
富士通の新しいARMのCPUを載せたマシンが秋葉原でOSや
コンパイラ込みで50万円ぐらいで売られるのならいいのにな。
そんなことできないのだろうけれども。
コア数の足らない出来損ないのCPUを載せて売るとかすれば
価格弾力性はある程度出せるのかもしれないけれども。
性能発表はよ。
従来指標での見積もり。対京比何倍?
ちなみに電力は3倍程度だな。
アプリケーション性能とやらはどうでもいい。
どうしてもそれを追加で持ち込みたいなら、
どういう条件の時京の100倍になるのか明示しろ。
条件を明示しないなら無意味な数値。
>>53
そんなもんで何するの?
コンピュータ?
制御用?
いずれにせよ競争力なんかまったく期待できねえよ。
無駄にベクトル積んで、メインフレームとSparcと共用設計したARMなんかコスパも悪そう
Fの顧客つなぎ止め製品にしか使えないだろうな。
Nvidiaも今は殿様商売、豪華ハイエンド指向になってしまったけれども、
もとはといえば、個人でも買える程度の価格のグラフィックカードを売っていて
それをマニアや物好きの研究者が買ってなんとかこの並列計算パワーを使えないか
といろいろやってたりしたのがなれそめだからね。テスラとかいうHPC用の
ブランドのカードも出たが、最初のうちはテスラと普通の民生用品の違いは
メモリ容量の大きさ、コア数の大きさ、パリティがあるかどうかぐらいだった。
しかし、だんだんと普通のホビーストや年間研究費が数十万円の研究者には
手に届かない値段になってしまった。 >>53
メモリバンド幅は同じなのにコア数だけ無駄に多いCPUこそ出来損ないなのに、お前馬鹿だな 超大規模な表計算を高速に行うためのアーキテクチャーとかはどのような
ものになるのだろうか。 たとえば、100万行で、100万列あるスプレッドシートの
表の各種計算をものすごく早く行う計算機はどういう風に
すれば良いだろうか? 日本ではスパコン業者が一社だけになってしまって、この分野は衰退してるな。
F社もパソコン部門を売却してしまったりしたそうだが、スパコン事業もあまり
儲かるとは言えないから。 国力を保つためにスパコン開発の技術を維持するのは大切である。
しかし、実際、理研でスパコンが効果的に使われているかとなると大いに疑問である。
理研の情報系の研究室の業績は厳しい審査の目を通されるべきである。
ファースト、ラスト、コレスポ以外の便乗論文は評価してはならない。 しかし、そうだとしても頭が悪すぎるな。
>なのでSPARCのままでよかったんだがそれじゃあ開発予算が取りにくいからARMにしただけ
これでARM採用は頭が悪い。富士通という企業は元はシーメンスと合弁するくらいのドイツ系
なので社風がファブレスの英国風ではないし、コアを簡単に変えること自体がナンセンス。
SPARCならSPARCを長く使うべきで、その先に最近話題のRISC-Vの道筋もあったはず。
ARM採用の富士通HPCは失敗するか最悪のマシンになると思う。
半導体設計も企業組織も組み合わせがよくない。良くないものを掛け合わせると最悪のものが
生まれる。 HDDやめてSSDにしたら早くなるのじゃないの?
特に、SATAじゃなくてPCI-Eのに SPARCだと全部自前で開発しなけりゃだめで重荷になってたんだとさ
ARMはバグ取り済みの資産が盛り盛り開発者も大勢
>>68
じゃあSPARCサーバなんてやめりゃいいのに。
もっともARMにしてベクトル積んで、
ベクトル化フォートランどうやって乗せるのかな?
元々Cかなんかで書いてあるのかな?
ベクトルレジスタの構成や機能を一致させときゃできなくもないか...
性能ロスは出るけど。
HPE、米国エネルギー省向けに、世界最大級のArmスーパーコンピュータを開発:
ベースとなる「HPE Apollo 70 System」を日本でも販売開始
https://www.hpe.com/jp/ja/japan/newsroom/press-release/2018/071701.html
> HPE Apollo 70 System 2P/28コア(2.0GHz)、32GB RAM 1,704,800 円〜 /2018年7月17日
これなら買えるところもあるだろう。 >>68
なんだその嘘
HPC用のARMの命令は今回追加するんで既存コードなんてどこにもないし、あってもキャッシュの
構成が違えば違うコードになるから、高級言語で書けばSPARCもARMも変わりないぞ 早く秋葉原で売られるようになるといいね。
ところで、引退する京はどこにいくのかな? >>71
日経の電子版に書いてあったよもう消えてるけど Requiem for a Phi: Knights Landing Discontinued
https://www.hpcwire.com/2018/07/25/end-of-the-road-for-knights-landing-phi/
βマックスはなくなるの? と似た感じで、
XeonPhiはなくなるの? Google、推論に特化したエッジ向けTPU「Edge TPU」をIoT向けに外販へ
4TOPSの性能を2Wの消費電力で実現
https://cloud.watch.impress.co.jp/docs/news/1134852.html >>47
ファウンダリーが進んでるのはプロセスの名前だけ。ファウンダリーの7nmとインテルの10nmのゲートピッチやメタルピッチはほぼ同じ AMDならインテルと張り合うレベルの技術あるしSOC戦争に参入してほしいわ
天下取れる AMD、999ドルのワークステーション向けGPU「Radeon Pro WX 8200」
https://pc.watch.impress.co.jp/docs/news/1137832.html
米AMDは12日(現地時間)、ワークステーション向けGPU「Radeon Pro WX 8200」を発表した。
米国での推奨小売価格は999ドル。現地の13日より予約開始し、発売は9月を予定している。
コンシューマ向けの「Radeon RX Vega 56」に近い規模のGPUで、56基のコンピュートユニット(CU)、
8GBのHBM2メモリを搭載。最大512GB/sのメモリバンド幅や11TFLOPSの浮動小数点演算性能を実現している。
ディスプレイ出力はMini DisplayPort×4で、8K解像度をサポート。AMDによれば、
NVIDIAより高いドライバの信頼性、Quadro P5000/P4000を凌駕するGPUレンダリング/VR性能を実現。
Radeon用ドライバと切り替えることでゲーム用途にも性能を最適化できる。
また、ACE(Asynchronous Compute Engine)の搭載により、コンピュートタスクとグラフィックスタスクを
同時に実行しても性能低下が少なく、マルチタスクにおいてQuadro P5000と比較して13倍の性能を実現する
という。
消費電力は250Wで、PCI Express補助電源8ピン+6ピンを利用する。
-----------------------
これで倍精度計算がハードでできて、OpenACCでプログラミングが出来れば
最高なんですがね。 32コアの第2世代Threadripperどうだね? 神戸の施設維持に莫大な税金を投じるくらいなら、北海道の寒冷地に量子コンピュータ
施設を作るほうがよほど、低コストで性能もだせるのに 独自規格にこだわる経産省は
世界的に売れないガラパゴススパコンに巨額能の投資するだけ まだ二年も先の話だから、その頃情勢がどう変わっているか分からないよ。
政府が急に緊縮財政をとって、不要不急の投資を全部凍結したりしたら、
不況になるよ。
三重もUMC(台湾)に売っぱらうみたいだし。
なんかやってたのかな?試作とか?
>>82
寒冷地に量子コンピュータ???
北海道の気候くらいじゃ、神戸と比べて量子コンピュータを稼働させるメリットなんか皆無だろ??
データセンターか何かと混同してないか?確かに、これなら一時期寒冷地に設置するのが流行ったね。
でもメンテナンスが大変になるんで、一気に廃れたけど >>78
>AMDならインテルと張り合うレベルの技術
おまえ技術違うだろ、特許だよ
だからいつも上から目線に感じる 別にエラソーに書いてないと思うが気に触ったらスマソコ >>86
技術だよ
ジム・ケラーのいないメーカーには革新がない
だからRyzen作った後でインテルに呼ばれてるんだよ
日本人にはムリw 京なんてもう「うんこ」かな?
日本電信電話(株)と日本アイ・ビー・エム(株)の2社により、
日本情報通信株式会社(略称:NI+C) を設立(本社:東京都港区)
1985年(12月18日)
x86では実現できない、次世代のパフォーマンスを発揮
POWER9/NVIDIA搭載サーバー
IBM Power System AC922
AI・Deep Learningを活用するにあたり、ベストプラクティスなサーバーです。
http://www.niandc.co.jp/sol/product/power9/ ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
富士通、スパコン「京」の後継機用ArmベースCPU「A64FX」の仕様を発表
劉 尭 2018年8月22日 13:03
https://pc.watch.impress.co.jp/docs/news/1139081.html
> 富士通株式会社は、スーパーコンピュータ「京」の次期モデルに
>採用される予定のCPU「A64FX」の仕様を発表した。
> A64FXは、Armとの協業により「Armv8-A」命令セットアーキテクチャを
> スパコン向けに拡張した「SVE(Scalable Vector Extension)」(Armv8.2-A SVE)
> を世界で初めて採用した。コア数はコンピューティングコアが48基、
> アシスタントコアが4基。
> ブロック図を見るかぎり、13コアと8MBのL2キャッシュ、容量8GBで
> バンド幅256GB/sのHBM2をひとまとめとした「CMG」を4基搭載し、
> オンチップネットワークで接続しているのがわかる。
> 製造は7nm FinFETで、約87億トランジスタを集積する。
.....(後略)
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
AMD、次期「Zen 2」および「Navi」はTSMCの7nmプロセスで製造へ
〜GLOBALFOUNDRIESは7nmプロセスの開発を無期限に保留、人員削減
劉 尭 2018年8月28日 12:01
https://pc.watch.impress.co.jp/docs/news/1140080.html
ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
ここで疑問が生じる。それは
GlobalFundriesは7nmプロセスの開発を無期限に保留して人員削減
であるならば、A64FXをG.F.で7nmで作る話の方はどうなるのだろうか?
二つの記事の出た日付は1週間程度の違いしかないのだが。まさか 👀
Rock54: Caution(BBR-MD5:1341adc37120578f18dba9451e6c8c3b) コプロセッサーてのは時代遅れですか?使い勝手悪いとか。gfortranは使えないですか? GLOBALFOUNDRIESで新京のための7nmのCPU などのLSIを製造して貰う話に
なったばかりだというのに、G.F.は突如として7nmの開発を放棄するという
話になったようだが、そうなると、新京の完成は予定よりもまた遅れるのじゃ無いかな? 日本よりも先に、中国あたりで先にARMのベクトル拡張を持ったCPUが
大量に使われたスパコンが出て来たらどうなるのだろうか? 中国はライセンスの関係でarm使わないと思う
龍心でアレだった訳だしw
やるならrisc-vとかライセンスフリーの奴じゃないかな >>25
半導体の性能って1年半で倍になるとかじゃなかったっけ?
10年なら2の6〜7乗で100倍まぁ妥当じゃないの?w オープンソースのARMアーキテクチャのソフト資産は沢山あるので、顧客からしてみれば
ARM採用はありがたいと思うな。
拡張命令追加されたところで過去資産はある程度は動くんだからな。
SPARCだとコミュニティが狭すぎるんだよね。 ソフトバンクホークス も改名して、ソフトバンク アームズ にしたらどうかな。 新スパコンの性能がCPUとか思っている馬鹿が多すぎる、
足回りの遅延を早くすることができたのが成果なのに、
CPUスゲーとかいつの時代だよ
これだけのCPUを並列化しているときのボトルネックはそれぞれの通信であり、
その通信遅延が全体の性能になる、CPUの性能あげても意味がない状況になっている。
4個とか16個とかそういう井戸の中の世界じゃない、ありえないほど大量な個数が並列で動いていることも
理解できないとは無知もほどほどにしろよ。
コンピュータの性能は計算性能ではなく、入出力のIO、メモリ、キャッシュ、相互接続の性能であって
同期しない稀なケースしか想像しない馬鹿には馬の耳に念仏だよな。
常時計算以外の遅延で演算部分が停止しているってことだよ、都内の道路が1メートル単位で信号があって
渋滞しないとか考える馬鹿が多すぎる。信号の排除、信号のない高速道路が全体の速度を上げるってことだよ >>103
100億倍ぐらいCPUを並列化すればそれもありだな、
通信経路遅延がそのぐらい遅くなる 昔、コネクションマシンとかNCUBEといった非力なマシンを3次元的に
たくさん並べて配線で結合して超並列計算機だというのを作って居たが、
ああいうのは復活しないのかな。 ■ このスレッドは過去ログ倉庫に格納されています