【IT】「富岳」がスパコン世界ランキングで1位に、世界初の同時4冠達成 [しじみ★]
■ このスレッドは過去ログ倉庫に格納されています
理化学研究所と富士通が共同開発したスーパーコンピューター「富岳(ふがく)」が2020年6月22日(ヨーロッパ夏時間)、スーパーコンピューターの性能を競う世界ランキング「TOP500」で1位を獲得した。日本勢が同ランキングで1位を取るのは2011年11月の「京(けい)」以来、8年半ぶり。HPC(ハイ・パフォーマンス・コンピューティング)に関する国際会議「ISC 2020 Digital」が同日ランキングを発表した。
TOP500は最も一般的なスパコンの性能ランキングで、規則的な行列演算である連立1次方程式を解く計算(LINPACK)でスパコンの性能を評価する。多くの科学技術計算で使われる倍精度演算(10進で16桁の浮動小数点)のみで計算するルールである。
富岳のシステムは396きょう体(15万2064ノード)の構成で、LINPACK性能は415.53ペタ(ペタは1000兆)フロップス(1秒当たりの浮動小数点演算回数)、実行効率は80.87%だった。同ランキング2位は米Intel(インテル)などが開発した「Summit(サミット)」で、LINPACK性能は148.6ペタフロップスだった。富岳は2位と約2.8倍の性能差をつけた。
富岳はTOP500以外の3つの性能ランキングでも1位を獲得し、4冠を達成した。具体的には、スパコン上で動く実アプリケーションに近い演算の性能を測る「HPCG」、ビッグデータ処理(大規模グラフ解析)に関する性能を測る「Graph500」、今回から加わったAI(人工知能)関連処理の性能を測る「HPL-AI」でそれぞれ1位だった。同じスパコンがTOP500とHPCG、Graph500で1位となるのは世界初で、同時4冠獲得も世界初だ。
HPL-AIはAIの計算処理などで使われる低精度演算の使用を認めた新しいベンチマークで、ディープラーニングなどAI関連処理の性能を示す。今回富岳は330きょう体(12万6720 ノード)で1.421エクサ(エクサは100京)フロップスという性能を記録し、浮動小数点演算を用いたベンチマークではじめてエクサ級の性能を達成した。
https://cdn-xtech.nikkei.com/atcl/nxt/news/18/08178/topm.jpg
https://xtech.nikkei.com/atcl/nxt/news/18/08178/ 時代は量子コンピューティングだろ?
日本は何もやってないだろ? >LINPACK性能は415.53ペタ(ペタは1000兆)フロップス
>(1秒当たりの浮動小数点演算回数)、実行効率は80.87%
513.8ペタが理論ピークということか? 1ヘキサなかったの? 富士通だから富嶽か
CPUも独自設計みたいだが製造はどこでやってんのかな
TSMCかな >>2
古澤明氏が頑張っている筈なんだが・・・開発出来たら確実に世界覇権確実だと思われ >>10
確実が2回繰り返すとは狂ってるな まだ寝ぼけてるwww >「富岳」の世界第1位獲得を受け、理化学研究所と富士通株式会社は
>共同で記者会見を実施(2020年6月23日 11時〜)、
>記者会見の様子はYouTubeにてライブ配信。ぜひご覧ください。
> https://youtu.be/RJ71ETnmTtw これでコロナウィルスのワクチンとか開発したら日本も一気に見直されるかもな
大都市でも伝染病が蔓延しない衛生観念があり狭い国でも世界三位の経済だからな >>2
スレ立つと同時にそのレス書き込むとかどんだけ悔しいのよ >>14
富嶽三十六景(36京=360PFlops)らしい Linpackのランキングなんか無意味だが、graph500他4部門独占となれば違った意味があるな。 気象計算の次に来る、生活に密着した使用方法は何だろう
油田でも当てるか これはこれで素晴らしいんだが、ところで量子コンピューターはどうなってんのかな?
ここ一年で報道もチラホラあったけど現実にはどこまで来てるのか
今のスパコンはともかく、そのスパコンを圧倒する能力の量子コンピューターの実用化が気になる
日本は研究の最先端いってるのかな?
ベンチマーク結果 = 国費投入の言い訳
就役中に成果を上げる稼働をさせて
元を取らないと無意味 日本が竹やりで闘っていた頃
米国は高射砲も届かない高空から爆弾を落としていた
米国はすでに量子コンに軸足を移しているのでは 正直、普通のコンピュータなんだけど
すげ〜速いって感じ? いっぱいつないですごく早いって言われても誰もすごいなんて言わないだろ 巡回セールスマンとか巨大素数とかどんなにスパコンの性能あがっても無理なんだから >>29
LinpackはどうでもいいけどGraph500のトップをどれだけ維持できるかは楽しみ ド素人的には単体が遅くても並列にたくさん繋いで分担処理すればいいだけなんじゃね?って思ってたけど、違うよね? >>39
処理を綺麗に分散させるのは大変
分散させるとトラフィクスが激しいから大変
故障率1%とかだと全CPUの1500個も壊れるから大変
って言うか普段からしょっちゅう壊れるので、ちょっと壊れたくらいでシステムダウンしない工夫が大変
京の辺りからこれ以上電力は増やせないのが分かったんで、省エネが大変 スパコンは日米中の3か国が覇権を争ってるのが現状だな。
1位になれば世界中で報道されるが2位以下は無視。やっぱり1位になることが必要だ。 そろそろスーパーの棚(こちらは電子的なタグなし)を見て足りない商品を補填する(今日はこれが早く
売れそうとかも含め)AI搭載ロボットが出来そうだな >>31
サッカーの試合結果見て、「ラグビーはどうなのかな?」って言ってるレベルだぞ? ノイマン式研究するリソース勿体無くね?
次世代・次々世代式はもう諦めてんのか?
そっちに100%注ぎ込むくらいでいいと思うんだが >>14
>>27
この話聞くとどうしても「日本が誇るモノとして富士山=富嶽の名を使った」じゃダメなんだろうかって思った 富嶽と聞くと第二次世界大戦の日本軍の幻の六発大型爆撃機の方を思いだす
飛行機からスパコンになったが日本人として誇らしい事だな 結局、京は45nmプロセスのCPUで今年の解体までgraph500の首位を9年連続で確保したんだな。
PCでいったらCore2Duoの最後の世代だから、よくそんなので性能確保できたなと思うわw
>>44
現状の中華はないわw
ベンチマーク回すのも四苦八苦の故障率では性能以前の話。
富岳は未完成でも実用できる信頼性だよ。
アメリカのサミットもあり物のGPU流用で性能確保で、クレイは富岳のチップ使うらしい。
普通に評価したら今は日本が抜けてると思う。 結局、これ使って満員電車内のコロナウイルスの流れを出すだけでしょ 京の性能では無理だった計算ってどんなのがあるんだろう? >>51
A64FXにGPU搭載したらどこまで性能向上するのだろうな >>52
違うよw
>>53
原理的には時間をかければどんな処理も可能だが、
京で1年かかる計算が富岳では4日以内でできる。 もう2020年になるのに「今日○時○分から雨が降って○時○分に止みます」っていう予報が
まだできないんだよな
20世紀の頃は、2020年頃はもうそういう世の中になってると思ってたわ 富士通はA64FXベースのサーバ向けCPU設計してMicrosoftやGoogle向けにライセンスを売ればいい >>61 それ。
日本って逆境じゃないと奮起しねーから。 しかし計算速度は断トツ世界一なのに、国家のIT化は先進国一遅れているってのも
いかにも日本らしい話。 Green500だと9位か。試作機よりだいぶ落ちてるな。 バカチョン、悔しいのうWWWWW 悔しいのうWWWWW シネヤキチガイ OSはRed Hatで京は詳細不明なLinux。OSの問題もあったんだろうな。 >>65
コンピュータ内部完結なら世界トップクラス
コンピュータとセンサおよびアクチュエータ接続なら1.5流
コンピュータ複数のネットワーク構築では2流
インターネットを利用したサービスの提供では3流以下
OSI参照モデルで日本の得手不得手を記述できるかと思ったがちょっと違うな
CPUもGPUもアメリカに握られてるからなあ
内部なら何でも強いわけでもない >>73
・・・に入る文字は、、、
わかったぞ!・・・に入るのは「っぷだ」
「とっぷだ富岳」
正解かな? LINPACKでさえ80%の効率、HPCGではわずか3%、
そりゃフルノードなんか想定してませんって言われるわけだわな。
1位を取りたいがためのスペックでしたw >>70
センサー類や駆動系を含むメカトロ分野では日本は世界一だよ。
産業用ロボットや小惑星探査機のC/Pを見ればわかる。
ネットワークでも広域なら光ファイバー普及率と利用技術でおそらく世界一。
チップ間通信では、富岳の性能の根源で、並ぶものがない程高性能だ。
HPCの技術は未来のPCの先行技術だ。
微細化の先はもう見えている(5nmで打ち止めとも言われている)ので、
革新的な技術が実用化されない限り、富士通のインターコネクト技術は大きなアドバンテージだ。
アメリカの会社と組まざるをえないから、旨味は少ないだろうがw
憲法改正し潜水艦搭載の報復核が持てればその限りではないが、のぞみ薄だな。 中国や北朝鮮関連の大学が日本の大学に共同で核分裂と核融合の模擬実験に富岳を使用しても
日本の大学は何も言えないのじゃないの。
日本の大学は、日本の核分裂の模擬実験には反対できるはからね。
日本の富岳が外国の軍事技術開発に利用されるんだろうな。
日本の大学は売国しかいないようだ。 >>75
Graph500では京が9年間トップ守ったらしいぞ
ベンチマークのためのスーパーコンピューターってのは中国のやつを指す言葉
何とかして貶めたいんだろけど、己の恥をさらしてるだけだぞ >>79
思い込みは寝言でいっとけw
LINPACKですら80%、HPCGですら3%の効率、これは客観的事実。
京は90%に6%、着実に落としてますなw そりゃメモリ量増やさないはずだわ。
フルノードジョブなんか効率悪すぎてやらせませんwwww >>79
わざわざ自己批判ご苦労様です
全ノード納入が5/13と納入直後で最適化が進んでない状態かつ京からノード数も増えててその成績なら一般的には十分な数字です >十分な数字です
これこそ、なんの証拠もなく思い込み炸裂のバカ発言そのものwww >>1
>今回から加わったAI(人工知能)関連処理の性能を測る「HPL-AI」
TOP500、HPCG、Graph500、HPL-AIで史上初の同時4冠!!
なおHPL-AIは今回が初めてですwww
あんまり姑息なことするなよ、その他の成果すら汚すことになるぞw >>2
スレ立て待ってたのか?
嫌がらせ民族の南朝鮮人よ >>40
へえー、
そういうもんなんだな。
素人なりになんとなくわかったわ。
総合的なバランスが大切なんだね。 >>70
>インターネットを利用したサービスの提供では3流以下
何故かこれだけはみんな否定しない 富士通がスパコン受注 JAXAから、61億円 2020年4月22日 12:06
https://www.kyoto-np.co.jp/articles/-/227421
>19.4P(ペタ)FLOPSの倍精度(64bit)演算性能を持つ見込み。2020年10月に稼働を始める予定。
TOP500JUNE2020で世界14位相当が61億円か。
これは売れるね。 >>80
規模が拡大すれば理論値と実行性能の乖離が拡大するのは当たり前。
Top10で富岳以上に理論値と実行性能の差が少ないHPCはない。
これも客観的事実だがw D-Waveの量子コンピュータ2000Qが17億円らしいから、どっちを取るかだな。 明日の作業は共有メモリを参照しないダミークラスから画面を起動できるようにして、
ブートプロセスを踏まなくても簡単な画面の確認ができる仕組みを作る しかも富岳は完成前、これからチューニングが進む。
京が9年連続で前回までGraph500でトップになったのもチューニングや改良があったからだ。 >>90
だからその差がおまえのいう最適化の時間がまだないからで十分許容範囲と言える証拠を出してみろよww おまえの主観丸出しの意見そのものだwww
客観的事実:LINPACKですら80%、実アプリに近いHPCGではわずか3%
そりゃ、フルスペックジョブなんか強行に拒否するわなw
HPCの世界では実効性能を実行性能とも書くんだよw おまえの無知がよくわかるw スゲー、それも単なる一位ではない
圧倒的な一位ではないか >>9
6発でアメリカ本土爆撃できる
予定が時間切れ じゃじゃじゃじゃじゃあああああああああああああああああwwwwwwwww 名古屋大学のスパコン「不老」の予算額はいったいいくらなんだろうか?
調べても出てこない。 >>101
入札だから適切に情報公開請求すればでてくる アホな蓮舫wwwwwwwwwwwwwwwwww
くそざまぁwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww よそのスパコンはすべての用途目的ではないからww
日本は計算機屋が一位を取りたいがために、すべての予算をがめてるわけ。
世界一になっても、効率が低ければ割り当て資源が小さいので大きな計算はできなくなるわな。実際日本のプロジェクト当たり割り当て資源量はかなり小さい。
帯に短し、たすきに長しってね。
3%の効率で踏んぞりかえられてもねw なになに、チョンが悔しがって富岳を貶めようと必死になってんの? 理研グループ(りけんグループ)は戦前の理研コンツェルンの流れを汲む企業グループ。
https://ja.wikipedia.org/wiki/%E7%90%86%E7%A0%94%E3%82%B0%E3%83%AB%E3%83%BC%E3%83%97
理研コンツェルン(「理研産業団」とも呼ばれる)は渋沢栄一が設立した財団法人(のちに特殊法人化→独立行政法人
→国立研究開発法人移行で現在に至る)理化学研究所の研究成果を企業化して生まれた
関連会社群からなる新興財閥だったが、
GHQから十五大財閥指定を受け、財閥解体により持株会社だった理化学興業
(1941年に理研工業へ改組改称)は11社へ解体(新理研工業、理研鋼材、理研精機、理化学興業、
理研製鋼、大阪理研工業、新潟工業、理研前橋ピストンリング工業、大研工業、
理研柏崎ピストンリング工業、理研熊谷鋳鉄)。
その後に理研光学(現在のリコー)の市村清が結成した三愛会(現在は「リコー三愛グループ」と称している)は、
理研コンツェルンの流れを汲む一部の企業によって構成されている。
増えるわかめちゃんやノンオイル青じそドレッシングの理研ビタミン株式会社は
今は縁がないのか
元はもちろん研究成果を工業化するための理研栄養薬品株式会社
元々は鈴木梅太郎も理化学研究所だったが
オリザニンすなわちビタミンB1を誘導体のアリチアミン、更にプロスルチアミンにして
それにアリナミンの商品名をつけたのが武田薬品工業
でも、これは江戸時代後期から続く所だから理研とは関係がない >>106 ( ID:GyfSkaGO )
なるほど、そう言うカラクリがあったんだな?
出来レースで科学技術予算を独り占めしては、虚像の結果と仕組まれた手柄を作り出し、また次の予算に唾を付ける・・・これ、昔から理研の常套手段じゃん? >>106
今回の富嶽は松岡聡先生が「すげー使いやすいの作るぞーっ」て作って
おまけに世界一にもなるとかよくわからん代物だけどな 「富岳を借りてインベーダーゲームを作って遊んでみた」っての誰かよろ >>39
コロナの分析ではそれでスーパーコンピュータを遥かに越えるスペックで分析を進めたよ
アメリカは >>96
その性能で一位なんだよw
悔しかったらそれ以上の割合で実行できるHPCを上げてみろよw
このクラスでは理論値に対する実効性能でもダントツなんだよw
その上電力効率でも一位なんだよw
前作の京なんて、core2duoと同じ世代のCPUで去年の前回大会まで実アプリに一番近いGraph500で9年連続トップなんだよw
富岳はそれの100倍の性能なんだよw >>114
それって、並列計算し易い計算アルゴリズムだから? >>116
プログラムはスーパーコンピュータ向けと同じものを使用
単純に性能が桁違い
サミットの10^60倍だったかな 2位との差が開いてるな、まだフル構成でも無いって話だが
しかしこれでもまだ製薬や医学では性能が足りないのか この手の手合は具体的にどのスパコンがお勧めで
どのあたりが比較すると優れてるのという質問からは逃げる 2020/03/20
【電算】富士通の新スパコン、世界最高レベルの気象予測精度達成に向けて稼動開始[03/10]
https://egg.5ch.net/test/read.cgi/scienceplus/1583785517/51,73,76
4/9
【研究】新型コロナウイルス治療薬開発などに利用 スパコン「富岳」前倒しで運用開始
https:
//egg.5ch.net/test/read.cgi/scienceplus/1586408198/
6/17
【IT】理研、スパコン「富岳」を公開 新型コロナ研究で試験稼働 [しじみ★]
https://egg.5ch.net/test/read.cgi/scienceplus/1592342434/ >>115
日本の伝統としてNECも富士通もbytes/flopsを重要視するけど、逆に欧米はflops最重視の印象があるな 用途毎に特化したシステムを専用に建設するのが良いか、
それとも用途に特化せずにどれもほどほどにして資源をひとつに
かためて運用設置することで、世間的にはTOPなんチャラの
記録の上位にのぼることを目指すのか。そういったことがあると思う。
分野に応じた計算機システムの研究開発を促進するとか、
分野ごとの計算機利用をする人たちが計算機のあり方について
考えるという面では前者が良いはず。後者だと、与えられたものを
使ってやるのだということになる。
どちらが良いかはなんとも言えないだろう。前者だと、よく考えて
作ってはみたが、期待したようにはうまくいかずに結果的には失敗
だったなどというリスクは高い。後者だと無難な路線で失敗をしな
いように確実性の高い技術の寄せ集めで作れるだろうから。 これ何て読むの?「フガク」昔無学「ムガク」の人が「2番じゃダメなの」と言っていたの思い出したよ。 >>96
>>82 は俺で >>90 は別の人なんだが
https://www.top500.org/lists/hpcg/06/
Rank TOP500 Rank System Cores Rmax (TFlop/s) HPCG (TFlop/s)
1 1 Supercomputer Fugaku Japan 7,299,072 415,530.0 13400.00
13400.00/415,530.0=0.0322
2 2 Summit United States 2,414,592 148,600.0 2925.75
2925.0/148600.00=0.0197
HPCGではLINPACKの数字のたった2%も出てないのが2位だな
3%は十分な数字なのが現実
しかもコア数が3倍近いのに効率は上ってのは常識から考えれば驚異的なこと
何が不満なのかね
日本にこんな高性能なシステムが存在すること自体許せないのだから仕方ないのだろうけど >>115
実アプリにちかいgraph500w
こいつがHPCとは無縁のバカというのがよくわかる グラフ探索はweb解析とかビッグデータとかで
使うやん どうせ能力フルにはまともに使えなくてタイムシェアリングとかノードシェリングで部分貸しするんだろ
最速の意味ないよ
安いスパコンをたくさん作って貸し出したほうがまし 富岳だけ速くても国別の計算力じゃアメリカとの差がデカすぎる
富岳100台ぐらい作れば良いのに >>135
台数は少ないけど国別計算能力合計だとTOP500の23.7%だから、実はかなり頑張ってる >担当者の頭を悩ませているのが、駅名を変更した場合の経費だ。
>看板の書き換え費用に加え、全国に影響が及ぶ交通系ICカードのシステム改修費や、
>ポートライナーと連絡する鉄道各社の路線図の更新費なども必要となり、
>少なくとも5千万円の経費が見込まれるという。
>コロナ禍で経営に打撃を受ける神戸新交通にとって小さい額ではない。
こうなることは最初からわかっていたはずだから自己責任だろ。
「理研計算機センター前」とか「理研計算科学センター前」に
しておけばよかっただけ。もっともセンターが廃止や移転になれば
同じような問題は生じるけれども。「学芸大学」、「都立大学」
なども同じように虚偽記載の問題はあるけれど、ずっと放置されてる。 日本より経済規模の大きいアメリカ中国でも
開発コストに2-3百億円くらいしかかけないって事は
金を出せないんじゃなくてそれ以上に金を出す価値がないから出してないって事だろ?
日本だけ1300億円てどうなん? IBMのスパコンを民間が買えば
5000億円くらいするセットを
米政府機関には200億円くらいで納入してたな。
ディスカウントがひどすぎて
IBMがお断りしたケースもある。 蓮舫の寿命を計算してほしい。
・政治生命
・実生活 >>97
でも数年以内には抜かれるよ。アメリカも作ってるし。 >>149
富岳はまだ設置スペースの4割ほど。
増設やノード更新で、追い抜かれても何回かは首位に返り咲けるだろ。 日本の財政事情が破綻に近くなればどうなるかわからん。
オリンピックのようなバブル景気をわざと演出するような
ことをして、景気に変動を与えれば、景気の波の高低差が酷くなり、
低いときには大勢の貧乏人が困窮するだけ。利益を得た人たちは
景気が悪くなりそうとみたら、資産を海外に移したり投資して
逃がすから、良いことはない。 来年から
El Capitan
Frontier
Aurora
天河3号
に1位争いを持っていかれるんだろうな。
しかしEl Capitanってネーミングはミスだな。
OSの名前ですでにあるので検索にヒットしにくい。 >>153
京は、世界一になることだけを目標にしたせいで、いろいろガラパゴス化して売れなかったのが大失敗だからな
今回はその反省で計算速度桁違いなのに電気代が京の3倍程度とか、システムがわかりやすかったりとか、あくまで商品としてコスパが良いそうなので
実は世界一になるのは売り文句としてはベターではあるが、最終目的ではなかったりする そういえば、クレイが富岳のCPUを採用したスパコンを開発し、米ロスアラモス国立研究所、米オークリッジ国立研究所、
米ストーニーブルック大学、英ブリストル大学などへ導入予定があるらしいな 京はもともと、世界一を目指す富士通のスカラ部分と
科学技術的な成果を目指すNECのベクトル部分の
複合計画だったからな。
むしろ、ベクトルだけで良かったくらい。
スカラだけになって利用価値が1/3くらいになった。
スカラはどこにでもあったからな。 アホなID:SBxvYI+Qが色々書いてるな
>>51
> graph500の首位を9年連続で確保
「9年連続」ではなく「9期連続」が正しい
年に2回ランキングが発表されるので「9年」は違う
数字もマトモに扱えないバカ
>>79
> Graph500では京が9年間トップ守ったらしいぞ
> ベンチマークのためのスーパーコンピューターってのは中国のやつを指す言葉
ここでもバカな発言
中国製スパコンがベンチマーク番長の傾向があるのは認めるが
京もGRAPH500で結果が出るようにチューニングしてあった
つまりベンチマーク用のチューニング
そんな事も知らないマヌケ
それにGRAPH500は「500」と言いながら参加しているマシンは300台程度
以前はもっと少なかった
第1回のランキングでは8台しか参加していなかった
最新版は確認していないが、以前はノートPCやタブレット端末まで参加しているランキング
IntelやAMDのCPUを載せたスパコンは参加していない場合が多い
わざわざチューニングしてまで参加する意味がないと考えている
他の強力なライバルが参加していないランキングで取った1位を自慢するのは
逆に日本を貶める行為に等しい
1位を取れないよりは勿論マシだが >>161
はよお前のお勧めスパコンとその特徴教えてくれ 8年待って、急に100倍の性能に変わるというのじゃなくて、毎年平均でシステムの
トータル性能が2倍ずつ良くなり続けるシステムというようなものは作れないものだろうか?
たとえば、全体が3つの区画からできているとして、それぞれの性能が最初は
システムAが1、システムBが2、システムCが4であるとする。
Aは2年前のもので、Bは1年前のもので、Cは今入れたばかりのものとする。
さて、今の時点ではA+B+C=7がトータル性能である。
翌年になってその時点で3年前のシステムAをリプレースするとして
3年たっているので性能が2の3乗で8倍良くなったとしてみる。
つまりA=8、B=2、C=4である、するとA+B+C=14となり、
トータル性能は前年の2倍になっている。
さらにまた1年がたってその時点で既に3年前のものとなったシステムBを
性能2からその8倍である16のものに取り替える。するとA+B+C=8+16+4=28と
なり、トータル性能28でさらに前年の2倍になっている。
さらにまた1年が経ってその時点で既に3年前のものとなったシステムCを性能4から
性能32にとりかえると、A+B+C=8+16+32=56となり,トータル性能56は
前年の2倍になっている。
これでA:B:C=1:2:4に戻ったのであとはこの繰り返しでやる。
この方式だとどの区分も3年間ずつで入れ替わるので、ソフトウェアやアプリの
開発サイクルが早くないと、その3年間のうちの最初の半年とか1年とか2年を
無駄にしてしまうかもしれない。 毎年2倍だと8年で100倍じゃなく1000倍にならないか? 競争相手が居る話なのに、まったく極楽トンボで悠長な話やな ムーア則も終わっててそんなにCPU性能伸びてないからな
NTTのチップに直接光接続みたいな革新でもう一発伸びて打ち止めじゃね >>161
訂正ありがとう、年2回なんだなw
ということは2015年から9期連続で、
この時点で既に京は完成から3年後。
製造プロセスはCore2duoと同じ45nmでPCでもほぼ廃棄済、
で、去年の運用中止まで5年間トップを維持w。
負けたのは後継機の富岳かw
貶す奴は何考えて生きてるんだろうなw 日本の技術を貶すなら、
計画通りの運用中止まで主な指標の一つでもトップを維持した他国のスパコンを挙げてからにしてくれw >>161
理論性能値を競うTop500よりGraph500は遥かに意味がある。
今は省エネのGreen500とAI性能のHPL-AIが重要視されているが、ビッグデータ性能のGraph500も重要だ。
極言すれば理論性能値なんてGPU買ってきて並べればいいだけだ。
故障率は劇的に上がり実用困難な中華スパコンみたいになるがw
まあ、富岳はTop500でもGreen500でもHPL-AIでも一位を取っているけどね。
Green500は今回は4位だったがw graph500は素人が参加してもスケールしないから悲惨なことに スケールしないからシングルノード参加が多いという
罠 >>24
もうやってるよ
コロナウイルスを効率よくぶっ殺すことばかり富岳は考えている で、技術素養はあるけどなんで日本はビジネスダメなの? で、FFTの性能は? ご自慢のtofu2なんだろww 主要産業の生産拠点を海外に移転したからだよ。
アメリカの核の庇護を源泉にした圧力や、他国の企業経営者や上級公務員、政治家に対する籠絡でねw
トヨタ一社の2015年以降の北米生産台数は200万台程度で、単価200万円としても4兆円。
その分のGDPは目減りして当然。
無論、他社分も他業種分も他地域分もある。
ちなみに、韓国では自国企業と認定した会社の他国工場での生産額も自国のGDPに算入しているw
日本の保険医療費支出はGDPの10%にも達しているが、アメリカ並に医療費が高騰し、
アメリカ並に訴訟大国になればGDPは瀑上げだw
単純にGDPを他国と比較しても無意味ということだ。 >>182
理論性能値に特化したスパコンじゃないので何にでも使えるよ。
ビッグデータ解析とか、空力の仮想風洞とか、
AI用途とかねw >>183
tofuはインターコネクトチップだよw
総合性能の評価はダントツで世界一。
FFTだけに注目しても無意味だよw 計算速度がピンとこなくて
ヘェ〜早いんだね
くらいに思ってたけど
全人類が不眠不休で1秒に1回電卓叩いて
2年かかる計算を"1秒"で完了できる
って聞いてしょんべんちびりかけたわ まあそれだけ計算速度は早いだろうなあw
そしてそれを利用するものも多数あるね >>187
また無知さらしてるの? FFTはインタコネクトの性能そのものだろw 他国はスーパーコンピューターに見切りつけて
量子コンピューターの開発してるだけでは? >>171
平たく言えば設計から8年も経ったロートルスパコンに「負けた」Sequoiaや神威・太湖之光はポンコツと>>161は言いたいんだろう >>193
量子コンピュータはノイマン式をリプレイスする物にはならないよ。 >>194
だからよそは、すべての分野でなんて主張してないってw
日本は計算機屋が予算をガメるために、すべての分野で使えるとほざいて、
コストパフォーマンス最悪になり、割り当て資源が大幅に劣る状況 あまりこういうスレ立てない方がいいと思う。
チョンパヨが発狂するから・・
気配りも必要だ。 >>192
中間でAll to Allを一回やるだけだけど、だから性能出るだろうに、お前はどこに突っ込んでるつもりなんだ? >>198
wwww おまえ実際スパコンまともに使ったことないだろw
数万ノードでのFFTが1回のall-to-all でできます!!
知りもしないことを偉そうにほざかないことだなw >>30
生活に密着してるかは知らんが
今は、機械類の設計時の数値解析に
スパコン用いたりしてる 気象計算ねw 京の商用版:FXを使ってた気象研が、
富岳導入にあわせて、FXからXeonに変えたのには大笑いさせてもらいましたwww >>201
って言うか、無理に生活に密着させる必要なんかないだろう。
だって米中のスパコン需要は、主に核実験と兵器開発じゃん。
人殺しのカネをジャブジャブ突っ込んで「格安」に見えるのが米中スパコンの実態。 >>199
お前、FFTも知らずに、FFTって言ってたのか >>205
まだ恥の上塗り続けるつもりか? どうやって数万ノードのFFTを1回のall-to-allでやるのかいってみな >>196
そんな誰も興味がない話題なんかつまらないよ。
>日本は計算機屋が予算をガメるために、
だったら、お前さんがソフト主導のスパコン開発をする為に、1000億円程度のグラントを取れば解決するよ。
すぐやってよ。みんながよろしくから。 前から思ったけど、京のCPU単体での性能(FLPOPS値)は、市販品で言うとCore-i7の3700だか
あの辺りと同じ程度だが、これCPU単体同士で京のSparc64[FXとCore-i7/3700
をベンチマークしても科学技術系のベンチマークだと京が勝つんでは?
というのも、市販品のCPUの命令セットの強化がCGレンダリングや動画エンコなどの
マルチメディア重点なのに対して、京のようなスパコン用CPUの命令セット強化
は技術向けの計算を重点に置いてるから、同じFLOPS値でも違うと思われ 誤 みんながよろしくから
正 みんながよろこぶから >>207
科学版でそんなこと言って反論したつもりかよwww
いや、無知なくせに偉そうなことをほざき、さらに自分の無知がばれるw
わかりやすいわww よくYOTUBEで見るCPUのベンチマークを見るんだけど
富岳で見せてほしいなぁ 富岳の肝は光インターコネクトだと思う。
これは京ができたときから一応完成形ができていたけど京には搭載されなかった。
スパコンにおいては各装置間の伝達速度がボトルネックになっている。
各国はそれで手こずってる最中だからね。
それと命令形をARMにしてコード密度を上げる事で低消費電力化を達成している。 >>212
搭載されなかったって、一応京から使ってる六次元(笑)トーラスだろ、他のLINPACK専用機よりはマ
シってだけで、しょぼい技術じゃん >>210
ああ、キミには無理だから泣き寝入りしてるんだ。
一生泣き言をわめくだけの人生も楽しいかもね?
負け犬人生が楽しかったら、また、教えてね☆ >>211
PCmarkや3Dmark Cineベンチ、
PCゲーム系の付属ベンチとか
あのあたりか、 AIMP 4K OPUS - PIONEER RT909 - Test Album 美風感 Vocal after Trance DJ Sound with Open Reel Deck
://youtube.com/embed/O7GocbtQfmY?list=UUAD_OjfQmia0EbUwjwRSI5g 数万ノードでのFFTを1回のall-to-allでやる方法はまだ?www
ほんとバカってみじめだよなww スパコン使ったことはないなあ
PCにGPUが入ってるだけでドヤ顔したくなるレベルw
で、FFTは自分で定義式を見てヒイヒイとバタフライ演算をまねてどうにか動くようにしたり
あるいは画像をFFTで変換して一部を改変してから逆FFTしたり
なおその時はPythonだったのだがnumpy型で0+0jってやらなかったせいで
まともに戻らなかったりしたもんだ
scipyだとこれが大丈夫だったかな 流石に今のスパコンの性能が、15年後にノートパソコンやタブレット以下の性能って事にはならないかなw
昔の1Mメモリだったかの写真で軽自動車サイズのコンピュータみたいのあったよな >>220
GPU使ったので機能限定的な
物なら、15年ぐらいで追い越せるかも 【再】国立天文台講演会 「アテルイと挑む未知の宇宙〜スーパーコンピュータが描き出す宇宙の姿〜」
://youtube.com/embed/pIpI5DB6lXk?list=UUe3kXTl3OjqchQseJe3qmvg 宇宙と言えば、昔「重力多体問題]を解析する専用チップを搭載した
スパコンがあったな 「富岳」がスパコン世界ランキングで1位に、世界初の同時4冠達成 ://xtech.nikkei.com/atcl/nxt/news/18/08178/
理化学研究所と富士通が共同開発したスーパーコンピューター「富岳(ふがく)」が2020年6月22日(ヨーロッパ夏時間)、
スーパーコンピューターの性能を競う世界ランキング「TOP500」で1位を獲得した。富岳のシステムは396きょう体(15万2064ノード)の構成で、
LINPACK性能は415.53ペタ(ペタは1000兆)フロップス(1秒当たりの浮動小数点演算回数)、実行効率は80.87%だった。
同ランキング2位は米IBMなどが開発した「Summit(サミット)」で、LINPACK性能は148.6ペタフロップスだった。富岳は2位と約2.8倍の性能差をつけた。
://cdn-xtech.nikkei.com/atcl/nxt/news/18/08178/topm.jpg ://pc.watch.impress.co.jp/img/pcw/docs/1260/899/01_o.jpg ://i.imgur.com/iikgMzB.jpg >>223 来たーーーーー!
一度でいいから見てみたい、マキノが売れるスパコンつくるとこ
この人だよね!
>>220
シングルチップのCPUで比較したら分からんよ。
数を並べて並列に処理するからFLOPS値が高くなるだけで。
1チップ視界意を持たない再帰計算なんて今だってサーバー最上位と同レベル。
×1チップ視界意を持たない再帰計算なんて今だってサーバー最上位と同レベル。
○1チップしか意味を持たない再帰計算なんて今だってサーバー最上位と同レベル。
>>226
シングルCPUでの比較なら今のスパコンは
そこまで市販品より上の性能じゃない
Crayのような昔のベクトル機は
別だろうけど
>>228
>>220は15年後のノートやタブレットって言ってるからねえ。
15年も経てば上回る可能性はかなり高い。
ただ、日本製CPUは商用を捨てて採算無視でベクトル積んでるから結構長持ちするかも。
>>218
>数万ノードでのFFTを1回のall-to-allでやる方法はまだ?www
まだ言ってるのか、じゃ、うざいからとどめさしとくか、こんなん常識なんだが、
www.na.scitec.kobe-u.ac.jp/~yamamoto/lectures/parallelFFT/parallelFFT1.PDF
の39ページの図の真ん中の「ひねり係数+転置」の転置のことで、その図の「プロセッサ
分割の境界」みたら明らかなように、後は全部ローカルな処理だ >>223
>宇宙と言えば、昔「重力多体問題]を解析する専用チップを搭載した
>スパコンがあったな
あれは酷かったな、とっくにもっといい方法が出てるのに、無理やり並列化だもんな >>231
恥の上塗り、また来ましたw
その方法で、数万ノードで動かすとして、格子数いくつよww
ほらまたバカが恥の上塗り重ねますよwww >>233
格子数wwww
差分法ならともかく、何でその言葉がFFTで出てくるんだよwwwwwwwwwwwwwwwwww 一方 国民一人当たりの年収は・・・
先進8カ国では最下位 (´;ω;`)ウゥゥ >>30
計算負荷の高い分子の動きの計算やな、宇宙開発や半導体や医療創薬に使える >>174
> 理論性能値を競うTop500よりGraph500は遥かに意味がある。
そこまで重要視する意味ねーよw
前にも誰かが書いていたが
GRAPH500と言いながら今回のランキングに参加しているのは226台w
iPadやノートPCまでエントリー出来るようなランキングw
わざわざチューニングしてまで参加する意味を見いだしていないスパコンも多いんだよ
そういうランキングのカラクリに騙されるバカwww >>240
iPad や ノートPC ぐらいの能力しかないスパコンが多いからだろ。無様な成績晒すことになるからエントリー出来ない。 富岳でyumじゃなかったdnfりたいなあ
どんふどんふ >>31
> スパコンを圧倒する能力の量子コンピューター
スパコンと量子コンピューターは用途違うしすべてを置き換えられるわけじゃないよ 中国のスパコンが天安門とか名付けてきたら、もう怖いもの無しの証。 NHK特集見たけど飛沫の分散計算で使われてたな。使う奴がバカだとせっかくのスパコンも宝の持ち腐れだとよくわかった番組だった 見る奴がバカだとせっかくの番組も宝の持ち腐れだとよくわかるレス乙w 富岳の演算パワーを100%使うプログラム書いてコンソールから実行のエンターキー押したら俺、失禁するかもしれん。 >>241
そういうのって、古いUNIX系のサーバ
をスパコン扱いでエントリーさせてるだけでは? >>204
>兵器開発だと、装甲の応力解析や
軍用機や艦艇の流体解析。爆発時の
エネルギーの拡散解析
ここらへんか、でもこの辺りの解析だと
わざわざトップクラスを持ち出さずとも、
もっと下のスパコンでもやれる >>247
この手のスパコンや大型サーバは
ユーザーが使えるハードウェアリソースを
シスオペが制限してるから、 >>246
あーいう番組って、スパコンがなんのか
わからない人のためにあるからねえ Crayの時代のベクトル型スパコンがCPU単体でも市販PCよりずっと
上だったのは、普通のCPUがスーパースカラやパイプライン、アウトofオーダーと
言った、今では当たり前の高速化技術が採用されてなかった(それらを実装
できるだけの製造プロセスもなかった)からってのもあるな シングルコアの昔のスパコンと万単位のCPUを封タべる今のスパャRンを同列で語b轤黷トも。 GPGPUを使えばこんなの簡単に追い越せる
「不学」と言うべきだな、理研は >>254
GPU使ったやつはプログラミング上での
柔軟性がCPUより劣る
単に速いってだけじゃなく、扱いやすさ
も考慮しての設計だから AppleがArmベースのSoCをMacに採用する背景
https://pc.watch.impress.co.jp/docs/column/kaigai/1261696.html
AppleのOSが直に、あるいはエミュレーションで動きそうですか? 1位にこだわらないスパコンとして生まれて1位を獲った「富岳」。
日本の技術者たちが開発で目指したものとは
https://pc.watch.impress.co.jp/docs/column/gyokai/1261786.html
すごく長い記事。まるでちょ >>186
なんにでも使えるって結局使い道が決まってないってことだろ
使い道が決まってないのに大金かけて作るのは無駄以外の何物でもない >>235
そのどこにも格子数なんて出てこないけど、FFTについて何も知らないだけじゃなく、英語も読めないのか >>54
すげー
スパコンの性能競争の水準を数世代一気に進めた感じだね。 メニーコアスパコンなんでGPUスパコンよりは応用範囲が広そう スーパーコンピュータには、スマートフォンのCPUを搭載しているからな
大幅な性能アップはスマートフォンの性能が上がったおかげ >>266-267
何にも知らないんだな
ARMの命令セットを拡張して採用しただけだぞ 本当みたいだな、AndroidスマホのCPU使ってるのか
やはり富士通にCPU作る力はもうないのか スマホのような「使い勝手のよさ」を目指してスマホのCPUが使われたらしいな 基本アーキテクチャは、以前のSPARCと
変わらないらしい。
ユーザーを増やすために
命令セットデコードをメジャーなものに
したくて、最初はx86を検討したけど
ライセンス上難しかったので
ARMにしたそうな。 SPARCのISAが酷くてx86のように内部命令に変換しないとそのままでは使い物にならなかったのが幸いしたな。 >>75
June 2020 HPCG(1Pflopsで足切、2%で足切)
Pflops HPCG/Peak
415.53 2.6% 富岳
6.618 3.0% 名大 FX1000
5.952 2.5% Pleiades/NASA SGI Xeon
5.283 2.4% Pangea SGI Xeon
3.157 3.2% SORA-MA/JAXA FX100
1.758 4.1% Astra ARM
2.910 2.7% ITC Nagoya FX100
2.897 2.6% SuperMUC iDataPlex Xeon
1.643 3.2% ARCHER Cray XC30 Xeon
1.655 3.1% Edison Cray XC30 Xeon
2.376 2.8% PlasmaSimulator FX100
1.283 4.2% Max-Planck iDataPlex Xeon
1.043 5.0% Oakleaf-FX/東大 FX10
1.359 3.1% Curie thin nodes Bullx Xeon
1.237 2.8% Helios Bullx Xeon
1.145 2.0% Mare Nostrum P9 CTE AC922 POWER9
番外
0.487 11.0% 地球シミュレーター SX-ACE
0.112 5.1% Vulcan(vector part) SX-Aurora スパコンの時代は終わったこれからはAIだby玉川徹 >>252
昔は論理回路の素子が違ってた。
今は家電組込もスマートフォンもスーパーコンピューターもCMOS logic かつて東芝は世界初のCMOSによる12ビットマイコンを作っていた。
消費電力が少ないので、組み込み機器に使うのに適していた。
そのころはインテルが8ビットマイコン8080,モトローラはMC6800
などであった。12ビットなのは、4ビットで十進1桁ずつとして3桁分
を格納することができたから。東芝の中型大型の計算機TOSBACは
48ビットの計算機だったからかも。
でも、結局ソフト開発の日米の能力差や情報技術の普及が
いまいちだった日本は、それを生かしてパソコンを作ったり
だれでも使えるOSなどを開発できていない。 これって何が効くの?
でかくすればいいの?
クロックを上げればいいの? 中国政府の検閲システム、『グレートファイヤーウォール』は富士通製。 昔のMIPS単位で言ったら何MIPSなの?(´・ω・`) 韓日で共同研究するにだ!
お互いに高めあうにだ!
ワザとコード踏んづけて断線させたりしないからやるにだ! >>277
何も知らん奴が出鱈目書くな
TLCS12Aは、自動車制御用には12ビットの精度が必要ってことで、それに特化したCPU、10進3桁と
か関係ねーよ
当時から日本の各社は独自のCPUをいろいろ出してたが、これからは全社トロンのCPUだとか言われ
て、技術の蓄積は全部失われた、で、できたのがあのどうしようもないCPUだったっていう
その後は日立がSHっていう、RISCでもなんでもないCPUを開発してRISCだと主張してたが、ろくな性
能は出なかった ここまで来ても富岳がダメダメ言う奴の
オススメスパコンが出てこない 世界一スパコン「富岳」を搬送したのは、海外からの配送がやたらと速いあの会社だった
https://pc.watch.impress.co.jp/docs/news/yajiuma/1262014.html
ラック1つが1.6トン、
こんなの自分の木造2階の8帖の部屋に置いたら床が抜けるわ。 電力あたりの性能で世界一を競うコンペがあるのなら、
重さあたりの性能で世界一を競うコンペがあってもいいと思うの。
それなら、軽量のコンピュータを作る競争が進んで民生用にも有益じゃないかな? >>290
俺は全くもってなくてよいとおもう
マジで全くもって
ユースケース見て最適化しないことが最高ってことになるわけだからな
馬鹿以外は興味ない指標だろう ランキングやコンペがあってもなくても情報機器関連の
小型化、軽量化は激しい技術競争が行われている。 >>290
重さあたりより体積あたりの性能の方が民生用でも重要じゃね?補強に金かけられない程予算がない所はスパコンなんて使わんでしょ アメリカ並みにスパコンの台数が増えればな
専用で使えるのと時間貸しで順番待ちじゃ研究も差がつくだろ
安いスパコンを大学や企業にばらまいたほうがまし 実行を待つのも行列を待つのも、どっちも待ちだぞ。
小規模だと、混雑が分散しないから待ちの増減が大きくなるのが難点。 米連邦通信委、ファーウェイとZTEを安全保障上の脅威に指定、中共はスパイ企業ばっかり日本からの全部排除するべきシャープはすでにやつらの子分 神戸ゆかりのスパコン、またも世界一 1W当たり毎秒211億回計算
4冠「富岳」は9位
https://this.kiji.is/648482411999478881 Wが小さいのは、CPU以外のメモリや
インターコネクトに電力を
使っていないってことだからな。
実用性は低いだろうなあ。 名古屋大、富岳ベースで光学ディスクも使ったスパコン「不老」を運用開始
https://pc.watch.impress.co.jp/docs/news/1262737.html
「富岳」と同じCPU、スパコン「不老」運用開始 名大
https://www.nikkei.com/article/DGXMZO61027250R00C20A7CN8000/
富岳の100分の1の性能規模らしいが、多分利用価値は100分の1の何倍
にもなるはず。研究をするのもマシンを使うのもプログラムを書くのも
人間なんだから。 もう、スパコンのアーキテクチャは枯れていて
どこにどの程度リソースを振るかで
性能は決まってしまう。
しょぼいCPUやメモリ、インターコネクトに
でかいGPU積めばWあたりの計算能力は増えるが
メモリや通信が必要な仕事は
性能が出なくなる。
それは一番通信量が小さいリンパックベンチですら
京は、91%の効率だったが
中国勢は50%程度だったのは
メモリやインターコネクトの性能が足りなかったから。
もっと重い計算であればもっと性能は下がる。
HPCGベンチの効率は京で5%程度。
1%に達しないシステムもざらにある。 HPCGベンチで効率を100%に近づけようとすれば
京でさえメモリやインターコネクトを
20倍に強化しなくてはならない。
しかし、そうすればW数=電力も
コストも大幅に上がってしまうよね。
そういう意味で、リソースの割り振り具合で
性能はだいたい決まってしまうのだ >>303
>HPCGベンチで効率を100%に近づけようとすれば
>京でさえメモリやインターコネクトを
>20倍に強化しなくてはならない。
それが正解なんだけどな
>しかし、そうすればW数=電力も
>コストも大幅に上がってしまうよね。
インターコネクトの電力をどう下げるかに技術の粋を注ぎ込めばいいのに、あきらめて放置、データ
センターにも劣る惨状だからな
富岳はまだマシなほう すべてをハードだけで力任せに解決しようとするとコスト高になる。 "Universities and Tech Giants Back National Cloud Computing Project", New York Times, June 30, 2020.
https://www.nytimes.com/2020/06/30/technology/national-cloud-computing-project.html >>302
理研の人がワードやパワーポイントも動く言うてるからやろうと思えばできるんじゃね? MSのライセンス料金がCPUの個数分だったら笑えるな。
ワードやパワーポイントなど棄てて、みんなLibreOfficeにすればいいんだわ。 >>308
ワードやパワーポイント???
それ、単にブラウザアプリとしてじゃね? データは出力するとしてもCSVかあるいはSQL内だろう
pickleとかnpzとかかも知れんけど
このコンピュータ内では分かり易い形にはあまりしないかもな
(3D描画とかはするだろうけど) ARM版Windowsの存在を知らないのがいるんだな。 >>272
それは初耳。
元々Sparcの命令セットってx86より
効率が良いんじゃなかったか?
それだから、昔はSUNのSparc載せた
ワークステ−ションがエンジニア用途で
使用されてたわけだし >>313
SPARCは10〜100万トランジスタの32bitCPUを想定して作られている。RISCも遅延スロットもレジスタウィンドウもそこでは有効に機能している。
x86では同様のトランジスタ数では486が限界であり68Kなどは早々に脱落した。
1億以上のトランジスタが使える現在では可変長の外部命令を固定長の内部命令に変換してアウトオブオーダーのスーパースカラで実行するのが最適解になっており、RISC-Vなどもその前提で開発されている。SPARCの古い命令セットは足手まといにしかならない。ARMは64bit化に際して命令体系を一新し時代に即したものに生まれ変わった。ここがRISCで唯一ARMが生き残れている理由でもある。 >>313
今はどのアーキテクチャでも高性能を目指したコアは命令変換してる
実際ARM設計のARMでもCortex-A7xは変換してる
https://en.wikipedia.org/wiki/ARM_Cortex-A77
>a new 1.5K macro-OP (MOPs) cache >>308
多分、そういう一般ソフトは仮想マシン
経由で動かしてるかと >>314
でもARMが64bit化の際に命令を一新できたのhじゃ
はPCやWS用に使われてないから、ソフト資産を
気にしなくて良いという事情もあったかと
これがもしARMがPC/WSで一定数普及して
それ用のソフト資産があったら、簡単に
命令一新というわけには、いかなかったかと >>316
スーパーコンピューター向けのシステムだとグラフィック周りが実装されてないし、仮想化支援なんて余計なもの積んでるわけないので、
CPUのA64FXの評価の一環でやったことがある程度だと思うぞ >>315
アウトオブオーダーのスーパースカラをやる時点でレジスタ数とオペランド数が増えるので何らかの変換は不可避ということ。
ARMもだがリテラルを32bitに拡張する命令や演算で破壊されるレジスタを保存する命令を関連する演算命令とまとめてひとつの内部命令にデコードするのが合理的でありその前提で作られている。
なお富岳のARM-SVEも64bitをまとめてデコードすることが前提である。 インテルもIA64で命令セットを一新したが
全く採用が増えず、x86拡張の
AMDのEM64に変える羽目になった。
インテル自身がx86に負けた。 IA64は100〜1000万トランジスタが前提のVLIWで素性が悪すぎたからな。使えるトランジスタ数が増えて命令のデコードとスケジューリングと分岐予測に贅沢ができるようになってVLIWは存在意義を失った。 IA64はコンパイルがうんと遅かったな。
最適化を高くすると、とてつもなくコンパイルが鈍い。 >>312
>ARM版Windowsの存在を知らないのがいるんだな。
ARM版Windowsではx86用のオフィスは動かないわけだが。 >>322
そういや京のコンパイルは異常に遅かった、3万行ぐらいのコードのコンパイルに20分ぐらいかかってたわw
ところが富岳ではほんの1、2分で終わるようになって驚いている。
まあ性能出てないけどねw >>321
Itanium2から、アウトofオーダー
搭載してなかったか? >>273
6.618 3.0% 名大 FX1000
5.952 2.5% Pleiades/NASA SGI Xeon
これじゃ売れるわけないわな。 >>329
Flow 6rack(80x140x200cm) 2304socket 約400kW(推定)
Pleiades 158rack 22402socket 4407kW 京はFPのレジスタが沢山ついてたから、コンパイラでレジスタ最適化を
やったなら、いかにも遅くなりそうだ。
数時間程度のCPU時間ではコンパイルが終わらなかったりして。 コンパイルだけ他のコンピューターで事前にできないの? >>334
でも、今だとx86もAVXなどの拡張命令セットの
サポートで大量のレジスタが付くようになった
確かSandyVBridgeの時点でFPレジスタが
160本はあったはず 京のCPUのレジスタは元のSparc64の32本を科学技術計算の拡張命令セット
HPC-ACE用に256本まで増強 レジスタリネーミングで物理レジスタは3桁に増える。プログラムから見えるのは論理レジスタであり、特定のレジスタを使い回してもまったく問題ないし過大な本数も必要ないので32本に落ち着いている。
IntelがAVXに乗じて整数レジスタを16本から増やさないのは演算がAVXに移行して整数レジスタの使用頻度が落ち16本で十分対応できるため。 This Week in HPC: Japan’s Fugaku Supercomputer Races to #1; Highlights from Top500 and ISC2020
July 1, 2020
https://www.hpcwire.com/podcast/japans-fugaku-supercomputer-races-to-1-highlights-top500-and-isc2020/ >>321
VLIWで現行といえるものはAI用プロセッサで少しあるくらいだな。Cadence Tensilicaとか 放送法
第二十条 協会は、第十五条の目的を達成するため、次の業務を行う。
[途中の項目略]
19 協会は、基幹放送の受信用機器又はその部品を認定し、
基幹放送の受信用機器の修理業者を指定し、
その他いかなる名目であつても、
無線用機器の製造業者、販売業者及び修理業者の行う業務を規律し、
又はこれに干渉するような行為をしてはならない。
[以降の項目略]
#放送法により、NHKだけがうつらないテレビを製造することをとめることは
#NHKはできない。かりに受信設備にかんする特許をNHKが有していたとしても、
#それを使わせる・使わせないを恣意的にきめることは、この規定に反する。 7/3
既存薬から数十種に絞り込み コロナ新薬候補、スパコン富岳で 理研 [爆笑ゴリラ★]
http://asahi.5ch.net/test/read.cgi/newsplus/1593769669/
世界最強のスパコン「富岳」 新型コロナ治療薬候補を選出 「京」で1年以上かかる計算を10日で終了
http:
//hayabusa9.5ch.net/test/read.cgi/news/1593778304/
7/4
サナダムシ駆除薬がコロナにも?スパコン富岳研究で浮上 [爆笑ゴリラ★]
http:
//asahi.5ch.net/test/read.cgi/newsplus/1593810797/
7/3
【シンギュラリティ】スパコン「富岳」で予測可能になった「南海トラフ地震」(FLASH) [ブルーベリーフラペチーノうどん★]
https://asahi.5ch.net/test/read.cgi/newsplus/1593776306/ ほんとに素晴らしい快挙ですね
韓国にはできないでしょう
ノーベル賞もひとつもない
平和賞は 北朝鮮に日本からたかって
お金を持って行っただけ 金大中 >>339
Intelの人間でもないのにどうしてそんな断定的なこといえるかしら??
汎用レジスタ16本(といっても1本はスタックポインタだから実質15本)のデータとしての整数を扱うだけじゃなくて、ベースとかインデックスのアドレスレジスタとしても使う。
足りなくなったらメモリ退避するけど、そうするとあっというまにコード量が増える。
AVXのコードだって大抵AVX側でだけで処理は終わらんよ…汎用命令つかう処理がまざってそのために汎用レジスタがいる。
と、格闘している人間からいうと32本にしてくれというのが切なる願い。 >>2
量子コンピュータは研究費出せしめるためのネタだよ >>2
量子コンピュータは研究費せしめるためのネタだよ >量子コンピュータは
>従来のコンピュータを置き換えるものではない。量子コンピュータは、
>膨大な計算を必要とするが必要とするデータは少ないBig Compute/Small Dataの
>特定の問題に対する非常に強力なアクセラレータ
>量子計算から着想を得た古典コンピュータで実行できる新しい
>アルゴリズムが開発されており、現在でも役に立っている。
https://news.mynavi.jp/article/20181228-sc18_qubit/ いまは、ハイエンドの性能をだしてランキングの上位に登り詰めるためには、
お金を沢山かけてなるべく沢山の箱を並べて、大電力を投入してそれらを
動かせるかにかかっているわけだろ。たしか京のときに電気が想定を越えて
電力会社に罰金を取られるかもしれないので苦労するなどという話が聞こえて
きたけれども、それをさらにしのぐ電力(2倍?)を使い兼ねないシステムに
したようなんだが、電気代は大丈夫なんだろうか? 隣に本格的な大電力の
発電所をドーンと建ててやれば、まだいくらでも性能を上げる余地がありそうだが。
でもそういった物量作戦であれば、アメリカにかなう国はないはず。
アメリカならその気になりさえすれば、1ギガワットでも2ギガワットでも
いくらでも電力を喰わせることはできようから。頑張れアメリカ。
電力を実際には気にしてないのは富岳でしょ。体裁は気にしてるけどね。
ARM命令セットにして一見気にしたかに見せてるが、同性能ならARMでもSparcでも大差無い。
消費電力が減ったのは多少の努力はあったかもしれんが、プロセスが上がったことによる。
ちなみにアメリカは張り合って来ないでしょ、中国ともそんな気無いし。
もはや、いくら出してどれだけの効果があるのか、
導入コストと電力も含む運用コストを加味して運用効果を考えて導入する。
とっくに日本みたいに右翼を喜ばせるだけの象徴的な存在ではなくなってる。
>>345
https://pc.watch.impress.co.jp/video/pcw/docs/665/735/p10.pdf
Haswellのコアのブロックダイアグラムだけど
これ見ると
168 IntegerPhycalRegisterとあるから
整数演算用の物理レジスタが168本あるって
ことでは? A64FXって、48コア・32GB(ユーザがつかえるのは28GB)ってことは
コア当たりわずが600MB、64ビット必要なかったねwって世界?
1秒間に2700G回の演算ができるといっても、使えるデータ量は10GBちょっと?
ロードしたデータを270回ぐらい使わないと効率でませんよの世界? インテルCPUのμOPの仕様はどうなっているのかな?
世代毎に替えているのかな? 他の国はバブル期の競争よりも他の技術に夢中だからな
昭和脳だけがおれつええしても少し虚しいねえ >>355
指摘されているのはレジスタとして割り当てることが可能な領域の合計であって、それと実際にプログラマから見える汎用レジスタの姿とは違うことに注意してください。
プログラマから識別できるのは汎用レジスタは16本だけです(なんでこうなっているか理由は長いから論じません、ひとことでいえば性能のためだけど)。
実際にプログラマからどう見えているかはほかのレジスタやメモリ含めて、Intelのマニュアルのなかで"BASIC EXCUTION ENVIRONMENT"として説明されているので確認してください。
CHAPTER 3 BASIC EXECUTION ENVIRONMENT (Vol.1 3-1)
This chapter describes the basic execution environment of an Intel 64 or IA-32 processor as seen by assembly-
language programmers.
3.2.1 64-Bit Mode Execution Environment (vol.1 3-5)
Figure 3-2. 64-Bit Mode Execution Environment
この表のなかにGeneral-Purpose Registers の説明として"Sixteen 64-bit Registers"という説明があります。
マニュアル自体は以下のURLから取得できますが、バカでかいのPDFなのでご注意を。
https://software.intel.com/content/www/us/en/develop/download/intel-64-and-ia-32-architectures-sdm-combined-volumes-1-2a-2b-2c-2d-3a-3b-3c-3d-and-4.html 結局京のCPUは沢山FPレジスタを持ってたけれども、
電気を食うばかりでそれだけの数をアプリで使いこなせ
ていなかったのじゃないのかと危惧する? とても韓国にはできるしろものではないですね
未だ75年まえのことを たかりネタにしようと
ねちねち言っている国が世界にあることが不思議 7/4
【速報】豪雨の被害 熊本県で15人死亡、17人が心肺停止 静岡県でも1人死亡 警察庁 [ばーど★]
https://asahi.5ch.net/test/read.cgi/newsplus/1593922070/92
【熊本豪雨】 防災科学技術研究所が解析 「50〜100年に1度のまれな大雨だった」 [影のたけし軍団★]
https:
//asahi.5ch.net/test/read.cgi/newsplus/1593855372/
熊本県球磨川水系で進められていた九州最大級のダム計画、民主党政権が中止させていた… ネット「民主党のせいで、犠牲となった日本人… [Felis silvestris catus★]
https://fate.5ch.net/test/read.cgi/seijinewsplus/1593864751/508 世界一のスパコン「富岳」が採用したA64FXは、ARMらしくないARMプロセッサー
https://ascii.jp/elem/000/004/018/4018768/ あるときはSPARC、またあるときはARM,そうしてあるときはx86_64、
そうしてRISC−Vにもなる。といった具合に、1つのCPUが簡単に動作を
切り替えて使えるようなものを作れるのだろうか。そうしてもそれほど性能が
落ちないのなら面白いのだけれども。また、CPU内部のあるコアに対しては
ARMとして、それと同時に動作している別のコアに対してはSPARCとして
などとできても。
OSはいつも同じアーキテクチャーの命令セットとコアでうごかして、
アプリに合わせてOS用以外のコアは命令セットをいれかえて使えるというものが
できたら、OSはいつもSPARCでなどとできる。
また決まり切った命令セットではなくて、ユーザーがデザインした拡張命令セット
をいつでも設置して試せるとか。
そんなCPUは値段が高くなって夢物語か。また命令セットの切り換えに
100ミリ秒とか掛かるかもしれないし。 >>366
トランスメタ社
コードモーフィング・テクノロジー >>366
昔のミニコンピューターにはユーザーが命令を作れる奴があったな
今のCPUでもエラッタで一部の動作の修正とかやってたりする >>367
クルーソー遅くて人気出なかったなぁ
x86系メーカー増えてほしいから頑張ってほしかったが >>372
命令デコーダくらいは
FPGAでできんかね? >>373
そのクルーソーの設計にかかわった
ロシア人技術者がエルブルス2000という
x86互換のロシア製CPUの設計も
行っていて、IA64同様なVLIWなアーキ
テクチャだが、高性能なコンパイラのおかげで
西側のサーバ用CPUなみのスペックとか http://www.sim.gsic.titech.ac.jp/Japanese/Gallery/index.html
今の流体のシミュレーションってすごいんだな。
昔は2次元で円筒を過ぎる一様な流れ(定常解)を計算するのにも
人力で数年もかけていたというのに。 ソフトにもっと注力しないかぎり、決して日本は世界一流にはなれないと思う。
OSもサーチエンジンも言語もみな舶来のものばかり。 >>371
16bit CPU程度の簡単なものならFPGAでできると思うよ
SRAMタイプのFPGAならコンフィグレーションROMを切り替える事で何でもありあり >>380
FPGAでCPU作ってなんの意味があんのよ? FPGA連携CPUとかが出てるようだし
コアな部分は高性能CPUで
アレンジが必要なところはFPGAで済ます。
インターフェイスがいじれると
自由度が広くなる。 出たw
できるできないの話ししてるのに何の意味ガーとか言う奴 >>383
あほ、「速度が必要な(>>371)」CPUをFPGAで作る意味がないと言っとるのだ。 FPGAて通信とか音声とかビットストリーム系の比較的低速なデータに対しては有効だけれど画像になると固定ハードウェアでないと速度が追い付かないからな。 >>366
1つのCPUじゃ無理だけど、富士通が設計上やってることはそれにちかいんやで
>>365に書いてあるとおり、ARMはとっかえひっかえする部分 どうせどんなCPUでも並列処理させるんだし
ソフトや料金が使いやすければそれで良いよ >>389
FPGAで最速CPU作ってみろや、知障 わかりやすくPCMARK10と3DMARKのスコアだせよ 最近3950Xと10900Kに2080Ti入れたパソコン組んだがベンチ計るのに使った程度で
使う用途は動かさないともったいないからたまにYOUTUBEみたりするくらいやね >>393
速度が必要なスパコンのCPUをFPGAでなら作れるんじゃないか、って話なんだが、馬鹿過ぎて理解しとらんだろ。 画像から物体検出しようなんて考えると使いまくる
流体とか興味もってコツコツ数式をプログラミングする人も配列をcupyだので高速化する方法を知れば
確かに速いなあと納得する >>396
速いコンピューター ⇒ スパコン
速い車と聞いてF1ガーとか言うガキ思考乙w
ちなみに富岳のクロック周波数は2GHz程度だから単体ノードならFPGAでも作れるぞ プログラマブルではない固定機能ブロックを何千ブロックも
搭載してるLSIも「FPGA」って呼んでるわな >>398
>速いコンピューター ⇒ スパコン
ここスパコンのスレだぞ、どアホ。
>ちなみに富岳のクロック周波数は2GHz程度だから単体ノードならFPGAでも作れるぞ
だから、出来るってんなら作ってみろや。
>>399
はあ? ケルビンヘルムホルツ不安定性雲
がこの前観察されたみたいだね
https://www.youtube.com/watch?v=ESBrkRli0K8
昔は
「こういうのはコンピュータでも出せないんだぜ〜」って
得意になって書いてる奴がいたが
今はそこらのPCでも出来てしまうと >>401
> だから、出来るってんなら作ってみろや。
すでにその手の試みがなされてることも知らんのか?
近い将来、メニーコア型の汎用マイクロプロセッサでは計算性能の向上が困難になるといわれている。
この問題を解決する方法の一つとして、対象計算問題を専用の回路に変換し、回路再構成可能デバイスFPGA を用いて専用の計算加速機構を実現する試みが注目を集めている。
https://www.r-ccs.riken.jp/jp/overview/lab/prt.html Kelvin-Helmholtz Instability, CFD Analysis ∇ OpenFOAM®
2015/04/26
https://youtu.be/Nx4boZ2c974
Rayleigh-Taylor Instability
2014/11/18
https://youtu.be/bW4526vHnY0 Mixing Physics Science Experiment 2013/01/11
https://youtu.be/NI85oC-3mJ0
2D High-resolution Rayleigh-Taylor Instability in UHD (4K, 2160p)
2010/10/05
https://youtu.be/P8Cs2tO5w74 pyro simulation of a single-mode Rayleigh-Taylor instability
2013/06/22
https://youtu.be/P4zmObEYCOs >>407
だから汎用CPUじゃ間に合わなくなってきてるからFPGAで専用回路を動的に組むって話な >>408
話が噛みあわんな。
はよ、最速** CPU ** をFPGAで作ってみせろや。 >>411
金も出さずになにか作ってほしいとか言う方が乞食だろw
ごたく言う前にFPGAでできない理由の一つでも書けよ 素人目には、今の最速のCPUは、最先端のテクノロジー➕最先端の集積度➕最先端の動作クロックを使って、限界ギリギリで作っているイメージがあります。
対して、FPGAはそこまではないので、確かにCPUは作れるが1世代前のもの、あるいは専用回路というイメージがあります。
本当に今の最速クラスのCPUが作れるのでしょうか?
テクノロジー、集積度、動作クロックの観点から、どのようなものが作れるのか見込みを示してもらいたいです。 >>413
最先端の富岳のクロック周波数がうちのPCより低いことについて意見を求むw >>414
FPGAとの比較の話をしているのに話題を変えます?
Top500を見ると、Powerを除き、ほとんど2GHz台ですね。
Powerは、GPU頼みの構成なので、GPUのコア周波数で見ると、1GHz台。
IntelやGPUも含めてチップあたりのCore数を大きくすると、周波数は下がる傾向にある。
スパコンとして使う場合、Core数による並列度を高めること、およびメモリ性能やインターコネクト性能、総消費電力などのバランスから、そうなっているのではないでしょうか? 発熱量はクロックの二乗で増えるんだったかな。
コア数が多くて発熱もものすごいので
クロックは下げ気味ですね。 >>415
> FPGAとの比較の話をしているのに話題を変えます?
いや、最先端の動作クロックとか意味不明なことを言ってるので富岳のクロック周波数が最高じゃないよって言ってるだけ
とりあえず絡んでくるなら最速のCPUとか最先端の動作クロックとかの定義を書いてくれ >>401
やっぱ日本語不自由だったか。勝手にしる 今のHPCで行われるほとんどの計算ではメモリとインターコネクトの帯域が足かせになってるんだから、
FPGAにより面倒な計算が一発で終わるので速くなる用途は限定されると思うんですが
それこそ初期のGRAPEみたいな感じなら速くなるだろうけど >>403
>近い将来、メニーコア型の汎用マイクロプロセッサでは計算性能の向上が困難になるといわれている。
>この問題を解決する方法の一つとして、対象計算問題を専用の回路に変換し、回路再構成可能デバイスFPGA を用いて専用の計算加速機構を実現する試みが注目を集めている。
20年以上前の話かと思ったら
>単一のFPGAにより、GPUによるシミュレーションと比べておよそ2 倍の計算性能、および8 倍の電力性能比を実現した
やっぱりwww
今時、単一CPUで性能出たって、スパコンではプロセッサ間通信がネックになって個々のノードの計算能力有り余るから、意味ねーwwwww >>420
初期のGRAPEなら、それこそ(当時はなかったけど)GPGPUだろ
当時から知られてたよりよいアルゴリズムを汎用機で動かしたほうがGRAPEより速かったけどwww 結局、FPGA使っても演算能力が上がるだけで
メモリ性能やインターコネクト性能が低いので
あまり意味がないということかと。
メモリ性能やインターコネクト性能を上げると
コストと消費電力が跳ね上がるからねえ。 >>423
FPGAで上がるのは、局所インターコネクト性能だろ GRAPEも、高演算器マシンというよりは
低通信帯域マシンをだったからねえ。
メモリバンドやインターコネクトをケチるのも京が限界で、
それ以上ケチったら、一番通信がいらない
LINPACKベンチですら性能が落ちる。
LINPACKベンチの効率は京で91%
中国勢は50%以下
京よりメモリバンドやインターコネクトをケチったら
どんどん効率は落ちていく。
HPCGベンチに至っては、効率3%〜5%で競っているていたらく。 >>424
そのへんが強化できるような仕組みなら
いいんだけどねえ。
通信線の本数殖やしたりできんかな? >>422
初期のGRAPEって重力計算に特化するために、その計算をハードウェアで実装したやつの事なのですが
1/r^2の計算に特化した計算機のどの辺がGPGPUなのでしょうか
>>423
その辺はFPGAにしなくても最初から固定回路で実装しておけばいいんじゃないの
富岳のA64FXがやっているように >>425
>メモリバンドやインターコネクトをケチるのも京が限界で、
LINPACKに必要なメモリバンド幅なんてすぐ計算できるんだから、どのスパコンだってそれだけは
用意してるっての
問題はインターコネクト性能で、京のもしょぼいとはいえ、他のスパコンに比べたらケチってないぞ
だからGRAPHだかなんだかは最後までずっと1位だったろ
>LINPACKベンチの効率は京で91%
>中国勢は50%以下
中国のは、もともとギリギリのインターコネクト性能だったのを、インターコネクトはそのままで無理
にスケールアップしたんじゃねーの
>>426
演算器間の接続を自由にいじれるのがFPGAなのに、お前は何を言ってるんだ? >>428
横からすまんが
ロジック上の構成が変更できても物理的な配線の制約からは逃れられない、と言う話だと思うぞ >>427
>1/r^2の計算に特化した計算機のどの辺がGPGPUなのでしょうか
除算がネックだといいたいのか?除算が苦手なのはFPGAも同じなのも知らんの?
>その辺はFPGAにしなくても最初から固定回路で実装しておけばいいんじゃないの
馬鹿だなあ >>429
>ロジック上の構成が変更できても物理的な配線の制約からは逃れられない、と言う話だと思うぞ
お前が、物理的な配線の制約について何も知らんのは、わかった
馬鹿ばっかだなあ、一番ひどいのは>>403で引用されてる馬鹿だが >>430
GRAPEが何を目的として作られたのか知らないのなら調べてから書き込んで下さい
人をバカ扱いするのは勝手ですが、具体的な内容が無いと反論できないから馬鹿って書いて終わりにしたとしか見えません 事実そうなのでしょうけど >>419
勝手に絡んできて言い込められたらどうぞお好きにとか恥ずかしすぎるだろw Alveo U280 (Xilinx UltraScale+ 16nm)
24.5TOPs INT8
460GB/s 8GB HBM2
38GB/s 32GB DDR4
41MB SRAM
PCI-E Gen4x8 or Gen3x16
25GB/s
225W
A64FX (7nm)
21.6TOPs INT8
1024GB/s 32GB HBM2
0GB DDRx
32MB L2 cache
PCI-E Gen3x16
40.8GB/s
約170W メモリアクセスで30倍、インターコネクトだと数1000倍の性能差があったら勝負にならんわ。 >>434
話題をどんどん変えていくのは、自己愛性人格障害者ぽい感じなので、相手にしないだけですよ。 >>437
話は富岳のノードの話から変わってないんだけどね
まあ俺も最先端の動作クロックとかイミフのことを言い出す人の相手は難しいから良かったわw >>377
6/25
スパコン世界4冠の「富岳」、そのすごさを丸っと解説!
https://newswitch.jp/p/22744
富岳の「脱・純国産」戦略−スパコン性能ランキングで世界4冠達成
◆ 理化学研究所計算科学研究センター・松岡聡、富士通
週刊ダイヤモンド(2020/07/11), 頁:8 四冠もとれた理由としては、昔に比べて冠の数が増えたこともあげられる。 ボクシングの団体と体重クラスが増えて、世界チャンピオンの数が増えたのと同じ感じ? >>442
本物?中身はなんもないダミーとかじゃないの? >>443
CPUのチップだけ。いわゆるLSI、ASIC。
記事を読めば分かるけど、
解体した京から取り出したCPUチップを配っている。
吉田なんとかというYoutuberの開封動画があり、それを見ればよくわかる。5万円なので、一般人には手が出ないけど。 SPARC系のCPUなんて一般人が買ってもどのみち使いようがないし… まあ。5万なら買えない価格じゃない
intel/AMDの5万クラスの代わりに京CPUを
買ったと思えば、、、
(現行のx86の5万円クラスに京CPUじゃ
演算性能で勝てないけど) >>445
今じゃSolarisも無償版あるし、LINUXや
BSDもあるぞ
そういうのを入れて、ネットぐらいはできるだろ?
それかフリーで出てる解析系のソフト入れて
ちょっとエンジニアリングに使うとか 京CPUに組み込まれる。科学技術計算用命令セットHPC-ACE
こういうのって、PC系の命令セットがマルチメディア重視なのに
対して、方向性が違うよな >>442-443
アホ、店舗の宣伝の意味もあるだろうけど理由はともかく科学技術への寄付だぞ
もっと寄付したらシステムボードや京のロゴ入り化粧板とかがもらえるらしい 京のシステムボードか、さすがに自作PCの電源がつなげるようには
なってないだろうな。 でもさ、米中も同じような性能のスパコンを開発中らしいから
いわゆる三日天下で終わる日も近いんじゃねえの?
だから、抜かれたら抜き返すためには、もう富岳の次の開発を
始めないとダメだよ? 「1位で安心しちゃあダメなんですけど〜!」 仕事始めてすぐに、先輩に連れられて行ったのが
VPP500の撤去。
その時、CPUボードの二枚を貰って帰った。
一枚は紛失したが、もう一枚は
まだ手元にある。 >>452信号の配線とかわかれば起動
できるようになるか? >>453
無理でしょうね。
数十枚セットで動くものなので。
空冷だけどチップ一つ一つに
冷却フィンがついてて、
裏側はおそらく手配線で
絹糸のような配線でびっしりでした。 >>2
量子コンピューターは、物理原理が確立してるだけ!
現状、数qビットの計算ができる程度。
ほぼ全く役に立っていない。
もっと画期的なブレイクスルーが必要だ。 量子コンピューターはアナログだから日本の得意分野ではあるのだがな。実用化はまだ遠いな。 量子コンピュータペンダー自身が、来年には実用化とか5年以内には実用化とか、ゲート式なので汎用計算とかと煽っているので、世間の人が量子コンピュータのことをそう思ってしまうのも無理はない。
すぐにでも、量子コンピュータでWindowsやLinuxが動き、富岳などがやったことよりもすごいことをやると、思ってしまいますよね。 昔は日本のスパコンもアメリカなどと互して競っていたものじゃった。
と昔の想い出話として語られるようになるのもそれほど未来のことでは
ないような気がする。 コンピューターを建造する(いまは製造するというよりも建造するといった方が
適切な状況になっている)のには、かなりの大金が掛かる。
それに比べて、冠と見なされるベンチマークを提唱するだけならタダも同然だ。
だから、冠と見なされるベンチマークの数をうんと増やして12とか144にして、
その冠をとる数を誇れば、それほど建造コストをかけずにまるで素晴らしいことが
できる能力が広がったように見せることができて有益ではないだろうか?
その結果、ベンチマークにシステムの資源のほとんどを費やしたり、
ベンチマークに特化したシステムがいろいろ作られたりなどの本末転倒の
状況になったとしても、それが進化というものなのだろう。
そうしてベンチマークに特化しすぎたシステムは、環境の変化によって
絶滅するなどということもあるだろう。未来は見えないわからない、ケセラ ARMよりもx86で使えるNECの方が使いやすいんじゃないの?
ARMで動くスパコン向けのプログラムってそんなにたくさんあるのかな? 福島事故の後始末に掛かる200兆円規模の金があったら、それだけ
科学研究が進み、素晴らしい材料や、工学的成果、社会を革新する
通信システム、社会や研究の基盤を造るためのソフトウェアの開発事業
などにお金を回せたかもしれないのに。ヤクザのピンハネに回るばかり
で、日本は徐々に沈没だ。電気代も高くなるばかりでいいことなかった。 >>461
富岳の場合は、ARM自体にスパコン用の命令を持つタイプ。
NECの場合は、Intelとは別にAuroraがいて、IntelはAurotaに計算指示を出すタイプ。計算自体はAuroraが行う。
なのでNECの方がソフトが多いというわけではない。
どちらもコンパイルが頑張ることになるのだと思う。
御人的には富岳のように、CPUに命令が内蔵されるほうが、NECのようなコプロセッサタイプよりも、コンパイラやプログラミング的には、楽なのではないかと、想像します。
処理がある程度専用ライブラリ化され、かつ投げっぱなしにできるアプリなら、コプロセッサタイプでも有利とも思います。 PCIのバスがボトルネックになって性能が出ない。
それでもPCIのカード側にTBクラスのDRAMを
超高速のメモリの後ろに搭載していれば、
まだマシなんだが、NECはなぜか決してそういう
製品を作ろうとはしない。 >>463
NECのはx86の大規模サーバにベクトルユニットで
あるAuroraを組わせた形式だろ
それだから、ベクトルを使わない大規模
x86計算サーバ的な扱いなら、従来の
プログラミングが活かせるかと GPU積んだスパコンもGPU使わなければ遅いx86スパコンだからプログラミングは楽だよね。 >>2
アメリカ企業勤務だけどうちの会社はやってるね
部門が全然違うから進捗とかどうなってるのか全く知らんけど ただのx86スパコンと言うが、現行のx86はAVXなどのSIMD機構があるから
そこらへんで昔の並列機とは事情が違うかと
確か、ここ数年のSIMD機構つけたintel/AMDの主力CPUなら
ベンチ上で数十Gflopsは単体で出る >>464
使ったことはないけど、プログラム全体がAuroraで実行されるらしいからPCIがボトルネックにはならなそう
その点はGPUとは違う
カード側のメモリ容量が少なすぎるのは同意 量子コンピューターの時代にスパコンw
今時、スパコンの開発なんて本気でやってるのは日本だけらしいがw 使えるし実生活(コロナの飛沫シミュレーションとか天気予報とか)に役立ってるからな PCIのボトルネックだけど、今使ってる自作PC 組む際にPCIエクスプレスx16の
コネクターを壊してしまったせいで、PCI エクスプレスx4の方に
ビデオカード(GTX1070)を付けてるけど、極端にゲーム画面などの設定を
重くしない限りは普通に使える、おそらくGPUだけで処理済ませるのが
多いから問題になってないのかも >>472
実生活というか、機械設計や建築での
応力や構造、流体などの数値解析に
使用されてる Announcement 478: Who did derive first the division by zero 1/0 and
the division by zero calculus tan(\pi/2)=0, log 0=0 as the outputs of a computer?
再生核研究所声明 477(2019.2.23) ケンブリッジ大学とミュンヘン工科大学の
Isabelle 計算機システムはゼロ除算x/0=0 を導いた
再生核研究所声明 479(2019.3.12) 遅れをとったゼロ除算 −
活かされない敗戦経験とイギリスの畏れるべき戦略 >>474
ほとんどGPUで処理しているから問題にならないだけ。
スパコンの場合、例えば1Plopsだと、AxB→Cの計算をするので、最大1Px3x8バイト=24PB/sの転送要求が発生してしまう。
もちろん、レジスタで使いまわしたり、オフロードしたりして、なるべくホスト、GPUあるいはAURORA間のやりとりをなくすのだが。
PCI EXPRESSの場合、Gen5のx64で、504GB/s。
なので、通信頻度を0.002%以下に抑えないと、PCIネックになる。つまり、実質ほとんどオフロードさせないと、ダメということ。 Googleが半導体チップの設計に必要な「PDK」をオープンソース化する
プロジェクトを支援、半導体業界がオープンソース化へ
https://asahi.5ch.net/test/read.cgi/newsplus/1594499226/ >>478
それだけじゃチップ設計出来ないからなぁ そのうちフリーハードウェアが増えて行くに違いない。
フリーハードウェアとは、自由に誰でも使えて改変、改良を加える
ことができるハードウェア設計のことだ。製造にはコストが掛かったり
特許が絡むので、物体としての製品までは誰にでも無料で配れるもの
にはならないけれども。 >>473
そんな基本的な仕組みすらはっきり公開されてないということ?
いろんな意味で残念だな 「オープンハードウェア」にはきまった共通認識はないとある。
ましてや「フリーハードウェア」においてもや。 AMD、最大64コア/メモリ2TB対応のプロ向けCPU「Ryzen Threadripper PRO」
https://pc.watch.impress.co.jp/docs/news/1265447.html
メモリを2TB付けたマシンが欲しいが、そんな金は無い。 メモリ32GBのマシンを使ってるが
恐らくメモリが埋まったことはない。 >>487
32GBどころか4GBだけど、それでも全部埋まったことはないな
3.5くらいまでだわ 4ギガなら、
static long int a[1024][1024][1024];
とやるだけで、メモリ領域が埋まってしまうで。 指原莉乃さん、安倍首相と会食済みでした
://twitter.com/ushyaloo/status/1261896971662446593?s=20
https://twitter.com/5chan_nel (5ch newer account) >>490
たった一辺が1024要素の立方体の記述で埋まるのか 昔のSun3とかのWSだと、メモリが4MBとか8MBとか16MBしかなくて、
3次元問題は各方向に100のメッシュをとることができなかったりギリギリだったな。
その当時のメインメモリの容量は今はなんとCPU内のキャッシュに収まるのだ。 SX-1/2 の頃、通常運営時のジョブサイズは最大200MBくらい。
その頃パソコンは640kB+バンク切替メモリ 1970年代は大型計算機センターで、400MBのファイルを確保するのには
特別ジョブ申請が必要だったな。しかもそれを長期保存はできず、
あくまでもジョブが走っている間の短期使用量。
80年代でも、計算機センター全部のディスク容量の全合計が50GB程度だったりなど。
いまからみればまさに子供の玩具のようなもの。 1970年代の終わり頃、
大型計算機のTSSのメモリ使用量制限1MB、特別なときは3MBが許されるが、
混んでくるとだめ。そのメモリ使用量というのも、物理メモリサイズじゃなくて
仮想記憶でのサイズだから、ユーザーが多いと、ディスクとの間で入れだしして
実現されているので、遅かった。何しろ計算機本体の物理メモリは16MB以下
だった(アドレスが24ビット分しかないのでフル実装で16MB)。そんなシステムを
100人ぐらいで共用で同時に使っているのだからね。今から考えたら、どうして
そんなに少ないメモリで大勢を同時にサポートできたんだろうと不思議に思える
かもしれない。それはCUIだったことが大きいのと、大型計算機の専用端末が
ちょっぴりインテリジェントであったからだろう。端末からのデーターのやりとり
は、行単位あるいは画面単位で行われていたと思う。今のパソコンのように
キーを1つ叩くごとにOSへの割り込みが発生していたら、とてもあんなに大勢を
サポートできなかったに違いない。IBM互換機のCPUのクロックも10MHzか
せいぜい20MHzぐらいだったのじゃないかな。詳しい人 >>496
汎用機の端末って別に賢くないよ
汎用機はCPUが直接端末を制御するんじゃなくてIOプロセッサ持ってるし端末を制御する制御装置がインテリジェントだからCPUの負荷は少ない メインフレーム全盛当時の端末ってダム端末だよ
"IBM 3270" と、そのソフトウェアエミュレーター
もそれほど賢くない
http://dotnsf.blog.jp/archives/1066862916.html >TSS
どれくらいの世代から
time sharing systemの略だってわからなくなるかな
ethernet 直前くらい、大学でパソコンを9600bpsのモデムで大型につないでた。
モデムと言っても電話交換機とか通らない直通の銅線経由 >>493
その頃って、スパコンや大型鯖クラスでも
メモリ―1GBもなかったような >>499
大学のコンピュータセンタにあったDECのVMSに9600bpsのモデムつないで通信してたわ
よく月分の割り当て通信量の上限が来て困ってた
しかも外国だったからなぁ 京のSparc64[FX FPU128Gflops
ここだけ見ればHaswell世代のintelCPUと同じだが。Veunasにはx86にないHPC-
ACEの、命令セットがあるからなあ。
科学技術計算で勝負したら負けるかも
でも、一方VeunasにはAVXのようにマルチメディアに振った命令セットがないから
動画エンコで勝負したらHaswellが勝つ >>500
SUN-3は1985年頃だから汎用機で512MB、スパコンは1985年前後には新製品はないから1987年でようやく1GB
ただし、拡張記憶って言うRAMディスクみたいな奴で24GBつけることができる 今は24GBのメモリなんて2万円でおつりが来そうだ。
それに当時のメモリの方が今のPCのメモリよりも
アクセスが遅そうだし。 >>504
確実に遅い、だからこそCPUにキャッシュを
付けて速度を埋めようとした メモリーセル自体の速度はそれほど上がっとらんよ。I/Oの速度上昇に合わせてまとめ読みの量増やしてるだけ。 ってか、クロックサイクルで測ったら昔のほうが圧倒的に遅延は少ないし メモリというとRASでラッチしてCASCASと読み出すものだったのにいつの間にかバースト転送オンリーになってしまった。 Sun3の頃のDRAMは、多分100ns〜150nsぐらいのアクセスタイムが
掛かったような気がする。今のPCのDDR-4はどのぐらいだっけな。 >>510
それRASアクセスタイムだよね
ページモードだとCASアクセスタイムが70nsとかで一般にはあまり使われなかったけどニブルモードだと25ns程度だった
まあ>>506の言うようにセル単体で見たら高速化は3倍程度らしいので基本は内部パラで読み出して 途中で書き込んじゃった
パラで読み出して高速化してるだけだな
しかし最近のD-RAMのデータシート見たら300ページ以上あって笑うわ
ちょっとした組み込みプロセッサよりムズいわ 長篠の戦いで、鉄砲の弾込めに時間が掛かるからとなめて掛かった
武田の騎馬隊が、全滅したように、メモリも要求を貯めておいて
どんどんとフェーズをずらしてデーターを送り込めば弾幕を張れるぞ。 1つのメモリバスに100枚のメモリモジュールをぶら下げて、
それぞれのメモリモジュールの読み出し・書き込み時間が30ns
だとしても、フェーズを100分割して送れば、0.3nsごとに1メモリワード
ずつどどーっと流れるように転送してくる、ということができたり
するわけだ。100枚のメモリモジュールを一種の長さ100のベクトル
レジスタが沢山沢山あるかのようにして使える。まあ100は難しい
だろうが4とか8とか16ぐらいならなんとかなるんでないの。 >>518
今更バスwwwwwwwwwwwwww
それだけでも馬鹿丸出しだし、256wayのinterleaveとかも大昔からあるのも知らないってwwwwwww しかし、なんだなスパコン関係のスレ見るとなんで「量子コンピュータとスパコン」を
同列に考えてるのか不思議に思う。
ちっと科学的な見識があればそんな風に考えない >>33
馬鹿言え。高射砲も届かない高空から爆弾を落としていたら、命中率が低すぎる。
だから軍事施設へのピンポイント爆撃が出来ずに、一般人大量虐殺してたと白状してどうするんだよ(爆笑) >>520
ルパン3世グッパイパートナーって見たことある?
世間の量子コンピュータに対する認識はあのレベル。
一般向けのニュース記事もそんなレベル。 世間の量子コンピュータの扱いはどんな問題でも
一瞬で解けるコンピュータくらいにしか
思ってない
科学板にもそんなのゴロゴロ >>522
いや、だからさ最初はそういう認識でも
「量子コンピューター?、ちとぐぐって
見ようとか図書館で暇つぶしに本見てみようとか
すれば実態がわかってくるわけじゃない
俺だって、以前はスパコンとか大型サーバとか
SF映画にでも出てくる、凄いコンピューター
というぐらいの認識だったが自分であれこれ
調べてその実態を知ることができた、
(使うような職業には就いてないけど)
要するに、知的探求心が足りないんじゃないの? >>526
子供の時に図鑑で調べる習慣がついたか否か >>526
科学ニュースに書き込むぐらいだから、それぐらいしてくれという気持ちですね。ごもっともです。 だが他方では、ネットを徘徊した結果妙ちきりんな話に傾倒する人もいる。
よりによってそれを実態と思い込んでしまうのかっ 富岳のプラモデルが発売されたりはしないのかな。
日本のなつかしのコンピュータシリーズと名うって
田宮あたりから発売されないのかな。
(日本に限定しなければ、アメリカにも輸出できるかも。
IBM704, Univac, CDC3600、PDP-11, IBM360,
VAX-11/780、CDC CYBER205, CRAY-I, などのプラモデルを) >>530
そういうのは、アオシマとかマイクロエース
の分野じゃないの?
田宮はあくまでも車や航空機、ミリタリー系の
スケールモデル専門って感じだし
(艦これとのコラボ企画も田宮は乗り気じゃなく
同じ静岡企業のアオシマが主導になった 今は初音ミクの人形を作って売る方が儲かるんだろうな。 >>530
そう言うのを買う層は3Dプリンタとか持ってそうw 最近は3Dプリンターといって騒がれなくなったが、どうなったんだろうか?
みんな物珍しさが減って飽きたのかな? >>534
安いのだと1万円台からあるからな
珍しくなくなったのと、CADで設計できないと意味ないのがわかってきたから 昔、コンピュータで図形を書く方法は、グラフィック端末もロクに無く、
画像を印刷できるプリンターもなかったときには、ペンを使った
X-Yプロッターというものを計算機からコマンドを送り込んで線画で
絵を描いていた。カルコンプのプロッターとか。いまX-Yプロッターは
廃れたんだろうな。ポストスクリプトとかPDFファイルで用が足りるから。
当時はプロッター装置は値段が結構高いものだったので、個人が買うのには
障壁があった。さて、スパコンの計算結果を出すのに自動車ぐらいの
サイズのオブジェが光速に印刷できる3Dプロッターは必要ないのだろうか。
実物サイズのものを作らなくてもVRグラスで眺めればそれで用が足りる?
3D印刷速度を稼ぐために、1つのものを並列に作り上げていくというのは
あるのだろうか? >>536
この手のスパコンや大型サーバは
UNIX/LINUXベースのOSで普通の
PCからアクセスして使い、計算結果も
PCに表示される 去年までは「スパコンランキングなんて何の意味も無い!」って言い張ってたくせに 正確にいうと
去年までスパコンランキングなんて意味なし、といってた層
↓
ランキングトップすげー
去年まで日本製は低ランキング!日本オワタ、と言ってた層
↓
スパコンランキングなんて意味なし!日本オワタ
こうだな 富岳も三日天下で終わるよ。
今年中か来年には、アメリカが開発中の新型に
抜かれてトップ5以下に堕ちる予定。
また、富岳も含めてトップに並ぶスパコンって
使ってるCPUや方式やOSが全て似たり寄ったりに
なって来てる。
今後は、発想を変えて、量子コンピュータとスパコンを
コラボさせて、現実の大問題(例えば、コロナ用の創薬とか)を
出来るだけ速く安く解く「スパコンクラウド」を提供する事だわな。 二十年前から量子コンピュータがどうとか言っとるが
すこしは実用化に近づいたんかね? >>540
三日天下で終わることがめでたいことだ
人類の技術の進歩が著しいってことだ スパコン省電力世界一「夢にも思わず」 快挙の舞台裏
2020/7/26 2:00日本経済新聞
「1位を取るとは夢にも思っていなかった」――。
人工知能(AI)開発スタートアップのPreferred Networks(プリファード・ネットワークス=PFN、東京・千代田)の平木敬シニアリサーチャーは、喜びと驚きをこう表現した。
2020年6月、PFNのスーパーコンピューター「MN-3」がスパコン消費電力性能ランキング「Green500」で世界1位を獲得した。
https://www.nikkei.com/article/DGXMZO61500730U0A710C2000000/ そしてITの技術やソフトやアプリはみんな海外産を使うようになった
馬鹿の一つ覚え
覇権とはほど遠いオナニー 命令セットアーキテクチャーも、OSも、プログラミング言語も、
アプリもみんな舶来品がほとんど。たとえばWindowsやMacintosh
を有り難がって買い、一太郎を棄ててWordやExcelの使用を強いて
くる役所などは、亡国を導く売国奴。かつてはアスキーとNECが
組んで、せっせとマイクロソフトによる市場制覇への橋渡しを
していた。日本のパソコンメーカーはわざわざマイクロソフト詣でを
して、ひさしをかして母屋を乗っ取られる愚を行った。ソードなどの
国内企業を育てなかった。大型計算機のOSやアプリを作れる技術力を
持った国内企業が真剣にマイクロコンピュータに取り組めば、ずっと
足踏み状態だったMS-BASICやMS-DOSやOS/2などをよそにおいて、
ぶっちぎりでマルチユーザー、マルチタスク、マルチジョブの
DISKオペレーティングシステムを開発できたはずだったが、
それをしなかった。それは大型計算機やオフィースコンピュータ
と称する1台あたりの商売の利益率が高いビジネスを自ら崩したく
なかったからだろう。コンピュータは通産省の領分だったが、
この役所もハードそれも外国のコンパチ機のクローン製品を
作らせることばかり企業の意向を受けて旗を振っていて、
本当のソフトの開発を真剣にやらなかった。アプリも含めて
ソフトを作るのが大変だという理由でIBMのメインフレーム
やIBMのPCの真似物ばかりを作って日本のソフト産業も
ハード産業も衰退した。1970年代1980年代の大学の情報
科学・情報工学の高度な専門家を養成する枠も極めて細く、
人材の供給がさっぱりだった。公務員の定員の縛りを掛け
られたためか、そういった学科が作りにくかったし、他の
学科からプログラムの書ける奴隷を情報系の学科に奪われる
のは不都合だみたいな意見が強くて、学科の新設もそれほど
世間の需要とは無関係に徐々でしかなかった。
世間では計算機のソフトや運用関係は人貸しピンハネビジネスが
昔から横行していて、技術力とは関係無く人月百万円でもって
人材派遣業をして、儲けるヤクザっぽいところばかりだった。
深い知識はなくて、表面的なマニュアルの暗記で有能とされ、
適当にコードをたたき込んでテストで動けばそれでアプリソフトが
出来上がりといったいい加減な技術者が跋扈して、そうして
ダメになった。ソフトを発注する側にも専門知識がないことが
普通であったことも問題だった。 「2k,4kの解像度」「オブジェクト全てレイトレーシング(テクスチャ一切無し)」「60fps」の3Dゲームはどの位のスパコンで出来るのだろう
見てみたいもんだなぁ >>548
基本、スパコンって技術解析計算メインだから
あまり3D的なものは得意じゃないんでは?
言っとくけど映画に出てくるスパコンの
インターフェースは視聴者にわかりやすいように
あーいう風にCGで見せてだけで、実際には
PC経由の端末からUNIXやLINUXベースの
OS使って操作だよ。 >>548
シリコングラフィックスが現存してたら、そういう方向のスパコンを作ってたかも 富岳が終わる時CPUとパネル欲しいな・・・
京よりカッコいいと思う >>549
いや、「映画に出てくるようなコンピュータ」を言っているんじゃなくて、単に計算速度が欲しい、という話です。
だからそのコンソールはunix系で構わない。
仕組みとしては、
(出来れば2k,4kクラスの)レイトレーシングの計算結果のビットマップをスパコンが秒間60回で共有メモリに書き出し続けて、
その共有メモリを別のコンピュータ(こっちは普通のpcでもいける?)が同じく秒間60回スクリーンに映し出す、
みたいな処理ができたらなぁ、という感じかな?
思い付きで言いたい放題書いてるがw >>548
プリレンダリングの高画質動画をバッチ処理で作るならはやい。
多数のノードに多数の別フレームを描かせればいいからな。
順番とか後で揃えればいい。
インタラクティブに操作しながら見たいなら
グラフィックカードを複数積んだパソコンの方がはやい。 めくらの人用には、音声応答によるユーザーインターフェースを
ヘッドセットを付けて使えるようなOSとかアプリのありかたはどうかな?
携帯電話などのモバイルで先行しそうな気がするけれども。
暗闇でも使えるだろうし。 >>552
それはコンピュータの計算性能と言うよりは
コンピュータのI/Oとディスプレイ間の通信性能が重要
また別の技術が必要ですね ミニってなんだか変な表現だな。小規模の間違いだろ。
432台に対して8台といっていることは、
432ラックに対して8ラックの意味かな?
それとも、8ノード分かな?
資源をあまりにも安価に提供していたら、
独禁法には触れないのだろうか? 十六倍精度浮動小数点数はbinary512だろうからSVE512bitと表現する富岳ではちょうど良いだろう。 富岳といえば 太平洋横断爆撃だよな 爆撃成功後はドイツの領内に向かう レンポウ!
コメント早よ!
中共からの指示は来たか?
安倍さん、反日自民議員を党内政治で優遇せずに大鉈を振るったらいい。
キチンと総理を尊敬する日本人は愛国自民議員を応援します。
スパイ防止法早よ!
親中自民議員批判の次に、トランプさんにスパイだらけの日本は信用できんと
外圧かけてもらえ! binary256はExponentが19bitらしい。
binary512はExponentが23bit
binary1024はExponentが27bit
binary2048はExponentが31bit
と予想してみる。 半精度の時代に使われもしない4倍精度のさらに上とか。
まあ64bit整数乗算器を積んでるなら80bit拡張倍精度演算はあっても良かった気がしないでもない。あっても使う機会無さそうだけど。 >>564
科学技術計算って倍精度以上でやるんじゃなったか?
GPUのシェーダーとかは半精度らしいけど >>565
ビッグデータの照合検索処理は半精度でいいらしい。
128bitレジスタとメモリバスが当たり前のように実装されるようになって久しいのに4倍精度の実装要求が出てこないのがすべてで、要は精度が必要な計算は少ないし必要な精度もまちまちだから倍精度演算を高速化しておけばそれで多倍長演算やるからいいよって話。 4倍精度って 確か単精度が32bit単位なはずだから32*4で128bitか?
PCのCPUのAVXとかSSEなどで扱われてる単位じゃない そういえばで、まだメモリバスは
64bit×Nchの単位なんだろうかね? バースト転送だからDDR4で4096bit単位になるが 4倍精度が使われない理由は、直接ハードウエア回路で実行するマシンが少なくて、
ソフトでエミュレーションしているために、2倍精度演算よりも20倍とか30倍
計算に時間が掛かるから。そのため、うんと速度が落ちてしまうので、
4倍精度を使ったプログラム・アプリが書かれない。プログラム・アプリがないから
4倍精度の命令をハードで実装してもメリットがないので、4倍精度演算をハードで
実行する回路を持ったCPU・計算機が作られない。するとそのような計算機の
上で4倍精度演算をソフトエミュレートで実行すると20倍〜30倍遅いので、
プログラム・アプリが書かれない。プログラム・アプリがないから4倍精度の
命令をハードで実装してもメリットがないので、4倍精度演算をハードで
実行する回路を持ったCPU・計算機が作られない。。。悪循環。
でもIBMの最近のサーバー用CPUであるPower9には、
4倍精度の演算回路が内蔵されているんだよ。
そもそも2倍精度の演算を行うとき、たとえば乗算を行う場合には、
2倍精度の仮数部と2倍精度の仮数部をかけ算するとき、内部では
ほぼ4倍精度並の長さの積の仮数部が作られている。その積の計算を
作る段階では4倍精度並の加算も回路としては必要だ。
そうやって、いったん内部で128ビットFPまがいの仮数部を作っておいて
それから「正確な丸め」を行ってわざわざ仮数部を丸めてFP64に
しているんだ。だから回路的にはそうとうもったいないことをしている
わけだ。丸めずにそのままIEEEには規定されていないが中間形式の
FPとしてレジスタに結果を入れられたり、そういった数をFMA的に
足し算できるようにすれば、長い倍精度のベクトル同士の内積計算などで
項数が多いことから来る積み残し誤差とか、数値相殺による相対精度の
低下などの影響を大いに減らすことができるのに。
ばかみたいにIEEEのFPの仕様に忠実に作ってしまうので、数値計算
にとってわずかな改変で結果を素晴らしく良くできる可能性をドブに
棄てているんだ。そもそものIEEEのFPはFMA命令ですらなくて、
FMA命令を使うとIEEEの規定する乗算や加算と結果が異なるので
「悪い」などといった馬鹿げた意見が世の中を支配していたりもした。
数値計算に十分な理解が無いハード寄りの人間ほど、規格が
どうであれそれを墨守して作りたがる。
かつてのIBMの16進FPは、Kなどの馬鹿が採用したもので、
丸め誤差などの問題には無頓着で、単に表せる数値のレンジを広げて、
加算を仮数部を4ビットずつずらしてシフトして行えるので、加算の
演算速度が25%向上するという利点に目がくらんで採用したもの
だった。 >>570
CGの法線ベクトル演算で効果絶大だな
だがGPUで演算してしまえばどうという事は無いか? 一番困るのはハード毎に計算結果が違う
(合致させる手順が明確ではない)状況が生じることだよ 気象予報計算とかカオス系の演算は全然違う結果が出そうだな ちぇっ、これもまた消費税が入って110円になるとは。 スパコンの時代は実はもう終わってるのに
なぜか日本では大盛況
すでに時代は次のレベルに到達しているので
ここにばっかり予算かけてると終わる スパコンの技術自体はもう枯れている。
CPUの速度が早くなれば、性能も上がり
CPUの消費電力が下がれば数を増やせる。
それだけのこと。 >>570
長文書いてるわりに、IEEEの乗算回路じゃあ、下半分切り捨てるとしても4倍精度乗算に必要な演算の
半分しかやってないことすら理解できてないとか、馬鹿すぎ
>>571
>CGの法線ベクトル演算で効果絶大だな
そんなもん、半精度でも精度余るってwwwww
>>572
並列化すると計算順序なんかいくらでも変わるから、現場では困らない
作ったハードの検証が楽ってのはあるが 祗園精舎の鐘の声
諸行無常の響きあり
娑羅双樹の花の色
盛者必衰の理をあらはす
おごれる人も久しからず
ただ春の夜の夢のごとし
たけき者も遂には滅びぬ
ひとへに風の前の塵に同じ
遠くの異朝をとぶらへば
秦の趙高 漢の王莽 梁の朱忌 唐の禄山
これらは皆 旧主先皇の政にも従はず 楽しみを極め
諫めをも思ひ入れず 天下の乱れんことを悟らずして
民間の愁ふるところを知らざつしかば
久しからずして、亡じにし者どもなり
近く本朝をうかがふに 承平の将門 天慶の純友 康和の義親 平治の信頼
これらはおごれる心もたけきことも 皆とりどりにこそありしかども
間近くは六波羅の入道前太政大臣平朝臣清盛公と申しし人のありさま
伝え承るこそ 心も詞も及ばれね これまで、時間がたてば次第に技術が改良されて
半導体の配線ルールが縮小し、歩留まりが向上し、
回路動作周波数が上がり、必要とする消費電力が下がり、
というドンドン良くなるホッケの太鼓の状態が50年近く
続いて来たわけだが、いずれ行き詰まってしまい、
自家用車の値段が余り下がらなくなったように、
半導体の製造会社が淘汰されて少数あるいは独占状態に
近くなって、技術改良が停滞して、安定的にあまり技術
レベルの向上の無い半導体を製造し続けて、価格あたりの
性能が向上しないかむしろ、物価の上昇と同様に値上がりを
するような時代が来る可能性がある。
これまでは半導体にはそういう時代が無かったので、
なかなか想像し難いし、耐え難いと想われるかもしれないが、
そうならないとは言い切れない。製造企業は新たな技術投資をせず、
安定した価格で長期に渡って作り、少量品種は作らず、同じ回路を
同じ値段でずっと作り続けるようになるかもしれない。蛍光灯や
白熱電球を作っていたように。 9/4
【スパコン開発】日本製世界No.1スパコン「富岳」の天下がしばらく続きそうな理由 米中ハイテク覇権争いの影響がここにも [すらいむ★]
https://egg.5ch.net/test/read.cgi/scienceplus/1599188776/ >>162
ペンタは5、五角形のペンタゴンと同じ語根
ペタが正しいしペタの1,000倍がエクサ >>217
いや、これはアカンよ
ID:dK+92yjC
負け犬と煽られて当然 >>154
書いてること残らずルサンチマンかつ有害なのはすごいな >>164
本当の開発速度はスケジュール通りではないから無意味 j替えwrgjgjggjgjgjp;あれ和ggp五尾後gぽ五gggっ後 喜ばしいニュース
まだまだ日本もいけるのかなと安心する ARMがNvidiaとねんごろになったから、次の機種はGPUが搭載されるか、
あるいはGPUは避けてRISC-Vにするかだな。 ■ このスレッドは過去ログ倉庫に格納されています