CPUアーキテクチャについて語れ 44
レス数が1000を超えています。これ以上書き込みはできません。
前スレ
CPUアーキテクチャについて語れ 43
http://egg.2ch.net/test/read.cgi/jisaku/1525078607
540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21]
Zenが高くないと買えない自分を正当化できないもんな
大丈夫だよ、8コア最上位でも3万円切るから
お前みたいな無職大貧民には大金だけどな
545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21]
最上位で3万円切るって宣言した俺の発言ログとっとけよ
148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9]
まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ
351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU+9WJv [4/7]
リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ まあみんなbulldozerをSMT対応しただけの微妙なコアになるとおもってたよ
まさかいきなりsandy〜haswell並みの性能のコアができるとはおもわなかった 団子って32コアOpteronデュアル機組んだの? >>前スレ999
AVX512を使うとクロックが下がってしまって、
効果が思ったより出ないのよ。
256から512になったので、性能2倍と行きたいところが、実際には1.3とか1.4とかなんだよね。 >>8
それはとっくに知られてることで、聞かれてるのは大顰蹙のソースだろ。
俺も顰蹙買ってるってのは見たことないから見てみたい。
マスタースレッドも遅くなる点なんかが嫌なのか? AVX512?
満載したPhiはディスコンになったぞ >>8 消費電力同じなら普通そんなもんでしょ。OCとかやってるとクロック1:2で省電力1:4くらいだし。
それでも7980XE@165W制限でLinpack 1000 GFlopsくらい出る。
うちの7980XEの全力の火力はこんくらい。
https://i.imgur.com/IxssRvU.png
https://i.imgur.com/t2COG7k.png 前スレ終了
負け犬団子さん 名無しじゃなくてコテで書いたらどうですか?
あっさすがに恥ずかしいですかw SIMD演算とかGPUに投げればいいだろう
もうすぐこのサイズ(GPUは300mm2)で単精度15Tflops、倍精度7TFlops、メモリ32GB、帯域1TB/s、TDP200W以下になるからな
https://www.cnews.cz/wp-content/uploads/2018/06/amd-computex-2018-7nm-gpu-vega20-lisa-su-4gamer.jpg CPU-GPU間の帯域がもっと増えるといいんだけどなあ。
今だとオフロードするのを意識しないといけないからな。
コード書く時面倒い。 CPUとGPUを三次元メッシュで繋いで周りに広帯域メモリを沢山並べるとか? >>13
本当にそんなTDPで出てくるかな
以前のリークだと150-300Wと書かれてたからなぁ >>13
コンパチだと思ってんの?
SIMDのコード全部GPUで再現できると思ってる? 機械翻訳君やポエマー相手には通じない
団子とはまた別ベクトルの狂気だよ CPUもGPUみたいに消費電力300Wが許されれば、CPUでAVX512ガンガン動かせる
消費電力制限のせいでAVX512が生かせない >>19 Xeon Plutinum 8180のTDP 205W→300Wにしても電力効率落ちるから精々クロック1.3倍くらいでしょ。
あと、メモリ帯域もそんなに余裕なさそう。>>11の全力もメモリネック。
処理量増やすなら、基本は低クロック&多コアでしょ。そうするとGPUやXoen Phiみたいになるのかね。 >>17
OpenCLで書けばいいだけ
得手不得手に違いはあってもAVXに出来る事はGPGPUでも出来るよ >>16
Vega10→Vega20は、R9 390X→RX 480と似ているから、同様にTDPも半分くらいになる
ただ、メモリ倍増させてるから、その分多少TDPが上がる程度 性能出て困るから普及させないんだろうな
AVXの方が優れてるならXeon PhiはとっくにTeslaを駆逐してるだろ
実際にはXeon Phiが駆逐されて撤退だけど デバイスごとに性能出るコード全然違うから、結局書き直すハメになるぞ
だったらIntrinsicsで直接書くわってなる そんな当然のことを理解してたら機械翻訳君やポエマーやってない サーバー、HPC、データセンターとかの類はデバイスに最適化するから、構築するたびに書き直すのが前提でしょ >>22
はい嘘つき。
それぞれのハード仕様すら知らない馬鹿が語るな。 Phiに関しちゃ、実際のソフトで大規模なシステム動かした結果が既にpaperになってるから
パフォーマンスがダメだったから廃止になったてのは違うよ、一部の人が大きな声でキャンキャン言ってるが
もっと「Intel屑だな〜」て理由から廃止になった
即ち10nmの遅れ、完全な自社都合でのディスコンである >>30
将来性ってのがないと判断されたのでは?
結局のところPhiの特徴たるCPUとして性能アップをしたら管理部分が肥大化し
そういうコアごとの管理部を削ってそのぶんコアを増やすGPUのアプローチのほうが将来性があると判断したとか phiの倍のクロックで動くxeonの多コア化が進んだ結果需要がなくなったんだろ ノイマン型コンピュータの特色としては相互にそれぞれの処理はできるだろう
やる意味がないだけで Phiはユーザー目線では大成功だよ
ユーザーは喜んでたが、メーカーが利益でなくて打ち切った >>32
そのXeonの倍以上のコアを積めばいいだけでは >>34
タダでばら撒いて採用増やそうとしたけどTeslaに勝てないから撤退だろ
頼みのHMCがHBM2に完敗したのが大きい それはおかしい。実質intel専用で作られたのにintelがトーンダウンしたのがHMC終息の原因であって元々HBMとは勝負にもなってない。 何でトーンダウンしたのかな
それはもちろんTeslaに勝てないからだろう
何で勝てないかと言ったら性能で劣るからでしかない
プロセッサの性能もメモリの性能も負けてるから、これ以上やっても仕方ないからPhiは諦めた コードも書けないGPU信者は名前入れてくれNGにできない。
敬愛するGPUの得手不得手くらい認識しろよ。 >>38
で、Oakforest-Pacsが大顰蹙のソースは? ソフトだよソフト。phiは開発者には素晴らしく使いやすい作りだった。
でもユーザーにパラレル処理をまともに書ける人材なんか限られてる。
nvidiaはソフトのサポートや用途まで全部面倒見てるからこそ強い。
優秀な開発者を揃えてることが前提のphiはターゲット設定ですでに躓いてた。 Teslaは不得手があっても高性能だから採用されまくってるんだろ
Phiは逆に得手があってもTeslaに及ばないから普及できなくて撤退
アクセラレータはメモリ性能も重要だから、当然HBM2 vs HMCでもある >>41
Oakforest-Pacsとか知らんよ、いきなりどうした >>42
Intelがサポートや環境でNvidiaに負けるわけ無いだろ
当然資金や人材を大量に投入してやってるよ AMDはサポート面で負け、Intelは性能面で負けた
じゃあ、AMDの性能とintelのサポートのタッグならどうなる?ということで出てきたのがkaby-G
まあ、サーバー向けじゃないから対TeslaのPhi後継というわけじゃないけど Intelが採用したことのないHMCの優劣を語って何になるのだ
HMCを推してたのは団子だけだ 単純な演算しかできないアクセラレータに汎用プロセッサで挑むのはどう考えても無理がある。 >>45
負けてんだよ。今ある環境見てみろ。見てもわからないか。
馬鹿でもターンキーの環境は存在してない。
性能なんて抽象的な言葉しか使えない奴はこの程度。 Zenも64GBくらいのHBMを積めばいいのに。
昔あったslotAかなんかで馬鹿でかいモジュールにしてしまえ。 512bit ADDERを内蔵すればいい使い道がある。 >>52
メモリ速度に引っ張られがちなZenアーキテクチャでSlotタイプはデメリットでかそう
CPU搭載Slot側にメモリとPCI-Eバススロット積んだらそれもうM/Bじゃないってなるし >>52
AMDのアーキはその実メモリドリブンコンピューティングなんだよな
HBCC出てきてそう思った
HBMとHBCCをCPUにも積むでしょ将来的にまあ早いとこ出してほしい
やろうと思えばCPU上にヒートスプレッダー代わりに積めるらしいから
ライザーカードはないだろうけど AMD信者も別の意味で狂ってるからな。もしAMDが2048bit SIMDとかやってたら絶対マンセーしてた でも実際はんな事やってねーじゃんw
仮定持ち出してネガるとか頭おかしいw AMDの予定は全て予定以上と吹聴するポエマーくんみたいだな
ひっくり返すとクソダンゴになるが さっき鏡をみながら自分の肛門のシワを数えてみたすが、143本あったっす
これわ多いのか少ないのか知ってる人いないすかね えーと、年齢、性別、身長、体重計、体脂肪率が同等の検体を調査すれば良いす。
こういうのはやはり言い出しっぺがやればよろしいす。(鼻ホジ
つまるところ知らんす。 富士通の出したPDFで2048bitのSIMD命令を512bitで数クロックかけてやる場合の効率とかやってるのあったよね
そこからPOST京につながるのはわかるんだが、他のセグメントにも応用できる話なんだろうか スパコンは別として一般のプロセッサの場合SIMDに過大にリソースを投じるのは非効率的だよな。
演算器は整数ユニットが64bitだからこれを2倍にして128bitくらいがちょうどよくて命令としては64bit×4×4の1024bitまでは意味があるとしてもそれ以上はねえ。 >>65
確かソレ140bit分くらい要るゾ
まぁISA上どうなってようが持ってる演算機で回せりゃそれで良いからな
SIMD用のコア別に持つのはどうよ >>66
演算器の拡張は楽なのよ。
一番面倒な制御回路を共用してデータパスは多少拡張する。
データの粒度を考える128bitなら効率よく使えるがそれ以上はどんどん効率が悪くなる。
機能としては64bit×4の256bit命令は是非とも欲しい。
大体命令デコード数の2倍以上の演算パイプラインを有するので
256bitの命令を128bitのパイプライン2つで処理するのが無駄が無い。 >>66
コアを分けるとスカラ命令に含まれる構造体や配列の演算、行列演算、文字列比較、ブロック転送とかにSIMDが使えなくなって順次処理命令の中に含まれる並列性を持つ部分を効率的に処理するSIMDの意味がなくなる。
コアを分けるなら制御回路の重いスーパースカラにするのではなくSIMT構成にして演算器リッチにした方がいい。要はGPUだ。特定処理に特化するならFPGAもいい。
GPUやFPGAをコプロセッサ的な形として実装するのは有りだろう。 つーことはやっぱスカラアレイ混載式、統合発行かな
そのうちEDGEになるかな SIMDは使いまわしのMMX・3DNowまで、以後命令追加のみ、
x64は既存レジスタの64bit拡張のみ追加なし、の未来が見てみたかった スタック式1オペランドFPUでもレジスタリネーミングすれば高速化は可能だし80bit拡張倍精度は多倍長演算と相性がいいし科学技術関係で重用されてたりしてな。 高速化するためにあれこれやってたらどんどん消費電力が上がって逆に非効率になった
シンプルなSIMD系特化コアをつくってかわりに数を大幅に増やしたほうがいい そのSIMDに仕事を割り当てるのは誰だと思ってるんだ intelとamdはどちらがより発明に関する実績が優れていると思いますか?
amdはintelからx86をライセンスされて勢いを得た企業らしいですが、自力での優れた発明はあるのでしょうか? >>76
x86自体が優れてたから普及したわけじゃないけどな
今まで残ってこれたのはIBM PCに採用されたからだ
MS-DOS時代は1MBのアドレス空間と64KBのセグメントの壁に多くの開発者が苦しめられた
1MBのアドレス空間以上のメモリを使うためにEMSなんてのもあったしな
Windows 2.xはEMSメモリで動作してたというのだから驚き
実際遅くて使い物にならず、プロテクトモードに対応したWindows 3.0になってやっと普及
それでも64KBのセグメントの壁は残り続け、Windows 95が出るまでずっと開発者を苦しめた AMDの自社開発のISAの話ならこのあたり読めばいいのでは?
CPU黒歴史 対Pentiumのために放棄されたAm29000
http://ascii.jp/elem/000/000/642/642559/ >>76
発明はさておき、2900ビットスライスの時代は先鋭的だったかもね。AMD好きだったな Oakforest PACSのXeon Phi 7250は約3TFLOPSに対して
MCDRAM 490GB/s、DDR4 115.2GB/s。FLOPSあたりのメモリ帯域は
あらゆる課題を相手に潤沢な大きさとはいえないから、一部の種類の
計算が不得手なのは当然で予定外の失策ではなく計画通り。
帯域がもっと大きければ不得手が減ることは分かり切ってるが
コストが跳ね上がることも分かり切ってる。 gpu部門の責任者移籍だってな
amdとintel 最新スマホのスナップドラゴン835か845でWIN10でエンコソフト動かしてもアトムセレロン以下
ってアンドロイド用のエンコソフトとかならcore i5ぐらいのエンコスピード出せるんかな? そもそもスマホのSoCって、バッテリーや放熱の問題があるので、
瞬間最大速度はそこそこ早くなったが継続的に出せる速度は結構遅い
機種によっては充電しながらスマホに扇風機で風当てて冷やしてれば
そこそこの性能が継続できるのもある ゲーミングスマホとかゲーミングタブレットとかほざいてファン内蔵する本末転倒もあながちジョークではない むしろNUCとかBRIXみたいなのをARMでやれれば バッテリーの持ち以外ARMを選ぶ理由ないんだよなぁ というか>>88的なのはラズパイのIF互換基板でやればいいか。
高性能品はマザーより大きいんじゃないかってくらいのヒートシンクが載る。 >>86
iPhoneは100%から電池切れるまでやり続けてもベンチスコア変わらんけど HMCのGen3が開発されていればもっと強力になっただろうに 今更ARM+HMCとか
知識の無い偉い人が適当に決めてます感がすげえな >>97
コスパでブッチギれることは確定だな
ハイパフォ向けじゃ無いから数で殴る専用になるけど
が、その用途はほかに強力な奴が居るからなんとも
現状86とARM、DDRxとHBM、GPUとFPGA
コレら以外の組み合わせはちょっとな
調達側の観点からはソリューションが貧弱ってのもあるけど、あったとして役に立たないであろうから貧弱なワケで >>92
当初ARMスパコンはHMC使用予定だったが、
HBMに計画変更されてるのでは? >>99
IBMパイセンはゴリ推しのパイオニアだからな
でも本気ならz/のラインが浮上してくると思う 富士通のHPCサーバーで採用実績があり、ノード当たり容量よりBW優先に振るなら、HMCの採用は当然と云える。 AMD、2018年第2四半期は過去7年で最高益に
https://pc.watch.impress.co.jp/docs/news/1135171.html
>米国会計基準(GAAP)に基づく第2四半期売上高は、前年同期比53%増の17億6,000万ドルで、
>営業利益は前年同期の-100万ドルから1億5,300万ドルへと黒字に転換。
>純利益も前年同期の-4,200万ドルから、1億1,600万ドルと大幅な増益を達成している。 SamsungがGPUを開発、スマホからスパコンまで対応? - EE Times Japan
http://eetimes.jp/ee/articles/1807/26/news059.html
intelに続いてsamsungもdGPUに参入か むかしNECもGPU作ってたよね
nvidia・atiに勝てなくて撤退したような Hyper98のE2GCは当時もっともWindowsを快適に使えるチップだったりする。 NECのグラフィックチップ自社開発を断念に追い込んだのはS3の928
nとかゴミ扱いの時代。 もうNECエレも遠くなりルネサスすらも…まだ生きてんのそういや? >>114
チップの自社製造が出来なくなったのでN天堂がスイッチした…と聞いた >>103
HMCは遅延を許容できるならデイジーチェーンで容量も確保できるし理屈上DDR4よりスケールする。
EUROSERVERがARM+HMC前提で動いてることもあって富士通も狙ってくでしょ アメリカは年間予算70兆円の軍隊がついてるから
コンピュータ技術でアメリカに勝てる国などいない
日本はアメリカから技術をパクって成功したが、いつの間にか自惚れるようになって
自惚れているうちに台湾や韓国に同じことをされて自滅
中国もアメリカに次ぐ軍隊を持っているからそのうちコンピュータ技術で台頭してくるだろうな コンピュータは軍事に直結する技術
だからアメリカが中国に対してCPUやGPUの輸出規制してるのだって
アメリカの半導体産業やコンピュータ産業を守るためじゃなくて安全保障上の問題からだからな >>114
ルネサスはトヨタや日産が元気なうちは車載向けでやっていけるだろうけどね
ルネサスではCPUコアとしてARMを採用したものが増えて
ルネサス独自CPUの存在感がどんどん薄まってきてるけど >>114
いまはarm自体が遠くなりそう
armって極論で枯れた技術の製品を需要が多い時期にクアルコムが先行投資する
ただそれだけの設備投資業だった
そしてARMの中身性能はPEN4世代のCPUとやってることが変わらなくて
過去10年のGPU中心のsocの進化に全く及んでない
いまのARMの中身、構想は2005年くらいにもあって、これ並みのsocをたしかソニーが提唱してた
ネットググれば当時のアーカイブ残ってるよ「1.5ghz×4c×fhd再生のLINUXチップ」ってコンセプトでたしかCELLの亜種だった
で結果現在のARMはそれで躓いて、GPUによる並列処理で省エネ高速をめざす現在のアプローチに及ばず
ai、クラウドでGPUは不可欠だが、armは別にいらんってことになっとる
こういう時代でai、クラウド、学習機材受注が偉いことになるとわかったから
INTEL、APPLE、AMD、NVIDIAは自社チップとAPU開発強化したんだ
で肝心のスマホarmは
・CPU単体の処理力はPEN4-初期コア2並
・GPU力はアトム並、コア2世代のapu用チップ並
・GPU中心の処理負担源ってやつができん
・クロックを押し上げても性能のばせず、CELLと同じでCPUパワーのみを押し上げても
いくらやってもソフト処理速度は向上しない
ようはソニーが描いたモバイルCELL構想を実現したarmすなどらは、モバイル版作ったらせいのう、理論がcellで性能のびなかった
こういうことなんだわな。835はどうベンチやっても14nmコアmに全く叶わないくせにコストクソクソ高い。
これを3nmにしても性能伸びない。
なぜならいまのpcのCPUはGPUレンダリング補助で省エネ、ツールを高速化するのが常識だから
でクアルコムはそのための技術も準備もないまま淘汰ひってい。
aiに採用するのも基本GPUの高速並列計算で、ARM社の特許技術なんか一切金にならん
こういうのがいまの実態 ARMと泥自体が2014-2015年で性能向上の限界がきて、中身はすなどら650、800で終わりなわけだ
で性能限界でハイエンドとタブレットのセールスに陰りが見えたのが2015前後
そして14-16nmの800-650あたりのやつにたいし835はたいして進化できなくて、3nmでもパワーアップしない。
それはマルチコア1.5-2ghz級のCPUで処理するソフト、アルゴリズムは例え3-4ghzまでやっても強くならん。
これ以上はデュアルコア、マルチコアの限界がコア2で迎えてから、GPU補助レンダリングに以降した10年前のCPU業界と同じだよと
結果ARMとすなどら理論では650級で十分で、これ以上は無意味で捨てられPOWERVRを採用して
ソフトもアルゴリズムも変えていかないと無理と
逆にいまAMD、INTELは3-7nmに以降すればRYZENAPU並の5-7wのタブレットやら、3wのWINDOWSMOBILE作れるやんて話
アーキテクチャとアルゴリズムの使い方が古すぎて、DDR4x、LPDDR5つかっても性能恩恵ないが
AMD、インテルは恩恵受ける
またスイッチがTEGRAな理由はゴミADRENOじゃアルゴとOSとエンジン適合性がクソで
実行性能ゴミだってわかってたから
なのでこれから飛躍するのは旧来のWINDOWSPC勢
google、すなどら、ARM、ソフトバンク、サムスンは割りくって大衰退する
それこそスマホ、タブレット、泥のアプリコンテンツは泥2.4、すなどら1-4からたいして進化せず停滞したままで
みんなYOUTUBEも飽きちゃったろ。すごいゲームの移植もなく紙芝居ソシャゲしかないだろ
こういう理由だわな。 例えばグーグルなんかは、YOUTUBEの低迷とCHROME、YOUTUBEの広告が停滞気味
利用率も低下
いまソシャゲの売上の収益で3000-5000億は利益出てるけど、こんなん日本のたかが数十万のコア消費者が離れたらおしまい
こういう危ういすごく杜撰な収益実態の各社が停滞陥ってるのがスマホ勢
ハイエンドスマホも内実4-5万のコアmタブレット、ノートに勝てんのだから、意味なくなった スマホ業界勢ってのは、日本のかっての携帯コンテンツビジネスの丸パクリをやった
それらをよりずさんに大規模投資でやって日本潰したのがスマホ
けど中身のない薄いコンテンツで5-10年ごまかしたが、もう停滞がきて
各社はそれまでの莫大な投資設備なりは残ってるが、その量だけあって中身内設備、コンテンツがもう相手にされなくなって
飽きられつつある
これがスマホ勢実情で、たいし不利な状況で利益だして将来勢あるのがPC勢
いまPC勢は弱いけど、あと5年で逆襲可能で株価も売上もひっくり返る
スマホ勢はシェアこそもってたけど、ビジネスモデルと技術は低くて
シェアだけあって競争力はクソやったと ARMのように広く使われるにはIPコアが広くライセンス販売されないと無理
IPコアとしてライセンス販売されてるコアのうちARMスマホで広く利用され性能も向上してる
ARMクラスの性能でIPコアとしてライセンス販売されてるCPUコアはあまりないよ スマホによって半導体業界で起きたことはファウンドリの大躍進
それによってTSMC、サムスンが半導体製造技術でIntelに追いついてしまった
AMDの復活もファウンドリの製造技術の向上あってのこと
そして自前のCPUアーキテクチャをもたない企業にとってARMはとても便利な存在になってる
ARMがこのまま行くか、他のものに取って代わられるかは知らないが
これから先も同じような状況になるだろうね まぁFabはさておき、もうモジュール設計を経て旧来型発行からの脱却時期だぁね
その意味じゃ一番マシなのはx86系だろう、電力軽減の機構は1Trのパラメータ変遷から言って利点では無くなる
何れにしても分水嶺だな x86が使えるのは実質IntelとAMDだけだからね
実質2社の独占だから他部分に強みを持った他社が付け入る隙がある
ARMはARM製のIPコアも使えるし、独自に回路設計したARMを他社が作ることも可能
こういう広く使えるところが支持されてる
ただ、ARMが勘違いして独善的なことをやりだしたら、みんな別のものへ移ってしまう
ARMは便利だから利用されてるだけだから >>130
ARMが低消費電力に向いてるなんて方便だぞ
広く普及した自前のCPUアーキテクチャを持ってない半導体メーカーが重用してるだけ
32bitのARMの命令セットは組み込み向けの設計で低消費電力的な用途に向いてたが
64bitのARMの命令セットは別に低消費電力的な設計ではないからな
今更、自前で新しいCPUアーキテクチャを作っても広く使ってもらうことなんて簡単にはできないから
広く使われてるARMに乗っかってるだけ 自前で設計できるならRISC-Vという選択肢もあるがわざわざARMのソフトウェア資産を捨てる程の利点はないな。魔改造しても怒られないからそのためのベースとしては有りだが。 >>121
ハイエンド車載マイコンはRH850が主体ですね。 >>134
まぁある程度引き継いでるし多少はね?
にしてもx86_64とARMが殆どで、他の有象無象が毛根並みに死滅してる現状はちっとも面白くないな
かと言ってRISC-Vみたいなスペシフィック系が躍進しても面白くない
普遍的になりようが無いし、何より魅力を全く感じないわ なんだかんだでx64+AVX512が一番性能優先のISAというのがな。
高機能すぎて実装に金が掛かるからもはや対抗できないという。 POWER系とGeforceでAPUみたいの作ってみて欲しい >>139
革ジャンをトップから引き摺り下ろさん事には無理だろ ルネサスはM&Aで医療用か宇宙用に手を出すみたいだがどこを買ってどんなのを作るのか
RAD5500みたいな高性能品作るつもりはないのか。 >>136
RH850はエンジン制御とかじゃないの?
情報系や自動運転とかを目指してるR-CARは64bitのハイエンドのARMだね POWER9はNVIDIAのGPUとの連携強化を謳い文句にしてるね
IBM、「POWER9」プロセッサ搭載のサーバーシステム「Power Systems AC922」
https://pc.watch.impress.co.jp/docs/news/1095421.html
>Power Systems AC922は、PCI Express(PCIe) 4.0や
>NVIDIAのインターコネクト規格「NVLink」、
>オープンなプロセッサ間コヒーレントインターコネクト
>「OpenCAPI (Open Coherent Accelerator Processor Interface)」を組み込んだ初の製品となり、
>PCIe 3.0ベースのx86システムよりも9.5倍高速
>(x86とPCIe 3.0 x16の最大転送デート15.75GB/s、
>POWER9とNVLinkの最大転送レート150GB/s)な転送の実現を謳う。
>AC922は、前述の高速なインターコネクトを活用し、
>アプリケーションがシステムメモリをGPUメモリとして活用できるようにすることで、
>AIモデルが大きくなってしまい、GPUメモリが不足してしまう問題に対応している。
>NVLinkにより、CPUとGPU間でメモリを共有しても、
>x86サーバのようにPCIe 3.0によるボトルネックが発生しないという。
> AC922では、16/18/20/22コアのPOWER9プロセッサを2基を搭載可能で、
>最大44コア構成が可能。GPUはTesla V100を2〜6基搭載できる。 今風のコンシューマ向けの手頃なPowerPCがない件 >>139
作っても使うところがないような
PC用やスマホ向けには作らんだろうし
いわゆる車載SoCだとNVIDIAは自分で作ってる
POWER系向けだとNVLinkやNVSwitchでGPUいっぱい積む方向だし >>144
IoTの波に乗るマイコン事情 第3回
〜ARMのライバル「MIPS」、「PowerPC」、「x86」
https://pc.watch.impress.co.jp/docs/column/1month-kouza/684769.html
この記事によればPowerPCをやってたところは64bitのARMに行っちゃった模様 PowerPCやってて64bitのARMに行ったAPMはX-Gene3を出す前にMACOMに買収されたようだが
別の会社がX-Geneの事業を買い取って新しい会社が設立された模様
Intelの元社長、サーバ向けArm SoCで再始動
http://eetimes.jp/ee/articles/1802/07/news067.html こんな記事があるけどどうなんだろうね
HPE、米国エネルギー省向けに、世界最大級のArmスーパーコンピュータを開発:ベースとなる「HPE Apollo 70 System」を日本でも販売開始
https://www.hpe.com/jp/ja/japan/newsroom/press-release/2018/071701.html
総コア数14万5000個以上のデュアルプロセッササーバ2592台で構成:
目指すは世界最大級のArmスパコン――HPE、米エネルギー省との共同による「Astra」開発計画を発表
http://www.atmarkit.co.jp/ait/articles/1806/20/news041.html
サーバー向けArmプロセッサのもう1つの刺客、Cavium「ThunderX2」
〜8チャネルメモリ/2ソケット対応
https://pc.watch.impress.co.jp/docs/news/1091494.html HPE、ARMベースのHPC専用サーバー「HPE Apollo 70 System」を販売
https://it.impressbm.co.jp/articles/-/16414 GUI表示する情報系に必要なチップのスペックはいまのルネサスの車載マイコンじゃまったく足りない
とくに上位車種はナビと車内システムが一体なのでより高性能なSoCが必要
iPad上位機種くらいの性能は必須 カーナビの画面ってなんであんなにカックカクなんだろうな スマホやタブレットSoC流用したような中華ナビはサクサク動く
ルネサスのSoCつかったカーナビは性能低すぎて使っててイライラする 測位が高速じゃないから、画面更新頻度を高くしても意味がないという考えでは というかやる気ないんでしょうな
どうせarmなんだからどうしても性能欲しければa72以上の使えばいいわけで
そうしてないわけだから。 >>153
日本製低スペ石使うからですよ
プロセッサ有ったのに全滅した間抜けを舐めたらあかん
ついでに犯人たる禿は吊れ カーナビは1Hz,5Hz,10Hzとかの低レートでしか測位してないから
大抵は1hz >>156
今のR-Carの最上位のH3はCortex-A57 x 4 + Cortex-A53 x 4 + Cortex-M7だけど
できたのが2015年だからね
Cortex-A72もしくはCortex-A75もしくはCortex-A76を使ったやつは開発中なのでは? >>159
だとしたら企業としての動きが遅い的なツッコミ入るだろう
組み込みだからってのはわかるが…… 中華ナビでもそんなに高性能な石使ってるわけでもないし同世代の製品使えば性能は足りてるんだよ。
国産カーナビはガラケーと一緒でソフトの方が進化しないので古い石使ったままってパターン。 >>160
組み込みフラッシュのつごうでそこまで微細化進んでないんじね?
40nmとか28nmで進んでる方とか言うし。 カーナビで組み込みフラッシュ使うようなMCUの必要はないし
ルネサスもARM以前のSHシリーズの頃からごく普通のSoCで現行最新は16nmだよ。 カーナビなんて余り物詰めてぼったくり価格で売ってるだけだと思ってた まあそこそこのカーナビはGPS+各種センサーだからねえ… >>163
ロジックは放っておいてもfab が勝手に開発してくれるが
フラッシュ混載はそのようなことはないから、不揮発内蔵マイコンの時期が
スマートフォンSoCやGPUなどよりも後になるのは仕方がない。
https://www.renesas.com/ja-jp/about/press-center/news/2017/news20171206.html ロジックとFlashを同じダイに混載するんじゃなく、
別ダイで作っておなじチップ内に放り込むとかじゃだめなの? R-CarのH3は16nm FinFETだからフラッシュは別チップのSiPだね
スマホみたいに1割でも性能を高く、という業界じゃないので、新製品の投入は7nmまで待ってるのでは >>169
その書き方だとフラッシュがパッケージングはされてるように思えるけど
ストレージは外部バス前提だよ。 PEZYはまだ終わってなかったんだな
安心した
PEZYの他にNVIDIA Tesla V100を使ったスパコンも作るらしい
PEZYグループの本業は液浸冷却システムみたいだしな
スパコンのエネルギー効率を競うGreen500 - 理研のシステムが連覇
https://news.mynavi.jp/article/20180709-660498/
https://news.mynavi.jp/article/20180709-660498/2
> 現在、PEZY/ExaScalerでは、
> NVIDIAのV100 GPUをアクセラレータとして使うZettaScaler-2.4の開発を行っている。
> 次の図を見ると、細長いボードにCPUと3個のV100 GPUが搭載され、
> このボードが12枚でブリックになるようである。
>
> NVIDIAのV100 GPUの方が性能が良いという訳ではないが、
> V100 GPUを搭載したシステムが欲しいというユーザの要求に応える製品開発である。
> 次回のGreen500には、このシステムで参加できる予定であるという。
> 開発が遅れている次世代メモリ技術
> PEZYはUltraMemoryと共同で、
> プロセサと積層DRAMチップを磁界結合で2TB/sのバンド幅の接続する
> TCI(Thru Chip Interface)を開発している。
>
> PEZY-SC2はDDR4 4ポートの76.8GB/sのメモリバンド幅しかないが、
> TCIが使えるようになれば、
> これが2TB/s(4個の積層TCI DRAMを使用する場合)と20倍以上のメモリバンド幅となり、
> メモリ性能は改善する。
>
> TCIは開発が遅れているが、
> 2018年の末にはいくつかの評価結果を公表できると考えているという。
> 次世代プロセサは7nmを採用
> そしてPEZYの社内ではPEZY-SC3の設計が進んでおり、もうすぐにテープアウトの予定であるという。
> PEZY-SC3は7nmプロセスを使い、4096プロセサコアを集積する。
> そして各コアは128bit長のSIMD演算器を搭載するとのことであり、
> 同一クロック周波数での倍精度浮動小数点演算性能は、SC2と比べて4倍になる。
>
> さらに、PEZY-SC3を使ってZettaScaler-3スパコンを開発する。
> 浸漬液冷の能力の改善など行い、30GFlops/Wの電力効率を目指す。 ちなみにこれらは全部PEZYのグループ企業
PEZY Computing
ExaScaler
UltraMemory >>173
まだPEZY終わってなかったのか
とっくにオジャンになってポシャったのかと思ってたわ
へ〜〜日の丸CPUな〜〜
頑張ってほしいな〜〜
メモリも凄いの開発してるみたいだし そんなツテもなさそーなのに7nmポンと作れるもんなのか >>176
海外もコネ社会だけど、そのコネはひょいひょい変わるコネで、
何ができる人間かによる。実際にやってみせた事をもつ人は強い。 >>175
DMMの子会社になって資金面での心配がなくなったからね。 仮想通貨マイニングで「先端半導体ライン争奪戦」が勃発
https://limo.media/articles/-/6332
前工程の製造はTSMCが担う。
設計は従来、パートナー企業ととともに進める予定であったが、
現在はこの設計会社に対して直接出資を行っており、今後GMOグループの傘下となる見通し。
なお、ASIC開発には100億円弱の投資を行っている。
ちなみにこのパートナー企業は、
スパコン開発ベンチャーで元社長が助成金の不正受給で逮捕されたPEZY Computingとみられている。 >米国軍は14nmプロセス技術と2.5D(2.5次元)チップパッケージング技術の
>信頼できるソースに欠けている。いずれも、ハイエンドの商業製品に
>幅広く用いられている技術である。
>米ベル研究所がトランジスタを開発して以降、DoD(国防総省)が
>最新技術へのアクセスを持たないのは初めてのことである。
米国、半導体への投資を増加する動き
http://eetimes.jp/ee/articles/1808/07/news025.html
昔、ビデオデッキのベアリングの方が兵器の部品よりも高品質だったなんて
話(真偽は定かじゃない)があったな、そういえば なんでもかんでも外注外注で気が付いたらスカスカなんてよくある話だろ >> そして各コアは128bit長のSIMD演算器を搭載するとのことであり、
MIMD捨てて、ってわけじゃないだろうがSIMD導入なのか
7nmで4096コアだと技術提携先のディッツェルの所の構想と真正面から競合すると思うが。
あっちはRISC-Vの4096コアにベクトル命令でしょ >>185
あの人はPEZYの技術顧問でもあるからな
どっちにも一枚噛んでるよ PEZY、近接チップ間無線通信技術を手掛ける米ThruChipを子会社化
https://news.mynavi.jp/article/20150511-a205/
> また、ThruChipのCEOでTransmetaの創業者CEOなどでも知られるDavid R. Ditzel氏が
> PEZYと8年間の技術顧問契約を締結しており、
> 今後のTCI技術やプロセッサ技術分野の応用などを担っていく予定だとしている。 >>183
元々軍用部品ってそんな質のいいもんじゃないよ
一番はアップデートがほぼ無いという特徴から高品質な新規部材があっても新規で制式しないと使われないって事
更にその制式に数年かかるので「その間変化のない部品」以外は時代遅れも珍しくない >>186,187
それは知ってるが勢力内で同じものを開発するのもバカらしいし、
Esperantoの方の構想をPEZYが飲んだんじゃないかという推測をしてしまう。
PEZYはあまり実績がないベンダーかもしれんが、Esperantoはそれすらない状態なので
PEZYを利用して実現できるなら万々歳だろうし。 >>188
ベアリングの下りに対するコメントなら、おっしゃる通り。
米軍関係者の懸念は、軍用開発完了や配備が民生販売より遅いことではなく
民生販売時点で軍用の開発開始すら出来なくなったことだと思われる >>190
ソイツは問題ない
民生用の方が良いならそっち使えば良い話だから
軍需ってのはそういうもので、そのうち民間委託になるのは必定
だから彼らがやるべきはそっちじゃなく、もっと先端の方
シリコンじゃなかったり現存の構造じゃなかったりする方 最先端の民間が国内になかったりするから問題なんだよ。
とりあえず日本を脅しとけば何とかなってたけどね。 >>191
よくないから困ってる
軍備にも色々あるが、一番クリティカルなところは
>製造施設の全従業員を米国市民
とかだから、IntelもGFも担当できない >>193
大丈夫だろ
どーせ先端なんざ耐久的に使えたもんじゃないし、どうしてもそんなワガママ通したいなら軍需用の企業一発起こせば良い
その場合intelのダブついてる国内工場を徴用するなりなんなりして
予算が無いならそれはそれでどっかと戦争やれば良い
寧ろ米軍でそんなに日和るなと、日本とか他の雑多な小国はどうなんだよ
その辺死んでるじゃねぇか f-35のコンピュータはgfニューヨーク工場ではなかったかな
作業員が全員アメリカ人かは知らない 知識が増大するにつれ、彼らは互いを愛したり心配したりすることはなくなる。
彼ら相互の憎しみはあまりに大きく、彼らは自分の親戚のことよりも、自分たちのもっている所有物や小物のことを気にかける。
人々は、自分の隣人よりも、自分がもっているいろいろな機械や装置のほうを信頼する。 軍需関連は結構枯れた技術使ってる場合多いしなぁ
潜水艦だって米海軍最新の原潜でやっとこさUSB接続するXboxコントローラー採用したくらいだしw >>198
箱コン使うてマジたったのかw
なんてか軍事にそういうのよく使うんだな
少し関係ないが、前にIBMがゲームのパフォーマンスはCPUのパフォーマンスに直結するて論文出してたっけな むしろ何か超自然的なパワーでゲームが動いてると思ってるのか IBMパイセン、コンシューマ向けCPUに新風オナシャス 戦争はゲームじゃねえんだぞ!!!
まあけど360のコントローラはかなり人間の体にフィットするのはそう
他のコントローラも多かれ少なかれ、あそこから取ってると思う‥‥ https://pc.watch.impress.co.jp/docs/news/1137913.html
17年前の「VIA C3」プロセッサにバックドアが見つかる
なお、C3 CPUの一部(C5系)には、隠し命令セット「Alternative Instruction Set(AIS)」が組み込まれていることがすでに明らかとなっている(関連記事:VIAの次世代CPU「Nehemiah」がMPFに登場)。
これは本来CPUのデバッグ&テスト用であり、内容は特定のユーザーに秘密保守義務契約を結んだ上で公開していた。今回の“バックドア”はこの命令を利用していると見られ、命令セットが流出したか、発見されたと思われる。 テスラvsエジソン?希代の発明家がかつて繰り広げた"電流戦争"。
その結果、コンセントまでは交流になり、デバイスの手前で電源アダプタなどで直流に変換されている。これまで陽の目を見なかった直流配電だが、近年その必要性が増しつつあると言うのだ。 グループウェアを提供するサイボウズは、来年1月から企業経営者を対象にした経営塾事業を始める。
1月から3月までに1日8時間の講座を6回実施。定員は20社で、価格は1社につき200万円だ。
サイボウズの青野慶久社長など同社の経営陣が講師を務める。「6日間で200万円」という経営塾にはどんな顧客が集まるのか。
青野慶久社長に聞いた――。
■「いい話」を聞いただけでは組織は変わらない 「なぜグループウェアの会社が、 レイトレのハードウェアアクセラレーションか。
10年……いや、20年遅いな >>209
>Turingは12nmプロセスでダイは754平方mm。トランジスタは186億。
>動作周波数のブーストは約1.7GHz
>RTX 5000 16GB/32GB 6GigaRays/sec $2,300
>RTX 6000 24GB/48GB 10GigaRays/sec $6,300
>RTX 8000 48GB/96GB 10GigaRays/sec $10,000 パーソナルは遠いな。ゲーセン筐体でももっと安いのでは。
テーマパークのアトラクションならいけるか? >212 はQuadro税なだけでGeForceの価格帯でも出せるのか。
そういえばGP102のTITAN Xp を20万円、Quadro P6000を65万円で売ってるな nvidiaのgeforce 2080/2080TiにNvlink積んでくるみたいね
従来のSLI端子のかわりにnvlink
このnvlinkは、SLIでGPU用途にしか使えないのか、
それともサーバ用GPUみたいにGPGPUのインターコネクトとしても使えるのかは知らん 2080ti のマイニングレートにしか興味がない、レイトレーシングとかどうでもいい、2080ti は掘れるのか? SKL-Xの発表でもここまで会場が冷え込んだことはなかった
あの場にいたみんなドン引きしててワロタ、ワロタ…… プレゼンの仕方が悪い
何が出てくるのかはバレバレ
なんだからさっさと発表して
ゲーム紹介に移るべきだった https://wccftech.com/nvidia-geforce-rtx-2080-ti-performance-preview-4k-100-fps/
NVIDIA GeForce RTX 2080 Ti Performance Previewed ?
Delivers Well Over 100 FPS at 4K Resolution and Ultra Settings in AAA Games, Ray Tracing Performance Detailed
We have multiple reports on the performance of the new cards with RTX enabled and the game ran
at around 50-60 FPS on average on a single GPU.
No resolution or settings are mentioned but other tech pubs are mentioning
that the demo was running at 1080p resolution and performance isn’t that optimized yet. 富士通、スパコン「京」の後継機用ArmベースCPU「A64FX」の仕様を発表
https://pc.watch.impress.co.jp/docs/news/1139081.html
https://www.anandtech.com/show/13258/hot-chips-2018-fujitsu-afx64-arm-core-live-blog
製造は7nmで、富士通もHBM2を採用
4スタックだと容量が足りないのではという気もする
13コアをXbarで纏めたCore Memory Groupを4つリングバスで繋いでる
それぞれのCMGにHBM2が一つ繋がっていてリングバスを使わずともアクセス可能みたいね トランジスタ数がめっちゃ少ないな
7nmで87億Trってダイサイズが200mm2を下回るんじゃないか? Tr数表記はFabどころかメーカー毎に基準が違うとあれほど >>226
最初からHBM2だったわけじゃなく、途中でHBM2に変更したんでしょ?
たぶん最初はHMCの予定だったのでは?
HMCの先行きが不透明なこと、ライバルメーカーが高性能なHBM2を使ってきてること、
HBM2の実装技術が進化して少量生産品でも比較的安価になったのとかが関係あると思う HMCガー豪語してた◎がついたバカが消えて久しいな 結局いまいち、広まらんかったな
MCDRAMにしてたwave computingも次世代はHBMいうとるし >>233
コストは元からHMCのほうが高かったよ
生産性・拡張性ではHMCが有利だったけど
結局は、高バンド通信に耐えられるM/Bは高価にならざるをえなかったみたい Prodigyとか聞いたことなかったわ、なんだこれ post-K以外にも今度こそ色々売るつもりなのかな >>242
・汎用CPUとしてはトップレベルの幅を持つ 512-bit SIMD レジスタ
・流行のディープラーニング AI 向けに8-bit 整数までサポートしてる SIMD 命令セット
・オンチップでノード間ネットワーク内蔵
・HBM2対応
・ARM v8 準拠
設計時期が良かったのか現代のハイパフォーマンス CPU に望まれている機能がてんこ盛りになっているす。
米中の貿易戦争も追い風になって売り方さえ間違えなければ成功わ望めるかと。
コアクラスタの単位である CMG 1-2個の A64FX Jr. 的なものを早期にリリースできることを期待するす >>244
汎用CPUっていっても、HPC用の専用の命令・レジスタつかわないとパフォーマンス出せないんだから
すでに汎用とはいいがたいだろ
標準的なAArch64じゃないんだし >>245
>汎用CPUっていっても、HPC用の専用の命令・レジスタつかわないとパフォーマンス出せないんだから
それは AVX(2 or 512) でも同じことかと。市場に出回るコンパイラの性能次第す
ただレガシーコードが存在しないのは有利だし、科学技術計算ソフトも自分でアルゴリズムを考えるより誰かが最適化したバイナリを Python 経由で使うのが普通になって来たというのも追い風になるかもしれないす A64FXをPCI-Eアクセラレータボードにして研究者に配ろう レガシーコードが存在しない、とは言うけど
なんだかんだ言って、今ある他機種向けに書かれた奴を移植するトコからだろ〜
バイナリで丹念にチューニングされたアプリって
正直、今はどのくらい利用されてるのかねぇ… ベクタ特化型で整数演算性能が低いもののコア数減らしてどうする。 >>250
GPUわ全く同じやり方で製品ラインナップを構成しているす >>249
>バイナリで丹念にチューニングされたアプリって
典型的なレガシーバイナリの問題わ用意されたアーキテクチャレジスタ数すら使い切らないというモノがあるす。
シリーズ最初のモデルから潤沢なレジスタ数があると言うことで未来へ向けて良いスタートを切ることができるのではないすかね A64FX のをスケールダウンしたスピンオフ版について懸念があるとすれば HBM2 の仕様上の上限が 8GB/パッケージ である為、CMG あたりのメモリも 8GB に制限されてしまうことす。
仮に NEC の SX-Aurora TSUBASA の様にアクセラレータカードとして売るにしても、8GBではカードあたりのメモリ容量が少なすぎて応用範囲が狭くなり、かつて HBM1 VRAM 搭載の Radeon のような失敗が予想されるす。
ちなみに TSUBASA の “Vector Engine” カードのメモリ容量わ HBM2 メモリを6個搭載して 24~48GB す。
スケールダウンして売るには GPU 同様に GDDR 版も用意する必要がありそうすけど、折角の汎用CPUすからカード売りももったいない様な… 他のパターンとしては CMG 4つのままで一部のコアを殺したバージョンを廉価版として売る方法もあるかと思うすけど、ダイサイズの情報がないので intel や AMD に対して競争力があるほど低価格化できるか謎す。 どうせ普及できるか否かわ価格で決まるすから、カードあたりの価格を GPU 程度にして、DIMM を増設する如く計算に必要なメモリ容量分だけ CPU と HBM を載せたカードをマザーボードに挿して使うというのわ如何すかね?
汎用CPUなので 1 個でも n 個でも同じ様に起動できるなら GPU 等のアクセラレータに対するアドバンテージになる様な気もするす。 富士通は、post-K用に専用に開発されたコードだけじゃなく、
OpenCLコードも、それなりに動かせるようにしたほうがいい
OpenCLコードが小改良でそれなりに動けば、
使えるソフト資産が一気に増える >>256
汎用 CPU なので MPI と OpenMP で十分でわ?
こちらの方がアクセラレータより歴史もあるしコード資産も多いと思うす。 PCI-Eボードにする場合はTOFUを外に引き出せるようにして超高速ネットワークカードの機能も持たせれば付加価値が上がりそう >>246
>誰かが最適化したバイナリを Python 経由で使うのが普通になって来た
そうなんだ? 何がどうなったら「普通」? ところで Post-K チップの仕様が明らかになってみると、アンコア部分の仕様わ昨年発表されたディープラーニング用チップ DLU と同じすね。
http://www.fujitsu.com/global/Images/deep-learning-unit.pdf
富士通がスパコン開発を単なる公共事業として扱わず、ハイエンドからローエンドまでカバーする共通アーキテクチャとして普及させる戦略を立てていることを期待したいす >>260
>そうなんだ? 何がどうなったら「普通」?
OpenFOAM や LAMMPS, Quantum Espresso, 等々、有名どころの科学技術計算ソフトの多くが python から制御できる API をサポートするようになってきました TOFU に関してわ SPARC64 XIfx に搭載された第2世代の仕様より改良されているらしいすけど、Hot Chips のプレゼンには詳細が無いす。
メモリのコヒーレンシがサポートされたという話がないのであれば TOFU 越しの SMP わダメで CMG 間の接続に使われているレングバス相当のインタフェースを外部に出さないとソケット/チップ間の SMP わ不可能なんすかね? 他ノードとハードウェアでメモリのコヒーレントなんてやったら、処理速度・ワッパが大幅に落ちて使い物にならなくなる
コヒーレントするのに必要なトランジスタ・電力・無駄な帯域がアホみたいに必要
むしろコヒーレントしないことによって性能が上がるんだよ
どうしてもコヒーレントが必要な処理は、それ用のライブラリでも用意して、
アプリからそれを使ってもらえばいい SPAR64 VIIIfx (58W)を88128個の京は12.7MW、1CPUあたり144W
post-K は30〜40MWの予定
1EFLOPSには2.7TFLOPSだと37万個必要
京と同様にsystemがCPU Wの2.5倍程度消費するとしたら
CPU Wを32〜43W(system 81〜108W)程度におさめれば37万個使える
たぶん無理だな。1EFLOPSと言わなくなってるし37万より少ないのだろう おや?37万に近いのかな。もしラック数が京と同じ864なら331776ノードになるな。
2.7TFLOPSで単純計算だと約0.896 EFLOPSか
> 384 nodes/rack
http://www.fujitsu.com/global/about/resources/news/press-releases/2018/0621-01.html >>264
バスがメモリコヒーレンシをサポートすることと、ノード間でメモリコヒーレンシを維持する話わ別物す。
例えば IBM POWER などはオンダイのインタコネクトとチップ間のインタコネクトに同じプロトコルを使い、ダイ内部のバスはリンク数が多く動作クロックも高いという様な使い方をしているす。
物理インターフェースわ共通で、ノード内わ高速でメモリコヒーレンシを保ち、ノード間は低速でコヒーレンス無しにすればシステム設計の自由度わ上がるかと 331776ノード30〜40MWならCPU W 36〜48W(system 90〜120W)。
倍率は2.5倍より小さいかもしれないし、sysytem 120Wならできるか >>266
Post-K わ Linpack でエクサフロップスを達成するのではなく、現世代のスパコンと比較してエクサ相当のアプリケーション性能を出すものであるとのことす
https://news.mynavi.jp/article/exascale-2/ >>259
TOFUの場合、何が嬉しいと言っても高価なスイッチ不要なところす。
Omni-Path や Infiniband EDR ときたら… >>267
いまはダイ内でさえコヒーレント取らない時代だよ
コヒーレントが必要な時だけ専用の命令使ったり、
コヒーレント用のシステムコールやらライブラリコールしたりして、なんとかする時代
コヒーレントとらないから高性能化してるのに、いまさら逆行するわけないでしょ? >>271
>いまはダイ内でさえコヒーレント取らない時代だよ
神居太湖之光 やアクセラレータなど HPC 専用製品ならともかく、汎用プロセッサでそれわ許されないかと。最適化云々と関係なく世間一般のアプリが再コンパイルしただけでわ動かないという事態に陥るすから
実際に A64FX のオンチップ・リングバスわ異なる CMG に直結された HBM を SMP で使えるように 115GB/s × 2 の帯域を持つす。
---
- Four CMGs keep cache coherency by ccNUMA with on-chip directory
―- 48Vから1Vに直接変換、次世代電源システム向け製品で際立つ存在感 ―― Vicor
http://eetimes.jp/ee/articles/1808/21/news009.html
PEZY-SC2のパッケージにも載ってる降圧モジュールは
SM-ChiPというパッケージ技術らしい。 >>267 に書いた話題の補足す。
A64FX と同じサーバーCPUセッションで IBM が次期 POWER9 システムについて語っていたとのことす。
https://www.hpcwire.com/2018/08/23/ibm-at-hot-chips-whats-next-for-power/
この中で 25GT/s の外部高速インターフェース “PowerAXON” を、
- モジュール間 SMP
- GPU接続 (NVLINK2)
- アクセラレータ接続 (OpenCAPI)
に共用する技術を中心に発表が行われたとのこと。
将来的にわメモリバッファとの接続にも同技術を用い、バッファチップを変えることで異なるメモリの種類に対応するとのこと。アクセスレイテンシわ 5ns 程度のペナルティで済む見通しとのことす。 件の PowerAXON 接続のメモリバッファとDRAMを搭載したメモリモジュールわ JEDEC で OpenCAPI DIMM として標準化を図るとのことす。
RDRAM の再来すか…
なお POWER10 わ 2010 年以降に登場で、32GT/s と 50GT/s の2種類?の新型 PowerAXON を搭載して DDR5 メモリ(+ 対応メモリバッファ) で最大 435GB/s を越えるメモリ帯域を達成する予定だそうす
プレゼンの写真わ anandtech の方が充実しているので、こちらもどうぞ。
https://www.anandtech.com/show/13257/hot-chips-2018-ibm-power9-scale-up-cpu-live-blog ポスト京は1エクサFlopsを目指してるのに
A64FXはSPARC64VIIIfxと比べてピーク性能で21倍くらい
このばまだと京の5倍のプロセッサを搭載しないと達成できない
GPUでも積むのかな? まさかA64FXを37万個も積むなんてことないよね? >>276
http://www.geocities.jp/andosprocinfo/wadai18/20180630.htm
ーーー
その清水氏が,Post-KのExaFlopsというのは10PFlopsと称している京コンピュータの100倍のアプリケーション性能を目指すという目標であり,HPLでは1EFlopsを達成することは難しいと述べました。
ーーー 384 nodes/rack >266 と
2.7 TFLOPS/node が判明したからあとはラック数だけだ。
384 nodes/rackは京の4倍。2.7 TFLOPSは京の約21倍。
もし京と同じ864rack なら理論最大FLOPSは約84倍 調べてもLPDDR5についての記事しか出てこないけど。 >>283
>>274 のリンク先をご覧下さい。それから >>275 で
>> POWER10 わ 2010 年以降に登場で
と書いたのわ 「2020年以降」のタイポす >>283
試作品は既に5月にお披露目してたよ
来年にはDCで、再来年はハイエンドからコンシューマに出るだろう あーそういうオリジナルキャラクタ設定なのでお察しください。 10年前なら分かるけど今はちゃんと文章読んで欲しかったら
読みやすい文章を心がけるべきだよね
そもそも某コテハンの相方ってレベルだから間に受けない方がいいよ
あれが消えてからノコノコ出て来るようになったし
スルー推奨 自ら嫌われたい無視されたいと言っているも同然の
コテハンなんだからそう扱ってやればいい。遠慮は不要 >>289
折角なのでここだけ回答しておくす。
>読みやすい文章を心がけるべきだよね
そう言う方針もアリかと思った時期もあったすけど、5ちゃん自体の現状が閉じコンの上、プロセッサアーキテクチャに関する話題そのものが若い方の興味を惹く様な話題で無くなっている事を鑑みてこのまま行くことにしたす。 というかそこまで拘るキャラ設定の理由が気になる。
実生活は平文(?)だよね。
うう、スルーできません。
割となりきりというか、TRPG的なもの好きの壮年のエンジニアと勝手に想像。 つまり読んでもらう気は無いし読まれなくて良いという事だよな
こういうネットスラングを使ったり変な文法だと
後で読み返す時に意味がわからなくなったりひどく読み辛いって話なんだけど
わからん人には分からんか
その前にこの御仁は好き嫌いで褒めたり貶したりするから内容も読む価値無いけど 日本語不自由とか、読む価値ないと言ってる人いるけど、
一番アーキテクチャについて語ってるから駄文でツッコミ入れてるレスよりよっぽど読んでて楽しいんだが…
これすら読まない人達って、英語だと読まないタイプ? 言ってる技術的なことは正しくてもその人となりが好き・嫌いは別ってだけでしょ(団子と同じく
ま、そういう細かいこと気にしてたら2chなんてできないと思うぞ こういう読んでて楽しいからって擁護する人本当に多いんだけどさ
内容も間違ってるからな
appleがppc積んでた時の言動とIntel採用後にトンズラしちゃったダサさがね…
決して謝らなかったどっかのクソコテと同じ
信用がないんだから攻めて読んで頂くという姿勢がないとダメでしょ
昔からいる人はNGにしてるだろうけど知らない人は騙されるんだろうね 単純に読んでて面白いからってだけなら小説でも読んでな
もし本当に興味があるならryzen発売前後の団子発言をさらって来いよ
害悪でしかないから >>300 さんも書いてる今回の GF の決定に関する Morgan 氏の記事す。
https://www.nextplatform.com/2018/08/28/the-datacenter-impact-the-globalfoundries-7-nanometer-spike/
New York 州 Malta の Fab 8 にある 7nm 向け EUV 露光施設を今年2月に見学したそうす。
液浸と EUV の二本立てで開発を進めていたものの進捗の遅れに AMD/IBM の二大顧客に逃げられた末、採算が取れない故の決断であろうと IBMも密かに代替プランは用意しているとのことで、ファブを GF に売却した後もニューヨーク州立大学に設置したナノテク施設にて GF, Samsung, TSMC, ASML, Applied Materials とプロセス開発を行なっているとのことす。
製造自体わ Samsung が第一候補、TSMC がバックアップと予測しているす 「日本語不自由かな」という言葉も十分、日本語に不自由してる件
>>303
元から先進プロセスの開発部門は手放してないからね>IBM
しかし、こくなってくると自分でファブを埋められる垂直統合モデルの安定感が光るな 安定感なのか
それとも
ファブ稼働率上げる為の宣伝用なのか
微妙… その辺は微妙ではあるな(歩止まりに爆弾を抱えてきたのがSamsungの伝統だし)
だけど、顧客が付かなかったから収益モデルを実現できませんとならないのは強みかと ルネサスも自社製品作ってきたのに先端プロセスやめちゃったし
サムスンはスマホがあるうちは盤石なのか?
あと軍用はIntelが再び手がけるとかになるのかね。
ニューヨークの14nm品の後は。 ふっつうの用途だとなんもないのはそうなんだけど
鯖向けでこれはやばい
https://www.phoronix.com/scan.php?page=article&item=l1tf-early-look&num=3
そらベンチ隠蔽しようとしますわ >>308
軍用/航宙産業で先端はちょっとな
特に7nm世代は柔らかそうだし
GloFoによればFX-14なる謎のプロセスと12FDXでほぼ全レンジ賄う感じだがどうなるか >>310
軍用は今45nmやってるけど
次は14nmだって憶測があるんよ
その先がもうない…… FX-14はASICプラットホームでしょ
プロセスの事じゃないと思うけど IDTって昔x86互換やってたところだよね
Centeurにうっぱらったんだっけか HuaweiのKirin 980、TSMC 7nmだって
パフォーマンスもワッパもsnapdragonをを大きく上回る
2Big+2Middle+4Littleコアの構成 ARM発表でCortex-A75@2.8GHzとA76@3.0GHzの性能差が35%なのでそんなもんかな 生産能力の拡大が課題って自分で工場売り払ったんやないかーい 十年前のスレにタイムスリップ
「未来ではインターシルとIDTが一つの会社になるんだぜ」
「で、どうなるんだ?」
「ルネサスオブアメリカになる」
絶対信じないよなこんなの >>311
ソレすらダメだと思うけどな
14は無理して微細化したFF連中だし、作るにしてもGloFo14FF/HP-SOIとか
そもそも軍用にそんなプロセスが使われない理由の一つに信頼性がある、運用的意味合い以外も含んでな
まぁ45nm有れば今んとこ要らんとは思うけどね
能力的に必要なのはレーダー処理や防空だけど、開発時期から考慮してロートルも良いところのヤツがゴロゴロしてるし
大体新鋭も海上は何処も頓挫状態、陸は泥臭過ぎて不要で残るは航空だがコイツは余計使えないし必要ない
要るとしたら中華くらい、最近元気良い海軍といえばあそこだし
逆に他んとこ金欠とか何だかんだでgdgdだかんな
>>312
なるほど、言われてみりゃそうか 航空・宇宙なんて三桁nmがシステムとしてよく使われる世界だからねえ 信頼性とかもいずれは技術的に解決すると思う
まあ今米国が航空向け14nm模索していると言われるのは失敗するかもしれん。
日本は32nmだか40nmだかが限界なので米国から買うしかない。 45nmも富士通は売り払ったし40nmルネサスも売り払った
ロジック向けは何が残ってるんだろう? 45nm パナソニック・タワージャズセミコンダクター株式会社
TowerJazz 51%、Panasonic 49%
今でも同じ%かどうか知らないけど Panasonic UniPhier 32nm は国内で作ってたんだと思うが
会社、工場はどこだったのかな >>323
無理だと思うけどな
原理的にその信頼性って耐放射線とほぼ同義だから https://pc.watch.impress.co.jp/docs/news/1141509.html
XiaomiはSurge S2も姿を見せないし自社製SoCは断念したかと思ったら
RISC-Vに乗り換えとはチャレンジャーだなあ。 >>325
うわぁ、チャレンジャーだなぁ
まぁそんな中華マシマシなスマホなんて絶対使いたくないけど
新たにエコシステム作るんでなければやっぱりAndroidベースで作ってくるのか
はたまたAndroidでもない、当然iOSでもないXiaomi独自開発かそれに近いOS載せてくるのかね ・AndroidがRISC-Vに対応する
・Androidのフリー部分をかき集めて独自にRISC-V対応させる
(Googleプロプライエタリ部分やGPU等のドライバはどうする?)
・Androidじゃない独自OSを作る Androidを模した中華LinuxベースのOSを開発
なぜか中国のGooglePlayを利用できるようにしてGoogleと一悶着を起こす >>333
あるにはあるけど優先度は低いかなぁ
それが問題になるレベルにまで微細化したところで詰め込むモノが無かったり、、、 民間の超小型衛星ビジネスが産声を上げつつあるけど
そういったいわゆる「民需」のところでは汎用部品が使われることがあるので
思ったよりも重要かもしれない
軍需産業は自分とこでライン作って調達できるけど民間の中小企業はそうはいかんし
まぁシールドというか外装がしっかりしてれば大丈夫かね 軍用チップは、14nmとかのチップが直接外部と通信するのではなく、
外部とのインタフェース部分だけ40nmとかの高信頼性チップで作って、
内部的な部分を14nmとか7nmとかにすればいいだけじゃないの? 軍用なんかIBMとかゼネラルなんちゃらとかレイセオンみたいなとこが作ってんだと思ってた >>336
意味がない
演算部の信頼性がどっちかと言えば問題なのに
全部90とかその辺りが関の山じゃね、細くとも65/45くらいは欲しいし 普通にFD-SOIでいいのでは
耐放射線性能も高いみたいだし 18FD-SOIをSamsungが2020年に出荷するみたいだから
それ使えというこっちゃか?
GFはもはや信頼できないし、TSMCはFDSほようしらんが中国の息がかなりかかってるし 第2世代Ryzenは電力効率が極めて高くサーバー用途で4コアのXeonよりも「使える」との報告
https://gigazine.net/news/20180904-amd-ryzen-for-server/
比較対象がsandy bridgeなことを隠してryzenがすごいことを謳う偏向記事だな
これが許されるなら、intelは比較対象を全部bulldozerにすればいい 5年前の製品だったら更新にいかが?
ってのはあるが、5年以上前だよなSandyは sandyはmeltdown対策で切り捨てられてるし
sandyの鯖運用者がryzenを移行先に選んだ記事と考えれば偏向でもなんでもない AMD、Zenをベースとした55ドルのAPU「Athlon 200GE」
https://pc.watch.impress.co.jp/docs/news/1141522.html
米AMDは6日(現地時間)、ZenアーキテクチャをベースとしたAPU「Athlon 200GE」を発表した。
米国での推奨小売価格は55ドル。
Ryzen 5 2400GとRyzen 3 2200Gの下位に位置づけられるモデルで、
日常のWebブラウズからHDゲーミングまでをサポート。
競合と比較して最大67%速いグラフィックス性能と最大2倍の電力効率、
84%高速なHD PCゲーミングを実現するとしている。
CPUは2コア/4スレッドで、動作クロックは3.2GHz、キャッシュは5MB。
GPUはRadeon Vega 3 Graphicsで、Compute Unit数は3基。
TDPは35Wとされている。 TSMC子飼いメディアの願望はともかく
Intelは変な話、14nmで十分すぎるからなあ プロセスにチップを適応させてパフォーマンス出させるのに
4年ほどかかってるからね
昔より衰えたのは事実
ただ適応させた場合は凄いことになるのもそうだろうな
Cascade-LakeはTACCの人の話だが、AVX-512でクロックが25-30%上がる見込みだとか それがクロックなら同じく120%ありえないと思う
性能向上幅の読み間違えならありえるけど >>342
対象はあくまでもECCメモリが使えて安価に構築が可能な自宅サーバだからな
どう考えても最新CoffeeLake世代で対抗製品を投入しなかったインテルが悪い
Xeonの方がコア少ない逆転現象もまだ放置されたままだし >>354
比較対象がリプレース前の古いサーバである地点で、
最新製品の比較はしてないので何の意味もない
GIGAZINE読むのやめろ >>350
発熱量と消費電力がは40〜70%アップですってw ゲーマーからすれば多少発熱増えようがシングルスレッド性能が上がったほうがいい
そもそもK型番なんて定格よりさらに発熱させたい人が買うCPUだし >>356
cascade-lakeがそうだというソースが見当たらんけど >>349
その14nmも深刻な供給不足だけどな。
14nmで十分ならGFみたいに撤退して10nm以降に準備してるラインを14nmに転換した方がいい。
>>354
投入しなかったんじゃなくて生産能力に余力がなくて投入できなかったんだよ。
Coffee Lake Refreshが当初の噂より遅れてるのもその影響。 なんかOC耐性とかAVX許容限度とか
完全にCPUの耐久度で性能嵩増しする世界やな >>346
Athlon 200GE $55
Zenコア2C/4Tにしただけで、2年前AMD史上最速のAPUと
謳われたA10-7890Kをあっさり抜いちゃうね
iGPUは負けるけど、Bull系はゴミでしかなかったな >>359
供給不足ってウェハ不足が原因だったら生産ライン転換しても無意味かと
(むしろ10nmが使えるならそっちの方が同じウェハから多く製品取れる?)
しかも獲得競争の札束ビンタでTSMCに負けた(TSMCは数年分確保済み)とか何とか・・・ 供給不足を早急に解消しないと、
Intelに札束で買収されちゃうぜ。 IntelがAMD買収するとか独禁法関連から考えて
各国政府に認可されるわけがないから気にしないでいいだろう >>361
但しソレはイールド用の下位だから
コスト勘案するとちょっと良くなった程度だろう
14nm先行の効果がデカかったお陰で結果的にダメージ低減出来たとも言える >>352
cascade-lakeがそうだというソースが見当たらんけど ウェハを確保できても作る工場が足りてないんだけどね。 IntelがTSMCに14nmのプロダクトの一部をアウトソーシングとの話
coffeeや組込み(Atom)、特にSKL-SPの需要が大きすぎるというのは以前あったけど
ここまでとは IntelはCPUを最先端プロセスで作って、チップセットを古いプロセスで作る傾向があるけど、
10nmへの移行が遅れたせいで後ろが詰まってきてんのかね RYZENとEPYCに対抗するためにダイサイズ増やしたらキャパが足りなくなったのでは 今頃10nmに移行している前提で生産計画立ててたし
14nmの生産能力が増えないのに6コア8コアとダイの種類を増やしてるんだから当然だよね。 >>371
今年からチップセットが14nmになってパンクしたのかも >>372
間違いなくソレだと思うよ
廃棄分はかなり増えたんじゃねぇかな XeonでもCoreでもコア数増し増しだからな
そら足らんわ しかしまあクルザニッチは製造出身だけれど
一体どうやってこんな計画を了承したのだろうか
本人が目標述べて製造トップが頑張ったが無理だったのか
製造トップから出された数値を特に検討せず行けると思ってゴーサイン出したのか
或いは……
最初の計画の実質9nmから実質12nmへの変更はgdgd過ぎる
2年前に計画変更を示しておけと RyzenショックでIntelは急遽ミドル4→8コアと倍にせにゃならん。
10nmプロセルの遅延、欠陥のハードウェアレベルでの再設計・・・・・
Zen2はSkylakeのIPCを確実に抜いてくるから状況は厳しいね。
AppleもIntel見切ってMAC専用の自社製SoCを開発してくると
面白いんだがなあ。 AppleがAMD買収するメリットってなんかあるのかしら、と
iPhoneのプロセッサは命令セットArm系列だし
次期AirもArmという噂というか推測があったりするから
何らメリットはない気がする むしろAMDを分社化して特許はAppleに本体は支那に継承させたらいい。 AMD買収は政府からの横やり入るから無理
過去検討したとこは他にもあったが、あまりに困難すぎてやめた
そんくらいめんどい
GF作るときですら糞めんどくさかったし >>382
パテント維持するのも金がいるし
x86/x64やAMD GPUのパテントをAppleが必要とするとも思えないなぁ
将来的にiPhone SoCのGPUをAMD系に変えるのならともかく
そんなしちめんどくさいことしないだろう https://news.mynavi.jp/article/20180913-692288/
Hot Chips 30 - 自動運転などの頭脳となるNVIDIAのSoC「Xavier」(前編) >>381
ワコムは、ライバル社が参入してこないからぼったくり値段で売れてたわけで、
ライバル社が参入してきたからもうダメだろ
ライバルメーカーも初期のやつはワコムに比べてダメダメだったのが、
ライバルメーカーの製品が進化してワコムとかわらなくなった
いまやライバルと同じ製品を2倍高い値段で売るメーカーになった >>385
パテントはあればあるほどいいんだよ
コンピュータ業界なんて、みんなお互いにパテント侵害しあってるか、
クロスライセンスしてるかどっちか
パテントでもめたり、クロスライセンス交渉になったときに、
こっちのパテントがあればあるほど有利な位置に立てる
まあいまじゃパテントだけ持って実製品を作らない会社も増えてきたけど 富士通が明かした日本の次期フラッグシップスパコンの心臓部
https://news.mynavi.jp/article/a64fx-1/
>消費電力は発表されなかったが、かなり低電力のグリーンなスパコンになっているという。
>低電力になった理由にArmアーキテクチャに替えたことがどの程度
>貢献しているかと質問したところ、まったく関係ない。低電力化は
>富士通のマイクロアーキテクチャの改善によるという答えであった。 appleが、高性能CPU2コア+低消費電力CPU4コア+機械学習8コアのヘテロコアCPUを投入してきたな
ただし機械学習コアが内部的にどういった接続なのか不明
CPUコアの1つみたいにつながってるのか、それともiGPUみたいにある程度独立してつながってるのか、
まったく別のコンピュータみたいな感じでつながってるのかは不明 CNNのInferenceオンリーだから、どーせ
あとソフト実装のほうが大事なので全く期待できないで終わり アポ糞は性能だけ盛っても自社囲い込みが災いして生かせずに終わる AppleはiPhone向けプロセッサ外販してないし
Android採用のArmアーキテクチャに対しても優位性保ってるんだから
どこに問題があるのかと
iPhoneの利益率はかなり高かったはずだし >>391
TMSC 7nmプロセスで高性能コアは2.5Ghzで動く
A11のヤツが2.4Ghz
Geekbenchでシングルが1割ほどアップ(Appleの発表だと最大15%)
1次キャッシュを128Kとかなり大目に積んでんのね
A12Xは出るとしたらどういう高性能コアと低消費電力コアの数が
どうなるか楽しみではある TMSCじゃトヨタモーターズクラブだなw
TSMCだった >>394
そういうことを書いてるんじゃないんだよ
今まで基礎やってこなかったんだから応用なんかろくに出来ずに終わるというか
ハードが出せるスペックとは別の話だよ 生かせずって言うけど
別にappleとしちゃ、自社製品に必要な部品だから作っただけで
汎用的wとかって考えは塵芥程度に思ってる気がす(ry >>397
iOSやiPhoneのカメラ周りであまり悪い評判聞いたことないんだけど
探せば出てくるだろうけど、それはAndroidでも同じことだし
完全無欠のOSやCPUなんて存在しないんだし
Appleが自社開発OS等で当社比前世代の何%増しとかいうのは問題ないと思うけど
例えば泥だとNPUとか大仰な名前で売り込んできたHuaweiのKirin970だって当社比なわけだし その可能性もあるが、深層学習が盛り上がってるからなキャッチアップしなきゃ感が強い
50社以上買収とかだっけ?AIスタートアップを、まあなかなかの数をした
けどFacebookのような新興よりもいまだに圧倒的に弱い
ただまあそういうのに必要な文化がない(クックじゃなくてジョブズのせいである)から、どうしようもない気がするけどね >>399
うん、だからその
凄くずれてるんだよ‥‥ そういや消費電力当たりの性能って触れちゃいけないんだっけ? バイクは原付しか乗ったことない
持ってる人て今どんだけいるんだろ >>390
ARM・ISAが消費電力に関係あるかのような酷い言説が流通してたからな
インタビュアーもわかってて否定してもらうために聞いたんじゃないか。 ISAも十分関係あると思うがな
副次的あるいは間接的ではあるだろうけど
大体馬鹿食いと言われるx86にボッコボコにされた時点で前代のアレはつまり、、、 SPARCやMIPSのISAは100万〜1000万トランジスタで最適なマイクロアーキテクチャであるシングルスカラパイプラインの32bitプロセッサに最適化されている。その代表的なものがdisp30の分岐命令と遅延スロット。
これを32bitマイコンからスーパースカラの64bitプロセッサまで広範囲に使えるものに調整したものがRISC-V。
ARMは用途ごとに異なるISAを切り替えて使うがRISC-VはシームレスになっていてOSの対応が楽になるものの実用上差はない。 100万Tr RISCが効率的だよね
1千万Tr VLIWが効率的だよね
1億Tr〜 RISC風CISC?CISC風RISC?が効率的だよね 動作クロックが上限に達すると1サイクルで出来ることが多いCISCが有利になる
ただしこれはシングルスレッド性能に限った話でマルチスレッド性能やワッパはまだRISC有利だと思う 廃れそうなのはマルチプロセサの方か
世界を覆う不況の影〜 一周回ってCISCの次はデータフローだな
ただこれを従来のCPUアーキテクチャといえるかどうかは人によるけど スーパースカラの命令デコードの都合で高性能プロセッサは32bit固定長命令が必須。その上で複雑な命令は複数の命令に分割して実装しデコーダで連結して元に戻すことになる。ついでに32bitに複数の短い命令を詰め込むことも考えられる。これってRISC?CISC?VLIW? >>416
Out of Order実行はデータフローみたいなものだ。 べつにIA-32廃止しなくても、
IA-32コードは高速で動く必要なし扱いにして、実装・デバッグの手間を下げるってのが
いちばん妥当では?
いまは、16bit命令とか、x87命令とかがすでにその扱いだよね
これらは高速で動く必要なしの扱いを受けてるので、レガシーアプリつかってる人は
CPUを新しくしたらパフォーマンスが落ちるとかの現象があった
CPUメーカーのドキュメントで使用を推奨しない命令に設定した後、
ほぼつかわれなくなったレガシー命令は、順序高速化の必要なし扱いにしていけばいい
将来は32bitコードもそうなるでしょう だからIA-32(CPU)の廃止であってWOW64(アプリ)の廃止とは言ってない AMDがプリフィクス増やしてIA32以上にダメなISAになってるx64を何とかしないとな。 AMD64のIA-32互換系をある程度オミットすればスッキリする
足手まとい >>417
>その上で複雑な命令は複数の命令に分割して実装しデコーダで連結して元に戻すことになる。
RISC-Vはマクロフィージョン前提で作られてるようだからな
命令長に関してはx86のようにデコードが複雑な可変長の命令セットは効率悪いけど
RISC-Vのようにデコードしやすい形なら固定長の命令にこだわる必要も無いと思う >>424
デコードしやすい可変長ってなんかおかしくね
長さ変わるから面倒だつってんのにさ >>420
x86のIA-32とx86_64はARMと違って全く違う命令セットじゃないからな
例えば、32bitのオペランドでR8-R15を使わない命令は
IA-32でもx86_64とほぼ同じマシン語になる
微妙に違うところはあるけど、
x86_64はIA-32に必要な時だけREXプレフィックスを付けたものだからな
REXプレイフィックスが付く時はR8-R15レジスタを使う場合と64bitオペランドを使う場合
それ以外はほぼIA-32そのまま
だからIA-32だけを廃止するのは意味がない
ARMの場合はx86とは違い32bitのAArch32と64bitのAArch64は別物だから
富士通のA64FXのようにAArch32をサポートしない設計に意味は出てくる >>425
命令の長さに規則性があって、ある一部分をみただけですぐに判断できるフォーマット
TRONチップのような考え方 >>425
先頭から何bitか見れば長さが分かるだけでデコードしやすい訳じゃない。オペランドごとにオペコードが散らばってたり結構汚い。 RISC-Vの命令長フォーマットはこんな感じ
16bit命令 xxxxxxxx xxxxxxaa aaは11以外
32bit命令 xxxxxxxx xxxxxxxx xxxxxxxx xxxbbb11 bbbは111以外
48bit命令 xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx xx011111
64bit命令 xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx xxxxxxxx x0111111 >>428
複数の命令を同時実行するには命令の切り出しが大事だからな
だから簡単に命令の長さが判別できる必要がある
RISC-Vはそういうように設計されてる
それにRISC-Vの基本命令は
RISC-Vの命令長フォーマットはこんな感じ
このページに書かれてるようにデコードがしやすい
https://news.mynavi.jp/article/risc_v-3/
https://news.mynavi.jp/article/risc_v-3/images/001l.jpg
RISC-Vの基本命令は次の図に示す32ビットの固定長命令で、4種類の形式がある。
どの形式でもrd/rs1/rs2のレジスタ指定ビットの位置は同じでデコードがやり易い設計である。 RISC-Vは完全フリーの命令セットで
RISC-Vで都合がいいのは日本や中国、韓国、インドなどの
独自のCPUの命令セットのエコシステムを持ってない国だよな
特にアメリカと敵対していて
半導体技術向上に力を入れてる中国にはとても都合のいい命令セット
日本や韓国などアメリカと友好的な国ならライセンス料を払ってARMを使ってもいいが
中国の場合、もし、ARMが米国企業に買収されたら
安全保障上の理由から利用が制限される可能性があるからね >>430
だから16bitと32bitを混在させることしか考えてない。
32bit命令のオペランドを拡張した48bit以上の命令は無理に作ってもほぼ別命令扱いになる。 >>426
>x86のIA-32とx86_64はARMと違って全く違う命令セットじゃないからな
そこが一番の問題
x86互換CPUで中国産やロシア産含めMeltdownなんて恥ずかしい脆弱性抱えてるのはIntelだけだからな
>>422
Intelは自社存続というエゴのために脆弱性対策と称したコード汚染を拡大する汚物そのものなのだが
既存のソフトウェア資産を放棄してまで忖度しろと妄言を吐くIntelこそが消えるべき RISC-Vは完全フリーと言ってもある数量以上量産するとパテント料を支払う規則になっているよ
まだ量産品がないから完全フリーに思えるだけ料金が幾らかは判らないが >>427
うーん
判別機構が簡素に成ればコレでも良いとは思うけど、x86系よりは遥かにマシだし
ただ多倍長の時点でデコーダの額面上の幅設計だけでクッソ厄介だろ
長かろうが完全固定長に勝るもんでは無いと思う RISC-Vって、ARMの禿税回避できること以外に利点があるの? A12 biocnicが搭載してる高性能CPU Vortex(2.5Ghz)はgeekbenchの
シングルはCore i7-7700に匹敵する
クロックあたりの性能なら越えてる部分もある
MACもIntel採用止めて高性能コアベースの自社製CPUに切り替えた方が面白いわ
Appleは自社製GPUの詳細もソロソロ明かしてくんないかね
PowerVRの特許の問題があるかもしれんが・・・・・ 2.5GHzのCPUと3.6のCPUのIPCを較べて何の意味があるんだか。 KabylakeのIPCも越え、シングルスレッドも3.6Ghzに匹敵するなら
MACでも使える話をしてる Geekbench自体あまり信じてないし、iOSだとAppleがベンチマークソフトを検出して何かしてそうで余計信じてない geekbenchは3から4になった時にスコアがかなりiPhone寄りに出るようになった
追加するテスト項目次第でスコアの重み付け出来るけど意図的なものかモバイルで重要な項目を重視した結果偶々そうなったのかは不明 iPhoneはOSとSoC共自社製でどこよりも最適化されてる
泥とスナドラのバラバラの組合せよかベンチで高い性能がでるのかもしれん
PS4はPCよりCPU性能貧弱でも直接ハードに叩ける分ゲーム最適化しやすいのと似た理屈 >>405
これか
ヤマハ、NVIDIAと協業し自律動作の農作業車/ヘリ/ボートなどを開発へ
9/13(木) 12:40
スバル、インプレッサにAIドライブコンピュータ「NVIDIA DRIVE PX 2」を搭載した自動運転プロトタイプ車
9/14(金) 5:00
いすゞ自動車がNVIDIAのプラットフォームを使って自動運転技術確立を目指す
9/16(日) 6:03 risc vはARMのシェアを奪うほど伸びるでしょうか? もうちょっと早く出てきてればポスト京に最適だったんだが
そこをARMに取られちゃ後は一銭も払ってくれない中華しか市場はない。 欧州はARM+RISC-Vアクセラレータじゃなかったっけ? 兆芯、“第7世代Core i5並みの性能”を実現した「開先KX-6000」の写真を初公開
ttps://pc.watch.impress.co.jp/docs/news/1143939.html >>448
KX-5000 8C でi3-6100 2C4T 相当と言っていた。
KX-6000 8C はi5-7xxx 4C4T相当に向上したわけか
448からたどれるKX-5000の記事にあるけど
こういう性能でも膨大な開発リソースが費やされたようだ
>x86は1つのアーキテクチャを設計するのにおおむね30億ドル
IntelやAMDに比べたら手本があることやビジネス環境の経費の低さで
30億ドルにはならないだろうけど、それでも多額だろう やっぱ今更x86互換に新規参入ってすっげぇ金かかんのね 街中でiPhoneにマウスとキーボードを接続して使っている人を全然見かけない謎 性能以前にHPCからモバイルデバイスまでターゲットにするとか無茶杉だろ
消費電力100Wのプロセサをスマホに載せるとか あんだけの値段するならキーボード付けてディスプレイに繋げばMacにもなります
くらいな林檎フォンであってくれよ まあモバイルはタブレットとかノートとかが限界だろう
禁輸された時対策だろうけど逆に関税かけられたという。
>>446
ベクトル命令がなんかもめてるみたいなブログ記事読んだけど今はまとまってるのかね?
まあPostKに採用されてたら問答無用でSVE追加されてただろうけど。 >>454
SVEは配列演算専用でベクタ長を意識する必要がないGPGPUの代替目的なんだろうけど全命令がmask指定を持つのは無駄が多いんだよね。
そこまでmaskを多用するならグローバルmaskレジスタを用意してそれを設定したら以後の命令にはすべてそのmaskが適用される仕組みにして演算命令のオペランド数を増やした方がいい。
でもお客さんの言うことなのでお客さん専用命令ということでARMとしては不本意ながらOKを出したってことだろう。 コプロやバリエーションなどのヘテロ編成も視野に入れてるからなのでは ARMじゃVNNIのようなAI用命令は無理だの云々て議論が1年前にあったっけ SVEがお客さん専用なら
そのうちNEON256とか……だいぶ先か。 NEONは64bit演算器を2回回す前提の128bitモードから作り直さないときつい。 次世代京は時期が悪いとしか言えないな
SPARCは実質ディスコン、RISC-Vはまだまだ、っていう微妙な時期に作らないといけない Samsung M3のパイプラインがZenより豪華に見える
プロセスが違うしSMT対応の有無もあるけど、モバイルも力強くなってきたなあ >>461
ちょっと重すぎない?
コレモバイルSoCだろ? いやあれはなんかコンパイラでチートしてんじゃねて気がするが >>464
ARMでそれをやらない所なんて無いだろ
RISCベースなんだから積極的にコンパイラで超最適化しないと性能なんか出ないぞ >>465
この記事この画像を使ってA75より性能/Wが高いって書いてるけどデマじゃん
https://news.mynavi.jp/article/m3-2/images/012l.jpg
https://news.mynavi.jp/article/m3-2/images/013l.jpg
まぎらわしいけど上画像のGBシングルスコアは青ラインがA75だけど
下のパーワットの方だと青ラインはM2に変わっててA75が比較対象に無いっていう M2に比べてM3はサイクルあたりで平均+60%
最高クロック+17%でその時の電力性能は平均80%?
同クロックなら電力性能が平均140%?
ってことは最高クロックだと電力は2.3倍
クロックを2.3GHzまで落としてもM2より電力が多い
M3の2.7GHzはモバイル電力の枠を軽く踏み倒してるが
A75を全ベンチで上回るグラフ作るための見せ球オーバークロック設定ってこった >>471
M2に対してサイクルあたり性能1.6倍
2.7GHzはクロック1.17倍で性能1.87倍
2.7GHzの性能/Wを踏まえ1.87 / 0.8 = 2.34
最高クロック時の電力は比較対象M2の2.3倍程度 それにベンチを見るとAI向けの行列演算で3.4倍と平均を押し上げているが
整数系ベンチでは2.7GHzでもM2比で1.6倍程度の性能に留まってるものが多いことから
実際のアプリ環境では印象ほど性能は伸びず、
また設計として高電力に振れていることからゲーティングが効き難く電力消費が大きくなるだろう
スマホチップとしてはもっと微細化を進めないと厳しいっていうのが実態じゃないか 実際にはベンチほど早くはないが
消費電力シングル〜オールコアで3.1〜3.5Wと
A75搭載スマホとかと消費電力は変わらん デコード幅が1.5倍でIPCが1.6倍に増えてるのは面白いね
さらに広げてもまだ性能伸ばせそうだ 10nmLPPは0.35V
7nmはどうなるんだろうか、Samsungはパフォーマンス寄りにプロセス設計を振ってるが TSMC/Samsungともに、10nmからは~200mm^2以上のビッグダイ(?)チップは作るのが難しくなってきてるとの話があるが
4年前のIntelが味わった地獄を今体感してる感じかね Samsung Galaxy S9 のGeekbenchだとM3は1.8Ghzだとわかる
発熱・消費電力の性でかなり低く抑えられてんだな
シングルで3300程、同クロックならA12bionicのVortexと同等になる
ハイエンドスマホSoCの高性能CPUは、ノートPC並の消費電力枠(15〜25W)に
すれば同枠のCoreやZenにひけはとらんな
AppleがMACを自社製CPUに切り替えるのも時間の問題かもw まずGBに対しては単純に比べられんてのと(特にx86とその他RISC)
TSMCも150mm^2辺りまでが精々なのに、それ以上の巨大なダイを出せるのか?
出せたとしても熱がすごそうな気がするけど……電圧をそんなかけていいのかしら 勿論、HPC用途だとビッグダイでも(多大なコストを転嫁、チップの値段に転嫁することで)いけるだろうけど
コンシューマ用途が殆ど、末端相手しかやっていけないとこは難しいかと
てかMACて書くのはちょっと…… Centriqは10nmで400mm2だし、7nmのVega20やA64FXはまだサンプリング段階だけど200mm2は越えてるでしょう
大きなダイを作れないという問題に直面してるとは特に思えないけど appleがMACを切り替えるっ見て
「え?物理層?モデムチップ、5Gでは自社製使う計画あったっけ?」
と、ちょっとだけ思ったのは秘密だ Centriq 2400は最低でも$888だし
>>466ということもあって、元とろうとしたら難しい
あのAMDちゃんがPOWER9とEPYCでタメ張ってたりするとこみるに
なんていうかかずるい感じがするよ・・・・・誰かも以前書いてたっけ? 連レスだが、なんか結局あれやめてたんじゃ?
カムバックするぜ!的なことは言ってたけど
事業としてはあの値付けでも難しかった可能性も低くはないのでは >>488
厳しいと思うよ
そもそも旧RISC勢が86にボッコボコにやられた理由がそこにある
焼き直したところで所詮は同系列の類似コンセプト
少なくともハイパフォ帯に於いてはあんなもんゴミでしかない
結局ハイパフォ化してもどうせx86_64には勝てん
ワッパが多少いい程度はシステム丸ごと入れ替えるのに見合わない、かと言ってパフォーマンス落としたら論外
結局ISA非互換のデメリットがそっくりそのままなのよ
加えて旧RISC勢は有効なダイ面積の利用が難しい、固定長で単命令を多くってのはキャッシュの利用効率そのものは良いが、サイクル効率はどう見積もっても悪くなる POWERは金融取引ではユニークだったりとかそういう強みはあるけどね
ファイナンス評価(シミュ)だとXeonがくっそ強いけど
他のRISCもSPARCはデータベース処理に一時期強かったりしてた気もする >>476
M3の消費電力はSPECintでA75の概ね2倍、最大は量子計算テスト中で4.8Wにまで達する
https://images.anandtech.com/doci/12520/specint_575px.png
さらにM3スマホの実効の電力性能がベンチに比べ悪すぎたためカスタムファームを用意して改善を模索した話
https://www.anandtech.com/show/12620/improving-the-exynos-9810-galaxy-s9-part-2/3
結局アプリではいまいち性能が出ず、バッテリー持ちはA75にもM2にも劣る結果に
つまるところファーウェイのベンチブーストと根本が一緒だろう
見栄の張りすぎ >>466
コンパイラでチートって演算結果の使われない無意味なループを飛ばして計算量を減らすとかコンパイル時に計算しておいて計算結果を書いて終わりとかを特定ベンチに特化したロジックで派手にやらかすベンチマーク対策のことだぞ。 M3はタブレットかCromebookにも載せてほしいな
高性能と消費電力はトレードオフなので
スマートフォンではサーマルスロットリングで厳しいだろうし >>492
それはそもそもマトモにベンチが走って無いじゃん
論外だよ
コンパイラのチートってのはそれ専用にカリカリにやる事
汎用コードじゃなくてな
SPECでみんなやってる故に数字に意味がないアレね
で有れば何処まで許容されるのかと言うとまたそれは別の問題だけど
コレをやった上で、やって無いヤツと同格では伸び代が違うだろ
そういうことだよ >>494
同一結果になる複数の命令があるとき最も高速なものを使うのは最適化の基本だぞ。×2乗算を加算に置き換えるとか太古のコンパイラからやってる話だ。 x86でx3,x5,x9の乗算にleaを使うテクはそのままARMに応用できる。
特定マイクロアーキテクチャ依存にしてもスーパースカラを前提にした命令スケジューリングとかやってない方がおかしいレベルだし。
L1キャッシュサイズ依存のループアンローリング量の調整とかまでくればどうかという気はするが、数式そのままに計算しないのはそろそろループをSIMDに展開するのが常識になりつつあるからなあ。 https://prtimes.jp/main/html/rd/p/000000093.000012662.html
ゴードン ベル賞のファイナリスト 6チームのうち5チームが、NVIDIA Volta Tensor コア GPUを利用 >>493
ハイエンドスマホ用SoCは高性能CPUだけ
見ると消費電力の制限厳しすぎで勿体よなあ。
リッチすぎてスマホじゃオーバースペックな気がする。 >>495
だから線引きはまた別の問題
本来で有ればベンチマークは実運用でログ取るのが最良だけど
そうはなってない故に、ね
特に単命令主体ともなるとフロー上の仕様を考慮した組み方は特定のプロセッサに向けて効くだろう
ただ、そのコスト分のゲインがあるのかは別とするしかない >>498
実アプリを使うと非効率なメモリアクセスが大量に発生してしまい、それが弱点故に集中して対策を講じてあるIntel大勝利で終わってしまうのだが。 >>499
あたりめというか、手抜きの正当化と言うか
ASLRウォーク可能かつ容易な構造という意味で、受け取り方としては逆が正しい
だからこそ当然そうなると言えるし、MT前提の高負荷条件では軽くひっくり返ったりする
予測のスパンが長く精度が高いほど、スラッシングに弱い スマホ用ゲーミングドックと、対応スマホかあれば、スマホのCPUの性能を出し切れる気がする
ゲーミングドックは、AC電源からの電源供給+空冷ファンでスマホ冷却の両方するとか
ゲーミングドックにとりつけたしたスマホは、リミッター解除して最高速度で動作 ファンと外付け電源追加して可搬性犠牲にした瞬間に高いだけのゴミになるやろ ゲームやりたきゃゲーム機買え
いまんとこポータブルゲーム最強はSwitchだから
SMACH Zがどうなるかはしらんが あんな在庫処分チップがバカ売れなんだから
結局はソフトなんだよなぁ ソニーはA76にPOWERVR8で新チップ起こせばスイッチ超える
けどやらないので今はただのチキン >>502
iPhoneでこういうヤツ来て欲しい
iOSとOSXが統合された新Macなら
歓迎
ttps://pc.watch.impress.co.jp/docs/news/1100308.html
>>506
A76でPascalアーキのTegra搭載版Switch上位機種の方がいいわ
PS4に対するPS4proみたいなヤツ >>506
ソフトがないとダメだろなぁ
SIEも傘下のソフトウェアメーカーあるけど海外のAAAクラスばかりで大規模ゲームでターゲットはPS4のみ
海外ではVITAは日本以上に鳴かず飛ばず(日本のXbox市場ほどでは無いと想うけど)
XPERIAブランド(も赤字続きでかなり失墜してるが)でスマホゲー作ってる方がまだマシかと
スマホゲーはFGOとマギレコが好調でソニー黒字の大きな一要素にもなってるし 今powervrは問題ないん?
買収とかされたんじゃ?
かといって他にGPUは……DMPとか? 安藤氏が MYCOM でここ数週間 Hot Chips のレポートを書いているすけど、今回は RISC-V の OoOE デザイン BROOM の話す
https://news.mynavi.jp/article/broom-1/
現段階で Cortex-A9 程度の性能ということすけど、設計がオープンソースで出回るコトで影響は大きいと思うす A9レベルより
A7みたいな性能と消費電力のバランスが良いコアで
4コア程度のマルチコアIPが
オープンかつ只なら
採用広がるかもね 組み込みとかなら良いけど、スマホとかハイパフォ/メインストリーム系とかは無理だな
クロック低くても良いから周波数あたりのマークをこの3倍くらいにカチ上げないと まだ全く使い物にはレベルだろうが
ttps://pc.watch.impress.co.jp/docs/news/1146315.html
噂のTDP12W&A76ベースのSD1000になれば多少使えるか・・・・ キャッチアップはしてくるはずだからインテルは穏やかじゃないだろうな >>516
ARMでx86Windowsが動いちゃくのは危機感あるだろう
Skylakeの使い回しで次のIcelakeまで弾がない
出たとしてZen2でIPCは確実に抜かれる
Ryzenショック、10nmプロセスの遅延、14nmプロセス需要増加
需要への供給量を満たすだけで革新はしばらくない 最近はARMも、コアごとにL2$+共用L3$になってきたんだよな
もちろんそのほうがパフォーマンス出るからだろうが
PC用CPUみたいな構成にどんどん近づく
パフォーマンス重視すれば行きつくところは同じ
一部のベンチマークだけ早い自称高速なCPUだけじゃなく、
一般的なGUI OS/GUIアプリがきびきび動くCPUにするには、
結局PC用CPUっぽくなる >>518
A76はスマホ向けよりサーバーやモバイルノートを想定したCPU。
とはいえA12bionicのCPUがSkylakeやZen以上のIPCに匹敵するとは思えん。 RISCとCISCでIPCが同じなら性能には大差がある訳だが。 >>520
それ良くある誤解すけど、IPC の算出に使用される MIPS の値わベンチマークからの換算値が使用されるので機械語命令そのものでわ無いす
https://en.wikipedia.org/wiki/Instructions_per_second#MIPS
−−−
For this reason, MIPS has become not a measure of instruction execution speed, but task performance speed compared to a reference.
−−− ArmとはいえA11以降デコーダが7ワイド
x86よりIPCが高いのも別に不思議でも無い
AVXあたりの強みも今後SVEが来るとArmにキャッチアップされそう Wintelが死語になってる以上避けられないよね流れ的には 性能や機能増強するとARMの省電力性が失われ、結局x86系に流れるだけだな。 >>524
自作ならそう言う流れもあるかもしれないすけど、メーカー品はチップを複数ベンダーから選べたりアクセラレータと組合せて差別化できるので x86 より ARM が好まれる未来は否定できないす そうは言っても
結局、SoC作るトコなんて限られてしまって
皆同じになるのがオチなのさ >>526
そうすかね?今や自作系の最先端わ、かつて掲示板で書いたらキチガイ扱いされた手作業での BGA リワークをやってるインド人や、回路にプローブつけてメモリの直読みしてる米国や中国の高校生だったりするす。
Intel の EMIB とか SoC の低コスト化技術も進んでいるし、SoC の敷居は下がって行くことで自作で手が届く時代すら来るかも まるで今は全うな評価受けてるみたいな言い方はやめろ いやだから、いくらBGA張り替え出来ても
ボールコンパチ品でも無い限り性能うpもできやしないって解ってるのかと
中華製リワーク機なんてIRの奴でも3万以下で買えるんだから
eMMC張り替えとかやりたい奴は日本でも買ってるだろ
それにwinCE時代見りゃわかるだろう
SoCは消費電力や価格主要因じゃないんだ
筐体や液晶パネルが支配的なのに
なんでarmにすれば勝つる的論調がいまだあるのか理解できない >>528
煽りで書いているので無いとすれば、YouTube で “BGA rework” とかで検索して何本か動画見てから AliExpressで必要機材と部品の値段を調べて見ることをお勧めするす 普通の処理を早くするためには、シングルスレッド性能を上げて、L2$増やして、共用L3$もつけないといけないが、
これやるとワッパがx86に近づいてくる
ワッパを上げるには、共用L3$無し低性能多コアCPUみたいな構成が必要だが、
これじゃパフォーマンスが発揮できるアプリが少なくなる >>529
>いやだから、いくらBGA張り替え出来ても
貼り替えでなく、マザーボードレベルわ個人で設計/製造が可能になる未来を述べているす。
設計のオープンソース化に加えて、基板などの小ロット製造わ現状ですら趣味で手が届く領域に入っているかと ARMは2年後にはインテルやAMDのハイエンドモデルを追い抜くって言ってるようだけど、そんな簡単に追いつけるものでもないと思うのだが。
そもそも設計図屋に過ぎないだろう。 モバイル&鯖限定だから最高クロックでは差が付いたままだぞ。 ARMも性能上がってくるしインテルは大変そう(小並感 >>533
5年前にもそういわれて
今頃ARM鯖がメインにとか言われてた K12どうなった?
それはさておき
ARMはSnapdoragon1000?でWindowsノートに一石を投じるか?
MacがApple自社製SoCに切り替わるか?が先だな どーしても実ソフトで成果だせんからね
所詮はベンチ用CPU intelがATOM復活させたほうがよさそう
外部ファブでも製造できるようにして、自社ファブに余裕があるときは自社、無いときは他社で製造すれば、 >>537
そう言ってたのは一部だけ
結構懐疑的な見方多かったよ
個人的には
86が駆逐したクソRISCベースが今更敵う訳無いだろワロス
だけど
ハイパフォ舐め過ぎね >>541
>86が駆逐したクソRISCベースが今更敵う訳無いだろワロスだけど
むしろ歴史を鑑みるなら組込マイコン上がりに過ぎなかった x86 がハイエンドサーバーまで制覇した様に、組込上がりの ARM が同じ階段を上って行く可能性を見いだせるのでは? かつて x86 わ一介の組込向け CPU だったモノが PC という破壊的イノベーションの時流に乗ってハイエンドコンピューティングまで制覇するに至ったす。
今 ARM はスマホという新たな破壊的イノベーションの中心にある訳すけど、果たして歴史は繰り返されることになるすかね?
技術史的に興味深い展開だと思うす ARM税払いたくない需要にRISC-Vそれなりに出るんじゃないの?
毎年億単位で出る組み込みプロセッサとか
もしくはRISC-V参入を表明してARM税減額交渉を行う需要とか 行き詰まりつつある製造プロセスと増大する一方の製造コストをどう乗り越えるのかが見物 >>542
先ず現状の半導体演算装置の特性として、演算時間よりフィードタイムが長い
及びデータフローの大部分をキャッシュで担保してるって事実がある
かと言って単純に増やせば良いという訳でも無い
コレを推測/先読み出来る能力が現状よりより大きなキャッシュ容量に対し十二分で有れば性能が向上する
ひっくり返すとコアの面積と性能よりもキャッシュや予測とかその辺が重要なワケだ
で有ればハイパフォに向けて設計されたISAの方が有利になる
デコーダのコストが幾ら高かろうがコア自体の面積食おうが同じ事やらせた時のフィード回数が増えるよりはマシという事でもある
つまりARMとかRISCとか全く見当違い
x86_64よりもっとハイパフォに向けたISAこそ必要
現行でさえコア数で稼いでるだけでSDRAMよろしく基礎性能はほとんど上がってないのに
パフォーマンスが良くてトントン、互換なしなんて誰が欲しがるのか RISC-Vは貧弱ながらも癖と無理が少なくて素性が良いから
これをベースに拡張すればかなり理想に近いものは作れるんだけどな。
まあ互換性はなくなるけど。 QualcommはARMSoCによるサーバー事業撤退準備中らしいね
知らんかった
せっかくCentriq 2400には期待していたんだが・・・
x86互換で置き換えられるからこそEPYCは美味しいわけか だめだMACオタの口調は脳ミソ夫で脳内再生される... niftyserveの頃もキャラ設定に頑なな奴はいたなあ。
人は今も昔も変わらんてことだな。 >>547
>ひっくり返すとコアの面積と性能よりもキャッシュや予測とかその辺が重要なワケだ
それが性能を決定づけるほど重要ならオンチップのローカルメモリへのロードをコア動作と並列動作するようにプログラミング可能だった CELL-BE SPE の MFC (Memory Flow Controller) のコンセプトがメジャーになっている筈なんすけど…
所詮その辺の性能向上効果わ、ユーザーがオンチップメモリを直接制御するために必要なコストに見合わないから大容量キャッシュに頼ることになっているす(笑) なんか話がずれていってる気がする
とりあえず>>549のようにQualcommのサーバ撤退などがあったわけだから
ARMが上位セグメント進出というのは当初言われていたほど成功してないと言えるだろう。
まあ当初の予想が過大だったのか。 煽って当て馬にしていいないいなXeon値下がったらいいなってポジでしかねえから
EPYC出てくるとその立場すら奪われて AMDはOpteron A1100で沈没、Skybridgeキャンセル、K12キャンセル
ARMによる上位セグメント進出は難しい
逆にIntelはタブレットやスマホ市場をAtomでのARM切り崩しに失敗して撤退
NviもTegra使ってやろうとしたが早々撤退したしな あんだけ色々整備してダンピングまがいのことまでやって全くシェアが作れなかったAtom シェアって言うか
結局、5万とか出してタブレット買う人は少なかった
それだけの事だよね… iPad vs ARMアーキの泥タブだからなぁ
スマホと変わらん
まぁスマホだとIntelはAppleに載っかった形だけど、訴訟の行く末はどうなるかな >>552
アレの問題点はソコじゃない
帯に短し襷に長しな構成に依る
それにソコをコード書かないとマズイなら結局VLIWみたいなものになる訳で
人間側がOoOやら投機やらまで分析して全部書けるワケがない
汎用性を損ない過ぎる
脱線するが、アレがあんなものになった遠因はあの191便事故だろうな ローカルメモリ付きのCPUは今でも中国が熱心にやってる
微細化が行き詰まったらx86も導入するのではないかな >>561
やるだろうけど、現状の制御からはあまり変えないと思われる
ついでに何載っけるかが割と重要
HBMだとDRAM代替、じゃその間はそのままなのかどうか ローカルメモリとか一般アプリではまともに管理できないしマルチスレッドだとOSも管理できないから同じ容量ならハードウェアでそこそこ管理されるキャッシュの方が速くなる。
VLIWよりスーパースカラの方が速くなるのと理屈は同じ。 i9 9900kはIntelにしては2700k以来の使えるCPUだな
コアはSkylakeと変わらんが8C/16Tは魅力的だわ
8700kとか半端なもんはいらん
1800Xに漸く追いついたな 原子サイズ以下のトランジスタって本当に製造できるのか 結局3-4waySMT化じゃなく2wayのまま多コア化競争に突入してしまったのだなあ
やっぱり1スレッド時だけ高性能にしてもユニット毎の(省)電力制御が難しいという事なのか、
ドでかコアによる低歩留まりが問題なのか Intelしかプロセスの微細化に取り組んでいないのが現実 86はメモリアクセスが多すぎてスレッド増やしても性能上がらないんじゃね。 とりあえずZen2はAVX2を256ビット一括演算できればOK。 iGPUのRyzen GやRyzen Mobile等なら自力で解決可能になるのか POWERのSMT4だのSMT8だのってどんくらい効果あったの?
メモリレイテンシはそりゃ隠蔽できてるんだろうけどユニットにちゃんとギッチリ命令充填できてんの?実用で むしろAVXは128bitの実行ユニット増やす方向に進まないだろうか ええけど、Intel向けに作られたバイナリとの互換性がね
2倍のクロック数でも実行できるユニット増えればと思った 分割命令間でデータの依存性解決を分離できるならAVXでも良いとは思うけど、それが出来ないか出来ても面積食うなら使わない方が良い筈
フロントだけ見ればAVXを2SSEにカチ割り出来れば良いことになるけど、AVXのレジスタから言ってコレによるオーバヘッドの方が大きくなるだろう
処理粒度は必要最低限にしないとキューが高深度化して仕方ない つまり1000個単位でないと使い物にならないGPGPUはゴミと >>580
形態が違うからアレはまた別
CPU並の汎用性とキャッシュ、予測機構諸々が付くならその通り
ただバンドと演算機数でゴリ押す分、対象は大量に無いといけない
向いてる方向がCPUとはまた違うとも言える
自動車と貨物船の違いに類似するか
あと、効率は悪いだろうが一発単位でも発行はできると思うぞ
Fermi/GCN以降は両者SFU付き単演算機仕様だし >>581
セットアップに数1000クロック掛けて数命令だけ実行させて何の意味があるのかと。
CPUでSIMDだとセットアップがゼロだから小口でも意味があるのに。 効率悪いだろうが、と前置きしてるにしても効率悪すぎるw CPUがGT-Rやポルシェで、GPGPUが大型トレーラって感じだな 超並列でもCPUのほうが良い場合もあるしね
あとどーしても、コードの難易度が上がってしまう GPUのバンド幅は1GPU当たりだと広いけど1Flop当たりだと中堅Xeonより狭い
Xeon Gold 6132 0.084Byte/Flop 128GB/s 1523.2GFLOPS(FP32)
Quadro RTX 8000 0.042Byte/Flop 672GB/s 15944GFLOPS(FP32) >>582
だからそこが要改善項目だ
どういう形態になるかはわからんが、どうせアレイを増やせば増やせない回せない問題にぶち当たる
現状の発行方式はSWバイパスと言って良い構成だから、ハンドオーバーないしオフロードをもっと高効率にしなきゃな
SIMDってのはスレッドでもタイムでも分散できる事から、結局中規模ユニットをBullのような共有分離式にすることになるやも
>>586
実際のデータフローでどれくらい出るかだね
計算前はキャッシュもあり割の数値でも上回るそのXeonが圧倒的性能でないとおかしいけど
の割にそのCPU作った本人はGPU作ってますつってるんだが >>587
新しく出て来るもの見てりゃ結論はデータの独立性に応じてFPGA,GPGPU,ワイドSIMDの使い分けで確定してるじゃん。ナローSIMDはモバイルやローエンドでしか生き残れない。 日本はB/Fにこだわりすぎたたとおもう
トータルで速度・コスパ・ワッパがよければ、べつにB/Fなんてどうでもいいのにね
B/Fは目的を達成するための手段の一つだったのが、逆にB/Fが目的化してしまった感じ B/Fがかなり低くても好成績が出せるHPLを競ってた状況の方こそ手段の目的化だった >>590
しかし B/F が低くても性能が出る粒子法による流体シミュレーションとか、ハードウェア技術進歩の方向性にソフトも対応するのは正しいと思うす >>588
俺はそうは思わんね
今は濫造の時期で、引き算始まってからが本番
もうちょいだろう
SIMDアレイはナローで、要に応じて多連実装
ワイドSIMDはキツくなるリソースに対しメリットが薄すぎる、ごく当然だが“CPU”としては同じリソースでキャッシュ盛るか他強化した方が遥かにマシなんだから
GPGPUの多重はSIMD用途から乖離して来ると思われる、数年内にパイプラインの再設計と効率化が主軸に移る、相対的に演算能力が目減りするか向かなくなる
マス向けはFPGA/ASIC、ないしGPGPUの内演算に特化したアレイが占有
この二極化だろう
現実的な電力と面積で多連以上の総効率を叩き出せるワイドがあるなら、別だけど
そんな魔法は無い >>592
管理ユニットが少なくなる分演算器の数増やすより幅広げた方が電力効率が良いんだが。演算器リッチにして全部稼働させると放熱が間に合わないからヒートスプレッダとしてロジックユニットより低発熱なキャッシュを増やすというのは後ろ向きでしかないぞ。 富士通がワイドSIMDを512bitで実行したらみたいな研究出してたよね 役人や政治家や偉い人から金引き出すために手段が目的化して無事脂肪 命令デコーダが弱いと高機能命令を複数内部命令に分解して実行する形で命令数を減らした方が性能が出るんだよね。 >>593
いやだから放熱間に合ってないなら増やした幅分のゲイン消えるよね
それどころかCPUっつーもんは汎用なもんだから増やした分アクティブ増えて平均、というかtypicalといった方が適切かもだが回せなくなるよね
面積も食ってるからイニシャルコストも上がる
処理効率だけ見ると確かにそうだけどね、現実論としてプロセスの進歩が限界近い以上、落とし所はよりプアな方に修正しないと
キャッシュは効果的な上限まで盛れると思えば良い、限度超えて非効率領域に突っ込む前提だと確かにそうなるけど
>>594
アレも分離型の方がゲイン/リソースが良いって論文じゃ無かったか
まぁ汎用に組み込むには重過ぎる幅だったと記憶してるけど >>597
GPUとか鯖用チップとかは熱があるからクロック落として使ってるんだが。ゲーム用がすべてではないんだよ。回路規模2倍でクロックと電圧を25%落として消費電力とんとん。どっちがいいかだよ。 IBMが大容量L3$積んだサーバ用CPUを5GHzとかで回してるけどね >>598
そりゃ回路規模下げる方
あとそういうの向けで下げてるんでは無く、一般向けを上げてると言った方が適切
比例関係では無いからね >>586 Xeon Gold 6132のFlops値は2ソケだね。メモリ帯域はもっとあるね。 >>602
Xeon Gold 6132 1CPU
FP64 1.7GHz x 14core x 32 = 761.6GFLOPS
FP32 1.7GHz x 14core x 32 = 1523.2GFLOPS
DDR4-2666 6ch 21.3GB/s x 6ch >603 間違えた
FP64 1.7GHz x 14core x 32 = 761.6GFLOPS
FP32 1.7GHz x 14core x 64 = 1523.2GFLOPS 結局多くの用途でnvidia gpgpuが効率がいい、ってことになるんだよな
nvidia gpgpuでカバーできないニッチ用途を他社がこそこそやってるって感じで 7980XE(18C)でAVX512クロック3.6GHzまで上げるとこのくらい。この辺りになるとメモリが限界でクロック上げてもあまり伸びない。
https://i.imgur.com/EBPXJDR.png
165W制限だと1TFlopsくらいだった。(メモリはOCメモリ) むかしのB/F重視
演算能力に見合う十分なメモリ帯域にしよう
↓
いつのまにか、
メモリ帯域にみあったしょぼい演算性能があれば十分
に変化した
GDDRメモリ採用してスーパーコンピューターより広いメモリ帯域を持つGPGPUに完敗した 96コアの高性能サーバーCPUも目論むArmの新ブランド「Neoverse」
ttps://pc.watch.impress.co.jp/docs/column/kaigai/1148482.html >>605
つってもスケーリングやプログラマブルを考えるとなあ
ソフトでも完全レジスタ勝負なら強いがそうでなけりゃ、微妙だし 次世代メモリ「DDR5」は2019年後半に登場
https://pc.watch.impress.co.jp/docs/news/1148609.html
1モジュールあたり40bit x2とか、同じクロックでも帯域が増えるとか言ってるし、バス幅が増えるのか? >>605
×結局多くの用途でnvidia gpgpuが効率がいい
○結局(金儲けが容易な)用途でnvidia gpgpuが効率がいい
世には金儲けに繋がりにくい用途に適した道具も必要
>606
低B/Fが原因でLINPACKに比べた速度低下が大きいシステムは
低下が小さいシステムに比べて
電力効率もコスト効率も低下倍率が大きい HBM積んでメモリ帯域増やしたvegaは正しかった! >>615
まぁある意味は正しいだろうけど
GDDRやDDR載っける面積分の削りで2-3枚載るし、ただ電力がアレで高密度実装には向かんが
毎度毎度オーパーツ作るから最初は扱い辛いんだよな
GCNの時もそうだった、初期の使い切れてねぇ感が滲み出る GPGPUはそれ単体で完結している分にはいいがデータ共有を始めるとそこで極端に足を引っ張られるからケースバイケースなんだよ。特定ベンチには最適なんだけどね。 >>617
どっちかっつとそれはデータフロー屋の領分では
とは言ってもネックとしてはCPUの重SIMDと類似の構造起因オーバヘッドだから、解決法はアルゴリズムによる緩和とそれに向けた特定構造の追加/改造くらい
要はASIC/FPGAにしろって事ですな >>611
Zeusはサーバー用Armのプラットフォームの名前だったのね
今のところポスト京のA64FXくらいしか実績がなかったからな
Armが本腰を入れ始めたことでコストが下がるのは良い
失敗したCellと違って、企業によってサーバー用CPUの種類はバラバラ
互換性がないからエコシステム構築は進まなそう
クアルコムのスナドラじゃねぇけど、デカい企業がアタリを作らないと
普及は難しそうだ >>613
ついに市販PCでも100GB/s超えの世界が
容量もノートすら32GBが最低限度となるか 帯域はHBMでいくらでも稼げるからDDR系は速度そこそこで大容量方面に向かうと思われる >>619
GiGAZINE記事だけどRISC-Vがエコシステム構築成功すれば何とかなるかもしれんね
RISC-Vは「ムーアの法則」以来の技術イノベーションになるとの予想
ttps://gigazine.net/news/20181017-risc-v-post-moores-law/ RISC-Vはvalidation どうするんだ。
例えばDisplayport とかもライセンス料要らないって言ってるけどトランシーバーや
ケーブルコネクタ等でATC(認証試験機関)を利用すれば料金は発生する >>623
投げっぱだろ。
そういう地道な作業に学者は興味ないから。 MITやコアになってる産学共同体が中心になってやるんじゃないの?
RISC-V作ってそれまでで後は今後の拡張や脆弱性見つかった場合への対処は俺知らねってこたないだろうし >>616
初期GCNはワッパもよくnvidiaと互角にやれてたぞ
いや、nvidiaがグラフィックスとGPGPUでアーキテクチャを分化したのも大きいのかな?
時系列を覚えてないんだけども MIT、プロセッサ性能を犠牲にせず「Meltdown/Spectre」脆弱性を解決する新手法
ttps://pc.watch.impress.co.jp/docs/news/1148962.html >>627
TS3でVLIWやってたトコにFermiで演算振り
ぶつける形でGCN1でスカラタイプへ変更
Fermi2世代目で対抗、その対抗でGHzとか出して泥沼
nvは6以降分割して推移、amdはGCN以降1アーキ化
じゃ無かったか
地味にTS3以降、spそのものには殆ど手が入ってないんだよね
ある意味すげぇわ amd/atiのGPGPUは、開発環境が使いにくい、世代かわったら互換性なし、とかやってたところ、
nvidiaが使いやすいCUDAで、世代変わっても互換性あるようになって、
一気に普及した >>628
これ見たとき、
「現行のCPUで」性能を犠牲にせずに対策が取れる
って話だと思ったのに作り直せばって話だって知ってがっかりしたわ
そんなのわざわざ発表しなくても中の人もわかっとるだろ 会社で特に画期的でも無いことをドヤ顔でプレゼンする奴を思い出したわ。 まぁアレに関してはミスリード狙いの国内クソメディアも噛んでるから何とも
ぶっちゃけ画期的な方法とかどうでも良いからアドレス振りの方式をAMDと同じフルにしろよって話
アレさえ当てられなきゃ実用性無いんだから ぶっちゃけ感染も流出もない環境さえあれば、今ある脆弱性なんてほとんど無視できる システムに管理者権限でアクセスして脆弱性ありBIOSをインストールすることで
システムを乗っ取れるバグなんてものあるぐらだし
割と何でもあり いまのBIOSは、システムに物理アクセスできない人でもインストールできるようになってるので
セキュリティ上問題が多い
システムに物理アクセスできる人しかインストールできないほうがセキュリティ上のぞましい
起動時のBIOS画面から、USBポートにつないだストレージからのみ
BIOSアップデートできるようにしたほうがいい BIOS起動時のパスワードを設定してる人は少ないだろうし(一般PC以外は知らない)
物理的に触られた時点でBIOSアプデの可能性はあるぞ PCにActive DirectoryやLDAPでログインする企業なら
BIOSやEFIにパスワード使う事も多い
ソースはうち ちゃんとOSとは別のパスワードが設定されてるなら
AMDの脆弱性も問題ないのでは OSログインにイントラのLDAPやADサーバーで認証する環境 (大企業だとフツー)だと、そもそも各個人のOSパスワードと特定のPCは紐付いてない。
見境なく自分のIDパスでログインできるのを防止する目的で会社管理のBIOS (EFI) パスワードを(永久に変更されない)を使う。
こんな環境は多いと思うよ Intelの新10nmプロセス?で作られるIcelakeのCPUコアは
キャッシュが増えかなり改良されてるっぽい
ttps://egg.5ch.net/test/read.cgi/jisaku/1530269772/l50
AVX512対応の強化で増やしたのかね
CPUコアは今までのP6ではなく、Goldmont+ベースに改良した
ものだと面白いのだが(Jaguar→Zenみたいなパターン) Goldmont+ももう古いから
新機軸を中心に全部刷新した新アーキテクチャでないと
ぶっちゃけAMDにできたんだからIntelができないはずがない >>643
P6を改良したBaniasから始まってタコ足配線続けてSkylakeまできた
性能アップはConroe(Merom)→Nahalemのメモコン搭載が一番大きかったが・・・・・
SandyはイケたがHaswellとSkylakeは期待外れで終わった
IcelakeはP6最期のタコ足配線となるか新アーキになるのか
Goldmont+が古いとはいえP6より遥かに新しいから期待してしまう まぁ、確かいP6よりは新しいけど、元の性能が低いから
そこからSkylakeレベルまで性能を上げるとなると・・ AMDにできた、と言っても同じことやったら出るのは何年後になるんだ? P6ベースってのはuOPS変換のOOOって意味だからこれから変えるのは不可能。K6移行のAMDもP6ベース。 >>647
違うんだよなぁ
少なくともAMDのこのタイプはK5から
K5はAm29000から
それ以前にzenではDe-Exで分割してるからそもそもこの構造すら引き継いでるわけじゃ無い
もっと言えばK8系/K15系でも系譜切れてる いい加減P6の延長という言い方はやめた方がいいな
今のCPUは全然違う トレースキャッシュを中心としたPen4アーキテクチャーの復活希望
現代のトランジスタ密度なら大きくなるデメリットも小さいし、どうよ なんとなくだがphiの時代に復活してたらという気がするな Pen4除いてP6からFamilyナンバーは6のままだからなぁ
>>652
Netburstの先進的な部分はSandy Bridgeで再実装終えてる トレースキャッシュは容量効率が悪いから制御構造はそのままに命令の変換だけしてキャッシュするよう砂橋で変更され今日に至っている。
AVXの命令フォーマットはデコーダで変換することを前提にして各種プリフィクスを統合してbit加工圧縮したものになっている。 >>649
一連の脆弱性の起源がP6まで遡れるっていうか
保護機構の概念がP6の時点らか変わってない事を指しての比喩だろう
今のCPUは全然違うとか皆わかってるよ 遡ってもBaniasくらいじゃないかw
geekbenchがどんだけ信用できるかわからんが
Skylake 6600U 2.6Ghz と比べるとIcelake 2.6Ghzはシングルで2割程度アップ
Skylakeは14nmに併せた拡張で(同クロックでの)性能は期待ほど上がらなかった
Icelakeでは多少はCPUの性能強化が実感できそう
Zen2との勝負が楽しみではある Skylake-Xを見ているとキャッシュの構成を変えただけでIPCが20%も上がるとはとても思えないんだが >>654,655
一番の胆である実行した順にトレースするトレースキャッシュじゃないからそこは違うと言っとく
よく使われるコードはトレースキャッシュに格納(して最適化処理も行う)
あまり使われないコードはμops止まりっていう良いとこどりな心ときめく新アーキテクチャーでなければ面白くない >>659
geekbenchだけの結果だしなあ
さすがにIPC2割は無理と思う
でもキャッシュだけじゃなく内部もそれなりに
改良されてる気はする
正直1割上がればいい方だね Skylake-XはL2が増えた代わりにL3が減ってトータルでは容量が変わらなかった
IcelakeはL1とL2が増えてコアにも手が加わるのでIPCが上がる >>661
2.6GHzなのはベースクロックで
geekbenchのスコアはターボを反映した数値だから
今出てる情報じゃIPCは全くわからんよ jpg圧縮
bzip2 -9圧縮
このあたりの速度が、実際の体感速度に近いと思う ソフト問わずzipの解凍時間でみるのが、わかりやすいな Intel、全部門で過去最高の売上高を達成
https://pc.watch.impress.co.jp/docs/news/1150025.html
売上が向上しない部門の整理が終わりました
部門ごとの売上は言うが利益は言わない アホな株主や市場関係者の言うことばかり聞いてれば、
将来への投資ができなくなる
日本の電機メーカーみたいに縮小均衡を続けてどんどん小さくなってもいいのか >>668
いやearning presenteationできちんと部門ごとの利益も出してるが AMD利益出たよ:1株あたりわずか9セント。
Intel利益出たよ:1あたり1ドル以上。
ま、これが現実だね。 1株とかどうでもいいしPERで見ろよ
4倍弱ぐらいの差 発行株数や時価総額が違う銘柄で1株あたりの利益比較とか意味が分からん そういえば貸借対照表も損益計算書も知らないのに経営について語ってた奴がいたな >>666
シングルスレッドガタ落ちでBull系は失敗しただろ
その反省からZenはExcavatorなら約60%IPCを上げた
AppleのCyclone系もIPCとシングルスレッド共にガンガン
上げている
Intelだけは苦戦しているようだが・・・・・
IcelakeはiGPUも大幅に強化されるようだし、CPUもアーキの
改良でよくなると面白くなる >>676
効率上げのIPC変化と単なるガツ盛りのIPC変化を一緒にするのはどうかと思う 整数演算性能に関する技術ってのは初期のスパコンの時点でほぼ出尽くしていてただ回路規模の点で実装できなかったものが多かったのが、それを実装できるようになったのがここ10年の話。
そこで本格的なマルチコア競争に突入したと。
だからスカラ性能はその頃からほとんど上がっていない。
出遅れた所が最近になってそれに追いついてきているがあくまで当社比でしか性能を語れないレベル。 スーパーコンピューターが求められた頃には
大型汎用機には既に多くの工夫が盛り込まれてたからな >>679
Hsswellで大きなジャンプがあったぞ Cyclone系は最初から素性が良い反面、最近はクロック向上ぶんしか性能上がってない印象だけどな ニューラルコア生えたけど何やらせてるのかよくわからん >>684
まぁ現状じゃ確実にバラストか何かだろうな >>683
2018 Vortex 2.5Ghz L1$ 128k L2$ 8M 7nm 15%+
2017 Monsoon 2.4Ghz L1$ 32k L2$ 8M 10nm 25%+
2016 Hurricane 2.34Ghz L1$ 64k L2$ 3M L3$ 4M 16nm 40%+
2015 Twister 1.85Ghz L1$ 64k L2$ 3M L3$ 4M 16nm or 14nm 70%+
2014 Typhoon 1.4Ghz L1$ 64k L2$ 1M L3$ 4M 20nm 25%+
2013 Cyclone 1.3Ghz L1$ 64k L2$ 1M L3$ 4M 28nm
Cyclone系は
Cyclone→Hurricaneまではキャッシュはほぼ同一でクロックを上げることで
性能を稼いできた
Monsoon以降はクロックはあまり変わらずキャッシュの構成は変化、内部を
改良することで性能を上げている
iPhoneは高性能CPUコアは全て2コアなので、シングルスレッドの
性能向上はわかりやすい Appleは毎年Cyclone系を改良しながらも新しいCPUコアを
投入してるわけで、その資金力は凄いと思う
Skylakeの使いまわしでコア数を増やすだけのIntelは終わってる 最近のmacがスペック抑え気味なのはarm macを出した時に「arm macはintel macに比べて〇〇%高速です」とやるためだったりしてね 前回以上に盛大にソフトウェア資産の切り捨てをやるのかなw iosアプリって名目でその辺のバッファになってる気がする Adobeは今頃Arm対応版の作成作業でてんてこ舞いだったりして 林檎はPowerMacはwindowsよりこれだけ高速!
とか言っておいてintel採用したら前世代よりこれだけ高速!
と言ってのけた会社だぞ
Arm採用しても普通に同じ事言うだろう iPhoneに搭載されているA12bionicだけならスマホと変わらん
ベンチも瞬間的に爆上げしてにIntel Coreに近いスコアを出す・・・・・・インチキ
だがiPad proのA12Xbionicになると、さすがに話は別になってくる
高性能コアVortexも倍の4コアになり、少なくともMSのSurface(PC)と張り合える
Appleは自社製SoCと専用OSにより、最適化されハードの性能を引き出しやすい
iMac・Mac mini/Mac book・Mak book pro辺りなら自社製CPUでMac OSとiOSの統合は
あってもいいんじゃないかなあ
最上位のMac proのレンジは捨ててiMac proレベルにするのもありだね
SurfaceでやろうしていることとiPad/Macはどちらも同じ方向性に進んでいるし とりま、AppleはiPhone/iPad共に搭載メモリはもっと増やしてほしいが・・・・・・・
ケチり過ぎ >>693
多分言うかもしれないがw
もうカタログ的にどっちが上かのユーザーはWindowsへ移っただろうし
もうそんなの誰も気にかけていないでしょ
ネットへの親和性とかモバイルとの融合性とかが重要かと
PCと時計じゃ機能に絶対的に大きな差があるが何を使っているかとかあまり意識せずに使えると便利(PC⇔モバイル⇔時計) MAC PROのユーザーだって今は最高など求めていなくてソフトにしてもハードにしても最新じゃないから
使えない部分の解消を強く求めているだけ DTMユーザーが去ったらいよいよクリエイティブ(笑)になっちゃうかもね CPUをリソース割り当てられてAPIとか叩かずにアプリ独自コードが走ってる部分に関してはOSとのコンボで性能出しやすいとかはあまり関係ないはずだけどね A12XのGPU性能はXbox one Sとほぼ同じで1.4Tflops
Apple製GPUは7コア
1コア辺りの性能はVegaの1CUを超える
Appleはその気になれば自前でPCミドルクラスのGPUも作れそうだな まあAPI諸々の関係で難しいだろうけどな、実際は
DFのいろんなポータブルゲームデバイスによるFortnite解析は面白かった
Switchサイキョ >>697
林檎社は気にするんだよ
ジョブズ帰還でごまかされてたけど
あの会社の社風はそういう志向 タブレットとして使ったらiOSが動いて、
キーボード・マウス繋げたらMacOSが動く
デュアルOSのMac作れよ
っていうか、1台でMacOSアプリとiOSアプリを同時に動かせるようにしろ CrayがエクサスケールでSC18で説明開くとか
Intelの新型アーキテクチャも分かるかもね またintelは政治力を使ってエクサスケール1年くらい延期させるのかなw 政治力?
単純にプロセス開発に失敗したから遅れたという話だろうに Crayも遊びでスパコン作ってるんじゃないんだから
Intel一社のためだけにリリース時期を遅らせたりしないだろう
米国政府や米軍等の顧客への売り込みもあるし
追い上げが激しい、というかもう同等レベルにある中国企業に対する競争力維持も図らないといかんし iPadProはメモリ8GBくらい積むんだよな?お値段的に ストレージ1TB以外はメインメモリ4GB、1TBモデルは6GBだとか
まぁ正直iOS端末だとそこまでメモリ不足は感じないけど、フル機能のPhotoshopとか動かすなら多い方がいいな 1TBをAPFSで動かすのに6GB必要説あるらしい
まあだいぶキテる感はあるがまだ少し足りない感じのiPadProだなあ
もうあと2、3世代重ねたら完成しそうな気はする その頃にはAPFSだって、もっと重くなってるやろ… いまどきの高度なファイルシステムはメタデータが大きくなるのはどれもおなじでしょ? Rome Zen2 64C/128Tはマジっぽいな
ビッグデータを見越して1ソケットでもXeon phi並みのコアを詰めてる
Intelは10nmに移れず14nm 需要の圧迫、Xeonも28コアで止まってるしやばいな
ttps://www.computerbase.de/2018-10/cpu-amd-epyc-2-rome-chip/ >>718
CPUコアに対してメモリ帯域が足りないな
DDR4 16chとか無いと https://pbs.twimg.com/media/Dq44LA5UwAAAppc.jpg
A12X Bionicの性能が凄すぎる
コアを倍増すれば20W程度で9900Kとほぼ同じ性能を実現できそう >>721
帯域なんてデュアル時代にはぶっちぎった筈
現存のCPUでも1コアの半分にも満たない総帯域なんてザラ
今更多少増えたところでそんなに変わらん >>722
A12とA12Xのシングルスレッドはあまり変わらないのか
A12XのTwisterは2.6Ghzと若干高いくらいかなあ
Coreはターボと定格とのクロックの変化が激しいからシングル・マルチとも
比べにくいな
とはいえA12XからPCノートを越える性能があるって歌い文句も
あながち間違いではないね
GPUもXbox one S程度はあるから、IntelのiGPUより遙かに強力だし
A11のMonsoonからL3$が廃止され、L2$が強化されてる
クロックはHurricaneそれほど変わらないから
内部も改良された新コアと言ってもいいね >>723
メモリバッファで32ch接続とかにすりゃ余裕 Hyper-Threading有効時にスレッド上の情報が盗まれる「PortSmash」 〜Intel製品のほかRyzenにも影響か
ttps://pc.watch.impress.co.jp/docs/news/1151619.html
SMTはあかんな >>726
L3でCore間のデータをやり取りしてるやつが多いから取っ掛かりがあれば見える
インテルの場合はHTTがC2Dの頃からその手鉤ひっかける場所にされてるから見つかりやすい
HTTきっといたほうがいいな、マジで >>727
C2DにHTTがあったとかどこの世界?
設定上は物理1コアあたり論理1コアだったけどこれとっかかりにならんだろ >>729
十分堅牢に作っとけばいい
zen系みたいにな サイドチャネル攻撃は堅牢とかそういう話ともちょっと違うんだよな >>731
実際有効に攻撃出来てないんだから堅牢で良いだろう
それとも何か?
「あたかもどう設計しても回避できないように印象付ける」必要でもあるのか? 今回の脆弱性はざっと調べた感じだと
読み出したい内部状態が0か1かで使う命令発行ポートが変わるから
そのポートに別スレッドで命令を流し込んでプレッシャーかければ処理時間の変化で内部状態を推定できるみたいなやつ
たぶんキャッシュとかメモリシステム周りは関係してない
ソフトウェアの方でアルゴリズムを堅牢にして対策しろって話で終わる感じがする SMT上でも他のスレッドと混ざらずatomicに実行されることを保証するのを
ソフトウェア側で制御できる仕組みとか作ればいいのに >>733
キュー分離してる上に分配の条件が不明って状態でそれやると、何処に放り込めるかわからんだろう
FP分離してる上にNSQ付いてるからP6みてーに共用パイプの重ユース突っ込むのも出来ない 潜在的にタイミング攻撃に脆弱な実装はSMT上だと問題が顕在化しますよというお話
OpenSSLのDSA/ECDSA署名の実装がビットが立ってるか立ってないかで処理時間が変化する欠陥があって
その変化をSMTを使って拡大することでサイドチャネル攻撃を成立させるというのが要点 本来乱数・暗号なんかは、Intel SGXで作った謎空間で、Intel Digital Random Number Generatorとかで
作った乱数でやるのがいいのだろうが、Intel SGXも、Intel DRNGもあまり信頼されてないからな
信頼できる同様の実装があればいいんだけど >>732
普通のセキュリティホールはやるべきチェックを怠って起きるようなものが多いが、
タイミングアタックとかのサイドチャネル攻撃は、正しく作っていればいいという事ではなく、
性能最適化とかで良いことをしたつもりでも穴になってしまうし、まあ難しい
ソフトウェアしか知らないけどハードウェアも同じ感じだろう 直接配信を見られないがAMDの発表がすごいことになってそうな話だな >>278
>>328
https://geocities.yahoo.co.jp/
>Yahoo!ジオシティーズサービス終了のお知らせ
>2019年3月末をもちましてサービス提供を終了いたします。詳しくはこちらをご確認ください。 >>741
あの8Cの1ダイ、HPL走らせたら
5W以下で100Gflops超えそう >>740
https://ja.wikipedia.org/wiki/サイドチャネル攻撃
サイドチャネルを何か勘違いしてないか?
暗号鍵を扱うシステムは不逞の輩が様々な手段で覗き見ようと狙ってくるので
ありとあらゆる事象がサイドチャネルにならないよう注意を払わなければいけないって事だぞ
Wikipediaに載ってるキャッシュ攻撃のような初歩中の初歩の手段で破られるようではお話にならない
まあ天井からぶら下がるアレも「物理的な侵入経路がある」という意味では立派なサイドチャネル攻撃なのだが・・・ MSやLinuxがスケジューラちょっと変更して、暗号を扱うプロセス向けに、物理コア占有するAPIを作ればいいのに
そのAPIつかったプロセスは、同じコアのSMTで他のプロセスを動かせないようにして
ただしマイクロソフトの署名済みのOSのプロセスだけ例外とかやっておくと、OSが有効利用してくれるはず Zen2はSIMDを128bitから256bitと拡張してくれたのが嬉しい
RomeのMCM構成は興味深いがやはりSiCよりSoCの方がロマンがある
Zen2でもRyzen 5以下とノート用APUはSoCでやってほしいね
あまり話題にはならんが・・・・・・・・
このゲーム機本体はどうでも良いがコイツのZen+VegaAPUはそそられる
GF14nmプロセスで作ってんだろうか
ttps://www.notebookcheck.net/Zhongshan-Subor-Z-s-custom-Ryzen-Vega-SoC-has-more-GPU-compute-power-than-the-Intel-Kaby-Lake-G-Core-i7-8809G.331872.0.html
現段階でもRavenridge以上のAPUを作ろうと思えばできんだな 128bitのまま並列度を増やすのかと思った
AVX2の256bitを処理すると2倍のクロックかかるからその間別のAVXユニットが使えるようにするとか
512bit化はないと思うが256bitのまま512bit対応もありうるのかね
互換性のためだけになるけど。 Intelでさえ持て余してるAVX512はないんじゃね >>748
恐らく微細化でデータパスの能力向上とバランスが取れたんだろう
512は流石にどうかと思うけど、全体として歪にならない範囲なら十分あり
14nmでやるのが無茶で有って、詰め込めれば当然放置できるゲインでは無い
要はバランスだ
ま今回の改良の裏は他にも色々有りそうだけどね avx612は、phiみたいなHPC用チップ向けだろ
一般向けじゃないような phiが爆死してしまったのでサーバー用のxeonにHBMくっつけたものをHPC向けに投入するらしい Zen2ではAVX/AVX2による死角は無くなったのは大きいね
AVX512は普及度合いを見極めてからでいいんでない
Zen→Zen2でIPCは10%チョイ上がるようだからSkylakeコアよりは
確実に上になる
Intelは最後の隠し弾14nmの9900kまで引き出され、
もはやタコ足配線限界のIcelake出すまでどうにもならんな
当初の10nmポシャってプロセスじゃA12/A12XやKirin980と
スマホ・タブのSoCに負ける始末
RomeはI/OチップにL4$がどの程度積んでメモリのレイテンシを
減らせるのか見ものだね >>753
まだヒートスプレッダ廃止とダイ研磨、スペクター緩和が残ってる
来年はCoffee Lake-R2でイケる! XeonにHBMくっつけるならそれはそれで結構革命だと思うけど
EMIBでつけるのかIF新規実装で直でつけるのか Zen2もあの真ん中の14nmのIOチップをHBM仕様に改良したら
そのままHBMの64コアEPYC・TRができちゃうのな いよいよコンシューマ向けにも変化が現れ始めたな
いいぞAMDもっとやれ チップが山盛りに乗ってるやつってCPUがたくさん載ってるんじゃなくてこれ全部で一つのCPUなんだよね >759の
上段中央は12コア、20コア用パッケージで
L2キャッシュは別ダイだけど1コアは1ダイ。
その左とかの碁盤の目のようなパッケージの1ダイはCPUコアの一部 ひょっとしてGPUとDRAMコントローラとインターコネクトと合わせたダイを作って
8コアのCCX入ったダイをあわせてAPUなんて事にはならんよね?
手軽に作れそうだがコンシューマ向けにはコスト上がりそうだし。 普通に考えたらI/O、CPU、GPUの3チップ構成か
I/OチップとCPU+GPUの二種構成だと思う
なぜなら7nmでアナログ回路作るのが大変という理由だから どのみち3.3Vや5VのI/Oは内蔵できないんだから
今まで通りワンチップ+PHYだろ >>765
少なくともVegaとA64FXにはPCIe3.0が実装されてる 時期APUのRyzen 3xxxシリーズは、GF 12nmシングルダイとかになるんじゃないの? Exynos9820が8nmだったのでSamsungはArF液浸7nmをスキップしてもプロセスで先行出来ず
TSMCが予定通り来年にEUV7nmを投入できればトップランナーの地位が固まりそう。 これってTSMC? GF? どこの12nmなんやろ
12nm FinFETに微細化した「Polaris 30XT」
消費電力21%増でパフォーマンス10%アップ!
http://www.gdm.or.jp/pressrelease/2018/1115/283714 ダイサイズ変わってないらしいしGFでしょ
GFの14LPPから12LPへの移行なら、サイズは変わらずトランジスタの性能が上がる程度の改良しかないので移行は楽 何もかも一緒で唯一構造だけ弄っただけだもんな
7nmもこういう小改良入りそうだなとは思う Researchers discover seven new Meltdown and Spectre attacks
Experiments showed that processors from AMD, ARM, and Intel are affected.
https://www.zdnet.com/article/researchers-discover-seven-new-meltdown-and-spectre-attacks/ >>771
1060より消費電力が100Wも高いとかなあ
下手すると2倍近く電力喰うケースもありえるとか
爆熱とはいえ絶対性能を有する9900kと違って全く笑えない
マニアとかGPU収集家なら買うんだろうか・・・・
せめてVegaで行こうぜVegaで nv株凄いことになってるw
YTDの下落率でGEと競争してるのかな? >>775
言うてグラボはその熱をカバー出来るクーラーにそのパワー賄えるVRM付き
多少馬鹿喰いしても何もしなくていいから楽ではあるぞ
CPUは冷やし難い上にMBによってVRMの差があり、相性次第でそっちが喰うケースもあってなんとも
特に今回みたいな無茶やるとよく喰うからね、お値段も上がっちゃうわけです nvidiaビットコインかファンドにちょっと一言いわれるとこれだからなw
ファンド往復で大儲け個人は往復ビンタw
nvidiaは自動運転車の方が将来的にヤバいと感じている(自動車関係各社nvidiaを必要としなくなる時期はそのうち遣ってくる) ゲームに幾ら特化したスマホとはいえ、プチオーバークロックしたSD845採用
あまりにも貧弱すぎる
メモリを幾ら積もうが、ストレージが速かろうがお話にならん
ttps://pc.watch.impress.co.jp/docs/news/1153859.html
せめてSD8150なら納得できるんだろうが・・・・・
それよりさっさとノートPC用のSD1000?発表しようぜ >>779
ここまでやったら携帯ゲーム機でいい、ソニーがvita2スマホを作れば解決だ >>778
自動運転はどちらにせよGPU屋の出るとこじゃ無いってのはとっくにわかってたからな
アレだけで数出るんだからASICで良いわ 1位と2位を米国勢が獲得したTOP500 - HPCGも米国勢が1位を獲得
https://news.mynavi.jp/article/20181116-725202/
Linpack番長といわれたのは昔の話、
いまじゃ米国勢はLinpackが早いだけじゃなくHPCGも早い
HPCGでも米国勢が圧勝
あらゆる計算で米国勢が早い
HPCG List for November 2018
https://www.top500.org/hpcg/lists/2018/11/
Linpackで負けてもまだHPCGでは早いから・・とかいってた日本勢が
手の届かないところまでいってしまった 投資間隔が長すぎるよ
いつまで京コンピューターがナショナルフラグシップとか言ってるんだよ
理研と海洋研が大型スパコン定期的に買ってるが
そこまででなくても比較的大口のユーザーがもっといないと競争についていけない >>783
アメリカの対中高性能プロセッサ輸出制限が中国のプロセッサ開発を
加速させたという見方がある。ARMの買収はRISC-Vの注目度上昇を
加速させたかもしれないな >>784
二つの階段の勾配が同じでも、二つをずらして重ねたら
どちらかが上になったり下になったりする。
日本は階段の段数が少なすぎ、間が空き過ぎで
下になる期間がどかっとまとまって訪れる。 長期的にはその辺RISC-Xになっちまうのかもしれないが
ARMもまだ強みがあるだろう
小銭とられる代わりにARM社が新技術導入の旗振ってくれる
RISC-X陣営も大口のユーザーになるとカネ出さなきゃならなくなるんだろ。
だからどうなるのか。 RISK-Vに関してはねぇ
高性能な実装のIP売る気があるベンダーがどれぐらいあるのかと言うと リスクてやると確かにKに変換されたが
流石にここではきちんとCにしようや RISCがRISKに変換されたか…
所詮、奴はWnn…
RISCをRISKに修正するなど予測変換の面汚しよ…! もうこの先はIBMと富士通で共同開発したら良いんじゃね(適当 >>793
地雷と地雷を組み合わせて核地雷を創造するのはNG HPとIntelを地雷と地雷だと思った人はどれくらいいただろう いつの間にかPEZYがRISC-Vアライアンスに加盟しとる CPUだけじゃパソコンは動かない
オープンGPUはよ >>799
オープンCELL BEというのはどうだろう? 少なくともサーバはマネジメント用の最低限のGPU乗せてれば動くだろ
ASPEED AST2510みたいなGPUでいい >>796
少なくともIntelの「鳴り物入り」は片端から地雷踏んでる歴史がある >>798
PezyがどうなのかはわからんがPezyのお友達のEsperantoは以前からRISC-Xで計画立ててる
ディッツェル親父の所な
もう社長いなくてどうにもならないからお友達に救済してもらうのかもしれん
そうなると国策で案件流してやるのも難しくなるなぁ アメリカって本当に凄い国だよな「核地雷」を作て配備までしたんだぜw
ソ連がアメリカに侵攻して来たら使うつもりだったらしいw 稼働中の原発を通常兵器で破壊するだけで十分
イスラエルは前科あるし Green500は、Linpack/Wを競うものだが、
HPCG/Wのランキングも出したほうがいい CNN、inferenceのみとはいえ、Myriad X(4TOPS)の6〜8倍か
まあこうした数値よりもCaffe、TFがきちんと使えるのが良い点 AI/DNNアクセラレータを作る時に重要なのが開発環境の整備なんだよな
主要なフレームワーク・ライブラリで使えたほうがやりやすい
ハードだけ作ってソフト全部そっちでやってくださいとか、オリジナルの開発環境しかない場合は、
よほどシェアが大きいとか、よほど高性能とかじゃないと使ってもらえない
よほどシェアが大きいとかは、たとえばx86にAI/DNN系命令入れるとか、nvidiaが自社GPUに入れてCUDAで対応するとか、
そんなやつね BIZARRE Intel Core i7 from CHINA for $100!!
https://www.youtube.com/watch?v=tvXfgdyQxPQ
中国で黄金戦士めいたコンセプトの製品が出回ってる模様 合法的に詐欺的な手法で政府から金を引っ張る技術に長けた既存大手メーカーと、
そういった技術の無いPEZYの違い
PEZYになかったのは、合法的に補助金貰う技術に長けた人材と、
よくわかんなんとか協会の設立、天下り受け入れ SSLで使う暗号化のハードウェア対応→AES-NI
SSLで使うハッシュのハードウェア対応→SHA Extensions 現状RyzenとEPYC対応、Intel対応予定
http/sslで使う圧縮のハードウェア対応→現状非対応
webのパフォーマンスを上げるために、Intelも早期のSHA Extensions対応と、
gzip/deflate圧縮のハードウェア対応が必要 >>814
天下り法人通して迂回詐欺やればよかったんだ >>818
大丈夫なのかな
IBMの石っつーとアレだからすごく危ない気がする 先端プロセスやめてなければ
本邦も同様にAMDとライセンス結んでx86スパコンとか作れたんじゃないか >>823
おいおい
そんなもん発案から実現までに2世代は遅れるぜ
何たって仕事が遅々として進まないからな NECがV386作ってれば時代は変わったんだろうな。 >>826
たかがスパコン一台に建設費1100億、運用費年額80億だからな
他国なら同等性能を10台から20台作れてしまう DO+で使ったCPU何だったか忘れたけど互換性がいまひとつだった記憶がある Amazonもepicを導入したけど団子さんはお元気だろうか(笑) 団子さんは藤井七段をどうやってdisるのだろうか(笑) Ryzen使ってるらしいな
TR買えば良かったとか言ってるらしい
今はZen2に興味あるとか
まあ今日日将棋指しの商売道具だろう
コンピューターは >>836
必要経費で落ちるかどうかが気になってきたw 使ってる将棋ソフトがコア数に応じて性能がスケールするタイプなんじゃないの? >>838
現在採用されてるアルゴリズムはフツーに探索だからリソースあればあるだけ早いし強いぞ 将棋みたいなのはGPGPUのほうが効率的
CPUでやるのは非効率
CPUは適当な安い奴で、GPUに金かけろ
つうかいまはGTX1080程度のGPUでさえ人間より強い コンピュータ将棋は短期間に一気にGPU化、ディープラーニング化が進んだ
3年前の知識では追い付かないぞ 将棋AIがプロ相手に勝てるようになったのは2013年の話だから
当時の学習データを再生するだけでアマチュアレベルなら手も足も出ないだろう
藤井君にはヌルすぎるAIってだけで・・・ >>843
今んとこ割に合ってる比率じゃないけどな
演算だけは矢鱈強いRadeon系使えれば大分上げられそうだけどな
アイツ複雑命令も強いし(そのかわり電気食うけど 将棋は伝統的MLだから、アクセラレータよりもCPUの方が歩があるんだな
入玉込みの評価さえアクセラレータではろくに出来てない >>845
RadeonはCUDAが使えないっていう最大の欠点がある
既存のCUDAプログラムやCUDA対応フレームワークを、Radeon対応のために
わざわざ変更しないといけないとか面倒すぎる
>>846
ここ数年で一気にGPU化が進んだんだよ
ちょっと前までGPU化が難しい分野だとおもわれてたが、いまはそうじゃない >>848
そうなの?
山下氏が2年前に記事で言ってたときはまだXeon 2sが最強という感じだったが 将棋はいまだcpuが支配的だよ
ゲーム木のminmax(厳密にはalpha-betaの前方枝刈りあり)探索してるために、ある盤面の評価を低レイテンシで行う必要があり、gpuだと辛い
deep learning系も出てきているが、まだ一回り弱いですね
deep mind の、alpha zero shogi が、最強に迫るか超えたという話があったが、いろいろ論文に不備があったり、現状では有耶無耶になってしまったままなので、多分未だにcpuが最強のままでしょう >>847
所謂機械学習のことかと
現状、機械学習の中の深層学習の中の畳み込みニューラルネットでしか
GPUの強みはみられない
多分848はなにか勘違いをしてるんだと思う 過去の棋譜を覚えてパターン認識だけで将棋が打つタイプの棋士がGPUに完敗したんだよな。 プロプラ言語に尻尾振る奴に碌な奴は居ない
ってのが実証されただけか elmoとかいうコアi7で十分なソフトがくっそ強いけど
GPUクラスタでさえ撃沈させた
そこから数年も経ってないのだが、ここ1年で何か変わったのか? わしの将棋ソフト知識はボナンザがつえーつえー言われてた時代で止まってるぞ >>856
>>848、>>852
が出てきてなんか具体的に書いてくれないとさっぱりわからん たぶん流用ではないPC専用スナドラ漸く来たな
ttps://pc.watch.impress.co.jp/docs/news/1157165.html
Cortex-A55ベースの4コアがひっかかるなあ
ここはせめてCortex-A76ベースでクロックダウン4コアでなきゃダメだわ
Cortex-A55ベースなんぞスマホじゃあるまいしPC用途じゃ貧弱すぎて話にならん
855の強化版ではなく、スマホとは明確に区別するもの作らんと
IntelのモバイルCPUには到底勝てんよ
AppleA12やA12XのVortex並のパワーはないんだし尚更だな A55は軽負荷の継続処理などに対してSoCの電力を極限まで落とすために存在するコア
用途分けのヘテロで搭載してる物だから全部A76じゃむしろ話にならん >>859
PCノートの用途ならスマホSoCレベルの極限まで電力を
下げる低性能コアは必要ないと思うがな
15WならIntelと同程度の性能しかないというのも競争力にかける
7Wからならありってところかな
来年Q3登場でもプロセスという点てはIntelよりは優位ってのがw むしろarmの場合は電力の低さこそが武器でありもっとも必要とされる部分だろうよ A55が電力を低く抑えられるのは根本的にコアが小規模なため
それだけ実装負担も軽い
A76だと電力が増えるだけでなくコア面積も3倍以上になる >>858
よく読め
高性能コアとしてCortex-A76が4コア
省電力コアとしてCortex-A55が4コア
の全8コア
Qualcomm、7nmプロセスのWindows 10用SoC「Snapdragon 8cx」
〜FirefoxのArm64版など、Armネイティブなアプリも提供開始
>CPUとなるKryo 495は、Cortex-A76ベースの4コアと、
>Cortex-A55ベースの4コアという構成になっている。
>
>Snapdragon 855のKryo 485は、ArmのDynamIQに対応しており、
>A76の4コアのうち1つを2.75GHzまで引き上げるプライムコア、残り3つを2.42GHzのパフォーマンスコアとして動作させている。
> これに対してKryo 495では4つのコアすべてがプライムコアとなっており、2.75GHzで動作する。
>また、Kryo 485ではシステムキャッシュ(Intelのプロセッサで言うところのL3キャッシュやLLCに相当)が5MBだが、
>Kryo 495では倍の10MBになっている。 >>865
書き方悪かったかな
>高性能コアCortex-A76が4コア
>省電力コアとしてCortex-A55が4コア
>の全8コア
ってのはわかるよ
省電力コアで使うにしてもA55はノートPC(Windows使用)では
あまりにも貧弱過ぎる
クロックダウンしたA76でもノートPCの範疇なら省電力コアとして
十分使えると思っただけだよ 別アーキテクチャのCPU性能を比較するのに現状SPECintくらいしかまともなベンチマークが無い
スマホとかでよく使われるベンチは、特定のアクセラレーション命令の有無でめっちゃパフォーマンスかわったりするから Always Connected PCとか歌ってるけど電池が持つだけじゃダメ
ソレだけを売りに高く売ろうと思わんことだな
Photoshopなんかもそこそこ快適に使えてナンボ
一緒に音頭とってるMSがSurface Goで採用するのがいいかもね 組み込み向けのAtomアーキテクチャでも
x86は大分進歩してきたからなあ
難しいんじゃない?
あと855は来年の銀河搭載なんだな、Exynosだけ8nm(10nmLPP改)なのはなんでなんだろ 現行のcore iから、L3$とAVX2命令とかを削除すれば、
組み込みチップができそうな気がする >>869
わざわざスナドラWindows機でAdobeのCC系ソフト使う人ってどれくらいいるんだろうか
ペン入力も必要になるだろうしメモリももっと積まなきゃいかんだろう
そういうクリエイター向けならそれこそSurfaceにx86アーキでいいだろうと思うが
そういやSurfaceがRyzen積むかもって噂が出てるみたいだね >>871
サムスンの方の7nm、7LPPは10月に準備完了だから
製品に載るまでは順調に行ってもあと1年掛かるよ
TSMCのN7が去年4月、サムスンの10nm第3世代の8LPPが去年10月に完了でようやく intelの10nmも年明けにはラインにウェハ投入しないと年末に製品が出て来ない スパコンは競技じゃなくて道具だということを相変わらずわかってない気がする 設置面積あたり、体積当たり、ラック当たりの性能は重要じゃん >>876
流石にそろそろ潰すか
予算の無駄遣いで切られそうになっても何が悪いのか一向に理解する気配が無い ロードランナー時代だったか
高密度実装とかいう話あったよな
スパコンは将来みんなこうなるんだろうかと思ったものだ >>881
TOP500の1位と2位はx86じゃないからな
IBMのPOWER搭載スパコン
せっかくx86の優位性がなくなってきたときに辞めるのはおかしい 今となってはファブレスのIBMがx86を追い越すなんて胸熱だな というか、さあ
国策スパコンの高コストって富士通が悪いというけど、
まさに「富士通」が悪いんであって富士通のCPUが悪いわけじゃないんじゃないかね
Intelに変更しても同じ性能のスパコン作ったら似たような値段になるんじゃないか?
富士通が契約取る限りは 話が元に戻るようで悪いんだが、
Snapdragon 835/850/8cxはARM製CPUをx86/x64エミュすることでWindows10を使う。
ふんで追加命令であるAVXやSSEはどこまでサポートされているのだろうか?
サポートされてるとしてどないして実行するのだろうか?
AVX2までならZenでもサポートされてるし結構重要な気がする。
偉い人教えてくれ。 >>886
受注企業側というよりは発注側の予算振りに問題がある
安く上げたら来年度からその予算まで下げられるとか誰も安く上げるわけねぇだろアホか
それを踏まえてもなお金がねぇつってんのにARMだのSPARCだの新造してる場合ちゃうやろ
同じ値段でIBMにオネガイした方が遥かにマシじゃ 1000億といっても1年間の予算は100億円で10年ためて1000億円
だから10年に1回しか麹総Xパコンは麹�黷ネいんだよbヒ LinuxでのARMはこれからだな
AmazonのクラウドのAWSでARMの提供は始まったみたいだが
AWS、Armベースの独自開発プロセッサ搭載EC2提供開始
http://www.itmedia.co.jp/news/articles/1811/28/news084.html >>887
エミュレーターはWindows 10上で動作する
エミュレーターというよりバイナリトランスレータみたいなものだろうけどな
主にビジネスアプリを動作させるのが主体だろうから、SIMD命令を高速に実行できるとは限らないと思う
ビジネス向けのパソコンではWebブラウザとMS-Officeさえ動作すればいいなんてこともあるし
Windowsが独占的な地位を持ってるのはMS-Officeのおかげだからな
WindowsではWebブラウザとマイクロソフト製のアプリさえ動けばいいという用途はたくさんある ARM版のWindows 10は今のところSnapdragonにしか対応してないようだが
Snapdragonは高いのでおそらく中華メーカーのSoCに対応するまでは普及しないと思う 中華の怪しいSoCに対応したとこで売れねぇと思うけどな >>893
サンクス
バイナリトランスレータみたいなもんってのは納得いった
8xcならビジネスソフトやブラウザとか
通常用途なら十分使えそうだね
スナドラPCも定着すれば面白そうだな
Skylakeからコア数増やす以外性能は上がらないし
モバイル用途ならチャンスあるね >>896
言っとくけど出したのはzen1自体のライセンスで
中華のx86はVIA流れ系よ 4Uで16ノード以上はいるなら
トポロジー含めた電力はかなり優秀なんじゃねえの
CPU単体だとTDP180W程度になりそうだが >>888
いやだから、IntelのハイエンドはVenusプロセッサと価格何倍も違わなかったと話だから、
プロセッサ作ってる場合じゃないだろは無関係あるいは大した影響与えてないと言ってるわけよ
作っても作らなくても米国勢並の価格にならん。
そういう意味じゃこのスレの中心課題からは外れていると思う。論じていけないわけじゃないが。 >>899
もうリバースエンジニアリングされて
取り上げようとしても無駄だしな
あぁあ >>901
いや、あると思うぞ
あの頃とはもう色々違うからな
>>902
アレは実製品からやるもんであって、何れにしてもどうせなんだかんだでパクられる
なら先にライセンス締結してカネに変えた方が良い
ただでさえリソースねぇんだから、そのくらいの勘定はできんと話にならん >>904
>あの頃とはもう色々違うからな
色々違うのであれば、あるともないとも言えないんじゃないでしょうか
試算もいつの世代の製品と比較すればいいのかわからんし。
現在Intelのスパコン向けハイエンドは40万とか50万とかするけど
確かにVenusの設計決まった当初はIntelはスパコン向けで尖った専用設計にはしてなかったので安かったんじゃないか
ただその当時のIntelではVenusには勝てなかったわけで(次の世代であっさり勝てただろうけど) http://kakaku.com/item/K0000982874/
価格うろ覚えだったのでぐぐったら40〜50万どころか……
まあ性能が段違いだけどこれ8万8000個搭載したら1000億越えちゃうね >>906
1個売りの小売価格で仕入れる前提なのかw >>907
思考実験でしかないよ。
ただ影響あったと言う人は思考実験すらしてないからね。 Sunny Coveでは実行ユニットが10ポートに増えてるらしいな
増えたのはstore addressとstore dataみたい Lakeシリーズが追わって、Coveシリーズがはじまるのか? 湖ネタが尽きて入り江
……いや、まだ湖ネタやれると思うが、イメージ刷新したくなったのかね Sapphire Rapidsとかいうやつはどこいった? >>913
あれはPurelyみたいな鯖用のコードネームでは
Ice lakeベースというのは前から言われてたしさ Ice Lake CPUに対応するのがSunny Cove マイクロアーキテクチャ
Sapphire Rapids CPUに対応するのが何であるのかは分からない
なんとかCoveかもしれないしそれ以外かもしれない 3IPCから4IPCに11年
4IPCから5IPCに13年 実測の話なんてしてないよマイクロアーキテクチャ上の最小幅の話だよ Skylakeでデコーダを強化したなら、次は実行ユニットの番ということだね
でも何でstoreを強化したんだろう
FMAのときは2load/1storeのバランスで納得したけど
最近のワークロードはstoreの比率が高くなってるのかね?
Zen(Zen2も?)はload/store合わせて2ポートだから差がついてるよな
同じアドレスに対するload/storeは一度に扱えるらしいけど >>913
Cannon Lakeが遅延する前で2020年予定、前のCEOや開発体制時に出てた名前だからSunny Coveのように変更されてる可能性がある
今はサイドチャネル攻撃を防ぐアーキテクチャを開発することが優先目標だろうし https://pc.watch.impress.co.jp/img/pcw/docs/1158/093/010.jpg
5 wide allocationがどこの帯域かいまいち分からんけど、ZenでいうDispatchの後段(RSへの投入)に対応してるところ? レジスタリネーミングの帯域が4uops/clkから5uops/clkに上がる PCWatchとか見るとIntelの新CPUについてらーじゃこづりが、と書いてあったが
GPUの専門家だろあの人
今のCPUにはGPU載ってるけどGPU側の地位が上がったのか? 立場的にはアーキテクチャ開発全般のトップじゃないの? CNETの翻訳記事によるとCPU、GPUにディープラーニング等の全般統括みたいな感じかな>ラジャ氏
https://japan.cnet.com/article/35110189/ >>924
xchg rax,rbxの動作がめちゃくちゃ速い!!助けて!!! Intelも異プロセス張り合わせとか言う力業でヘテロジニアスマルチコアやる気なんじゃね
AppleができてIntelができない理由はないだろ 異なるプロセスルールのチップの張り合わせ(3D積載)は
Appleやってないと思うけど? Intel expresses 10-nm and 7-nm confidence in investor Q&A
https://techreport.com/news/34312/intel-expresses-10-nm-and-7-nm-confidence-in-investor-q-a
これによると、Intel 10nmは、他社10nm並みの劣化仕様じゃなく、当初の計画通りに他社7nm並みになるようだよ 当初は他社7nm以上(6nm相当?)じゃなかったっけ? >>932
既にご自慢の7nm並を他社は量産してるんだがなw >>934
モバイル用低消費電力プロセスと、サーバ・デスクトップ用ハイパフォーマンスプロセスは違うのでは? tsmc以外終わるな
サムスンも8nmとか軟弱なこと言ってる 求めるぱふぉパフォーマンスの違い
それなりか、かなりか >>932
都合のいい部分だけ比べて他に劣る部分は隠してるから他社7nm相当で正式な7nmを名乗れないんじゃねーの? プロセスサイズ比較を見るとむしろ他社7nmとどこが違うんだというレベル
まあ比較図に出ない要素がどれだけあるのか知らないが まだリニューアル版7nmについての情報開示はないのでは SemiAcuの、「実際は従来のIntel基準だと12nm程度になる」というのは
否定してたような
そもそもSemiAcuはアンチインテルが強すぎて
のわりにはリークもブルームバーグにも負けるし Intel寄りすぎではあるけどリークはすごいと思う PS5が今年出るとか妄言吐いてたSemiAccurateさん
リークに関しては昔は凄かったが最近は全然
業界からハブられたりでもしたんかね PS4発売前は、メモリ暴落時期だったから、サムスンから非常にいい条件でメモリ仕入れることができたのが大きいと思う
だから、8GB GDDR5メモリっていう当時としてはかなり思い切ったメモリ量にできた
いまはまだPS4はきっちり回収する時期では? 8chでしょ?
16chと言ってるのは大原の妄想では たぶんプラットフォームによって変わると予想
旧世代互換では8ch、Rome専用だと16chみたいな 来年、第9世代の次はDTメインストリームとモバイルはIcelake(Sunny Cove)で
固めて欲しいな
iGPUはGT2ですら64EUと大幅に強化されるのも良いね
Cannonlakeは無効化されたけど既に40EUだったらしいが・・・・・
DDR4-3200対応なら2400Gに近い性能が期待できそう >>949
大丈夫? インテルのGPUだよ???
むしろ200GEに喰い付かれないか心配する所じゃね? >>950
大丈夫じゃなぇなw
Skylake GT4eと違ってeDRAM搭載してないだろうしなあ
コレを高く売ろうとしてたIntelはアホだと思ったわ
それでもIcelakeからのGT2強化は正直嬉しい
あと踏み逃げせず次スレ立てとけよ Gen11はタイルレンダリングで帯域と電力が削減されたと言ってる
https://pc.watch.impress.co.jp/img/pcw/docs/1158/131/008_o.jpg
おそらく最近まで雇ってた元祖PowerVR開発者の監修
タイルベースGPUの始祖だから実績とノウハウ的には最強 試しに建ててみたら立ってしまった。
CPUアーキテクチャについて語れ 45
https://egg.5ch.net/test/read.cgi/jisaku/1545156597/l50
IntelGPUはこづりさんがなんとかしてくれる事を祈る >>953
PowerVR好きだからこういうのは嬉しいな >>954
トン
>>953
なんだかんだでタイルベースレンダリングの応用は各社やってるからね
https://www.4gamer.net/games/251/G025177/20170309081/
https://www.4gamer.net/games/337/G033714/20170101002/
フレームバッファ圧縮によるVRAM帯域の節約なのか
描画負荷削減のためにGPGPU演算でプリレンダするのか
解説が無いと何とも言えない
プリミティヴシェーダが全部入りだとみてる 1993年のタイルレンダリングGPUの基礎部分が出願20年で2013年7月に切れたっぽい
https://patents.google.com/patent/US5729672A
2014年にNvidiaからタイル機能搭載のMaxwellが登場
Appleも独自GPU化
AMDとインテルもタイル機能搭載
それ以前はQualcommなんかはImaginationとわざわざIPライセンス契約を結んでた
この発明者のAshton Martinが2016年にインテルに移り今年7月にはAMDに行った 確かに考えてみれば
メモリ帯域が厳しいiGPUとタイルベースとの相性は良いわな 現実はタイル間のやり取りが発生するから性能が出にくいと聞いた覚えが Skylake GT4eでEU数オセオセで行くかと思ってた時期があったなあ
アレを高く売ろうとしたIntelはマジあほだけどさ
gen.12のXeでは本格的になりそうやね
MSが次世代XboxをIntel製にすると面白いんだがな
ひとまずIcelake 4C/8Tクラスは2400G並にiGPU強化して欲しいね
MCMは悲しい、やはりシングルダイ即ちSoCこそがiGPUのロマン MIPS命令セットアーキテクチャがオープンソース化
ttps://pc.watch.impress.co.jp/docs/news/1159305.html >>961
SkylakeでPCHもオンダイ化すると思ってたからガッカリしたよ >>962
デンソーがwave computingのAI MIPSアーキテクチャ使うよて話があったから
こういうことが予定されてたのね いつの間にか次スレに2以降貼ってくれた人がいるな
以前もそうだったが次スレ1のコピペをまた間違えたorz
2行目43スレじゃんよ オープンソース化されるのはMIPS32R6とMIPS64R6だけなのかな?
MIPS32R6やMIPS64R6はそれまでのMIPS32R2からMIPS32R5、MIPS64R2からMIPS64R5とは
命令セットのバイナリ互換性はない新しい命令セット
MIPS32R6、MIPS64R6だけなら従来のMIPS32R5、MIPS64R5までのMIPSはオープンソース化されないってこと?
また、最近発表されたnanoMIPSも含まれてないようだな
MIPS命令セットアーキテクチャがオープンソース化
https://pc.watch.impress.co.jp/docs/news/1159305.html
> Wave Computingは17日(米国時間)、
> 同社が保有しているMIPS命令セットアーキテクチャ(ISA)の
> オープンソース化プログラム「MIPS Open」を発表した。
>
> これに伴い、MIPSを次世代SoCを使う開発者、半導体企業、大学などは、
> 32bitおよび64bitのMIPS ISAをライセンス費用なしで利用できる。
> さらに、MIPS Openプログラムの参加者は、何百もの特許とともにライセンス供与される予定。
>
> 同プログラムは具体的には、以下の技術やリソースが含まれている。
>
> ・オープンソース版の32bit/64bit MIPS ISA Release 6
> ・MIPS SIMD拡張
> ・MIPS DSP拡張
> ・MIPS Multi-Threading技術
> ・MIPS MCU
> ・microMIPSアーキテクチャ
> ・MIPS仮想化 MIPS32R6やMIPS64R6はMIPSがImagination Technologies傘下の時にできた命令セットで
それまでのMIPSとはバイナリ互換性がなくAndrooidで売り込むために作られた命令セット
MIPS32R6やMIPS64R6は採用例がほとんどないMIPSアーキテクチャ
ほとんどのMIPS採用例はMIPS32R2からMIPS32R5、MIPS64R2からMIPS32R5になってる >>945
デンソーは新しいnanoMIPSの方を使いたいんじゃないの?
デンソーはそもそもMIPSの利点と考えてるのはI-Classの製品のハードウェアマルチスレッドであって
MIPSのISAそのものじゃないんだよな
nanoMIPSで発表されたI7200もI-Classでハードウェアマルチスレッドに対応してる
今回のオープンソース化にはnanoMIPSは含まれてないようだしね
CPUコアはARMだけじゃない、デンソーとイマジネーションテクノロジーズが共同研究
http://monoist.atmarkit.co.jp/mn/articles/1611/15/news043.html
MIPS、初のnanoMIPS命令セット対応CPUコア「I7200」
https://pc.watch.impress.co.jp/docs/news/1120074.html ちなみにMicrochipのPIC32に採用されてるのはM4KのMIPS64R2とmicroAptivのMIPS64R3、M5150のMIPS64R5だけ
MIPS64R6のI6400はPezy SC2の汎用コアとして採用されたが
Pezy SC2を採用したスパコンはXeonを使っていてほとんど汎用コアとしては活用されてない模様 MIPSのオープンソース化といってもほとんど死にかけてるMIPS32R6やMIPS64R6じゃ、意味ないね
これらは本来のMIPSではないし、新しいアーキテクチャと言ってもいい https://wavecomp.ai/mipsopen/
What happens if I’m using an earlier version (i.e. R5 or lower) of the MIPS ISA?
MIPS Open focuses on promoting and proliferating the latest version of the MIPS ISA, Release 6.
If existing customers using earlier MIPS ISA versions would like to take advantage of the latest MIPS architecture advancements,
they may do so under the MIPS Open license.
However, earlier MIPS customers and other MIPS Open licensees must follow the terms and conditions of the MIPS Open license
and cannot “mix” their licenses or earlier-licensed deliverables with the MIPS Open license. 結局MIPSのオープンソース化と喜んだけど
ほとんど使われてないMIPS32R6とMIPS64R6のオープンソース化だったわけだよな
しかもオープンなのは命令セットだけで、
MIPS32R6やMIPS64R6の実際の設計されたコアがオープンになったわけでもない
ぬか喜びしちゃったよ MIPS32R6、MIPS64R6のコアはこれだけあるがほとんど採用例なし
ちなみに今のMIPSはパフォーマンス重視のP-Class、
ミドルレンジでハードウェアマルチスレッド対応のI-Class
組み込み用のP-Classに分かれてる
P-Class P6600
I-Class I6400、I6500
M-Class M6200、M6250 >>977
SMTは近年セキュリティ問題が大量に発覚してるが、
そのへんは対策できてるのかな? >>978
CPUの設計次第かな
L1TFはキャッシュが他スレッドから推測される脆弱性との合わせ技だし
ポート競合によるレイテンシ増加を読むPortSmachの回避策はポートに依存しないコードを書く
つまり「ZENマイクロアーキテクチャは、Intelのようなポートの競合の問題が少ない。」という後藤の記事を鵜呑みにするならばZenはIntelよりPortSmachでの推測がしにくいCPUって事になる もしかしてSunny CoveがLEAを増やしてきたのはその対策? 組み込み用なら同じプロセスのスレッド以外は混ぜないSMTとかやっても良さそう AppleはiOS11とiOS12で完全64bitに移行したけど、
A11やA12のCPUは32bitモード(ARMv7ベース)を非搭載かな? オプソ化って簡単にできるの?権利関係とかめんどくさそうなんだけど。 >>992
フラグが生えてきてしまうので
踏み固めて除草剤を
Crusoeをそっと埋める ttps://www.guru3d.com/news-story/intel-discontinues-ia-64-itanium-processors.html
あらまディスコン…悼にあむ
K5をそっと埋める 32nmライン閉じて改装予定だからねQuark終了も同時期。
Intelにライフサイクルの長い組み込みなんて土台無理だったんや。 i386は2007年まで生産されてた
Intelも利益を生み出せないなら
止めざるおえない
既存の顧客に対しては受注を継続し
2021年までは出荷可能と言ってるだけ
マシかと >>997
Itaniumもi386もサーバー関連メーカーとの契約の影響があるでしょうね。
Quarkに限らずIntelの組み込み系はバッサリが多いかも。
一定量の供給を受け続けることのできるメーカーやベンダーが契約を結べばあるいは…
きっと一定量購入しないと厳しいペナルティが…
>>998
バイナリだけ残して潰れていった会社のソフトを使わざるを得ないとか、
Windows9xの標準バックアップで保存したファイルを復元するのに必要かも知れない。
NEC系のFDの1.25MBを読むとかPDドライブのようなお終わってしまったハードウェア絡みとか。
ハードウェアとかOS備付プログラムが絡んでなければ意外とWineで動いたりすることも。
PrescottとPentium DとThunderbirdを冷ましてからそっと埋める Bulldozer4代をブルドーザーでそっと埋める(APUは除く)
>>988
任務完了 このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 218日 6時間 48分 56秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。