CPUアーキテクチャについて語れ 47
レス数が1000を超えています。これ以上書き込みはできません。
まあハードリミットはプロセスが決めるからねえ
そういう意味じゃIntelだけ縛りプレイしてて悲しい IntelもSunny Coveの後継は著しく大きくなるって言ってるからPOWER9みたいになるかもね Arm、2021年のフラッグシップスマートフォン向けCPU/GPU/NPUの最新デザインを発表
〜CPUのCortex-X1は30%、GPUのMali-G78は25%、Ethos-N78は25%性能向上
https://k-tai.watch.impress.co.jp/docs/news/1254912.html 5nmプロセス向け。性能が2割向上したArm「Cortex-A78」
〜新フラグシップGPU「Mali-G78」なども
https://pc.watch.impress.co.jp/docs/news/1254999.html >>954
いうてAVX512とかAIようの専用コプロとかで
無駄に肥大する公算のほうが大きい ARMのGPUはマトモになったのかね
Qualcommは独自開発だしSamsungは次からRadeonを使うらしいが >>959
Ryzenにはセキュアプロセッサーが…… >>961
そういうコプロセッサ的なやつではなくbig.LITTLEみたいなのがあったら面白そうだなと
例えばwindowsでx86のみのアプリ動かす時にだけx86プロセッサが動く
みたいな動きが出来たら省電力化にも貢献できるんじゃないか? >>962
それならAtom+BigCoreでええやん
ARM必要なかんべ
そういやチップレベルではないけどPS4がダウンロード代行するARMコア持ってたような記憶が PS4にARMコアはあるけど非力すぎてスリープ中のDL代行する案は発売前に中止になった。普通にJaguarでDLされる。 >>957
あんなのHPC用途くらいでしか使えないだろ
スマホ用とかで使う意味なし Cortex-A78とX1の違いはこちらを見るとよくわかるね↓
ttps://hexus.net/tech/news/cpu/142918-arm-cortex-x1-designed-deliver-ultimate-performance/
Apple・ARM・AMDはプロセスに合わせたCPUコアの開発を毎年進めてる
それに比べてIntelはあまりにも不甲斐ない 14nm、14nm+、14nm++に合わせてラインナップ拡張してるだろ! >>965
しかしPC向けならば256bitSIMDが出てくる余地があるわけで、
現状256以上はSVEが本命
(別の追加命令定義して流行らせる企業が出てこなければ)
スマホが256必要かというのもまたよくわからない。
キラーコンテンツは動画エンコというのだとスマホでやるやついないし。 Intel流に素早く処理を終えて
少しでも長く省電力ステートに入るのが効率的ではあるはず
たしかAppleaのSoCは256bit SIMDと推測されてたはず IntelはインサイダーCEOが独裁経営してた挙げく夜逃げで滞ってたが、今は新体制で製品・製造どちらもロードマップが建て直されてる
Tiger Lake、Rocket Lake、Alder Lake、Sapphire Rapids、Meteor Lake..
EUV 7nm、Nanowire 5nm、積層 Nanowire 3nm、積層ウェハー 2nm.. >>966
A76からA77、A78、X1って同じアーキテクチャの改良版らしいけど
これ開発したリードアーキテクトがちょっと前に林檎に引き抜かれてたよな
林檎に開発をごっそり引き抜かれて苦境に陥ったPowerVRみたいにならなきゃいいけど >>972
HPC(スパコンや大型サーバ)で行う
科学技術向け計算に発想が行かないとね 安倍晋三が「責任は私にある」と述べたのに何の責任も取らなかったのは昨年11月までで49回、現在は50回を超えているそうだ。せっかくなので「自分の責任を認めつつも一度も責任を取っていない現職の首相」として誰かギネスブックに申請してほしい。 >>973
>>965に対してHPC以外の用途を言うレスなのだからスパコンを持ち出すのはキチガイだろう 通信量を抑えて広帯域を狙うなら圧縮率の高いコーデックを使うから、スマホでもAVXとかSVEの出番はありそう。 画像認識/物体認識/画像処理/AR/VR/MR
音声認識/音声合成/立体音響
言語処理
色々と重い処理がある そもそも標準的な幅が概ね128なんだからそこまでは必要だが、それ以上がどのくらい要るかつったら作りたい石次第なわけで
モバイルとかだと汎用重SIMDなんて多用してたら電池マッハだし、面積も無駄に食う
そーなると128x2くらいかなってとこだし
デスクトップでも何でもコアを減らしてまでフィード帯域を稼ぐくらいなら256x2程度で上等って感じ
どうせコアでカバー可能だし SIMD長倍よりコア数倍の方がはるかにコストがかかる
電力も回路規模も >>966
A78は7nmのA77を5nmに微細化しクロックを上げたものか
X1はオプションでSVE搭載とかはないんだな
Appleは例外として自社でカスタマイズする手間が省けるのはいいね >>983
その下が「4x128b total bandwidth」となってるのは
そこまで拡張できますってこと? >>984
図のとおりだろう、という想像しかできないので図を見てほしい。
たぶんX1はクソデカいコアになるので。 >>985
FMULとFADDが4本づつって凄い化物じゃの >>975
スパコンや大型サーバ扱う
企業の研究センターやら大学の工学部の
サイトやら見てれば「工学解析が云々
天文学計算が云々とか出てきて。
この手の大型コンピューターは
こういう学術的or研究用途に使うんだな
ってわかるじゃない 学術で使われてた機能をクライアントにどう落とすんだって話を
そういう機能は学術で使うんだってもう会話が意味不明だ >>988
コピペミスってたのが直っておる……ありがたや……
(今スレ主は悪くないが前スレでミスったのが残っていた) >>987
でも2本づつでは?
== ここからコピペ
242 :,,・´∀`・,,)っ-○○○:2015/10/30(金) 08:31:42.60 ID:MaS1QgyE
どうやらFADD/FMUL計4基の意図が読めましたよ
JavaScriptの為だ。サーバサイドでいうとNode.jsだね。
基本の数値型が倍精度スカラなんだよね
なおかつ積和演算が使えないからFMAより単体のFMUL+FADDのほうが効率がいい
V8とかの既存のエンジンの実装を見ても今のところループベクタライズなどの最適化は行われていないから
スカラ演算のスループットに特化したほうが速いはずだと。
Intelをして「インターネットのネイティブ言語」と言ってるくらいだからこれに特化する価値は十分あると思う
貼り付け元 <http://anago.2ch.net/test/read.cgi/jisaku/1445047651/>
92 返信:,,・´∀`・,,)っ-○○○[sage] 投稿日:2015/11/18(水) 23:07:50.29 ID:IpozkCo0 [3/3]
>>89
まあNode.jsでも数値型より文字列のほうがはるかに利用頻度高いんだけどなw
AVX2でネイティブの256ビットSIMDが使えるとUCS2が16並列でマッチングできたりいろいろ便利だよ
128ビットニコイチじゃいかんのですよ
== ここまでコピペ
末端(クリエイティブではなくコンテンツ消費)特化な感じかな? >>992
各コア毎クロック
32個の32bit float積和
か
16個の64bit float積和
が可能 このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 157日 14時間 40分 41秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。