CPUアーキテクチャについて語れ 44
■ このスレッドは過去ログ倉庫に格納されています
Teslaは不得手があっても高性能だから採用されまくってるんだろ
Phiは逆に得手があってもTeslaに及ばないから普及できなくて撤退
アクセラレータはメモリ性能も重要だから、当然HBM2 vs HMCでもある >>41
Oakforest-Pacsとか知らんよ、いきなりどうした >>42
Intelがサポートや環境でNvidiaに負けるわけ無いだろ
当然資金や人材を大量に投入してやってるよ AMDはサポート面で負け、Intelは性能面で負けた
じゃあ、AMDの性能とintelのサポートのタッグならどうなる?ということで出てきたのがkaby-G
まあ、サーバー向けじゃないから対TeslaのPhi後継というわけじゃないけど Intelが採用したことのないHMCの優劣を語って何になるのだ
HMCを推してたのは団子だけだ 単純な演算しかできないアクセラレータに汎用プロセッサで挑むのはどう考えても無理がある。 >>45
負けてんだよ。今ある環境見てみろ。見てもわからないか。
馬鹿でもターンキーの環境は存在してない。
性能なんて抽象的な言葉しか使えない奴はこの程度。 Zenも64GBくらいのHBMを積めばいいのに。
昔あったslotAかなんかで馬鹿でかいモジュールにしてしまえ。 512bit ADDERを内蔵すればいい使い道がある。 >>52
メモリ速度に引っ張られがちなZenアーキテクチャでSlotタイプはデメリットでかそう
CPU搭載Slot側にメモリとPCI-Eバススロット積んだらそれもうM/Bじゃないってなるし >>52
AMDのアーキはその実メモリドリブンコンピューティングなんだよな
HBCC出てきてそう思った
HBMとHBCCをCPUにも積むでしょ将来的にまあ早いとこ出してほしい
やろうと思えばCPU上にヒートスプレッダー代わりに積めるらしいから
ライザーカードはないだろうけど AMD信者も別の意味で狂ってるからな。もしAMDが2048bit SIMDとかやってたら絶対マンセーしてた でも実際はんな事やってねーじゃんw
仮定持ち出してネガるとか頭おかしいw AMDの予定は全て予定以上と吹聴するポエマーくんみたいだな
ひっくり返すとクソダンゴになるが さっき鏡をみながら自分の肛門のシワを数えてみたすが、143本あったっす
これわ多いのか少ないのか知ってる人いないすかね えーと、年齢、性別、身長、体重計、体脂肪率が同等の検体を調査すれば良いす。
こういうのはやはり言い出しっぺがやればよろしいす。(鼻ホジ
つまるところ知らんす。 富士通の出したPDFで2048bitのSIMD命令を512bitで数クロックかけてやる場合の効率とかやってるのあったよね
そこからPOST京につながるのはわかるんだが、他のセグメントにも応用できる話なんだろうか スパコンは別として一般のプロセッサの場合SIMDに過大にリソースを投じるのは非効率的だよな。
演算器は整数ユニットが64bitだからこれを2倍にして128bitくらいがちょうどよくて命令としては64bit×4×4の1024bitまでは意味があるとしてもそれ以上はねえ。 >>65
確かソレ140bit分くらい要るゾ
まぁISA上どうなってようが持ってる演算機で回せりゃそれで良いからな
SIMD用のコア別に持つのはどうよ >>66
演算器の拡張は楽なのよ。
一番面倒な制御回路を共用してデータパスは多少拡張する。
データの粒度を考える128bitなら効率よく使えるがそれ以上はどんどん効率が悪くなる。
機能としては64bit×4の256bit命令は是非とも欲しい。
大体命令デコード数の2倍以上の演算パイプラインを有するので
256bitの命令を128bitのパイプライン2つで処理するのが無駄が無い。 >>66
コアを分けるとスカラ命令に含まれる構造体や配列の演算、行列演算、文字列比較、ブロック転送とかにSIMDが使えなくなって順次処理命令の中に含まれる並列性を持つ部分を効率的に処理するSIMDの意味がなくなる。
コアを分けるなら制御回路の重いスーパースカラにするのではなくSIMT構成にして演算器リッチにした方がいい。要はGPUだ。特定処理に特化するならFPGAもいい。
GPUやFPGAをコプロセッサ的な形として実装するのは有りだろう。 つーことはやっぱスカラアレイ混載式、統合発行かな
そのうちEDGEになるかな SIMDは使いまわしのMMX・3DNowまで、以後命令追加のみ、
x64は既存レジスタの64bit拡張のみ追加なし、の未来が見てみたかった スタック式1オペランドFPUでもレジスタリネーミングすれば高速化は可能だし80bit拡張倍精度は多倍長演算と相性がいいし科学技術関係で重用されてたりしてな。 高速化するためにあれこれやってたらどんどん消費電力が上がって逆に非効率になった
シンプルなSIMD系特化コアをつくってかわりに数を大幅に増やしたほうがいい そのSIMDに仕事を割り当てるのは誰だと思ってるんだ intelとamdはどちらがより発明に関する実績が優れていると思いますか?
amdはintelからx86をライセンスされて勢いを得た企業らしいですが、自力での優れた発明はあるのでしょうか? >>76
x86自体が優れてたから普及したわけじゃないけどな
今まで残ってこれたのはIBM PCに採用されたからだ
MS-DOS時代は1MBのアドレス空間と64KBのセグメントの壁に多くの開発者が苦しめられた
1MBのアドレス空間以上のメモリを使うためにEMSなんてのもあったしな
Windows 2.xはEMSメモリで動作してたというのだから驚き
実際遅くて使い物にならず、プロテクトモードに対応したWindows 3.0になってやっと普及
それでも64KBのセグメントの壁は残り続け、Windows 95が出るまでずっと開発者を苦しめた AMDの自社開発のISAの話ならこのあたり読めばいいのでは?
CPU黒歴史 対Pentiumのために放棄されたAm29000
http://ascii.jp/elem/000/000/642/642559/ >>76
発明はさておき、2900ビットスライスの時代は先鋭的だったかもね。AMD好きだったな Oakforest PACSのXeon Phi 7250は約3TFLOPSに対して
MCDRAM 490GB/s、DDR4 115.2GB/s。FLOPSあたりのメモリ帯域は
あらゆる課題を相手に潤沢な大きさとはいえないから、一部の種類の
計算が不得手なのは当然で予定外の失策ではなく計画通り。
帯域がもっと大きければ不得手が減ることは分かり切ってるが
コストが跳ね上がることも分かり切ってる。 gpu部門の責任者移籍だってな
amdとintel 最新スマホのスナップドラゴン835か845でWIN10でエンコソフト動かしてもアトムセレロン以下
ってアンドロイド用のエンコソフトとかならcore i5ぐらいのエンコスピード出せるんかな? そもそもスマホのSoCって、バッテリーや放熱の問題があるので、
瞬間最大速度はそこそこ早くなったが継続的に出せる速度は結構遅い
機種によっては充電しながらスマホに扇風機で風当てて冷やしてれば
そこそこの性能が継続できるのもある ゲーミングスマホとかゲーミングタブレットとかほざいてファン内蔵する本末転倒もあながちジョークではない むしろNUCとかBRIXみたいなのをARMでやれれば バッテリーの持ち以外ARMを選ぶ理由ないんだよなぁ というか>>88的なのはラズパイのIF互換基板でやればいいか。
高性能品はマザーより大きいんじゃないかってくらいのヒートシンクが載る。 >>86
iPhoneは100%から電池切れるまでやり続けてもベンチスコア変わらんけど HMCのGen3が開発されていればもっと強力になっただろうに 今更ARM+HMCとか
知識の無い偉い人が適当に決めてます感がすげえな >>97
コスパでブッチギれることは確定だな
ハイパフォ向けじゃ無いから数で殴る専用になるけど
が、その用途はほかに強力な奴が居るからなんとも
現状86とARM、DDRxとHBM、GPUとFPGA
コレら以外の組み合わせはちょっとな
調達側の観点からはソリューションが貧弱ってのもあるけど、あったとして役に立たないであろうから貧弱なワケで >>92
当初ARMスパコンはHMC使用予定だったが、
HBMに計画変更されてるのでは? >>99
IBMパイセンはゴリ推しのパイオニアだからな
でも本気ならz/のラインが浮上してくると思う 富士通のHPCサーバーで採用実績があり、ノード当たり容量よりBW優先に振るなら、HMCの採用は当然と云える。 AMD、2018年第2四半期は過去7年で最高益に
https://pc.watch.impress.co.jp/docs/news/1135171.html
>米国会計基準(GAAP)に基づく第2四半期売上高は、前年同期比53%増の17億6,000万ドルで、
>営業利益は前年同期の-100万ドルから1億5,300万ドルへと黒字に転換。
>純利益も前年同期の-4,200万ドルから、1億1,600万ドルと大幅な増益を達成している。 SamsungがGPUを開発、スマホからスパコンまで対応? - EE Times Japan
http://eetimes.jp/ee/articles/1807/26/news059.html
intelに続いてsamsungもdGPUに参入か むかしNECもGPU作ってたよね
nvidia・atiに勝てなくて撤退したような Hyper98のE2GCは当時もっともWindowsを快適に使えるチップだったりする。 NECのグラフィックチップ自社開発を断念に追い込んだのはS3の928
nとかゴミ扱いの時代。 もうNECエレも遠くなりルネサスすらも…まだ生きてんのそういや? >>114
チップの自社製造が出来なくなったのでN天堂がスイッチした…と聞いた >>103
HMCは遅延を許容できるならデイジーチェーンで容量も確保できるし理屈上DDR4よりスケールする。
EUROSERVERがARM+HMC前提で動いてることもあって富士通も狙ってくでしょ アメリカは年間予算70兆円の軍隊がついてるから
コンピュータ技術でアメリカに勝てる国などいない
日本はアメリカから技術をパクって成功したが、いつの間にか自惚れるようになって
自惚れているうちに台湾や韓国に同じことをされて自滅
中国もアメリカに次ぐ軍隊を持っているからそのうちコンピュータ技術で台頭してくるだろうな コンピュータは軍事に直結する技術
だからアメリカが中国に対してCPUやGPUの輸出規制してるのだって
アメリカの半導体産業やコンピュータ産業を守るためじゃなくて安全保障上の問題からだからな >>114
ルネサスはトヨタや日産が元気なうちは車載向けでやっていけるだろうけどね
ルネサスではCPUコアとしてARMを採用したものが増えて
ルネサス独自CPUの存在感がどんどん薄まってきてるけど >>114
いまはarm自体が遠くなりそう
armって極論で枯れた技術の製品を需要が多い時期にクアルコムが先行投資する
ただそれだけの設備投資業だった
そしてARMの中身性能はPEN4世代のCPUとやってることが変わらなくて
過去10年のGPU中心のsocの進化に全く及んでない
いまのARMの中身、構想は2005年くらいにもあって、これ並みのsocをたしかソニーが提唱してた
ネットググれば当時のアーカイブ残ってるよ「1.5ghz×4c×fhd再生のLINUXチップ」ってコンセプトでたしかCELLの亜種だった
で結果現在のARMはそれで躓いて、GPUによる並列処理で省エネ高速をめざす現在のアプローチに及ばず
ai、クラウドでGPUは不可欠だが、armは別にいらんってことになっとる
こういう時代でai、クラウド、学習機材受注が偉いことになるとわかったから
INTEL、APPLE、AMD、NVIDIAは自社チップとAPU開発強化したんだ
で肝心のスマホarmは
・CPU単体の処理力はPEN4-初期コア2並
・GPU力はアトム並、コア2世代のapu用チップ並
・GPU中心の処理負担源ってやつができん
・クロックを押し上げても性能のばせず、CELLと同じでCPUパワーのみを押し上げても
いくらやってもソフト処理速度は向上しない
ようはソニーが描いたモバイルCELL構想を実現したarmすなどらは、モバイル版作ったらせいのう、理論がcellで性能のびなかった
こういうことなんだわな。835はどうベンチやっても14nmコアmに全く叶わないくせにコストクソクソ高い。
これを3nmにしても性能伸びない。
なぜならいまのpcのCPUはGPUレンダリング補助で省エネ、ツールを高速化するのが常識だから
でクアルコムはそのための技術も準備もないまま淘汰ひってい。
aiに採用するのも基本GPUの高速並列計算で、ARM社の特許技術なんか一切金にならん
こういうのがいまの実態 ARMと泥自体が2014-2015年で性能向上の限界がきて、中身はすなどら650、800で終わりなわけだ
で性能限界でハイエンドとタブレットのセールスに陰りが見えたのが2015前後
そして14-16nmの800-650あたりのやつにたいし835はたいして進化できなくて、3nmでもパワーアップしない。
それはマルチコア1.5-2ghz級のCPUで処理するソフト、アルゴリズムは例え3-4ghzまでやっても強くならん。
これ以上はデュアルコア、マルチコアの限界がコア2で迎えてから、GPU補助レンダリングに以降した10年前のCPU業界と同じだよと
結果ARMとすなどら理論では650級で十分で、これ以上は無意味で捨てられPOWERVRを採用して
ソフトもアルゴリズムも変えていかないと無理と
逆にいまAMD、INTELは3-7nmに以降すればRYZENAPU並の5-7wのタブレットやら、3wのWINDOWSMOBILE作れるやんて話
アーキテクチャとアルゴリズムの使い方が古すぎて、DDR4x、LPDDR5つかっても性能恩恵ないが
AMD、インテルは恩恵受ける
またスイッチがTEGRAな理由はゴミADRENOじゃアルゴとOSとエンジン適合性がクソで
実行性能ゴミだってわかってたから
なのでこれから飛躍するのは旧来のWINDOWSPC勢
google、すなどら、ARM、ソフトバンク、サムスンは割りくって大衰退する
それこそスマホ、タブレット、泥のアプリコンテンツは泥2.4、すなどら1-4からたいして進化せず停滞したままで
みんなYOUTUBEも飽きちゃったろ。すごいゲームの移植もなく紙芝居ソシャゲしかないだろ
こういう理由だわな。 例えばグーグルなんかは、YOUTUBEの低迷とCHROME、YOUTUBEの広告が停滞気味
利用率も低下
いまソシャゲの売上の収益で3000-5000億は利益出てるけど、こんなん日本のたかが数十万のコア消費者が離れたらおしまい
こういう危ういすごく杜撰な収益実態の各社が停滞陥ってるのがスマホ勢
ハイエンドスマホも内実4-5万のコアmタブレット、ノートに勝てんのだから、意味なくなった スマホ業界勢ってのは、日本のかっての携帯コンテンツビジネスの丸パクリをやった
それらをよりずさんに大規模投資でやって日本潰したのがスマホ
けど中身のない薄いコンテンツで5-10年ごまかしたが、もう停滞がきて
各社はそれまでの莫大な投資設備なりは残ってるが、その量だけあって中身内設備、コンテンツがもう相手にされなくなって
飽きられつつある
これがスマホ勢実情で、たいし不利な状況で利益だして将来勢あるのがPC勢
いまPC勢は弱いけど、あと5年で逆襲可能で株価も売上もひっくり返る
スマホ勢はシェアこそもってたけど、ビジネスモデルと技術は低くて
シェアだけあって競争力はクソやったと ARMのように広く使われるにはIPコアが広くライセンス販売されないと無理
IPコアとしてライセンス販売されてるコアのうちARMスマホで広く利用され性能も向上してる
ARMクラスの性能でIPコアとしてライセンス販売されてるCPUコアはあまりないよ スマホによって半導体業界で起きたことはファウンドリの大躍進
それによってTSMC、サムスンが半導体製造技術でIntelに追いついてしまった
AMDの復活もファウンドリの製造技術の向上あってのこと
そして自前のCPUアーキテクチャをもたない企業にとってARMはとても便利な存在になってる
ARMがこのまま行くか、他のものに取って代わられるかは知らないが
これから先も同じような状況になるだろうね まぁFabはさておき、もうモジュール設計を経て旧来型発行からの脱却時期だぁね
その意味じゃ一番マシなのはx86系だろう、電力軽減の機構は1Trのパラメータ変遷から言って利点では無くなる
何れにしても分水嶺だな x86が使えるのは実質IntelとAMDだけだからね
実質2社の独占だから他部分に強みを持った他社が付け入る隙がある
ARMはARM製のIPコアも使えるし、独自に回路設計したARMを他社が作ることも可能
こういう広く使えるところが支持されてる
ただ、ARMが勘違いして独善的なことをやりだしたら、みんな別のものへ移ってしまう
ARMは便利だから利用されてるだけだから >>130
ARMが低消費電力に向いてるなんて方便だぞ
広く普及した自前のCPUアーキテクチャを持ってない半導体メーカーが重用してるだけ
32bitのARMの命令セットは組み込み向けの設計で低消費電力的な用途に向いてたが
64bitのARMの命令セットは別に低消費電力的な設計ではないからな
今更、自前で新しいCPUアーキテクチャを作っても広く使ってもらうことなんて簡単にはできないから
広く使われてるARMに乗っかってるだけ 自前で設計できるならRISC-Vという選択肢もあるがわざわざARMのソフトウェア資産を捨てる程の利点はないな。魔改造しても怒られないからそのためのベースとしては有りだが。 >>121
ハイエンド車載マイコンはRH850が主体ですね。 >>134
まぁある程度引き継いでるし多少はね?
にしてもx86_64とARMが殆どで、他の有象無象が毛根並みに死滅してる現状はちっとも面白くないな
かと言ってRISC-Vみたいなスペシフィック系が躍進しても面白くない
普遍的になりようが無いし、何より魅力を全く感じないわ なんだかんだでx64+AVX512が一番性能優先のISAというのがな。
高機能すぎて実装に金が掛かるからもはや対抗できないという。 POWER系とGeforceでAPUみたいの作ってみて欲しい >>139
革ジャンをトップから引き摺り下ろさん事には無理だろ ルネサスはM&Aで医療用か宇宙用に手を出すみたいだがどこを買ってどんなのを作るのか
RAD5500みたいな高性能品作るつもりはないのか。 >>136
RH850はエンジン制御とかじゃないの?
情報系や自動運転とかを目指してるR-CARは64bitのハイエンドのARMだね ■ このスレッドは過去ログ倉庫に格納されています