CPUアーキテクチャについて語れ 44
■ このスレッドは過去ログ倉庫に格納されています
>>66
演算器の拡張は楽なのよ。
一番面倒な制御回路を共用してデータパスは多少拡張する。
データの粒度を考える128bitなら効率よく使えるがそれ以上はどんどん効率が悪くなる。
機能としては64bit×4の256bit命令は是非とも欲しい。
大体命令デコード数の2倍以上の演算パイプラインを有するので
256bitの命令を128bitのパイプライン2つで処理するのが無駄が無い。 >>66
コアを分けるとスカラ命令に含まれる構造体や配列の演算、行列演算、文字列比較、ブロック転送とかにSIMDが使えなくなって順次処理命令の中に含まれる並列性を持つ部分を効率的に処理するSIMDの意味がなくなる。
コアを分けるなら制御回路の重いスーパースカラにするのではなくSIMT構成にして演算器リッチにした方がいい。要はGPUだ。特定処理に特化するならFPGAもいい。
GPUやFPGAをコプロセッサ的な形として実装するのは有りだろう。 つーことはやっぱスカラアレイ混載式、統合発行かな
そのうちEDGEになるかな SIMDは使いまわしのMMX・3DNowまで、以後命令追加のみ、
x64は既存レジスタの64bit拡張のみ追加なし、の未来が見てみたかった スタック式1オペランドFPUでもレジスタリネーミングすれば高速化は可能だし80bit拡張倍精度は多倍長演算と相性がいいし科学技術関係で重用されてたりしてな。 高速化するためにあれこれやってたらどんどん消費電力が上がって逆に非効率になった
シンプルなSIMD系特化コアをつくってかわりに数を大幅に増やしたほうがいい そのSIMDに仕事を割り当てるのは誰だと思ってるんだ intelとamdはどちらがより発明に関する実績が優れていると思いますか?
amdはintelからx86をライセンスされて勢いを得た企業らしいですが、自力での優れた発明はあるのでしょうか? >>76
x86自体が優れてたから普及したわけじゃないけどな
今まで残ってこれたのはIBM PCに採用されたからだ
MS-DOS時代は1MBのアドレス空間と64KBのセグメントの壁に多くの開発者が苦しめられた
1MBのアドレス空間以上のメモリを使うためにEMSなんてのもあったしな
Windows 2.xはEMSメモリで動作してたというのだから驚き
実際遅くて使い物にならず、プロテクトモードに対応したWindows 3.0になってやっと普及
それでも64KBのセグメントの壁は残り続け、Windows 95が出るまでずっと開発者を苦しめた AMDの自社開発のISAの話ならこのあたり読めばいいのでは?
CPU黒歴史 対Pentiumのために放棄されたAm29000
http://ascii.jp/elem/000/000/642/642559/ >>76
発明はさておき、2900ビットスライスの時代は先鋭的だったかもね。AMD好きだったな Oakforest PACSのXeon Phi 7250は約3TFLOPSに対して
MCDRAM 490GB/s、DDR4 115.2GB/s。FLOPSあたりのメモリ帯域は
あらゆる課題を相手に潤沢な大きさとはいえないから、一部の種類の
計算が不得手なのは当然で予定外の失策ではなく計画通り。
帯域がもっと大きければ不得手が減ることは分かり切ってるが
コストが跳ね上がることも分かり切ってる。 gpu部門の責任者移籍だってな
amdとintel 最新スマホのスナップドラゴン835か845でWIN10でエンコソフト動かしてもアトムセレロン以下
ってアンドロイド用のエンコソフトとかならcore i5ぐらいのエンコスピード出せるんかな? そもそもスマホのSoCって、バッテリーや放熱の問題があるので、
瞬間最大速度はそこそこ早くなったが継続的に出せる速度は結構遅い
機種によっては充電しながらスマホに扇風機で風当てて冷やしてれば
そこそこの性能が継続できるのもある ゲーミングスマホとかゲーミングタブレットとかほざいてファン内蔵する本末転倒もあながちジョークではない むしろNUCとかBRIXみたいなのをARMでやれれば バッテリーの持ち以外ARMを選ぶ理由ないんだよなぁ というか>>88的なのはラズパイのIF互換基板でやればいいか。
高性能品はマザーより大きいんじゃないかってくらいのヒートシンクが載る。 >>86
iPhoneは100%から電池切れるまでやり続けてもベンチスコア変わらんけど HMCのGen3が開発されていればもっと強力になっただろうに 今更ARM+HMCとか
知識の無い偉い人が適当に決めてます感がすげえな >>97
コスパでブッチギれることは確定だな
ハイパフォ向けじゃ無いから数で殴る専用になるけど
が、その用途はほかに強力な奴が居るからなんとも
現状86とARM、DDRxとHBM、GPUとFPGA
コレら以外の組み合わせはちょっとな
調達側の観点からはソリューションが貧弱ってのもあるけど、あったとして役に立たないであろうから貧弱なワケで >>92
当初ARMスパコンはHMC使用予定だったが、
HBMに計画変更されてるのでは? >>99
IBMパイセンはゴリ推しのパイオニアだからな
でも本気ならz/のラインが浮上してくると思う 富士通のHPCサーバーで採用実績があり、ノード当たり容量よりBW優先に振るなら、HMCの採用は当然と云える。 AMD、2018年第2四半期は過去7年で最高益に
https://pc.watch.impress.co.jp/docs/news/1135171.html
>米国会計基準(GAAP)に基づく第2四半期売上高は、前年同期比53%増の17億6,000万ドルで、
>営業利益は前年同期の-100万ドルから1億5,300万ドルへと黒字に転換。
>純利益も前年同期の-4,200万ドルから、1億1,600万ドルと大幅な増益を達成している。 SamsungがGPUを開発、スマホからスパコンまで対応? - EE Times Japan
http://eetimes.jp/ee/articles/1807/26/news059.html
intelに続いてsamsungもdGPUに参入か むかしNECもGPU作ってたよね
nvidia・atiに勝てなくて撤退したような Hyper98のE2GCは当時もっともWindowsを快適に使えるチップだったりする。 NECのグラフィックチップ自社開発を断念に追い込んだのはS3の928
nとかゴミ扱いの時代。 もうNECエレも遠くなりルネサスすらも…まだ生きてんのそういや? >>114
チップの自社製造が出来なくなったのでN天堂がスイッチした…と聞いた >>103
HMCは遅延を許容できるならデイジーチェーンで容量も確保できるし理屈上DDR4よりスケールする。
EUROSERVERがARM+HMC前提で動いてることもあって富士通も狙ってくでしょ アメリカは年間予算70兆円の軍隊がついてるから
コンピュータ技術でアメリカに勝てる国などいない
日本はアメリカから技術をパクって成功したが、いつの間にか自惚れるようになって
自惚れているうちに台湾や韓国に同じことをされて自滅
中国もアメリカに次ぐ軍隊を持っているからそのうちコンピュータ技術で台頭してくるだろうな コンピュータは軍事に直結する技術
だからアメリカが中国に対してCPUやGPUの輸出規制してるのだって
アメリカの半導体産業やコンピュータ産業を守るためじゃなくて安全保障上の問題からだからな >>114
ルネサスはトヨタや日産が元気なうちは車載向けでやっていけるだろうけどね
ルネサスではCPUコアとしてARMを採用したものが増えて
ルネサス独自CPUの存在感がどんどん薄まってきてるけど >>114
いまはarm自体が遠くなりそう
armって極論で枯れた技術の製品を需要が多い時期にクアルコムが先行投資する
ただそれだけの設備投資業だった
そしてARMの中身性能はPEN4世代のCPUとやってることが変わらなくて
過去10年のGPU中心のsocの進化に全く及んでない
いまのARMの中身、構想は2005年くらいにもあって、これ並みのsocをたしかソニーが提唱してた
ネットググれば当時のアーカイブ残ってるよ「1.5ghz×4c×fhd再生のLINUXチップ」ってコンセプトでたしかCELLの亜種だった
で結果現在のARMはそれで躓いて、GPUによる並列処理で省エネ高速をめざす現在のアプローチに及ばず
ai、クラウドでGPUは不可欠だが、armは別にいらんってことになっとる
こういう時代でai、クラウド、学習機材受注が偉いことになるとわかったから
INTEL、APPLE、AMD、NVIDIAは自社チップとAPU開発強化したんだ
で肝心のスマホarmは
・CPU単体の処理力はPEN4-初期コア2並
・GPU力はアトム並、コア2世代のapu用チップ並
・GPU中心の処理負担源ってやつができん
・クロックを押し上げても性能のばせず、CELLと同じでCPUパワーのみを押し上げても
いくらやってもソフト処理速度は向上しない
ようはソニーが描いたモバイルCELL構想を実現したarmすなどらは、モバイル版作ったらせいのう、理論がcellで性能のびなかった
こういうことなんだわな。835はどうベンチやっても14nmコアmに全く叶わないくせにコストクソクソ高い。
これを3nmにしても性能伸びない。
なぜならいまのpcのCPUはGPUレンダリング補助で省エネ、ツールを高速化するのが常識だから
でクアルコムはそのための技術も準備もないまま淘汰ひってい。
aiに採用するのも基本GPUの高速並列計算で、ARM社の特許技術なんか一切金にならん
こういうのがいまの実態 ARMと泥自体が2014-2015年で性能向上の限界がきて、中身はすなどら650、800で終わりなわけだ
で性能限界でハイエンドとタブレットのセールスに陰りが見えたのが2015前後
そして14-16nmの800-650あたりのやつにたいし835はたいして進化できなくて、3nmでもパワーアップしない。
それはマルチコア1.5-2ghz級のCPUで処理するソフト、アルゴリズムは例え3-4ghzまでやっても強くならん。
これ以上はデュアルコア、マルチコアの限界がコア2で迎えてから、GPU補助レンダリングに以降した10年前のCPU業界と同じだよと
結果ARMとすなどら理論では650級で十分で、これ以上は無意味で捨てられPOWERVRを採用して
ソフトもアルゴリズムも変えていかないと無理と
逆にいまAMD、INTELは3-7nmに以降すればRYZENAPU並の5-7wのタブレットやら、3wのWINDOWSMOBILE作れるやんて話
アーキテクチャとアルゴリズムの使い方が古すぎて、DDR4x、LPDDR5つかっても性能恩恵ないが
AMD、インテルは恩恵受ける
またスイッチがTEGRAな理由はゴミADRENOじゃアルゴとOSとエンジン適合性がクソで
実行性能ゴミだってわかってたから
なのでこれから飛躍するのは旧来のWINDOWSPC勢
google、すなどら、ARM、ソフトバンク、サムスンは割りくって大衰退する
それこそスマホ、タブレット、泥のアプリコンテンツは泥2.4、すなどら1-4からたいして進化せず停滞したままで
みんなYOUTUBEも飽きちゃったろ。すごいゲームの移植もなく紙芝居ソシャゲしかないだろ
こういう理由だわな。 例えばグーグルなんかは、YOUTUBEの低迷とCHROME、YOUTUBEの広告が停滞気味
利用率も低下
いまソシャゲの売上の収益で3000-5000億は利益出てるけど、こんなん日本のたかが数十万のコア消費者が離れたらおしまい
こういう危ういすごく杜撰な収益実態の各社が停滞陥ってるのがスマホ勢
ハイエンドスマホも内実4-5万のコアmタブレット、ノートに勝てんのだから、意味なくなった スマホ業界勢ってのは、日本のかっての携帯コンテンツビジネスの丸パクリをやった
それらをよりずさんに大規模投資でやって日本潰したのがスマホ
けど中身のない薄いコンテンツで5-10年ごまかしたが、もう停滞がきて
各社はそれまでの莫大な投資設備なりは残ってるが、その量だけあって中身内設備、コンテンツがもう相手にされなくなって
飽きられつつある
これがスマホ勢実情で、たいし不利な状況で利益だして将来勢あるのがPC勢
いまPC勢は弱いけど、あと5年で逆襲可能で株価も売上もひっくり返る
スマホ勢はシェアこそもってたけど、ビジネスモデルと技術は低くて
シェアだけあって競争力はクソやったと ARMのように広く使われるにはIPコアが広くライセンス販売されないと無理
IPコアとしてライセンス販売されてるコアのうちARMスマホで広く利用され性能も向上してる
ARMクラスの性能でIPコアとしてライセンス販売されてるCPUコアはあまりないよ スマホによって半導体業界で起きたことはファウンドリの大躍進
それによってTSMC、サムスンが半導体製造技術でIntelに追いついてしまった
AMDの復活もファウンドリの製造技術の向上あってのこと
そして自前のCPUアーキテクチャをもたない企業にとってARMはとても便利な存在になってる
ARMがこのまま行くか、他のものに取って代わられるかは知らないが
これから先も同じような状況になるだろうね まぁFabはさておき、もうモジュール設計を経て旧来型発行からの脱却時期だぁね
その意味じゃ一番マシなのはx86系だろう、電力軽減の機構は1Trのパラメータ変遷から言って利点では無くなる
何れにしても分水嶺だな x86が使えるのは実質IntelとAMDだけだからね
実質2社の独占だから他部分に強みを持った他社が付け入る隙がある
ARMはARM製のIPコアも使えるし、独自に回路設計したARMを他社が作ることも可能
こういう広く使えるところが支持されてる
ただ、ARMが勘違いして独善的なことをやりだしたら、みんな別のものへ移ってしまう
ARMは便利だから利用されてるだけだから >>130
ARMが低消費電力に向いてるなんて方便だぞ
広く普及した自前のCPUアーキテクチャを持ってない半導体メーカーが重用してるだけ
32bitのARMの命令セットは組み込み向けの設計で低消費電力的な用途に向いてたが
64bitのARMの命令セットは別に低消費電力的な設計ではないからな
今更、自前で新しいCPUアーキテクチャを作っても広く使ってもらうことなんて簡単にはできないから
広く使われてるARMに乗っかってるだけ 自前で設計できるならRISC-Vという選択肢もあるがわざわざARMのソフトウェア資産を捨てる程の利点はないな。魔改造しても怒られないからそのためのベースとしては有りだが。 >>121
ハイエンド車載マイコンはRH850が主体ですね。 >>134
まぁある程度引き継いでるし多少はね?
にしてもx86_64とARMが殆どで、他の有象無象が毛根並みに死滅してる現状はちっとも面白くないな
かと言ってRISC-Vみたいなスペシフィック系が躍進しても面白くない
普遍的になりようが無いし、何より魅力を全く感じないわ なんだかんだでx64+AVX512が一番性能優先のISAというのがな。
高機能すぎて実装に金が掛かるからもはや対抗できないという。 POWER系とGeforceでAPUみたいの作ってみて欲しい >>139
革ジャンをトップから引き摺り下ろさん事には無理だろ ルネサスはM&Aで医療用か宇宙用に手を出すみたいだがどこを買ってどんなのを作るのか
RAD5500みたいな高性能品作るつもりはないのか。 >>136
RH850はエンジン制御とかじゃないの?
情報系や自動運転とかを目指してるR-CARは64bitのハイエンドのARMだね POWER9はNVIDIAのGPUとの連携強化を謳い文句にしてるね
IBM、「POWER9」プロセッサ搭載のサーバーシステム「Power Systems AC922」
https://pc.watch.impress.co.jp/docs/news/1095421.html
>Power Systems AC922は、PCI Express(PCIe) 4.0や
>NVIDIAのインターコネクト規格「NVLink」、
>オープンなプロセッサ間コヒーレントインターコネクト
>「OpenCAPI (Open Coherent Accelerator Processor Interface)」を組み込んだ初の製品となり、
>PCIe 3.0ベースのx86システムよりも9.5倍高速
>(x86とPCIe 3.0 x16の最大転送デート15.75GB/s、
>POWER9とNVLinkの最大転送レート150GB/s)な転送の実現を謳う。
>AC922は、前述の高速なインターコネクトを活用し、
>アプリケーションがシステムメモリをGPUメモリとして活用できるようにすることで、
>AIモデルが大きくなってしまい、GPUメモリが不足してしまう問題に対応している。
>NVLinkにより、CPUとGPU間でメモリを共有しても、
>x86サーバのようにPCIe 3.0によるボトルネックが発生しないという。
> AC922では、16/18/20/22コアのPOWER9プロセッサを2基を搭載可能で、
>最大44コア構成が可能。GPUはTesla V100を2〜6基搭載できる。 今風のコンシューマ向けの手頃なPowerPCがない件 >>139
作っても使うところがないような
PC用やスマホ向けには作らんだろうし
いわゆる車載SoCだとNVIDIAは自分で作ってる
POWER系向けだとNVLinkやNVSwitchでGPUいっぱい積む方向だし >>144
IoTの波に乗るマイコン事情 第3回
〜ARMのライバル「MIPS」、「PowerPC」、「x86」
https://pc.watch.impress.co.jp/docs/column/1month-kouza/684769.html
この記事によればPowerPCをやってたところは64bitのARMに行っちゃった模様 PowerPCやってて64bitのARMに行ったAPMはX-Gene3を出す前にMACOMに買収されたようだが
別の会社がX-Geneの事業を買い取って新しい会社が設立された模様
Intelの元社長、サーバ向けArm SoCで再始動
http://eetimes.jp/ee/articles/1802/07/news067.html こんな記事があるけどどうなんだろうね
HPE、米国エネルギー省向けに、世界最大級のArmスーパーコンピュータを開発:ベースとなる「HPE Apollo 70 System」を日本でも販売開始
https://www.hpe.com/jp/ja/japan/newsroom/press-release/2018/071701.html
総コア数14万5000個以上のデュアルプロセッササーバ2592台で構成:
目指すは世界最大級のArmスパコン――HPE、米エネルギー省との共同による「Astra」開発計画を発表
http://www.atmarkit.co.jp/ait/articles/1806/20/news041.html
サーバー向けArmプロセッサのもう1つの刺客、Cavium「ThunderX2」
〜8チャネルメモリ/2ソケット対応
https://pc.watch.impress.co.jp/docs/news/1091494.html HPE、ARMベースのHPC専用サーバー「HPE Apollo 70 System」を販売
https://it.impressbm.co.jp/articles/-/16414 GUI表示する情報系に必要なチップのスペックはいまのルネサスの車載マイコンじゃまったく足りない
とくに上位車種はナビと車内システムが一体なのでより高性能なSoCが必要
iPad上位機種くらいの性能は必須 カーナビの画面ってなんであんなにカックカクなんだろうな スマホやタブレットSoC流用したような中華ナビはサクサク動く
ルネサスのSoCつかったカーナビは性能低すぎて使っててイライラする 測位が高速じゃないから、画面更新頻度を高くしても意味がないという考えでは というかやる気ないんでしょうな
どうせarmなんだからどうしても性能欲しければa72以上の使えばいいわけで
そうしてないわけだから。 >>153
日本製低スペ石使うからですよ
プロセッサ有ったのに全滅した間抜けを舐めたらあかん
ついでに犯人たる禿は吊れ カーナビは1Hz,5Hz,10Hzとかの低レートでしか測位してないから
大抵は1hz >>156
今のR-Carの最上位のH3はCortex-A57 x 4 + Cortex-A53 x 4 + Cortex-M7だけど
できたのが2015年だからね
Cortex-A72もしくはCortex-A75もしくはCortex-A76を使ったやつは開発中なのでは? >>159
だとしたら企業としての動きが遅い的なツッコミ入るだろう
組み込みだからってのはわかるが…… 中華ナビでもそんなに高性能な石使ってるわけでもないし同世代の製品使えば性能は足りてるんだよ。
国産カーナビはガラケーと一緒でソフトの方が進化しないので古い石使ったままってパターン。 >>160
組み込みフラッシュのつごうでそこまで微細化進んでないんじね?
40nmとか28nmで進んでる方とか言うし。 カーナビで組み込みフラッシュ使うようなMCUの必要はないし
ルネサスもARM以前のSHシリーズの頃からごく普通のSoCで現行最新は16nmだよ。 カーナビなんて余り物詰めてぼったくり価格で売ってるだけだと思ってた まあそこそこのカーナビはGPS+各種センサーだからねえ… ■ このスレッドは過去ログ倉庫に格納されています