CPUアーキテクチャについて語れ 43

**過去スレ** · 2018/04/30(月) 17:56:47.66

**過去スレ** · 2018/04/30(月) 17:58:07.13

**Socket774** · 2018/04/30(月) 18:21:50.52

教えてください！
x86系CPUのコア数なんですが、将来的な見通しとして最大何コアまで行きそうでしょうか？
パラレル動作するインタプリタを作っておりまして、スレッド用のスロットをいくつ確保するかを仕様として決め打ちしたいのです

**Socket774** · 2018/04/30(月) 18:45:43.29

x86といえばWindowsだが
Windowsの論理プロセッサ数はクライアント版（Pro）が256とかだっけか
サーバだとそれ以上。

**Socket774** · 2018/04/30(月) 18:58:09.02

>>4
ありがとうございます！
このページによるとWindows Server 2016では512論理プロセッサとあります
http://www.atmarkit.co.jp/ait/spv/1612/21/news047.html
このくらいを考えておいた方がいいってことですね

**Socket774** · 2018/04/30(月) 20:06:59.47

>>5
要求がよくわからんから大くくりの回答しかできんかったわ
市場の顧客の条件にも依るんじゃないか。
デスクトップPC向けが256論理コア行く事なんて向こう10年はなさそうだし。

**Socket774** · 2018/04/30(月) 20:25:20.12

>>6
いや、充分です
考えてみればマイクロソフトが一番情報を持っているだろうし

ありがとう！

**Socket774** · 2018/05/01(火) 03:11:14.06

>>1000
HBM1はむしろ高いよ
1層2Gbの非効率なメモリダイとロジックダイとTSVを使う高級規格

コスト的な理想はロジックダイなし単層で小型の最新プロセス版WideI/Oメモリを作ることだと思う
HBM3の規格と製造プロセスと共通化するのがええ

**Socket774** · 2018/05/01(火) 04:11:41.16

ハイエンドサーバとかの場合、MSに聞くよりハードウェアベンダーに聞いたほうがいい
ハードウェアベンダがサポートするOSを使うのが基本だからな

**Socket774** · 2018/05/01(火) 04:38:06.68

>>8
LC-HBMの暫定が確かそんな仕様だった

が、実装都合上メリットが無いとして破棄
使う側からはメリットである帯域もただでさえ少ない容量も減るというスペースシャトル並みの本末転倒
そしてFabはTSVの熟成用生贄が欲しいのに使わないなら態々金掛けて新規格を採用する意味がないという

まぁ色々思うところはあるが、現存のHBM規格は価格以外のデメリットが取り敢えず無いからして
低価格化して普及するなんて今までも山程あったわけで
取り敢えずは問題なかろう
問題は値段下がるより先にプロセッサのUMC部の値段がソイツを上回りそうって事か
まぁそうなったらそうなったでみんな美味しいから良いか

**Socket774** · 2018/05/01(火) 05:46:09.60

>>10
現状のHBMはコストこそが絶対的なデメリットで
そこには技術的な背景があるから問題になっていて
用途拡大も進められれずにいるんだよ

**Socket774** · 2018/05/01(火) 06:03:54.66

とりあえずLCもスタックドメモリでTSVを使う規格だった
TSVには工程としてのコストとダイエリアのコストと歩留まりコストがあり
高コストな技術だと言われてる

だからニアメモリで別途ファーメモリのDDRを使うAPUなんかには
初めから容量は捨ててTSVの無い1枚チップで良いじゃんって話をした

また帯域を落とすのが本末転倒なのでLC規格とは違いバス密度は落とさない
バス幅半分にするのと同時にエッジ長と面積も同時に半分にする

実装の最小単位を落とせば使いやすくなるだろうって話であって
エッジ幅や面積あたりで見た時の帯域効率はHBMと同じって話

**Socket774** · 2018/05/01(火) 07:39:13.05

今の性能、ダイサイズ位のAPUならGDDR5で十分

なんでそんなにHBMに執着するのか

**Socket774** · 2018/05/01(火) 07:42:44.39

基本のコア性能上げるの諦めてるからだろ

**Socket774** · 2018/05/01(火) 07:55:00.79

>>12
それこそ本末転倒なんだよなぁ
そんなんならダイのDRAMコン増やすかSRAM増やすで十二分に効果がある範囲にしかならない
寧ろダイの拡大の方が現実的だろう

何でLCで密度を落とす選択をしたかと言えばインターポーザにSiがどうしても必要だからだ
またTSV“自体”のイールドは改善のしようがある
だがこれはメインのロジックダイとHBMを貼り付ける都合上かなり大きくなってしまう、配線も増える
半導体のイールドとコストはインターポーザと言えどウェハから作る関係上、影響を受ける
どころかコレを作るためだけにラインを一つ消費するだけのコストが掛かる
その上共通化できないから製品毎に専用、しかもサイズの異なるダイを二つかそれ以上接合しないといけないという地味に難易度の高い実装
一方スタックドDRAMであるだけのHBM自体は小さくその上安価なDRAMプロセス製の規格量産品
故にHBM“自体”のモンキーモデルはこれを必要とはしない
どーやって引っ付けるかがネック

>>14
上がらねぇんだよ
論理的にも物理的にもほぼ限界
だから現状唯一面積さえ差し出せば向上出来るポイントである粗粒度並列化、その為の帯域要求
現状、コレ以外のソリューションは軒並みデファクトを置き換えられる程のものじゃない
他に方法があればこんな米帝プレイ的なピン数のゴリ押しに頼ったりしないさ

**Socket774** · 2018/05/01(火) 08:04:20.85

>>13
GDDRにすると
・チップあたりの帯域幅が数分の１
・転送1bitあたりの電力が数倍
・チップあたりのch数が少なくレイテンシが長くなる
といった辺りがいまいち

**Socket774** · 2018/05/01(火) 08:13:58.73

>>15
DRAMプロセスだから１ダイあたりで16Gbit
只のニアメモリであってダイコストはまったく普通のDRAMだよ

SRAMはどんなに増やしても数百Mbitが限界
DRAMコントローラが増やすためにはダイを大きくする必要があり
それはまさにコスト直結、電力増大、用途限定の本末転倒

逆に高密度インターコネクトパッケージは2.1Dのファンアウト技術を中心に遥かに開発が進んでる
インターコネクトが進化してる状況ではLC版で規格を低密度化する意味が無い

**Socket774** · 2018/05/01(火) 08:16:42.97

例えば2.1DではFuryやVegaで2.5D実装を手掛けてたASEの準備が出来たと言ってる

https://www.nikkei.com/article/DGXLRSP470309_R00C18A2000000/
https://semiengineering.com/wp-content/uploads/2018/03/fig2fanout.png
半年前の発表資料ではチップ合計624mm2、配線3層、パッケージ45mm角だったのに対して
858mm2、4層、67mm角にまで強化Vega64クラスに対応出来るスペックになった
真っ先にAPU + Memoryとも書かれてる
歩留まりが2.5umスペースの4層で99%まで上がったんだそう

**Socket774** · 2018/05/01(火) 08:36:25.62

メモリをWideI/O的な一層メモリ、ロジック無しにすると
メモリベンダー側の原理的なダイ製造コストは通常のDDR系とほとんど差がなくなる
つまりベンダー側が極端なプレミアムを付ける一方的な根拠が無くなる

マイクロバンプによる高密度WideI/O系単層メモリは
昔からソニーがプレステポータブルとか携帯機で使い続けてる
なので幅広く使えないようなコスト的な根拠は無いだろう

**Socket774** · 2018/05/01(火) 09:44:23.01

>>7
(ターゲットとしているx86の範疇外かもしれないが)ロードマップで見えてきている製品でも
Xeon Scalable ProccesorだとIce Lake-SPが最大38コアとの噂で
2way SMT/4way SMPだとシステムとしては304スレッド

Xeon PhiだとKnights Landing/Millが最大72コア/288スレッド
Knights Runでは～88コア程度との予測がある

Xeon Phiのコアアーキテクチャが現在のSilvermontベースから
次のKnights CoveからはSkylake-SPベースに変わるとの噂なので
SMTが現在の4wayからKnights Cove/Runで変化するかもしれんし
SMPの対応有無も不明なので
Knights Runのシステムとしての最大スレッド数がどの程度になるかは現状不明

**Socket774** · 2018/05/01(火) 11:01:43.08

APUのキャッシュ用メモリに欲しいスペックは、100GB/s程度の帯域、1GBの容量なんで、これを達成できれば何でもいい
似たようなスペックがHBM1の1スタックで、面積も小さいからCPUソケットに収まる範囲に出来ると思った
APUに求めるのはローエンドGPU並の性能だし、HBCC使って1GB HBM + 8GB DDR4の階層メモリなら必要十分な性能出せると思う

普通のAPUに+5000円くらいで追加できるなら大歓迎

**Socket774** · 2018/05/01(火) 11:03:14.57

>>13
今のデスクトップ/モバイルのAPUですらDDR4では足りないし
GDDRのM/B実装なんて需要が無い→現状ではHBM系しかない

別にAPU作ってるAMDだけじゃなく、IntelもHBMの規格作りに参画してるんだし
dGPUと家庭用ゲーム機ぐらいでしか脚光を浴びないGDDR推しの必要はないのでは

**Socket774** · 2018/05/01(火) 11:05:56.32

>>21
HBCCのキャッシュは名ばかりキャッシュだから
CPUのキャッシュと同列に並べるのに違和感
CPU、GPU、HPC向けCPUのカテゴリを書いてから書いたほうがいいよ

**Socket774** · 2018/05/01(火) 12:13:26.66

>>23
CPUと同列なんて欠片も言ってないけど？
カテゴリ分けとかそんな面倒なことはする気ないし

ついでにいうと、メモリやキャッシュの階層制御は、一般的で普通の技術だよ、大抵のプロセッサで普通に使われてる
それをiGPU+HBM+DDRでやろうってだけの話
iGPUに少量の高性能メモリを使うってのは、IntelのeDRAMやXBOXのeRAMとか先例もある

技術的やコスト的に1GB 100GB/sを5000円は可能と踏んでるけどどうかな

**Socket774** · 2018/05/01(火) 13:43:39.21

100GB/sだったらDDR5 2chで良いじゃん
少なくともメインメモリの5倍くらいの帯域はないとCPUに使う意味はないと思う

**Socket774** · 2018/05/01(火) 14:06:30.65

DDR5だとかえって高く付くとか無いのか？

**Socket774** · 2018/05/01(火) 15:21:23.46

来年製造開始てレベルだしなあ……

**Socket774** · 2018/05/01(火) 17:02:31.09

iGPUとの接続の話がメインならこのスレの話題対象外じゃないの？
前スレでももめてたしさ

**Socket774** · 2018/05/01(火) 18:44:52.19

>>26
あんま電力が下がらんのとプロセスが微細化するので現存の概ねCCX一発分を維持すると仮定すれば
丁度クロスする辺りかもな

**Socket774** · 2018/05/01(火) 21:45:37.30

DDR5自体ペーパーローンチなのに対応したメモコン積んだCPUなんていつの話やら

**Socket774** · 2018/05/01(火) 22:02:27.17

>>21
今年(2018年)はGDDR6の年となる。データ転送レートは最大で18Gbps、高性能GPU
クラスのx384インターフェイスならメモリ帯域は864GB/sとなる。メモリ帯域だけ
なら、これまでのHBM2(まだ広帯域化が続いている)に匹敵する。
https://pc.watch.impress.co.jp/docs/column/kaigai/1106510.html

**Socket774** · 2018/05/01(火) 22:16:53.91

またまた家庭用ゲーム機、PC向けのAPU/CPU、HPC向けプロセッサのごった煮論議の開始か・・

>>30
DDR5の仕様って固まったの？

**Socket774** · 2018/05/01(火) 23:11:14.24

一応実質的には去年のワークショップで決まったようなもんではある
DDR4も最終確定は2014年9月だったけど、それ以前からエンプラ向けには売ってたし

**Socket774** · 2018/05/02(水) 01:20:39.85

>>25
DDRでもGDDRでもいいよ、このスペースに入るなら
https://akiba-pc.watch.impress.co.jp/img/ah/docs/1106/736/amd3.jpg

**Socket774** · 2018/05/02(水) 01:31:02.81

>>34
普通に入りそう

**Socket774** · 2018/05/02(水) 02:07:48.26

>>34
メモリは積層して何とかスペース確保するにしても、
ソケットタイプだと配線の引き回しが極めて厳しくなりそうだなぁ
M/B直付けタイプならなんとかなるかもしれんけど
M/Bベンダーもうちら顧客も極めて選択肢が狭まりそうな気がする

**Socket774** · 2018/05/02(水) 02:53:36.22

Ravenと同じくらいのサイズのVega Mobileがこんな感じだから、APU+HBMもAM4ソケットに載りそうな気はするんだけど
http://ascii.jp/elem/000/001/620/1620182/Photo03_500x375.jpg

AM4で無理ならAM5まで待つから、いつかは作って欲しい

**Socket774** · 2018/05/02(水) 05:33:51.57

>>36
今んとこライバルは256GB/sあるから、16Gbpsだとして4枚程そこに入れなきゃ対等ですらないがよろしいか

**Socket774** · 2018/05/02(水) 08:38:41.89

コストかけて微細化しても、消費電力は減らず、性能を上げられない
コストに関しては減価償却が進めば下げられるとしても、今後は「CPUの価格が下がるだけ」で性能向上は見込めないのかも

**Socket774** · 2018/05/02(水) 15:00:56.98

なのなの
MIPS、初のnanoMIPS命令セット対応CPUコア「I7200」
ttps://pc.watch.impress.co.jp/docs/news/1120074.html

**Socket774** · 2018/05/02(水) 16:33:39.70

via「なぬ？」

**Socket774** · 2018/05/02(水) 16:43:26.31

＞コアに密接し、高速アクセスが可能で決定論的なスクラッチパッドRAM(SPRAM)も最大1MBまで搭載可能
これうまくやればHPC向けにそこそこ使えそう

適度なローカルメモリやスクラッチパッドがあれば大幅に高速化する種類の演算は、
これで大幅に早くなるはず

**Socket774** · 2018/05/02(水) 16:55:30.23

>>37
BGAで基板に実装できるものと、配線引き回しや物理的な制限に苦労しそうなソケットとを単純に比較するのは無理じゃないかなぁ

**Socket774** · 2018/05/02(水) 22:54:17.69

>>33
電源がDIMMに乗るんだっけか
出始めの相性問題は激しくなりそうではあるね

>>42
1MBじゃ・・

**Socket774** · 2018/05/03(木) 00:14:06.03

L1 1MBとかできたらいいな
100%無理だけど

**Socket774** · 2018/05/03(木) 00:19:11.69

キャッシュサイズとレイテンシは大体比例するから、L1 1MBとかにしたらL2と変わらない性能になるだろうな

L1 64kB、 L2 512kB、L3 2MBくらいが一番バランスがいい

**Socket774** · 2018/05/03(木) 00:41:42.15

x8づつくらいが良いんでないかな
64-512-4096
ただ共有とか相互がある場合ちょっと工夫は要るだろうね

**Socket774** · 2018/05/03(木) 09:24:02.14

個人的には新世代メモリがきたらL2も分離型になるかと思ってたけど
よくてLLC（共有型）どまりみたいで残念

**Socket774** · 2018/05/03(木) 10:31:00.52

Skylake以降のXeonではL2:1MB、L3:1.375MB
L3 victimにして低用量で済む処理の速さに重点を置く形に
DRAM高速化やSSDの普及でまあこれがとりあえずはいい形なのかね

**Socket774** · 2018/05/03(木) 12:26:47.95

CPUのキャッシュはこういう階層になる。
L0:デコード済み命令
L1:コードデータ分離
L2:コア毎独立
L3:チップ内統合
L4:ボード内統合
L0はRISCには不要
L4はメインメモリの管理方法が内蔵キャッシュとの間でのある程度のサイズのブロック単位のバースト転送になったこと、チップ毎のローカルメモリをチップ間通信で共有する形になったことから短レイテンシを特長とする外部SRAMによるものは存在価値を失った。
現在ではメインメモリ内に設けられたボード間通信バッファをL4とみることはできる。

**Socket774** · 2018/05/03(木) 17:40:40.74

eDRAMや2.5DでL4$を持つのはわるくないとおもうよ
L4$っていっても、タグ領域はCPUダイ内のSRAMに置いておけば性能低下は最小限にできる

問題はコストとパフォーマンスの関係があまり良くないってところか？

**Socket774** · 2018/05/03(木) 17:45:49.84

タグRAMにシリコンを使うくらいならコアを増やす方が良いという考えもあるからなぁ

**Socket774** · 2018/05/03(木) 20:05:24.27

そんなに大きかったっけか？

>>51
（一般的な）キャッシュだとiGPU以外では目立った効果がなく
モバイルの上位モデルぐらいでしか価値が見いだせられないからおいしくない

**Socket774** · 2018/05/03(木) 20:12:07.49

1T-SRAMとかどーかな

**Socket774** · 2018/05/03(木) 20:21:24.05

カートリッジ式CPUへの回帰

**Socket774** · 2018/05/03(木) 21:01:52.27

遅延デカすぎて駄目でしょｗ

**Socket774** · 2018/05/03(木) 22:25:00.67

1T-SRAMが存在できるのは40nmとかまでで、
現状の14nmとか10nmだと実装できないって話だったような。

**Socket774** · 2018/05/04(金) 00:37:14.39

12FDXでZ-RAM復活とか

**Socket774** · 2018/05/04(金) 03:48:07.96

eDRAMはUMAグラフィックでは性能が出ないためVRAMのうちアクセス頻度の高い部分をローカルメモリ上に確保する目的以外ではほとんど効果がない。
intelはキャッシュの体を取ることでソフトウェアの変更なしにアクセス頻度の高い領域がeDRAM上に確保されるようにした。結果としてCPUから見たL4になったがL4としては多大なコストに見合うだけの効果は無かった。

**Socket774** · 2018/05/04(金) 03:51:18.98

>>57
そっか
Trのラッチアップを意図的に制御出来ればSRAMは楽そうだよな

ん?、、、

**Socket774** · 2018/05/04(金) 09:51:42.01

>>59
理由と結果がつながってないと思うんだけど・・

**Socket774** · 2018/05/04(金) 10:08:41.08

>>61
OSやグラフィックライブラリーを変更しなくて済むようGPUのキャッシュとして作ったけどメモリが共有だからCPUからもキャッシュとして使えた。でもそれは無意味だった。

**Socket774** · 2018/05/05(土) 16:12:13.81

>>33
ついにきたな
今夏最終仕様発表で来年から出荷開始
まずは3200なのか、それとも4400からなのか

**Socket774** · 2018/05/05(土) 22:44:44.02

2～3年後にはメモリ容量1TB、帯域300GB/s以上とかになるのか‥‥

**Socket774** · 2018/05/05(土) 23:05:39.91

メモリ帯域はCPUにはあまり関係ないからなあ
今以上にあってもあまり意味無いと思う

**Socket774** · 2018/05/05(土) 23:14:13.20

半分冗談だけど、SSDの高速化の方が役に立つ

**Socket774** · 2018/05/05(土) 23:26:18.00

>>53
dGPU挿したときゲームで効果大やぞ
https://www.purepc.pl/procesory/test_procesora_intel_core_i7_8700k_premiera_coffee_lake?page=0,14

**Socket774** · 2018/05/05(土) 23:36:44.57

それ以外のゲームだとドングリの背比べのような・・

**Socket774** · 2018/05/05(土) 23:37:35.54

>>65
は？

**Socket774** · 2018/05/06(日) 00:54:47.64

>>66
ほんこれw

**Socket774** · 2018/05/06(日) 01:52:21.54

>65
現状のレイテンシ、帯域、容量を暗黙のうちに前提にするなら
そういう表現になるかもしれないが、前提にしないなら

「レイテンシとつり合いの取れてない帯域があっても用途が狭い」

今のDRAMメモリはレイテンシの役割をキャッシュに丸投げ、
容量の役割をSSD、HDDに丸投げして中継ぎしてるだけだ
（「メイン」メモリの名が泣いている）。
もしもDRAMのレイテンシがキャッシュの階層を減らすことができるくらい
小さければ、帯域増のメリットは大きい。

**Socket774** · 2018/05/06(日) 02:06:04.97

CPUのボトルネックはストレージだから、メモリをいくら速くしても意味ない
CPUベンチ以外ではメモリは既にボトルネックじゃないよ

**Socket774** · 2018/05/06(日) 03:10:45.89

サーバや業務用ストレージ用途はともかく、
個人向けじゃ動画編集とかやってる人以外はSSDなんてSATAで十分だけどな

むしろDRAM高騰で、メーカーPCのメインメモリが減ってるからスワップが増えて
低速化してる気はするな

かつて8GBデュアルチャネル積むのが当たり前だったメモリが、
4GBシングルチャネルになったし

**Socket774** · 2018/05/06(日) 11:05:45.52

データセンターは知らんが、水力学や大気力学じゃ、メインメモリの帯域重要なんだが

**Socket774** · 2018/05/06(日) 13:08:01.94

PCだってメインメモリのないソリューションがないんだから
CPUの理論値を下回らない程度の帯域を確保したメモリは必要

**Socket774** · 2018/05/06(日) 13:36:00.02

CPUの理論値とは

**Socket774** · 2018/05/06(日) 17:01:28.27

階層毎に1/10くらいかな
0.1%以下が当たり前だし

**Socket774** · 2018/05/08(火) 02:59:53.53

>>74
流体力学一つでよくね？

**Socket774** · 2018/05/08(火) 18:47:02.68

中国でA12プロセッサのスコアがリーク：
アップル新iPhone性能20％向上か
http://ascii.jp/elem/000/001/673/1673232/

リーク通りだと順調に早くなってるね

**Socket774** · 2018/05/08(火) 20:15:42.54

A12ってTSMCの、7nmのやつ？

**Socket774** · 2018/05/09(水) 05:07:34.93

tsmcの10nmから7nmで20％クロックアップできるから、アーキテクチャとしてはほぼ変わってないな

**Socket774** · 2018/05/09(水) 05:49:41.86

まだまだ発売日まで時間あるから
最適化されるかも分からん

**Socket774** · 2018/05/09(水) 06:31:13.16

なーに、OSアプデで遅くすれば
40%向上達成は容易よ

**Socket774** · 2018/05/09(水) 14:19:36.65

林檎の脱インテルはラインナップ全部ではなくとも一部ではやりそうだ

**Socket774** · 2018/05/09(水) 19:17:56.72

新しく発表されたnanoMIPS32だけど命令の長さが16bit、32bit、48bitあるのな
48bitの長さの命令には32bitイミディエイトロードの命令もあるみたい

nanoMIPS32 Instruction Set TechnicalReference Manual
https://s3-eu-west-1.amazonaws.com/downloads-mips/I7200/I7200+product+launch/MIPS_nanomips32_ISA_TRM_01_01_MD01247.pdf

**Socket774** · 2018/05/09(水) 19:36:35.82

nanoMIPS32は範囲が32bitのPC相対アドレッシングのロード、ストアがあったりとか
GP(グローバルポインタ)間接のdispが21bitあったりとか
(GOTテーブルのサイズが多く取れて扱えるグローバル変数の数が増える)
ポジションインディペンデントなコードを作る場合の改善とかあるのな

**Socket774** · 2018/05/10(木) 04:10:21.14

いまさら新しいCISC作ってどうすんだ。

**Socket774** · 2018/05/10(木) 07:19:39.66

イミディエイトロードの命令はいらない子

**Socket774** · 2018/05/10(木) 13:32:04.99

TSMCがロードマップを発表、EUV導入は19年前半 (1/2)
http://eetimes.jp/ee/articles/1805/10/news033.html

パッケージングの技術開発もかなり進んでる模様

**Socket774** · 2018/05/10(木) 14:09:20.36

>>89
順調だな

**Socket774** · 2018/05/10(木) 18:59:31.43

>>87
CISCとまではいかないだろう
CISCだとアドレッシングモードによって命令の長さが全く違ってくるしもっと複雑
nanoMIPS32だと48bit命令の最初の6bitは全部011000で始まってるようだし
簡単に命令長を区別できるようにデコードに負荷がかからないような仕組みが導入されてるはず

>>88
コード密度を上げるためかもな
lui $4, %hi(0x12345678)
addiu $4, $4, %lo(0x12345678)
と命令を2つ使うと8バイトになるが
li $4, 0x12345678
こっちの方が48bit(6バイト)で短くなるから
C言語にアセンブラコードを吐かせたのを見るとシンボル値のロードは頻繁に使ってるしな

余談だが64bitCPUの場合でも、デフォルトではシンボル値は32bitに制限してたりする
Linuxでもx86_64はシンボル値を32bit、ARM64はシンボル値を33bitにするのがデフォルトになってる
おそらく64bitのシンボル値を読むようにすると性能が落ちるんだろうね

**Socket774** · 2018/05/10(木) 19:06:22.62

あとnanomips32ではPC相対のロードストア命令の他に
PC相対で指定したアドレスをレジスタに読み込む命令も用意されてるから
簡単にリロケータブルなコードを生成できる
PC相対の範囲も32bitのアドレスを指定できる48bit命令が用意されてる

**Socket774** · 2018/05/10(木) 19:43:47.92

アセンブラがあまりわからない人のために補足しておくと
シンボル値は主に関数のラベルやグローバル変数名に使われる
上にも書いたがたとえ64bitのプログラムでもシンボル値は32bitに制限されてる場合が多い
x86_64やARM64でもだいたい32bitくらいに制限されてる
gccには-mcmodelオプションで指定できるメモリモデルがあるのだが
デフォルトはx86_64でもARM64でもsmallになってて
x86_64だと2GB、ARM64だと4GBの範囲でしかシンボルを扱えない
largeだとシンボル値を64bitとして扱う

x86_64だとmediumが指定できて
これを指定するとグローバル変数のシンボル値に64bitの値が使われる
スパコンのソフトだとこのオプションを使ったりする場合も多いらしい

PGIのコンパイラのサイトにわかりやすい説明が載ってる
64ビット環境 2GB 以上の生成オプション
https://www.softek.co.jp/SPG/Pgi/TIPS/opt_64.html

**Socket774** · 2018/05/10(木) 20:02:20.67

アセンブラというよりCコンパイラ側が吐き出すコードが
デフォルトだとシンボル値が32bit(ARM64だと33bit)を想定したアセンブラコードになってる
ほぼすべての64bit CPUのCコンパイラがそんな感じになってる
シンボル値のロードは頻繁に発生するので速度低下を抑えるためにそういう仕様になってると思われる

**Socket774** · 2018/05/11(金) 14:53:25.71

まあ、32bitのイミディエイトロードはアドレスの読み込みで頻繁に使うからな
その部分で1回当たり、2バイトも削減できるのは大きいね
1命令4バイト固定にこだわらないのはRISC-Vの影響もあるかもね

**Socket774** · 2018/05/11(金) 16:31:56.06

4バイト固定てARMか

**Socket774** · 2018/05/11(金) 17:25:33.47

アドレスに32bit使うならabs32よりbase+(index+disp20)*scaleの方が使い手がある。

**Socket774** · 2018/05/12(土) 04:50:30.32

ザーッと見た感じ48bitの長さの命令は6命令しかなさそう

addiu rt, s32 レジスタと32bitイミディエイトの加算(ソースとディスティネーションが同じレジスタ)
addiu rt, gp, s32　　　　グローバルポインタと32bitイミディエイトとの加算
addiupc rt, s32　　　　　PCとイミディエイトの加算
li rt, s32　　　　　　　　　32bitイミディエイトのロード
lwpc rt, addr　　　　　　PC相対アドレス指定の32bitロード
swpc rt, addr　　　　　　PC相対アドレス指定の32bitストア
lapc rt, addr 　　　　 PC相対アドレスのロード(addiupcのエイリアス)

**Socket774** · 2018/05/12(土) 06:43:41.85

MIPSの場合、GP(グローバルポインタ)は汎用レジスタの$28な

**Socket774** · 2018/05/12(土) 06:48:10.88

しかし、全く違う命令セットで来るとはな
MIPS32R6やMIPS64R6はまともな応用製品が出る前に終焉なのかな？
命令セットを変えまくって、32bitのLinuxは対応するにしても、他のリアルタイムOSが対応してくるのか？
IoTの時代に、リアルタイムOSなしでの開発とかやってられないでしょ

**Socket774** · 2018/05/12(土) 07:00:52.83

ThreadXとNucleus RTOSがnanoMIPSに対応するみたいだな
ちなみに、どちらもμITRONの互換機能をもつバージョンも持ってる模様

アドバンストlte/5gコミュニケーションとネットワーキングicデザインにおいて、抜群のパフォーマンスと効率性を実現する、mips I7200プロセッサコア
https://globenewswire.com/news-release/2018/05/03/1496280/0/ja/%E3%82%A2%E3%83%89%E3%83%90%E3%83%B3%E3%82%B9%E3%83%88lte-5g
%E3%82%B3%E3%83%9F%E3%83%A5%E3%83%8B%E3%82%B1%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%81%A8%E3%83%8D%E3%83%83%E3%83%88
%E3%83%AF%E3%83%BC%E3%82%AD%E3%83%B3%E3%82%B0ic%E3%83%87%E3%82%B6%E3%82%A4%E3%83%B3%E3%81%AB%E3%81%8A%E3%81%84%E3%81
%A6-%E6%8A%9C%E7%BE%A4%E3%81%AE%E3%83%91%E3%83%95%E3%82%A9%E3%83%BC%E3%83%9E%E3%83%B3%E3%82%B9%E3%81%A8%E5%8A%B9
%E7%8E%87%E6%80%A7%E3%82%92%E5%AE%9F%E7%8F%BE%E3%81%99%E3%82%8B-mips-I7200%E3%83%97%E3%83%AD%E3%82%BB%E3%83%83%E3%82%B5%E3%82%B3%E3%82%A2.html
(URLが長いので改行してます)

> Express LogicのCEOであるWilliam Lamie は次のように述べている。
> 「I7200は、リアルタイムイベントに対する高い性能と高速応答の両方を必要とする通信、
> ネットワーキング、その他のアプリケーション向けの高性能プロセッサとして活躍するでしょう。
> 当社の産業用Grade X-Ware IoT Platform (ThreadX RTOS基盤) に新しいI7200コアを追加し、
> MIPS CPUの長期サポートをより拡大することを楽しみにしています。」
>
>
> Siemens傘下事業であるMentorの組み込みプラットフォームテクノロジーのジェネラルマネージャであるScot Morrisonは次のように述べている。
> 「MIPSの長年にわたるパートナーとして、当社のNucleus RTOSは、両社お客様がより低リスク、
> より短期間で製品を市場に投入することができるように支援しています。
> 当社のSMPバージョンは既にMIPSラインナップで既存のマルチスレッドおよびマルチコア製品をサポートしています。
> 新しいMIPS I7200プロセッサコアは、優れた性能と最適化された機能を提供し、
> MIPSのお客様が複雑なLTE/5G通信アプリケーションを含めた幅広い組み込みソリューションを開発するために役立ちます。」

**Socket774** · 2018/05/12(土) 09:45:48.60

命令長途中で変えると厄介だな
いっそ命令系を二系統に分けたらサクサク設計できて軽く動けるんじゃねぇかな、短いのと長いのでL1レベルから分離してさ

**Socket774** · 2018/05/12(土) 10:43:41.55

過去の互換性を切れば、命令密度とデコード負荷をある程度両立できる新命令セットは作れるのでは？
物理コア当たりのトランジスタ数は2億以上が前提のアーキテクチャで

**Socket774** · 2018/05/12(土) 12:16:41.40

2億以上って縛りがある時点で広がりに欠けるのでは

**Socket774** · 2018/05/12(土) 12:17:05.19

コード密度を追求すれば1ワード16bitの可変長命令、性能を追求すれば32bit固定長命令というのが長年の研究結果だ。いずれにせよ使用頻度の低い多bitリテラルは効率が落ちる実装でも全体でみた時は問題ない。

**Socket774** · 2018/05/12(土) 13:41:58.53

可変長はありえない

**Socket774** · 2018/05/12(土) 19:38:19.23

QualcommがARMサーバチップから撤退か
http://www.geocities.jp/andosprocinfo/wadai18/20180512.htm

速すぎぃ

**Socket774** · 2018/05/12(土) 20:30:39.03

撤退するのかはわからんけどサーバに人員割き過ぎてたのでモバイル向けに戻るという観測はあったな

**Socket774** · 2018/05/12(土) 20:57:00.72

というか今更この情報かいな‥‥遅すぎだろ

まあでもこれでARMサーバーは悉く失敗したわけだが
ボトムアップが覇権を取るx86もそうだった、だからARMも云々
という風潮はなんだったんだろうか

**Socket774** · 2018/05/12(土) 21:21:50.70

どちらかといえば、Intel牽制のためにARM持ち上げてた感じはあるな
AMDがふたたびIntelに対抗できるようなサーバCPU作れるようになったので
べつにARM持ち上げる必要はなくなった感がある

**Socket774** · 2018/05/12(土) 21:28:14.79

餅は餅屋

**Socket774** · 2018/05/13(日) 04:42:03.77

サーバ向けARMやってたところは車載向けに転向するか撤退してるね
まだサーバ向けARMをやってるのはThunder XのCaviumを買収したMarvellと
次期スパコン向けをやってる富士通
Applied MicroのX-Gene部門を買収したIntel元社長がCEOのCarlyle Group

Intelの元社長、サーバ向けArm SoCで再始動
http://eetimes.jp/ee/articles/1802/07/news067.html

こんなワークステーションも出してるよ
CaviumとGIGABYTE、業界初の64bit ARMv8ワークステーション
https://pc.watch.impress.co.jp/docs/news/1113534.html

GIGABYTE ThunderXStation Workstation is Powered by Cavium ThunderX2 32-Core ARMv8 Processor(s)
https://www.cnx-software.com/2018/03/24/gigabyte-thunderxstation-workstation-is-powered-by-cavium-thunderx2-32-core-armv8-processors/

**Socket774** · 2018/05/13(日) 07:40:36.79

うん、知ってた
x86_64信者が言うのもアレだけど、元々他の旧RISC勢より低電力に振ってるんだから
其奴らとそれより上の連中を蹴とばせるわけがない

というかプロセスが進む毎にISAの電力のメリットってデメリット化してる気がする

**Socket774** · 2018/05/13(日) 07:44:33.92

ISAのデメリットとは？

**Socket774** · 2018/05/13(日) 08:28:11.46

POWERが大復活するな(適当

**Socket774** · 2018/05/13(日) 09:54:50.77

同一機能をより低消費電力で実現可能なISAがあればそ消費電力＝発熱が少ない分高クロックで動作させることができるので高性能なISAでもある。
一般に低消費電力を謳うISAは小規模な回路で実装可能だが低機能低性能なものなので高性能とは相容れない。

**Socket774** · 2018/05/13(日) 10:00:16.55

その方面で行くにしても
最高クロックは物理法則の壁で伸び悩んでるからね
（しかも高クロックにするための技術的蓄積はx86勢やPowerのほうが優れてると言う・・）

**Socket774** · 2018/05/13(日) 10:47:42.97

ISAはデコーダ差し替えて乗り越えられるから問題になりえないという風潮だったが、
そうでもなかったね。
まあ残ってる企業が今後頑張る可能性もなくはないが。

**Socket774** · 2018/05/13(日) 11:39:59.51

現状マルチコア、SIMDで並列処理が可能な所は全部並列処理した上でボトルネックになる順次処理性能をいかに上げるかが問題である。
演算ユニットは複雑なものを実装できるようになったので命令を高機能化して処理する命令数を減らすことが有効である。暗号専用命令の実装はその代表例だ。
メモリアクセスでは配列変数にアクセスするためのbase+(index+disp)*scale factor形式のアドレッシングモードの有無が重要であり、x64では1命令でアドレス生成、ロード、演算、ストアを実現できる。RISCでこれに対抗するのは容易でない。

**Socket774** · 2018/05/13(日) 11:49:29.57

>>119
でもARMもv7まではCISC的命令取り入れてたから
v8では実装的にどちらかひとつを取るしか無かったんだろうけど（32bitモードならまだ残ってるけれどね）

**Socket774** · 2018/05/13(日) 14:34:41.59

周波数の物理的限界が見えた12～13年程前の時点で
RISCはどうしようもなかったんだよ

**Socket774** · 2018/05/13(日) 14:39:44.74

CISCもパイプライン深くして１ステージでやることを少なくしたら
RISCなみにクロックを上げることができた

当然同じことをRISCでやるよりたくさんのトランジスタが必要になるが
微細化が進んでなんとかなった

**Socket774** · 2018/05/13(日) 15:38:12.30

Apple AシリーズだけはRISCの癖に矢鱈クロック当たりの性能高いな

関係ないけど、やっぱZenとか見るとIntelのi686の増改築＆魔改造は余程不利なのかな？新マイクロアーキの奴を早くお目にかかりたいな

**Socket774** · 2018/05/13(日) 16:24:54.02

8700k対2700Xのベンチ記事見ると
現状でもシングルスレッド性能でZenより上だと思うが。
まあコア数も価格設定も考えればZenは高性能だが。

Intelの問題は多コア化路線進むしかなくなってる所だと思う。
IPCの伸びしろがもうない。

**Socket774** · 2018/05/13(日) 16:26:32.95

>>123
それ比較対象が遅すぎるだけだぞ。
intelも今後は特定ベンチ対策を考えないと力押しだけではダメなんだろう。

**Socket774** · 2018/05/13(日) 17:06:21.65

PCworldでその辺記事にされてたな
実際使ってみるとGBで示されるようには速くないんだが？ていうとこから始めて
色んなベンチ取って、まあやっぱりね、と

**Socket774** · 2018/05/13(日) 17:27:33.03

>>112
Thunder X2も売れなくて今年中に終わりがアナウンスされるような

**Socket774** · 2018/05/13(日) 17:33:37.59

>>123
AppleのCPUは他のARMと同じように「専用命令で高速化」されてるだけ
ただプラットフォームの関係上ほぼ完全な最適化が可能だから、利き方が最初からほぼ上限まで行ってる
普通のCPUで実行するコードは当たり前だけどコア内ヘビーループばかりでも無いしデータフローや命令順序の都合で幾らでも理想ケースから外れる
故にどちらかと言うとアクセラレータに近い利き方となる、そんなもんいらねー

**Socket774** · 2018/05/13(日) 18:03:30.83

>>126
興味津々なんだけどURL持ってますか？

>>128
その辺は公開されてるの？非公開だったら何故知ってるのかな

**Socket774** · 2018/05/13(日) 18:20:09.91

まあ真に高速なCPUなら
剛体シミュで低スコアにはならんと思うよ

**Socket774** · 2018/05/13(日) 18:25:32.94

>>129
pcworld ipad pro fastで検索すれば出てくるやつかと

**Socket774** · 2018/05/13(日) 18:39:08.00

あと公開してるの？だのなんだののところは
Linusが、なぜGeekbenchはShitなのか、という説明をしてたと思うので
それを読めばいいのでは

**Socket774** · 2018/05/13(日) 18:41:10.01

>>関係ないけど、やっぱZenとか見るとIntelのi686の増改築＆魔改造は余程不利なのかな？新マイクロアーキの奴を早くお目にかかりたいな

これどことなくポエマーとか機械翻訳と似たような臭いがする
別人だろうけど

**Socket774** · 2018/05/13(日) 18:46:26.82

だから次はintelも鯖からモバイルまで共通アーキテクチャで作るのをやめて非鯖用は特定ベンチ対策を組み込むんじゃね。

**Socket774** · 2018/05/13(日) 18:51:08.58

そんな無駄なことはやらんだろ
3D MarkやSPEC 2017、他各種科学・工学計算ソフトでの結果を出してみて下さい
と言えば終わり
AMDが割とこの辺きちんとやってIntelに応えてきてたのには驚いたな

**Socket774** · 2018/05/13(日) 18:58:31.85

LinusはGB4は遥かに良くなったと評価してたが

**Socket774** · 2018/05/13(日) 19:03:27.33

そら良くならなかったらヤバイでしょ……
それでもXeonや末尾Xのプロセッサ測るのには殆どあてにされてない時点でね

で、記事は読んだのかな

**Socket774** · 2018/05/13(日) 19:06:20.91

ポエマーみたいなのをいくら相手にしても無駄な気がするのだが
つい最近も似たようなことあって大変だった記憶が、前スレの最後の方だったかな

**Socket774** · 2018/05/13(日) 19:09:23.32

>>133
たしかに雰囲気あるな
HBMで発狂してどこ行ったんだろ？

**Socket774** · 2018/05/13(日) 19:15:33.00

AMDスレでRyzenで楽しんでる人等と喧嘩してるんじゃない？

**Socket774** · 2018/05/13(日) 19:39:36.21

>>140
なんでAMDのファン同士で喧嘩するんだよw

**Socket774** · 2018/05/13(日) 19:47:04.00

>>137
読んだけど、GB3は信頼度が低いというまさにその通りの内容だとしか。
GB4だとまさに6600Uが基準スコアの4000になってて、2017のA11 Bionicがこれとほぼ同じ。3DMarkも同じくらいだったかと

**Socket774** · 2018/05/13(日) 20:10:08.80

GB3は、BZip2 Compressや、JPEG Compressの値が実際の性能に近かったと思う

GB3のトータルスコアはダメでも、個別スコアを見ればちゃんと使えた

**Socket774** · 2018/05/13(日) 20:15:38.01

あとSHA2のハードアクセラレーションが効いてしまって総合スコアが崩壊するんだと
記事中の比較では、GB3だとA9Xと6600Uのスコアがほぼ同じになってしまってる

**Socket774** · 2018/05/13(日) 20:32:13.83

A11の3DMark-Physicsスコアてんな高かったか
6600Uよりかなり下だったはずだが

**Socket774** · 2018/05/13(日) 20:45:35.57

Ice Ex Physicsで確認したら、A11はSD835等他のARMより高い25300程
6600Uのそれが43200くらい
で、どこが同じくらいなんだ？

**Socket774** · 2018/05/13(日) 21:01:08.62

失礼、ExtremeでなくてUnlimitedね

**Socket774** · 2018/05/13(日) 21:38:51.31

いやそこは分かってるから大丈夫
3Dmark physicsはオフラインレンダリングしててGPUでも多少数字変わるし、マルチスレッド対応が強力でHTもよく効くと思う。それを含めてもIntelが強力でAppleが弱いのは事実でしょう。
ただ件の記事でApple AxがGB3の結果ほど強力ではないと引き合いに出してるのは、不思議なことに総合スコアとgraphicsの方なんだよね。SoC (CPU + iGPU) として比べてる

**Socket774** · 2018/05/13(日) 21:52:27.17

>>148
GPU変わっても有意な変化はないぞ
2割も3割も変わる事例を出してみなよ

**Socket774** · 2018/05/13(日) 22:04:40.01

>>149
5000くらい平気で変わりますが。
オフラインレンダリングというのはフロントバッファに描画しないだけで裏でレンダリングしてる(unlimitedなら720pで)ってことで、あのPhysicsテストはそもそも純粋なCPUテストではないんだよなあ。
そもそもGeekbenchを引き合いに出したのも誰か別の人で自分はそれに答えただけで別にGB4信者ですらないし知ったこっちゃないが、しかし3dmark physicsなんてもっと意味不明なテストだと思うけど。

**Socket774** · 2018/05/13(日) 22:04:49.50

ID:pvgU/IUiはほっとけよ

**Socket774** · 2018/05/13(日) 22:07:18.35

>>150
だから2割も3割も変わるのなら出してみなよ

**Socket774** · 2018/05/13(日) 22:12:05.21

>>152
2割とかHTで平気で変わると思う

**Socket774** · 2018/05/13(日) 22:14:39.24

>>153
750Tiから1050Tiでは、GPU以外同じ条件にしてもPhysicsが2割も上がる
そんな話は聞いたことない
あるのなら出してみてよ

**Socket774** · 2018/05/13(日) 22:18:49.64

いや、ハイパースレッディングで2割くらい変わっておかしくないでしょと言ってるのだが。スコアが25000-43000くらいの領域ならGPUで更に1割くらい変わると思うけどね

**Socket774** · 2018/05/13(日) 22:24:36.98

>>155
だから自分でGPU変わっても有意に変動してるんだからCPUの性能ではないと
書いているんだから
それを証明しろと書いてるでしょ
出せないんだよね？

**Socket774** · 2018/05/13(日) 22:37:03.42

>>156
えーと、CPUを6600U固定でGPUを変えた場合のIce Storm Unlimited Physicsのスコアですね。Surface Bookのi7 6600Uモデルで比較してみてはいかがでしょうか

http://www.itmedia.co.jp/pcuser/spv/1603/09/news070_4.html

**Socket774** · 2018/05/13(日) 22:43:42.36

>>157
そのページは前見たことあるけど
dGPU付きとそうでないのとでなんで同じ条件になると思ったの
他、デスクトップ環境やおなじのーと

**Socket774** · 2018/05/13(日) 22:45:54.97

失礼
同じノートのブランドでdGPU付き同士で比べるのが正しいんじゃない？
iGPUだと比較にならないよ
あとこれみても2割も変化ないよね

**Socket774** · 2018/05/13(日) 22:51:24.21

モバイルのdGPUかそうでないかを持ってきてGPU以外同じと言うんじゃなかろうかと思ったら
ほんとにそうくるとは

四亀やPCWatchがGPU変えただけでテストして確かめてるのに
それ持ってこずにこれだもの

**Socket774** · 2018/05/13(日) 22:53:13.42

2割云々は読み直してもらえば分かると思うけど、ハイパースレッディングで2割くらい変わってもおかしくないって言ってるよね
Apple A11にはなく6600Uにだけある
3DMark Physicsは高度にマルチスレッド対応してる

**Socket774** · 2018/05/13(日) 22:57:21.87

>>161
HTと同じ文にGPU変わっても変化する
そしてそれは文の終わりの、だからCPUの性能以外も、にかかってる

その後のレスの意味がないもの（これは上にあるCPUの性能じゃないを更に強調してるのは明白）
と書いてるとみたが
そしてここでGPU変えてもはやっぱ変わらないとは書いてない

**Socket774** · 2018/05/13(日) 23:07:36.90

>>162
すまない。ちょっと何を言ってるのか分からない。

てか、HTの有無などの最大で2割程度の性能差が出うるもの、そしてGPUなどの(てかドライバの差のが大きいかも)少しだけ、まあ最大でも1割程度の性能差を生むであろうもの、
それらを抜きにしてもあのベンチはIntelが得意でAppleが弱いだろうと最初から>>148で言ってる。
得意不得意はどのCPUにでもあるから

ただ一つ言えることは、GPUでオフラインのレンダーターゲットにレンダリングしてる時点でCPUベンチとしては糞ベンチですわ。繰り返すがべつにGB4の肩なんか持たないけど、なんで3D Physicsなんかが良いベンチだと思えるんだろう

**Socket774** · 2018/05/13(日) 23:22:50.19

148の中に、論拠としてGPUでもスコアは変化するという頓珍漢なことを
HTと同じ分脈で書いてるだろうに
157でそう思ってたことが明らかになって、今訳のわからん自己弁護してる段階でしょ

なんでもっとふっつうのレビューサイトでGPUを変えるとどうなるかというテストをしてるのに
それを出さずに157でどやったんでしょうか

**Socket774** · 2018/05/13(日) 23:31:14.88

>>148読む限りはHTと似た程度の変化は、GPU変えてもあると書いてるよね？
で、それを補強するために>>157を持ってきた
この157のレスを読めば分かる通り、彼はこれを根拠にしてHTと似た程度の変化は起きてると主張してるのは明らか
ところが157は全く的外れなのを指摘されて、ドライバがどーのとかいう148～157とは違ったところに持っていってる

**Socket774** · 2018/05/13(日) 23:31:38.52

いや、GPUでスコア変わるよ
どうしたらオフスクリーンで720pでGPUレンダリングしたりわざわざ不確定要素を増やしてる物を、信頼性の高いCPUベンチだと思えるんだろうか理解に苦しむけど。
ただ普通に

**Socket774** · 2018/05/13(日) 23:35:08.48

ただ普通の純粋なCPUベンチを作ればいいじゃん
あえてGPU処理を混ぜたりと変な条件になってるのは3DMarkがゲーマー向けのゲームを想定したベンチだから。

**Socket774** · 2018/05/13(日) 23:43:51.22

>>166
>>GPUでスコアは変わるよ
変わりません
ふざけないで下さい

**Socket774** · 2018/05/13(日) 23:57:24.07

なんかCPUベンチが出る度にPhysicsガーって書いてたのこの人なのかな
3DMarkのphysicsの事だったのか

**Socket774** · 2018/05/14(月) 00:18:57.20

そういやなんか疑問に思ったことがあった気がする＞Physics云々

**Socket774** · 2018/05/14(月) 00:19:20.14

>>157
これ半分一時期テンプレ入りまでした団子に嫉妬してるだろ

**Socket774** · 2018/05/14(月) 00:32:33.86

取りあえずGPU変えただけでPhysicsスコアが目に見えて変わるってのなら、きちんとしたの出してあげたらいいんじゃねーの
もうずいぶん前からレビューサイトで検証されて''特に変化はなかった''とされてるのが違うってみたいだから

まあなんでかそういってる当人が自分自身の「えーと、比較してみてはいかがしょうか」というレス以降
その比較に対しての突っ込みにも触れずに、最後は安価もつけず独り言呟くというパターンに入ったけど

**Socket774** · 2018/05/14(月) 00:45:16.96

>>170
もっとアーキテクチャの根底に関わる発言だと思ってたな
例えば流体力学はバンド幅が大事みたいな
XX社のCPUは(3Dmarkの)physicsに弱いって意図の発言だったんかいな

**Socket774** · 2018/05/14(月) 00:57:51.81

まあベンチの何が大事かってのは分かるんだけど
自分が勘違いしてたのがバレたからそういう方向強調しだしたのが丸見えなのがアレ
最初からGPU変えて変化する、という点へのツッコミ
取り敢えず>>157みたいなのだして変化するんだ、という人の書いてることはね

見苦しい

**Socket774** · 2018/05/14(月) 01:09:09.79

そして最初からそうしたツッコミの点でしか話されてないのに
日付け変わって急に意義がどうたら出てくるというのは（勿論これは大事だが、残念ながらそこは上のやり取りにはあまり関係ない
自分のミスを認めようとせず自爆した一人の人がいるだけ）
色々と疑ってしまうからやめた方がいいかと

**Socket774** · 2018/05/14(月) 01:41:29.34

団子っぽいと言えばそうかもね、言ってるのはそこじゃねえよってなってずれてく
……のか意図的にずらそうとしてるのかは分からなかったが。
最後も彼の討論(？)時の幕引きと同じ状態に。

しかし、彼の予言なのか呪いなのかしらんが
ARMサーバーの船出はきつ過ぎるな。

**Socket774** · 2018/05/14(月) 02:01:05.22

お前等優しいな、この糞馬鹿は団子そのものだろ
ほんとしねよ

**Socket774** · 2018/05/14(月) 02:45:34.78

GUI OS/GUI アプリの体感速度は、
・物理２コア以上
・高シングルスレッド性能
・寝起きが良い(省電力モードから素早く高パフォーマンスモードへ移行)
これが重要

**Socket774** · 2018/05/14(月) 03:14:06.70

>>141
都合良く解釈し過ぎて、流石に付いていけないやつもいる。
俺もAMD派だが、AM4マザースレは気持ち悪かったぞ、今は知らんが。
企業や政党の構成員でも無いのに、精神的に一体化してる奴はどれも気持ち悪いが。

**Socket774** · 2018/05/14(月) 04:36:07.85

サーバ向けARMも始めのうちはLinux上で一般的なサーバアプリを走らせる用途じゃなくて
NASとか専用の機能を持ったネットワーク製品のような組み込み的なものだと思うよ

**Socket774** · 2018/05/14(月) 09:32:39.21

性能とかよりそもそも製造量や出荷量が圧倒的に違うからIntelの牙城を崩すのはほぼ不可能でしょ
ARMサーバーって、ベンダーも検証用に少量作ってるだけだろうし、大量に量産出荷しているIntelとは桁が2つ以上は違うと思う

**Socket774** · 2018/05/14(月) 10:02:14.47

寡占してるから駄目な新製品でも支持され続ける？
アホですか

**Socket774** · 2018/05/14(月) 10:32:22.55

>>182
世の中そんなもんだ
資金力と物量で囲い込んだものが大体勝つようになってる

**Socket774** · 2018/05/14(月) 12:52:00.96

あれだけ堂々と鳴り物入りした痛ニュームとかどうして売れないの？Intel様々にしちゃひどい有様ですよね？

**Socket774** · 2018/05/14(月) 13:56:29.12

どうして売れないかといえば、互換性じゃないですかね。
互換性確保するために別コア混載してたり非効率だった。

**Socket774** · 2018/05/14(月) 14:14:43.42

itaniumで大々的に宣伝してずっこけたのってもう10年以上は前じゃないか

**Socket774** · 2018/05/14(月) 16:27:04.05

十年以上前に資金力と物量だけじゃ勝てないってIntel様々が身を以て証明してる皮肉

**Socket774** · 2018/05/14(月) 16:53:50.13

>>183
「仕方なく使い続けること」＝「支持されていること」
ではないだろう

**Socket774** · 2018/05/14(月) 18:08:58.24

新アーキテクチャなんかいらねえIA-64を再設計だ
という男気に惹かれる可能性がワンチャン(適当

**Socket774** · 2018/05/14(月) 20:20:55.09

PentiumProは、16bitコードの実行が遅く、個人に売れなかった(のちのPentium2では16bitコードも高速化)
Itaniumは、32bitコードが遅く値段も高いところに、AMDがx86-64を出してMSもAMD支持したので
いつのまにか消えてHP-UX専用CPUになった

**Socket774** · 2018/05/14(月) 20:33:30.06

>>190
いまでもIA-64って動いてますか？

**Socket774** · 2018/05/14(月) 20:39:25.24

非互換でも売れることはあるけど、そのためには非互換のデメリットを
覆すに足る大きな性能格差、機能格差が必要。
売れなかったってことは足らなかった。

**Socket774** · 2018/05/14(月) 21:01:53.25

>>188
エコシステムが出来上がっているものは、多少劣っていてもそう簡単には他に切り替わらないよ
イタニアムはエコシステム作る前に大半のメーカーからそっぽ向かれているし

そもそもIntelがマトモにエコシステム作っているのはXeonとCore CPUだけで、他はその他大勢になってるか失敗している

**Socket774** · 2018/05/14(月) 21:08:41.51

>>191
今でもHPが基幹システム向け等で売ってるよ

**Socket774** · 2018/05/14(月) 21:36:55.08

IA-64はx86-64に負けたってレベルですらなく、
32ビットのK7とP6の性能競争にすら追随できなかったレベルじゃないかい。

**Socket774** · 2018/05/14(月) 21:52:30.33

>>195
開発遅延が響いた
世界支配が目的のISAだからよかったのかもしれない

**Socket774** · 2018/05/14(月) 22:01:17.78

VLIWというのがスーパースカラのスケジューラに潤沢にトランジスタを投入することができるようになる以前の技術だから仕方ない。

**Socket774** · 2018/05/14(月) 22:29:12.42

IA-64はクルーソーCPUレベルで現実から目を背けて理想論だけで突っ走った結末だろ

**Socket774** · 2018/05/14(月) 23:43:07.59

意外と今のプロセス技術用いてVLIWの性能向上に全力投球したら……

まあコード効率激悪とか解決してないんだろうけど。

**Socket774** · 2018/05/15(火) 07:42:44.38

>>198
アレはアレで突き詰めればIA-64よりは有用だと思うぞ
実際似たような事やるようになってきたわけで