X



CPUアーキテクチャについて語れ 43

■ このスレッドは過去ログ倉庫に格納されています
0001過去スレ
垢版 |
2018/04/30(月) 17:56:47.66ID:a2EDvByC
Part42 http://egg.2ch.net/test/read.cgi/jisaku/1515469535
Part41 http://egg.5ch.net/test/read.cgi/jisaku/1510223006
Part40 http://egg.2ch.net/test/read.cgi/jisaku/1503459435
Part39 http://egg.2ch.net/test/read.cgi/jisaku/1501219656
Part38 http://egg.2ch.net/test/read.cgi/jisaku/1500374247
Part37 http://egg.2ch.net/test/read.cgi/jisaku/1498278212
Part36 http://egg.2ch.net/test/read.cgi/jisaku/1495257064
Part35 http://egg.2ch.net/test/read.cgi/jisaku/1491116131
Part34 http://potato.2ch.net/test/read.cgi/jisaku/1488968098
Part33 http://potato.2ch.net/test/read.cgi/jisaku/1480216577
Part32 http://potato.2ch.net/test/read.cgi/jisaku/1467240873
Part31 http://potato.2ch.net/test/read.cgi/jisaku/1447725141
0002過去スレ
垢版 |
2018/04/30(月) 17:58:07.13ID:a2EDvByC
Part30 http://potato.2ch.net/test/read.cgi/jisaku/1437051626
Part29 http://anago.2ch.net/test/read.cgi/jisaku/1421580486
Part28 http://anago.2ch.net/test/read.cgi/jisaku/1412642328
Part27 http://anago.2ch.net/test/read.cgi/jisaku/1407592292
Part26 http://anago.2ch.net/test/read.cgi/jisaku/1395873247
Part25 http://anago.2ch.net/test/read.cgi/jisaku/1386424858
Part24 http://anago.2ch.net/test/read.cgi/jisaku/1377863763
Part23 http://anago.2ch.net/test/read.cgi/jisaku/1355497868
Part22 http://anago.2ch.net/test/read.cgi/jisaku/1334096468
Part21 http://anago.2ch.net/test/read.cgi/jisaku/1324483722
Part20 http://anago.2ch.net/test/read.cgi/jisaku/1318113870
Part19 http://hibari.2ch.net/test/read.cgi/jisaku/1305200489
Part18 http://hibari.2ch.net/test/read.cgi/jisaku/1290758715
Part17 http://hibari.2ch.net/test/read.cgi/jisaku/1274809074
Part16 http://pc11.2ch.net/test/read.cgi/jisaku/1253517890
Part15 http://pc11.2ch.net/test/read.cgi/jisaku/1235699613
Part14 http://pc11.2ch.net/test/read.cgi/jisaku/1231064800
Part13 http://pc11.2ch.net/test/read.cgi/jisaku/1223189876
Part12 http://pc11.2ch.net/test/read.cgi/jisaku/1219884494
Part11 http://pc11.2ch.net/test/read.cgi/jisaku/1214999146
Part10 http://pc11.2ch.net/test/read.cgi/jisaku/1202913839
Part09 http://pc11.2ch.net/test/read.cgi/jisaku/1186887760
Part08 http://pc11.2ch.net/test/read.cgi/jisaku/1178140550
Part07 http://pc11.2ch.net/test/read.cgi/jisaku/1172923824
Part06 http://pc9.2ch.net/test/read.cgi/jisaku/1169393906
Part05 http://pc9.2ch.net/test/read.cgi/jisaku/1159238563
Part04 http://pc7.2ch.net/test/read.cgi/jisaku/1151732227
Part03 http://pc7.2ch.net/test/read.cgi/jisaku/1139046363
Part02 http://pc7.2ch.net/test/read.cgi/jisaku/1101041110
Part01 http://pc5.2ch.net/test/read.cgi/jisaku/1082357989
0003Socket774
垢版 |
2018/04/30(月) 18:21:50.52ID:rf6dcBdn
教えてください!
x86系CPUのコア数なんですが、将来的な見通しとして最大何コアまで行きそうでしょうか?
パラレル動作するインタプリタを作っておりまして、スレッド用のスロットをいくつ確保するかを仕様として決め打ちしたいのです
0004Socket774
垢版 |
2018/04/30(月) 18:45:43.29ID:QEOEYhIv
x86といえばWindowsだが
Windowsの論理プロセッサ数はクライアント版(Pro)が256とかだっけか
サーバだとそれ以上。
0006Socket774
垢版 |
2018/04/30(月) 20:06:59.47ID:QEOEYhIv
>>5
要求がよくわからんから大くくりの回答しかできんかったわ
市場の顧客の条件にも依るんじゃないか。
デスクトップPC向けが256論理コア行く事なんて向こう10年はなさそうだし。
0007Socket774
垢版 |
2018/04/30(月) 20:25:20.12ID:rf6dcBdn
>>6
いや、充分です
考えてみればマイクロソフトが一番情報を持っているだろうし

ありがとう!
0008Socket774
垢版 |
2018/05/01(火) 03:11:14.06ID:gUWyFvM/
>>1000
HBM1はむしろ高いよ
1層2Gbの非効率なメモリダイとロジックダイとTSVを使う高級規格

コスト的な理想はロジックダイなし単層で小型の最新プロセス版WideI/Oメモリを作ることだと思う
HBM3の規格と製造プロセスと共通化するのがええ
0009Socket774
垢版 |
2018/05/01(火) 04:11:41.16ID:qulFVhez
ハイエンドサーバとかの場合、MSに聞くよりハードウェアベンダーに聞いたほうがいい
ハードウェアベンダがサポートするOSを使うのが基本だからな
0010Socket774
垢版 |
2018/05/01(火) 04:38:06.68ID:B4EGi1o/
>>8
LC-HBMの暫定が確かそんな仕様だった

が、実装都合上メリットが無いとして破棄
使う側からはメリットである帯域もただでさえ少ない容量も減るというスペースシャトル並みの本末転倒
そしてFabはTSVの熟成用生贄が欲しいのに使わないなら態々金掛けて新規格を採用する意味がないという


まぁ色々思うところはあるが、現存のHBM規格は価格以外のデメリットが取り敢えず無いからして
低価格化して普及するなんて今までも山程あったわけで
取り敢えずは問題なかろう
問題は値段下がるより先にプロセッサのUMC部の値段がソイツを上回りそうって事か
まぁそうなったらそうなったでみんな美味しいから良いか
0011Socket774
垢版 |
2018/05/01(火) 05:46:09.60ID:gUWyFvM/
>>10
現状のHBMはコストこそが絶対的なデメリットで
そこには技術的な背景があるから問題になっていて
用途拡大も進められれずにいるんだよ
0012Socket774
垢版 |
2018/05/01(火) 06:03:54.66ID:gUWyFvM/
とりあえずLCもスタックドメモリでTSVを使う規格だった
TSVには工程としてのコストとダイエリアのコストと歩留まりコストがあり
高コストな技術だと言われてる

だからニアメモリで別途ファーメモリのDDRを使うAPUなんかには
初めから容量は捨ててTSVの無い1枚チップで良いじゃんって話をした

また帯域を落とすのが本末転倒なのでLC規格とは違いバス密度は落とさない
バス幅半分にするのと同時にエッジ長と面積も同時に半分にする

実装の最小単位を落とせば使いやすくなるだろうって話であって
エッジ幅や面積あたりで見た時の帯域効率はHBMと同じって話
0013Socket774
垢版 |
2018/05/01(火) 07:39:13.05ID:wEMfHv9f
今の性能、ダイサイズ位のAPUならGDDR5で十分

なんでそんなにHBMに執着するのか
0014Socket774
垢版 |
2018/05/01(火) 07:42:44.39ID:PkRVD1eX
基本のコア性能上げるの諦めてるからだろ
0015Socket774
垢版 |
2018/05/01(火) 07:55:00.79ID:B4EGi1o/
>>12
それこそ本末転倒なんだよなぁ
そんなんならダイのDRAMコン増やすかSRAM増やすで十二分に効果がある範囲にしかならない
寧ろダイの拡大の方が現実的だろう

何でLCで密度を落とす選択をしたかと言えばインターポーザにSiがどうしても必要だからだ
またTSV“自体”のイールドは改善のしようがある
だがこれはメインのロジックダイとHBMを貼り付ける都合上かなり大きくなってしまう、配線も増える
半導体のイールドとコストはインターポーザと言えどウェハから作る関係上、影響を受ける
どころかコレを作るためだけにラインを一つ消費するだけのコストが掛かる
その上共通化できないから製品毎に専用、しかもサイズの異なるダイを二つかそれ以上接合しないといけないという地味に難易度の高い実装
一方スタックドDRAMであるだけのHBM自体は小さくその上安価なDRAMプロセス製の規格量産品
故にHBM“自体”のモンキーモデルはこれを必要とはしない
どーやって引っ付けるかがネック

>>14
上がらねぇんだよ
論理的にも物理的にもほぼ限界
だから現状唯一面積さえ差し出せば向上出来るポイントである粗粒度並列化、その為の帯域要求
現状、コレ以外のソリューションは軒並みデファクトを置き換えられる程のものじゃない
他に方法があればこんな米帝プレイ的なピン数のゴリ押しに頼ったりしないさ
0016Socket774
垢版 |
2018/05/01(火) 08:04:20.85ID:gUWyFvM/
>>13
GDDRにすると
・チップあたりの帯域幅が数分の1
・転送1bitあたりの電力が数倍
・チップあたりのch数が少なくレイテンシが長くなる
といった辺りがいまいち
0017Socket774
垢版 |
2018/05/01(火) 08:13:58.73ID:gUWyFvM/
>>15
DRAMプロセスだから1ダイあたりで16Gbit
只のニアメモリであってダイコストはまったく普通のDRAMだよ

SRAMはどんなに増やしても数百Mbitが限界
DRAMコントローラが増やすためにはダイを大きくする必要があり
それはまさにコスト直結、電力増大、用途限定の本末転倒

逆に高密度インターコネクトパッケージは2.1Dのファンアウト技術を中心に遥かに開発が進んでる
インターコネクトが進化してる状況ではLC版で規格を低密度化する意味が無い
0018Socket774
垢版 |
2018/05/01(火) 08:16:42.97ID:gUWyFvM/
例えば2.1DではFuryやVegaで2.5D実装を手掛けてたASEの準備が出来たと言ってる

https://www.nikkei.com/article/DGXLRSP470309_R00C18A2000000/
https://semiengineering.com/wp-content/uploads/2018/03/fig2fanout.png
半年前の発表資料ではチップ合計624mm2、配線3層、パッケージ45mm角だったのに対して
858mm2、4層、67mm角にまで強化Vega64クラスに対応出来るスペックになった
真っ先にAPU + Memoryとも書かれてる
歩留まりが2.5umスペースの4層で99%まで上がったんだそう
0019Socket774
垢版 |
2018/05/01(火) 08:36:25.62ID:gUWyFvM/
メモリをWideI/O的な一層メモリ、ロジック無しにすると
メモリベンダー側の原理的なダイ製造コストは通常のDDR系とほとんど差がなくなる
つまりベンダー側が極端なプレミアムを付ける一方的な根拠が無くなる

マイクロバンプによる高密度WideI/O系単層メモリは
昔からソニーがプレステポータブルとか携帯機で使い続けてる
なので幅広く使えないようなコスト的な根拠は無いだろう
0020Socket774
垢版 |
2018/05/01(火) 09:44:23.01ID:didAijoS
>>7
(ターゲットとしているx86の範疇外かもしれないが)ロードマップで見えてきている製品でも
Xeon Scalable ProccesorだとIce Lake-SPが最大38コアとの噂で
2way SMT/4way SMPだとシステムとしては304スレッド

Xeon PhiだとKnights Landing/Millが最大72コア/288スレッド
Knights Runでは〜88コア程度との予測がある

Xeon Phiのコアアーキテクチャが現在のSilvermontベースから
次のKnights CoveからはSkylake-SPベースに変わるとの噂なので
SMTが現在の4wayからKnights Cove/Runで変化するかもしれんし
SMPの対応有無も不明なので
Knights Runのシステムとしての最大スレッド数がどの程度になるかは現状不明
0021Socket774
垢版 |
2018/05/01(火) 11:01:43.08ID:dah0BDLf
APUのキャッシュ用メモリに欲しいスペックは、100GB/s程度の帯域、1GBの容量なんで、これを達成できれば何でもいい
似たようなスペックがHBM1の1スタックで、面積も小さいからCPUソケットに収まる範囲に出来ると思った
APUに求めるのはローエンドGPU並の性能だし、HBCC使って1GB HBM + 8GB DDR4の階層メモリなら必要十分な性能出せると思う

普通のAPUに+5000円くらいで追加できるなら大歓迎
0022Socket774
垢版 |
2018/05/01(火) 11:03:14.57ID:GIq4tHD2
>>13
今のデスクトップ/モバイルのAPUですらDDR4では足りないし
GDDRのM/B実装なんて需要が無い→現状ではHBM系しかない

別にAPU作ってるAMDだけじゃなく、IntelもHBMの規格作りに参画してるんだし
dGPUと家庭用ゲーム機ぐらいでしか脚光を浴びないGDDR推しの必要はないのでは
0023Socket774
垢版 |
2018/05/01(火) 11:05:56.32ID:GIq4tHD2
>>21
HBCCのキャッシュは名ばかりキャッシュだから
CPUのキャッシュと同列に並べるのに違和感
CPU、GPU、HPC向けCPUのカテゴリを書いてから書いたほうがいいよ
0024Socket774
垢版 |
2018/05/01(火) 12:13:26.66ID:dah0BDLf
>>23
CPUと同列なんて欠片も言ってないけど?
カテゴリ分けとかそんな面倒なことはする気ないし

ついでにいうと、メモリやキャッシュの階層制御は、一般的で普通の技術だよ、大抵のプロセッサで普通に使われてる
それをiGPU+HBM+DDRでやろうってだけの話
iGPUに少量の高性能メモリを使うってのは、IntelのeDRAMやXBOXのeRAMとか先例もある

技術的やコスト的に1GB 100GB/sを5000円は可能と踏んでるけどどうかな
0025Socket774
垢版 |
2018/05/01(火) 13:43:39.21ID:Soq6ZCU6
100GB/sだったらDDR5 2chで良いじゃん
少なくともメインメモリの5倍くらいの帯域はないとCPUに使う意味はないと思う
0026Socket774
垢版 |
2018/05/01(火) 14:06:30.65ID:Z1qc79tp
DDR5だとかえって高く付くとか無いのか?
0027Socket774
垢版 |
2018/05/01(火) 15:21:23.46ID:vEZk2cQb
来年製造開始てレベルだしなあ……
0028Socket774
垢版 |
2018/05/01(火) 17:02:31.09ID:9R+zSBtU
iGPUとの接続の話がメインならこのスレの話題対象外じゃないの?
前スレでももめてたしさ
0029Socket774
垢版 |
2018/05/01(火) 18:44:52.19ID:B4EGi1o/
>>26
あんま電力が下がらんのとプロセスが微細化するので現存の概ねCCX一発分を維持すると仮定すれば
丁度クロスする辺りかもな
0030Socket774
垢版 |
2018/05/01(火) 21:45:37.30ID:FNxGUvir
DDR5自体ペーパーローンチなのに対応したメモコン積んだCPUなんていつの話やら
0031Socket774
垢版 |
2018/05/01(火) 22:02:27.17ID:bm41tQeZ
>>21
今年(2018年)はGDDR6の年となる。データ転送レートは最大で18Gbps、高性能GPU
クラスのx384インターフェイスならメモリ帯域は864GB/sとなる。メモリ帯域だけ
なら、これまでのHBM2(まだ広帯域化が続いている)に匹敵する。
https://pc.watch.impress.co.jp/docs/column/kaigai/1106510.html
0032Socket774
垢版 |
2018/05/01(火) 22:16:53.91ID:GIq4tHD2
またまた家庭用ゲーム機、PC向けのAPU/CPU、HPC向けプロセッサのごった煮論議の開始か・・

>>30
DDR5の仕様って固まったの?
0033Socket774
垢版 |
2018/05/01(火) 23:11:14.24ID:nJyHp6sG
一応実質的には去年のワークショップで決まったようなもんではある
DDR4も最終確定は2014年9月だったけど、それ以前からエンプラ向けには売ってたし
0036Socket774
垢版 |
2018/05/02(水) 02:07:48.26ID:Y5ewDZCA
>>34
メモリは積層して何とかスペース確保するにしても、
ソケットタイプだと配線の引き回しが極めて厳しくなりそうだなぁ
M/B直付けタイプならなんとかなるかもしれんけど
M/Bベンダーもうちら顧客も極めて選択肢が狭まりそうな気がする
0038Socket774
垢版 |
2018/05/02(水) 05:33:51.57ID:7WyTFZQz
>>36
今んとこライバルは256GB/sあるから、16Gbpsだとして4枚程そこに入れなきゃ対等ですらないがよろしいか
0039Socket774
垢版 |
2018/05/02(水) 08:38:41.89ID:I//tWZQh
コストかけて微細化しても、消費電力は減らず、性能を上げられない
コストに関しては減価償却が進めば下げられるとしても、今後は「CPUの価格が下がるだけ」で性能向上は見込めないのかも
0040Socket774
垢版 |
2018/05/02(水) 15:00:56.98ID:/myJo1Hx
なのなの
MIPS、初のnanoMIPS命令セット対応CPUコア「I7200」
ttps://pc.watch.impress.co.jp/docs/news/1120074.html
0041Socket774
垢版 |
2018/05/02(水) 16:33:39.70ID:/P621/Ht
via「なぬ?」
0042Socket774
垢版 |
2018/05/02(水) 16:43:26.31ID:X8im71xu
> コアに密接し、高速アクセスが可能で決定論的なスクラッチパッドRAM(SPRAM)も最大1MBまで搭載可能
これうまくやればHPC向けにそこそこ使えそう

適度なローカルメモリやスクラッチパッドがあれば大幅に高速化する種類の演算は、
これで大幅に早くなるはず
0043Socket774
垢版 |
2018/05/02(水) 16:55:30.23ID:Y5ewDZCA
>>37
BGAで基板に実装できるものと、配線引き回しや物理的な制限に苦労しそうなソケットとを単純に比較するのは無理じゃないかなぁ
0044Socket774
垢版 |
2018/05/02(水) 22:54:17.69ID:07KRLdUz
>>33
電源がDIMMに乗るんだっけか
出始めの相性問題は激しくなりそうではあるね

>>42
1MBじゃ・・
0045Socket774
垢版 |
2018/05/03(木) 00:14:06.03ID:72nU8fpG
L1 1MBとかできたらいいな
100%無理だけど
0046Socket774
垢版 |
2018/05/03(木) 00:19:11.69ID:DuE9SY6j
キャッシュサイズとレイテンシは大体比例するから、L1 1MBとかにしたらL2と変わらない性能になるだろうな

L1 64kB、 L2 512kB、L3 2MBくらいが一番バランスがいい
0047Socket774
垢版 |
2018/05/03(木) 00:41:42.15ID:EU3m3UAd
x8づつくらいが良いんでないかな
64-512-4096
ただ共有とか相互がある場合ちょっと工夫は要るだろうね
0048Socket774
垢版 |
2018/05/03(木) 09:24:02.14ID:UBscNOmq
個人的には新世代メモリがきたらL2も分離型になるかと思ってたけど
よくてLLC(共有型)どまりみたいで残念
0049Socket774
垢版 |
2018/05/03(木) 10:31:00.52ID:Zz366aXP
Skylake以降のXeonではL2:1MB、L3:1.375MB
L3 victimにして低用量で済む処理の速さに重点を置く形に
DRAM高速化やSSDの普及でまあこれがとりあえずはいい形なのかね
0050Socket774
垢版 |
2018/05/03(木) 12:26:47.95ID:W6JDBY8A
CPUのキャッシュはこういう階層になる。
L0:デコード済み命令
L1:コードデータ分離
L2:コア毎独立
L3:チップ内統合
L4:ボード内統合
L0はRISCには不要
L4はメインメモリの管理方法が内蔵キャッシュとの間でのある程度のサイズのブロック単位のバースト転送になったこと、チップ毎のローカルメモリをチップ間通信で共有する形になったことから短レイテンシを特長とする外部SRAMによるものは存在価値を失った。
現在ではメインメモリ内に設けられたボード間通信バッファをL4とみることはできる。
0051Socket774
垢版 |
2018/05/03(木) 17:40:40.74ID:7sZhfKZq
eDRAMや2.5DでL4$を持つのはわるくないとおもうよ
L4$っていっても、タグ領域はCPUダイ内のSRAMに置いておけば性能低下は最小限にできる

問題はコストとパフォーマンスの関係があまり良くないってところか?
0052Socket774
垢版 |
2018/05/03(木) 17:45:49.84ID:quv/9kPv
タグRAMにシリコンを使うくらいならコアを増やす方が良いという考えもあるからなぁ
0053Socket774
垢版 |
2018/05/03(木) 20:05:24.27ID:UBscNOmq
そんなに大きかったっけか?

>>51
(一般的な)キャッシュだとiGPU以外では目立った効果がなく
モバイルの上位モデルぐらいでしか価値が見いだせられないからおいしくない
0054Socket774
垢版 |
2018/05/03(木) 20:12:07.49ID:gjyKvWEl
1T-SRAMとかどーかな
0055Socket774
垢版 |
2018/05/03(木) 20:21:24.05ID:BxIfOwz/
カートリッジ式CPUへの回帰
0056Socket774
垢版 |
2018/05/03(木) 21:01:52.27ID:ger3ZDhe
遅延デカすぎて駄目でしょw
0057Socket774
垢版 |
2018/05/03(木) 22:25:00.67ID:VTodrsCC
1T-SRAMが存在できるのは40nmとかまでで、
現状の14nmとか10nmだと実装できないって話だったような。
0058Socket774
垢版 |
2018/05/04(金) 00:37:14.39ID:lCb/3zAU
12FDXでZ-RAM復活とか
0059Socket774
垢版 |
2018/05/04(金) 03:48:07.96ID:AJmfmntt
eDRAMはUMAグラフィックでは性能が出ないためVRAMのうちアクセス頻度の高い部分をローカルメモリ上に確保する目的以外ではほとんど効果がない。
intelはキャッシュの体を取ることでソフトウェアの変更なしにアクセス頻度の高い領域がeDRAM上に確保されるようにした。結果としてCPUから見たL4になったがL4としては多大なコストに見合うだけの効果は無かった。
0060Socket774
垢版 |
2018/05/04(金) 03:51:18.98ID:vM1YyUr9
>>57
そっか
Trのラッチアップを意図的に制御出来ればSRAMは楽そうだよな

ん?、、、
0061Socket774
垢版 |
2018/05/04(金) 09:51:42.01ID:lCb/3zAU
>>59
理由と結果がつながってないと思うんだけど・・
0062Socket774
垢版 |
2018/05/04(金) 10:08:41.08ID:AJmfmntt
>>61
OSやグラフィックライブラリーを変更しなくて済むようGPUのキャッシュとして作ったけどメモリが共有だからCPUからもキャッシュとして使えた。でもそれは無意味だった。
0063Socket774
垢版 |
2018/05/05(土) 16:12:13.81ID:vWgvF3wK
>>33
ついにきたな
今夏最終仕様発表で来年から出荷開始
まずは3200なのか、それとも4400からなのか
0064Socket774
垢版 |
2018/05/05(土) 22:44:44.02ID:Mw+aSXM3
2〜3年後にはメモリ容量1TB、帯域300GB/s以上とかになるのか‥‥
0065Socket774
垢版 |
2018/05/05(土) 23:05:39.91ID:DFj4LZ6j
メモリ帯域はCPUにはあまり関係ないからなあ
今以上にあってもあまり意味無いと思う
0066Socket774
垢版 |
2018/05/05(土) 23:14:13.20ID:lZJ3X6Pm
半分冗談だけど、SSDの高速化の方が役に立つ
0068Socket774
垢版 |
2018/05/05(土) 23:36:44.57ID:BvtZVtod
それ以外のゲームだとドングリの背比べのような・・
0071Socket774
垢版 |
2018/05/06(日) 01:52:21.54ID:Za/qNdy5
>65
現状のレイテンシ、帯域、容量を暗黙のうちに前提にするなら
そういう表現になるかもしれないが、前提にしないなら

「レイテンシとつり合いの取れてない帯域があっても用途が狭い」

今のDRAMメモリはレイテンシの役割をキャッシュに丸投げ、
容量の役割をSSD、HDDに丸投げして中継ぎしてるだけだ
(「メイン」メモリの名が泣いている)。
もしもDRAMのレイテンシがキャッシュの階層を減らすことができるくらい
小さければ、帯域増のメリットは大きい。
0072Socket774
垢版 |
2018/05/06(日) 02:06:04.97ID:XWMDjptq
CPUのボトルネックはストレージだから、メモリをいくら速くしても意味ない
CPUベンチ以外ではメモリは既にボトルネックじゃないよ
0073Socket774
垢版 |
2018/05/06(日) 03:10:45.89ID:JbkuwWUo
サーバや業務用ストレージ用途はともかく、
個人向けじゃ動画編集とかやってる人以外はSSDなんてSATAで十分だけどな

むしろDRAM高騰で、メーカーPCのメインメモリが減ってるからスワップが増えて
低速化してる気はするな

かつて8GBデュアルチャネル積むのが当たり前だったメモリが、
4GBシングルチャネルになったし
0074Socket774
垢版 |
2018/05/06(日) 11:05:45.52ID:LQcgo45J
データセンターは知らんが、水力学や大気力学じゃ、メインメモリの帯域重要なんだが
0075Socket774
垢版 |
2018/05/06(日) 13:08:01.94ID:1mtyJLen
PCだってメインメモリのないソリューションがないんだから
CPUの理論値を下回らない程度の帯域を確保したメモリは必要
0076Socket774
垢版 |
2018/05/06(日) 13:36:00.02ID:p3Nbz4jX
CPUの理論値とは
0077Socket774
垢版 |
2018/05/06(日) 17:01:28.27ID:P/EGyHlL
階層毎に1/10くらいかな
0.1%以下が当たり前だし
0078Socket774
垢版 |
2018/05/08(火) 02:59:53.53ID:2u9Dbt8M
>>74
流体力学一つでよくね?
0080Socket774
垢版 |
2018/05/08(火) 20:15:42.54ID:fhqx6So7
A12ってTSMCの、7nmのやつ?
0081Socket774
垢版 |
2018/05/09(水) 05:07:34.93ID:GyIhDu7z
tsmcの10nmから7nmで20%クロックアップできるから、アーキテクチャとしてはほぼ変わってないな
0082Socket774
垢版 |
2018/05/09(水) 05:49:41.86ID:FL3239J2
まだまだ発売日まで時間あるから
最適化されるかも分からん
0083Socket774
垢版 |
2018/05/09(水) 06:31:13.16ID:+iaMmS07
なーに、OSアプデで遅くすれば
40%向上達成は容易よ
0084Socket774
垢版 |
2018/05/09(水) 14:19:36.65ID:/8Y/xV7p
林檎の脱インテルはラインナップ全部ではなくとも一部ではやりそうだ
0086Socket774
垢版 |
2018/05/09(水) 19:36:35.82ID:fQyWHbff
nanoMIPS32は範囲が32bitのPC相対アドレッシングのロード、ストアがあったりとか
GP(グローバルポインタ)間接のdispが21bitあったりとか
(GOTテーブルのサイズが多く取れて扱えるグローバル変数の数が増える)
ポジションインディペンデントなコードを作る場合の改善とかあるのな
0087Socket774
垢版 |
2018/05/10(木) 04:10:21.14ID:i4e71/fi
いまさら新しいCISC作ってどうすんだ。
0088Socket774
垢版 |
2018/05/10(木) 07:19:39.66ID:Bm8NbQ7s
イミディエイトロードの命令はいらない子
0091Socket774
垢版 |
2018/05/10(木) 18:59:31.43ID:ShSfLrPS
>>87
CISCとまではいかないだろう
CISCだとアドレッシングモードによって命令の長さが全く違ってくるしもっと複雑
nanoMIPS32だと48bit命令の最初の6bitは全部011000で始まってるようだし
簡単に命令長を区別できるようにデコードに負荷がかからないような仕組みが導入されてるはず

>>88
コード密度を上げるためかもな
lui $4, %hi(0x12345678)
addiu $4, $4, %lo(0x12345678)
と命令を2つ使うと8バイトになるが
li $4, 0x12345678
こっちの方が48bit(6バイト)で短くなるから
C言語にアセンブラコードを吐かせたのを見るとシンボル値のロードは頻繁に使ってるしな

余談だが64bitCPUの場合でも、デフォルトではシンボル値は32bitに制限してたりする
Linuxでもx86_64はシンボル値を32bit、ARM64はシンボル値を33bitにするのがデフォルトになってる
おそらく64bitのシンボル値を読むようにすると性能が落ちるんだろうね
0092Socket774
垢版 |
2018/05/10(木) 19:06:22.62ID:ShSfLrPS
あとnanomips32ではPC相対のロードストア命令の他に
PC相対で指定したアドレスをレジスタに読み込む命令も用意されてるから
簡単にリロケータブルなコードを生成できる
PC相対の範囲も32bitのアドレスを指定できる48bit命令が用意されてる
0093Socket774
垢版 |
2018/05/10(木) 19:43:47.92ID:ShSfLrPS
アセンブラがあまりわからない人のために補足しておくと
シンボル値は主に関数のラベルやグローバル変数名に使われる
上にも書いたがたとえ64bitのプログラムでもシンボル値は32bitに制限されてる場合が多い
x86_64やARM64でもだいたい32bitくらいに制限されてる
gccには-mcmodelオプションで指定できるメモリモデルがあるのだが
デフォルトはx86_64でもARM64でもsmallになってて
x86_64だと2GB、ARM64だと4GBの範囲でしかシンボルを扱えない
largeだとシンボル値を64bitとして扱う

x86_64だとmediumが指定できて
これを指定するとグローバル変数のシンボル値に64bitの値が使われる
スパコンのソフトだとこのオプションを使ったりする場合も多いらしい

PGIのコンパイラのサイトにわかりやすい説明が載ってる
64ビット環境 2GB 以上の生成オプション
https://www.softek.co.jp/SPG/Pgi/TIPS/opt_64.html
0094Socket774
垢版 |
2018/05/10(木) 20:02:20.67ID:ShSfLrPS
アセンブラというよりCコンパイラ側が吐き出すコードが
デフォルトだとシンボル値が32bit(ARM64だと33bit)を想定したアセンブラコードになってる
ほぼすべての64bit CPUのCコンパイラがそんな感じになってる
シンボル値のロードは頻繁に発生するので速度低下を抑えるためにそういう仕様になってると思われる
0095Socket774
垢版 |
2018/05/11(金) 14:53:25.71ID:SzCwN0Bl
まあ、32bitのイミディエイトロードはアドレスの読み込みで頻繁に使うからな
その部分で1回当たり、2バイトも削減できるのは大きいね
1命令4バイト固定にこだわらないのはRISC-Vの影響もあるかもね
0096Socket774
垢版 |
2018/05/11(金) 16:31:56.06ID:vIpHDtU7
4バイト固定てARMか
0097Socket774
垢版 |
2018/05/11(金) 17:25:33.47ID:1w9yqWqs
アドレスに32bit使うならabs32よりbase+(index+disp20)*scaleの方が使い手がある。
0098Socket774
垢版 |
2018/05/12(土) 04:50:30.32ID:6B1Bn3eb
ザーッと見た感じ48bitの長さの命令は6命令しかなさそう

addiu rt, s32 レジスタと32bitイミディエイトの加算(ソースとディスティネーションが同じレジスタ)
addiu rt, gp, s32    グローバルポインタと32bitイミディエイトとの加算
addiupc rt, s32     PCとイミディエイトの加算
li rt, s32          32bitイミディエイトのロード
lwpc rt, addr      PC相対アドレス指定の32bitロード
swpc rt, addr      PC相対アドレス指定の32bitストア
lapc rt, addr      PC相対アドレスのロード(addiupcのエイリアス)
0099Socket774
垢版 |
2018/05/12(土) 06:43:41.85ID:6B1Bn3eb
MIPSの場合、GP(グローバルポインタ)は汎用レジスタの$28な
0100Socket774
垢版 |
2018/05/12(土) 06:48:10.88ID:6B1Bn3eb
しかし、全く違う命令セットで来るとはな
MIPS32R6やMIPS64R6はまともな応用製品が出る前に終焉なのかな?
命令セットを変えまくって、32bitのLinuxは対応するにしても、他のリアルタイムOSが対応してくるのか?
IoTの時代に、リアルタイムOSなしでの開発とかやってられないでしょ
0101Socket774
垢版 |
2018/05/12(土) 07:00:52.83ID:6B1Bn3eb
ThreadXとNucleus RTOSがnanoMIPSに対応するみたいだな
ちなみに、どちらもμITRONの互換機能をもつバージョンも持ってる模様

アドバンストlte/5gコミュニケーションとネットワーキングicデザインにおいて、抜群のパフォーマンスと効率性を実現する、mips I7200プロセッサコア
https://globenewswire.com/news-release/2018/05/03/1496280/0/ja/%E3%82%A2%E3%83%89%E3%83%90%E3%83%B3%E3%82%B9%E3%83%88lte-5g
%E3%82%B3%E3%83%9F%E3%83%A5%E3%83%8B%E3%82%B1%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%81%A8%E3%83%8D%E3%83%83%E3%83%88
%E3%83%AF%E3%83%BC%E3%82%AD%E3%83%B3%E3%82%B0ic%E3%83%87%E3%82%B6%E3%82%A4%E3%83%B3%E3%81%AB%E3%81%8A%E3%81%84%E3%81
%A6-%E6%8A%9C%E7%BE%A4%E3%81%AE%E3%83%91%E3%83%95%E3%82%A9%E3%83%BC%E3%83%9E%E3%83%B3%E3%82%B9%E3%81%A8%E5%8A%B9
%E7%8E%87%E6%80%A7%E3%82%92%E5%AE%9F%E7%8F%BE%E3%81%99%E3%82%8B-mips-I7200%E3%83%97%E3%83%AD%E3%82%BB%E3%83%83%E3%82%B5%E3%82%B3%E3%82%A2.html
(URLが長いので改行してます)

> Express LogicのCEOであるWilliam Lamie は次のように述べている。
> 「I7200は、リアルタイムイベントに対する高い性能と高速応答の両方を必要とする通信、
> ネットワーキング、その他のアプリケーション向けの高性能プロセッサとして活躍するでしょう。
> 当社の産業用Grade X-Ware IoT Platform (ThreadX RTOS基盤) に新しいI7200コアを追加し、
> MIPS CPUの長期サポートをより拡大することを楽しみにしています。」
>
>
> Siemens傘下事業であるMentorの組み込みプラットフォームテクノロジーのジェネラルマネージャであるScot Morrisonは次のように述べている。
> 「MIPSの長年にわたるパートナーとして、当社のNucleus RTOSは、両社お客様がより低リスク、
> より短期間で製品を市場に投入することができるように支援しています。
> 当社のSMPバージョンは既にMIPSラインナップで既存のマルチスレッドおよびマルチコア製品をサポートしています。
> 新しいMIPS I7200プロセッサコアは、優れた性能と最適化された機能を提供し、
> MIPSのお客様が複雑なLTE/5G通信アプリケーションを含めた幅広い組み込みソリューションを開発するために役立ちます。」
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況