Intelの次世代技術について語ろう 89 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
Intelの次世代製品や、それに関連する技術についてのスレッドです。
■前スレ
Intelの次世代技術について語ろう 88
http://egg.2ch.net/test/read.cgi/jisaku/1496933082/ >>618
そういうコードを逆に排斥した方が結果的に性能は出る気がする 未最適化状態ならせいぜい数十行程度の単純なロジックばかりとにらめっこしてればいい科学技術計算屋の発想ならそうなるだろうが
業務で扱うデータは必ずしもコンピュータで並列化しやすく並んでないしあらゆる顧客に対応するために拡張に拡張を重ねるのでコードも莫大になる
書き直せるレベルのコードしか書いてない奴は楽でいいな 最近のコンパイラの最適化は凄い
すでに64bitコードはそうなってる
32bitコードでレガシー命令つかわない場合もすでにそうなってる
むかしのCISCの常識は捨てないと AVX2オプション付けてコンパイルしてもさっぱり速くならないか逆に遅くなるプログラムもあってだな スパゲティなプログラムやデータはもう仕方ない
それはそれで残しとくとして、使用範囲を狭めていけばいい
そして並列化しやすいプログラムやデータを新しく開発してそっちに切り替えて運用すればいい
データとかはコンバート用のソフトか機能を作って、新フォーマットに適用させればいい 世の中のコードは大半が(CPUから見ると)極めて効率の悪いコードで、それが減る未来は当面考えにくいんじゃないかな
最近のサーバはむしろ仮想化で雑多なアプリケーションを集約しまくってるし、
IaaS環境だとむしろ他人のよくわからん実行から干渉を受けるぐらいになってる >>621
糞コードってのはコンパイラがどうしようが糞
そういうレベルじゃなくて、もっと上位の変更が必要
データ構造とかアルゴリズムとか
もちろん原理的に糞コードしか作れない処理ってのも世の中にはたくさんある おおもとのプログラムに起因する問題は、命令セットではどうにもならない
x86だけじゃなくRISCプロセッサーでも同様の問題が起こる
命令セットが悪い問題は、すでにx86プロセッサではレガシー命令つかわない限り解決済み
大昔の386プロセッサでも実行可能なコードを吐く必要があるとかなら別だが よく使われるOSとオフィスとブラウザ自体がクソコードだらけなんじゃないだろうか (論点が噛み合ってないだけで全員似たり寄ったりなことを書いている気がしないでもない) 1コア4スレッドってまるで天津飯だな
腕が四本になったり4体に分身したりそれは凄い才能の持ち主であった >>627
Windows10は原理的にはCore2以前のPCで動くことが想定されてないからの Athlon64の初期モデルで動かなくなったやつ?
セキュリティーかなんかだっけ? CMPXCHG16B, PREFETCHW, LAHF/SAHF, ほか
すなわち、ぺ4様でも後期ならWindows10動作要件を満たす
>>628
まー、一流のソフトエンジニアを複数抱える世界最大級のソフト開発会社であるMicrosoftのOffice製品見ればわかるよな
AVXが必要なのはあらゆる用途に使えるからではなくひとえにサーバサイドでデータ解析のマーケットが拡大してるからだ
従来のソフトウェアが速くなるわけではない
実際コンシューマ版SkylakeではAVX-512の実装見送る判断してるわけだし ま、用途に特化したアクセラレータを流用して他の用途でも優位性を見出すのはソフト屋の知恵が試されるところですけどね AVX512実装してコアサイズがでかくなるのと、
AVX612実装せずにコアサイズを小さくコンパクトにしてそのぶんコア数増やすのでは、
どっちが有利か、っていうと、サーバでは後者のほうが有利なアプリが多い気がするよ >>642
タイルプロセッサとかの極端なメニーコアプロセッサを考えてみればわかるけど
MIMDお化けみたいなプロセッサがあってもそれはそれでアプリケーションは大変だし性能出るとも限らんですよ >>639
すまん簡単に言えばCore2/Athlon64までのアーキテクチャでしか動かないようになってるって話 coreが増えると周波数が上がらないのはどうにかならないのかね ITBM 3.0は昔から期待されていたアイディア(コアがいっぱいあったら高クロックで動くのも混ざってるように選別できるやろ)を元にしてるんだとは思うけど
さすがに少数コアの製品には勝てないんだろうな >>642
【※ただしフロントエンドに限る】だろ、それは
SIMDを減らして消費電力あたりのスカラ整数性能に特化したDenvertonに、オールラウンダーのSkylake-SP、SIMD特化のKnights Landing、更にエントリーモデルとしてE3やDがあるぜ
みんな違っていい https://youtu.be/5MsFaXfnAGo
https://youtu.be/OvPYlM84fm0
今時、動画キャプもWindowsの標準機能に搭載されているご時世に
こんな有り様じゃあパソコンでゲームやらなくてもいいだろ
ゲームとチャット程度しか出来ないなら凶箱やPS4と一緒ってこった >>502
消えろまじ
540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21]
Zenが高くないと買えない自分を正当化できないもんな
大丈夫だよ、8コア最上位でも3万円切るから
お前みたいな無職大貧民には大金だけどな
545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21]
最上位で3万円切るって宣言した俺の発言ログとっとけよ
148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9]
まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ
351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU 9WJv [4/7]
リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ 多コア化は熱源の増加でもあるからクロックは下がる
だったらコアあたりの熱量を下げればいい
コアの中で一番発熱している部分というなら、デコーダー、SIMD、L2キャッシュのどれかかな フルロード時を前提にするならコアを増やすアプローチではダイの面積も消費電力もそのまま2倍になるんだよな
SIMDを2倍にする拡張だと同じフォーマットなら同じフォーマットならデコーダやスケジューラのリソースを増やさずにデータバスと演算ユニットを2倍にするだけでスループットを稼げるので電力やリソースの増大は2倍を下回る
ならその余力をもってIPC増加に費やしたほうがいいわな?
2パス実行の実装では1命令リタイヤするのに2オペレーション滞留することになるので電力効率はむしろ悪い。 大体にXeon Platinum 28CとEPYC(自称)32Cでは消費電力はTDPに優位差はないがFLOPS数が3倍は違うだろう >>502
主観だけで物言う嘘松団子
540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21]
Zenが高くないと買えない自分を正当化できないもんな
大丈夫だよ、8コア最上位でも3万円切るから
お前みたいな無職大貧民には大金だけどな
545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21]
最上位で3万円切るって宣言した俺の発言ログとっとけよ
148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9]
まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ
351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU 9WJv [4/7]
リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ
>>655 定格2.1GHzでTDP165Wだし、Kabylake-refleshの4コア(15W)の7倍+αと考えれば余裕ですな
なお例の4個詰めパックは2.2GHzでTDP180W
元がモバイル用CPUだから低クロックのほうが安定するだけでは
Skylake-Xは300WのGPUを4枚刺すようなプラットフォーム向けだから目くじらたてるもんじゃないでしょ 卒業生の成り済ましにも言っておくけど
クソ団子の発言は全部根拠の無いデタラメだから
いちいちこっちが裏とったり検証しないといけないんですけど
そこんとこわかってんのかね? じゃあ裏取ってみたら?
TDP165Wの8176じゃなくて205Wの8180のほうだけどベンチ比較記事出てたよ
http://wccftech.com/amd-epyc-7601-benchmarks-analysis/
普通にSandra Mediaでトリプルスコア引き離してますな
しかしAVX-512ですら並列化できない問題がどうしてGPGPUにオフロードできると考えるのか
現にROCmのレポジトリはCUDA関連や01.orgのそれと比べて1〜2桁は更新が少ないし現実問題としてAMDのGPUがAVXの代わりになると考えてる関係者は皆無だろう
NVIDIAのGPUの母艦としても特に優位性あるようには見えないが… >>594
FX-8800Pはすでに出てるよ
嘘つき団子がFXをけなし
Atomの性能を誇張してるだけ
Atomのゴミ性能なのを受け入れろ >>660
TDP140Wで売り出してる10コアi9-7900XがTDP140W10コアi7-6950Xと同じようなノリかと思ったら大間違いw
http://www.4gamer.net/games/382/G038222/20170630095/TN/036.png 8800Pってロード時に30W超えるあれだよな?
あれがどうやったらSwitchより小さい携帯機に収まるの?
なおノートPCのストリーム配信してました詐欺までは想定内 >>664
ヒートスプレッダついているとはいえ、200W近いとか暖房器具かよ。 >>502
消えろ
540 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 21:45:48.40 ID:ijYX/87D [5/21]
Zenが高くないと買えない自分を正当化できないもんな
大丈夫だよ、8コア最上位でも3万円切るから
お前みたいな無職大貧民には大金だけどな
545 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2016/10/12(水) 22:03:09.78 ID:ijYX/87D [8/21]
最上位で3万円切るって宣言した俺の発言ログとっとけよ
148 名前:,,・´∀`・,,)っ-○○○[] 投稿日:2016/11/14(月) 20:21:39.52 ID:0Q4rwlJ0 [5/9]
まあ、本当にBroadwellの性能超えたら32コアOpteronデュアル機組んでAMDを応援してやるよ
351 名前:,,・´∀`・,,)っ-○○○[sage] 投稿日:2017/01/10(火) 21:24:59.71 ID:deU 9WJv [4/7]
リアル春にはAMD冬の時代になるから今のうちに春を楽しんで置きたまえ 8800Pのサーマルスロットリングの酷さにユーザーからクレーム事案
https://community.amd.com/thread/185411
よくこんなんで携帯ゲーム機使うなんて企画立ち上がったよね
現に発売延期を何度も繰り返してモデル追加でさらなる出資を募る、出資詐欺にありがちなパターンに嵌ってるが xeon取り上げられちゃったから暴れてんのか
まあ、見る人が見ればxeonは与えらんねーわ
華々しく卒業するも露頭に迷い先輩面して部室に入り浸って
ウザがられる奴だな IntelがTDP詐欺やめればまだ許せるんだけどねw
>>670
情弱過ぎて頭ボケてんですかw
普通に携帯ゲーム機何か検索かければ出てくるんですがw
https://www.amazon.co.jp/dp/B01MZIA361 >>662
母艦としての優位性はコスパでしょ。
よりG P Uにふれる。
しかし、裏をかえせば今のインテルにはAVXしか無いってことかね。
自作民へのアピールポイントを、もっと聞きたいとこだね。 >>674
ソフトがなきゃコスパ(笑)もクソもないわな
機械学習用途はAMDもNVIDIA頼みが現実解っすか?
GPGPUが不向きな処理はCPUで並列処理で分担してやるんだし、12コアもあればEPYC最上位の32コアのSIMD性能を超えるという考え方ならコスパも逆転するわな 相手にする奴も相手にする奴だよな
卒業生と同類だぞ
自演でもしてんのかってぐらい 団子って次世代の話全くしないな
今頃BristolRidge叩いても仕方なかろうに >>677
NVIDIAの母艦て書いたの、あんただが?
なにか? 来年の
Intelは14nm++のCascade Lake
AMDは7nmのZen2
Intelモタモタし過ぎw
AMDの本命来たらイチコロじゃんw >>681
AMDの7nmは早くて2019年だ馬鹿者 AMDの7nmなんてGF次第だろ
すでに遅れてるけどな
AMDがいくらすごいロードマップ書いたところで
ファブメーカーのGFが、7nm量産立ち上げまで絵に描いた餅 なんで卒業した糞OBに相手する必要性あるんですかね… IntelのソリューションだとそもそもGPU自体が不要だぞ
つーか既に一定分野ではソケット版Xeon PhiがTeslaを圧倒してるからなー
富士通の筐体だと2U筐体にKNLを8CPU集積できるしPCIeまたぎのオーバーヘッドも発生しない >>685
ふーん、まぁNVIDIAの母艦としての優位性にコメしただけだから、どうでもいいけど、
なんでi9ネタは避けるの?
待っててガッカリしたから、もう1800Xに完全に傾いてるんだけど >>680
自社GPUだと機械学習用途のソフト資産はないに等しい状態だろ
TeslaもXeon/PhiもGoogleやBaiduのデータセンターで現役で動いてるが、ROCmは一旦今までの環境をご破算にして0から作り直したかろうじてSGEMMの移植できましたのレベル。
GitHubのあの状況がオープンソースの成果じゃスタートラインにすら立ててないわな
オープンソースに依存するほど差が開いていくと思うよ >>686
ECCもオミットしてあるものを機械学習用途では使いたくないなー
どうせXeonの機能制限+倍率アンロック版に過ぎないんだし CUDAで開発できるnvidia、x86資産で開発できるPhiとちがって、
AMDのGPUは、ディープラーニングの開発環境が弱すぎる
ハードだけじゃなく使いやすい開発環境とそれなりのエコシステムが必要 >>686
ランダムSEGV問題がいまだに解決できないRyzen・・・
まあEPYCで起こるのかどうかはわからんが Xeon Phiとかxeonありきなのに、そのXeonがEPYCにシェア取られそうなんだよな
母艦がやられたらPhiが頑張ってもどうしようもない
http://www.dotup.org/uploda/www.dotup.org1289238.jpg
Xeon 28cとか熱問題ヤバそう
基本的に7900Xの増量版だから、電力や熱的に同じ問題を抱えることになる
正直AVX512をまともに動かせるようには見えない
おまけにメモリ少ないし、PCIe少ないし、チップセットいるしと劣ることだらけ
7nmの前に14nm同士での勝負をどうするのか
ちなみにEPYC 32Cは歩留まり良好だからどんどん出荷されていく
Xeon 28Cは今年の夏らしいけど未定
ついでにSPEC CPUも
http://cdn.overclock.net/d/d8/d87f14d8_AMD-EPYC-SPEC-e55d604df4d5a13b.jpeg
2699v4は22Cだから大体2/3位、まあコア数分くらいの性能差は出せてる Xeon Phi単体で1ソケットサーバノード組めるのにXeonありきなどと意味不明なことを述べており… >>690
> CUDAで開発できるnvidia、x86資産で開発できるPhiとちがって、
x86はあまり関係なくて、AVX512とか使ったGPGPUくらい面倒なチューニングが必要
> AMDのGPUは、ディープラーニングの開発環境が弱すぎる
> ハードだけじゃなく使いやすい開発環境とそれなりのエコシステムが必要
これからなんだから弱いのは仕方ない、それはこれから改善していく
Nvidiaにしても最近のP100から始めた市場だから、大して差はない
市場規模10000に対して、Nvは10、Intelは5、AMDは1からのスタートみたいなもんかな
10倍の差があったとしても、その先が圧倒的に大きいから追いつく余地はいくらでもある オープンソースにしてみたらコミッタの数が数十倍の差があったという悲惨な状況 NVIDIAもIntelもPythonで関数呼び出すだけで簡単に並列化プログラム書けるようにライブラリ整備してるんだよ、おじいちゃん
AMDだけが一人負けwww
たとえば日本では旧帝大や東工大の共同利用施設でPhiやTeslaを使った大規模分散演算ができてその成果が民間にスケールアウトされるんだ。
TOP500スパコン中3つしか採用されてないようなAMDのGPUじゃ土俵にすら立てないわな こいつまだ書き込んでるんだw
俺なら恥ずかしくてコテ付けて書き込めないがなwww >>665
やっと「Atomに近いパフォーマンス」というのは
大嘘だと認めたか(笑) EPYC最上位でXeon Platinumに惨敗したのにまだ出てこれるAMDファンボーイの神経 >>700
サーマルスロットリングかかったらむしろAtomより酷いだろ >>702
自分で言ってるけど30wだからな
それで65WのBristol Ridgeが
「Atomに近いパフォーマンス」なのか
説明してくれませんかね?w >>703
そーいやCPU-Z旧版のApolloLakeのベンチスコアがBRとドッコイだったな >>681
プロセスの数値が小さくても実際の配線で比べると小さくなってなかったり
小さくしてもリークや熱の問題で性能が出ないから製品で比べた方がいいよ >>702
水冷導入して定格運用でも
サーマルスロットリング起こす
7900xというCPUが最近出たらしいw
団子の大好きななAVX512ってのが売りらしいなw >>704
あえて旧版なんだw
団子的にもryzenのスコアが良かった
旧版が正しいかったと認めるのかな? 本物は卒業宣言してた気がするんだけど、この団子は偽物かな? 団子がいくらXeon Phiを持ち上げても、Intelの命運はXeonが握ってるのは間違いない
そして肝心のXeonやそれの廉価版の7900Xがこのザマという
http://www.dotup.org/uploda/www.dotup.org1289238.jpg
http://www.4gamer.net/games/382/G038222/20170630095/TN/036.png
コレをどうにかしない限り、サーバー市場での立場はなくなるだろうね
サーバー市場での立場がなくなったら、当然PCや業務向けにも影響するだろうな
結局HEDTどころかサーバーと言えどもワットパフォーマンスの呪縛からは逃れ無さそう ベクタ長は埋められる限りにおいて伸ばす方が効率が良いが、
CPUだと256〜512ぐらいが限度なのかなあ
しかしそれだと今後の性能向上をどうしていくかという問題はある >>708
二人目が卒業して三人目が入学したんだろ
多分後100人くらいいるよ >>704
Apollo Lakeに何を期待してるんだか…
Celeron N3350/N3450のベンチマーク結果を紹介! Apollo Lake世代の性能に迫る!!
http://little-beans.net/exposition/apollo-lake/
Athlon 5370とAthlon 5350でベンチマーク比較
http://pc-gadget.com/pc/pc-jisaku/68/ >>709
なんかよくわからん論評はSkylake Xeonが出た後でいいんじゃない >>710
ARMは2048ビット長まで対応して
再コンパイルも不要なSVEを載せてきてるな
ARMの新ベクトル命令「SVE」、ポスト京に採用へ
http://eetimes.jp/ee/spv/1608/25/news036.html
しかし、同社の「SVE(Scalable Vector Extensions)」は、
128〜2048ビット長を128ビット単位でサポートするという。
ベクトルコードを1回書き込めば、
あらゆるサイズのベクトル設計で動作させることができ、
再コンパイルも不要だ。
ARMは、「他のアーキテクチャでは実現不可能な性能だ」と主張する。 >>714
お手本のようにすると、ベクタ長もレジスタ数も仮定できなくて、制約の強いコードを強いられる設計だった気がする
まあ仕様に幅をもたせざるをえないのは良くも悪くもARMというか >>714
要するに128ビット止まりでランタイムレベルでの後方互換性すらとれないAMDの一人負けじゃないですかww
MKL-DNNではSSEからAVX-512を自動的に選択して実行するJITを導入したよ
なおJITフレームワークの開発者は日本人 >>717
虎の子AVX512で
まさかの一人負けは辛いよねw
7900x ■ このスレッドは過去ログ倉庫に格納されています