強い局所性というか論理コア数ぶんシングルタスクプログラム並列で走らせるだけですけどね。
スレッド共有メモリの同期がネックになるアプリこそ強そうだけどな

Non-inclusiveなのでL2+L3の容量は2.375MB/core
向き不向きはあるだろうがL2の容量を大きくしたのはデータ解析のトレンドに合わせたといったところでは



GCPの早期アクセス版のSkylake XeonがLinpackで82%高速、実効メモリバンド幅が2倍とか書いてある(いずれもBroadwell比)
更に生命情報学のアプリでAVX-512最適化時、AVX2比の2.2倍とか


いずれもcloud.google.com/intelより

※vCPUの表記が気になるが32コアは実マシンと一致してないかも