AVX512って32bitx16個か64bitx8個の処理をやってるだけでしょ?
多くなるほど効率悪化してスケーリングが落ちるから、ベンチか特定演算専用にしかなってない
256bit命令や512bit命令があるわけじゃなし、無理して実装するものでもないでしょ