fp16も32も消費電力変わらんし、処理能力が同等の場合どちらとも同じ性能だ。
違いはデータの大きさと精度だけ。
それにfp16とかの型にアクセラレーターはないよ。あるのはそれぞれユニットが適切にマルチ処理できるアーキテクチャだ。
nvidiaが速い理由はただ単にfp16で処理するユニットが多いだけや間抜け