>>180
CUDAで書かれたカーネルコード自身は、CPUのアーキテクチャからは独立してるかもしれないが、
前後処理でCPUベタベタなSIMDのコードを書いていても全然おかしくない。
CUDAでしか処理しないものもあるだろうが、そんなのは用途次第で、CPU/GPU両方使うなんてのはざらにある。
そもそも、x86_64 macOS用のドライバを作るのをやめたNVIDIAがARM向けのドライバを書いてくれるかもわからないしね。

あと、TensorflowのフロントエンドはPythonというのは正しいけど、
コードの60%はC++で書かれてるよ
Pythonでゴリゴリ計算させる系のライブラリはバックエンドはほとんどC/C++/FORTRANだよ
Pythonインタプリタで動かしてたら遅くてかなわんでしょ

180こそ、本当にCUDAやTensorflowをはじめとしたPythonの科学技術系のライブラリを使った上での知識があるのかな?
簡単な解説で理解した気になってるだけでは