【AI】立教大、フーリエ変換を用いて大量のメモリが不要な画像認識の新手法を開発 [すらいむ★]

■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
垢版 |
2024/02/08(木) 22:59:14.50ID:RxO0nQRL
立教大、フーリエ変換を用いて大量のメモリが不要な画像認識の新手法を開発

 立教大学は2月6日、音声や画像のような信号を異なる周波数の成分に分解する数学的手法「フーリエ変換」を用いて、「グローバルフィルタ」と「注意機構」のメリットを兼ね備えた、大量のメモリを必要としない新しい画像認識手法を開発したことを発表した。

(以下略、続きはソースでご確認ください)

マイナビニュース 2024/02/07 15:23
https://news.mynavi.jp/techplus/article/20240207-2879063/

プレプリント
FFT-based Dynamic Token Mixer for Vision
https://arxiv.org/abs/2303.03932
2024/02/09(金) 00:32:31.65ID:dKZRcgv6
こりゃすげええええ!!!

アフォのようにコンボリューションコンボリューション
いやリカレントだ!GANだ!トランスフォーマーだ!!!
とメモリドカ食いの連続で画像解析してたところで

「畳み込みのフィルター自体を動的生成したら?」
だもん
そしてそのフィルター生成に、画像タイプごとにフーリエ変換を使うか

https://github.com/okojoalg/dfformer
こちらにgithub
今や論文と同じくらいgithubのリポジトリが大事だな
2024/02/09(金) 00:52:08.43ID:dKZRcgv6
生成AIだとU-netという方法で逆畳み込みなんて方法も使うが
ここでその逆畳み込みのフィルターもフーリエ変換で出来たら面白いがちょっと難しいか???

必死になってNVIDIAの独占するVRAMも大きいが値段も凄いGPU買ってたのが
「こんなの4GBのVRAMでいいじゃん」ってなったらそりゃ嬉しい事か
■ このスレッドは過去ログ倉庫に格納されています