もう画像処理はいいから音声処理にも手を広げてくれ
音声抽出、文字起こし、人物聞き分け、音声生成
これが出来たら完璧なんだ