あ、音声モニタリングは関係ないわ
実際動画流して歌ってみたりしてズレたら数値いじってってやればいいよ