お世話になります

動画データを読み込むだけで、音声を、そのまま字幕としてつけるソフトウェアはないでしょうか

一応自分でも考えてみたのですが、人の話す言葉を「あ」を「あ」と認識し字幕するだけではなく土を踏む音「ザッ」を認識するソフトがほしいです