Synthesizer V Part6 【ワッチョイ有】

**292** (ﾜｯﾁｮｲ 33b2-pDLy) · 2023/12/29(金) 10:13:24.55

>>292で
AIでピッチだけでなく声色のダイナミクスを囁きからがなりまで変化させられないかと書いたんだけど
それには歌詞の意味や感情を加味しないと難しいかなと思っていたら中国のアプリのこんな記事が

「深層学習を用いて収集したデータから音高や音色、拍子、語彙（ごい）、感情といった特徴を抽出する。
そして、抽出された特徴を活用してモデルに学習させていく。」

中国のアプリでは感情まで抽出しているらしい
このAIの歌声を聴いたことがないのであれだけど
カンルさんがAI歌声合成の世界トップランナーだと思っているけど
母国のアプリもなかなか無視できないんじゃないですか？

https://japan.zdnet.com/article/35213184/