歌声合成ソフト『 CeVIO 』総合スレ Part.7
■ このスレッドは過去ログ倉庫に格納されています
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512
CeVIO Creative Studio / CeVIO AI / CeVIO Pro(仮称)に関する情報交換を目的としたスレです。
【「CeVIO」とは?】
「CeVIO(チェビオ)」とは、UGC(User Generated Contents、ユーザー生成コンテンツ)を支援するために生まれた、これまでに無いエンターテイメントを創出する新しいプロジェクトです。
魅力的なキャラクターを生み出す映像・音楽のクリエイター集団と、豊かな感情表現が可能な音声合成技術・歌声合成技術を持つ技術者集団の融合によって生まれました。
CeVIO Creative Studio:CeVIOプロジェクト
https://cevio.jp
ONE -ARIA ON THE PLANETES-(オネ):1st PLACE株式会社
http://1stplace.co.jp/software/cevio/
IA ENGLISH C -ARIA ON THE PLANETES-:1st PLACE株式会社
http://1stplace.co.jp/software/cevio/ia_english_c/
Color Voice Series:株式会社エクシング
http://camp.joysound.com/colorvoice/
CeVIO AI 結月ゆかり 麗:テクノスピーチ
https://www.techno-speech-products.com/cevio-ai-yuzuki-yukari-rei
CeVIO AI 東北きりたん ソングボイス:AHS
https://www.ah-soft.com/cevio/kiritan/
前スレ:
歌声合成ソフト『 CeVIO Creative Studio 』 Part.6
https://egg.5ch.net/test/read.cgi/dtm/1591853594/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured >>128
ふと思ったけどwavenet系を使ってないのは恐らく動作が重くなるからだと思うけど仮に個人のPCで実用に耐えうる程度の軽さにできた場合に今のCeVIO AIを更新して追加するのかproみたいに新しいソフト限定になっちゃうのか気になる
ソングもトークもwavenetで今より一段とクオリティ上がるだろうしそもそも従来のwavenetよりクオリティ上げて軽くできるボコーダの研究とか発表してたよね
こいつが搭載されて初めてCeVIO AIのスタート地点な気がする >>152
一応CEVIO AIはCEVIO CSからバージョンを引き継いで8扱いだから
CEVIO CSを今後更新しないなら移行を促す施策をした方がってのはあるんだけどね
Proの扱いがどうなるかにもよるけど OSのアップデートで旧版が動かなくなるのが怖いな
当分大丈夫だと思うけど まだ出ていない本家はまだしも
旧版と明記せずにしれっとセール宣伝してたのはどうかと思いますふぁっぷれさん それは俺もそう思ったが、まあ違法ではないので・・・ wavenetはGPU使ってRTF 200ぐらいだから
5分の歌で16時間とかかかるから使えないけど
今開発してるであろうWaveGAN系なら
CPU 1コアでRTF 2ぐらいだからリアルタイムで行ける。
WaveGANはwavenetの遠い親戚みたいなもん
WaveGAN(PWG)はMSのHiFiSingerにも使われたし
PERIODNETもWaveGANベース。
ベータでもいいから載せてくれって感じ。
PERIODNET
https://arxiv.org/abs/2102.07786
In this paper, we incorporate Parallel WaveGAN [16]-based framework
into our non-AR baseline and proposed models, as shown in
Fig. 1(b), Fig. 1(c), and Fig. 1(d). Each generator has the
same architecture as the generator of [16],
which is a modified WaveNet-basedmodel with non-causal convolution. 2019年の時点でテクノスピーチが日本語でも発表してたよね
結論として実時間より早くてwavenetより自然な波形
学習外の音も生成可能
https://w.atwiki.jp/ceviouser/pages/53.html 可愛い女の子達を扱うボイチェビの公式配信で、
髪の薄いおっさん達の画面占有に耐えねばならぬというのか いつも思うけどVtuber的なことをした方がいい公式の中の人さんも世の中には多いと思う
まあ業界では顔の知れた方で、ってのはよくあるんだけども proがサブスクライブになった場合どれだけ受け入れられるのかは気になるね
たくさん使う人はいいけどそうじゃない人は手が出にくそう
もしproだけwavenetとかテクノスピーチが論文出してるPeriodNetが使われたりしたら個人でも使いたい人が出てくるのかな? >>162
>>163
VTuberって中身おっさんでしょ
それ見てるここおっさんでしょ
それってもうインターフェスが違うだけで
ほぼおっさん同士がきもいやりとりしてるわけで
耐えられないよ アイドルをプロデュースしてるのもおっさんばかりだし
エロ漫画描いてるのもおっさん多いし
おっさんが好きなことはおっさんがよく知ってるから
うまいこと回してるんだろうけど
よく考えるとおぞましい世界だよねw >>160
それとほぼ同じ論文が
Deep neural network based real-time speech vocoder
with periodic and aperiodic inputs
で
showed that using an NVIDIA GTX 1080, speech
was synthesized at approximately five-times faster than realtime.
5分で10時間(600分)が
600倍高速化して5分が1分 RTF 0.2
600倍というのは、これに合わせて
分かりやすく説明したんだろう パラレルWaveGANのデモ聞いたけど凄いクオリティだね
PeriodNetがこれ並みがこれ以上なら現状のCeVIOAIとは…ってぐらい別物になりそう
でも既存の界隈からはリアルすぎて受けは悪いかもな
https://kan-bayashi.github.io/ParallelWaveGAN/ Speech synthesis(と言っていいのかよくわからないけど)の世界は、シンセシスというよりはコーデックの一種であるかのように元のスピーチを忠実に再現する方向にどんどん進展しているんだね。
仮にここで合成パラメータを変えたら、きっとまるで高度なフェイズヴォコーダ・アルゴリズムでエフェクト処理を掛けたかのような音の変化を、たとえば発音単位で細かく制御したかのような効果が得られるのだろうけど、実際その辺はどうなのか興味深い。
そして歌声合成で合成パラメータを変える時は、どういった変化が望まれるのか?
将来の行き先がどこなのか興味深い ここってトークボイスの話題もおk?
さとうささらの「つ」の発音が上手く調整できなくて困ってるんだ
「緩急をつけて」と喋らせようとすると「緩急をっつけて」みたいに小さい「つ」が入ったような詰まった発音になってしまう
「ts」と「u」の長さを調整しても詰まった感じになる
「つき」なら自然だけど「つけて」になると途端に不自然になってしまう……
すずきつづみだと問題無く喋ってくれるんだが >>173
なっちゃうものなのか
ってことはおそらくサポートにもそういう報告が入ってるけど直ってないんだよな
あと「よ」も母音が弱くて不自然だけどこれは調整でなんとかなる感じだわ
「と」「ん」はどんなときにおかしくなる?
今のところ大体大丈夫なんだけど >>174
ライトユーザーなので詳しい事は分からないですが
母音+ん の時かなあ
やたらと2音の時間が短くてくそ早口に感じたり
つ も下手したら チュ の方が近く感じます
韓国人かよとw なんとか「つけて」を自然に喋らせることが出来た……
>>176
怒り、哀しみを上げるとチュに近く感じるね 体験版はささらちゃんで遊んでたけど製品版は小春六花ちゃん買ってきたぞ!
これキャラごとにだいぶ調声の仕方が違うんだな
「あっ!」とか「おっ!」とか言わせる難易度がめちゃくちゃ上がったんだが >>178
ユーザーズガイドとか互助会wiki見るといいぞ AIのトークは触ってないけど、無印のノウハウ通用しない所とかありそう
ところでそろそろ初夏になりますが、ささらAIっていつなんですかね? >>179
ありがとう知らない機能がいくつかあった!
けど小春六花ちゃんの記述はやっぱりまだ少ないんだね
普通のセリフだと単語登録と軽く音素や発声時間を弄るだけでかなりそれっぽく喋ってくれるけど
「あっ!」とか「ふふっ」みたいな短いセリフの感情表現をさせるのは難しいなあ >>183
どの程度の確度かわからんけど予定として目標日程は決まってるってこと?
それとも必達の日程として確定させてるってこと? 決定してるけどまだ発表には至ってない
焦らされてるってことだよキーーッ!!!! >>181
花ちゃん出る前にNEUTRINOでヒメミコの音楽的同位体が先に出そう
同時に歌唱DBも公開されるので下手をするとAIきりたんの時みたいに花ちゃん出る前にCeVIO AIに移植される可能性も >>184
この前のAHS生放送で代表が日程は確定してるけどまだ言えないと言ってたよ 小春六花ちゃんを「あー」って単調に伸ばして喋らせるのが難しすぎる
うねるうねる
「あー、それも良いですねえ」みたいに喋らせたいのに! ああ で後ろのあを伸ばすのはダメかな
六花ちゃんは持ってないから分からないけど >>189
ああ
楽しかった
って分ければなんとかなりそうだけど
「ああ」にノイズが走ったり「楽しかった」と声が合わなかったりでなかなか難しい
何か方法はあるんだろうけど一筋縄にはいかない感じだ…… CeVIOproのデモ動画短くていいから定期的に出してほしいなぁ
買い控えに繋がっちゃうかもしれないけどこういう取り組みしてるんだってのはアピールしていいと思う CoeFontは完全にニューラルボコーダだな
ニューラルボコーダ化は止められない
テクノスピーチがプレミア付けようとしてる間に他がやる
出し惜しみしない方がいい ってもソングトーク共に法人がらみの開発もしてたしな
紐付きの技術が関わってるなら具体的なことが言えないなんてよくあること CoeFontもまだクリアな感じが足りない気がするけどフットワーク軽そうだから伸びてくるだろうな
CeVIOProを出すのに2年以上かかるようなのんびりさではこれからたけのこのように湧くであろう新興勢力に飲まれそうな気がする
PeriodNetの実装頑張ってくれ 声フォント、収録音源のノイズ取って無いのかイヤホンで聞くとギャーピー聞こえるんだよな。
アマチュアが個人で作ってるAIトークでもそこらへん問題にしてたけど。
あと多分GPUぶん回してクオリティ上げてる気がする。 GPU対応すれば小春六花トークのイヤホンマイク通したこもった様な声も改善されるのでは・・・?
NEUTRINO程度のクリア加減出てれば十分。 GPUを使うかどうかは生成の速度には関わってくるけど声の曇りそのものには関係ないよ
例えば新論文のベースになってるParallelwaveGANはGPUには及ばないけどCPUでも処理できる >>196
Waveform Generator(Waveなんちゃら系)は
PCMのサンプルを直接推定してるから量子化ノイズが出る
オリジナルのWaveNetはμ-lawの8bitサンプルを
推定してたからもっとノイズ乗った。
2018年のテクノスピーチのデモにもノイズ乗ってる。 NEUTRINOと比べたらなんでも高くなっちゃうよな
相手が悪すぎる デカいとMMDでの扱いが面倒だとなぜメーカーは学習しないのか? イラストレーターさんが自分の推し絵師さんだった
チラ見せで思ってたよりロリっぽい仕上がり 現在も鋭意開発中ってことは7月にリリースという名のベータテストが始まるって雰囲気だろな
CeVIOユーザーはベータテストに慣れてるから何ら問題はない
むしろ積極的に人柱になって協力する CeVIOはベクターのプロレジ大賞を何度も獲ってたっけな
それはともかくタカハシの新イラストおなしゃす ウエストじゃなくアンダーバストで縛るのは腰から下の太ましさを隠すためだと思う
別に胸を持ち上げる意図ではないかと 垂れ目になったせいか顔の印象もだいぶ変わった
片縛りの髪はクラウンだし勲章下げてるし
なんか旧CeVIOのささらとは別人になった感じがする ささらの発売日は決まったけど他の2名は無理じゃね?
ささらひとりでこんだけ遅れるということは中の人が別ならまた苦労するでしょ
声質をすり替えただけで作ってるならともかく。 IAとONEはCS用のデータをそのまま使ってると言ってるしデータそのものはささらも同じじゃないかな
同じデータでも今まで通りの声にはならなかったから時間掛かったと1stPlaceの代表は言ってたからささらも同じことが起きてそう
CeVIOProのデモ動画ではそんなふうには聞こえなかったけど これまでのところタカハシつづみの中の人情報は出てないからなあ
どうなってるんだろう たしか以前の開発中デモ動画ツイートで変な発声で開発苦戦してた希ガス 旧衣装からあれこれ付け足したくらいにしか思えないけどな ボーカルの弄り要素を付加しないと、差別化がないからなぁ 桜乃そら ナチュラル が割とどれも平均点だせる
他のは特融のクセがあるからなぁ・・・ 予定では初夏って言ってるけど予定通り行くのか
IA英語とONEは既存データを使うのかもしれないけどIAの日本語は新録になるだろうから調整に時間掛かりそうな気がする
6月後半からマキ可不ささらとリリースも続くしタイミングが難しそう 新録ならトークも新録か何かしてくれ
去年の全額返品になった35k邪神像並の出来なんだが
あれじゃソングもまるで期待できん 元々CeVIOのトークには期待するところがないよ
AIトークのが数段レベル高いからな A.I.VOICEはコーパスのままでAI要素は一切ないからね
ほぼVOICEROID2 AITalk 5のDNNの声って、CeVIO AIと比べてどうなんだろう?
まだ個人向け製品としては出てないけど ソングもトークも推定エラーを直してできるだけ震えやこもり声を減らしたとしても
新しいニューラルボコーダが搭載されない限り根本的な限界はどうにもならないような気はする
たぶんProに積むんだろうけどスピード感もってやらないと先に競合ソフトが出てきちゃうんじゃないかな とにかくアートに尽きる歌唱分野は、多少の粗があるかどうかよりもパッケージのトータルで
ユーザが欲しい品質であるかどうかと、受け入れられる使用条件になっているかで市場での
勝敗が決まると思う。使えなければ始まらないので先行利益が大きいのも当然だ。
ただ、固定ファンを裏切るほど品質が低いとそこで終わってしまうことも事実なので、どうせ
遅れるなら品質を上げる方に時間とリソースをなるべく費やした方がいい。
小回りが効く開発体制を取っているNEUTRINOには速さで勝つことはできないだろう。 要望したら? ブートキャンプ使ってくださいで終わりだと思うけども サンプル出してるんだしさすがに邪心像と同レベルの扱いはかわいそう 発売前日/当日にサンプル出されても、予約してた人には間に合わなかったんだわ
邪神像の時「お値段以上の価値」を強調しといて、無料のAI音声CoeFontに33-4で敗北
「ファンを待たせられない」と投げ売りして投資資金回収をごまかすより、何年でも延期してくれた方がブランドは守れた
まあ次から1st placeのは予約とかせず慎重にやるわ 予約するほど期待してないなこの界隈にはもう
ちょっと出音を聞いてもまだ不安要素がありまくる歌声合成では発売日に買うことすら躊躇するのが本音 きりたんが増えたけど花ちゃんが減ったのでプラスマイナス0っていう トークにロサという子を出したいらしいな
俺は今のところ新ささらトークすら需要がないわけだが トークの方の評判、競合製品と比べてあまり良くないように感じてるけど大丈夫なのかね
前バージョンより価格高めだからちょっと試してみるかとも思えず そういや8.1はどうなったんだ
全然音沙汰ないけど この業界当たり前のように体験版なしをやってくるからなぁ ■ このスレッドは過去ログ倉庫に格納されています