X



トップページDTM@2ch掲示板
1002コメント332KB

歌声合成ソフト『 CeVIO 』総合スレ Part.7

■ このスレッドは過去ログ倉庫に格納されています
0001名無しサンプリング@48kHz (オイコラミネオ MM3f-tkhL)
垢版 |
2021/02/16(火) 11:21:43.80ID:snO0cx8mM
!extend:checked:vvvvv:1000:512
!extend:checked:vvvvv:1000:512

CeVIO Creative Studio / CeVIO AI / CeVIO Pro(仮称)に関する情報交換を目的としたスレです。

【「CeVIO」とは?】
「CeVIO(チェビオ)」とは、UGC(User Generated Contents、ユーザー生成コンテンツ)を支援するために生まれた、これまでに無いエンターテイメントを創出する新しいプロジェクトです。
魅力的なキャラクターを生み出す映像・音楽のクリエイター集団と、豊かな感情表現が可能な音声合成技術・歌声合成技術を持つ技術者集団の融合によって生まれました。

CeVIO Creative Studio:CeVIOプロジェクト
https://cevio.jp

ONE -ARIA ON THE PLANETES-(オネ):1st PLACE株式会社
http://1stplace.co.jp/software/cevio/

IA ENGLISH C -ARIA ON THE PLANETES-:1st PLACE株式会社
http://1stplace.co.jp/software/cevio/ia_english_c/

Color Voice Series:株式会社エクシング
http://camp.joysound.com/colorvoice/

CeVIO AI 結月ゆかり 麗:テクノスピーチ
https://www.techno-speech-products.com/cevio-ai-yuzuki-yukari-rei

CeVIO AI 東北きりたん ソングボイス:AHS
https://www.ah-soft.com/cevio/kiritan/

前スレ:
歌声合成ソフト『 CeVIO Creative Studio 』 Part.6
https://egg.5ch.net/test/read.cgi/dtm/1591853594/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured
0154名無しサンプリング@48kHz (ワッチョイ 6b1f-0pr0)
垢版 |
2021/04/05(月) 23:42:15.34ID:ZYLRQyxG0
>>128
ふと思ったけどwavenet系を使ってないのは恐らく動作が重くなるからだと思うけど仮に個人のPCで実用に耐えうる程度の軽さにできた場合に今のCeVIO AIを更新して追加するのかproみたいに新しいソフト限定になっちゃうのか気になる
ソングもトークもwavenetで今より一段とクオリティ上がるだろうしそもそも従来のwavenetよりクオリティ上げて軽くできるボコーダの研究とか発表してたよね
こいつが搭載されて初めてCeVIO AIのスタート地点な気がする
0159名無しサンプリング@48kHz (ワッチョイ 4d8e-KN+/)
垢版 |
2021/04/06(火) 15:53:23.08ID:cM9FnBKd0
wavenetはGPU使ってRTF 200ぐらいだから
5分の歌で16時間とかかかるから使えないけど

今開発してるであろうWaveGAN系なら
CPU 1コアでRTF 2ぐらいだからリアルタイムで行ける。
WaveGANはwavenetの遠い親戚みたいなもん

WaveGAN(PWG)はMSのHiFiSingerにも使われたし
PERIODNETもWaveGANベース。
ベータでもいいから載せてくれって感じ。

PERIODNET
https://arxiv.org/abs/2102.07786

In this paper, we incorporate Parallel WaveGAN [16]-based framework
into our non-AR baseline and proposed models, as shown in
Fig. 1(b), Fig. 1(c), and Fig. 1(d). Each generator has the
same architecture as the generator of [16],
which is a modified WaveNet-basedmodel with non-causal convolution.
0164名無しサンプリング@48kHz (ワッチョイ a21f-CoCA)
垢版 |
2021/04/15(木) 22:29:53.85ID:4Ly2x/DU0
proがサブスクライブになった場合どれだけ受け入れられるのかは気になるね
たくさん使う人はいいけどそうじゃない人は手が出にくそう
もしproだけwavenetとかテクノスピーチが論文出してるPeriodNetが使われたりしたら個人でも使いたい人が出てくるのかな?
0167名無しサンプリング@48kHz (ササクッテロラ Sp5f-FELZ)
垢版 |
2021/04/15(木) 23:37:23.16ID:LQ4rC25hp
アイドルをプロデュースしてるのもおっさんばかりだし
エロ漫画描いてるのもおっさん多いし
おっさんが好きなことはおっさんがよく知ってるから
うまいこと回してるんだろうけど
よく考えるとおぞましい世界だよねw
0168名無しサンプリング@48kHz (ワッチョイ 9b8e-LdNq)
垢版 |
2021/04/15(木) 23:44:56.28ID:iHr/64Bt0
>>160
それとほぼ同じ論文が
Deep neural network based real-time speech vocoder
with periodic and aperiodic inputs



showed that using an NVIDIA GTX 1080, speech
was synthesized at approximately five-times faster than realtime.


5分で10時間(600分)が
600倍高速化して5分が1分 RTF 0.2

600倍というのは、これに合わせて
分かりやすく説明したんだろう
0171名無しサンプリング@48kHz (ワッチョイ 175a-lTA+)
垢版 |
2021/04/16(金) 08:59:29.27ID:QyeiOYtt0
Speech synthesis(と言っていいのかよくわからないけど)の世界は、シンセシスというよりはコーデックの一種であるかのように元のスピーチを忠実に再現する方向にどんどん進展しているんだね。

仮にここで合成パラメータを変えたら、きっとまるで高度なフェイズヴォコーダ・アルゴリズムでエフェクト処理を掛けたかのような音の変化を、たとえば発音単位で細かく制御したかのような効果が得られるのだろうけど、実際その辺はどうなのか興味深い。

そして歌声合成で合成パラメータを変える時は、どういった変化が望まれるのか?
将来の行き先がどこなのか興味深い
0172名無しサンプリング@48kHz (ワッチョイ 17b1-dTST)
垢版 |
2021/04/20(火) 08:06:56.01ID:obhwMbxE0
ここってトークボイスの話題もおk?

さとうささらの「つ」の発音が上手く調整できなくて困ってるんだ
「緩急をつけて」と喋らせようとすると「緩急をっつけて」みたいに小さい「つ」が入ったような詰まった発音になってしまう
「ts」と「u」の長さを調整しても詰まった感じになる

「つき」なら自然だけど「つけて」になると途端に不自然になってしまう……

すずきつづみだと問題無く喋ってくれるんだが
0174名無しサンプリング@48kHz (ワッチョイ 17b1-dTST)
垢版 |
2021/04/20(火) 08:37:15.70ID:obhwMbxE0
>>173
なっちゃうものなのか
ってことはおそらくサポートにもそういう報告が入ってるけど直ってないんだよな
あと「よ」も母音が弱くて不自然だけどこれは調整でなんとかなる感じだわ

「と」「ん」はどんなときにおかしくなる?
今のところ大体大丈夫なんだけど
0176名無しサンプリング@48kHz (ブーイモ MM9b-kXRq)
垢版 |
2021/04/20(火) 14:31:59.22ID:hq8WT2/sM
>>174
ライトユーザーなので詳しい事は分からないですが
母音+ん の時かなあ
やたらと2音の時間が短くてくそ早口に感じたり
つ も下手したら チュ の方が近く感じます
韓国人かよとw
0178名無しサンプリング@48kHz (ワッチョイ 17b1-dTST)
垢版 |
2021/04/21(水) 12:17:11.36ID:Nxa7JEWB0
体験版はささらちゃんで遊んでたけど製品版は小春六花ちゃん買ってきたぞ!
これキャラごとにだいぶ調声の仕方が違うんだな
「あっ!」とか「おっ!」とか言わせる難易度がめちゃくちゃ上がったんだが
0182名無しサンプリング@48kHz (ワッチョイ 17b1-dTST)
垢版 |
2021/04/21(水) 17:05:17.31ID:Nxa7JEWB0
>>179
ありがとう知らない機能がいくつかあった!
けど小春六花ちゃんの記述はやっぱりまだ少ないんだね
普通のセリフだと単語登録と軽く音素や発声時間を弄るだけでかなりそれっぽく喋ってくれるけど
「あっ!」とか「ふふっ」みたいな短いセリフの感情表現をさせるのは難しいなあ
0184名無しサンプリング@48kHz (ワッチョイ 7794-KAGY)
垢版 |
2021/04/21(水) 21:57:45.78ID:XyCBxn+z0
>>183
どの程度の確度かわからんけど予定として目標日程は決まってるってこと?
それとも必達の日程として確定させてるってこと?
0190名無しサンプリング@48kHz (ワッチョイ 01b1-Nexr)
垢版 |
2021/04/23(金) 14:44:42.06ID:UKrcQT2N0
>>189
ああ
楽しかった

って分ければなんとかなりそうだけど
「ああ」にノイズが走ったり「楽しかった」と声が合わなかったりでなかなか難しい
何か方法はあるんだろうけど一筋縄にはいかない感じだ……
0191名無しサンプリング@48kHz (スププ Sd70-SXW7)
垢版 |
2021/04/26(月) 14:55:37.40ID:7eD9iU8Rd
CeVIOproのデモ動画短くていいから定期的に出してほしいなぁ
買い控えに繋がっちゃうかもしれないけどこういう取り組みしてるんだってのはアピールしていいと思う
0194名無しサンプリング@48kHz (ワッチョイ 381f-RJlf)
垢版 |
2021/04/27(火) 10:58:30.47ID:KEc67PbP0
CoeFontもまだクリアな感じが足りない気がするけどフットワーク軽そうだから伸びてくるだろうな
CeVIOProを出すのに2年以上かかるようなのんびりさではこれからたけのこのように湧くであろう新興勢力に飲まれそうな気がする
PeriodNetの実装頑張ってくれ
0196名無しサンプリング@48kHz (ワッチョイ 3f76-HPFo)
垢版 |
2021/04/27(火) 12:40:45.99ID:AUTRJu910
声フォント、収録音源のノイズ取って無いのかイヤホンで聞くとギャーピー聞こえるんだよな。
アマチュアが個人で作ってるAIトークでもそこらへん問題にしてたけど。

あと多分GPUぶん回してクオリティ上げてる気がする。
0198名無しサンプリング@48kHz (ワッチョイ 381f-vn0/)
垢版 |
2021/04/27(火) 16:16:04.28ID:KEc67PbP0
GPUを使うかどうかは生成の速度には関わってくるけど声の曇りそのものには関係ないよ
例えば新論文のベースになってるParallelwaveGANはGPUには及ばないけどCPUでも処理できる
0201名無しサンプリング@48kHz (ワッチョイ 1d8e-R0M4)
垢版 |
2021/04/29(木) 07:34:27.78ID:57Yco9Q/0
>>196
Waveform Generator(Waveなんちゃら系)は
PCMのサンプルを直接推定してるから量子化ノイズが出る

オリジナルのWaveNetはμ-lawの8bitサンプルを
推定してたからもっとノイズ乗った。
2018年のテクノスピーチのデモにもノイズ乗ってる。
0211名無しサンプリング@48kHz (ワッチョイ c794-uN1F)
垢版 |
2021/04/30(金) 17:48:36.24ID:Bk1Zj9yx0
現在も鋭意開発中ってことは7月にリリースという名のベータテストが始まるって雰囲気だろな
CeVIOユーザーはベータテストに慣れてるから何ら問題はない
むしろ積極的に人柱になって協力する
0221名無しサンプリング@48kHz (ワッチョイ 0758-YF1U)
垢版 |
2021/05/01(土) 01:55:27.74ID:QqO+4vc70
ささらの発売日は決まったけど他の2名は無理じゃね?
ささらひとりでこんだけ遅れるということは中の人が別ならまた苦労するでしょ
声質をすり替えただけで作ってるならともかく。
0222名無しサンプリング@48kHz (ワッチョイ df1f-OedE)
垢版 |
2021/05/01(土) 02:54:20.58ID:wfQ9C5ip0
IAとONEはCS用のデータをそのまま使ってると言ってるしデータそのものはささらも同じじゃないかな
同じデータでも今まで通りの声にはならなかったから時間掛かったと1stPlaceの代表は言ってたからささらも同じことが起きてそう
CeVIOProのデモ動画ではそんなふうには聞こえなかったけど
0234名無しサンプリング@48kHz (ワッチョイ c71f-j2Dz)
垢版 |
2021/05/18(火) 14:09:26.37ID:FkGD9Th50
予定では初夏って言ってるけど予定通り行くのか
IA英語とONEは既存データを使うのかもしれないけどIAの日本語は新録になるだろうから調整に時間掛かりそうな気がする
6月後半からマキ可不ささらとリリースも続くしタイミングが難しそう
0239名無しサンプリング@48kHz (ワッチョイ c71f-j2Dz)
垢版 |
2021/05/19(水) 02:31:06.81ID:BKxpbBBJ0
ソングもトークも推定エラーを直してできるだけ震えやこもり声を減らしたとしても
新しいニューラルボコーダが搭載されない限り根本的な限界はどうにもならないような気はする
たぶんProに積むんだろうけどスピード感もってやらないと先に競合ソフトが出てきちゃうんじゃないかな
0240名無しサンプリング@48kHz (ワッチョイ 0f58-AYRO)
垢版 |
2021/05/19(水) 03:53:17.42ID:kt8x7qFt0
とにかくアートに尽きる歌唱分野は、多少の粗があるかどうかよりもパッケージのトータルで
ユーザが欲しい品質であるかどうかと、受け入れられる使用条件になっているかで市場での
勝敗が決まると思う。使えなければ始まらないので先行利益が大きいのも当然だ。
ただ、固定ファンを裏切るほど品質が低いとそこで終わってしまうことも事実なので、どうせ
遅れるなら品質を上げる方に時間とリソースをなるべく費やした方がいい。

小回りが効く開発体制を取っているNEUTRINOには速さで勝つことはできないだろう。
0244名無しサンプリング@48kHz (ワッチョイ d933-0qpL)
垢版 |
2021/05/19(水) 22:43:22.49ID:V//3+Z6s0
発売前日/当日にサンプル出されても、予約してた人には間に合わなかったんだわ
邪神像の時「お値段以上の価値」を強調しといて、無料のAI音声CoeFontに33-4で敗北
「ファンを待たせられない」と投げ売りして投資資金回収をごまかすより、何年でも延期してくれた方がブランドは守れた
まあ次から1st placeのは予約とかせず慎重にやるわ
0253名無しサンプリング@48kHz (ワッチョイ 5ddc-Z5Cr)
垢版 |
2021/06/04(金) 15:51:29.96ID:OzsDNJVj0
この業界当たり前のように体験版なしをやってくるからなぁ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況