歌声合成ソフト『 CeVIO Creative Studio 』 Part.5
■ このスレッドは過去ログ倉庫に格納されています
CeVIOに関する情報交換を目的としたスレです。
【「CeVIO」とは?】
「CeVIO(チェビオ)」とは、UGC(User Generated Contents、ユーザー生成コンテンツ)を支援するために生まれた、これまでに無いエンターテイメントを創出する新しいプロジェクトです。
魅力的なキャラクターを生み出す映像・音楽のクリエイター集団と、豊かな感情表現が可能な音声合成技術・歌声合成技術を持つ技術者集団の融合によって生まれました。
CeVIO Creative Studio:CeVIOプロジェクト
http://cevio.jp
ONE -ARIA ON THE PLANETES-(オネ):1st PLACE株式会社
http://1stplace.co.jp/software/cevio/
Color Voice Series:株式会社エクシング
http://camp.joysound.com/colorvoice/
HMM/DNN歌声合成システム:Sinsy
http://www.sinsy.jp/
前スレ:
歌声合成ソフト『 CeVIO Creative Studio 』 Part.4
https://egg.5ch.net/test/read.cgi/dtm/1468540727/ 歌い方の癖をユーザー側で直せるのかどうか分からないけどDAWで音程と声量微調整すれば
こういう歌い方する歌手と言い張って済みそうだよ 完成度高いのはありがたいけど自由度も高くしてほしいんだよな
どれ歌っても同じ調子じゃ困る 歌い方を変えるパラメータの実現には長い道のりがありそうだけどね
これまでどおり曲の方を歌手に合わせる作り方がベターでしょう 直感では水瀬いのりさんの歌い方の癖とは違うような気がする。
声はささらと分かるけど、新しい中の人誰なんだ 深層学習で歌い方を学習したのだから中の人というか
お手本によっていくらでもバリエーションは増やせるはず えっこれ機械?ってなるような歌い方して怖い
技術革新ってすごいな そもそも俺達側に回ってくる?
企業専用とかはないよね… 深層学習だと中の人のパラメータがどんだけ生き残ってるのかもよく分からないな
これならタカハシの中の人問題はまるっと解決するわ ソングエンジンのバージョンアップなら嬉しいけど
別物になるならお高いんでしょう ソフトウェア自体の値段は問題にならないと思う
ワークステーション級GPUを買うとそれだけで普及帯SSDで10TBの爆速RAIDが組めるか
メインメモリ256GB積めるかというような事態が発生することの方がよほどヤバイ。
研究所で使うマシンの性能が低いわけがないからね 冷静に考えたらGPUぶん回す爆音機材を置いてDTMなんかやってられるわけがなかった。
別室に隔離できない人バイバイ案件。
>>260で指摘のとおりサーバー利用のサブスクリプションでスロースタートアップするしかなさそうだ。
月額いくらになるのかなあ・・・ ユーザーが学習させるわけでもなく、リアルタイム歌唱させるわけでもないのに、何故GPUの話になるのかと
そんなに重いNNになると思うか? 学習結果使い回せることを知らないんじゃない
プログラミング知らない人ならそういう理解の仕方になってもしゃーない 何でも何も開発者がそう言ってるんだからそうなんだろ レンダリングにGPUでそれなりの時間がかかると公式に書いてあるけども。
リアルタイム歌唱やDAW連携はもともとCeVIOでは最も苦手な分野だろうから置いておくとして
微調整のたびに結構待たされるというなら、学習結果から歌い方の癖の部分は除去できるようにして
これまで同様にタイミングとピッチとダイナミクスをゴリゴリ手書きするようにしてほしい。
デキる人は画面の曲線と耳で合成結果を予測して調整追い込むだろうから。 CeVIO作ったとこじゃんと思って聞いたらやっぱりCeVIOの進化系だったね 今回のが隠れマルコフモデルやHMMとは直接関係あるのか分からないけど3月の学会で明かされるのかな >>281 HMMと書いたのは間違いでSinsyね。 ニューハルオロイドまだか。大阪万博には間に合わせてね。 New CeVIOはVSTiかReWire対応でお願い ボカロですらReWireはβ対応なのに贅沢言ったらダメ テクノスピーチのサンプル聞いてきたわ
IA-Englishがやべえな
来年夏ごろ発売だろうか トークの声質も同レベルまで引き上げてくれないとバランスが… 人工音声を人と遜色ないレベルまで持って行くのが目標だろうから
当然トークの性能も上がるんじゃね デモはベタ打ちだからな
ちょっと手直しするだけで十分になりそうなら上出来じゃないかな >>283
デモの音声を聴くと、歌唱ソフト独特のこもるような声にならないところがいいね
あと Diamonds のアカペラは、「けーしきが みたーい」 の節回しが水瀬いのりっぽい 発売は「パッケージ」「クラウド」「既存サービスへの組み込み」か。
使い慣れているCEVIOのバージョンアップがいいな。 CeVIOじゃなくなっても買うけど、クラウドベースだとCeVIOなら大改修することになるだろうなあ
クラウドを使うためのサブスクリプションアカウント認証システムと、クラウドとの絶え間ないやりとり
どっちもソフト屋さんには結構な負担だと思う 流石に無料アプデじゃなくて金取ってもいいと思う
高すぎるときついけど ローカルでやるもんだと思うけどなぁ
レンダリングにはそこまでパワーいらんやろーし SinsyのDNN謡子のカチカチ山で10秒ほど待たされることを考えると相当深い隠れマルコフを解析しないと
あの精密な歌声が出せないのだと思うけど DNN対応なのにHMM連呼してしまう分別の無さがアレ 機械学習に関わる二つのキーワードを
明確なソースもなく繋ぎ合わせていくのは
妄念と言うしかないだろう 妄念でもあてずっぽうでもなんでもいいけど隠れマルコフの多段層の深度や確率変数重み付けの決定に
ディープラーニングを使ったものと自分の中では理解したから今度の学会で詳細が発表されたらもう少し
勉強できるかなと思っている。 歌い方の学習であって声質の合成には関係ないんじゃないの
例えるなら、ボカリスに必要だったお手本をディープラーニングに任せたものだと思うけど それだと既存の方式の意味が分からなくてね。
これまでも歌い方としてアクセントの付け方などボカロよりはメリハリ付けて上手に歌ってたと思うのだけど
今回の音声波形の解像度アップも同じ理屈で、ただしさらに詳細な自動解析を経て実現できたのかなと。 新システムについては3月の日本音響学会春期研究発表会にて発表だそうだが、
これと関係あるのかな?
明日(9月12日)日本音響学会秋季研究発表会にて、ビブラート、タイミングモデル等を
含むシステム全体をDNNに基づいて構成した歌声合成システムについて発表します。
「Deep Neural Network に基づく歌声合成システム -- Sinsy」 なんともいえない
Sinsyとは発表者が違うだろうし 発表者はこんな感じ
Deep Neural Network に基づく歌声合成システム -- Sinsy
☆法野 行哉,村田 舜馬,中村 和寛(テクノスピーチ),橋本 佳,大浦 圭一郎,南角 吉彦,徳田 恵一(名工大) これが初期研究かな。2017年のもの。
歌い手の声質・歌い方を自動で学習・再現できる統計モデルに基づく歌声合
成システム
代表研究者 徳 田 恵 一 名古屋工業大学大学院 教授
共同研究者 南 角 吉 彦 名古屋工業大学大学院 准教授
共同研究者 大 浦 圭 一 郎 名古屋工業大学大学院 特任准教授
https://www.taf.or.jp/files/items/746/File/049.pdf 関係はありそうだね
でも重要技術については団体毎に共同特許とかであらかじめ押さえておくだろうから
発表団体が変わるなら全く同一のテクノロジーは持ち出さないのではないだろうか 大浦圭一郎率いるテクノスピーチは名工大の学内ベンチャーなことに留意する必要があるね。
名工大 国際音声言語技術研究所にも参画機関として名を連ねているし。今回の発表も共同で
行われている。別団体とはいえ関係は深い。
https://www.nitech.ac.jp/research/project/splabo.html CeVIOが失敗したのは、公開当初の厳しい縛りと高額な権利料が原因だった
とはいえ、その点はかなり改善されたし、技術的には利用分野の裾野が広い
市場だから、これからも巻き返しできるチャンスは大いにあるはず 名工大のトークはここまで行ってるからなあ。
http://www.sp.nitech.ac.jp/~swdkei/syn/Blizzard_2018/ Cevioを起動したら、ウィンドウの左側が真っ白で右側が真っ黒で何も表示されなくなってしまった
右クリックすると「トラックを追加」とかのメニューが表示されるので存在はしているのだろうけれど、
これどうやったら治るん?
ちなみにソフトをクリーンインストールして再インストールしたり、バージョンを下げても同じ症状だった >>316
imgurでいいのかしら?
https://imgur.com/a/efFNw9O
ノートPCだし、グラボとも思えん気がするんよ 多分関係ないと思うけど、起動したままで画面の解像度変えてみるとか 最近追加した他のソフトやらデバイスのドライバやらと干渉してるのでは? みんなありがとう。
>>318
.NET Frameworkの修復というのを試してみたけれど不発
他のバージョンのものもインストールしたり、Windows Updateをやり直したりしてみたけれどだめ
>>319
解像度を変えてみたり、外部ディスプレイにしてみたりしたけれど駄目
>>320
システムの復元を試してみたけれど、駄目っぽい
セーフモードで起動しても同様
もうこの際Windowsをクリーンインストールしような…… 一応、今の状況を公式から詳細報告したらいいと思う
対応に日にちかかるからそれまでに自己解決するかもだが 公式へ問い合わせた方がいいね。
画像込みでメールすると良いよ。
メインメモリもしくはグラフィックメモリが圧迫されてるのかなとも思えるけど。 タスクマネージャなりリソースモニタでプロセスがどうなってるか見るのはいいかもね C:\Users\ユーザー名\AppData\Local\CeVIO のフォルダ内に
ログファイルが作られているはずだから、アプリの起動と認証が上手く行っているか
(ログファイルはメモ帳で開けるので) 確認しておくと良いかもしれない ソフトの場合は、売れなくなったらオープンソースとして無料開放されることで世の中に浸透する
という第二の人生もあるから、商品として失敗したからそこで終わりというわけでもない 敗北主義者はセール中のボカロでも買って移住したらどうだ? 一番手っ取り早いなw
でも、自作曲すら上手く歌えないなあ そりゃ相当の練習しないとねえ
結局はDAWでむちゃくちゃ調教して盛ることになるよ まずは、入力したCeVIOにあわせて歌うところから始める つまり、CeVIOに弟子入りするところから始めると.... Vocaloid5でやらかしているうち、この半年以内にNew CeVIOになれば勝機あるで リアル路線になるならVOCALOID市場で発表しない方がいいよ
ボカロは昔ながらの非人間丸出しじゃないとウケないから新たに開拓しないとだめだ NewCevioはだいぶ先の話じゃないかなぁ
早くても来年ぐらいな気がするけど うん、CeVIOはサポートもアップデートも続けてくれているからね
バージョンアップによる旧ユーザーの切り捨てもない ボイスドラマとか実況動画作ろうと思ってcevio買ったんだが今のバージョンだとnicotalk使えないってことでええの? ハルオロイドで励磁音再現するアレどうやってるんだろう・・・ >>345
いま、nicotalkはCeVIOの音声作成の部分でエラーとなり、セリフのWaveファイルが
作れない状態になっている。
しかし、この部分だけを手動で作ってあげるようにすれば、あとは動画ファイルを作る
ところまで、nicotalkで正常に作業させることができる。
具体的に言うと、台本.txtを作る Step1.exe と、動画ファイルを作る Step3.exe は正常。
台本.txt の内容をCeVIOでWave音声に変換する Step2.exe が正常に動作しないため、
そこだけを、CeVIOを使い自分で作業する必要がある。
といっても、どのみち調声は必要だし、調声に手間をかければそれだけ出来あがりも
良くなるので、この部分を手作業で行うのは悪いことじゃない。
というわけで、こちらは、いまもふつうにnicotalkでCeVIO(ささら)を利用している。 >>347
ていねていね丁寧にありがとう
とりあえず動画作りそのものの手順確認のため
ベタ手打ちで一本作ってみたから流れはなんとなくわかりました。
2以外の工程が省けるなら確かに便利そうですね。使ってみます。 >>337 64bitVST、AU、AAX対応音源化すれば一発あるかも
出来次第じゃ仮歌さんに渡すボーカルガイドには出来そう
エディタ入力の出来次第かな
リアルタイム録音だとノートの重なりの問題が出るから、
ステップ入力が出来て鍵盤を弾いた時に音程の確認、鍵盤押さえてる間にマウスで音符の長さを選択出来て
鍵盤を離さなければ弾き間違えても最後に押した鍵盤が反映される
って事が出来たら作業が捗るので
もしVST音源化してDAW上で入力出来て、MIDI鍵で簡単にステップ入力が出来るなら俺は買う
あーそれとジョイサウンドが出したような作りが雑なライブラリはもう勘弁な、SSDの肥やしになってるから あれ使ったことないけど雑だったんだ
ジョイサウンドが出してるから実用的なのかと思ってた IA 7th & ONE 4th Anniversary -Special Talk & Live-
2019/01/27(日) 開場:18:50 開演:19:00
http://live.nicovideo.jp/watch/lv317975257?ref=qtimetable&zroute=index
藤田 茜・三澤紗千香・千本木彩花出演◆ラブコメRPG『エンゲージプリンセス』公式生放送〜vol.4〜
2019/01/27(日) 開場:21:35 開演:21:45
http://live.nicovideo.jp/watch/lv317452871?ref=qtimetable&zroute=index 1st Placeぇ…あんな設定盛られたらボーカルとして使いづらいじゃないか なんか、ショートカットキーのスペースで再生とかストップが、動作するときとしないときあるの
どういう違いがあるの?
なんかちょっとした違いで動作したりしなかったりしてわからないんだけど >>356
そう、それで全角半角を切り替えればいいのかもしれないんだけど
切り替えられないことが多いんだよね
そこがわからない
何度押しても切り替えられない!と思ったら、突然切り替えが効くようになったりとか こんなものあったのかDTMステーションで初めて知ったよ。クーポン使って半額位で買えたよ楽しませてもらいますわ おう楽しんでくれ。マイナーだけど性能はいいぞ
ささらより高めだがONEやIA Englishを使うとさらに歌唱性能が伸びる ■ このスレッドは過去ログ倉庫に格納されています