歌声合成ソフト『 CeVIO Creative Studio 』 Part.5
■ このスレッドは過去ログ倉庫に格納されています
CeVIOに関する情報交換を目的としたスレです。
【「CeVIO」とは?】
「CeVIO(チェビオ)」とは、UGC(User Generated Contents、ユーザー生成コンテンツ)を支援するために生まれた、これまでに無いエンターテイメントを創出する新しいプロジェクトです。
魅力的なキャラクターを生み出す映像・音楽のクリエイター集団と、豊かな感情表現が可能な音声合成技術・歌声合成技術を持つ技術者集団の融合によって生まれました。
CeVIO Creative Studio:CeVIOプロジェクト
http://cevio.jp
ONE -ARIA ON THE PLANETES-(オネ):1st PLACE株式会社
http://1stplace.co.jp/software/cevio/
Color Voice Series:株式会社エクシング
http://camp.joysound.com/colorvoice/
HMM/DNN歌声合成システム:Sinsy
http://www.sinsy.jp/
前スレ:
歌声合成ソフト『 CeVIO Creative Studio 』 Part.4
https://egg.5ch.net/test/read.cgi/dtm/1468540727/ やっぱDTM板だからトークの話は盛り上がらんねぇ
かくいう私もソングしか使わないわけだが ソングとトークをひとつの作品で両方使ってる人なかなかいないね。 ラップ調でトーク何回か使おうと試みたがソングで作った方がしっくりきた 僕も昨夜、CeVIOの存在を知りました☆
微妙な下手さ加減が生々しくて新鮮です。
DTMステーションのクーポン使ってゲットしてみます! ゲットしました☆
ダウンロードしたらヴァージョン4(最新ではない)というのはこれいかに?
起動していきなり6にアップデートしろとのお知らせがw
あと、英語版のお知らせも来てデモ聴きましたが、これはイマイチですね。
遊んでみます。 >>370
みずいろの雨 イイ
グッとくるね
CeVIOの取扱いは直感的で良いです
youtubeでCeVIO調声講座見て勉強中
MACやiosでも動けばなぁ・・
古いノートPC復活させました。
CeVIOのおかげで元取れそうっす できることが限られてる代わりに動作が軽いのはいいね >>370
情報ありがとうございます!
どれも凄く素敵に作っていますね☆
特にオリジナル曲には曲自体にも感動です。 >>370
ささらは楽曲が上手くはまると、すごく伸びやかな声が出るところも魅力
低音が苦手だから、少し高めの音域で歌わせるのがコツだよね
時を超えてゆくよ feat.さとうささら 【オリジナル曲】
https://www.youtube.com/watch?v=v_Vp_8jQVTM >>363
【さとうささら】ヒトダマシイ【オリジナル】 http://nico.ms/sm34105735
これとか曲にトークをうまく取り入れてる 近くなってきた。
研究成果は2019年3月に開催される、日本音響学会2019年春季研究発表会にて
発表いたします。
2019年3月5日〜7日に開催される日本音響学会春季研究発表会にて音声合成4件、
歌声合成3件の発表を行います。 DNN に基づく感情音声合成のための敵対的学習の検討
☆角谷 健太,橋本 佳,大浦 圭一郎,南角 吉彦,徳田 恵一(名工大)
歌声合成におけるCNN に基づく音声パラメータ生成手法の検討
◎中村 和寛(TS),橋本 佳,大浦 圭一郎(TS,名工大),南角 吉彦(名工大),徳田 恵一(TS,名工大)
敵対的生成ネットワークを用いた歌声合成の検討
☆法野 行哉,橋本 佳,大浦 圭一郎,南角 吉彦,徳田 恵一(名工大) AI 歌手りんな:ユーザ歌唱や楽譜を入力とする歌声合成システム
◎沢田 慶,坪井 一菜,Wu Xianchao,Chen Zhan(MSD),法野 行哉,橋本 佳,大浦 圭一郎,南角 吉彦,徳田 恵一(NITech)
周期・非周期信号から駆動するディープニューラルネットワークに基づく音声ボコーダ
◎大浦 圭一郎(名工大),中村 和寛(テクノスピーチ),橋本 佳,南角 吉彦,徳田 恵一(名工大)
日本語End-to-End 音声合成における入力言語特徴量の影響
☆藤本 崇人,橋本 佳,大浦 圭一郎,南角 吉彦,徳田 恵一(名古屋工業大学)
隠れセミマルコフモデルの構造を用いたDNN に基づく音声合成における計算量削減手法の検討
☆島田 基樹,橋本 佳,大浦 圭一郎,南角 吉彦,徳田 恵一(名工大) 今回はGANがCeVIOの新時代を切り拓くトレンドになるのかな なんかすごいけど新製品とか出るのは先の話だろうか
今のボイスもアップグレードしてくれるといいんだが
たぶんキャラクター重視の1ST Placeなら対応ライブラリー出すだろうけど 「敵対的学習」とか「敵対的生成ネットワーク」とか、一体何が始まるんです? たぶん、中の人が居る現在のCeVIOには当面は関係ないと思うけど、
もし誰かが不特定多数の歌手を元に色々な歌い方ができる架空の人間の
歌声合成をしようと思ったら敵対的学習でパラメータを自動生成するんだろう。
全然内容分かってないけど。 1st PLACEがYAMAHAを捨てて全面的にCeVIO陣営に来てくれたら嬉しいんだけどな
でもまあIA-EnglishがNew CeVIOになったら真っ先に買うわ 誰でもいいからCeVIOの新しいバージョン来たら予約して買うわ >>383
その研究もしてるね。「ビッグデータを用いた深層学習に基づく統計的パラメトリック
歌声合成技術の研究開発」が戦略的情報通信研究開発推進事業(SCOPE)平成30年度
研究開発課題としてが採択されました(代表:潟eクノスピーチ 中村和寛)。 本研究開発では、深層構造を持つニューラル
ネットワークに基づく歌声合成手法を用いつつ、統計的パラメトリック歌声合成技
術を組み合わせることにより、合成時の計算量を下げながら自然性の高い歌声を合
成することが可能な歌声合成システムの実現を目指す。 >>383,387
自分も歌唱ソフトの未来はそこにあると思う
シンセサイザーのように、自分で色々なパラメーターを設定し違う人物の声を作る
実在の誰かに似せることもできるし、実在しない歌声を作ることもできるようになれば、
コーラスが自作できるし、歌声合成ソフト1つで混声四部合唱なども可能になるよね ふと思ったんだけどこういう研究発表会にボカロやボイロ系の企業や研究者いるのかな? 大元の開発側ならいるんじゃね
ライブラリ作ってる側はどうだろうな >>382
オリジナルの人間の音声と、それを真似て作ったAIの合成音声を、
オリジナル音声と偽物の音声を聞き分けるAIが判別して互いに切磋琢磨させるんかな >>394
処理量を減らすというけど最終的な仕上がりはさすがに今度出ると期待しているDNN版より重いんだろうな
その代わりありえないほど高精度な合成なんだろうけど cevioってピアプロみたいに作品の投稿所って無いんだよな
UTAUみたいに有志が集まってって訳でも無いから、誰かがグループ作ってる訳でも無いし
ピクシブでONEの使えそうな絵探してみたけど合うのが無かったし、
ピクシブは画像投稿サイトだから音源も投げて募集も出来ないし
ピアプロはCevioキャラの投稿はライセンス的に問題ありそう
IAは投稿OKの一覧にあるけどONEは一覧に無いからピアプロに上げるのも微妙だし
第一ボカロじゃ無いからクリプトン関係無いものね……
さてどうしたものか…… 募集は掛けて無いけどツイッターには期間限定で投稿したんだけどね、
フォロワーの絵師さんとか反応あるかな?とかちょっと期待したんだけど見事に反応無かった
頼めば書いてくれるかもだけど、キャラが違うとお願いもし辛いってのが本音 ニコニコで良いんじゃないの? 絵も音も素材投稿可能なサイト 適当な画像探してニコニコに上げるのが一番早いかな、やっぱり
それかDAW動画キャプチャーして適当に歌詞付けて上げるか ネットコミュ障なので普段Twitter投稿しないし、こっちからフォロー掛ける事も無いから
フォロワーが過去企画で関わった極少数ってのもあるんだよね……ダメ元でもう一度募集掛けてみる 自作曲がないからその辺は適当に済ませて上げてしまう私
大丈夫、人気が出たら誰かがやってくれるさ 前はTmBoxもあったけど閉鎖してしまって
今のMQubeはゴミだからね 静止画1枚付けた音源動画作ってtwitterに適切なハッシュで上げれば
ファンは聴いてくれると思うんだがな
ニコ動は以前撤退してもう見ることなくなったが、つべやニコに上げるにしても
twitterで宣伝するのは必要だと思う Youtubeならハッシュタグつけとけばいいんじゃないかなぁ 半額セールで興味持ったんだけど、これ買うより
Creative Studioってやつ買った方が得なのかな? CSはトークボイスがあと2つ付いてくるから掛け合いしたいならそっちのが安い まさかこのアプリはアンドゥってできない?
キーボードからの入力も無理だよね? これの存在今日知った
これ、ボカロよりクリアだね
声の抜きとかも自然な感じだし。買っちまおうかな。 /i/|ii!//|!/!i/´i/ .|i |/ノ i\i!゙、:iヽ|:::| ヽ 'i ! ヾi |'!ヽ::::||::::::/:::::::::::::::::::::ヽ
i i 川i!ハ/" _! | │ 川 ヾ:ii ゙'∨ | ゙ヾiヽヽ;||:::::i':::::o::::::::i/::::::::::::
ノ ノ/リ,,,,,,二三テ=''" ヽノ ル |ノノヽヾ ノ 、,,,ノ,、 iヽ:::||:::::i':::::::::::o::::::i/:::::::::::
/  ̄ ´~~゙'''' ゙''‐- ..,, ,, ‐' `゙ヾミッ、,, ヽ::|::::/::::::::::::::::o::::::i/::::::
,,イ| i' i" `'‐=' `'|/i!:::::i::::::::::::::::::::::::
i | :::::::ヽ::::ヽ::::::ヾ:: ゙、 l 〃::::: i//::::ハ::::::::::::::::::i:::
i i \\\\\ヽ ) ヽ ′′′ / /:::::/:::::::::::::::::::|::::
! | i ,,ィノ < :::: : /:::::/:::::::::::::::::::/::::
i! i i! /i/ ,r''''‐y'''.;、 \ /:::::/:::::/::::::::::::/:::::
゙i! | i /⌒' 、 Y:::::::::''::;;;;'.;.Y'⌒゙i /::::::/::::::/::::::::::::/::::/i
i i ゙! ん、,,__ヽノ:::::::::::::::::::;;;;;{,__,,,r'' /:::::::/::::::/::::::::::::/:::://
゙、ii! ゙| i ノ ゝ;;;:::::::::::::::::::;ノ 。 `i //:::::/:::::/::::::::::::/::::::/:::
ヾ!トl ゙iU i 。l '゛.. ‐ー:::::i | //::::::/::::::/::::::/:::/:::::i!::::::
iiミ! ハ i l ,,,,::: :::;;;;;...{ ° ゙、 //::::://::::/::::::/:::::/::::i::::ii::
i!ヾ!i ゙、! , ' |::: ::::ヽ ..} |゙ヽ......,.,.,.,,,///://::://::::/::::://::::i::::リ::
!ヽヾi i゙、 ___,,,/ }:: : ;;;::: ::::::::} レWノ'レi/、//::/:://:/:::/::/:::ハ:i |:: >>421
まだ全部AIに丸投げは難しそうだけどかなり前進してるな
cevioも協力してるみたいだし記事の紹介Twitterでしたらいいのに
話が進んでるってこともっと認知されるべき やっとCeVIOのアップデート代払えるようになるんか ツイッターで普通に紹介されてたのでお前らも拡散しろ。
https://twitter.com/kenfujimoto
個人的な感想としては既存の神人力ボカロ作品とも比肩しうる生々しいボイスキャラクターを発揮しているので
リアル女性歌い手系歌声合成として理想的な出来栄え。
これならSinsyと同じサーバー処理で文句言わないしレンダリング1発10時間でも待てる。
処理高速化と合成品質の向上に時間がかかりそうなのは分かるが、ブレイクスルーは早いに越したことはないので
サブスクでもクラウドファンディングでも協力するからとにかく大至急エンドユーザが使えるモノにしてほしい。
ただ現実的には市販の商品を作る過程でおそらくキャラクター(外の人)が変わるのだろうな。
中の人が同じだとしても歌唱力も声質も昔とは変わってるから、ささらの従姉妹のお姉さんになりそう。
あとタカハシのソングもこの調子でよろしくだよ。
https://twitter.com/5chan_nel (5ch newer account) >>425
現時点でささらとIAの二人を使ってディープラーニングしてるわけだしサンプリングデータを使えるんだからキャラを変えるとかしなくていいはず
キャラを増やすって話ならどんどん増やしてどうぞ >>427
サンプリング元に揺らぎがある場合(中の人は同じで音域が変わったり歌唱力や発声の癖が変わったりしてる等)
全部まとめてAIに突っ込んでおかしなことにならないかよく分からない。
AIが声の共通項やら妥協ポイントも学習してうまいことやってくれるのかな。
今のところは本当にAIが好きなように歌ってるみたいだから、あらゆる歌唱パターンを試したらどこかで破綻も出るだろうけど
学習の修正はすぐできるのかな? 今回はIAの全音符がうまくいかなかったみたいだし。
それよりは新キャラということにしてより多くの安定した歌唱データでみっちりがっつり学習させた方がいいのかなと思った。 >>428
声質が変わったから新キャラにしないといけないわけではないと思う
例えばボイロ2で声質が大きく変わったキャラいたけどだからといってキャラ変更してないしそれなりに受け入れられてる
今までそっくりの声にならないのは間違いないけどある程度の範囲ならファンは許容できるんじゃないかな
特にIAみたいにキャラにファンがいてIPとして確立してる場合見捨てて新キャラなんて逆にできないだろう ささらとIAの版権元や中の人がみんなOK出してくれる品質になることを願おうか
タカハシは音痴設定であえて音痴なAIを作ってくれてもいいのよ 今のCeVIOと比べたらそこまで凄いと感じなくてMIXしたらこんなもんなんか?というのが正直な感想だった
記事を見る限り課題も多くて未完成なのに何故こんなに急いでCDでリリースするんだろうと疑問も感じた
未完成の状態で出したら劣化生歌の悪い印象がつくのが心配で、もっと完成度を上げてからの方がよかった気がする 自分がCDを買う理由はまさしく未完成だから。
ノンエディットのボーカルトラックが入ってるなら買って聴き込みたい、と思うDTMerだけが買えばいい。
完成度を上げるには当分かかるし、新技術でカバー曲サンプルじゃないオリジナル曲を作った記念品でもある。
製品版になってもMusicXML扱えるDTMer何人いるんだって話になりそうだな。CeVIOをそれで運用してる人いるのかね? 技術的な面でいうとSCOPEの研究開発の成果が出たあたりで十分と考えてる
SCOPEでの目標は高品質の歌声の再現でのブレークスルーになってて
SCOPEの研究開発期間で完成度を上げるのはマストなんだから当分かかるなんて言ってられないはず
未完成のまま話題性でブレークに繋げたいのは何か違うなってのも引っかかってる 今回のは第三者の同人制作で公式の許諾はもらったけど非公式のサンプル音源みたいなもんだしね。
同人CDをつべに丸上げするような大馬鹿もいないでしょ。
話題になって急かせば早く完成するかもしれないから界隈の興味ある人間だけで地味に盛り上げればいいよ。
どうせミクとは違う地味な世界の出来事さ 素人耳には、もう水瀬いのり本人にしか聞こえん
ささらどこいった やっぱ水瀬いのり本人に聞こえるの?
自分には分からないってかささらにしか聞こえない 大浦圭一郎特任准教授(名工大/テクノスピーチ)が、2019年6月22日(土)・23日(日)開催の音学シンポジウム2019(第123回 音楽情報科学研究会・第127回 音声言語情報処理研究会 共催研究会)にて招待講演を行います。http://www.sigmus.jp/?page_id=4179 大浦圭一郎特任准教授(名工大/テクノスピーチ)が、FM FUJI http://www.fmfuji.co.jp/ のラジオ番組「terminal」http://fmftp.lekumo.biz/tl/ に、歌声合成の話題で生出演します(2019年4月18日(木)16:00〜18:50)。出演は17:37からの予定です。 去年の5月頃にSCOPE採択された情報が流れてたんで今でなくともM3の2019秋が順当なスケジュールと思えた
もしDTMステーション側の都合だけでM3の2019春にゴリ押ししたなら開発や世間の評判に影響しかねないんで自重して欲しかった
記事に書いてたバタバタした裏事情というよりDTMステーションのせいでバタバタさせて技術未完版でリリースしたのなら
技術完成版セカンドアルバムみたいなのもリリースするようなフォローがあってもいいくらい >>443
今回のワンコーラス聞いて率直に技術が未完成だと感じたのか?
CDでエフェクトかけてない出音を聴けばはっきりするが、記事を読んだ感じではAIが作れる現状の上限品質が
これであって今年出しうる技術水準では実質の完成品だと思うのだが。
処理高速化と歌唱力向上の実証をしなければならないし、さらに人間が調整するパラメータやらUI、製品化に
必要な諸々の機能を実装する段階ではないだろう。
あと根本的に権利関係の問題をクリアできるのかどうかすら分からないな。リアルすぎて問題が出るというやつだ。 >>445
ディープラーニングで上手い歌い方を学習できていないようだし、あの程度だと学習が少ないだろ
目指しているブレークスルーとなる高品質の歌声の再現ってのが1つの対象素材の再現ってことなら話は別だがな
なぜマイクロソフトのりんなが歌ウマプロジェクトで学習の教師となる素材を一般から集めたかって話だ
それにSCOPEでの研究開発は1カ年で完成させることになっている
だから理論実証が中心の研究開発としてシステムの基礎が完成するのが今年の6月あたりだろ
それをうけて今年出しうる最高品質は今年後半に制作したものになる
製品化の話はもっと先だから、まだまだ先って書いてるのは当然だよ どのみち今作られてるシステムでCevio2らしきものが発売されるのは数年先の話だろうね >>446
数時間の素材で「上手い歌唱」を学習するという研究目的は、SCOPEと関係ない自分のような一般人には二の次、
「鼻声ノイズが少ない」「音素が明確に聞き取れる」「人間らしい声色を持っている」ことが自分には大事なんだな。
で第三者が「まだ難もあるけどこんだけ生っぽく歌ったよすごいよ」とやってくれるのは純粋にありがたいのよ。
というのもボカロは今まで長年突き詰めてみても、どれについても自分の理想に遠いし(良くなってきたけど声色がね…)
音声・歌声合成界隈の現状水準を踏まえてのSCOPEの意義は理解できる一方で、現行ささらは既知の中の人と技術で
製品化して実績があることから母体のCeVIOプロジェクトと、SCOPEの研究を同じレールに乗せるのか?が気になってる。
まず研究を成功させるのが最優先なのは当然なので、学習素材を厳選して、歌にうるさい専門家の評価に耐えうる精度を
出すように持っていくだろうし、CeVIOプロジェクトで新ささら・新IAをリリースするためには、大人気になってる中の人や
所属会社にお願いして新しい素材で高品質に仕上げなきゃファンががっかりするから、コストがかかって大変に違いない。
さしあたり製品化するなら研究時に厳選した素材、別人のボイスで出してくる可能性もありそうだ。
要するに、昔の素材でとりあえず学習して仕上がったAIささら・IAの声が聴けるのは、テクノスピーチのサンプル以外では
このCDだけになるかもしれない。ならば自分はささらに需要があるからこれは記念で買っておきますよと。 ちょっとマスタリングまじめにやれば消えそうなノイズすら消す手間も省いてCD売ろうとか、
さすがアホみたいなレイテンシのゴミを売ろうとした藤本だけあるわ CDじゃなく配信だとしてもオリジナル曲として世界初のはずなんだけどな。
りんなの実力も、オリジナルをアカペラで歌ってもらわないと分からんのだよ。 >>448
質問された、なぜ未完成と感じたかを答えただけだど?
VOCALOID5を意識してたのかSCOPEの課題としてスタイルを使わずに自然に歌えるようにするって大見得切ってんだから
スタイル無しでどんな曲でもそこそこ上手い歌い方をするのが標準になってなきゃ歌い方の揺らぎも何もないだろ
だから推論するためのベースとして膨大な学習も必要
それと歌い方がヘタで編集の手間がCeVIO以上にかかるならブレークスルーにならず研究成果としても問題になる
少なくともCeVIOよりもリアルで、かつ、上手いことで研究の課題であったブレークスルーの実現になり研究が成功と思える
総務省相手に受託してんだから既存システムのCeVIOやVOCALOIDを越えて課題であるブレークスルーを明確に実現しないとヤバいだろ
だから今年前半まででブレークスルーを起こす成果が必達となるので今以上の結果に期待出来る
だからこそ完成度が上がるってわけだな ちょっと長く書きすぎたか
研究しているのはビッグデータとして大規模な歌声データベースの利用が前提になっているシステムで、それを、ささらの歌声に適用することになる
この歌声データベースがないから学習が少ないんだろってことを446で書いたつもり >>451
人間の歌唱の上手さってSCOPEで明確に定義されてるのかな?
楽譜どおり歌うという言葉があるが、ボカロの時代から「それは厳密には違う」って言われてる部分。
声量やリズムはともかくとして、ピッチは揺らぐのが人間らしい歌唱だし、V5で追加されたスタイルって作り手が
明示的に指図しない限りは楽譜上は「無い方がいい」表現要素の塊。
ハスキーとかファルセットとか巻き舌気味にとか色々あるけど失敗すると聞き取りにくいだけなんよね。
それはともかく、現行ささらのベタ打ちが上手だなと思ったのは最初だけで実際は割とピッチヨレヨレなので、
AIささらがよほどブレブレでもなけりゃ現行より手間がかかるってことはなさそうに思う。
発声自体はたぶんおおむね良好だろうし、音素タイミングも1ティック単位の調整をAIに求めても仕方ない。
こだわり作業は人間に残してくれてかまわない。でないとリアル歌手の仕事がなくなりそうだ。
ともかく早くユーザーに使わせてくれ、性能向上は金取ってアプデすればいいから、とCeVIOプロジェクトに言いたい。
今キックスタートでビジネスに持ち込めばきっと成功すると思うんだが…3年も待ちたくないぞ。 >>452
ビッグデータの歌声DBって悪い言い方をすると「無個性な集合体」になるのかな。誰かが細かくアノテーションするのかもしれないけど。
ささらやハルオロイドが無個性だったら拍子抜けだし、やはりボイスキャラクターを重視してもらいたいので学習素材は厳選してほしいな。
バックコーラスなら専用の音源も出ているので欲しいのは声が際立つリードボーカルなんだよ。 キャラなりの歌い方を求めず作曲者のイメージした歌唱じゃないと受け入れられない使い方だとCeVIOの様なAI歌唱はかなり使いづらいし
歌手に合わせた作曲をしないボカロPは今後もAI歌唱は使わないんじゃないかなって思う。
まあVSTやReWireに対応してくれないとボーカル作れませんって時点でダメだとは思うけど
ところでトークの方はもっとキャラ追加してほしいんだけど全然増えないよね… 全然詳しくないから適当なこと言うけど平均的な人間の声の出し方の設計図を作って
後から声優だったり歌手だったり色んな人のサンプリングデータを設計図に混ぜてやるとその都度色んな声が作れるみたいな便利なシステムだと汎用性高そう トークがソングの声色・声質に寄るようにAIで解決されるといいんだけどな。
それにTV局のアナウンサー並に滑らかな発声をしてもらわないと長時間は聞くに堪えない。 >>456
たぶん現状のAIはそんなに便利なことはできないと思っている。
女声と男声で完全に別のデータベースを作らないと必ず破綻すると思うし
男声もテナーとバリトンとバスで細かく分けとかないとやっぱり破綻する気がする。
今回のささらAIも、以前にテスト済みの音域を外れたら破綻する恐れがあるという前提で作曲したくらいだから。
ハルオロイドのコブシを効かせる特殊奏法も専用の演歌素材から作るのがより良い結果になると思う。 >>460
いかにもお役所の考えるクールジャパン戦略のIT版みたいなやつだということだけは分かった
内容はさっぱり ■ このスレッドは過去ログ倉庫に格納されています