X



トップページDTM@2ch掲示板
1002コメント293KB

歌声合成ソフト『 CeVIO Creative Studio 』 Part.5

■ このスレッドは過去ログ倉庫に格納されています
0001名無しサンプリング@48kHz
垢版 |
2018/03/02(金) 09:58:37.65ID:A9/GqU7H
CeVIOに関する情報交換を目的としたスレです。

【「CeVIO」とは?】
「CeVIO(チェビオ)」とは、UGC(User Generated Contents、ユーザー生成コンテンツ)を支援するために生まれた、これまでに無いエンターテイメントを創出する新しいプロジェクトです。
魅力的なキャラクターを生み出す映像・音楽のクリエイター集団と、豊かな感情表現が可能な音声合成技術・歌声合成技術を持つ技術者集団の融合によって生まれました。

CeVIO Creative Studio:CeVIOプロジェクト
http://cevio.jp

ONE -ARIA ON THE PLANETES-(オネ):1st PLACE株式会社
http://1stplace.co.jp/software/cevio/

Color Voice Series:株式会社エクシング
http://camp.joysound.com/colorvoice/

HMM/DNN歌声合成システム:Sinsy
http://www.sinsy.jp/

前スレ:
歌声合成ソフト『 CeVIO Creative Studio 』 Part.4
https://egg.5ch.net/test/read.cgi/dtm/1468540727/
0161名無しサンプリング@48kHz
垢版 |
2018/10/31(水) 07:36:14.19ID:5tgbtZU9
ボカロから来る人は
 VST連携が出来ない
 声がどれも同じに聞こえる

ボイロから来る人は
 VoiceroidUtilが使えない
 声がどれも同じに聞こえる


VSTはオリジナル作る人には重要かも知れないが
VoiceroidUtiは無くても良いよな
YMMは直接対応だしAVIUTLはかんしくんで無造作に投げ込んでくれる
同じ声に聞こえるのは単に興味が無いから聞く努力をしないだけだろう

自分が見た中でボイロを触ってからCeVIOに興味を持った人の中で
自分で手法を模索しない人からの中傷にも取れるCeVIO下げは結構目立つなって思った
ある程度は匿名SNSでのケアをしておけばもう少し伸びたのではと思う
0164名無しサンプリング@48kHz
垢版 |
2018/10/31(水) 12:59:19.82ID:rdnfEKTu
VSTつってもRewireみたいなもんだしなあれ
0175名無しサンプリング@48kHz
垢版 |
2018/11/02(金) 05:38:43.39ID:Wf/hmtbt
ボカロも初期に売れた音源以外は鳴かず飛ばず(曲自体の売れ行きも含めて)
というかミクだけ状態
0176名無しサンプリング@48kHz
垢版 |
2018/11/02(金) 06:43:37.19ID:mxka0rIM
ミクはじめクリプトン一家は例外としても
ONEでIA(JPN)を倒せない現状は厳しいな
IAてるみぃ言えてないし性能面のアドバンテージはこっちにあるはずだが
0177名無しサンプリング@48kHz
垢版 |
2018/11/02(金) 13:49:20.35ID:vx1Mnja5
性能と人気は関係ないっていうのはどんなものでも同じだぞ
すでに一大コンテンツが出来上がってるところに性能で売りに行って伸び悩んでるのはCevioだけじゃない
0178名無しサンプリング@48kHz
垢版 |
2018/11/02(金) 13:54:53.64ID:Ziq4TSRx
高性能な方がだいたい負けるゲーム機みたいなもんだな
0180名無しサンプリング@48kHz
垢版 |
2018/11/06(火) 01:32:54.62ID:ISqpRrot
そうだね。簡単にそれなりの品質を得られるけど、VSTではないしね。
どっちも凄いと思うけど、理想からは程遠い。
0182名無しサンプリング@48kHz
垢版 |
2018/11/15(木) 23:07:50.53ID:Y1uCLm7R
IAはソングトーク組にならなくて安くならないのがな
英詞使うなら選択の余地はないんだけどいつも後回し
0185名無しサンプリング@48kHz
垢版 |
2018/11/20(火) 13:09:40.56ID:U8xCRjNt
物理モデリングかサンプリングかの違いじゃね
ボイロがサンプリングでなかったら知らん。
というかトーク専ならそっちのスレの方が良いんじゃないかな
0186名無しサンプリング@48kHz
垢版 |
2018/11/20(火) 13:44:13.16ID:szYXPpqw
ボイロは録音されたものを鳴らす大容量サンプラ
チェビオは指定されたしゃべり方を計算するシミュレータ
0188名無しサンプリング@48kHz
垢版 |
2018/11/22(木) 02:30:46.38ID:xfOSkJEO
>>185
物理モデリングは関係ない
この板のちょっとおかしな人が
勝手に物理モデリングだと思い込んでるだけ
0191名無しサンプリング@48kHz
垢版 |
2018/11/22(木) 15:40:46.96ID:xfOSkJEO
CeVIOは音声分析の一部にWorldエンジンを使っている事から、メル周波数ケプストラム係数等のパラメーターベースの分析再合成方式にHMM(や最近はDNN)を取り入れた方式っぽい。
0192名無しサンプリング@48kHz
垢版 |
2018/11/22(木) 22:54:36.87ID:eSRa4PbM
ライブラリのデータサイズとエディタのパラメータから物理モデリングに近いものだと思ってたけど
0193名無しサンプリング@48kHz
垢版 |
2018/11/22(木) 23:52:13.07ID:ZgJlCRFn
音声合成であってモデリングではない
モデリングと言うなら声帯、気道、鼻孔、舌、唇をモデル化して制御してるのかって話
してないだろ
0196名無しサンプリング@48kHz
垢版 |
2018/11/23(金) 09:10:26.75ID:/DLr4e6u
一般向け説明でどんな言葉(物理モデリング)が飛び出そうと、
それが音声合成業界で一般に受け入れられていない用語・用法である限り、その分野の未定義用語を比喩もしくはマーケティング目的で不注意に使ってしまったという以上の意味は無い。

「音声合成」はどんな方式であろうと、
大元には人間が声帯や口腔、鼻腔、舌、唇等を使って音声を出す機構の模倣という側面があるけれど、
その模倣方法は千差万別で、声帯や口腔の模型を使った発声実験、模型を抽象化した物理的モデルを扱う調音合成、波形やスペクトラムの特徴量を扱うメインストリーム、そして膨大なサンプルの切り貼りで同等な結果を得ようとする波形接続合成等がある。

そして全ての音声合成の大元に人間の物理的発生機構がある件は、「音響合成」分野でスタンフォード大学CCRMAのJulius O. Smith IIIが提唱した「Physical Modeling」とは直接関係ない。
Smith IIIの認識では、1961年デイジーベルを歌ったベル研の研究は、音響合成方式担当のMax Mathewsが「Waveguide」音源方式の原型を採用した点に関して、Physical Modelingの発端と位置付ける事ができるという程度の話。
そしてその系譜の研究には、声帯や口腔の(流体力学的)模倣を指向する「調音合成 (Articulatoly Synthesis)」や、数少ない商用実装系だったNeXT上のGnuspeechがある。
0197名無しサンプリング@48kHz
垢版 |
2018/11/23(金) 09:46:33.49ID:/DLr4e6u
音響合成分野(そして潜在的には音声合成分野も)は良くも悪くも超ニッチな研究分野らしくて
一見、一般的用語を組み合わせた包括的概念のように見える用語が、実は包括的概念としては広く承認されておらず、特定の研究や方式を指す固有名詞として使われている例が多いので要注意だぬ。

例を挙げると:
・Physical Modeling : スタンフォード大学CCRMのJulius O. Smith IIIが提唱している、Waveguide音源方式他を扱う分野。音声合成分野ではArticulatory Synthesisの一手法。
・Wavetable Synthesis : 1978年に、後のPPG Waveで有名なWolfgang Palmや、作曲家のMichael McNabbが個別に開発し、
1993年Hoyer, Beauchamp & HakenがMultiple Wavetable Synthesisとして再定義を図った、複数波形を時間的に切り替えて音色変化を得る方式。
(波形テーブルを使う方式一般は、古くはTable-lookup synthesis として総称されていた)
・Sinwave Synthesis : 1970年代末Haskins Laboratories のPhilip Rubinが開発した、フォルマントピークを正弦波でトレースする音声合成方式。
日本ではLPC方式の先導的研究にあたるPARCOR方式から発展したCSM (Composite Sinusoidal Modeling
)方式として独立開発され、PC-6001mk2SRやCX5の歌声合成として広く知られている。
0205名無しサンプリング@48kHz
垢版 |
2018/11/23(金) 15:55:07.49ID:KcH0zqkf
サンプリングかシミュレーションかの話してるのに勝手に言葉が違う!とかイキって話ずらしてきたのは君じゃん
0206名無しサンプリング@48kHz
垢版 |
2018/11/23(金) 16:30:18.50ID:/DLr4e6u
なんだ、的外れな二元論で対立煽りをし始めちゃったよこのバカw

Sinsy、CeVIOの方式なら名工大徳田恵一教授の資料を読めばいいじゃん。
2015年プレゼンを見ると、音声合成の歴史的発展過程が下記のように分類されていて
1. ルールベースのフォルマント合成
2. コーパスベースの波形接続型音声合成
3. コーパスベースの統計的パラメトリック音声合成
ボカロは2番目のグループ、Sinsy.CeVIOは3番目のグループに相当し
両方ともコーパスベースなので、生の音声データに基づく加工サンプル(2の場合)もしくは特徴量の学習データ(3の場合)を使ってリアリティを実現する一方、
特徴抽出・波形生成部に関して3の方式では広義のボコーダー(音声符号化に基づく音声合成エンジン)が使われている。
ただし同プレゼンでは、声帯や口腔の物理シミュレーションは「まだ難しい?」と疑問符付きで示されていて、その方式は使っていない事がわかる
0207名無しサンプリング@48kHz
垢版 |
2018/11/23(金) 17:43:21.41ID:8XuAFECi
波形生成ならモデリング音源でいいよ
なんか物理モデリングより若干グレードダウン感があるからかっこいい名前付けてくれ
0210名無しサンプリング@48kHz
垢版 |
2018/11/25(日) 13:02:25.78ID:7nrTNw/p
>>206
「音声合成の歴史的発展過程〜Sinsy.CeVIOは3番目のグループに相当」と
「プレゼンでは、声帯や〜事がわかる」だけで足りるだろ…
ダラダラと長いと、お前さんが馬鹿だと思われて読んでもらえないぞ
多少正確性を欠こうが、>>194くらいに圧縮してもいい
0212名無しサンプリング@48kHz
垢版 |
2018/11/25(日) 21:34:12.48ID:9EBip3cH
「パラメトリック」にはルールベースとコーパスベースがある、という程度の話も判別できずにグダグダ絡むのはおぼこ
0214名無しサンプリング@48kHz
垢版 |
2018/11/25(日) 21:42:10.44ID:usxHbw+E
徳田さんが読んでも訂正が入らない程度の踏み込み具合にしとかないのがおぼこの踏み込み方
0215名無しサンプリング@48kHz
垢版 |
2018/11/25(日) 22:19:46.11ID:V3MdvRkt
「ダラダラ長いと馬鹿だと思われて読んでもらえない、恥ずかしい」
というセンスに知恵遅れの高齢未通女特有の頭の悪さを感じるね
0219名無しサンプリング@48kHz
垢版 |
2018/11/26(月) 10:43:12.77ID:nUfTFOFu
ただ技術のソースのリンク貼れば済むものを。。。
長文でスレを汚さないように気配りしてる住人まるごとアホ扱い。論文読めるの俺だけってところがレベル低いんだけど気付かないんだろうな。
0222名無しサンプリング@48kHz
垢版 |
2018/11/26(月) 11:16:58.01ID:Qn/tIWNJ
でもなんか言葉だけで見ると音声のバリエーションあれこれ作れそうなんだが、なんで似通ったような声しか出せんのかね?
0223名無しサンプリング@48kHz
垢版 |
2018/11/26(月) 11:17:04.24ID:SVH8qGbH
そもそも匿名掲示板で専門記事や論文の解説をしてもらおうとする時点で、能力のないアホ確定だから相手にする必要がないだろ
0225名無しサンプリング@48kHz
垢版 |
2018/11/26(月) 11:42:12.35ID:YQW/T6KQ
皆がひっそりと嗜んでいたのに自称識者がドヤ顔で場を乱してるのが哀しいです
何がしたいの?低能ばーかばーかって煽りたいの?
0226名無しサンプリング@48kHz
垢版 |
2018/11/28(水) 22:37:16.27ID:g8Yk0Z7o
多分32bitアプリケーションだからだろうけど、何をやるにしても反応がワンテンポ遅いのどうにかならんの?
64bitにするのそんな大変なの?今時64bitに対応してないようなソフト相手にされないだろ
0227名無しサンプリング@48kHz
垢版 |
2018/11/28(水) 22:43:35.39ID:PfvcPXMw
その場でレンダリング(っていうのかな?)してから発声するようなメカニズムだからね
64bitにしたから反応良くなるものでもないんじゃない?良くて1割とか
0229名無しサンプリング@48kHz
垢版 |
2018/11/29(木) 09:17:16.38ID:WTghYAub
んなわけねえw
ミュートやソロボタン押すだけでワンテンポ遅れるんだから
俺のi7-7700のPCのせいじゃないぞ
0231名無しサンプリング@48kHz
垢版 |
2018/11/29(木) 10:19:30.49ID:6NL67B4H
全くだ
0232名無しサンプリング@48kHz
垢版 |
2018/11/29(木) 10:34:05.18ID:JNk/d9SP
CPUとかメモリーとかに負荷がかからない配慮のためだろうか?
トークトラックの追加と削除はとくに気になる重さだ。
0234名無しサンプリング@48kHz
垢版 |
2018/12/01(土) 23:27:34.36ID:Nn9CC/f2
将来的にDAW連携が強化される予定があるとの含みを持たせているのに
まだ64bit化されてないのは不安しか残らなくね?
0236名無しサンプリング@48kHz
垢版 |
2018/12/02(日) 22:41:37.25ID:XhENmZdC
そこまでいうならPCスペックと症状でも書けばいいのに

i7-8700/SATA3SSDで特に困ってないけど
0239名無しサンプリング@48kHz
垢版 |
2018/12/03(月) 00:23:24.58ID:oL49BNZ+
まあ世の中には高スペックすぎて予期せぬ不良動作させてしまう人もいるからね…
0240名無しサンプリング@48kHz
垢版 |
2018/12/03(月) 00:39:21.55ID:VpGxpwZ8
話が全くかみ合わないのは
曲を作っているかどうかの違い
DAWとの連携強化を行うなら64bit化は不可欠
0241名無しサンプリング@48kHz
垢版 |
2018/12/03(月) 00:43:17.32ID:kvgLYtgv
曲作ってるけどCeVIOはそういうもんだと割り切ってる
DAWでメロディートラック作る→MIDIで書き出してCeVIOで音声化
→DAWにWAV読み込み
CeVIOの外部WAVミックスは使ったことない
0242名無しサンプリング@48kHz
垢版 |
2018/12/03(月) 00:49:43.46ID:dVVIJ89G
まー、もちろん64bit化してRewire対応させて欲しいとこではあるんだけども
再生ボタン押してからレンダリングして再生する今のエンジンじゃ無理だろうなとも思ってる
0243名無しサンプリング@48kHz
垢版 |
2018/12/03(月) 12:57:45.56ID:s48F0zHG
>>241
現状はそれしかないよね
始めに割り当てていた音色だといい感じなのに、
ささらにしたら「あれっ?」ってなるリスクが嫌だけど
0251名無しサンプリング@48kHz
垢版 |
2018/12/14(金) 18:56:51.15ID:xMkFKVCA
ささらがデモに使われてるから後継に期待しちゃうぞ
GPU要求スペック高いだろうけど俺はそれでも欲しい
0252名無しサンプリング@48kHz
垢版 |
2018/12/14(金) 19:06:38.11ID:j+zwd8qQ
これはCeVIOを買った甲斐があったというものだ
ささらがまたここまで化けるとは思ってなかったからすごく嬉しい
0254名無しサンプリング@48kHz
垢版 |
2018/12/14(金) 19:46:42.69ID:FMwNsBkr
クラウドベースで学習データ適用来るかも
製品化するなら第二世代という扱いかな
CeVIOの名前で出してくれるとユーザーとして嬉しい
0255名無しサンプリング@48kHz
垢版 |
2018/12/14(金) 20:03:27.83ID:j+zwd8qQ
これまでの流れを汲むなら、歌い方パラメータをセッティング済みのアセットに
さとうささらの声色を乗せたものがパッケージになるイメージだがどうなんだろう。
調整のUIはこれまでどおりでも全然問題ないレベルだと思う。
これでトークとソングの声質の差もかなり埋まる気がする。
タカハシがめっちゃ美声で歌う可能性も出てきたのが今回一番ヤバい。一部の界隈で突沸しそう。
0256名無しサンプリング@48kHz
垢版 |
2018/12/14(金) 20:33:36.16ID:G5paU2OY
>>253
GPUを使っても計算時間がかかる、と言ってるので
CPUで代用すると10倍くらい遅いと思った方がいい
waifu2xとかCPUで使ってみれば遅さを体感できるよ
0257名無しサンプリング@48kHz
垢版 |
2018/12/14(金) 20:37:14.06ID:j+zwd8qQ
仮想通貨業界が瀕死になってやっとGPUもまともな値段に戻りつつあるから仕込むには好機
製品化されるのが何年後なのかだけだな
0258名無しサンプリング@48kHz
垢版 |
2018/12/14(金) 20:39:04.69ID:FMwNsBkr
最適化が進めば速くなる類のものか、プロセッサそのものの計算能力が上がらないとどうしようもないのか
計算能力を要求するタイプなら必然的に多コア対応するようになるだろうけど、多くのPCでは性能不足でまともに使えないものになってしまうおそれも
0259名無しサンプリング@48kHz
垢版 |
2018/12/14(金) 21:05:59.55ID:pAqOTWA5
ずっと無料アップデートで悪いくらいに思っていたので、ここらでアップグレードは追加料金でも構わないくらいには思ってる。
0260名無しサンプリング@48kHz
垢版 |
2018/12/14(金) 21:13:30.49ID:G5paU2OY
サーバーサイドアプリでサブスクリプションという手もある
GPUを個人が買うとソフトより高い出費になるうえ、
最悪、動かない・・・まであるからな

どちらにせよ、DAW連携はもう諦めた方が良さそうw
0261名無しサンプリング@48kHz
垢版 |
2018/12/14(金) 21:30:29.93ID:j+zwd8qQ
それより心配なのは個人ユースじゃなくて商業展開の方だなあ。
ここまで高品質な発声だとカラオケ屋で自分の代わりに歌わせて楽しむささらカラオケオフすら成立しうるので
GPU枚数に物を言わせて数千曲作りたい職人向けのライセンシーどうするかってなりそうだ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況