歌声合成ソフト『 CeVIO Creative Studio 』 Part.5

**名無しサンプリング＠48kHz** · 2018/03/02(金) 09:58:37.65

CeVIOに関する情報交換を目的としたスレです。

【「CeVIO」とは？】
「CeVIO（チェビオ）」とは、UGC（User Generated Contents、ユーザー生成コンテンツ）を支援するために生まれた、これまでに無いエンターテイメントを創出する新しいプロジェクトです。
魅力的なキャラクターを生み出す映像・音楽のクリエイター集団と、豊かな感情表現が可能な音声合成技術・歌声合成技術を持つ技術者集団の融合によって生まれました。

CeVIO Creative Studio：CeVIOプロジェクト
http://cevio.jp

ONE -ARIA ON THE PLANETES-(オネ)：1st PLACE株式会社
http://1stplace.co.jp/software/cevio/

Color Voice Series：株式会社エクシング
http://camp.joysound.com/colorvoice/

HMM/DNN歌声合成システム：Sinsy
http://www.sinsy.jp/

前スレ:
歌声合成ソフト『 CeVIO Creative Studio 』 Part.4
https://egg.5ch.net/test/read.cgi/dtm/1468540727/

**名無しサンプリング＠48kHz** · 2018/10/31(水) 07:36:14.19

ボカロから来る人は
　VST連携が出来ない
　声がどれも同じに聞こえる

ボイロから来る人は
　VoiceroidUtilが使えない
　声がどれも同じに聞こえる

VSTはオリジナル作る人には重要かも知れないが
VoiceroidUtiは無くても良いよな
YMMは直接対応だしAVIUTLはかんしくんで無造作に投げ込んでくれる
同じ声に聞こえるのは単に興味が無いから聞く努力をしないだけだろう

自分が見た中でボイロを触ってからCeVIOに興味を持った人の中で
自分で手法を模索しない人からの中傷にも取れるCeVIO下げは結構目立つなって思った
ある程度は匿名SNSでのケアをしておけばもう少し伸びたのではと思う

**名無しサンプリング＠48kHz** · 2018/10/31(水) 07:37:43.07

>>159
ツベとかニコニコで検索してもボカロだと完全に埋もれるよな

**名無しサンプリング＠48kHz** · 2018/10/31(水) 10:34:18.13

VSTは別に要らんからRewireくれ…

**名無しサンプリング＠48kHz** · 2018/10/31(水) 12:59:19.82

VSTつってもRewireみたいなもんだしなあれ

**名無しサンプリング＠48kHz** · 2018/10/31(水) 16:33:21.54

ProToolsだからVSTだとささらちゃんがささらないんだわ

**名無しサンプリング＠48kHz** · 2018/10/31(水) 21:43:51.94

>>165
VSTがささるプラグインをさせばちゃんとささるのでは

**名無しサンプリング＠48kHz** · 2018/10/31(水) 22:24:02.15

いやVSTにDAW側が対応できないってことだろう

**名無しサンプリング＠48kHz** · 2018/10/31(水) 22:24:53.91

すまん
間にかませてVST対応にするプラグインがあったな。そういう意味か

**名無しサンプリング＠48kHz** · 2018/10/31(水) 23:53:43.11

8000円そのために出すのかーー、って感じ
本体10000円で

**名無しサンプリング＠48kHz** · 2018/11/01(木) 12:02:34.75

何だレス増えたな

**名無しサンプリング＠48kHz** · 2018/11/01(木) 12:08:19.41

話すことがないだけで使ってる人も見ている人もいると言うことだろう

**名無しサンプリング＠48kHz** · 2018/11/01(木) 21:24:03.80

（インストールしたまま）使ってないから話すことがなくてすまんな

**名無しサンプリング＠48kHz** · 2018/11/02(金) 01:56:53.68

わざわざ書き込まないでいいよ

**名無しサンプリング＠48kHz** · 2018/11/02(金) 02:38:38.39

ボカロに対して優位取れる所が無いもんな
流行るわけがない

**名無しサンプリング＠48kHz** · 2018/11/02(金) 05:38:43.39

ボカロも初期に売れた音源以外は鳴かず飛ばず（曲自体の売れ行きも含めて）
というかミクだけ状態

**名無しサンプリング＠48kHz** · 2018/11/02(金) 06:43:37.19

ミクはじめクリプトン一家は例外としても
ONEでIA(JPN)を倒せない現状は厳しいな
IAてるみぃ言えてないし性能面のアドバンテージはこっちにあるはずだが

**名無しサンプリング＠48kHz** · 2018/11/02(金) 13:49:20.35

性能と人気は関係ないっていうのはどんなものでも同じだぞ
すでに一大コンテンツが出来上がってるところに性能で売りに行って伸び悩んでるのはCevioだけじゃない

**名無しサンプリング＠48kHz** · 2018/11/02(金) 13:54:53.64

高性能な方がだいたい負けるゲーム機みたいなもんだな

**名無しサンプリング＠48kHz** · 2018/11/03(土) 17:44:38.02

負けてるとは思わんが勝ってるとも思えんな

**名無しサンプリング＠48kHz** · 2018/11/06(火) 01:32:54.62

そうだね。簡単にそれなりの品質を得られるけど、VSTではないしね。
どっちも凄いと思うけど、理想からは程遠い。

**名無しサンプリング＠48kHz** · 2018/11/15(木) 22:59:08.59

またほんのちょびっとだけ安い
https://twitter.com/1st_PLACE0302/status/1062993608985309184
https://twitter.com/5chan_nel (5ch newer account)

**名無しサンプリング＠48kHz** · 2018/11/15(木) 23:07:50.53

IAはソングトーク組にならなくて安くならないのがな
英詞使うなら選択の余地はないんだけどいつも後回し

**名無しサンプリング＠48kHz** · 2018/11/17(土) 00:52:05.29

IAはパッケージないんだっけ

**名無しサンプリング＠48kHz** · 2018/11/20(火) 12:11:40.51

cevioとボイスロイドの違いってなにがあるの？

**名無しサンプリング＠48kHz** · 2018/11/20(火) 13:09:40.56

物理モデリングかサンプリングかの違いじゃね
ボイロがサンプリングでなかったら知らん。
というかトーク専ならそっちのスレの方が良いんじゃないかな

**名無しサンプリング＠48kHz** · 2018/11/20(火) 13:44:13.16

ボイロは録音されたものを鳴らす大容量サンプラ
チェビオは指定されたしゃべり方を計算するシミュレータ

**名無しサンプリング＠48kHz** · 2018/11/20(火) 15:24:03.41

声の種類増やして欲しい

**名無しサンプリング＠48kHz** · 2018/11/22(木) 02:30:46.38

>>185
物理モデリングは関係ない
この板のちょっとおかしな人が
勝手に物理モデリングだと思い込んでるだけ

**名無しサンプリング＠48kHz** · 2018/11/22(木) 11:22:09.37

そうだろうね。物理モデリングなら声質はパラメトリックになるはずだからね

**名無しサンプリング＠48kHz** · 2018/11/22(木) 13:12:47.25

HMM（隠れマルコフモデル）音声合成

**名無しサンプリング＠48kHz** · 2018/11/22(木) 15:40:46.96

CeVIOは音声分析の一部にWorldエンジンを使っている事から、メル周波数ケプストラム係数等のパラメーターベースの分析再合成方式にHMM(や最近はDNN)を取り入れた方式っぽい。

**名無しサンプリング＠48kHz** · 2018/11/22(木) 22:54:36.87

ライブラリのデータサイズとエディタのパラメータから物理モデリングに近いものだと思ってたけど

**名無しサンプリング＠48kHz** · 2018/11/22(木) 23:52:13.07

音声合成であってモデリングではない
モデリングと言うなら声帯、気道、鼻孔、舌、唇をモデル化して制御してるのかって話
してないだろ

**名無しサンプリング＠48kHz** · 2018/11/23(金) 00:09:30.69

声を出す仕組みをパラメーター化してるって話を聞いたような

**名無しサンプリング＠48kHz** · 2018/11/23(金) 00:34:11.96

AIりんなの記事読むと物理モデリングの定義が広そうだな。違うと言えば違う
https://av.watch.impress.co.jp/docs/series/dal/1136630.html
> 沢田氏は「人間の歌い方を元にした物理モデリングを行なっています。

**名無しサンプリング＠48kHz** · 2018/11/23(金) 09:10:26.75

一般向け説明でどんな言葉(物理モデリング)が飛び出そうと、
それが音声合成業界で一般に受け入れられていない用語・用法である限り、その分野の未定義用語を比喩もしくはマーケティング目的で不注意に使ってしまったという以上の意味は無い。

「音声合成」はどんな方式であろうと、
大元には人間が声帯や口腔、鼻腔、舌、唇等を使って音声を出す機構の模倣という側面があるけれど、
その模倣方法は千差万別で、声帯や口腔の模型を使った発声実験、模型を抽象化した物理的モデルを扱う調音合成、波形やスペクトラムの特徴量を扱うメインストリーム、そして膨大なサンプルの切り貼りで同等な結果を得ようとする波形接続合成等がある。

そして全ての音声合成の大元に人間の物理的発生機構がある件は、「音響合成」分野でスタンフォード大学CCRMAのJulius O. Smith IIIが提唱した「Physical Modeling」とは直接関係ない。
Smith IIIの認識では、1961年デイジーベルを歌ったベル研の研究は、音響合成方式担当のMax Mathewsが「Waveguide」音源方式の原型を採用した点に関して、Physical Modelingの発端と位置付ける事ができるという程度の話。
そしてその系譜の研究には、声帯や口腔の(流体力学的)模倣を指向する「調音合成 (Articulatoly Synthesis)」や、数少ない商用実装系だったNeXT上のGnuspeechがある。

**名無しサンプリング＠48kHz** · 2018/11/23(金) 09:46:33.49

音響合成分野(そして潜在的には音声合成分野も)は良くも悪くも超ニッチな研究分野らしくて
一見、一般的用語を組み合わせた包括的概念のように見える用語が、実は包括的概念としては広く承認されておらず、特定の研究や方式を指す固有名詞として使われている例が多いので要注意だぬ。

例を挙げると:
・Physical Modeling : スタンフォード大学CCRMのJulius O. Smith IIIが提唱している、Waveguide音源方式他を扱う分野。音声合成分野ではArticulatory Synthesisの一手法。
・Wavetable Synthesis : 1978年に、後のPPG Waveで有名なWolfgang Palmや、作曲家のMichael McNabbが個別に開発し、
1993年Hoyer, Beauchamp & HakenがMultiple Wavetable Synthesisとして再定義を図った、複数波形を時間的に切り替えて音色変化を得る方式。
(波形テーブルを使う方式一般は、古くはTable-lookup synthesis として総称されていた)
・Sinwave Synthesis : 1970年代末Haskins Laboratories のPhilip Rubinが開発した、フォルマントピークを正弦波でトレースする音声合成方式。
日本ではLPC方式の先導的研究にあたるPARCOR方式から発展したCSM (Composite Sinusoidal Modeling
)方式として独立開発され、PC-6001mk2SRやCX5の歌声合成として広く知られている。

**名無しサンプリング＠48kHz** · 2018/11/23(金) 10:45:13.98

めんどくさいなあ
君友達いないでしょ

**名無しサンプリング＠48kHz** · 2018/11/23(金) 10:54:32.93

で、CeVIOはどんな方式なの？

**名無しサンプリング＠48kHz** · 2018/11/23(金) 12:44:34.65

名工大がそこら辺を正式に話したことあるん？

**名無しサンプリング＠48kHz** · 2018/11/23(金) 14:54:35.51

祝日昼間から三連投ワロタ

**名無しサンプリング＠48kHz** · 2018/11/23(金) 15:04:33.14

匿名掲示板は論文を読めない人が一行連投する場所だからどうでもいいか

**名無しサンプリング＠48kHz** · 2018/11/23(金) 15:24:11.15

論文読める人が作った曲を聴いてみたい

**名無しサンプリング＠48kHz** · 2018/11/23(金) 15:28:16.79

話がどんどんズレるのほ分裂症

**名無しサンプリング＠48kHz** · 2018/11/23(金) 15:55:07.49

サンプリングかシミュレーションかの話してるのに勝手に言葉が違う！とかイキって話ずらしてきたのは君じゃん

**名無しサンプリング＠48kHz** · 2018/11/23(金) 16:30:18.50

なんだ、的外れな二元論で対立煽りをし始めちゃったよこのバカw

Sinsy、CeVIOの方式なら名工大徳田恵一教授の資料を読めばいいじゃん。
2015年プレゼンを見ると、音声合成の歴史的発展過程が下記のように分類されていて
1. ルールベースのフォルマント合成
2. コーパスベースの波形接続型音声合成
3. コーパスベースの統計的パラメトリック音声合成
ボカロは2番目のグループ、Sinsy.CeVIOは3番目のグループに相当し
両方ともコーパスベースなので、生の音声データに基づく加工サンプル(2の場合)もしくは特徴量の学習データ(3の場合)を使ってリアリティを実現する一方、
特徴抽出・波形生成部に関して3の方式では広義のボコーダー(音声符号化に基づく音声合成エンジン)が使われている。
ただし同プレゼンでは、声帯や口腔の物理シミュレーションは「まだ難しい？」と疑問符付きで示されていて、その方式は使っていない事がわかる

**名無しサンプリング＠48kHz** · 2018/11/23(金) 17:43:21.41

波形生成ならモデリング音源でいいよ
なんか物理モデリングより若干グレードダウン感があるからかっこいい名前付けてくれ

**名無しサンプリング＠48kHz** · 2018/11/23(金) 18:27:00.79

もとからボイスシンセサイザーって言われてると思うが

**名無しサンプリング＠48kHz** · 2018/11/24(土) 08:52:34.17

眠い

**名無しサンプリング＠48kHz** · 2018/11/25(日) 13:02:25.78

>>206
「音声合成の歴史的発展過程～Sinsy.CeVIOは3番目のグループに相当」と
「プレゼンでは、声帯や～事がわかる」だけで足りるだろ…
ダラダラと長いと、お前さんが馬鹿だと思われて読んでもらえないぞ
多少正確性を欠こうが、>>194くらいに圧縮してもいい

**名無しサンプリング＠48kHz** · 2018/11/25(日) 21:31:48.62

おぼこい反応だな

**名無しサンプリング＠48kHz** · 2018/11/25(日) 21:34:12.48

「パラメトリック」にはルールベースとコーパスベースがある、という程度の話も判別できずにグダグダ絡むのはおぼこ

**名無しサンプリング＠48kHz** · 2018/11/25(日) 21:35:16.32

ただでさえユーザー少ないんだから険悪な雰囲気作らないでくれ

**名無しサンプリング＠48kHz** · 2018/11/25(日) 21:42:10.44

徳田さんが読んでも訂正が入らない程度の踏み込み具合にしとかないのがおぼこの踏み込み方

**名無しサンプリング＠48kHz** · 2018/11/25(日) 22:19:46.11

「ダラダラ長いと馬鹿だと思われて読んでもらえない、恥ずかしい」
というセンスに知恵遅れの高齢未通女特有の頭の悪さを感じるね

**名無しサンプリング＠48kHz** · 2018/11/26(月) 00:40:38.99

文章が長いのは理解が足りないから

**名無しサンプリング＠48kHz** · 2018/11/26(月) 01:30:43.39

長文読めない自慢はチラシの裏でヤレ

**名無しサンプリング＠48kHz** · 2018/11/26(月) 05:23:49.88

長い文章と冗長な文章は別だわな

**名無しサンプリング＠48kHz** · 2018/11/26(月) 10:43:12.77

ただ技術のソースのリンク貼れば済むものを。。。
長文でスレを汚さないように気配りしてる住人まるごとアホ扱い。論文読めるの俺だけってところがレベル低いんだけど気付かないんだろうな。

**名無しサンプリング＠48kHz** · 2018/11/26(月) 11:10:55.14

長文読めない自慢と文献探せない自慢の愚痴でスレを埋め立てる痴れ者

**名無しサンプリング＠48kHz** · 2018/11/26(月) 11:10:59.51

いやリンク読みに行くなんて面倒だし書いてくれた方がありがたいよ

**名無しサンプリング＠48kHz** · 2018/11/26(月) 11:16:58.01

でもなんか言葉だけで見ると音声のバリエーションあれこれ作れそうなんだが、なんで似通ったような声しか出せんのかね？

**名無しサンプリング＠48kHz** · 2018/11/26(月) 11:17:04.24

そもそも匿名掲示板で専門記事や論文の解説をしてもらおうとする時点で、能力のないアホ確定だから相手にする必要がないだろ

**名無しサンプリング＠48kHz** · 2018/11/26(月) 11:25:26.25

語る阿呆に読む阿呆だろ

**名無しサンプリング＠48kHz** · 2018/11/26(月) 11:42:12.35

皆がひっそりと嗜んでいたのに自称識者がドヤ顔で場を乱してるのが哀しいです
何がしたいの？低能ばーかばーかって煽りたいの？

**名無しサンプリング＠48kHz** · 2018/11/28(水) 22:37:16.27

多分32bitアプリケーションだからだろうけど、何をやるにしても反応がワンテンポ遅いのどうにかならんの？
64bitにするのそんな大変なの？今時64bitに対応してないようなソフト相手にされないだろ

**名無しサンプリング＠48kHz** · 2018/11/28(水) 22:43:35.39

その場でレンダリング(っていうのかな?)してから発声するようなメカニズムだからね
64bitにしたから反応良くなるものでもないんじゃない？良くて1割とか

**名無しサンプリング＠48kHz** · 2018/11/29(木) 00:43:58.31

多分マルチコア化も64bit化も全く役に立たん部類のソフトだとは思ってる

**名無しサンプリング＠48kHz** · 2018/11/29(木) 09:17:16.38

んなわけねえw
ミュートやソロボタン押すだけでワンテンポ遅れるんだから
俺のi7-7700のPCのせいじゃないぞ

**名無しサンプリング＠48kHz** · 2018/11/29(木) 09:23:55.15

64bitとか全く関係ないな

**名無しサンプリング＠48kHz** · 2018/11/29(木) 10:19:30.49

全くだ

**名無しサンプリング＠48kHz** · 2018/11/29(木) 10:34:05.18

CPUとかメモリーとかに負荷がかからない配慮のためだろうか？
トークトラックの追加と削除はとくに気になる重さだ。

**名無しサンプリング＠48kHz** · 2018/12/01(土) 23:12:15.90

冗長長文野郎が教えてくれるさきっと

**名無しサンプリング＠48kHz** · 2018/12/01(土) 23:27:34.36

将来的にDAW連携が強化される予定があるとの含みを持たせているのに
まだ64bit化されてないのは不安しか残らなくね？

**名無しサンプリング＠48kHz** · 2018/12/01(土) 23:29:53.37

Cubaseだとブラックリスト行きだからマジで64bitは必須

**名無しサンプリング＠48kHz** · 2018/12/02(日) 22:41:37.25

そこまでいうならPCスペックと症状でも書けばいいのに

i7-8700/SATA3SSDで特に困ってないけど

**名無しサンプリング＠48kHz** · 2018/12/02(日) 22:57:37.00

DAW連携するならの話だよ。32bitとっくに切り捨てられたから

**名無しサンプリング＠48kHz** · 2018/12/02(日) 23:50:18.20

高スペックでドヤ顔されても
問題ないの当たり前だろ馬鹿かw

**名無しサンプリング＠48kHz** · 2018/12/03(月) 00:23:24.58

まあ世の中には高スペックすぎて予期せぬ不良動作させてしまう人もいるからね…

**名無しサンプリング＠48kHz** · 2018/12/03(月) 00:39:21.55

話が全くかみ合わないのは
曲を作っているかどうかの違い
DAWとの連携強化を行うなら64bit化は不可欠

**名無しサンプリング＠48kHz** · 2018/12/03(月) 00:43:17.32

曲作ってるけどCeVIOはそういうもんだと割り切ってる
DAWでメロディートラック作る→MIDIで書き出してCeVIOで音声化
→DAWにWAV読み込み
CeVIOの外部WAVミックスは使ったことない

**名無しサンプリング＠48kHz** · 2018/12/03(月) 00:49:43.46

まー、もちろん64bit化してRewire対応させて欲しいとこではあるんだけども
再生ボタン押してからレンダリングして再生する今のエンジンじゃ無理だろうなとも思ってる

**名無しサンプリング＠48kHz** · 2018/12/03(月) 12:57:45.56

>>241
現状はそれしかないよね
始めに割り当てていた音色だといい感じなのに、
ささらにしたら「あれっ？」ってなるリスクが嫌だけど

**名無しサンプリング＠48kHz** · 2018/12/03(月) 13:08:50.80

>>243
ささらさんのaiueoをサンプラーに取り込む(名案)

**名無しサンプリング＠48kHz** · 2018/12/05(水) 21:32:49.56

>>233
おめぇまた長文読めない自慢してんかよw

**名無しサンプリング＠48kHz** · 2018/12/05(水) 22:01:06.05

アップデートきたぞ！

**名無しサンプリング＠48kHz** · 2018/12/06(木) 07:07:13.72

何か変わった？

**名無しサンプリング＠48kHz** · 2018/12/12(水) 14:52:24.90

アプデの半分以上はトークの方だからなあ

**名無しサンプリング＠48kHz** · 2018/12/14(金) 18:22:08.20

やばいやつ出てきたな
Cevioオワタ

**名無しサンプリング＠48kHz** · 2018/12/14(金) 18:38:23.34

製品化頑張って欲しいな

**名無しサンプリング＠48kHz** · 2018/12/14(金) 18:56:51.15

ささらがデモに使われてるから後継に期待しちゃうぞ
GPU要求スペック高いだろうけど俺はそれでも欲しい

**名無しサンプリング＠48kHz** · 2018/12/14(金) 19:06:38.11

これはCeVIOを買った甲斐があったというものだ
ささらがまたここまで化けるとは思ってなかったからすごく嬉しい

**名無しサンプリング＠48kHz** · 2018/12/14(金) 19:35:17.26

CPUじゃなくてGPUになるのん？自前で学習させられるとは思えんが

**名無しサンプリング＠48kHz** · 2018/12/14(金) 19:46:42.69

クラウドベースで学習データ適用来るかも
製品化するなら第二世代という扱いかな
CeVIOの名前で出してくれるとユーザーとして嬉しい

**名無しサンプリング＠48kHz** · 2018/12/14(金) 20:03:27.83

これまでの流れを汲むなら、歌い方パラメータをセッティング済みのアセットに
さとうささらの声色を乗せたものがパッケージになるイメージだがどうなんだろう。
調整のUIはこれまでどおりでも全然問題ないレベルだと思う。
これでトークとソングの声質の差もかなり埋まる気がする。
タカハシがめっちゃ美声で歌う可能性も出てきたのが今回一番ヤバい。一部の界隈で突沸しそう。

**名無しサンプリング＠48kHz** · 2018/12/14(金) 20:33:36.16

>>253
GPUを使っても計算時間がかかる、と言ってるので
CPUで代用すると10倍くらい遅いと思った方がいい
waifu2xとかCPUで使ってみれば遅さを体感できるよ

**名無しサンプリング＠48kHz** · 2018/12/14(金) 20:37:14.06

仮想通貨業界が瀕死になってやっとGPUもまともな値段に戻りつつあるから仕込むには好機
製品化されるのが何年後なのかだけだな

**名無しサンプリング＠48kHz** · 2018/12/14(金) 20:39:04.69

最適化が進めば速くなる類のものか、プロセッサそのものの計算能力が上がらないとどうしようもないのか
計算能力を要求するタイプなら必然的に多コア対応するようになるだろうけど、多くのPCでは性能不足でまともに使えないものになってしまうおそれも

**名無しサンプリング＠48kHz** · 2018/12/14(金) 21:05:59.55

ずっと無料アップデートで悪いくらいに思っていたので、ここらでアップグレードは追加料金でも構わないくらいには思ってる。

**名無しサンプリング＠48kHz** · 2018/12/14(金) 21:13:30.49

サーバーサイドアプリでサブスクリプションという手もある
GPUを個人が買うとソフトより高い出費になるうえ、
最悪、動かない・・・まであるからな

どちらにせよ、DAW連携はもう諦めた方が良さそうw

**名無しサンプリング＠48kHz** · 2018/12/14(金) 21:30:29.93

それより心配なのは個人ユースじゃなくて商業展開の方だなあ。
ここまで高品質な発声だとカラオケ屋で自分の代わりに歌わせて楽しむささらカラオケオフすら成立しうるので
GPU枚数に物を言わせて数千曲作りたい職人向けのライセンシーどうするかってなりそうだ