ヤマハ歌声合成ソフト『VOCALOID』Part79
■ このスレッドは過去ログ倉庫に格納されています
ここまでガン無視されるとは思わなかったんだろうな
天下のYAMAHAは栗の努力から使用料を徴収するだけw クリプトンもボカロソフトで儲かってるようには思えないからな 今更ながらボカロ興味あって知人から未開封のIA duo pacっての貰ったけどこれだけで始められる?
他にも用意するものあるかな? 「VOCALOID3 Editor」
がついているなら多分問題ない。ついてない方のパッケージなら・・・
IAってのは音声ライブラリなんで別途エディタが必要となってくる。
・初音ミク等のクリプトン社製ライブラリに付属するピアプロと言うエディタ
・Vocaloid Editor 4 (販売終了しているがギリ店頭在庫が無いでもないかもしれない時期。1万円程度
・ボカキュー4(同上、Cubaseと言うDAW上でのみ動作するエディタ
・Vocaloid Editor 5 (恐ろしく重い上にクッソ高いので最後の手段
と言う選択肢がある。
もしDTM自体をやったことがないのなら、DAW(デジタル・オーディオ・ワークステーション)が必要だ。
これでオケを作ったり、ボカロとオケを合わせたりする。
これについては最初は「Cakewalk」と言うものでいい。完全無料で最低限の楽器・エフェクタも付いてくる。
また、有料品よりは品質は相当劣るものの無料のVSTプラグインと言うものがごろごろ転がっており、
余程のガチでやらない限りはタダでなんとかなる。
これについてはここでこれ以上詳述するとスレ違いになるので、
必要なら本を読むなり、適切なスレを探すなりしてくれ。 >>593
俺の記憶が正しければIA duo pacにはTiny V3 Editorというお試し版(機能制限版)のエディターが同梱されてるはずだから
とりあえずそれとIAライブラリをインストールすれば短い曲を歌わせることはすぐに可能。 >>595に補足
知人の方から詳しい説明を受けたかどうか分からないけど、貰ったパッケージは同一キャラクターの2種類の声色が入ってるもの。
もし自分でも使えそうだと思ったら、>>594の説明にあるようにV4エディターかピアプロスタジオをゲットして、クロスシンセシスという
2種類の声色のミックス調整機能にチャレンジしてみてください。 Tiny V3はWin専用みたいだな・・・マカーだったらごめんね ニコ動でこんなのがあったぞ
【調教晒し】VOCALOID4とVOCALOID5の比較【検証】
sm34249876 試聴ページ
AI技術により超高精度な歌声合成を実現
https://www.techno-speech.com/news-20181214a
詳細記事
歌声合成技術に革命!ディープラーニングで人間さながらに歌うAI歌声合成システムを名工大とテクノスピーチが開発 | | 藤本健の "DTMステーション"
https://www.dtmstation.com/archives/22902.html
AIの力ってこれほどのものなのか… ヴォー、これでベタだと。
さすがにクソオモなようだが?俺の耳が生きているウチに手元に届いてくれるといいな。 ゾクゾクするぜ
使い手が作りたい思う本来の歌声表現に合成音声が応える時代が来るんだな
クリプトンもどうかこっちに来てくれ 生身の中の人(ミクなら藤田咲さん)の歌唱力が学習基準になるのだとすると
うっかりコレジャナイミク(割と音痴)が生まれてしまったりするものかねえ。
V1のふたりに関してはまったく心配しなくていいな。 りんなの歌も驚いたけど、これも凄いな
公式のデモソング聴いて、誰かに似てるなーと思ったら奥華子だわ
俺がおじいさんになる頃には社会的にもAIの歌が1つのジャンルというか、一大勢力になりそうだ いまのボカロ5だと、このAIの「技術革新前」のレベルっぽいね。
「技術革新後」を聞くと、大きな差だと、はっきり分かる。
ヤマハはボカロにこだわりすぎずに、製品化で相乗りすればいいのに。
あるいはAI側は、クリプトンなどと組んで、ヤマハに対抗するようになるのか。 低音寄りな男声も高精度合成できるのかな
女声サンプルを聴くだけでも低音部にめっぽう強そうという印象だが どう見てもりんなに触発されて慌てて後追いを始めた風に見える
誰かが石を投げないと何も出来無いって情けないジャップ感
多分まだ全然出来て無いと予想 記事も読まずにジャップとか批判するのはウリナラの人たちかねぇ
りんなの開発者は今回のAI歌声合成システムを開発した徳田研究室にいた沢田氏で
徳田研究室はこれまでCeVIOやSinsyも発表してた
またりんなが人間の歌唱をお手本にするために歌唱サンプルがたくさん必要なのに対して
今回のAI歌声合成システムは歌詞とメロディだけ入力すれば人間のように歌ってくれる
言うなればりんながスピンアウトでAI歌声合成が本家本元の決定版 りんなはアルファ碁みたいなもんだね。
出音の品質はともかく生成効率は圧倒的に今回のものが優れてるはず。
しかし今回のシステム、名前はまだ無いのかな?
ボカロと区別しないとね。AIが頑張りましたと分かるようなのがいい。 名前欲しいよね
ボカロがアンドロイドの変形なら、AI歌声合成はサイボーグの変形でサイボーカルとかどうよ(ダサい
簡単に説明するなら
りんなは歌わせたい曲の人間の歌唱サンプルが大量に必要
AIはその学習がディープラーニングにより既に済んでいるので歌詞とメロディの入力だけで人間らしく歌ってくれる
つまり歌わせたい曲ごとに歌手をゼロから育てるのがりんな
既にある程度の実力を備えた歌手に歌を歌ってもらうのがAI りんなってそんなに面倒なシステムだっけ?
それなりに歌唱サンプル集めたらその応用で他の新しい歌もそこそこ上手く歌うもんかとばかり >>610
−−今回の歌声を聴いてMicrosoftのりんなの歌い方を彷彿しました。
りんなは徳田先生の研究室にいた沢田慶さんが担当されていますが、これとの関係性はあるのでしょうか?
徳田:Deep Neural Networkを利用しているという意味では共通の部分がありますが、
Microsoftさんの方では、「歌詞と歌声」から「歌声」への変換という形で、
ユーザーの歌い方を真似るために活用しているのに対して、本方式では、
完全に「歌詞付き楽譜」のみから歌声を合成している点が大きな相違点になります。
https://www.dtmstation.com/archives/22902.html GPUが必要らしいのはAI活用してる
からか
NIVIDAの最新のGPUはAI用のハードが
組み込まれてるからDTMにもGPUが
必要になるのか、それかクラウドで
利用する方向になるのかな 一方、ミクのV5でも出ない限り盛り上がりようがないボカロであった。 V5のボイスバンク1本作るのにいくらくらいかかるんだろ。
ウナのような大当たりの持ち込み企画でもないとヤマハの堅いボイスでは到底戦えないだろうに。
VYシリーズよりも地味な、高品質コーラス要員で終わってしまう。 V5エディターそんな悪い?
使い勝手は工夫でなんとかなってるから
歌声よくなったのに皆使ってない分差がつけれてラッキー >>616
さんきゅー
AIのは未加工であれは凄いね
デモの瞳の最後、音が下がりきらずに外れかけてるのはなんでだろ
どんな学習方法なんだろう
歌唱方法とか指定できるのかな? CeVIOを使ってれば分かるけどあれはもともと独特の癖があるよ。
新しいのも学習結果もしくは学習教材に人手での微調整を入れてないんじゃない。 優れた自動部分と細かい微調整が何処まで出来るかが売れるカギに思える ありがとう なるほどー
低域でない人があーいう外しかけ方することあるなー
ある意味リアルだなーと思ってたら、そういう事かもですね どのボカロもどの音素でもこれくらいクリアな発声をしてくれれば
V5のアーティキュレーションが活かせると思うんだけどな。
一言で言うと声質がもったりしてて今となっては古臭いとすら感じてしまう。 古臭いのは当たり前だろ
ボーカロイドが何年前の技術だと思ってんの 基幹技術はFDSASSのまま、トライフォン対応(V3)、グロウル、xSy対応(V4)くらいだったっけ
合成音声の本質部分で拡張された部分は。
V5で良くなったのはボイスバンクの構築方法を変えたんだろうか? V5エディタは重いというよりはレンダ待ちが困るってだけかと。あれバックグラウンドでやってくれたら特に不満ない......不満はあるけどとりあえず使えるわ。 マイクソソフトとのコラボがポシャったなんて言わない方が良かったよな V5.2出たな
やっとロケート周りが同期するようになった いまだにやっぱ、機械音声は苦手って人が居る。まあうちの相方とかなんだけど。
が、生声っぽく調教した奴とかは聞けたりする人もいるようだ。
っつーことでボカロもいいけど、やっぱり生声に近いのもあった方がいいよね。
そもそも機械音声って、元々は人間に近づけたいがあるものだろうし。 機械音声と言えば、高速道路での交通情報はほとんど合成音声になったみたいね あー、うちんとこの市バスもやな。
内容に変更があるたびに声優さんとかアナウンサーとかその辺り雇って撮り直すより早くて効率が良いんだと。
まだ自然とは言いがたいけどな。どこのどんなエンジンか知らんが。 輸出大国を気取り続ける為の歪な円安誘導
国内への皺寄せで購買力が落ちるのは当然 >>634
独Cubase社のサーバーのJPドメインの接続を弾くとか(並行輸入品のアップデート対策)
YAMAHAはそういう汚い商売を平気でするところ 外人たちの損して得取れブラックフライデー商法みてるとほんと日本人は商売下手だよな
そりゃDTM界隈じゃ日本企業ほぼ壊滅するわ 自分で作らない人が商売するもんじゃないよ
クリプトンとの対比で分かる こないたアップデート来てたから久々に起動したけどGUIの文字がクソ小さいの思わず笑えるレベルだよなぁ視力検査かよ 発音ミクさんのようなことをするために人間を使うのはどうなのかね ボカロ4エディターとピアプロだったらどっちの方が使いやすいですか? >>642
V4Eを使うなら、ReWireで使いたい。だが保証外ではある。うちではちゃんと動いてるがな。
EVEC対応ならピアプロ一択、
安定性を取りたいならV4E(外部アプリなので巻き込みクラッシュはほぼ考えなくていい)。
マウスのチルトホイールでスクロールしてくれるので俺はV4Eが好き。 >>642
一通り試したけど、cubaseならボカキューがぶっちぎり
唯一VSTiとほぼ同じ感覚で操作できる
それ以外のDAWなら>>644の通り そいやDAW(またはプロジェクトで指定しているプラグイン)は結構オチるけど、
V4Eは堅牢だな。俺落ちたことないや。 ミクの調教についてですが、なんだか思った様な感じになりません。
https://dotup.org/uploda/dotup.org1724966.mp3
もっと跳ねた感じ、メリハリのある感じ(グッと声に力を込めたり抜いたり)になって欲しいんですが、
ピッチの上下はある程度変化を付けれる物のなんか一本調子になってしまいます。
ミクの元の声質から言って、やはりそういうのは難しいもんなんでしょうか?
ちなみに使用しているのはミクV4Xです
あとエディタから出力しただけの状態、素の状態ではとりあえずこんな感じでかなり素っ気気がするんですが、
この段階ではこんなものなんでしょうか?
なんだか線が細いというか「複雑さ」が無いみたいな。
人間の歌のミックスとボカロのミックスとは完全に別物ですか?
ちらっとネットで見ましたら、サチュレーターで倍音を足すとかいうのも見掛けたのですが、
ボカロの場合はオケに馴染ませる以前に、「化粧」をしてボカロそのものの声を派手にしておくみたいな前段階があるんでしょうか? 全く人によるが、BRI/CLEあたりは必ず制御する感じで。
VocalShifter使ってもいい。音と操作性が好みの方で。
モゴモゴ部と朗々部を付けた方がいい場合げ結構ある(サビとか)。
VocalShifterでは子音を細かく制御するのもよくやる。
大体ここまでが、素かなあ。
ミックス前段階ではなんでもありだよ。
T-rackSのMIC ROOM通して見たり、
Melda Mcharachterも良く使うし(突発的な低音で基音をカットしたり・・・EQでも似た結果になるけど。低次の奇数次倍音制御はかなり効く)、
エキサイタ・エンハンサもとかく考慮はする。
このあたりはオートメーションでできるだけ適切に制御してやりつつーの。
もちろん正解なんてない。楽曲およびそのサウンド構成、そして目指す歌唱次第だから。 あーそうそう、ビブラート含めてピッチ制御をボカロに任せると、
いかにもボカロの音になるのよね。ボカロだから当たり前だけど。
ワイはピッチは外部で手動でいじるね、ほとんど。
ボカロっぽくするか消すかもこれ、状況や好みに合わせてみたいな。 >>647
ありがとうございます。
一応教科書レベルの内容は理解しているつもりなんですが、
あくまでボカロエディター内での作業の話なので、やはりそれだけだとこのレベル止まりって感じですかね
それ以上の調教となるとはなからボカロエンジンは当てにしないというか、
声だけ出してもらったら後は全部こっちでやるんで、みたいな
一応ダイナミクスとかvelocityはいじってみてるんですけどね
これ以上の人間の様なメリハリ、声の出し入れはどうするんかなと
頭の中ではさらっとイメージ通りに歌えるんですが
ただ書かれている内容を見ますと(BRI/CLE制御、子音制御、倍音制御)、
いや〜〜〜(笑)頑張ってみてもいいけど、そもそもそこまでそれを究めるのが果たして自分の仕事なのか?と、
これはちょっと考えますね そら君、本当に本気出したら1曲に何ヶ月もかかっちゃうから、誰でもw
どこで妥協するかは常に云々。 人間的なダイナミクスを重視するならCeVIOの新バージョンが出るまで待つ方がいいかもしれない >>647
とりあえず跳ねさせるならもっとノート短くしよう。
多少短くしてもなお、適当につなごうとしてくるエンジンなので。 >>653
タイミングがなーやっぱなーどうしてもなー(苦笑
ボカロだとどうしても目指すデュレイションにならなかったり、ピッチカーブが描かれなかったりする。
そういうケースについては入門書ではトラック分けなんかで解決しろとされているんだけど。
wav編集ツールを使うとそのあたりはかなり自由自在になる(ピッチ変更系ソフトは結構あるがボカロならVocalShifter一択だろう)。
気にならないならいいけど、気になるのにボカロの限界だと放置する手はないからね。 外部でどうこうするのは基本だけどこのスレの担当外ではあるんだよな
人間の微妙なボーカル扱うのと変わらないからね 人のヴォーカルよりトランジェント系はかけやすいかもしれん。
ハキハキさせたいときはよく使う みんな5使ってる?
何であんなにもっさりなの凄く腹立つ これからの新規は5しか買えないので4までのユーザーとギャップが出そうだ >>660
V4E持ってなかったのか。
災難だったな・・・。 やっぱり使ってない人多いんだろうな
せっかくvst化したんだからもう少し親和性高めるとか、ARA対応させるとかできなかったもんかね
とりあえずレンダリングだけでもなくしてほしい >>661
V4Eも使ってたが、
音が中途半端に悪くて、
我慢して使ってたから今回もうあえて切った もう3の音なんて忘れちゃったわw
5はレンダリングさえ賢く組んでくれていればよかったんだがな。
そこのアルゴリズムがアレすぎて実用に堪えず他の場所が評価不能っていうね。 >>657
V5で粗組み→とりまwavにオーディオ出力→cubaseのvariAudioでwavを再びmidi化→cubaseと一体操作はできる。しかし、チューニングに行き詰まる→V5に戻ってやり直し。
もう無間地獄でつ。
昔はボーカロイドと一体操作できた時代があったそうでつ。
何か、いいやり方はないでつか?
レンダリング対策で、短く切るハサミはある。
しかし、元にもどしたくても「ノリ」がありまてん。
途中で別の曲を操作したくても「閉じる」がありまてん。
いちいち終了と再起動で時間がかかりまつ。
もう無間地獄でつ。 エディタ自体の機能が、何故か落ちまくっているし・・・・。
開発期間=開発費、の制限からだろうか?
V5.9.9.9.9くらいで完成なのかいな。
エフェクタも素直にVSTのスロットだけ拡張してくれりゃよかったのに・・・。 キュベの新機能タイミングのやつ便利そうだなぼかりすみたいに使えそう
自分で歌った通りのタイミングに合わせ込んでくれるんだろ ボカロ5は、テンポ変更指示でも全体を再レンダリングする。
スローで入る曲でボカロ5を使おうとしたら、発音不能になって泣いた。
とにかく、何か一個触るだけで再レンダリング発生。
これは、小節単位で細かく切る対応策では、まったく解決できない。 再生直前にレンダリングするUTAU面倒だなって思ってたけど、それを上回ったV5 DAWのようなトラック分けは基本
もちろんシンガー個別に1シーケンス作成 ミックスで音変わるんだし、そこまで音質にこだわっても
激変するなら話は変わるけども zero-Gのボカロもあんまり安くなってないな。けっこう強気? ボカロ始めてCubaseでPiapro使ってやってるけど何かと不便すぎる
ボカキュー別売り販売終了はダメでしょw
YAMAHAはユーザーのこと分かってないのか… おいらはSONAR使いだからずっとピアプロだけど、
今では慣れて有り難いと感謝しながら愛用してるよ。
動作が軽快なのが当たり前じゃないんだものね。 歌唱音声ソフトはsynthVとcevioのとこの新しいプロジェクトに期待してる ボカロはキャラクターを捨てては存在しえない、ということが証明されそうだね キャラクターを含めてボカロはお払い箱になるかも知れないぜ >>672
V4Eのほうが音量の安定度は上という印象があります。
ただそれを「おとなしく感じる」所はあるかも。 ミクがボカロには興味無くしましたみたいな流れで笑えない 大成功し続けてるキャラ商売も
元々ユーザが作った数々の名作のおかげだというのが
まんまと上手く乗せられた感ある
皆が延々とボランティア宣伝し続けたという まぁどこもボカロには勝てんな
ただの音源を越えた存在になってるし >>688
理解したかしようとしたからこそのV3でクリプトンボカロが出るまでの
ヤマハが全社のキャラを引っ張るぜな微妙なムードがあったのでは? V5EditorでStyle読み込ませて歌わせただけの状態で
物凄く音痴になるのはどうやったら直る?
skillとか上げてるし、前まともに歌ってた曲と同じような設定なのだけど singing skillはclean,skill5,amount5で語尾のピッチが不安定 ■ このスレッドは過去ログ倉庫に格納されています