ヤマハ歌声合成ソフト『VOCALOID』Part81
■ このスレッドは過去ログ倉庫に格納されています
v1: CHATR世代の波形接続合成(音声コーパス方式)に、MTGがフォルマントの微細構造操作を加えた方式
v2: MTG方式で難のある部分を、波形接続合成寄りに手直し?
v3: 技術論参照
v4: クリプトンが先行した声質別音声データベース切り替え方式の公式実装、クロスシンセシス、グロウル
v5: v3発表後に急速に発展した機械学習による合成/調整方式へのキャッチアップ 良さそうなコンセプトを使い勝手を無視して詰め込んだ、Sonyのはずれ製品のようなもの >>418
聞く専もいるだろうが、俺は作り専に近いな??
いるだろ、AKBグループの全メンバー言えないヤツがたまに。それと同じだ。 パート分割した状態で単一ノートのパラメータいじっても一瞬で処理終わるけど、めちゃくちゃ重い人は環境か何かが全く違うのかな
全体適用のスタイルをいじったら重いというなら分かるけど ノート一個一個いじる手間に比べたら大したことないから
8とか4小節で分割でいいと思うんだけど
次のパートに移るのはダブルクリックだけだし 前にも書いたけどV5エディターはリリース当初から変更範囲のみレンダリングを行う実装になってるのに、それを阻害しているのがコントロールパラメータの仕様
このコントロールパラメータのポンコツ仕様のせいでエディットされていない状態だとそのノートからパート最後までのレンダリングが必ず発生する
VPRロード時、シンガー変更、Singing Skillの場合はパート全体でも仕方ないがコントロールパラメータ編集でパート最後まではダメだろ
バックグラウンドレンダリングがあることを考えずにコントロールパラメータをV3以降の仕様と同じにしてしまったヤマハが大馬鹿で
V5のコントロールパラメータ仕様を考えた奴というか考え無しに作った奴こそユーザーの作業時間を膨大に奪うA級戦犯
V3で「コントロールパラメータの描画動作をV2互換に」の設定が出来た経緯を理解していない技術担当がバカ パート分割は弊害もあるのとコントロールパラメータの対処はパート分割以外もやりようがあるとしても、それでもパート分割は推奨する
理由はプレビュー用WAVEファイルはパート単位で出力するから1カ所修正してもパート全体のファイル出力では無駄が多すぎるため
1カ所修正で20MB前後のファイル書き込みは調教での修正回数を考えたらSSDに優しくないんでパート分割して書き込み容量の合計を削減すべき SSDにやさしくないwwww
SSDの書き込み寿命がどれぐらいだかわかっていて言ってるのか? 話題が終わった頃にまたさらっと蒸し返すのなんなの?禿げなの?チビなの?デブなの? フラグメントはそれなりにランダムR/W速度に影響を及ぼすと言う結論が出ているはずだが? SSDくらい寿命来たら買い換えろどんだけ貧乏なんだ VOCALOID5辺りになればあらゆることが自動化され調教って言葉は死語になると思ってたのに V5は『ボカロPが願う理想的な合成処理が行われるという前提で』
「こんなUIなら指図しやすいと思うんですけどどうです〜?」
というヤマハからの前振り的試作バージョンだと理解している。 ↑『』の部分は技術的な事情で実現できていないけどね。 剣持氏はこの分野の開祖として超有名だし
v5の出るだいぶ前にボカロから新規プロジェクト立ち上げ部署に異動になったのは有名なのに
意味ありげに「K氏」とイニシャル表記してv5の製品責任者であるかのような、誰も騙されない嘘を書くのは頭が痛く悪過ぎるね そーゆー子供じみた嘘デタラメが通用しちゃう
知的レベルの低い荒らしが来てるって判るからいいけど 実装実務の引き継ぎに失敗したからこうなったとしか思えないからそう書いただけです
それは違うというのが分かる詳細な経緯をご存知ならご教授願いたいものですが 少なくともV4まで深く関わってたのは間違いないと理解してるんで、異動前にヤマハが満足に
後任者に業務ノウハウを引き継がせなかった(時間を与えなかった)のならヤマハの体質の問題だけどね >>450
ヤマハから出ている情報すらまともに把握せずに
想像力豊かなストーリーをでっち上げて
ストーリーが違うなら資料を示して反証しろというのは、品性の低い人間特有の「言いがかり」だよ。
妄想ストーリーを書いたおまえ自身が、妄想を実証する義務がある。
ただしおまえの妄想ストーリーなど誰も相手にしないけどな。 音声情報処理学会とかには行かないけど少なくともヤマハやクリプトン等の関連公式ツイッターは読んでるよ。
その上で、V5を誰がどういうプロジェクトチームで開発して、どうして今がこうなったのかが分からないから不審に思ってる。
既に異動されたK氏の功罪という話がしたいわけじゃないけど、以降に名前が出てるリーダー級が見当たらない。 K氏は実際には関わってるとか言いたいのこの人?
それともK氏の引き継いだ構想通りのものがV5だって言いたいの?
それこそ妄想力豊かすぎない? 妄想ストーリーが妄想なのは事実だし外野の言いがかりなのも事実だからそこが不快なのは自分が悪かったから謝罪するが
ヤマハの出してきたモノの使い勝手が不快なのをヤマハから謝罪をもらいたいものだよ。 技術や会社を語るわりに何も一般常識を知らないんか?
当時の剣持氏の役職は主幹技師だっただろ
開発に携わっていると紹介されてたのはVOCALOIDの研究段階で現場にいたためで主幹技師は一般には技術畑の部長職で
現場の技術情報引継ぎなんてVOCALOID2の時点でも既に関係ない役職だわ
開発担当部長か室長なら当時も開発現場を取り仕切ってるのは直属の部下で部長クラスはそれを管理するのと営業を兼務するくらいで直接の開発は担当しない >>454
V4が普及した時点で、V5に実装された新エフェクトの理論部分が既に出来ていたのだけは確かなんだろう?
当時の異動前の氏に次期V5の機能を構想する場面がどの程度まであったのかは知らないのだけど、
理論を実装する以上は仕様を誰かが厳密に策定しなくちゃ書けないから、その誰かが誰なのかってことなんだよ。 >>456
自分はヤマハ社員じゃないからヤマハ社の組織形態を知らない。
大企業の中のそれほど大きくない一部門といっても、上から下までプレイヤー(上はプレイングマネジャー)な会社だって
(少々ブラック気味だけど)よく聞く話。
ともあれ、氏があまり実装部分に目をかけられる立場じゃなかったのなら、「自分で使わない人が作ってる」という批判は
一個人ではなくV5開発部門全体に当たることになるのかな。 >>444
寿命きてるってことはHDDで言う所のバッドクラスタが出ている状態で、
クローンが正常動作しない可能性が相応に高い。
となるとクリーンインスコになり。
アホほどプラグインを持っているDTMer各位はクリーンインストールは最大限避けたい所。
まあ本当の意味で寿命ってのはあまり考えなくていいが、容量的な寿命がある(陳腐化
だからコスパの許す限り最大容量を買って長く使おう。 SSDで不安と思うならRAID1や5で運用した方が良いよ
>>445
それやる前にサンプル数増やしていろんな歌い方が出来るようにしないとダメかと思う ここに交代時の話がちょっこっと出てるけどさ。
https://togetter.com/li/776056
4年前に剣持に代わった新しいプロジェクトリーダーってだれ? てかさ、なんでブレスの音とか入ってないの?ボーカル音源でしょ?ギターノイズやベースのノイズなんかも当たり前のようにある時代やん。もしかして言われるまで分かんないの?クリプトンって脳無し集団やなw >>459
賢明なDTMerはひととおり環境構築できた時点でまずクローンを作っておくでしょ。
大事な機材・資産がある日突然吹き飛ぶかもしれないのに保険をかけないなんてありえないよ >>465
環境構築と言うが、100点の環境に組み直せた事なんてねえw
取り敢えず必要なもので構築して、あとは使う時に組み込んでいく方式だな。
なーーーにせ、再構築に半月とかストップしてらんねぇから。
うちはまだ、10Tが2台あれば交互のミラーリングが効くけどよぅ・・・。 >>466
日常使いのバックアップストレージと最後の保険用クローンは分けた方が無難よー RAIDや自動同期はハードウェアエラーには対処出来るがソフトウェア的なそれに対処できないから、
外付け大容量HDDにクローン作って、普段はハズしておく運用してんのよ。
ちょっと前にもあったよな。「WindowsUpdateかけたらファイルがごっそり消える」とか。
が、差分バックアップとは言え、「差分確認」だけで相当な時間がかかるからウゼぇ・・・。
音源我慢してでももうちょっと予算投じるかなって所で、こんなもんにしとくべぇか。邪魔したな。 V5がWAVEファイルを場所固定で出力して環境変数すら見ていないのが悪いんでは?
システムドライブに出力されたら不都合なだけ バックグラウンドレンダリングのWAVEファイル出力が場所固定って意味 Windowsで特定フォルダ配下を別の物理ディスクに配置したいなら、3rd partyのハードリンク設定エクステンションを使ってジャンクション設定すれば終了なのって20年近く前から常識だろ。
なんかWindowsのノウハウも無かったり、剣持氏をK氏と呼んでみたり、とんでもないエアプが暴れてるな MSDOS時代にもjoinとsubstでドライブとフォルダの相互変換が可能だったから30年以上前からの常識だな MacはFreeBSD系だからシンボリックリンクで問題ないんじゃ?
Windowsも去年の7月からシンボリックリンクで使ってV5で問題は起きていない vocaloidはv5genなのにクリプトンの初音ミクが未だにv4xなのはなぜ… ・V5は失敗作だから移行する意味なし
・ミクはV4XだろうがV5だろうが関係なく売れる
・ボカロ売上シェアの7割持ってるクリプトンの立場の方が大きい ヤマハがサードにAPI渡さないって話どうなったんだっけな API公開をV3から始めたがクリプトンのPiaproStudio以外からは声がかからなかった
API商売であまり儲からないと考えてなのかエディタをV5独占に戻したのだろうか 以前はクラウドでボカロ合成サービスなんて話もあったけどV5でどうなったんだっけな >>462
vocaloidでブレスと言われるとそのものがあるんだがそっちの話じゃないのか?
むしろヤマハを除いて(ただしv3以降のヤマハ製は買ってないため伝聞だが)昔からvocaloid出しているところは記号入力すればブレス音出るぞ
クリプトンとか
v3以降から参入した会社のvocaloidはヤマハの方針に合わせて別ファイルになっているが ブレスの取扱いがどうあるべきかは微妙だな
CeVIOのように人間風に適宜ブレス入れてくれるのも一つの考え方ではあるのだが
別ファイルでとりあえず提供だけはするけど、使いたかったら自分で貼って、も正しいとは思う ブレスなんてどうでもいい
もうボカロなんて仮歌の仮歌くらいの需要しか無いんだし
特にミクファンなんてリアリティ求めて無いし そう言うなよ
仮歌にだってリアリティを求める人はいる 新規録音が必要な表現は逆立ちしたって出来ないんじゃないの ブレス素材ぐらいはその辺からゲットできる、なんなら自分で録音すりゃいいけど、
音声表現はオーディオも収録したから使ってくれというスタンスでFAになってしまったな
本家のヤマハがその割り切り方はどうなのよと思うし、wavに金払いたいわけじゃないんだけどな グロウル表現が、基礎研究レベルではクロスシンセシスを使えば出来る筈だったのに
実用レベルでは任意の歌声音声とグロウル・テクスチャの倍音マッチング問題で難航したのと同様、
ブレス表現も歌声とのスムースな接続を考慮すると場合分けやモデル化に難があって実用的な合成が難しく、
ユーザー側でサンプルを貼って好きに加工しろという流れになったのだろうと思う。
基礎研究レベルでブレス音は、EpRモデルの無声音処理に準じてスペクトルピークを取り出し、ノイズ音源と全極フィルタで表現できる筈だけど
そこでやっている事はLPCコーデックを使ったサンプリングに過ぎない。
その背景にあるべきスペクトル表現や物理モデルとの対応関係が(有声音と比べ)貧弱なのが敗因かと。
物理モデルによる音声合成はまだ未発展だが、
その場つなぎとして機械学習がブレス音の合成手法確立に役立つ事を期待する。 >>481
net vocaloidだったか
自動作曲機能もあるvocaloidを自動的に歌わせるやつ
あれで実用レベルの鯖を動かすためには相当のパワーが必要と分かったか何かで懲りたのでは CeVIOの自動ブレスやら特定の発声・拍での強音、弱音のアーティキュレーションを
ヤマハは真似できそうなら真似してもいいんですよ。自在にオンオフさえできればおk。 CeVIOので良いなら、ブレスだけCeVIOで入れればいいじゃない(暴論 そんな便利なことできないのがCeVIO
ちゃんと歌わせないとブレスもただの呼吸になるから2回作るハメになる CeVIO「はぁはぁ、はぁはぁ、はぁはぁはぁはぁ、うっ (エロい事にちぇびおを使っちゃらめぇ)」 エロ方面に使う人は往々にして利用規約ちゃんと読んでないからNG 利用規約読んで自分の中の公序良俗に照らせば自ずと答えが出るだろう
目に余る違反で利用権利剥奪された人も居ると聞いたが テレビで放送できるかが線引きだと見たことがあるが… テレビでボカロ音楽が普通に流れることもある時代になったのかね? 公序良俗の判断基準にテレビの基準を参考にするっちゅう話やでオッチャン ネットに上がってアウトになる事例を基準にした方がええと思うボカロは >>501
あぁ…
・v5のブレス自動挿入機能 https://www.vocaloid.com/support/faq/502
Ctrl+BやCommand+Bで自動挿入on/off
頻度や強度の設定はStyle→Customize→Breath
v4以前のブレス表現ノウハウ×3種類もある
http://mitchie-m.com/blog/vocaloid/voice-release-breath/
このスレに常駐してネタフリしてる人はエアプで
出来る事を出来ないと言い出すから相手しちゃダメなんだ 呼吸音よりも音素に含まれる呼気の割合をいじれる様にですねぇ 剣持引き継ぎの件とかAPI 公開の件とか総合して思うのは、要するにV5でヤマハ的に大きく戦略変更があって日本マーケットでなく世界ターゲットにしてそのせいで剣持は異動になって、 API 公開もピアプロに主導権持っていかれそうになって世界戦略の障害になりかねないから独占に戻した、ていう流れでしょう エディタが使いにくくなったのも戦略的にライトユーザーに的を定めた結果だろクソな話しだ 現状、中国語に関してV5はオワコン状態で戦える場面がないよね
大きい市場のひとつのはずだけどSynthVの圧勝なのでは? >>503
ライブラリの方でわざわざ用意されたご本人収録のブレスを選んで使うわけでないところが惜しい エアプの思い付き連投だから
サンプルを選んで貼る程度の事を
さも重要事のように何時間でも愚痴り続けるなど まあボカロは所有者同志では一種の共有物なんで、どっかにブレスソムリエがいて
「これはあのボカロのブレスと違うのを貼って使ってる」とか言われたら恥ずかしいし・・・ ブレス等の音声素材は当VOCALOIDを購入した人のみ使用可能って利用規約にあるけどVOCALOIDを買っていればブレス単体での使用も可能なのかな? >>514
可能。自分が歌った歌にミクのブレスを足したっていい
なんせ収録素材にも合成音声と同じ利用規約が適用されるはず >>515
そうなんですか、ありがとうございます。
なんかそのボカロ以外で使ってはいけないんだと思い込んでいて改めて利用規約見たら、
あれ?良いの?ってなってました。 無加工丸揚げみたいなバカなことさえしなけりゃ、買った人のクリエイティビティをやたら制限する無粋はしないっしょ
ボカロ出してるの音屋なんだから 初音ミクに関しては名前も絵も出さなければ制限される規約はなかった記憶 ケムリクサのEDがそうだったよね
VOCALOIDを使いつつ、そのキャラクターを使わないマーケティングもありかもしれない
独自キャラなら版権の縛りがなくなる?からねえ >>518
そうなの?へえー知らなかった
cevioは内緒で使ってても明記しないといけなかったよな?
クリプトンは逆に明記しないなら販売に使えるの? CeVIOは理由は分からないけど厳しいんだよ
それが普及を妨げてる一番の要因だと断言していい CeVIOだかSinsyは微調整不要な歌唱能力を活かして、カラオケのガイド歌声としての商用利用実績があるから商用周りは強気なんだろうね。同人活動は別扱いらしいし この人、話が判らないまま
噛み合わないレスを付けて話題を変える面倒な人だな >>520
ヤマハ(クリプトン含む)のは「音源」だよ。
趣味用のお遊び用品ではない。いちおうね。 本当は、V5の歌声を使った大ヒットボカロ曲でも出れば色々状況が変わって良かったんだろうけど、まあ仕方ないな ■ このスレッドは過去ログ倉庫に格納されています