AI歌声合成ソフト『NEUTRINO』
レス数が1000を超えています。これ以上書き込みはできません。
NEUTRINOに関する情報交換を目的としたスレです。
NEUTRINOはニューラルネットワークを用いた歌声シンセサイザーです。本ソフトウェアはフリーウェアです。
楽譜から発声タイミング・音の高さ・声質・声のかすれ具合などをニューラルネットワークで推定します。上記の推定されたパラメータを元にvocoderで音声を合成します。
本ソフトの名称はまだ聞いたことのないような楽曲・ジャンルを開拓してほしいという思いを込めて名付けました。あなたの創作・発見の一助になれれば幸いです。
NEUTRINO オフィシャルサイト
https://n3utrino.work/
対象OS
Windows
Linux 需要がありそうなので立てました
無料の歌声合成ソフト「NEUTRINO」がプロもうなる完成度 楽譜と歌詞を入れるだけで東北きりたんが自然に歌う
https://nlab.itmedia.co.jp/nl/articles/2002/26/news101.html どえらいスタイリッシュなページのStart Nowをクリックしたらベクターに飛んでワロタ これって出力される音声ファイルのサンプリングレートとかbit数とかはどのくらいなんでしょう? vectorの鯖落ちてない?
ダウンロードできないんだけど Linux版のバイナリはMacじゃ使えないのかね
Version.0.102アップデート | NEUTRINO
https://n3utrino.work/501/ >>7
ウィンドウズの人にMIDIデータ渡して頼めば良い 将来的にMacにも対応する予定って書いてあるけど
その頃には有料ソフトになってたりして○| ̄|_ 初期のミクの時みたいに電車の発車メロディをアカペラで歌わせるシンプルな動画が増えるかな ニコニコの一部限定って感じでそこまで広がりは無いな
時期が悪かったね ボカロよりもCeVIOよりも自然で好きなんだけどな >>3
できるらしいが当然金は払う必要はある
【告知続き】同人イベント以外でCDなどを販売をする場合,
1曲1,000円とキャラクターライセンス料(zunko.jp/con_shoushi.html)でのライセンス販売とさせて頂きます.
登録用サイトは現在制作中ですので,完成し次第追って報告致します.
https://twitter.com/m_morise/status/1232317209550053380
https://twitter.com/5chan_nel (5ch newer account) >>16
試しながら初音ミクNTか後続の待つかな
ちょっと個性がなさすぎる がちゃ以外のアプローチができるようになったら個性を付けられるかもしれない NEUTRINO同士が繋がって、ユーザーが歌わせれば歌わせるほど歌唱力が上がっていくシステムにならんかな
SETI@homeみたいな感じで それSETIについてもNEUTRINOについても何か勘違いしてない? NEUTRINOの歌唱ライブラリは学習済みのデータだからね
それにずっと学習させてれば良いと言うものでもないし
過学習になればどんどん歌唱データのクオリティが落ちていく きりたん表記やキャラクターを使わない曲なら勝手に売っていいのか? さぁ、>>16を見る限りキャラクターライセンス料以外に1曲1000円要るみたいだが 歯みがかないでも死にはしなーい、モテもしなーい
を歌わせたい >>24
合成ソフトとしてはミクさんみたいに楽器音源扱いにしてくれれば良かったんだが
そうではないみたいだな
なんか面倒が抱えそうで使う気萎えるよな まあ凄くめんどくさいよ
直MIDIできんから変換しなきゃならんし
このへんは個人の限界だね
いくら開発できてもVSTまわりの権利は個人では買えないわ AIきりたん無調整でも優秀過ぎるが巨星ミクほか、nextもかなり強いからな
リンレン/ルカ/GUMI/ゆかりは越せないだろうなあTOP10入りすら大変だ このスレなんで独り言文体で埋まってるんだよ
いつもの独り言連投のひとしか居ないってバレバレやん
表側のハイプにも乗れずに独り言を書き散らす哀れな人生だな 統失妄想おばさんのみじめったらしい精神勝利法に爆笑
このひと音楽スレ荒らしをしても音楽の話がまるでできないから毎回エアプとバレてるのに > いくら開発できてもVSTまわりの権利は個人では買えないわ
VSTプラグイン開発はライブラリの使用許諾に同意すれば個人でもできるのは24年前から常識だよな
なに寝言を書いてんだ 途中でブレス挟まないと吐息だけになるの色っぽくていいな(`・ω・´) きりたんってゲーム実況やってるボイロのイメージしかなかった ゆっくりみたいにYoutubeで人気ありゃ良かったが
ニコニコローカルなのが今の時代勿体なかったな 音声読み上げソフトがツール任せでここまで歌えるのはすごいと思った
初音ミクNTプロトタイプのデモソングも聞いてみたけど >>37
>音声読み上げソフトがツール任せで
いやちゃうで
音声読み上げソフトは株式会社AI製のAITalkという全く別のソフト
こっちはAITalkを使ってVOICEROIDという名前で商品出してる
東北きりたんの中の人に
ギャラ払って歌ってもらった50曲の声を
機械学習させて別の人が作ったNEUTRINOという別のソフト
ちなみにギャラ払って歌を依頼したところも全く別のところ
ちなみに機械学習分野で研究に使うのみであればだれでも使えるように
その50曲の歌声を配布している NERTRINOだけで音声ファイル出力まで出来るなら、中の人以外まったく関係ないじゃないかw
動画にみんなAIきりたんってついてるから勘違いする NEUTRINOで使っているきりたんDBを作ったところのインタビュー
そっちもAI歌声合成システム開発の完成を目指しているらしい
途中でそっちの宣伝になってしまうため若干スレ違い気味だが
AIきりたんの仕掛け人、森勢将雅准教授に聞く、AI歌声合成の世界で今起こっていること
https://www.dtmstation.com/archives/28823.html >>43
_人人人人人人人_
> 公開停止中 <
 ̄Y^Y^Y^Y^Y^Y^Y^ ̄
慌てて見に行ったのに・・・orz=3 なかのひとも週末早い時間帯に出して週末中に試してもらえるかでハイプが違うから大変だよね ベタ出力の自然さだとヤマハのvocaloidシリーズより上だな
おかしくなる曲もあるらしいけども いやこれもうボカロとか言ってる場合じゃないぞ
完全にブレイクスルーはたしてるやんけ
普通に聞いたら人が歌ってると誰もが思うぞ
ガチで新時代きたな 既に有名Pが使って知名度の無さに嘆いたりしてたじゃん
ハニワが使っても全然伸びない辺りで悟ったよ 藤田咲に頼んでAI初音ミクってタグついてりゃ大ブレイクしてただろう
きりたん好きだけど知名度 >>50
VOCALOIDでもUTAUでもCeVIOでも言える普遍的な問題
「どの歌声が好きか?」の領域ではないかと思う
平均的なそつなく歌う歌い手よりも個性的で光るものがある歌い手の方が人気があることと同じこと
ボイロの東北きりたんとも少し違うAI東北きりたんのファンがもう少し増えないとな
AI謡子も然り 商用ソフトでも利用規約が面倒臭いソフトは買わねーよ カンパウェアみたいな感じだな
1曲千円程度ならいいんじゃない
売るつもりがある人なら元取れるでしょ 主にきりたんの方の元々の研究目的以外で使用してはならないは、機械学習かつ版権切れてない楽曲を元にしているからだが
それが1曲1000円でペイできるという話はよくわからないな
JASRAC使用料だったら50曲分のうちの数%ということでもっと行きそうだが
まだ具体的な基準はないだろうが
それとも別の部分の話なのか? 今は機械学習結果は原曲の著作権の対象にならないんじゃないの >>61
商用利用1曲1000円が始まったら是非解説してほしいところ
研究成果ということで >>63-64
すまない
>>62の2行目はついでに>>64のような解説をしてほしいという願望を遠回しに書いただけだった
解決してしまったthx NEUTRINO-MAIN-Windowsを、RAMディスク(2GB)で実行させたらSSDより
15%位作成時間が短縮できたよ バージョンアップ来たな
無声化が修正されたのはありがたい >>69
マジ
公式ブログからダウンロードできるよ >>38
なるほろ、らぁらや中の人本人が歌ってるように聞こえるのはそのせいか AI謡子のイラストを追加する予定はあるのだろうか? >>73
それはSinsyのところに要望出せばいいんじゃないか? 東北きりたんはAHS繋がりでpiaproに画像結構あるな これって冒頭に空白(無音)が入るのがデフォなの?
sample1でも空白出来たんだが
楽譜通り出だしからちゃんと歌うwavファイル作れる人いる? 先頭と末尾に無音部分できるね
何かパラメータ弄れば変更できるのかな? >>77
同じ症状の人居て良かった
環境依存なのかと思ったぞ
仕様なのかな?
他の人はどう? むしろ出だしからきちっと歌うようにすると不都合があるからだと思う。
波形見ると、ジャストの出だしの前にブレスなのか何なのか分からんけど明確に音がある やっぱキャラクターライセンス料以外に1曲1000円+税が要るのは変わらんっぽいな
AIきりたんの商用利用ライセンスできました((o(*´∀`*)o))
AHSさんに管理をお願いしました(≧▽≦)ゞ
商用利用する楽曲を1曲1000円+税で登録していく形となります(」*´∇`)」
https://www.ah-soft.com/licensee/music/ai_kiritan/
https://twitter.com/t_zunko/status/1238026881535885313
https://twitter.com/5chan_nel (5ch newer account) youtubeへのうpって商用利用に当たるの?
収益化されてる前提で >>81
AHSに委託しているという話
AHSに問い合わせればいいんじゃね
ストリーミングに相当しそうだがどう考えているのかね
ニコニコもクリエイター還元なんとかやってなかったか?
今はやっていないかも知らんが >>81
金になってるなら商用だろうけどなってなきゃ良いでしょ ボイスロイドは名前しか知らなかったけど、人の声過ぎてびっくりした
思わずやってみようと思ったが、音楽初心者には難しいな >>83
今の時代普通に収益化するだろう、避けて通れなくね? こう言う微妙なところがあるから規約の厳しいソフトを避ける理由になるんだよな 支援ソフトを開発されてる方々が出てきましたね。
少しずつ使いやすくなりそうです。 こんなんフリーとか恐ろしい時代だな
非商用という概念はいとむつかし
●東北ずん子利用の手引き
クリエイターは非商用利用可能。同人誌は原価回収レベルでやってね
ニコ動のクリ奨は非商用の範囲 Youtubeはどうなんかね、流石にもうニコ動の時代じゃないし 普通に考えたら収益化したらダメだろ
まあ規約にないんだったらやってみたら?
世の中には書いてないんだったらOKって解釈する人もいるしどうとでも読める規約ならそっちの方が悪いって事もある
どうなっても知らんけど Youtubeやってないから知らないんだがぼろいのか?
最近流行りの事務所所属Vtuberは気になる
ギャラが発生するから商業利用になりそうだが今の規約では逃げられそう 芸能系も含めプロがYouTubeに降りてきてるから趣味系もかなり辛いと思うけどな
内容が濃い人は本当に濃い
特に芸能人系の動画は周辺にもプロがついてるから撮影、編集クオリティが段違いな場合が多い >>94
言い換えるとその辺りの事務所所属未所属問わずプロが使って収益化するのはOK?という疑問はあるかもしれん 人による解釈の話かも知れんがYouTubeとか動画サイト等の収益化=商用だと思ってる
同人の販売はあくまで原価回収が建前だから非商用扱いで許してるんだろう
規約が杜撰すぎるのよ きりたんやずん子の出自を知らんくせに規約が杜撰とかドヤ顔で語ってて草 きりたんやずん子の出自なんか知りたくもないから、早くこいつのボイスデータ消した完全フリーバージョン作ってくれ
残念ながら誰もこのキャラに興味なんかないよ いくら芸術にクリエイターの人間性は関係ないとはいえ
こんな奴の曲は聞きたくないな 音楽作る側からすりゃわりと忌憚のない意見だけどね
キャラが本体ではないし このソフトに対する見方が作る側と聴く側とでハッキリ分かれてるな きりたんも秋田のクソガキ感出てて良いけどVY1V4みたいな無機質なイメージでもいいな >>76
何個か試してみた程度だが、たぶん冒頭の空白は一小節分。
(ただし、 >>79 が指摘するように少し先行して発声している分はある。)
伴奏とかと合わせるならそのつもりでやったらだいたい合うと思う。 >>105
70〜80年代のJPOPなら歌える
古い歌なので、当然ながら動画サイトでは人気がない
視聴回数かせぐなら、AI謡子でなくてAIきりたんにアニメソングを歌わせるに限る様です 謡子はなんというか……オバハン声なんだよな。
いや、悪いわけではないし声楽的に正統派っぽい雰囲気すらあるけども、
大衆ウケはしないなぁというのもよくわかる。 初音ミクとかのボカロもう完全にオワコンだろこれw大体味がある云々言うけど聞き取れやしねーよあんなもん
グッズ展開やら声だけ変えて数出してーの商業特化に夢中で より人に近く聞ける音声でっていう面を疎かにしたツケだろw 調声した人によっちゃ化ける…ってベゼスダゲーかよw
新作のFo76も以前のシリーズでユーザーにMODでバグ修正だのコンテンツ追加だの尻拭いしてもらってきたツケが回ってきて満場一致のクソゲーだったよな
ゲームに限らずなんでも消費者舐めた商売してるとこうなるんやね 使い方。
Run.bat(Run.sh)が鬼門なのかな?
俺はいきなりTarget(だっけ?)=$1
に書き換えたわ。Windowsなら%1だね。
現在のところWindowsでxmlまで作ってきりたんのwaveとかmidiのミックスまではMacで遊んでるけど全部無料でここまで楽しめるとは思わなかったよ。
ポケミクなんて無駄に3セットも買ったのに作る気しなかったけれども >>109
IT業界は先駆者の利が巨大で強大
アマゾン考えれば分かるだろ
きりたんはきりたんで生きていくだろうけど
競い合うように次のミクがより良くなるなら願ったりだけどな NEUTRINO はかなり自然に歌ってくれるのはありがたいんだけど、調整の余地がないんよね。
微妙に休符とかブレスとか入れたパターンをたくさん作っていい感じになるのを祈るしかない。
こういう結果が欲しいからこういじるというのが通用しない。
が、 DAW 系のソフトで人間の歌を調整するのと同じような要領でいじれるわけだし、
調整に多大な労力を使うよりは賢い出力をちょっといじる方がだいぶんマシだよな。
ユーザーのほとんどは理想を追い求めて調整を続けるようなヘビーユーザーではなく
ほどほどになんかいい感じに歌って欲しいと思ってるだろうし。 弱起の曲だとリズムが狂うな。 短い小節の最後の音が間延びするみたい。
まあ普通の長さにして頭を休符で埋めればいいだけなんだが……。 ボカロと違って仕様上「ここだけ」ビブラートとか「ここだけ」ファルセットとか出来ないっぽいよな
あくまで楽譜ベースでしか歌ってくれない的な
譜面記号でビブラートとか無いしな >>115
ビブラートの記号は有るよ。
NEUTRINO では認識しないけど。 今朝、これを知りました。ショックです。
やればできるんだろうなって思って、ぼちぼち検討してた。
個人が趣味でやるレベルだと大量の生声が手に入らない
著作権的にアレだけれど、外に出さない実験段階なら、
商業CDのシングルのカラオケバージョンで差分とって
ボーカルだけ抽出して使うか?とか考えてるうちに・・・。
その分野か近い人なら誰もが、最初か早いうちに試すであろう、
王道かつ直球ストレートの手法で、ここまで出来てしまうなんて。
やればできるだろうって予想はついていたけれども、
いざ実際にやってみせられて、予想以上の結果にショックだよ。
これのブレイクスルーは学習に使われた生声データですよ。
ふつう、あれだけのデータは手に入らないですから。
声優さんが(意図的に不自然に作った)声優ボイスで歌った
音声で学習して、これですよ?
もし一流の歌手が普通に歌った音声で学習させたら、
もっと自然になるんじゃないかなぁ。
しかも、2桁くらい多くの音声で学習させたらば、
ちょっとマズいレベルになるんじゃないでしょうか。 >>54
無償で提供されてるんだから、規約を読むくらいの手間を惜しむなよ。
それとも、
規約とかあまり気にせず、いかなる用途にも使えるように、
誰かが権利処理してくれて1ユーザ50万円で売られたら使う気になるのか? >>56
用途を狭く制限する代わりに安く提供されてる、
個人ホビー用ライセンスを買おうとするから面倒なんだぜ? >>92
厳密に言えば、
upした者が金銭を受け取らずとも、
広告は表示されYouTubeが利益を得るから、
どうなんだろうな。
たとえば、
動画つくった人Aがタダで別の人Bに動画データを渡して、
Bが収益化onでupして収益を得るけれども、
Aにはダイレクトには還元しない、
なんていうやり方で回避できちゃったら、おかしくないか? 元になった技術は論文で公開されてるみたいだから実装しようと思えば誰でも出来るんだろうけど声優とか歌手の歌声を集めるのにはコネとか資金が必要だよね それはおかしいな
利益は東北地方に回らなければならない >>99
自分で作ればいいじゃん。
ソースコードは公開されてるんでしょ?
ならば別の音声データを用意して食わせればいいだけじゃんかー。
その別の音声データってのが大変なんだけどな。 スレが急に進んだと思ったらなんか凄いのが降臨してる… じゃあ権利関係がクリアな初音ミクを2万で買ってそれを使うわな >>115
中身を見てないので、たぶんアレだが、
譜面に埋め込んだ追加データを、
AIからボコーダにパススルーするように、
改造したらいいんでね? ボカロスレでガセネタ自演で3週間騒いでたひとと似たタイプのもう一人かな。文体やボキャブラリーに見覚えがある あーでも、ボコーダにファルセットがなければ、どーにもならんか。 すまん、言葉が足りなかった。
×あーでも、ボコーダにファルセットがなければ、どーにもならんか。
○もし、ボコーダにファルセットがなければ、どーにもならんか。 ファルセットって何でしたっけ。
オペラで声楽家がとんでもなく高い声を出す時の
裏声的な発声? これ学習に使われた曲を歌わせたら、どうなるんだろ。
そうではない曲よりも、格段に上手に歌えてしまうのだろうか。
そしてこのエンジンの学習に単一の曲だけを与えたならば、
ほぼボイスチェンジャー並みの再現性になるのだろうか。 musiなんたらに歌詞をポチポチ打ち込むのが面倒くさすぎて死 >>137
そのうち音声認識で、歌詞つき譜面を生成できるようになるんじゃないかなー。
さらにボーカルだけ抽出する技術と組み合わせたら、どんどん学習できちゃうね。 >>137
専用のボカロエディタ開発してる人が居るよ。
でもおそらくリアルタイムで発音できないから手間は減らない気がする。 ボカロpボカロスレNEUTRINO
ボカロに恨みでもあるのかな これがネガティブ婆の書き込みか
135 名前:名無しサンプリング@48kHz [sage] :2020/03/27(金) 01:37:15.97 ID:XoFt2NGD
uragoe
141 名前:名無しサンプリング@48kHz [sage] :2020/03/27(金) 09:21:03.20 ID:XoFt2NGD
ボカロpボカロスレNEUTRINO
ボカロに恨みでもあるのかな 山形大学ハラスメント職員天羽優子スレって書かれてたw 唐突に山形云々言い出す人が登場したとなるとスレの崩壊も近い 突飛じゃなく「唐飛」という表記は
台湾の軍人の話題なのかな。
DTM板長期荒らしの天羽優子はテンパると
・スレ違いな話題で論点ずらしを始めたり
・身元がバレた後から「山形」という地名を出すのは
おかしいとゴネ始めたり
・自身の名前に幼児向け敬称や詐称肩書を付けてみたり
錯乱状態が酷いね この単発IDの人は
他の誰かがその真っ当な業績で注目を浴びコラボレーションが進む度に嫉妬して
匿名掲示板になりすましスレを立ててイタコの口寄せみたいな妙な自演をするのだけど
単発IDのなかのひとは他人とまともに意思疎通できない人間だから、レスを付けられてもまともに反応できず>>135のような反応をして、即座に化けの皮が剥がれてしまう悲しい人なんだよね。
どんな人間だって、自身より有能な人間のなりすましなど能力的に不可能なのだから、最初から正直に真っ当に努力して成果を出して結果的に他の人に認めて貰えばそれで充分なのに、それが全くできない あぁ、バカに見つかってしまったか
しかもヘイトまき散らす無能な味方っていう最悪の形で
終わったな このメンヘラおばさんはなりすまし対象のキャラを理解する人間的理解力に欠けているから
>>148のようにメンヘラおばさんの愚痴丸出しの文章を止め処なく垂れ流して
糞尿を撒き散らす不潔な動物扱いされているんだよね、職場で また天羽優子の発狂連投再開か
DTM板のスレは軒並みそれで過疎化してるね 昨日のID:7RI1IbQRだが、
この展開にドンビキしてる。
もう昔の2chとは客層が違うんだな。 昔もキチガイはおったでしょ、荒らしも多かった
今は人が居ない分より濃く見えるだけ 合ってるんじゃね。「昔」と言えるほどの5chは存在しないのだから「昔の2ch」というしかなかろう 正味な話、昨日のID:7RI1IbQRがドン引き案件じゃねーか DTM板に関しては昔から一部では
意味不明な叩きとか名誉毀損とかあったね。
だけど2017年12月に上で名前の出てる人が猛烈な勢いで粘着を始めて板が機能しなくなった。
質問に対して回答を付けたり出典論文を示すとその度に、まるで親の仇にでも遭ったように発狂して1件1年単位で同じ繰り言を繰り返すようになって
さすがに教育機関の職員がそんな態度はあり得ないから職場にもクレームを入れたのだけど、
その職場でも敷地内で学生の投身自殺が相次ぐ状況で、そこでハラスメント対策をしてるのがこの人らしくてもう教育機関として箸にも棒にも掛からない状態。
この人は20年以上前からネットストーキングやネットハラスメントで悪名の高い人だから、老衰か事故でネットアクセス不可能になるまで、荒らしが続くと思うよ。 ほら早速、上で名前の挙がっている問題人物が脳内仮想敵の名前を出して責任転嫁し始めた。
職場通報されてもストーキングを辞めないんだから精神異常者と言うしかないねw ID:7RI1IbQRを執拗に叩いているID:mCtvgAXWが
ネットストーキングとネットハラスメントの常習犯本人 天羽優子の事だろ。そいつ基地外だから相手しちゃダメ
どっかでミスを指摘されて精神崩壊してあちこちのスレを荒らし回っているだけ と、こんな感じで煽ってやると基地外おばさんは喜んでエクスタシーを感じるらしいよ。
誰も基地外おばさんには興味無いのに、執拗に付き纏って何度でもトラブルを起こす理由は、
他人に罵倒される事に歓びを感じる性的倒錯者だからだよ。 a_watcherの事だろ。そいつ基地外だから相手しちゃダメ
どっかでミスを指摘されて精神崩壊してあちこちのスレを荒らし回っているだけ このスレの人間は誰一人として山形の某にもa_watcherにも興味無いぞ https://www.youtube.com/watch?v=bmNaKW1JI58
https://www.youtube.com/watch?v=MN1yipwu6aY
こんなの聞いたら、AIに勝てる気がしない。
コンピュータの記憶容量や演算能力は、
ユーザーが何の努力もしなくても、
勝手に年々ドンドン高まっていくんだぜ?
どんどん精度が上がるに決まってるジャン。 歌唱のいいところを徹底的に搾り出した結果、
機械に歌なんて必要ないのに、
人間より人間を気持ちよくしてくれるのが機械という世界 これ言うと気分を害する人もいるだろうけどさ、
人工知能よりも機械的な歌い方する商業音楽が
シェアを取りすぎたんだと思うよ。
ボカロが人に近付いてるのではなく、
人がボカロに近付いてしまったんだよ。
そしてそれを聞き慣れているからさ、
慣れてる=ストレスがない、わけでさ、
そのほうが気持ちよくなっちゃうんだよね。
昔のアイドル曲とか聞いたら、
ボカロ世代にはストレスなんじゃないかな。 >>117
>商業CDのシングルのカラオケバージョンで差分とってボーカルだけ抽出して使うか?
ボーカルリップですね。実験段階では結構楽しめます。例えば
「アナと雪の女王」から松たか子及びMay J.をそれぞれリップして、「アナと雪の女王」
のカラオケにMixしたら、一緒に歌っているかの様に息もっぴたり作品になりました。
実験で「アナと雪の女王」をAIきりたんに歌わせて「アナと雪の女王」カラオケにMix
したが、当然ながら、原盤権のあるカラオケなので動画投稿はNGです。
かと言って、耳コピしてオーケストラのMIDIデータを作る能力はないです。
ヤマハミュージックデータショップから購入したMIDIデータを元にして、所持している
VSTi用に作り変えてMIDI演奏させたカラオケなら楽して動画投稿できるが、NGかな? >>170
ミュージックデータショップの規約を読む
多分黒に近いグレー 真黒だろ
ソレにあんたvpnってidコロコロしてんの? AIは著作権料なしで学習し放題
人間はピアノ教室での練習であっても著作権料を払って学習しなきゃいけない
人間の学習は不利すぎる。 AIきりたんで音声合成してみたが声の震えとかはかなりしっかり合成によって補完される一方
もとのデータベースにないか、あるいはデータベースの楽譜上はあるけど音声データ見ると声が出てない特定の音階、
特定の発音の声だったりすると、そこは合成されずに音が抜けてしまうな
データベースの曲がほとんどiRisのプリパラの曲でサンプリング音域が狭いから
音域も高いとことか低いところはうまく出てこない
毎日ものすごい勢いで歌わせてみたカバーとかがうpされててもう追い切れてないんだけど
システム的にはまだまだ改良の余地があるんじゃないかな
特定の母音子音での発声で、元データにない特定の音階の音を合成できるようにならないと完成とは言えないんじゃないだろうか 多分今のNEUTRINOの仕組みって
元の音源の音を楽譜の音符毎に区切って短音のデータ化し、それをつなぎ合わせた後に
各音のつなぎ方を元の曲と比較して一番それっぽい感じのものにするっていう学習方法なんだろうと推測できるけど
根本的には発音+音階で音を合成(これはボカロ的)してその音の自然さを生の単音発生データと比較する、
そのあとでそれをつなぎ合わせて今と同じように元の曲歌唱データと比較するっていう2段構成での合成にした方が精度がよくなりそう
って誰かAIきりたん作った人にいっといて >>178
よくわからんけど、
学習させてないものを発揮できないのは、
当たり前の話で、
学習させれればいいだけじゃないかな?
でも、それはNEUTRINO作った人の興味範囲外かもね。
やればできることを実証して見せたので満足してるかも。
今回も自前で学習データを用意したのではなく、
既存のものを流用してるんだしさ。 >>179
なんか良く分からないけど、波形を切り貼りするって考え方してたら、
いつまでたっても前世紀のサンプラーの技術水準から抜け出せないぞ。 >>181
なんかよくわからない、じゃなくて全然書いてあることの意味わかっていないと思うよ >>178で問題となるのは
DNNの多次元データ層における、外挿推定の精度低下
(周辺データが希薄な端っこ方向の延長上の推定、たとえば超高音はうまく推定できない)
の問題だろうから、その方向の学習データ(本来は存在しない超高音の学習データ)を増やさないと解決は難しいと思う。
DNN技術のこの問題を端的に示す例の一つは
点が4つしか打たれていない画像を自動車写真と認識してしまうDNN画像認識の問題。1年ほど前にバズっていた
>>179は、AIきりたんの説明としては的外れに見えるけど、DNNの内挿推定をあえてボカロ視点で解釈するとそういう話が出てくるのかなぁ。 1980年代ブーム時の多層パーセプトロン提案とその後1990年代のニューラルネット研究停滞期を知っている人にとっては、2004年DNNアルゴリズムによるブレークスルーと現在のブームは重要な事柄だから
略語の読み方で暴れる知恵遅れは放置だろ 知恵遅れ天羽が平日昼間から専門的説明が判らず発狂とはみっともないね。
還暦近くにもなって専門的説明がある度に発狂して無知を誤魔化す精神病患者 やまがたの@apjの発狂癖は、まともな話を遮って幼稚な嫉妬心を満足させる為のじい行為だからスルー推奨 仮に一番詳しい人が見てたら、>>183を踏まえて>>179をどこかで説明し直す筈だから無問題。
どこかで言及が無ければ>>179はその程度の流すべき話だから無問題。
見えない敵と戦うヒステリーおばさん以外、このスレで詳細説明不可能な空理空論を書く動機が無いから
扱いはとても簡単 >>185
むかし課題に対して「ニューラルネットで」と答えるギャグがあったわ。
ゼミ発表で何かツッコミ入れられて答えに困ると「そこはニューラルネットで」といって逃げるの。
あまりに連続して教授がブチきれたこともあった。 それは2004年以降の話だろうな。
前回ブーム末期の90年代初期にニューラルネットの再ハード化をした所を紹介された事があったが
当時は多層ニューロンの可能性が大きな壁にぶち当たって本質的なブレークスルー待ちの状況だったから
そこをクリアせずにハードで高速化だけしても壁は乗り越えられないだろうという諦めムードを感じた >>192
90年代だよ。
自分ところはニューラルネット自体は研究対象ではなく、
他所で研究され確立されるであろう技術として扱ってた。
つまり、
いますぐ自分たちが使えるわけではないと思ってるからこそ、
課題に対して「ニューラルネットで」というのは、
自分のやるべきことじゃないし、ほっといても時間が解決するでしょ、
という態度を取ってることになるので、ギャグになったんだよ。 ちなみにニューラルネットは天敵だったんだよね。
今ならニューラルネットを使えば簡単に出来ちゃうことを、
たった数十MHzのCPUと数十MBのメモリのマシンで、
どう実現しようかって何年も研究してたんだからなぁ。 90年代に「ニューラルネット実用化」を前提とした研究って人工知能学会論文集あたりでありそうな話だけど、コアな研究は冬の時代だったから捕らぬ狸の皮算用な感があった
某大手メーカーはLSIハード化、某大手家電メーカーでは多値論理との組合せで家電応用をやっていて、
応用分野は一度勢いがついたらなかなか止まらなくて、その中からブレイクスルーが飛び出る事もあるんだろうけどね。応用の皮を被った基礎研究のような 191の3行書き込みは既視感バリバリの
陳腐なネタだからマジレスしたら踏ん張ってるね
https://egg.2ch.net/test/read.cgi/dtm/1582756084/191
どこまで空虚な話を引っ張るのやら そういやエアコンに「ニューロ自動」ってあったわ。
リモコンの表面には大きなボタン(on/off)が1つだったかな。
他のボタンは折りたたみを開いた内部に隠されてたんだけど、
ニューロ自動を使わないと頻繁に開閉を繰り返すことになって、
早々にフィルム基板が破断して故障するという。 >>196
既視感?
複数箇所で見かけるのは普通だろ?
日本のあちこちで同時並行に見られた光景だろうからね。
だいたいみんな、考えることは一緒だからね。 完全にスレ違いだな
スレの縛りを無視しないと
目の前のお題に沿った書き込みが出来ない人は
書き込むべきじゃないよ。
スレのテーマはNEUTRINOだから
自分の知ってるニューラルネット小話を延々と書くスレ違いの人は退場 ID:iszjIyz7は中身のない書き込みを延々とする方の荒らし係だね。198にまでレスを付ける無分別さに爆笑した まあ197の書き込みで、話題がどんどんズレてく統失だって判定したわ。まともな人間なら二行目で話をすり替えない >>202>>203
はいサヨナラ。
>>179については、>>183に書いたように趣旨が今ひとつ理解しにくいので
もし本気で書いたのなら説明しといてくださいw NEUTRINOの話をしろよ。
スレチとか言ってるけど、
お前らだってNEUTRINOの話をしてねーじゃねーか。
そういう自治厨もまた荒らしなんだよ。 ちょっとマジレスするとすぐ書き込みが止まったり
話題逸らしが始まるみっともない成りすましだったね
大した事を書けないのにやたら勿体ぶって、やれスレが荒らされたのスレが終わっただの言い出すチキンな芸風は、通用しないからこれっきりにしてね。 >>188
専門的説明がある度に発狂して無知を誤魔化す精神病患者=a_watcher 自らの欠点を指摘されると、それは自分ではなく脳内妄想敵a_watcherの欠点だと言い換える幼稚な癖のある天羽は満53歳の幼児 20年間も30年間もこの手の下らない言い争いを続けてきた天羽が、すっかり精神荒廃して誰にも相手にされなくなり若年性認知症になったのも当然だな。
馬鹿馬鹿しいから繰り言の続きは、精神病院でやってくれ >>205の注意があってもなお、こんな書き込みしてるんだから・・・ >>205
お前はマジモンを知らないからそういうことが言えるのよ
糖質とかキチガイに目をつけられたスレはそいつが居なくなるか崩壊するかのどっちかだから それは過疎スレだから。
本来の話題の流速が速ければ荒らしは追いつけないんだよ。 公開前(開発中)の段階である2019年12月時点で、SHACHI氏がTwitter上で歌声合成手法に関する「能勢隆」(東北大学准教授)氏からの質問に回答したことがある。ぐらいか。内部構造について明らかにされたのは。 Acoustic NNはAR付きのFFNNをResidualで繋いだ構成で、過去200 frameの対数基本周波数・メルケプ(0次)、過去20 frameのメルケプ(1~60次)・非周期性指標・有声/無声をARしています。 NN Vocoderはh-sinc-NSFがベースで、入力をWORLDの基本周波数・メルケプ・非周期性指標、出力を24kHzに変更しています。学習率も段階的に下げるようにしています。 継続長に関しては20曲では推定が難しい部分があるため一部修正を加えています。(母音脱落など)
フルセットの50曲での学習である程度改善されることを期待しています。 >>214-217
分かる人には分かる、門外漢には分からん、
細かい工夫がいろいろあるんだろうけども、
それにしたって、
https://www.youtube.com/watch?v=4yfBWiExuZw
こんなの聞いたら、みんな絶望して吹っ飛ぶ。
オリジナルの曲を聴いたことない人に、
事前情報ゼロで聞かせたら、まず気が付かんぞ。 >>214-217
やっとまともな書き込みが来て安心したよ。 このスレはaなんとかが自演で珍説を垂れ流すスレッドになりました >>218
DTM板はここ2〜3年極端に過疎っていて
たまにまともな話が出てレスが付いても
板荒らし天羽の大量荒らし書き込みで
レスが埋れてしまうので
掲示板として使うのは難しいと思いますが
ご健闘をお祈りします かといって気軽に話せるコミュニティってないよなー
製品のフォーラムはテーマが限定的だったり登録あったりで面倒だし 専門性の高い話題ほど匿名で話すメリットが無いからな
専門板が軒並過疎ってるのはそういう事 コミュニケーション/議論プラットフォームの選択は
何を目的にどの層に働きかけ何を成果と見なすか
によってシビアな選択が必要だと思います。
元々ここ2ch改め5chは、何か有意義な議論をして成果を出す場所ではなく、
表舞台で有意義な事をやっている堅実な人に匿名で嫌がらせをして、無能者なりのマウント欲充足を第一とする某氏のような性格破綻者の為の場所です。
かつてその場所で勢いをつけてプロジェクトを立ち上げ、それなりの成果を収めた例もあるのは事実ですが
それは匿名掲示板に普通の人々が大量に集まっていた隆盛期特有の現象でしょう。
10年ほど前から(たとえばボカロ2ブーム以降)、ネットメディアの多様化で匿名掲示板は時代遅れとなり、
他所に実体のあるプロジェクトやコミュニティの盛況が匿名掲示板に飛び火して書き込みが増え、情報交換が行われているだけで
何かを立ち上げ皆で盛り上げるかつてのニコニコ動画のような場所としてはもう機能していないように思います。
それではどのメディアなら気楽に雑談できるのか?
それは難しい問題ですね。 かつてニコ動が熱かったのは、
高いスキルあるのに不景気で仕事なくて暇な人が大量に出て、
その人たちがコンテンツを作ってたからなんじゃないかなー。 それこそ気軽に話せるのはニコ百の掲示板くらいか
とはいえあそこもID固定にはなるが >>227
結局、若い子よ
5chとかニコ動とか言ってる時点で俺ら老害なんだわ まあ敗北主義者は放置するとして。
このスレで多少なりとも空気入った感じがするのは事実だよ。
ここ12年ほど例の頭のおかしなひとが始終つきまとって議論妨害ばかり仕掛けてきて
西村式匿名掲示板に対する偏見が激化してたけど
自分の偏見が自分の世界を狭めるのは当たり前のことで
そーゆー病んだひとを助けてあげたいという気持ちは断ち切ってそろそろ次かな NSFいいな!ピッチいじれないのが難点だが、そこはVariAudioなりMelodyneなりV-Vocalなりで整えればかなりいい感じになる。 されるね。そのあとCubadeに読み込むところで変換してるわ。 経過 (Peogress) が表示されるのは良いね! 宣伝です。NSF版で作ってみました。
https://www.nicovideo.jp/watch/sm36694148
休符の後のブレスは無効とのことですが、
どうにか上手く入れる方法はないのでしょうか? >>183
1ヶ月ぐらいみてなかったけどおおまかにいうとこういうことだと思っている
今
入力:楽譜+楽譜から合成された波形データ
学習ネットワーク:順伝播型ニューラルネットワーク(回帰有り)
教師データ:きりたんデータベースの楽譜+歌唱音声データ
波形データ = 元の音源の音を楽譜の音符毎に区切って短音のデータ化し、それをつなぎ合わせたもの
学習 = 各音のつなぎ方を元の曲(教師データ、、きりたんデータベース)と比較して一番それっぽい感じのものにする
>>179で書いた内容
入力1:楽譜+楽譜から合成された波形データ
学習ネットワーク1:何か
教師データ1:声優が発生した短音ボイスデータ
まず短音の声優の合成ボイスを作成する。やり方は基本はボカロとかボイスロイドと同じ
次に
入力2:楽譜+1で作った音声データをつないだ合成波形データ
学習ネットワーク2:今と同じ
教師データ2:きりたんデータベースの楽譜+歌唱音声データ
で楽曲音声データにする
短音の教師データ(母音+子音+音階で声優の声をサンプリングしたもの)を用意して1音1音を先に声優の声に変換
(このとき教師データに高低音を用意しておくことで音の脱落問題を事前にある程度なくす)
その後データベースの楽曲データを用いて歌として成立するように波形合成する
これを再帰型で行う方が精度があがるのでは?ということ 皆が疑問に感じている事柄
「AIきりたん他NEUTRINOの合成方式は
WaveNetのようなニューラルネット中間層の高次元データにおける内挿推定ではなく
>>179が言うようなボカロのような素片接続合成なのか?その根拠はどこにあるのか?」
>>240は上記の疑問に全く答えていない。 誰かのなりすましをしたい人が居て
でも能力不足で全然似てない上に
頭が悪くて説明が稚拙で要領を得ない
いつもの人でしょ。
なりすましのモデルらしい本人と直接話せば済む話を
なぜ匿名掲示板でイタコ芸したがるのか
頭の悪い人の行動は意味不明でござる 根拠は>>214-217に書かれてるね
NEUTRINOの歌声合成部が次の2つからなるとして
S: 短音の波形合成
C: 短音(S)をつなぎ合わせる歌声合成
FFNN ARによる合成・比較・修正は
・現状では 上記SとCの結果全体に対して行われると推定されていて、それを関数的に表記すると:
AR(C(S)) [Sの結果からCを計算しAR処理]
・改善案は S単体のAR処理も追加する事で精度が上がるという話で、それを関数的に表記すると:
AR( C( AR(S) ) ) [SをAR処理し、その中間的結果からCを計算しAR処理]
AR処理を二段階に分ける事で、(教師信号に推定値を近付ける)最適化処理の自由度が上がり精度向上が期待されるのは判る。
ところで「再帰型で行う」(>>240)とは言うものの、CのAR処理各ループの度に、その内側でSのAR処理を再計算する必要はあるのかな?
平たく言うと、つなぎ方に関する最適化ループで、短音の波形がおかしいからうまくつながらないんだから直せ、という処理はあり得るのかな? >>243
明確に二段階に処理を分けた場合、二段目の結果をもって一段目の答えを変えるのはありえないんだろうけど
現実に歌の連続音として発声された個別の短音の波形はある程度崩れる方が自然なんじゃないのかな
これもボカロみたいな話になるけど、二段階目でどうしても教師データに近づかない(不自然さが残るレベルの)とき
その誤差をもって1段階目の計算に補正を入れる必要はあると思う
普通に計算量が乗算になるからそのときの誤差の損失関数の出し方は多分工夫がいるけど 人間の場合も、歌い方だけを工夫してもうまく繋がらない/うまく模倣できない/(直接的な教師信号無しのより広い評価基準で)より良い表現ができないから、発音を変えて工夫するってのはあるよね。
Sauthern All Starsの英語風巻き舌日本語ロックとか、Brayan Ferryのスノッブな難解発音による繊細な表現とか。
他方、最適化を明確に二段階に分割すると
一見、自由度が増えたようでありながら
実際は、二段階分割による制約が入って最適化が上手くいかない=局所最適解に陥ってグローバル最適解に辿りつかない、ってな話もあるよね。
(たとえば経路探索で正方形の対角線が距離最小の正解である場合に、問題を直交座標的な縦軸と横軸に二分割してしまうと、いくら計算パワーをかけて最適解を探しても縦横縦横のギザギザ線にしかならず距離は一向に減らない)
問題分割を誤ると正解にも最適解にも辿りつかない。
分割の仕方は難題だから、可能なら分割せずに一体型の問題として記述して、最急降下法(Numerical Recipes)でグローバル最適解を探すのが、NNの基本戦略だったような。
歌声模倣問題を「短音合成」と「つなぎ方」試行錯誤の二段階に分割記述しないといけないように見える理由は何なのだろうね。
もちろん、現時点ではそれが一番わかり易く実装しやすいからそれで進めるのが妥当、という事なのかもしれないけど まあDNNの基本戦略は定石に過ぎなくて
今回のは分けるのが自然なのかな。
短音合成に関して、声優の発音と音声合成器の発音は基本的に別物だから、直接比較はできなくて何らかの特徴量(Worldの特徴量)を指標に模倣する必要がある。
歌声合成(つなぎ方)に関しては、その延長線上で新たな特徴量も追加されるのかな。
たぶん基本的に短音合成と歌声合成は別物だけど、その両者が相互干渉して互いに微調整が必要になる領域では、両者を一気通貫で一体として扱う統一記述モデルをでっち上げる必要があるのかなw
(シュトックハウゼンがセリー音楽でリズムを高速再生し発振音に変えて、両者の統一性を解き明かそうとしたような話)
現状では、両者を対等に連続性を持って扱う統一モデルが無いから、どちらが外側ループでどちらが内側ループとすべきかみたいな病んだ話(>>243)になってしまうw
まあ音色(短音、ミクロ領域)と音楽(つなぎ方、マクロ領域)の統一記述モデルなんてのは、現状には到達しようの無い彼岸の存在のような気もするけど。
物性物理だと、ミクロとマクロの両者が関わる領域を「メゾスコピック領域」としてモデル化する試みがあった。 真面目に追いかけてもいない話について
無理に何かを書くよりも
「マジで全然知らん」と書いておくのが正解みたいね AIきりたんでHIMEHANAのうたかたよいかないでを歌ってもらいました。
個人的に、AIなのに「感情表現」が少しはうまくいったと思って、
なぜ上手くいったのか情報交換したいです。
https://www.youtube.com/watch?v=wnp0MAfz6zo
音符は長さ調整だけなのでお話ししたいのは、
FormantShiftが感情表現に与える影響です。
この歌の設定はFormantShift=0.98 にしました。
自分の好みの声はFormantShift=0.975なのですが、
FormantShift=0.979と0.98の間に 「幼さ」と「幼くない」差があり、
「この曲には0.98が適している」と感じました。
「0.979では感情的に聞こえない」と思いました。
0.98だと高域が強いから感情が乗るのか、
それとも曲に対するフォルマントの高さで感情を感じるという事でしょうか?
ご存じの方宜しければ教えて下さい。宜しくお願い致します。 FormantShift=0.979と0.98の間に 「幼さ」と「幼くない」差があり
そこは個人の認識よって誤差があるからね
別の方は0.978と0.981かもしれない
そこで逆転の発想が必要になるんですよ、続き聞きたいですか? 宇宙真理として、全ての答えは非常にシンプルなんですよ
小数点が入るわけがない、本当は世界は、ね(倒置法
1 にしてください
こだわりを捨ててください
凛として 整数世界 凛として 割きれる世界 凛として シャムール
黄金比率ですよ
それが全ての答えなんです
よーく物事の本質と向き合ってください
頭で考えてはダメ 凛として感じてください
凛としてキリタンポ
チュパチュパチュパチュパ
ほんのりと答えが見えてきたよね 世界中全てがひとつになって繋がっているという事
予定調和を信じて?
1が答えになる
私達は未来からきているから”最初から知っていた”というわけなの >>248
ここまで自然に聞こえるなんて凄いですね。これはNSFですか?
自分はこれから導入しようと思っているところなので参考になります。 キリタンってデータ投げれば自動でやってくれるんじゃないの?w
細かくやりたければボカロ買ってエディットからやればいいと思うが すみません、q5PbdaEoさんが優しい方だという事は分かったのですが、
何をおっしゃっているのか私の頭では理解が出来ません。
しかし何となくわかる気がします。すみません、どなたか翻訳をお願いします! >>257
おちょくられてんだと思うよw
FormantShift=0.979と0.98 この辺で勧誘できそうな臭いを感じたかw NEO相対性理論
私達は皆隣り合わせなんですよ
今は分からなくてもいい
未確認飛行物体がやっと認知された時代ですからね ヒントは量子力学です
芸術家の異常性と物理学の関係
ちょっとフライングしまったわね 文章の抜け字を繋いでごらんなさい、私に言えるのはここまでよ・・・ >>255
ありがとうございます!
この曲の場合はNSFです。
WORLDも試したのですが、
NSFの方が歌に抑揚が生まれ、より人間らしいと感じました。
曲によって早口で音程の正確さが求められる場合や、
感情的な表現が不要な場合、冷淡に聞こえさせたい場合
私はWORLDが向いていると感じました!
音符はネットの情報を参考にして、
長さ、ひらがな調整を行いましたが、
個人的にはFormantShiftをかなりシビアに設定しました。
そのあたりの情報がなく、好みかと思っていたのですが、
「自分の好みではなく」というところがポイントでした。
0.979、0.98、0.981を聴き比べて、
この曲のメロディでより感情的に聞こえる0.98を選択しました。
そのあたり、難しく原理が良く分からないので
知りたいと思った次第です! また統失婆の自演連投かよ
こいつ専門スレに書き込みがある度に
どうでもいい妄想を大量連投する真性のゴミクズだな 統失婆は頭が空っぽだから同義反復と妄想しか書くことが無いのなら てやんでぇ〜の江戸っ子精神論オバちゃんです、理論スレにもいるよ
独身で寂しいんやろな SNSで反応ないとこっちで欲求不満爆発させる人いる...ネット世界の闇よな
下ネタスパムしてたのもこいつじゃね?...ドブス臭w 統失婆が専門スレを妄想同期反復で埋め立てる理由は
学習障害で他人の話が全く理解できない、という致命的障害と向き合う事ができないからだろうね。
判らない話があると、幼稚な質問攻めや統失ズレズレ質問の飽和攻撃で回答できないと決め付けたり
未研究領域の未科学ですらニセ科学だと決め付ける癖も全く同じ理由。
統失婆の盟友キクマコをサイバーメディアセンターの閑職に取り立てた元阪大学長氏も言及した未科学問題に対してですら、統失婆はニセ科学だと決め付け、
筋が悪いと気付くと早大名誉教授大槻義彦氏をミスリードして、誤ったニセ科学叩きの犯人は大槻氏であるかのような虚言を重ねていた。 >>249
こういうのを見るとなんだかなぁ、っていつも思ってしまう
あらかじめ設定されたプリパラメータ弄るだけで「幼くなる」「大人になる」
その数字で興奮してる人って・・・音作りとは無縁そうやね
どの帯域と、ピッチ弄ると幼くなるとか、そういう基本から勉強した方がいいですよ
おちょくられるのも何かわかる気が・・・ ここのスレ主だか一番詳しいひとの基本ポリシーは
無知を知ったかぶりで誤魔化さず、自身の無知と良い意味で謙虚に向き合って何かを掴んで
さっさと這い上がって来て歌声音源作りを一緒に楽しもう、というスタンスに見えるね。
それは言葉を換えれば、ソクラテス的な無知の知の認識こそ(個人もしくは人類にとっての)新しい発見のきっかけだという話なのかもしれない。
妄想連投のひとはそれが著しく苦手なのだろう >>264
これな~長いわりに全く意味が無い(・ω・)
新しいソフトに触れたゲーマーみたい ニュートロンの三種類の機能を得意げに語ってるみたいな(ID変え忘れ 顔文字NG推奨
統失婆の三大荒らしツール
・際限のない妄想連投/意味のない質問連投
・顔文字
・AA貼り ここはそういう場所、なんか賢そうに語ってるやつは瞬殺で見抜かれる
地頭も偏差値も低い沼は本当の沼に落とされる場所、つーか入り口だな ↑こいつも統失婆の同類
どう這い上がるかではなく
どう足を引っ張り全体レベルを低下させるか
の話しかできない負け犬 そう?ヒント書いてあげたけどな?お前らロリ声作ってシコしたいんだろ?キモオタの変態諸君 こういうのって商用というより、オタクの自己満のおもちゃなんじゃ?
動画公開すればキモいファンが付くんだろうけどなぁ
商用転用もありなのかな?本当の音楽やってるやつは一応、区別すると思うよ
ボカロから音を作りこむわけでもない、プリセットの塊みたいなものの
『オッパイスライダー』弄って興奮してんだろ? もしかして滅茶苦茶怒ってる?wちょっと感想を書いておくよ オッパイスライダーで沈黙しちゃうからなぁ、本当にそっちの人かなぁと思ってしまったよ
原曲を知らなかったんだけど、さきほど聞かせてもらいました 原曲が脂っこい肉だとしたら、とてもくさみが抜けてね、AIの方がいいんじゃないか?と思ったの
0.50あたりでちょっと気になるところもあった、このaiffをネクターやメロディオンに通して補正して
抑揚をつけてみると、もう少しよくなるかもしれない 2.15秒当たり、この辺はAIとは思えない良さが出ている、途中で一か所ぶつりと切れてますよね
完璧な作品にするのであればちゃんとチェックしたほうがいいと思いますよ まぁ、私としてはね、AIがどうじゃなくて、曲ね?こういう曲ノータッチだったからとても勉強になります
これからアナリーゼしていきたいと思います ビックリしただろ?このまま「勝ち逃げ」すると思ったか?ババァ
残念だったなぁ いいか?お前たち、貴様らは何と戦わねばならないのか?何のために音楽をやっているのか?
目先の餌に誘導されてはいけない
そして選曲と歌詞、響くものがあったからこれを選んだはずだと「信じたい」
ここで、いやらしい商業的な淀みがあったとき、純粋な心は消えてしまうと思う
いずれ、「このような曲」を作る立場になりたいと思っているはず
ピュアな初心「だけ」は忘れてはいけない
しかし同時にズルはよくない、受け身のお客様では成長しない
入り口としてAIを使って音楽を作る、どのような逆風が来るのか?予想した上だったと思う
狂ったような口撃を見た時、私は前世を思い出してしまった...
その上で、少しだけ「名も無き援護射撃」をして差し上げたまでの事、礼には及ばず
君達が抱える悩みと、想いはシカと受け取った あの方に届け、私の音楽活動の糧とさせてもらう
ありがとう、養分達 【悲報】メンヘラ天羽優子、また専門スレで発狂連投中【ID:q5PbdaEo】【ID:tmh+Rk5L】 連投と言うか、スッキリしないんでねぇ、こういうのが尾をひくと私の活動に影響を与えてしまう
わたしは「敏感」なんでね、作曲中敏感モードになると「霊的」に全てを受信してしまうから大変なんだよ
>>292
悪態をつくのも許して差し上げよう、私は寛容だからな(植物ではない
いや、そうありたいと思っているのか・・・これも哲学かもしれない
悩ましいよね(自問自答)
言いたいことは言ったし「出したウンコ」は”ある程度”ふき取った感じがするんで失礼するよ
今夜はカレーなんでね ガイアが俺にレスしろって言ってるんだよ、黒塗りの乗用車がお前の「
続きが出てこないんでね、本当に失礼するよ >>274
なんか変な連中が何匹も湧いてますが・・・
今まで聴いてきたNEUTRINOの曲の中ではピカイチの出来だと思いますよ。
自分のPCのGPUはAMDなので、NSFを使おうとしたらオンライン版を使うしかないのと、出力が24kHzというのが
若干気にはなるところかな。
支援ツールとかは使ってます? 変なのは天羽優子一匹
変なのが複数居ると思っているのは
天羽優子一匹だけ 俺様の多重人格演技もなかなかじゃのぉ、ほんじゃ本当にさよならだ キチガイメンヘラおばさんはID変えては即レスするから誰の目にも自演がバレてしまう いやいや、分からなったじゃん、前から気になってたんだけど優子って誰?ググったら出てきたけどさぁ
俺は男だけどな
俺様の多重人格演技もなかなかじゃのぉ、ほんじゃ本当にさよならだ キチガイメンヘラおばさんの単発ID自演は下手くそ過ぎ 11年前に訴訟相手と実験講義学生と同僚その他を混同して誤爆ハラスメント事件を起こした天羽優子の
反社会性人格障害が炸裂中 ほんとにその人存在するんなら 実名書くとやばいんじゃないの… 使ってみたらボカロより楽だった
@平仮名入力
A楽譜
無料!!
https://youtu.be/_pXxiglKaKY NSFで出力しましたが、同じフレーズでも歌い方に違いがでるものなのでしょうか。
「あっという間」の「あ」音が、最初の部分と繰り返しで微妙に違う感じです。
気のせいなのか、そういうものなのか・・・気になります。
https://youtu.be/yq6zHexmB10 >>309
GJ!
中身がどういう作りになってるのか知らないので一般論で言うと、
前後の歌詞から発音のしかたを選んでいるのだと思うので、
同じフレーズでも出現位置によって発音が変わるかもしれない。
それとは別に、常に同じ発音をすると不気味さが出てくるので、
わざと発音に「揺らぎ」を与えているかもしれない。 NEUTRINOの本当のスゴさは、
きりたんではなく謡子さんでこそ分かると思う。
YouTubeで見かけたこれとか
https://www.youtube.com/watch?v=8M8Kb9bZVqw
びっくりするよね。
きりたんの中の人は声優さんであって歌手ではないので、
AIに学習させる音声としては難易度が高い気がするなぁ。
UTAU用の音声素片をFFT解析にかけて見たんだけど、
歌手の人の音声とは、だいぶ様子が違うんだよね。
NEUTRINO作った人は頑張ったんじゃないかなぁ。
ちらりちらりと不自然さが残るほうが好かれる理由もわかるけどね。 ネットで見かけた
https://www.youtube.com/watch?v=4yfBWiExuZw
すごすぎるんだけど。
とくにハモってる部分は違和感がない。
これと同じクオリティを人間が手動でデータ作って可能なのか? 技術的なことは詳しくないんだが、50曲学習でこんなに自然に歌えるの?
死んだ歌手を呼び寄せられそう その50曲の音符全部に音素とタイムコードをつけていかなくちゃならんのだぞ
AIきりたんは学生10人ほど使って3ヶ月かかったって言ってたな Mさんところは学生1名×3ヶ月でしょ。
AIきりたんが学生10名雇ってタグ付けし直したとは初めて聞いた >>314
人間の聴覚や脳の認識能力って、
都合よく解釈する機能が強力だから、
いくつかの要点さえ合ってれば、
他のところは合ってなくても分かりにくいのだと思う。 >>315
そこで今ホットなend-to-end音声合成ですよ。
日本語の50音は量子化しすぎかもしれないし、
音と音の区切りを適切に線引きするのは難しいだろうから、
AIに間違いを教えた結果として、
不自然な出力になってる可能性が考えられるので、
人間がラベリングしないほうが有利な気がするんだよね。 いちおう言っとくと、
学習用の音声に添付されたラベルをNEUTRINOが使ってるかどうかは、
俺は知らないよ。
なんとなく予想としては使ってないと思うんだよねぇ。 >>317
男声の実現は大変なんじゃないかなぁ。
低い音は不確定性原理に阻まれて学習できなさそうだもの。 AHSがSyhthesizer Vベースの琴葉姉妹出したな
けれどAIきりたんほどのインパクト無いし
俺としてはイタコ姉さんのDB制作のほうに期待してしまう
https://www.ah-soft.com/synth-v/kotonoha/ 低音に適しているのはリバース推定ではなくフォワード推定だろうな >>322
量子力学は知らないけど、数学的には同じ現象らしいね。
C4=262Hzでもモヤモヤするし、F3=175Hzは雲を掴むような感じだよ。 久しぶりにニコニ動画に行って、今更AIきりたんを知ったのですが、マジ人間にしか聞こえない。
もう、機械音が残るボーカロイドは消えていくと思った次第です。
国産スパコン「富岳」が9年ぶりに世界ランキング1位になったし、技術の発展って凄いね! この手の研究って、電話の業界で、けっこう力を入れて行われてきたけど、
別業界で、新しい人たちがゼロから車輪の再発明したのが良かったのかも。
電話の業界だと、同じ学会に属して論文発表してたわけだから、
大学やメーカーが違っても、合成された音声が似通ってたんだよね。
帯域幅が限られていてCELPで無理やり圧縮される国際電話や携帯電話の
音声をターゲットにしていたので、まずCELPありきだったろうし、
比較や追試が可能なように皆おなじATRの音声データベースを使ってたような。 音程が狂ってたり、妙な変調かかったロボットっぽい声になる原因を、
AIきりたんは回避してるというか、同じ轍を踏んでないんじゃないかなー。
ちなみに、AIでなくても、Synth-Vもクリーンな音声だよね。
たとえば、
https://www.youtube.com/watch?v=bH5nSGYGnzU
これとか。 >>329
おおっ! これもまるで人が歌っているようだ。
もともと、ミクを筆頭として機械音が歌うのは苦手だったんだ。
これからはいい時代になると感じた。 VocaloidでもLily V3やMACHAは割と自然な声なんだけどな。ミクを基準にするとVocaloidを誤解する。 ミクはエフェクターでわざと機械音にするPがいるだけで
地声は機械音じゃないだろ。 >>328
確かに。
日本では1940年代から世界トップレベルの音声分析研究成果が出て、関連分野に大量の人的リソースが投入されて来たのに
隣接分野の楽音合成を含む電子音楽分野では長年、科学や工学として学術的研究を行う拠点がほぼ皆無で
芸大や音大か海外研究拠点に留学するしか道が無かった。
だから潜在的にその分野に興味を持ちながら、他の分野に行った人が、大量に掘り起こされているのでしょうね 楽音合成分野で、倍音加算合成とフィルタによる減算合成を商業的に成功させたローレンス・ハモンドも
コンピュータによる音楽作成と楽音合成の基礎を築き大きく発展させたマックスVマシューズも
二人とも楽器は弾けず、音楽の伝統的教育訓練も受けていないまっさらのビジネスマン/研究者だったから
車輪の再発明に見える事にも臆さずチャレンジして成果を上げたのかもしれないね V5の付属ライブラリとか色々な要素が合わさって言わないとバレないだろうなと思う日がある
まああいつら完成度低くて破綻させないのが難しすぎるんだけど 初代ボカロが商品化されるよりも前に、
電話系メーカーのテキスト読み上げソフトに、
おまけで歌声合成機能がついていた。
童謡を歌わせるデモンストレーションやっていて、
初代ボカロよりも格段に性能は良さそうだったが、
アナウンサーの声質で、しかも童謡だったのがなぁ。
いまでも、
AIきりたんは注目されるけどAI謡子はスルーされがちだよね。 >>333
基本的には同じ技術だからこそ、学生や研究者は、
莫大な売り上げから豊富な研究開発費がある電話の
業界に行ったのでしょう。
>>332
鼻声的な声優ボイスがベースだということを差し引いても、
なんかロボット風味の妙な変調かかった音してたような。
ネットで出回ってる作例しか聞いてないから違うかもだが。 >>334
むかしは音楽業界の人たちとは文化が違いすぎて、
テクニカルタームや常識が違ったのも懐かしい話だ。
いまは通じるようになったというか、
音楽業界の常識が、こっちに合わせてきたけど、
昔はフルスケールを0dBとして負の値で言うと怒られた。
彼らは最小可聴音を0dBとして正の値で言う文化だったから。 謡子さんはSinsyの頃からすでに優秀だったから、AI謡子として登場してもそれほど
進化やインパクトを感じないんだよね〜♪
【Sinsy】 マグノリア 【UTAU曲カバー】
https://www.nicovideo.jp/watch/sm12331076
【Sinsy】 右廻りの世界 【UTAU曲カバー】
https://www.nicovideo.jp/watch/sm19361850
【猫村いろは・謡子(Sinsy)】 君の銀の庭(アカペラVer.) 【カバー】
https://www.nicovideo.jp/watch/sm24572001 >>336
NECあたりですかね。
NECは嵯峨山先生が1977年発表した複合正弦波モデリング(CSM: Composite Sinusoidal Modeling; LPCボコーダーのPARCOR+加算合成版相当、海外のsinusoidal synthesisとパラレル)の共同開発でLSIを作って
歌う六本木パソコンことNEC PC-6601SRに搭載した歴史があるから、YAMAHA CX5搭載のCSM歌声合成、WonderhornのNTT(旧武蔵野研?)と並んで歌声合成の歴史を背負っている感があります。 >>340
当時の旧電々ファミリーのメーカー各社が音声合成ソフトを作ってたと思います。
私が見たのはWindows95時代のアプリで、研究発表ではなく市販品の販促でした。
本来の機能であるテキスト読み上げよりも、童謡の歌唱のほうが上手に聞こえました。
テキスト読み上げは、文章だけから合成しなきゃいけないけれども、
歌唱のほうは、音程も与えられているので有利だったのかもしれません。
テキスト読み上げの不自然さは目だって客引きにならないけれど、
歌唱は不自然さが目立ちにくいので客引きになるという考えだったのか、
あるいは、中の人が本当は歌声合成やりたかったのか・・・。 そういや、同じものを示していても、
業界によって用語が違うので面食らったものに、
「N次高調波」vs「N倍音」てのもあったなぁ。 ソンな技術的なことは置いておいて、もうね、ボーカロイドは時代遅れになると思う。
老害が多い2CHは、スマホやラインが登場したとき、「2CHで十分!」でほざいていた。
しかしそうならなかった。だから予言しておく。AIの人口音声が今後主流になる! と。 そう思う。5CHは老害の山。
WINDOWS10の時代でXPで頑張るとか抜かしていた連中だ。
古くはWINDOWS95が出た時代にMS-DOSで頑張るとか言っていた連中。
あと20年もすれば、ジジイしか使わないFAXも消えるハズ。
ITに中國なんかに抜かれているのは全部、老害のせい!!!! >>343
これからはAIの時代だって?
これまでもAIの時代だったんだぞ。
いまの若い人はディープ・ラーニングだけがAIだと思ってるのか。
おじいちゃん達がしてる前世紀の遺物もAIだったんだぞ。
コンピュータ業界ってのは流行り言葉が大好きでね、
一本の同じ流れの上にある=従来からあるものなのに、
あたかも画期的な新機軸かのようなキャンペーンするものなのよ。
そして、いままで使ってこなかった人たちが、
世の中が変わるとかいって浮かれちゃうわけ。
分野が違うけど、ホンダのアシモが登場したとき、何を思った?
二足歩行ロボットの研究の歴史を知っている人らは、
パッケージングと宣伝を除いて、新規性ないと冷めてたよ。 ホビー層に初音ミクなどが愛されてきたのは、
たくさんの手間がかかるからだと思うんだよねー。
使い方をマスターするのに時間かかるとか、
手間をかければかけた分だけ良くなるとか、
そういうところがね。
つまり、ゲームみたいなものだったんだ。
だから、プレーンな譜面データを入力しただけで、
手を加える余地がない程度に歌うようになったらば、
ホビーとしてはオワコン化するんじゃないかなぁ。
これってDTMが辿った道と同じだと思うんだよね。 っていうか、そもそもAIはソフトウェアを開発すること自体が面白いのであって
ある程度完成してしまったらもうつまらなくなる。 342までの超専門的な話の流れを一気に便所の落書きに戻した「ソンな技術的なことは置いておいて」の破壊力よ 前言撤回。
ニコニコ動画に上がっているAIきりたんの無調整の「鳥の詩」は聞けたものではなかった。
調整された初音ミクやIA(イア)のほうが、ず〜とましだった。合成音声にも得意分野があるようだね。 >>351
ニコ動の鳥の詩は聴いてないけど、つべの「鳥の詩 きりたん」検索でいくつか出てくる中で、
ttps://www.youtube.com/watch?v=RxKmfz3R7ws
これなんかは相当いいところまでいってると思うけどな 人によって評価軸が違うんだよね。
何をもって機械っぽいと思うかが。
ライブで目の前の生身の人間が歌っていても、
ナチュラルではなく人工的に感じる場合もある。 >>352
アレンジはいいが、原曲で歌うバージョンはちょっと・・・・・ちなみに「鳥の詩」の楽譜は、
AIR SOUND TRACKのブックレットに記載されている。 東北イタコの歌唱データベース作られるかもしれないので期待しています。 90年代は多層ニューラルネットが大きな壁にブチ当たっていて、2000年代〜2010年代のブレークスルー待ちでブームは沈静化
ファジー論理(3値論理)に関しては、コンピュータサイエンス視点での様相論理(多値論理)再評価の方向になって、ニューラルネットとは乖離
ファジーニューロは関西電器大手で応用製品を出したり電機大手が関連のLSI化をしていたけど尻すぼみ
歌声合成ではATRがサンプリング応用で音のリアルな素片接続型合成を試作して、テイトウワがアルバムで使用
3つの要素(ファジー論理、多層ニューラルネット、歌声合成)が結びつき得る時代では無かったね。
関西電器大手は初期サンプリング機材の輸入代理店をしていた事もあるし、90年代には物理モデル音源の製品も出してたけど
儲けの出ない基礎研究をしっかりやるような企業では無かったからしょうがないね 確率的推計ってのはユーザが部分的に推計に介入するのは無理なんかね 仮にそういうことが出来たとして、介入した部分としてない部分の繋ぎが不自然になるぞ なんで突然、確率的推計の話を持ち出したのかさっぱり意味不明だが。
確率的言語モデルであれば、形態素/統語/意味解析において複数の解釈が可能な場合に、学習データとして使った言語コーパス上でそれぞれの解釈がどの程度の確率で発生したかを参照して、
それに基づいてトータルでより確率の高い解を選択しようという程度の話だよね。
たとえば形態素解析の応用であるかな漢字変換だと、まずは確率の一番高そうなのを第一選択候補として出して、必要があれば人間が候補を再選択して、人間にとり望ましい結果に修正したり、
その修正結果も学習データとして取り込んだり確率値の修正を行う方式が30年以上前から普及している。
それに対し歌声合成の場合はまだ歴史が浅いし、
データやコンテキストや評価基準も複雑だし、
創作活動向きの候補選択ユーザーインタフェースもまだ試行錯誤状態だろうから、今まさに発展中なんじゃね。 AIガチャってのが内部的にどうなってるのか知りたいんだよね
触れるなら触ってガチャ引く手間を削減したい 要はNEUTRINOでユーザができる調整って原理的にどこからどこまでなのか知りたい
>>362の説明のIMEのやり方が音声合成にはやや適切でないというのは分かるんだけど
AI側がいくつか結果の候補を出せるなら並べて出してほしいところ まあ人間がどのフレーズのどの部分をどのようなパラメータについて候補を並べてほしいかUIで事前に指定しないといけないのは当然だろうから
いったん通しで出力したやつを人間が聴いて、それを踏まえての局所的にテイク2〜をAIにお願いしましょうって形になるのかな
そのためにはテイク1の合成の過程をAI側も覚えておかないといけないね >>330
機械音が歌っているのを聞くのは苦手だった
不快な音やもんなあれ
作り手満足だったし
>>1
MacOS対応は? 今のところNEUTRINOはコスパ最強だな
利用に制約はあるけどもAI合成のポテンシャルを界隈の末端まで知らしめた功績は大きい
これを超えるのは正直難しいと思う。
商業ソフトが対抗するなら制約をどこまで減らせるかと声のバリエーションの次元で戦うしかできない。
出音は良くて当たり前、エディットも手数少なく高品質に持っていけるのが当たり前、だからな。 無料で出しちゃうとそれが最低基準になっちゃうってのは有るよな。
少なくとも NEUTRINO (AI きりたん) 以上ってのは誰もが期待するようになった。
初音ミクなんてとても聞いてらんない。
ただ、歴史的には初音ミクに連なるシリーズも作品をとりあえず発表するという点では
大いに貢献したというのも間違いないんだけど、
いろんな人が「歌ってみた」をやって初めて完成という感覚はあったよね。
(つまに初音ミクは仮歌としてしか使い物にならない。) >>370
Vocaloidの中でもミクが特にそう感じる声だっただけで、Lily V3とかMachaあたりは不快じゃなく普通に聞けると思う。 >(つまに初音ミクは仮歌としてしか使い物にならない。)
ライブで日本だけでも何万人、世界中で何十万人も動員してる現実が見えてない人? 初音ミクを人間の声の代用として使おうとするやつはそりゃ仮歌にしかならんよ。せめて他のボカロにしろよ。 ミクは人間の声じゃないところがウリだからそこは認めないと。
AIきりたんとAIヨーコさんで比べるなら同じ土俵だからいいんじゃね ジャズなんて音楽じゃないと言ってクラシックに固執してたり
ロックなんて音楽じゃないと言ってジャズに固執してるような化石みたいな音楽観だよね >>377
消失とか高音厨音域テストとか人間には歌うことが難しい曲が流行ったからそういうイメージが付いてるけど
クリプトン自身は別に人間の声じゃないことをウリにして売ったことは無いような
メロディがあって歌詞が聞き取れるから歌声と認識できる
あとは好き嫌いの範疇なんじゃないかな
ここで挙げるまでもなく有名Pの歌詞は聴き取りやすく調声されてるから
「初音ミクは使い物にならない=自分には使いこなせない」と言ってるように受け取れる >>374
あれは初音ミクのキャラクターで売ってたのであって、
もちろんそれも商業的成功ではあるけど耳障りさを擁護する根拠にはならんよ。
いわゆる「不気味の谷」ってのは音にもある。
人間の声とは別種の楽器だといくら言い張ったところでボーカルとして使ったら
ボーカルとして聞いちゃう。 >>380
「耳障りではない」とも「人の声に聞こえる」とも言ってないよ
「使い物にならない」という主張に対して活用している人はたくさんいるし成功事例もあると言ってるだけのこと
使い方の問題でしょ 使えないとか気になるとか全部主観で
現実として成功している部分を直視出来ていないよね もうキャラありきで公式や公式が拾ったコンテンツにファンがついてる様なもんだからねえ
色んな意味でもう比較しちゃいかんと思うわ 使い物にならないじゃなくて
使う気になれないと書いてれば突っ込まれなかったのでは まあ発音が常に聞き取りやすいかと言われると現状のミクでもエディットヘタクソだと話にならん、かな
そこはAIシンガーの解像度の高さに軍配が上がるところ もちろん話し声じゃなくて歌声である限り、歌詞なんて全然聞き取れなくてもいいんだけどな
英語以外の洋楽と同じ チー牛おばさんが自演連投すると
どのスレも瞬時にゴミクズになるな >>384
ワイは創作者ではなくて、聞き手としての感覚で書いてたわ。
主観を正確に表現するなら「初音ミクを使った作品は出来が悪いように感じる」やな。 もちろん上手く使えばいい感じというのも正しいんだろうけど、
そういう作品が多くない以上は消費者側の意見としては出来が悪いとしか言えない。 AIきりたんもヘタクソに打ち込むと割とロボくもなるんだよな
そちらの方が興味深い 聞き手側なのに「使い物にならない」って色々失礼な奴だな 初音ミクが13年に渡って歌声合成とヴァーチャルアイドル市場を切り拓いて盛り上げてきた上にNEUTRINOの存在があるのに
そのNEUTRINOと比べて初音ミクを出来が悪いて
さすが聞き手様は言うことが違うわ この板にいるのはある程度長く生きてる人間ばかりだから初音ミク以前からの流れも理解してるだろう、音声合成の歴史は古いしな。
でも若いクリエイターはミクを見て聞いてクリエイターを志したピチピチもいるから、ミクのでかさが体感でまったく違うだろうて。
ぽっと出の新人ボーカルと人生に最大の影響を与えたボーカルの神くらい違うはず
こんなとんでもない存在と比べたら、AIきりたんは作られたご当地キャラとはいえ、ある意味そこらにいる普通の人間のボーカルよな 新幹線の0系と最新のN700S系を比べて0系は出来が悪いと言うようなもんやな ボカロが出た当初、宅録に女声リードボーカルを取り入れるつもりでMIRIAMやMEIKOを買ったけど、結局は
自然さとは程遠い出音で断念した自分にとっては、NEUTRINOでやっと実現したいことが出来そうな気がする ボカロ発売から十数年経てようやく人間にかなり近いボーカルがコンピューティングで作れるようになったという点で
NEUTRINOやこれから出るCeVIO AIはDTM史に名を遺すじゃろ。
一方で出来た作品の良し悪しなんて観点は歴史にあまり記されない。ミクファンからすりゃ思い出の名曲だらけだし。
みっくみくもメルトも千本桜もその他にも数万曲あるんだっけ、AIきりたんがそこまでの曲数を歌う機会に恵まれるかといえば いずれ本格的な商業利用が始まれば、通信カラオケのガイドボーカルではAIシンガーが大活躍するかもしれんな。 きりたんは合成と分かって聴いていても人間に聞こえるほどだし
街なかで聞こえてきたら誰も合成とは気付かないレベルではあると思う
でも何十曲も聴いていたいかというとそうでもない
可愛い声ではあるけど素人の女の子が歌っているレベルで歌に魅力が無い
でもこれがPVやヴァーチャルキャラクターがあって歌って踊っているとまた違うかもしれない
初音ミクは狙ってそうなったわけではなくたまたま技術の進歩と合致したんだけど
タイミングの良さや権利のコントロールなどやはり奇跡的だと思う 初音ミクの歌声には人工の歌声が抵抗なく聴けるかどうかというハードルがある
一方のきりたんは声質や歌い方の好みで人間の歌手と並んで選ばれるレベルに達していてそのハードルを超えている
初音ミクを含むボカロはCDショップを見てもボカロコーナーがあるように
キャラクター性まで含めた「ボカロ」というジャンルになっている
これからきりたんがどういう展開を見せるか興味深いが
一つはっきりしてるのはきりたん(NEUTRINO)とボカロは合成方式以外の面でも現在のところは別物ということだね 多少合成に欠陥があるのも含めてAIきりたんが最初の研究成果なわけで、次に東北イタコさんが来てからが本番だな
どこがどれだけ変わってるのかボカロ耳じゃない本来の歌モノのプロの聴覚を問われるレベルの出来になってると期待してるよ 正確にはSinsyからの流れでヨーコさんも研究成果に含めなくちゃいけなかったな
あれが一番、合成方式の進化の恩恵が分かりやすい 俺はアーティストではない。
産業技術 (テクノロジ) 的に見ているという自覚があってそこが齟齬なんだろうというのはわかってる。
上限が高いことよりも下限が保証されていることが重要という考え方をする。
ボーカルに楽譜を渡せば及第点程度には歌えるのが当然で、
細かな表現を付けて魅力的にするのはそこから先の話。
で、ボーカロイドはそれを達成できなかった。
そこを意地になって調整したりなんなりでボカロ曲というジャンルが出来たのは
アートとしては一種の成功ではあってもテクノロジ的にはも十分な成功ではないと思うんよ。
ボカロ曲というジャンルが確立したということは否定しないよ。
ワイにとっては耳障りなことも事実だがそれは単なる好みだしな。 言葉の選択が不得手なんだな
2007年発売ということを考えればテクノロジー的にも十分成功だろう
当時誰がヴァーチャルシンガーがライブしたり地上波のMステに出たりすると想像した?
文脈的に「成功」ではなく「完成」が妥当だと思うがそれならきりたんでも未完だわ >>405
だからそれはキャラクター商売の部分でウケたんだって言ってるじゃん。
そのキャラクターなら許される音であって、キャラクターありきでどうにか受け入れてもらえる程度でしかない。
キャラクターを前面に押し出さなければいけなかったのはむしろテクノロジーの未熟さの証だろ。
テクノロジーとしては「歌声」が目指すべき目標なはずだろ?
だからまずは歌として及第点程度であるというのが俺の考えるテクノロジー的に十分な成功だ。
俺にはボーカロイドは歌声には聞こえない。
せいぜいが音階のある奇声、歌声としてはピーキーさが過ぎる。
俺が「十分な成功ではない」という言い方をしているのは、
失敗だと思っているわけでもないってことだ。
そりゃあ時代背景を考えれば部分的には成功でもあったんだろう。
でも「歌声」と言っている以上は普通の歌声に聞こえる程度を基準にするのが自然だろ? はいはい
君の成功の定義と俺の定義は違うってことだね 聞いてらんない
使い物にならない
耳障り
出来が悪い
歌声には聞こえない
NEUTRINOスレをアンチボカロスレと勘違いしてるのかこいつは 一応俺がリスペクトしているボカロ曲を何曲かあげておく
372氏の認識が少しでも変わることを願って
【VOCALOID Megpoid Gumi】Miracle∞Gumiracle【Touhou Vocal Cover】
https://youtu.be/-hZNtYfErfE
【VY1V4】Fairytale,【カバー】
https://youtu.be/4hNpxi0N-2U
【Fukase・Otomachi Una】Near【Cover】
https://youtu.be/_xGk3OY-uxM
【初音ミク】海の幽霊【カバー】
https://youtu.be/jfynSsb0qrw
投稿年の古い順
1番上は驚くことに11年前V2時代の作品
下3曲は全部kyaami(Cillia)さんになってしまった
検索したら1曲めのきりたんバージョンが出てきたので
NEUTRINOスレだし参考までに張っておく
【AIきりたん】Miracle∞Hinacle【カバー】
https://youtu.be/lEXmW6D0MpQ >>408
歌声をベースと置き換えたらTB-303の発売時の評価のようだw >>409
だからさ、良い曲があるよ〜、とか、上手く調整してるのがあるよ〜ってのはテクノロジーの敗北なの。
お前がそういうの紹介するのはテクノロジーの敗北の証拠なの。
一番へたくそなのでも歌声ではあるよね (その上でアーティストは魅力的な調整をしよう) ってのが
本来はテクノロジーに求められるものであって、
歌声になんなかったやつ、またはめっちゃ頑張って歌声っぽくなったやつもそれはそれでアートだよねってのは
派生的な成果に過ぎないんだってば。
「歌声を合成しよう」という目標に対してそれは (十分には) 達成できてないよねということを言ってるだけなのに
なんでそれがわかんないの。 ボカロは登場した当初から、けっこう面白い楽曲が短期間で公開され新鮮だったよね。
今から振り返ってみれば、ボカロというあたらしい楽器に才能が集結し、その後も語り
継がれるような名曲を次々と発表していったことで、それが大きなムーブメントとなり
盛り上がっていった、というのが自分の実感かな。
下の楽曲など、各人がボカロに託した夢や希望みたいなものが歌詞や曲にあふれていて
いま聴いても色褪せない魅力がある。
「Ievan Polkka」を歌わせてみた(2007/09/04)、みくみくにしてあげる♪(2007/09/20)、
Packaged(2007/09/25)、ハジメテノオト(2007/10/14 )、教えて!! 魔法のLyric(2007/10/20)、
私の時間(2007/10/22)、ミラクルペイント(2007/11/22)、01_ballad 星に願いを(2007/12/24)
自分のように既存の商業音楽の歌詞やメロディに退屈していた人間からすると、まったく
別の物語の世界が開けたようで、すごく新鮮な気分になれたことを覚えている。 >>408
ボーカロイドは歌声を作ろうとして (十分には) 歌声になりませんでした。 (事実)
しかしそれはそれで一つのジャンルを形成しました。 (事実)
私はボーカロイドの声をとても耳障りに聞こえます。 (感想)
NEUTRINO はまさに歌声らしい出力をします。 (事実)
なので (ボカロが苦手な) 私にとってはアーティストがこのような道具を得たのはありがたいですね。 (感想) >>372は歌声合成技術テクノロジー的な観点から述べていて、>>400は一般市場に受け入れられたかどうかに重点を置いているから話は平行線のままなんだよ(´・ω・`)
2人とも言ってることは間違っちゃいないが、もう少し歩み寄ったらどうだい(´・ω・`) もともとは「歌声」を指向してるんだから
より歌声らしい方がテクノロジー的には上等じゃん
(エンターテイメント的には知らん)
ってだけの話なんよね。
それと世間にとってどうだろうと俺にとって耳障りなものが耳障りでなくなることは無いんで、
別の選択肢が現れてありがたいですよねってだけ。 まぁあれじゃないの
生ドラムを代替するつもりでリンドラとかTR808を作ったけど、結局全然生ドラムの代わりにはなれなくて
その代わりに新しいジャンルを確立してしまったっていう >>415
誰が聞いても歌声に聞こえなかったら歌番組にTV出演までしてないと思うから
テクノロジー的にも一定のレベルに達している=一定の成功を納めていると俺は考えるけど372は違うらしいし
誰が聞いても歌声に聞こえそうな曲を紹介してみても「紹介するのはテクノロジーの敗北だ」とか
なぜか勝ち負けの話にすり替えて聴く気も無さそうだし
372が歩み寄る気なんてサラサラ無さそうだからお話になりません >>418
だからさー。 同じことを何度も書かせるなよ。
> 誰が聞いても歌声に聞こえなかったら歌番組にTV出演までしてないと思うから
キャラ人気で引っ張ってボカロ曲というカテゴリとして出たんだろ。
歌声合成が目指していたのは本当にそれだと思ってるのか。
繰り返すが部分的な成功であることは否定してない。
ただ、目指していたはずのものを達成しているとは思わん。
> 誰が聞いても歌声に聞こえそうな曲を紹介してみても
歌声を合成するソフトなんだから歌声に聞こえるのは当たり前なの。
それは大前提なの。
全部が (下手でもなんでもとりあえず) 歌声に聞こえるというのが出発点なの。
歌声に聞こえるものを選ばなきゃならないようではそこに到達してないわけ。 「ボクのかんがえるうたごえソフトのとうたつてん」とか知らんがな
自分のブログにでも書き散らかしてろって いずれにせよ自分が思うほど上手に歌わせられないのはこれもボカロも一緒だ
難易度とアプローチが違うだけ
なので使わない立場でモノを言うのはナンセンス 俺が歌声に聞こえないソフトは歌声合成ソフトではない(キリッ もっとバリバリに調声したきりたんが聞きたいんじゃぁ〜 久しぶりに来たんだが
これ商用利用は出来るようになった? >>431
え?マジで?知らんかった!
ありがとうやで! フルートだってギターだって、楽器ってまともな音を出せるようになるまで時間かかるよね
練習して上達して「音楽」にしていくもんなんじゃないかな
なんでボカロだけ敗北になるんだろ? 消費するだけの人の意見なんていつも贅沢なもんさ
音楽に限らない どうしても高音を歌わせると声がかすれてしまう
かと言って1オクターブ下げると別の箇所が低くなりすぎる
どうしたらいいものか... 新バージョンもうすぐリリースですな
ひとつのソフトで2種類のエンジンが同時進行するのは面白い >>433
音楽かどうか、とかそういうことは言ってないんだってば!
楽器に期待されるのは少なくとも期待する音階が出ることで、
ドを鳴らそうとしてレが出たりしないのは当たり前のことだろ。
表現はその後の話。
歌声だって少なくとも歌声であって奇声ではないことを期待するのが
そんなに不自然なことか? >>433
最初から超上手い人がいるから
楽器だって小中学生でプロ顔負けの演奏できる奴いたら注目されるだろ
そういうのって何千万人に1人クラスだけど実際いるからね
そういう才能の前では皆その他大勢でしかない 勝ち負けで音楽を判断する時点で話にならない
ボカロ文化の全否定かと 私負けました〜みたいな曲書いて爆発すんのがボカロ畑だから 少なくともNEUTRINOは「解像度が高い」のがすごいのであってピッチが完璧とかいう話をする対象じゃない
使ってればそんなことは口が裂けても言えないはず アスペは勝ち負け、優劣みたいな1ビットでしか物が考えられないからな(^^; 人間の歌唱において「滑舌がいい(似たニュアンスだと音素の解像度が高い)」という状態をアーティキュレーション用語として表現する確立した言葉は存在してないみたいだから
歌声合成の評価基準としては研究者向けのそれしかなくて、一般人はフワフワとしたあいまない言葉で上手い下手を論じるからこうなるんだろうと思う。
そもそも音素が聞き取りやすいことは歌の良し悪しとは別の次元にある概念で、わざとモゴモゴ歌ったり掠れたりスキャットで言葉として意味のない聞いて気分が良い音素だけ並べたりと
芸術だから作る人と聞く人が気持ちよくなればそれで良い物なので、仮にカチカチに歯切れよくしか歌えないと逆に崩したくなる作り手も出てくるし逆も然りということだな。 音素というより波形の解像度と言った方がニュアンス正確なのかな
まあ低音部の解像度がもうひとつなのはみんなさすがに共通認識だろうから今後の課題はそれだと個人的には思ってるが
CeVIO Proが嵐のイケボイスで男声を高解像で歌わせて一般人に出してきたので期待が持てる
NEUTRINOにも誰かバス〜テノールのイケボな方が歌声DB提供してくれたらいいのにな >>433
ボカロは楽器より無駄な手間がかかるだろう
比較対象は人の歌声なんだよ 人間が歌が上手いと思っている人はDTMerでは絶対にないのでそろそろ出ていってほしい 歌唱ソフトを人間に似させるためには、もっと多彩な表現力を持たせないとダメ
そういう意味では、やっと人に似させることができたという入り口の段階
これからは、軽く流すように歌うとか、鼻にかかった歌い方をするとか、声色を
変えて(ものまねやキャラ変で)歌うとか、泣くように歌うとか、もっと人間に
近づけていかないとエモーショナルな表現力や色気は乏しいままだと思う
亜蘭知子 I'm in Love
https://www.youtube.com/watch?v=pE2D3LWADFg
木村恵子 電話しないで
https://www.youtube.com/watch?v=oNQkWgrNbzU ttps://nicovideo.jp/watch/sm37539100 ttps://nicovideo.jp/watch/sm37539012 >>439
> ドを鳴らそうとしてレが出たりしない
これって演奏者のスキルの問題ですよね。
ピアノならミスタッチしない、とか。 期待するピッチが出ないのなら実例のひとつでも示せばいいのに >>437
ピッチ変ガチャでうまく声出るようになったわありがと きりたんやイタコに歌わせるような普通の曲が全然作れん
ボカロっぽい曲ばかり作ってきた弊害を今更感じてる 仕方ない、テキトーにコード進行やアレンジをパクって作るか… イタコさん早口も割といけるみたいだけどまあボカロのは極端だしな クソみてえな抱き合わせエディタ出してYAMAHAがサードパーティに見限られてる間に技術面でもフリーソフトに抜かれてるの情けなさすぎてウケる 顔文字を含む自演ネガティヴ連投は
3年来のDTM板荒らし山形チー牛顔婆の特徴 https://i.imgur.com/2chBg6u.jpg ver4になってから、NSFだと高域が少し耳に刺さるような感じがしない? NSFはあんま好みじゃないから使って無いかな
一長一短あるんだろうけど ボカロの声が嫌いだった俺はこれのお陰で世界が変わった。歌ものを作れるようにしてくれたきりたんありがとう。 自分の場合はこれのおかげで今まで書いてたボカロ曲のメロディの不自然さに気づけたわ
そもそも発声のタイミングとかおかしいのを変な風に誤魔化す技術ばかり身につけていたんだよな んだな。ミクはケロケロを標準でつけてから売れやと言いたくなるくらい変声だと思うわw だな。元気な感じはいいと思うが、かわいさゼロ・・・ カッコイイ系にはめちゃくちゃ合うが
アイドルソングっぽいのは厳しいな きりたんは歌手で言うと奥華子に近いものを感じる
外連味がなくって、ピュアでストレートな感じっていうのかなあ
松田聖子のような可憐なアイドル臭は無い 中の人のこと知らんからなんとも言えんがそれでも学習DBは全部アイドル曲らしいからなあ
難しいとこだね CANDYCANDYとかパンツはけるもんとか
きりたん無調声に歌わせたらなんか壮絶なギャグになったわ アイドルの声質ということでは、CeVIOのささらの方がそれなりの魅力を持っていると思う
【CeVIOカバー】 さとうささらで 「勇気の神様」
https://www.nicovideo.jp/watch/sm23577101 FormantShiftいじっても全然かわいくならないんで、きりたんは捨てることにしました・・・ 外部のボイチェンエフェクタ使った方がいいよ
あるいはレゾナンスとか そうなん? とりあえず、イタコに深めにコンプかけたら、割と満足した フィルタでガツっとロー削るとかまあ色々やってみたらいい
せっかく今一番発声品質が高いAI合成が使えるのだから外部で弄り倒してでも満足するまで使って
先行者利益(商業的にでなくノウハウ面で)を得よう CeVIOからインポートする場合、無声化の「’」は半角じゃないとダメな感じか? おおむね満足なんだけど、鼻濁音ってどうやるのかな?
VOCALOIDの時はNを付けるんだったと思うけど
原則ひらがなしか受け付けないみたいだからなぁ
ちなみに「お」と「を」は同じ扱いっぽい
「wo」と発音させたいときは「うぉ」がいいみたい 自己解決
「が」の鼻濁音だったら音符一個に「んが」って入れれば鼻濁音っぽくなる
あとはスラーが使えればいいんだけど、これはピッチカーブで描くしかないかなぁ 鼻濁音の出し方は普通に義務教育で習ったのと同じってだけだな
というか、グーグルで発音記号を見てみ。知らない人にとっては目からうろこかもしれん シャクリもだけど、テンポや表現によってどれくらいの音価で置けば良いのかも変わってくるし難しい 時間の長さを音価と表現する事で、判ってる風を演出してみましたw 時間の長さって何?
音の長さって言いたかったのかな? ここでの音価はラベルファイルのタイミング情報と定義しておいた方がいいんじゃないかね
楽譜では表現できないけど発声で重要だし 鼻濁音の話と全く関係ない一般論をドヤ顔で書いてる時点でゴミクズなのは一目瞭然 音価とは楽譜上の音符や休止記号の長さの事。
DTMでは発音タイミングは大まかに音価に従うが
key on/key offの間の時間、いわゆるGate timeを音価以下の範囲で設定して演奏表現するのは基礎の基礎なので今更指摘するまでもない話だが
この人物は音価とGate timeを混同している臭い 気狂いの気狂い文章にツッコミを入れたら
9分かかったのはおかしい、と気狂いが発狂連投 音価が楽譜上の音符や休止記号の時間的長さって
幼稚園や小学校レベルの基礎中の基礎だから
逆に>>495や>>499のような妄想文章が何を言いたいのか、健常者視点では推測が難しいよね ちなみに細かい話だけど小学校までで音価という単語は教えない
個々の音符や休符の名前(四分音符など)を教えるにとどまる >>495はNote valueの意味で書いたのだろうけど言語学で音価というと文字で表される音 phonetic value の意味もあるんだな >>499
タイミングではなく継続時間
ほらね、判ってないのに判ったふりをするから
話が支離滅裂 >>507
いくら名称と意味を切り離して屁理屈を言っても
意味が判っていない事に変わりはない >>496で「音価なんて珍しい単語使って判ってる風w」みたいなスタンスで突っかかって行ったのに
>>505で「音価なんて基礎中の基礎ですから」って急変、キチガイすぎるだろ
これが噂のトビサワニカゲツ君ってヤツか 簡単な概念に、普通使わない正式名称を使った挙句に
意味を取り違えてやっぱり判っていなかった事を
後から誤魔化すいつもの知恵遅れ 「音価」ではなく、「発声継続時間」とか「gate time」とかそれに類する表現をすれば一発で伝わるのに、「音価」の意味を取り違えているから話が意味不明になったんだよね
譜面上の音価に対して、演奏表現として発声/発音継続時間あるいはシンセやDTMならgate timeを調整するのは基礎の基礎である事には変わりない こんなくだらない話をいつまでも言い訳するのは
未だに間違いを理解していない知恵遅れの証 言い出しっぺがどういうニュアンスで音価と言ったのかはまだ誰も分かっていない 元々の話は、楽譜レベルでは作曲時に確定済みの音価を、打ち込み時には演奏表現として持続時間何パーセントにするかという話なので、音価ではない この手の話は、用語の用法を勘違いして誤用すると、より適切な言い換えもサクッと示されるのに
間違えた当人はいい加減な用語使いにいつまでも固執して、自分の間違いは確定していないと言い張る不毛な展開 AIきりたんを使っていて明らかにおかしな音になる場面に遭遇したので調べてみるとロングトーンが苦手ということなんですね。
これは音符の入力の工夫ではどうしようもないのでしょうか?
(出力した音をいじってどうにかする必要がある?) AIシンガーを今までみたいなボカロと同じように扱ってもうまく歌ってくれない
打楽器弦楽器管楽器、それぞれ出せる音域が違って奏法や適したフレーズが異なるように
AIシンガーにも適した音域や歌い方が存在するんだから
作曲側もそれに寄せないと理想的な仕上がりにはならないよ
逆に自分がやりたい音楽を突き通すなら無理が出てくる部分は妥協するしかない >>519
出音は外部で弄ってナンボの時代なのでダメなところはメロを直すとか切り貼りで対応する方が早いかな
人間ならブレス位置に気を付けて頑張って伸ばしてくれと指示すれば通じるがAIきりたんはブレスさせても厳しい時がある ロングトーンは頑張っても1小節だね
こないだ2小節にまたがるロングトーン書いたら、ブレス置いてないのに
手前のノート無視で数秒ブレス吸い込んだあとロングトーン出力してて
肺活量まで人間ぽいんだなと妙に納得した
どうしてもロングトーンしたいなら、ロングトーン前のフレーズと
ロングトーンのみのフレーズに分けて波形でつなぎ合わせるかタイムストレッチ
どちらにしても波形レベルで、一発解決は今のところない
今後のバージョンアップでどこまで緩和されるかだな
ブレスなし早口は他の歌唱ソフトの得意とするところだから
適材適所で使い分けるのが吉だと思う ブレスも強いブレスとか長いブレスとか指示できたらいいのにな
大事な表現のひとつだし >>518
もう誰もそれ話題にしてないよ(´;ω;`)フ
不毛なのはお前の頭だよ(´;ω;`)フフフ? ブレスはブレスサンプル音をサイドチェーンして合わせた方が楽だと思う サイドチェーンで排他的処理できたっけ?
音楽の息継ぎ効果は、メイントラックに大音量のバスドラ等を重ねてコンプで潰して、バスドラ等が爆音で鳴った瞬間だけメイントラックの音量が下がる感じ まあメインとバスドラに別コンプをかけるならサイドチェーンで合ってるか >>521
ロングトーンで後半が苦しくなるのならきりたんの個性ってことでいいと思うんだけど、
子音のほうが破綻してしまうのはプログラムの改善を期待したいところだなぁ。
とりあえずきりたんには出来ないと割り切って出来るギリギリまでやってくれればいいやってことで
長さを縮めたけど思ったほど不自然にはならなかったわ。
二小節のところを一小節にしても案外こんなもんなんだな。 まだ母音のコントロールまでは気が回ってない感じだよね
ビブラート、ポルタメントとか、複雑だから難しいんだろうな
演歌や民謡の歌い方みたいに音程を完全に移動する歌唱法もあるし
言いたいことは自分で直したいから編集ソフトくれ ずん子もNEUTRINO化する可能性ありらしいですね。 合唱するときにちょっとづつパラメータをずらしても
結局は同じ声だったら合唱って感じになりにくいんよね。
声の種類が増えるのはありがたいッス。 シンガー違えばタイミングやピッチが微妙に違うから、ただ重ねても自然な合唱になりそうだね
東北三姉妹揃うとアイドルグループっぽい曲が合いそうなので楽しみ ボカロの場合はシンガー違ってもコピペだと変に打ち消し合ったりするから手動でずらしてたな VitalのようなWavetableシンセにAIシンガーやAIラッパーが搭載されると面白いな めろうって言う新音源、息成分多めなので
ずん子の声も普通に作れそう 学習の質と量を上げていけるということらしいから今後も期待できるね
来年もおそらくNEUTRINOが最強エンジンとして君臨するだろう ファルセット(裏声?)の実装がまだなので対応が楽しみやな。
SyntheV AIの紅蓮歌では裏声出してたからCeVIO AIも出来るんだろうけど。 同じモデル・パラメータでもバージョンによって結構出音が違うね
一概に新しいバージョンが良いとも限らない
ひょっとしてWin/Mac/オンラインのプラットフォーム違いでも出音が変わるのかな 16分で50パーセントとか微妙にスウィングさせたいのだけど出来るものですか? AIきりたん最新モデルでも稀に一部がささやき声になるバグあるね
調声ツール使ってもピッチの線がそこだけ途切れてて、鉛筆で書き足すこともできない たしか有志ツールがそのへんを整備してくださったはず 何が言いたいかっつーと
> 調声ツール使ってもピッチの線がそこだけ途切れてて、鉛筆で書き足すこともできない
これはきりたん外のツールの問題できりたんの問題じゃないのでは ああ、そういう意味か
実際のデータをツール開発者さんに送って見てもらうのがいいかもしれないな。 >>544だけど非公式ツールの話だって把握はしてたけど区別なく話してしまって申し訳ない
外部の調声ツールを使わない段階でまずささやき声になってて、それをその調声ツールで治そうと思っても
「ピッチの線が途切れてて〜」って状態になってて治せない
歌詞を変える前は正常だったし、キーを半音下げて調声ツールで読み込んでからツール内で半音上げて出力っていう手順で一応
普通の声になるんだけど、一応NEUTRINO公式とツール開発者に教えたほうがいいかもしれない >>552
公式でできたんですね、知らなかったです…ありがとうございます ボカロからここまで進化したのは素直に凄いと思うが
いまだに何か下手糞なのはなんなんだ
声をエミュレートするにはパラメーターが足りないということか 学習時に与えられるデータとパラメータの量と質でだいたい決まるからな
エンジンの調整はあまり関係ない(触れば変わるが必ずしも良い方向へ変わるとは限らない)
と思う
ユーザはガチャを引きながら美味しい部分をかき集めてなんとかする Voice Coder方式とDNN方式の相違を理解せずに
要素還元主義の更に一例に過ぎないVoice Coderを万能モデルと思い込んで
「パラメータガー」と言っておけば本質を外さない筈だとタカをくくるハッタリ老人って居るよな
DNNは限られた数の教師データを高次ベクトル空間の特徴量に還元・学習し、教師データとよく似たデータを生成する手法であり、パラメータ合成方式とは異なる手法 頭の病気が原因で無限に妄想を紡ぎ出す欠陥生物は相手にする価値のないゴミクズだ もう教師なし学習に比重をおかないといけない段階に来ている
NEUTRINOが学習でGANを使っているのかどうかは知らない これから追加で必要なパラメータは声の明るさや口の開け具合、喉の開き具合、息の入れ具合など
学習元である歌手本人が意識的にそれを講じることで生まれる声質の変化と、その数値化かなと思う
そこまでやる学習コストは尋常じゃないだろう >>567
ユーザサイドでどうにも出来ないことだから厳密に議論しても無意味だけどな なんか実際に現場で使われてるんやなぁ
https://www.iwate-np.co.jp/article/oricon/2180159
作りやすさでCevioやSyntheVのAIに取って代わられるだろうけど
ボカロ界のゆっくりの地位を築けるかもしれん 新年早々ハッタリ老人パラメータ婆が発狂相手を探し回って連投して来てワロタ 無料で仮歌が出せるんだから強いわ。シンガーの種類も順調に増えてるし。
歌声合成界隈において、MMDが出た当時の3DCG界隈のようなインパクトがあったんじゃないかね
DTMステーションでNEUTRINO他の合成シンガーシェアを調べてくれるといいんだが とりあえず駿台偏差値48の底辺国立大理学部に間違って入り込むと、いまどきDNNの概念すら知らずに
DNN方式をパラメータ合成だと決め付けて発狂してうんちを漏らす異常者が待ち構えているから
関わらない方が良い DNNの大元にはパラメータが必須なんだが知らんわけじゃないよね いわゆるブライト感の学習とかは実際の人間のボイトレを参考にするのがいいかもな
もっというと後付の空間系エフェクターで
口の中をエミュレートする
口の開け閉めだけ真似るだけでもかなり違いそう 今のNEUTRINOはDAW内で完結できず、めんどくさいのが欠点だな。フロントエンド的なものをVSTiあたりで作れたら便利になりそうな予感はある。
あとは、人らしく歌うけど、思い通りには歌わない問題か。
CevioAIやSynthesizerVも出てきそうだし、今後もいい方向に発展していきそうで希望がもてる。 VST化は先にCeVIO AI Proが実施するんじゃなかろうか
それを見てから追随するなり、さらに改良した連携を模索するなり きりたんでB2以下からレンダリングしても発声しなくなるのですが、仕様ですか? こんにちは。このスレの住人の方はNEUTRINO調声支援ツール使われてますか? >>575
自分の場合は結局DAW(自分はLOGIC)に読み込んでから調節する方が早いんで
そっちでやってる MuseScoreで新規、修正は調整ツールでやってる コメント有難うございました。DAWで直接エディットされている方もいらっしゃるんですね。自分は調声支援ツールで調声、DAWで二次調声という非効率なやり方をしてます。DAWで直接調声できるいいボーカルエディタが有ればなぁって思ってました。支援ツールはとても有難いのですが、スコアを書き換えると調声は一からやり直しですよね。(自分の認識合ってるかよくわからないですが) 得体のしれないところに登録せんといかんのがちょっとなぁ ツタヤグループやし海外のよりは得体が知れてるから問題ないやろ 教えてください
今日初めてNEUTRINOを使ってみたんですが
アウトプットフォルダににbap、f0、mgcファイルは作られるのにwavだけ生成されません
cmdの内容を覗いてみると
「Error:Failed tu run NSF. Please check log(NSF/NSF.log).」
ってのが見えたんで、
NEUTRINOの中のNSFフォルダにあったlogを見てみたら
「FAILED in GPU initialization: CUDA driver version is insufficient for CUDA runtime version」
という記載がありました
これってCUDAドライバーってのをインストールすればなんとかなるんですかね? WORLD版で試したら? NSF版はグラボが対応してるか分からんし そのエラー出たときはGPUの最新版をアプデ出来るのにしてないときに出た
あとmusescoreで作ってるなら息が続かないほど歌わせてるときにも出た
間に少しでいいから休符いれたら直った
あくまで参考で
>>583 レスありがとうございます
グラボがダメなんですかね
ワイのグラボは「Intel HD Graphics 4600」というざーこ♪ざこざこ、ざぁ〜こっ♪なグラボなんで
やはりお話にならないんでしょうか
で、この場合は調べた限りだと以下の2通りやり方があるのかと思ったのですが、合ってますかね?
(1) ひとつは>>584さんが言うようにWorld版ってのでWAVを生成する方法
このWorld版ってのは
@公式ページで0.200以前の過去バージョンを入手するか、あるいは
ARun.batファイルの
echo %date% %time% : start NSF
bin\NSF_IO.exe score\label\full\〜
って行の前に「:」を入れるって理解でいいんでしょうか?
(2) あとなんか調べたら
「NEUTRINOオンライン版でGoogleコラボラトリーを使った高速処理+NSF処理をしてみよう」
とかいう記事が見つかったんですが、
これはGoogleコラボラトリーとかいうクラウド上のデータを借用することで
ワイのザコザコグラボでもNSFを使ってWAVを生成できるってことでしょうか?
>>585
ありがとうございます
アプデもしてみます(´・ω・`) >>587
それってCPU内蔵機能ですよね。世間ではそれをグラボとは呼びません。
別途でCUDAが動くグラボを買ってきて挿せばGPU版が動くんじゃないかと思います。
でNSFは書かれたとおり自分のPCの能力は使いませんのでそちらをお試しあれ >>587
うん。グラボが対応してない。
Ver0.4 のWinかMacのインストーラー(Onlineじゃない奴)で問題ないはず・・・
NSF_IOのコメントアウトはいらない
(2)は、難易度が上がるから忘れていい
>NEUTRINOの中のNSFフォルダにあったlogを見てみたら
>「FAILED in GPU initialization: CUDA driver version is insufficient for CUDA runtime version」
問題ない。未対応なら出る。俺のも出てるがWaveは作成されてる。
Run.bat 実行時の出力で以下が出てれば、WORLDで動いてるはず
no NVIDIA-GPU was detected.
executing in CPU mode... >>587
バージョンは最新で構わない
(1)のやり方(行の頭に「:」を入れる。「: bin\NSF_IO.exe〜」て感じ)でOK。world版の
wavファイルが作られる筈
これでできなければ何か別の原因
ちなみに(2)だと自分のPC環境に全く関係なくNSFが使える (1)の@はうまくいかず・・・
Aのコロン入れるヤツを試したらWAVが出力されてました!
めっちゃ元気に歌っとる・・・キリタンカワイイヤッター
>>588
基礎的な知識がなくてすみません・・・
グラボってオプションとして買ってきてPCの内部にぶっさすヤツですか(最近はUSB?)
WorldとNSFの比較動画を見たりして、今後検討してみます!
>>589
no NVIDIA-GPU was detected.
executing in CPU mode...
これは出てましたねえ!
グーグルコラボラトリーってのは確かに難易度高そうなので、
いただいたアドバイスに従って今はスルーしときます
>>590
できました!レスありがとうございます!
めっちゃ長文を投稿したのに、みなさんしっかり読んで丁寧に返信してくれてありがとうございます!
これからきりたんに好きな曲カバーしてもらったり、オリジナル曲を作りたいと思います。
本当にありがとうございましたm(_ _)m >>587
とりあえず、コマンドの出力結果残すようにしたら?
RunLog.bat を新規で作って以下の内容で保存して実行
Run.bat > Run.bat.log >>591
とりあえずおめでとー
正直今お持ちの知識だとグラボ増設はハードルが高いと思うので、NSF使うなら
オンライン版の方がまだ近道かも、お金もいらないし
個人的には現時点ではNSFよりWorldの方が好み。NSFは何となくキツク聞こえる 使いこなすにはややハード寄りなソフトだから最初のハードルが高いのは仕方ないか
とはいえGPUなくてもオフラインでもCPUで処理できないこともないのは有情だね時間かかるけど その「有情」という場違いな単語を
他の意味の通る表現に書き換えてくれ
造語症臭いな 他の板やスレならわからんでもないが歌詞書く人のスレで造語症気にしてどーする
ボカロなんて造語だらけなんだからイチイチ気にしてたら精神持たんだろ >>592
出力結果を残すとどうなるんですか?
>>594
ありがとうございます
そうなんですか、WorldもNSFもどっちもいいんですね
とりあえずしばらくWorldを使ってみます >>600
Dos窓からコマンド実行しているなら不要だが、エクスプローラー等から実行した場合、終了時に窓が閉じられる。ログが親切に出ないアプリに関しては一般的に使われる musescoreでAh~とかyeah~とかってどうやって入力してる? 東北ずん子のNEUTRINO制作、クラウドファンディング目標達成で、決定しました。 @21日も残ってるじゃない
さすがにボイチェビ勢連続クラファン(琴葉、ついな、京町、ずん子)で勢い落ちてたけど。それでもジリジリと安定して早いな。
まぁコレ終わっても今度はONE IA関連のクラファンスタートするという。 NEUTRINOは遊びで使うツールとしては現状最強で間違いないな CevioもSynthVもAI版出してきたけど、なんかボカロ臭が残ってるんだよな
Neutrinoが現状一番生歌っぽい 個人ごとにボカロ臭いと思うポイント違うだろうけど
俺はボカロ特有の鼻声とビブラートのかかりかたを聴くとボカロ臭いと思うし
NEUTRINOはそのへん優秀だと思う CeVIOゆかりさんはボカロに寄せてるからしゃーない
ボカロに近いAIシンガーだとロックに強くなるし
AIきりたんは偏在するから曲によって使い分けられる
フォルマントシフト(声質)の変更はNEUTRINOの方が自然な気がする
CeVIOきりたん声質-50だと結構ケロケロだったし てかCeVIO_AIでも無声化バグ出ててワロス
初期のNEUTRINOよりは発生数が稀みたいだけど機械学習音源の宿命なんかね 久々にニュートリノで遊んだなう
dominoでマウスポチポチしながら基本耳コピ。BPMは原曲と同時再生で手探り→musescoreで歌詞入れ→ニュートリノで出力→VocalShifterで調声→Audacityでエフェクト付け。曲と合わせる
音楽の知識が義務教育で止まってるから、歌詞入れまでがいつも面倒くさい(特に最新の曲はカンニング出来ない)。楽な方法があったら教えてほしいです
ちなみに音の加工は楽しい バージョン上がる毎にもう調声いらないんじゃね?って思うわ
まあ曲にもよるし、調声した方が楽しいけど さすがに、まだ調声無しはきついかな。
ユーザーの調声情報をディープラーニングで学習させる事ができたらいいのにね。 多少のやんちゃは個性の内っていうスタンス
さすがに子音強すぎとかロングトーン最後のピッチ上ずりとかはDAWに取り込んだ
後でDAW側で修正するけど 連投すまん
>>617
DOW側で修正ってMelodyne?
自分ボカロエディタの調整は全く国ならないだけど
Melodyneで修正めちゃくちゃきついくない? >>619
Logicでやってる
子音の強すぎるところを下げるとかは普通にオートメーション、ピッチの調整は
LogicのFlexツール。実ボーカルを編集するのと同じイメージでやってるけど、
おそらくMelodyneもだけどそんなにしんどくはないと思うけどな。 Melodyneの編集作業は癖が強くてやりにくいのはそうなんだけど、
一番仕上がりが良いのはMelodyneなんだよな
換えが効かない MelodyneはEDMでよくあるゴッドボイスとかケロケロとかチョップとかやって遊ぶのにしか使ってない
やろうと思えばボカロのカクカクした部分を滑らかにしたりできるのはわかるがAIより上手くできる気がしない >>620
あたしかに ここニュートリノだから撮り後の修正みたいにするしかないのか
ニュートリノもピアプロみたいにvstauでできるようになったらなぁー(願望) cubaseで歌詞入力してVariAudioで修正 スローでロングトーンの曲だと暴れるな
あとスイングしてるとノレてない きりたんはストレートなロック以外は調整必要だなって思う
というかきりたん以外はあんまりデキが良くない気がする
初登場時のあれは神憑り的に上手くいっただけなのかもしれない イタコもきりたんと同程度に良いと思うけどな
めろうはもうちょっと成長待ち(まだα版だし)
他2つはまぁ・・・ 瑶子に関してはSinsy謡子(DNN版)の方がじゃじゃ馬じゃないらしい。 >>626
きりたんの声が合成音声との相性が良いのかもしれない。
ボイロもCevioも割と評判いいし たぶんずん子はめろうに近い感じになるんだろうな
ロングトーンに強い声になってくれると嬉しい 知名度はさすがのトップバッターきりたん
イタコさん声は好きだけど二重母音の繋がりがまだぎこちない
めろうさんは貴重なオリジナル音源でキャラ依存低めを好む層の拠り所
謡子さんはオペラ・ミュージカル・クラシカルクロスオーバー向けか きりたんDBって明大の教授がきっかけだけど
コイントスで表出てなかったら博士課程進んでないので教授にになっておらず
教授になってもTwitterのつぶやきをずん子が見逃してたらきりたんDB作られず
AIきりたんも生まれなかったんやな。 それこんな所でいまさら蘊蓄するまでもなく
本人がTwitterで前から言ってるし
関連本家スレにたまーに本人書き込みあるじゃん
AI方式(機械学習)とVOice CODER方式(人間が解析的に設計する従来方式)は対立する概念ではなく、相補的に機能し発展する手法である事、
特に「人間の」音楽表現には必須である楽器としての歌声の制御は、前者(機械学習)の観点だけでは不充分で後者(人間による設計と制御)の発展形として今後拡充する必要がある
といった議論は関連本家スレで行われ、
新しい研究プロジェクトとして立ち上げたそうだ。 もしかして自分へのレスなんだろうか?
たんにAIきりたんが生まれない世界線も3分の2くらいはあったんやろなー的なカキコやったんやが aiの要である機械学習を自分でリファレンス曲でまさに調教させたい なにしろ東北家公式の貪欲な活動はハンパじゃない
創作界隈にとっては良い環境だわな 東北系は震災便乗商法的なのと関わってた榊が胡散臭いので使わないことにしてる プロジェクトの行方はともかく、ずん子のAI歌声の出来が良くなることを願っとるよ いい感じに抑揚つけてくれるけどこれは何を元にしてくれてるの?
音の上下?歌詞のパターン?
色々実験してみるか >>651
諸々のパラメータを元に機械学習で重みづけを決定しているので
ちょっとした実験で傾向をつかめるほどわかりやすくはないよ。 v0.422使ってみたけど、きりたんのブレスがおかしなことになっちゃってるな 男性ボーカルは来月中旬に延期決定だそうだ
3月に急遽収録が入ったかららしいがずん子クラファンのやつかなー? 知る限りはずん子だけでしょうねえ
クラファン側からゴリ押ししたのかなあ・・・ 男声はどうでもいいけど、
・めろうの改善
・ブレスのバグの改善
お願いしたいのはこの2点かな 東北勢以外にも年内収録埋まってるけど、どんなのか気になるぞ AIシンガーはどのソフトでも結構スケージュール逼迫してるっぽい
ずん子クラファンとNEUTRINOの年内スケジュール発表ほぼ同時だったしクラファン成功する前にもしかすると収録枠だけは抑えていたのでは?
ついなちゃんもSynthV AI収録は今しかチャンス無いとか言って駆け込みクラファンしてた 肝心のヤマハがボカロAIを製品化する気なさそうなのがなんとも寂しい
せっかくひばりでノウハウ得られただろうにな NEUTRINOのGUIは秋頃公開予定だそうな
>>手法的な面でも機械学習ベースの手法オンリーで構成するのでは無く、信号処理・経験則的なヒューリスティックな手法も取り入れていけたらと思っています
信号処理・経験則的なヒューリスティックってなんじゃらほい ver0.430で「ブレス音のノイズを緩和した」って書いてあるけど、直ってない・・・
めろうは何となく良くなった >>664
SynthV的なものが出来るんじゃないのかね guiは要らんな
バッチのが自分で好きなようにできて便利だが めろうとなんたらの息多めライブラリはNSFと相性悪いのでWORLD推奨らしい
普段はGPU対応のNSFでテストして仕上げはWORLDって感じか AIシンガーテックってので男性シンガーチラ見せするらしい
塩沢兼人みたいな声だったら良いんだが 日本初の一般向け男性AIシンガーはNEUTRINOが持っていきそう 男の声聞き続けて調整すんの拷問なんだろうな・・・
と、思ったがソースのボイスがないだけか? 可愛い可愛い男の子を良い聲で鳴かせるおしごと
めっちゃ需要あるやん これまでの流れでいくとKAITO系の声質だと思うけどね 夏目悠李も玄武も何故かKAITOっぽく
ガクぽは知らん
めろうの男性化のアカペラは中々良かった 成果物が似ていてもエンジンは全然違うというのは面白いのでどんどんやってほしい そろそろ中旬ですけど男性ボーカル出るんですかね?
無個性のように見えて個性強いのであまり使われそうなイメージですが。 リリースされたら取り敢えず男性ボーカル曲を歌わせたい。 ブレスの不具合、ver0.430で直ってなかったの作者さんも認識してたみたいで
4/23に直すって言ってくれてる。よかったよかった 基本的なことですまんがブレスは音符と音符の間に入れないと機能しない?
要は休符と音符の間に入れても意味ないのかなーと。 >>689
自分MuseScoreでやってるけど、ブレス記号は休符に付けても機能せず、音符に
付けても直後が休符だと機能しないみたい
面白いのは、付けた音符の長さでブレスの長さも変わるところ。全音符に付けると
一拍分くらいの長さのブレスになるので、実質付点2分音符+4分休符て感じにできる 吐いた分吸うわけだから、そこも学習しているのかも。 >>690
なるほど、有益な情報をありがとう。
ブレスがついたりつかなかったりするからそこを意識してみるよ。 但し現時点では一拍分くらいの(長い)ブレスは妙にノイジーになってしまうっぽいので
その辺を改善してもらえたらなぁと思ってる ネーミング(No.7)もキャラデザもNEUTRINO向けらしいけど
きりたん・イタコ・謡子・JSUT・めろう・ナクモに続く7番目って意味なのかな?
だとするとずん子はその後に公開か(6〜7月予定らしい)
てかここ最近のアクティビティが凄いなー 歌唱DB用の著作権フリー楽曲が無いなら全曲作ればいいじゃないとか誰もが思いつくけど手間暇技術不足で出来ない事を仕事の片手間にやってしまうヤベー声優がいるらしい 人気声優なのかどうかよく分からんけどマルチタレントという意味では業界でもかなりの兵 一番面倒なのは発声のタイムコード付けだろうけど
それがテンプレ化するとか起業して有償で引き受けるとか
とにかく個人がちょっと頑張れば製品化できるまでやって欲しい 有償引受は今まさにやってるんじゃないの
個人でも金持ちなら依頼できるレベルの金額だろ あくまで学習用で観賞用ではない前提であれば完パケ・フルコーラスである必要がないとはいえ
本業の片手間でやっちゃうなんて頭が下がるわ
歌詞に関しては音素の穴を埋めるために特殊な単語とかも使ってそうだけど
ボカロの「呪文」ほどじゃないにしろ電波ソングやナンセンス歌詞のようなカオス状態になってそう VTuberが少額クラファンで次々とDB作る未来を夢想した(´・ω・`) もう一部のAIプログラマーがAI自動ラベリングを試行錯誤しててラベリング作業そのものがちょっとした手直し程度で良くなるかも
歌声DBの規格決まってるなら最適化で更に精度上がりそうだけど AIプログラマー呼ばわりワロタ
こいつミュージシャンを楽隊屋、聴衆を聴かせて乞食、購入者を購入厨とか呼ぶ構って乞食だな ラベリングは基本手作業、AIで自動化という話はどっから出てきたのかな、ソースがあるのか想像話なのか 初っ端からAIナクモ、AIシンガーナクモ、ナクモ(NEUTRINO)でタグ分散しててわろす NEUTRINOを注記しておかないと後で別エンジンで出てくるかもしれないからなあ >>708
その判断はピンポイントでは的確だと思うけど
この板は妄想デマを流す異常者が張り付いているから
ソースを添えて話をする習慣がないのは頂けないね 最近の動向を知らないだけでしょ
ソース求める前にもっとアンテナ広げた方がいいよ ソース出せないキチガイジおばさんの方か
この人英文がまともに読めないから
ソースを出したなら知ってて当然の話を知らなかったり
ソースに書かれていない話をソースがあると言い張ったり
毎回トラブルを起こして他の研究者から失笑されるからソースを出せなくなったんだよな 論文がないとソースじゃないとか言い出した人までいるからね
技術的なことはあえて触れない方がスレのためだよ 普通の人はソースを出せと言われたら、ソースを出す
言い訳して出さないのはソースを出せない印だと
皆は理解する
他人を罵倒しておけばソースを出せない事を誤魔化せると思い込んで54年間生きている惨めな生き物だ ・専攻分野の学位論文未提出
・英語論文の紹介や引用に毎度深刻な誤訳や超解釈があり、まともに読みこなせていない
・匿名掲示板に入り浸り自演連投でスレを埋め立て、他の人からツッコミを受けると宇宙の法則が狂ったかのように罵倒と罵詈雑言をする
どう見てもただの発達障害 ぐちゃぐちゃ言う前に目の前の板か箱叩いて検索してみたら
もうNGにしておくよ >>693
ver0.431で、一拍分くらいのブレスも違和感がないくらいまで改善してもらえてる。
まだ少しおかしくなることがあるけど なんか自動ラベリングで荒れてるな
投稿されてる動画見た感じ現状は半自動ラベリングな上に最後は手動だったな
出来としてはNEUTRINO比較で70〜90%位な出来だった
てかNEUTRINOというAIシンガーの出来の基準があると比較が楽だな NSFよりもWORLDの完成度が上がってきてるというのはちょっと意外だな
採用する学習本の声質次第ではNSFが神がかったりするんだろうか ナクモやべえわw
はよGUI実装して5000円以下で販売して
開発途上という欠陥品を高い値段でドヤ顔して売ってる勢を駆逐してほしい 合う曲はドハマリする合わない曲はとことん合わない安定のNEUTRINO ボカロでも同じでは
得意ジャンルや適合する音域を無視されて作られているボカロ楽曲の多いこと多いこと まあ作り手への批判はやめとこうか
得意な音域やテンポがあるという点はAIになってもまったく変わらんな ボカロはどんな曲でもケロケロじゃん
ボカロ耳直した方がいいぞ NEUTRINOから始めたからボカロはよくわからんのだけど
どっかの記事でボカロはMIDI楽器、NEUTRINOは歌声合成ソフト、っての見て
ボカロは得意な音域とかは特にないもんなんだと思ってたけどそうでもないのかな ボカロでもMachaやLily V3や優月ゆかりはそんなにケロケロ感ないような調整ができるけどな。妙に高音を歌わせるような使い方でなければ。
上記のボイスがボカロの中では比較的まともなのであって、ボカロ特有の違和感が出てしまう音源が多いのも事実。
あと、ミックスで大胆にEQでカットしていくこと。単体で聞くと目も当てられないような状態にして、ギターやベースに上手く乗せると、曲全体として違和感がなくなる。
他の楽器の音が少ない、ソロとか静かなパートではその手は使えない。リバー部とか強めてオケとなじませて使うぐらいか。 V5のkenとUTAUの最新音源のなんちゃら連続音?は割といい線行ってたけど
きりたんピッチを手動で移植したAI初音ミクはかなり自然だったし
ボカロがAIピッチ生成機能もてば割と解決しそうな ボカロは「新しい楽器」だと言い張って人の声と比較するのを否定する奴らもいるんだけど、
実際問題としてどうしてもボカロでなければならないボカロを前提とした歌ってほとんど無いんよね。
ボカロソングのほとんどはやっぱ人が歌ったほうが良い感じになる。
ボカロソングの隆盛が始まってそこそこの時間がたった今でも。
十分に上手い歌い手を確保できないときでも最低限度として歌として成立させられる、
つまりはアマチュアを底上げする道具がボカロなんだと思う。
そういうボカロはアマチュアの道具だという前提に立てば
「上手く調整すれば上手く歌ってくれる」ってのはそれほど役に立たなくて、
「いいかげんな指定でもほどほどには歌ってくれる」のほうがありがたいと思うし、
そう思ってたところに現れた NEUTRINO は素晴らしい道具に感じる。
(念のために断っておくが、こういう前提に立つならという仮定なのでそうでない背景を否定するものではない。) いかにもボカロ曲だとケロケロ大丈夫だけど普通の曲でケロケロだと聞いてて萎える というか、身近に女性ボーカルを担当できる人材がいなかったから、ボカロを使っている人が多いと思う
有名ボカロ曲の作者には、ボカロがきっかけで女性ボーカルと組めるようになった人も少なくないよね
もう1つは、仮歌としてボカロを使う
あとは、カラオケを用意しておけば、気に入れば歌ってくれる人たちが現れる
JASRACからがんじがらめに管理されていない、誰もが歌えるフリーの曲が爆発的に増えたという点も、
ボカロ流行の大きな成果だったと思う 今は主要な動画投稿サイトが JASRAC と包括契約しちゃったから逆に JASRAC 管理曲以外のほうが使いにくいんだよな。
管理されていなくても権利は存在するので、管理されていないということがマイナスに働く。 てか、単純にきりたんは声がブスなので使う気がしない&聞く気がしない 声がブスとは自分にはなかった価値観だ
どうブスなのか聞いてみたい ブスな声というと、魔法使いサリーのよっちゃんの声が頭に浮かぶ
【公式】 魔法使いサリー (第1期) 第1話
https://www.youtube.com/watch?v=riTgc9VUuOg&t=217s なくも動画、スタートダッシュは鈍いけど地味に増えてるな これがフリーってのは凄いな
ひも付きじゃなく自由に使える音源がもっと増えて欲しいけど 商業にも条件付きで採用できそうなラインを残したのが強いな
というか他の強豪が弱すぎた 自然さではNEUTRINOがぶっちぎり優勝だけど、細かいとこいじるのに非公式ツール必須で、
それでも出力結果は運任せなとこがあるから、ここらへんが改善されたら他ソフトは壊滅するな とはいえNEUTRINOの原理上そのへんは改善が困難なのでは? と思ってしまう
理解が浅いだけなら嬉しいが 調声支援ツールでピッチはいじれるけど、ダイナミクスはいじる前と変わらんから変な感じになるのとりあえず改善してほしい
音がちっさくなってるとこを拡大してマウスでポチポチして平らにしてみても元の音量が低いから音質おかしくなってしまう
あとフォルマントシフトのNSF対応と1音ずつフォルマントシフト変えれるようにして、あとかすれ声とか叫び系の声も指定して出せるようになってほしい 学習パターンを何種類か作りこめば歌い方を選べるようには出来るのかも知れないね
ただ細かいとこまで利用者がコントロールすることやはり原理的に出来ないんじゃないかな 細かいピッチやダイナミクスはDAWに取り込んでからいじるから(調声支援ツールは
使ってない)別に今のままでいいかな・・・ DTMの初心者質問スレに間違って書いてしまったのですがこちらで質問させていただきます
曲に歌を付けるためにニュートリノを使っているんですが
スコアを変換して出力する際の出力後のファイル名(wav)は
Runの設定を毎回かえないといけないのでしょうか? >>752
何がしたいの? 出力されたwavファイル名を自分の手で毎回変えるのと手間は同じだよね? 入力ファイル名をrun.batにセットしたら、出力もそのファイル名でされるのでは
batファイル魔改造して出力ファイル名を変える事もできるだろうけど、やり方はわからん >>752
引数で渡すようにするとかも出来るけど、それはバッチファイルの書き方を調べてね。 ん?上書きされないように自動リネームされるオプションなかったっけか ありがとうございます
バッチ側で名前変えるようにしてみます >>756は勘違いだったので忘れてください
batや他のスクリプト使って出来ることしかできないよね 上書き回避する古典的な手法としては出力ファイル名に年月日時秒を付与するってのがあったのでRun.batに追記すればできるね。
BASENAMEは引数として渡すのとRun.batを直接編集するのとどっちが早いのかしら。 set BASENAME=%~n1
に書き換えて、musicxmlファイルをRun.bat(またはそのショートカット)に
ドラッグすればいちいちファイル名書き換えなくてもいけるかも
誰か試してみれ
出力ファイル名は元々末尾に_synや_nsfが付加されたwavファイル名になるけど
そこも気に入らなければbatファイル書き換えれば何とかなると思う
今の仕組みではピッチやかすれ具合以外をコントロールできるような設計になってないよね
modelにバリエーション付けて、途中で切り替えたりはできるかもしれんけど
他の市販ソフトみたいにカーブ書いて可変するようなのは仕組みから変えないと難しいと思う
そもそもガチ調声から解放されて楽譜渡せば歌ってくれるのがコンセプトっぽいから
ガッツリいじりたければ他を当たったほうがいいのかも あーそうか、入力ファイル名を利用すりゃいいんだね賢い この長文のくどさと内容の簡単さのアンバランスさにニヤニヤした
バッチファイルの書き方自慢って20年前でも絶滅危惧種 NEUTRINOだからこその懐かしいテク披露ではあるね
逆に言うとこういうちょっとした工夫のしどころがあるということで 女性ボーカルってフォルマントシフトで男性化するけどイントネーションが女性なのでオカマになるんやな
男性音源のナクモ出たしオフラインで使ってるユーザーは声質差し替えで完璧なTS化できるのでは? お、AIずん子のリリース日決定か
息成分多めの音源ってじゃじゃ馬なイメージだが大丈夫か? 昨日初めて使ってみた。
Synth V のSaki aiのデータをmidiで出力してMusescoreでmxlにしてMellowに歌わせた。
途中にへ音記号が混入してたのに気付かずエラーが出て苦労した。
100点ではないが素直な声がいい。フォルマントを少し下げるとアニヲタと距離を置くお姉さんな声になっていいね
時々ドキっとするくらい色気
感じたわ ハイブリッドだからそれで設計意図どおりなんだろうけどね 7月5日からのずん子解禁が楽しみだのう
それまでにどれだけ先行者が使い込めるかによるところはあるが メロウのアプデは今月25日か
音程の安定性か
よかよか NEUTRINO AIずん子音源開発リザルト
2021/03/08 収録開始
2021/04/16 収録完了、音源制作開始
2021/06/21 CF支援者先行リリース
収録 40日
制作 66日
AIシンガートータル開発期間106日(概ね3ヶ月半)
(この間他音源のバグ取り最適化等実施)
うーん、歌声合成って割とすぐ作れるんやなぁ? 資金調達開始しからリリースまで6ヶ月
資金調達完了してからリリースまで4ヶ月
すっごいスピーディーやな・・・ ワークフローが完成してるからなのかねえ? スタッフたくさん雇ってるとか? リリースまでくそはやいな
確かにきりたんでワークフローつくったてのはあるかもしれないね ディープラーニングは学習のためのデータセット作りと環境作りが面倒くさいところあるから、それが終わってるとかなり楽なはず。今回は最も手間がかかる部分であろうデータセットのラベル付けがほぼ終わってると思うから、手間なのは音源の調整くらいなんじゃなかろうか
ところでロングトーンってどうやったら崩壊させずにすみますか?できればタイムストレッチは避けたいのですが ・肺活量足りてないか注意する
・sigさんのNEUTRINOエディターで修正
・スタイルシフトオプションの値を設定してみる
(キー変更+ピッチ変更ガチャを公式が機能として実装したオプション)
・キー変更+ピッチ変更ガチャ 何曲かやって気づいたけど肺活量みたいなの設定されてるよな >>783-784
処理のパラメータとして意図的に設定しなかったとしても
機械学習の技術が基礎にあるんだから
学習の結果として息を吸える場所が効いてくるのは普通にあることでしょ。
公式ページには「学習データの関係上、ブレス記号は特に効果があります」とは書いてあるし、
ユーザーの感覚では (人間の歌い手に対してそうであるように) 肺活量に
配慮する必要があると思って使うしかないと思う。 人間が不可能なロングトーンは自分で加工して作るしかないね 推論時にブレスからブレス(休符でも可)までをフレーズとして同時に使うとのことだから、肺活量というより学習データにないロングトーンに対応する音声パラメータの推論に失敗してると思ってる
やりたいのはテンポ60の4/4で数小節のロングトーンなんだけど、後から無理やりするにしろなにか上手く誤魔化す方法がテクニックとしてあればと思ったのだが
調整するにしてもf0もmgcもどっちも崩壊してしまうから困る 一応裏の処理ではきりたんよりタコ姉のほうが肺活量あるらしい
試し方ははブレスなしで歌わせる(鬼畜) 関ジャム見たけど本間照光がこっそりAIきりたんのボカロPで仕事では実際に仮歌提出で使ってるっぽい
クリプトン中の人がきりたん仮歌で使ってる人居たとかちらっと言ってたけど実際に現場でも使われてるんだねぇ オワタPとかピアノロールが苦手で楽譜派とかも居るらしいし
年配だとボカロのオペレーションが苦手で逆にMuseScoreが直感的な場合も ピアノロールだと横方向にばっかり伸びるのと、他の楽器の兼ね合いとかを確認しにくいからね
だから私は調声もある程度出来るようにpythonで書いてる
musescoreの譜表テキストを使ってビブラートかけたり、pとかfとかのダイナミクスをmgc[:,0]に適応したりの簡単なものだけど
これやってから有志GUI使うほうが効率がいい のろまったからGYAOで見直したけど、あれだとNEUTRINOかCeVIO AIかわからんな
ていうか歌声の一つでも聞かせるかと思ったら喋り(ボイロ?)だけだったし
(まぁ主役がボカロPだから面目潰しちゃ…ってのはあっただろうけど)
本間さんくらいの人だと楽譜ポンで仮歌のほうが肌に合ってそう ExVoice(生声)のきりたん自己紹介使ってるけど
ボカロの特集なのにAIシンガーの出力を出してしまうと放送の軸がブレるしねー
「AIきりたん」だけでも話題として放送に載せられるギリギリのラインでは?
おかげできりたんの声人間みたいってツイートが散見 AIきりたんの動画伸びない傾向にあるけど本間探しという妙なバフつくようになるのかw もともと東北家は歌う方面のキャラクターじゃないからなー ツールとしてはDAW上で使えるのが理想なんだろうけど
そうなると無料ってのは無理そうか >>798
musicxmlで書き出せるなら実質どんなソフトでも対応してると言える
ただ、再生するには特徴量推定をしてからVocoder合成が必要な都合上、DAWとしての魅力が活かせない
AIシンガー自体がDTMの畑と異なってて、それこそUTAUなどがその畑なのだと思う VSTとしてはCeVIO AI Proが実現すると言ってるから、それのお手並み拝見となる。 DAWだと一応有志がREAPER上で完結できるようなの作ってたね
Reaper NEUTRINOでググると出てくる ロングトーンって一小節がギリギリってくらい? それを超えたら破綻するよね。
譜面通りの長さの声が出なくて途中で途切れてもいいから破綻はしないようにして欲しいよな。 メロウは今回のアップデートで気になってたところが改善されてる印象
声を書き出しただけなので完パケのボーカル差し替えてどうなるか なんかやるみたいね
https://zunko.jp/event/tv_contest/
「CeVIO、ボカロ、UTAU、歌ボ「など」をご利用ください」
なのでNEUTRINOもOK? >>802
>>787のものだけど、詳しく見るとf0に関してはブレ出すのが問題で、mgcは消滅しちゃうのが問題だった
一応引き伸ばして線形補間してやるだけで、ほぼ違和感なくロングトーンさせられたから、しきい値みたいなのを決めて、それを超えると補間を使うって風にするといい感じだよ 公式ページに言及がないっぽいけどフェルマータは無視されるってことでいい?
テンポの調整で代用するのが一般的なのかな。 まあDTMにおいてテンポはユーザが厳密に指定するのが普通だしね… と思ったら musescore で musicxml 形式にエクスポートした段階で
フェルマータの長さ情報が脱落して 1.0 になってたわ。
musicxml はフェルマータの長さデータを持たないみたいやね。
データフォーマットが情報を持たない以上は機能もしないのは当然か。 ずん子解禁になったんでいくつか聴いてるけど、なんか悪い意味でボカロっぽくない? ずん子は結構ストレートに歌うな
よく言うと加工しやすそう
悪く言うとボカロっぽい
他のキャラにMGC(声質)ファイル差し替えしてアイボスのクロスシンセシスみたいな事したらきれいにハマりそう
イタコさんにずん子を憑依させたい >>814
それこそイタコ(口寄せとかする巫女)だな ナクモMGCを憑依させて昭和アイドルっぽく歌うカマっぽいナクモとかも出来るっぽいね
解説記事見ただけでまだやったこと無いけど Twitter見ても絶賛しかされてないけどずん子の出来最悪すぎない……?
ボカロっぽいというか電子音みたいな出音
収録失敗したか? 歌声合成としては悪いとは言わない
じゃあその声はまさしくずん子なのかと聞かれると答に窮する まぁボイロと同じできりたんばっか使われそうな気がする これは俺の直感的な理解なので無視してもらっていいが
やっぱ低音寄りの成分をたくさん持ってる歌い手さんの声色では再現度が下がるんじゃないかと思う きりたんの完成度もそうだけど初見の衝撃が凄すぎた。
それを超えられない。 https://www.youtube.com/watch?v=48_vuMlqnzI
NEUTRINOを使いこなしてるわけではないけど、動画コンテンツとしては今まで見た中で
ピカイチだわ ニコニコはAIずん子かAIシンガーずん子か統一してほしいなぁ ずん子がボカロもどきになっちゃってたんで、明日のNo.7に期待だな
でもなんであんな風になったんだろ、きりたん/イタコと作り方が違うのかな >>827
トークのデータは声優のトークから、歌声のデータは声優の歌声から学習してる。
歌うときにキャラ作りを維持できない声優もいて、
東北ずん子の声優である佐藤聡美はそのタイプなんじゃないかな。
佐藤聡美の歌を聞いたら NEUTRINO の東北ずん子と納得できるわ。 >>828
いや、ずん子の問題はそこじゃない……演技の話するとそもそもきりたんがVOICELOIDとNEUTRINOかけ離れてるから…… かと言って椎名心実でもないんだよなNEUTRINOずん子 東北家は例の秋田弁でもないのに言ってる意味が分からないアニメがあったからな
しかたない セブンちゃん出たらナクモを憑依させてカマナクモにして遊ぶんだ ナクモって女性キーで歌わせると苦しい感じになり恐怖だなw また酔って息切れしているようにもなりオモシロイ AIシンガーもなかなか難しいな
声帯や喉、口の形状までシミュレートするような物になったらゴールになるか そいやCeVIOトークの口パクデータを使用してNEUTRINO喋らせてた動画あったけど普通に喋ってたな
ボカロの無理に喋らせた感じがほぼ無かった SEVENめっちゃ面白いなw
Dual Alter World的な歌い方を学習させたんかな?
バラード系には無力w SEVENちゃんのオリジナル曲聞いたら普通に生歌の歌謡曲でワロス
これ普通の人が聞いても歌声合成って分からんやつや ニコニコにGodKnows上がってるけど無茶苦茶ハマってるなSeven Sevenいいね
もう少し声のエッジを丸くできると俺的には嬉しい 名前がウルトラマンみたいなのに実力はあるから恐ろしい子だ >>841と>>825はNEUTRINOの作者さんもリツイートしてるな 合唱するような作品だと個別の癖は目立たないし、数が出そろうのは歓迎。 これA#3から下の音が変換されないんだけど仕様ですか?
ナクモの音域がほとんど変換されず飛び飛びになる。
解決方法知ってる方いますか? youtubeのNEUTRINOに喋らせてる動画は
NEUTRINOってlabファイルを元にしてAIが歌ってくれるから
CeVIOトークのlabファイル渡せばNEUTRINOで喋ってくれるって感じかな?
まぁ所々触る必要あるかもだけど? CeVIO AIトークもlabファイル吐いてくれるのかい? アウトプトのmgc使って別のシンガーに憑依させるのって具体的にどういう手順でやるんですか 自己解決
憑依させたい歌手で出力させたmgcをもとのmgcと入れ替え支援ツールでmgc読み込んでWORLD実行で出来るね みなさんGUIとかなに使ってますか?
sigさんのやつずっと更新無いみたいですが… 最終調整はsigさん
年末くらいまでには公式エディターが出ると信じてる(願望) おれはCeVIO CS7
なんというかCeVIOに高性能音源がいっぱいできた感じがして嬉しい Twitter見てるとCeVIO CS7でMUSIC XML作ってsigさん調整支援ツールに投げると楽というのを知らずに
MuseScoreで苦戦してる人が結構いるけどNEUTRINO解説動画はほとんどMuseScoreでCeVIOつかう解説動画はめったに無い
下手すると無いかも NEUTRINOはCeVIO CS7の拡張音源って聞くとメガドライブのSUPER32Xを思い出す
メガドラタワー >>858
広い目で見たらCeVIOとNeutrinoの両方を使うユーザーがめったにいないってことになるかも >>858
CeVIO:ピアノロール入力、MuseScore:音符入力ってことで、自分なんかはピアノロール
より音符入力の方が早いし得意なんだけど、それ以外にCeVIO使うメリットって何か
ありますか? ひと手間かかるがSynth vでメロと歌詞入力してmidi吐かせてMusescoreに食わせてmxl吐かせば無料で出来る 横からだけど、MuseScoreでメロと歌詞入力してmxl吐かせればいいのでは? >>865
アホの子だけど、何でSynthesizerVを挟んでんの? MIDIキーボードから打ち込みできるぶん、MuseScoreの方が効率が良いという人もいると思う。
あと、いちど楽譜にした方が、全体を俯瞰できおかしな部分も見つけやすいという人もいるよね。 楽譜とピアノロールで好きなほうでやれば良いんだけど
解説動画では楽譜でしか解説してないので
ピアノロールから始めた人は意外と苦戦してるって話やな
SynthVだとMUSIC XML直に出力出来ないので間にワンクッション挟みましょうって感じ sigさんのは逆にmidiを直に読み込めたし、musicxml書き出しもできたような? 調整ツールでアポストロフィーつければ母音だけに出来るはずなんだが、上手くいかないんだけど解決法わかる人いますか?
ゆ'→y にしたいのにyuになってしまう
バージョンは最新の1.5.1です 特殊記号
「’」は母音脱落になります。
サンプル5小節目の「すこし’」のように、母音は発声せずに子音のみの発音になります。英語歌詞の部分や速めの歌唱の際に使うと効果的です。
※子音のみでの入力はできません。必ず「母音+子音」「子音+子音+母音」など母音を一つ含む形にしてください。
https://n3utrino.work/332/ 解説サイトのやつコピペで使ってもダメだったからツール的な不具合だと思ってたけど、なんか普通に間違えてる可能性高そう…。
触れる環境に戻れたら試してみます、ありがとうございます! 既存の楽譜を入力するなら楽譜通りに入力したいし、
作曲するなら伴奏とセットで考えたいので
ピアノロール方式ってそんなに良いとは思わんな。
ピッチの微調整には便利なことはあると思うけど。 別にメロの入力は好きなDAWで作成→歌詞入力だけMuseScoreでmxl出力→調整支援ツール
なのでピアノロールとか譜面ビューとか何を言ってるのという感じ 母音脱落は母音をセットにしないと脱落させてくれないというのがミソ 871だができたわ。ありがとう。
ただこれって>>877さんの言う通り「と’」だけだと「t」にはならないんよね?
同じ音が続く時は「きっと’」とかすればいいんだろうけど、「き」と「と」が別の音で続く時はどうしようもないって感じですかね?
後からピッチで無理矢理下げちゃうしかないのかな? 「と」で入力しておいて、調声支援ツールで「t」「o」になってる「o」を
その次の音と重ねてしまうと、ほぼ「o」が聞こえなくなる(聞こえなくなるとは言ってない) カバー用のmidisynthVやutauから書き出した物とmuse scoreの相性が悪くて(何故か声部が別れた楽譜になる
フリー版studio oneに手出してみたけど上手くいくだろうか MIDIを読み込んで.bat内で歌詞書いてエクスポートしたい
xmlエディター使いたくないという我儘 音の大小ではない声の強弱が調整出来るといいのにな
ウイスパーからシャウトみたいな YouTubeは事前にある程度視聴者付いた投稿者じゃないと検索にもヒットしないからなぁ
まず見てもらうという土俵にすら上がれない
日付順で決め打ちすれば出てくるけど つべに投稿始めた頃、いくら検索しても自分が投稿した動画がヒットせずに凹んだのを
思い出したわ ニコニコの場合は掘ってくれる人がいて出来が良ければ広告してくれるしね
まぁニコニコ衰退してるから無名で良曲だと1000行ければ良い感じ
小中高生に人気なのはtiktokだけど触ったこと無いので分からん
ニコニコ以上に見る人居るみたいだけど 海外にも刺さる音楽作ってる自負があるならつべでいいと思うよ つべはタグや自己紹介コメントなどの有無にもよる感じなので、こちらから視聴者にアピールが必要なんじゃないかな。
自分は制作ではないけど、アジア系ポップスを集めたプレイリストを作成して各国の言葉や名称のタグ・コメントを入れて公開していたら、プレイリスト経由で再生してくれる視聴者が増えたな。で検索でも自分のチャンネルが出てきたり、まとめサイトみたいなところにリストアップされたりもしたな。今は面倒くさくなってやめたけど 利便性で言ったら YouTube とニコ動は全くレベルが違うんよね。
YouTube に慣れたらわざわざニコ動を使う気が全くしない。
ただ投稿者の平均的な気質はニコ動のほうが「コンテンツを作る」ということに強い意欲を持ってるという印象はある。
ネット上で交流するにあたってツイッタを選ぶか YouTube を選ぶかといったレベルの気安さで
誰もが動画を投稿できる世界になったのはきっと良いことなんだろうけど、
自分が作っているのが人に見せるコンテンツなのだという意識はニコ動の投稿者のほうが (平均的) には上
なんじゃないかな。 ・ニコニコ、YouTube、tiktok等複数のサイトで投稿
・初音ミクやカフ等の人気や話題になりやすいコンテンツで地道に視聴者を増やす
・海外の人にも分かりやすい説明文を添えておく
・海外の人にもわかりやすいアジア系ポップスやアニソン&ボカロプレイリストで客を呼ぶ
超テキトーだけど上レスの参考にしたらこんな感じ?
NEUTRINOはただでさえアタリショックなのにりんごろうで更に悪化した気が NEUTRINOはアタリショックとは言えんでしょ
そもそもショックで暴落するほどのヒット曲が出せてないんだから
むしろりんごろうあれなかったらもっと悲惨よ
開発にやる気あるからそういう風に見えんあたり開発のやる気は大事なんだなと感じるけども 音楽について詳しくないから作曲とかできんし、
学生時代の音楽の教科書とかひっぱり出して NEUTRINO に歌わせてるわ。
YouTube に投稿してるけどほとんどは 100 に届かないくらいの再生数だな。
人気曲にりんごろうネタの歌詞を付けただけの雑な替え歌は数百くらいにはなってるから
コンテンツへの入口というか動線があるかどうかってのはかなりデカい要素なんだと思う。 ボカロほど固定のファンが居ないからNeutrinoでオリジナル曲だしても見る人が少ないんだろうな…。
ボカロよりリアルで、歌う必要がない(歌のスキルに依存しない)けど、人間の声にかなり近いってのがNeutrinoの強みだと思うんだけど、結局つくり手のメリットであって聞く側のメリットでは基本無いんだよね。(キャラや声当ててる人が好きな人は除く)
Neutrinoで高品質なオリジナル曲が増えるか、元々人気の高い人に声を当ててもらうかしないとコンテンツ自体が盛り上がっていかない…。 NEUTRINOは正常進化だと思う。
だから、これから音楽の制作現場では徐々に普及していくことになるだろうと見ている。
自分のようなアマチュアの立場からしても、これでやっと(ボカロうんぬん関係なく)ふつうに歌を評価してもらえる環境が整ったと喜んでいるところ。
NEUTRINOというタグを入れず、「これ、いい曲だね、だれが歌ってるの?」と聞かれるような時代がついに来たかという感じ。 そこまでいくには音の面だけでもあまりにも足りないものが多すぎるのよね
無料なのにこのペースで音源増やしてくれるのはありがたいけど正直増えるたびにがっかりしてる自分もいるわ 新しい声どれもきりたんのクォリティ超えれてないのはなんでなんだろう
NEUTRINOの開発手法に合う声質みたいのがあるのかな そーかなー個人的にはずん子が残念な出来だった以外は大体満足してるけど
※最初の2つとナクモは使ったことが無いので知らない イタコは気に入ってる。俺は逆にきりたんがダメ、何か聴いてるとイライラしてくる 声の感情のバリエーションが乏しすぎるから正統進化とは思えない
だからといってそれを楽譜から推定できるようにするのも楽譜上で指定できるようにするのも難しい NEUTRINOってYou Tubeだと未だに「神調声」とか言われるよね。 きりたんは純粋にユーザーがよってたかって揉んだことで不具合が解消されて品質が上がった。
そして最初に出たということで声のイメージが単体で確立できた。
後から追随するボイスはどうしてもきりたんとの比較という形での評価になりやすい。
声質の違いとか歌唱の癖の違いとかそういったところ。そうすると単体出しした時の純粋な評価が得られにくいだろう。 感情のバリエーションはもちろんあった方が良いけど、現状では個性に合った曲を選ぶことが重要かも そういうことじゃなくて、一曲の中でずっと同じ感情ってのがなんとなく怖いところある
個性に合わせようにも、個性側が淡白に聴こえてしまう >>905
ピッチガチャでの複数トラックを、切り貼りもしくは部分的にマスクなどすれば多少対応可能。 ウイスパー、ノーマル、芯のある強い声、ファルセット、シャウトとかキースイッチみたいに音符毎に指定出来ると最強やね 自分の場合、歌い手はできるだけ無色に近い(癖の少ない)ほうが好み。
感情の起伏や作品の世界観などは、歌詞とメロディと編曲、あとはミックスダウンなどの音作りで作り上げればいいという考えかた。
>>906に続け NEUTRINO 「めろう」 の例で話をすると、Youtubeにアップされている曲だけでも、(>>906とあわせ)下のように歌の世界観をかなり表現できているのが判る。
たとえば、実際に自分でバンドを組もうとしても、これだけの声質と歌唱力を備えた女性ボーカルを探すのはけっこう大変だと思う。
もちろん、めろうに合わない曲もあるだろうけど、NEUTRINOの場合は歌唱ライブラリがあまり被っておらず使い分けできる点もいい。
自分の場合は、ポップス&バラード系にめろう、アイドル系にイタコ、ロック系にNo.7、という感じで考えている。
AIシンガー“めろう”で 「ふゆびより(ゆるキャン△ED)」 カバー
https://www.youtube.com/watch?v=u7Bta0ca5xA
【めろう】 長い間 / kiroro 【NEUTRINO】
https://www.youtube.com/watch?v=1BlScyeiFJM
【めろう】 ドライフラワー 【NEUTRINOカバー】
https://www.youtube.com/watch?v=HKKA54nnEbE 一通り聞いてみたけど母音と子音間?のカクつきというか引っかかり感みたいなのが結構あってまだ途上だなーって感じ >>912-913
もう、そのレベルになると半分以上は好みの問題だと思う。
きりたんのダンデライオンはちょっとダメだった、というか、きりたんにはどういう曲を作ればいいのかも思い浮かばない。
自分にとって、きりたんは色々な部分で曲者(癖もの?)だったりするんだよね。
いま無理に考えてみると、ラブコメのアニソンみたいなポップで明るいイメージの曲ならこちらも合わせられるのかなぁ....
そういう意味では、上の>>903-904でも話が出たよう、ボーカルに合う曲というのは絶対あるし、曲を作る側からしても自分と相性の良いボーカルと悪いボーカルは絶対あると感じている。 イマイチという評価をしている人は「下手な人間に聞こえる」なのか「人間を再現しきれてない」なのか。
どっち? 人間の一部分を再現しているので全てを平均的にバランス良く再現しきれておらず下手な人間の歌に聞こえると判断している 合唱曲で全員の声を合わせると個々の個性が相殺かつ相乗されて割と自然に聞こえる気がしてる。 >>916
質問に合わせて用語をチョイスしたので語弊がある書き方だった
仮歌シンガーとするなら下手って意味で素人が歌うカラオケなら巧さも外し具合も再現できていると思う
歌唱の技法はいくつか知っていて知ってる技法を随所に盛り込んで歌うだけで1曲を通じてみたら仮歌シンガーとして下の方の評価になってしまう 作品として仕上げるなら支援ツールでピッチと強弱は編集するよ
メロウはこれにより見違えるね
でも音量に応じた声色の変化は難しい
同じ曲を例えばメロウと7に歌わせて7のf0とbapはそのままにmgcだけメロウにしてworldして出来たメロウ7のwavとメロウ単体のwavを切り貼りすると多少表現力は上がる
コーラスなどはずん子のf0、bapを使うと癖なくほぼノンビブラートの歌声に仕上がる めろうは出た当初はロングトーンくっそ音痴で調整支援ツールで全部直さないと行けなかったから
MAC派は絶望だっただろうなぁ
今は少しまともになったかな? >>910
技術的に難しいなら、新しい声実装する感じできりたんの別Ver(シャウトきりたんやウィスパーきりたん等)作ってほしいなあ。
継ぎ接ぎ編集はもうこっちでやるので… きりたんにはテンポ速すぎない電波ソングが合うと思う Sevenはマスタリングのリミッターで歪むから個別にEQで調整がいるんだよね Neutrinoが商業的に成功しない(というかそもそもそのつもりでない)のなら基本的に継続した進化は望めないと思うんだが、
MMD的なコンテンツの盛り上がり方したらワンチャンあるかなあと思ってる MMDと違って寄付は受け付けてくれてるからまめに支援することで継続できると思う 専用エディター次第で化けそうな気がする
調音支援ツールも良いんだけど細かな使い勝手向上はできそうだし
sigさんもしかしてヘッドハンティングされちゃったかなぁ? >>925 >>927
答えは出ているのだから、違う路線で盛り上げたいなら他人任せにするのではなく率先してMMDやエディタを製作して提供すればいいんだよ。 >>928
ま、そうだな。
曲作る方はみんなに任せて映像やツール面で支援していきたい。勉強するかあ…。
てかまとめwikiみたいなのも今のところないよな?
需要あれば作ろうかな。 みんなエディタには何が欲しいんだろ
個人的には複数パート対応とオケの同時再生ができればいいなとは思ってるけど 同じ楽譜でとりあえずありったけのボイスを合成するバッチくらいならまあ一瞬でできるけど
オケの再生とタイミングを厳密に合わせるとなるとそれなりに頑強な作りにしないと難しいだろね AIきりたんに歌ってもらったときの感動は
きりたんがわたしのために歌ってくれてるうううう
って思った(抑えきれないヲタ感
いや、まじなかなか言い難いですが、そうなるんですよ・・・
発展性ありそうなんだけどなぁ
クリエイターと視聴者で温度差あるのかも メロウのギザギザピッチもう少しフラットにならんかな
手直しめんどい カバーを作るときにオケを他所から借りてくる人に聞きたいんだけど、そのオケのBPMも一緒に書かれていると嬉しいものですかね? あれば楽な場合もあるけど、DAWでビート抽出できるのが今時当たり前なので別になくてもいいな。 無くてうれしいってこともないので有るほうが良いのは確か。 エディターは希望を言うなら
複数パート対応とオケの同時再生
最低限これだけあれば、いいんじゃないでしょうか
あとから追加できるし
非営利なのかな、カンパシステムも実装してもいいと思う >>936
>>937
ありがとう
なくても良いがあると楽とのことなので、自分が公開しているオケには記載することにするよ
ニコニコのNEUTRINOカバー曲を見ていたらオケとテンポが合っていないものが散見されたので オケが借り物とかなんかつまらんよね
オケ込のコピーこそ楽しみ とりあえず歌わせたいだけって人もいるからね
それは個人のスタンスによるし、それこそ自作曲でこそって人もいるし JPOPの曲なんかだと、オリジナルをコピーしただけのショボい自作オケを使うくらいなら
CDに入ってるカラオケ使えばいいじゃん、と思うことが良くある 以前はCD音源アウトだったけど今はおkだからね
人それぞれだけど、借り物なら歌声はガチ調声であれば配分的にはいいと思う
オケ込みなら昔のMIDI職人作品聴くような楽しみもある
オケ借り物で無調声でも動画でカバーするのもアリだろうし まあ借りたオケにちゃんと声を馴染ませるミックス技術は求められるからね CDの音源をつかうのが上手な人はいるからね。
下のCeVIO使いの人も市販のオケにあわせるのと選曲がうまい。
【CeVIOカバー】 さとうささらで 「約束はいらない」
https://www.nicovideo.jp/watch/sm24979144
【CeVIOカバー】 さとうささらで 「勇気の神様」
https://www.nicovideo.jp/watch/sm23577101 >>943
CDに入ってるカラオケはコーラスとか入ってることが多くて、NEUTRINOで作った声と合わせるとマッチしなかったりするのがこまる 昔のMIDI職人作品で思い出したけどWRD付きMIDIのカバー作品とかも最近は出てきてて面白い。
うちも当時大量に集めてたけどHDDクラッシュで全部吹っ飛んで、今や手に入れる手段は無し… 歌の音量が大きすぎてオケをかき消している動画もいくつかあるよね >>951
そういう時は、もっと上手なお手本を示してもらわないと、ただのビッグマウスじゃないかと疑ってしまう。 >>953
俺が思うに >>946 みたいなのは原曲と比較しちゃうからあまり高くは評価できないと思う。
合成でやる以上はどう頑張っても人が歌う感じに似せようとした (しかし出来ていない) 作品として聞こえる。
(技術的チャレンジとしてはこういう試みを積極的にやって欲しいとも思ってるけど。)
CeVIO の使い方が上手いとかミックスの上手さとかいう話じゃないんよ。
原曲が「正解」として存在してしまうからそこに届かないものにしかならんのよ。
カバーするなら原曲を再現することを目指すよりは別の魅力を引き出すように、
CeVIO が活きるようにアレンジしたほうが良いと思うから
CD 音源を上手く使うのは元々ハードルが高いものだと思う。 原曲から歌声抽出してピッチ情報コピペして作った初音ミクの渡良瀬川がすごかったけど
それもオリジナルを超えてるかっていうと到底そうは思えないからね カバーは原曲へのリスペクトだからね
それ無しだったらただの窃盗犯っすよ わざわざ比較も出す気ないから別にビッグマウスと思ってもらっていいよ
正直原曲も聞いた記憶ないから1曲の音楽を聴いたうえで
CeVIO の使い方の上手さとかミックスの上手さって話。 >>954
> 原曲が「正解」として存在してしまうからそこに届かないものにしかならんのよ。
> カバーするなら原曲を再現することを目指すよりは別の魅力を引き出すように、
そういう話じゃなくて、>>946は、上の>>942-945に続けた発言なんだよね。
> ショボい自作オケを使うくらいならCDに入ってるカラオケ使えばいい
というのもあるし、新しい歌唱ソフトが出た直後はサンプルが少ないから、市販の
オケを使ってくれた方が、早くサンプルを出せるし、比較できる原曲がある分ソフト
の質や実力も評価しやすい。
とくに、946については、自分がCeVIOを購入するとき参考にした曲の1つでもある。
市販のオケに負けずこれだけ歌えるなら、自分の目的にも十分使えるという参考
材料になった点は大きい。
NEUTRINOの場合は、キャラ絵を使わず、聴く側に誰が(何が?)歌っているのか
あまり意識させないような使い方をするつもりでいる。
>>957
おそらく、参考になるようなサンプルは探しても簡単に見つけられないだろうと思う。
市販のオケにのせ歌唱ソフトを上手に歌わせている動画というのは、意外と少ない。
ベテランは市販のオケを使わないことが多いし、市販のオケを使うユーザーは逆に
初心者が多いため、一定以上のレベルまで仕上げられていない作品が多い。
>>946の曲は、そうした狭間でこれだけのバランスに仕上げた点が貴重だといえる。 >>960
繰り返すが技術的なチャレンジとして面白いということはわかってる。
CeVIO を評価するには比較対象があったほうがよいというのもわかる。
しかしそこで >>951 のような意見が出る背景としてはこういう見方をしているせいではないかな
ということを想像して補足をしただけ。 まぁしょっぼいギターなMIDIのカバーは聞く気せんけど 音楽やってる人でもない一般の視聴者には生ギターもシンセのギター音色さえもそう変わらないという事実 最近のギター音源は、上手く打ち込めば下手な生ギターより良い結果になることも
多い、特にオケの他の音数が多い場合 よく調整した声を聴かせたい曲だと表明されてるならオケは単なる額縁だと思って聴くようにはしてるな >>946
十分なレベルだな
歌ってみた系の標準レベルは超えてる 今は無料でもUnrealInstrumentsみたいな良質なギター音源があるから良いよね 下はMIDIのクラシックギター打ち込み専門サイトで、MIDIデータもダウンロードできる。
カディス (スペイン組曲第4番) 【ギター版】 / I.アルベニス
解説上部の再生ボタンで視聴、右下のダウンロードクリックでMIDIデータ入手。
http://www.guitarsound.net/elixir/htm/cadiz.htm 2009年か・・・MIDI文化は廃れてしまった感が/(^o^)\
歌唱データを抽象化したデータ配布が流行る時代来たか・・・?
オリジナルしか作らないから分からないけど
piaproとかでオケMIDIデータ取ってるくのかな
個人的には下手でも耳コピしたデータの方がいいぜ・・
結果的に耳コピならぬアレンジになるから ないだろうね
昔MIDIデータがスタンダードだったのはテレホやISDNの通信能力が貧弱な時代でMP3(当時はコーデックの質も今ほど良くなかったしビットレートも128kbpsが主流)に比べてはるかに計量だったことと、
ローランドやヤマハのハード音源がDTMをするほとんどの人にとっての標準装備だったって理由がある
ハイレゾ音声さえも簡単に配布できる時代に、作る側がわざわざ生データを配る理由がない midiで配布してもハード音源持ってる人は少ないしOS標準の音源もショボい
MSがmidi音源にもう少し拘りを持ってたら状況が違ってたのかもな MSがローランド買収してVSCが標準搭載にとか… ないか あんなの、FM音源に毛が生えた程度の音しか出ねえ(´・ω・`) VSCなんてそんなもんだよ
言うならSC-VAかと DTMをやっているWindowsユーザーなら、VirtualMIDISynth に サウンドフォント SGM-V2.0.1.sf2 を
設定して、MIDIの音質を改善しているという人も多いんじゃないかな。
Windows標準では草笛みたいにしか聞こえないバイオリンの音が、しっかりバイオリンに聞えるように
なるなど見違えるように音が良くなるし、どちらも無料で入手できるからね。
良くできたMIDIファイルは編曲の勉強にもなるし、自分は色々なMIDIファイルを落とし良く聴いている。
下はフリー音楽素材サイト TAM Music Factory のMIDIファイルを演奏させたもの。 (全8曲)
https://d.kuku.lu/84ff0b5f6 スレ違いのクソどうでもいい話題を延々と続ける価値とは何か NEUTRINO自体はMIDI文化とは関係ないもんなあ
MIDI2.0とも今後も交わる予定もなかろう 今のところは NEUTRINO 用のモデルは8キャラ分あるわけだけど
憑依の組み合わせで考えると64あるとも言えるわけだよね。
憑依を積極的に活用した作品の例とかありませんか? ここ見りゃ憑依の仕方がわかるってページありませんか? >>989
world コマンドのときに mgc を差し替えるだけ。 >>989
使いたい声の奴と憑依させたい奴のmgc入れ替えてWorldするだけや
メロウにずんこ憑依させると声の震えがなくなるがほぼノンビブラートになる
他も色々おもろいで なんで憑依のスタンダードってmgc入れ替えになったの?
どっちかというとf0入れ替えのほうが適切な気がするんだが バッチファイルじゃなくて調声支援ツールでworld実行してるんだけど、
この場合でもmgc入れ替えでいける? 次スレ立てました。テンプレに入れたい最新情報あれば適宜書き込んでください。
AI歌声合成ソフト『NEUTRINO』 Part2
https://egg.5ch.net/test/read.cgi/dtm/1628983407/ このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 535日 6時間 43分 10秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。