X



トップページDTM@2ch掲示板
1002コメント330KB
AI歌声合成ソフト『NEUTRINO』
レス数が1000を超えています。これ以上書き込みはできません。
0001名無しサンプリング@48kHz
垢版 |
2020/02/27(木) 07:28:04.98ID:T+LDlfSs
NEUTRINOに関する情報交換を目的としたスレです。

NEUTRINOはニューラルネットワークを用いた歌声シンセサイザーです。本ソフトウェアはフリーウェアです。
楽譜から発声タイミング・音の高さ・声質・声のかすれ具合などをニューラルネットワークで推定します。上記の推定されたパラメータを元にvocoderで音声を合成します。
本ソフトの名称はまだ聞いたことのないような楽曲・ジャンルを開拓してほしいという思いを込めて名付けました。あなたの創作・発見の一助になれれば幸いです。

NEUTRINO オフィシャルサイト
https://n3utrino.work/

対象OS
Windows
Linux
0004名無しサンプリング@48kHz
垢版 |
2020/02/27(木) 10:09:23.23ID:JjaPv+H3
どえらいスタイリッシュなページのStart Nowをクリックしたらベクターに飛んでワロタ
0005名無しサンプリング@48kHz
垢版 |
2020/02/27(木) 11:03:38.59ID:Zd1rZx6l
これって出力される音声ファイルのサンプリングレートとかbit数とかはどのくらいなんでしょう?
0007名無しサンプリング@48kHz
垢版 |
2020/02/27(木) 22:04:01.93ID:ogb24Ma1
Macで使えない時点でワイ詰んでる
0008名無しサンプリング@48kHz
垢版 |
2020/02/27(木) 22:23:18.60ID:lnXtMQmC
vectorの鯖落ちてない?
ダウンロードできないんだけど
0012名無しサンプリング@48kHz
垢版 |
2020/02/28(金) 20:32:15.58ID:zBgnoRVB
将来的にMacにも対応する予定って書いてあるけど
その頃には有料ソフトになってたりして○| ̄|_
0013名無しサンプリング@48kHz
垢版 |
2020/02/28(金) 23:31:32.11ID:4zQRw8n9
初期のミクの時みたいに電車の発車メロディをアカペラで歌わせるシンプルな動画が増えるかな
0016名無しサンプリング@48kHz
垢版 |
2020/02/29(土) 02:38:37.71ID:N+ZB53n6
>>3
できるらしいが当然金は払う必要はある

【告知続き】同人イベント以外でCDなどを販売をする場合,
1曲1,000円とキャラクターライセンス料(zunko.jp/con_shoushi.html)でのライセンス販売とさせて頂きます.
登録用サイトは現在制作中ですので,完成し次第追って報告致します.
https://twitter.com/m_morise/status/1232317209550053380
https://twitter.com/5chan_nel (5ch newer account)
0019名無しサンプリング@48kHz
垢版 |
2020/02/29(土) 19:00:04.63ID:YmpGuXEa
NEUTRINO同士が繋がって、ユーザーが歌わせれば歌わせるほど歌唱力が上がっていくシステムにならんかな
SETI@homeみたいな感じで
0021名無しサンプリング@48kHz
垢版 |
2020/02/29(土) 23:27:41.21ID:Gc7AlYmJ
NEUTRINOの歌唱ライブラリは学習済みのデータだからね
それにずっと学習させてれば良いと言うものでもないし
過学習になればどんどん歌唱データのクオリティが落ちていく
0026名無しサンプリング@48kHz
垢版 |
2020/03/04(水) 07:20:06.52ID:EqT37SJF
きりたんの歌真似芸人が出てきそうな予感
0027名無しサンプリング@48kHz
垢版 |
2020/03/04(水) 07:44:55.80ID:lVWp6svP
>>24
合成ソフトとしてはミクさんみたいに楽器音源扱いにしてくれれば良かったんだが
そうではないみたいだな
なんか面倒が抱えそうで使う気萎えるよな
0028名無しサンプリング@48kHz
垢版 |
2020/03/04(水) 07:58:31.63ID:KxPdApEN
まあ凄くめんどくさいよ
直MIDIできんから変換しなきゃならんし
このへんは個人の限界だね
いくら開発できてもVSTまわりの権利は個人では買えないわ
0029名無しサンプリング@48kHz
垢版 |
2020/03/04(水) 10:15:56.33ID:cxprzihQ
AIきりたん無調整でも優秀過ぎるが巨星ミクほか、nextもかなり強いからな
リンレン/ルカ/GUMI/ゆかりは越せないだろうなあTOP10入りすら大変だ
0030名無しサンプリング@48kHz
垢版 |
2020/03/06(金) 00:01:03.80ID:tF6Lgumz
このスレなんで独り言文体で埋まってるんだよ
いつもの独り言連投のひとしか居ないってバレバレやん
表側のハイプにも乗れずに独り言を書き散らす哀れな人生だな
0032名無しサンプリング@48kHz
垢版 |
2020/03/06(金) 07:42:52.32ID:XUoF8g91
統失妄想おばさんのみじめったらしい精神勝利法に爆笑
このひと音楽スレ荒らしをしても音楽の話がまるでできないから毎回エアプとバレてるのに
0033名無しサンプリング@48kHz
垢版 |
2020/03/06(金) 07:47:31.32ID:XUoF8g91
> いくら開発できてもVSTまわりの権利は個人では買えないわ

VSTプラグイン開発はライブラリの使用許諾に同意すれば個人でもできるのは24年前から常識だよな
なに寝言を書いてんだ
0036名無しサンプリング@48kHz
垢版 |
2020/03/06(金) 13:36:17.70ID:o33c6kMt
ゆっくりみたいにYoutubeで人気ありゃ良かったが
ニコニコローカルなのが今の時代勿体なかったな
0037名無しサンプリング@48kHz
垢版 |
2020/03/06(金) 15:26:10.24ID:YH++l5pP
音声読み上げソフトがツール任せでここまで歌えるのはすごいと思った
初音ミクNTプロトタイプのデモソングも聞いてみたけど
0038名無しサンプリング@48kHz
垢版 |
2020/03/06(金) 15:35:59.51ID:+jN4duH1
>>37
>音声読み上げソフトがツール任せで
いやちゃうで
音声読み上げソフトは株式会社AI製のAITalkという全く別のソフト

こっちはAITalkを使ってVOICEROIDという名前で商品出してる
東北きりたんの中の人に
ギャラ払って歌ってもらった50曲の声を
機械学習させて別の人が作ったNEUTRINOという別のソフト

ちなみにギャラ払って歌を依頼したところも全く別のところ
ちなみに機械学習分野で研究に使うのみであればだれでも使えるように
その50曲の歌声を配布している
0039名無しサンプリング@48kHz
垢版 |
2020/03/06(金) 16:17:26.64ID:YH++l5pP
NERTRINOだけで音声ファイル出力まで出来るなら、中の人以外まったく関係ないじゃないかw
動画にみんなAIきりたんってついてるから勘違いする
0041名無しサンプリング@48kHz
垢版 |
2020/03/07(土) 18:47:01.05ID:ZQGKfBxE
NEUTRINOで使っているきりたんDBを作ったところのインタビュー
そっちもAI歌声合成システム開発の完成を目指しているらしい
途中でそっちの宣伝になってしまうため若干スレ違い気味だが

AIきりたんの仕掛け人、森勢将雅准教授に聞く、AI歌声合成の世界で今起こっていること
https://www.dtmstation.com/archives/28823.html
0043名無しサンプリング@48kHz
垢版 |
2020/03/08(日) 02:20:26.08ID:zNCV2CM2
Mac版出たってよ
0044名無しサンプリング@48kHz
垢版 |
2020/03/08(日) 08:03:58.13ID:P4pr5U6M
>>43
_人人人人人人人_
> 公開停止中 <
 ̄Y^Y^Y^Y^Y^Y^Y^ ̄

慌てて見に行ったのに・・・orz=3
0045名無しサンプリング@48kHz
垢版 |
2020/03/08(日) 08:07:55.43ID:so0uI8zQ
なかのひとも週末早い時間帯に出して週末中に試してもらえるかでハイプが違うから大変だよね
0047名無しサンプリング@48kHz
垢版 |
2020/03/08(日) 19:58:45.77ID:Z32EcBmd
ベタ出力の自然さだとヤマハのvocaloidシリーズより上だな
おかしくなる曲もあるらしいけども
0048名無しサンプリング@48kHz
垢版 |
2020/03/08(日) 21:09:32.62ID:pJfBT2/q
いやこれもうボカロとか言ってる場合じゃないぞ
完全にブレイクスルーはたしてるやんけ
普通に聞いたら人が歌ってると誰もが思うぞ
ガチで新時代きたな
0050名無しサンプリング@48kHz
垢版 |
2020/03/08(日) 21:26:11.53ID:x9E3VLFv
既に有名Pが使って知名度の無さに嘆いたりしてたじゃん
ハニワが使っても全然伸びない辺りで悟ったよ
0051名無しサンプリング@48kHz
垢版 |
2020/03/08(日) 21:35:14.09ID:Z32EcBmd
藤田咲に頼んでAI初音ミクってタグついてりゃ大ブレイクしてただろう
きりたん好きだけど知名度
0052名無しサンプリング@48kHz
垢版 |
2020/03/08(日) 22:51:31.18ID:n/4XJoYd
>>50
VOCALOIDでもUTAUでもCeVIOでも言える普遍的な問題
「どの歌声が好きか?」の領域ではないかと思う
平均的なそつなく歌う歌い手よりも個性的で光るものがある歌い手の方が人気があることと同じこと
ボイロの東北きりたんとも少し違うAI東北きりたんのファンがもう少し増えないとな
AI謡子も然り
0053名無しサンプリング@48kHz
垢版 |
2020/03/09(月) 15:07:12.17ID:wI0YBGRz
きりたんの動画めっちゃ増えててワロタ
0055名無しサンプリング@48kHz
垢版 |
2020/03/09(月) 15:40:36.51ID:wI0YBGRz
ミク厨発狂しててワロタ
0059名無しサンプリング@48kHz
垢版 |
2020/03/09(月) 19:51:02.08ID:BmZbyQWI
カンパウェアみたいな感じだな
1曲千円程度ならいいんじゃない
売るつもりがある人なら元取れるでしょ
0060名無しサンプリング@48kHz
垢版 |
2020/03/09(月) 22:53:06.94ID:pf0OwphC
主にきりたんの方の元々の研究目的以外で使用してはならないは、機械学習かつ版権切れてない楽曲を元にしているからだが
それが1曲1000円でペイできるという話はよくわからないな
JASRAC使用料だったら50曲分のうちの数%ということでもっと行きそうだが
まだ具体的な基準はないだろうが

それとも別の部分の話なのか?
0066名無しサンプリング@48kHz
垢版 |
2020/03/10(火) 10:43:29.43ID:4O5k7WC8
人の声にすごく近いのがすごい
あとは知名度だな
0067名無しサンプリング@48kHz
垢版 |
2020/03/10(火) 12:10:56.49ID:d0bAkfm7
NEUTRINO-MAIN-Windowsを、RAMディスク(2GB)で実行させたらSSDより
15%位作成時間が短縮できたよ
0073名無しサンプリング@48kHz
垢版 |
2020/03/11(水) 17:21:08.01ID:bnqAEiv7
AI謡子のイラストを追加する予定はあるのだろうか?
0076名無しサンプリング@48kHz
垢版 |
2020/03/12(木) 02:36:32.06ID:gK4hgT0n
これって冒頭に空白(無音)が入るのがデフォなの?
sample1でも空白出来たんだが
楽譜通り出だしからちゃんと歌うwavファイル作れる人いる?
0078名無しサンプリング@48kHz
垢版 |
2020/03/12(木) 11:19:18.18ID:gK4hgT0n
>>77
同じ症状の人居て良かった
環境依存なのかと思ったぞ
仕様なのかな?

他の人はどう?
0079名無しサンプリング@48kHz
垢版 |
2020/03/12(木) 11:35:02.88ID:svFW2oLY
むしろ出だしからきちっと歌うようにすると不都合があるからだと思う。
波形見ると、ジャストの出だしの前にブレスなのか何なのか分からんけど明確に音がある
0080名無しサンプリング@48kHz
垢版 |
2020/03/13(金) 11:49:42.53ID:Gqry7mOS
やっぱキャラクターライセンス料以外に1曲1000円+税が要るのは変わらんっぽいな

AIきりたんの商用利用ライセンスできました((o(*´∀`*)o))
AHSさんに管理をお願いしました(≧▽≦)ゞ

商用利用する楽曲を1曲1000円+税で登録していく形となります(」*´∇`)」
https://www.ah-soft.com/licensee/music/ai_kiritan/
https://twitter.com/t_zunko/status/1238026881535885313
https://twitter.com/5chan_nel (5ch newer account)
0081名無しサンプリング@48kHz
垢版 |
2020/03/13(金) 22:04:37.73ID:QnyAPbwK
youtubeへのうpって商用利用に当たるの?
収益化されてる前提で
0082名無しサンプリング@48kHz
垢版 |
2020/03/14(土) 00:29:58.20ID:nK5LrCey
>>81
AHSに委託しているという話
AHSに問い合わせればいいんじゃね
ストリーミングに相当しそうだがどう考えているのかね

ニコニコもクリエイター還元なんとかやってなかったか?
今はやっていないかも知らんが
0083名無しサンプリング@48kHz
垢版 |
2020/03/17(火) 09:45:26.67ID:zQ+oAmmA
>>81
金になってるなら商用だろうけどなってなきゃ良いでしょ
0084名無しサンプリング@48kHz
垢版 |
2020/03/17(火) 15:46:53.03ID:KOGuYBjH
ボイスロイドは名前しか知らなかったけど、人の声過ぎてびっくりした
思わずやってみようと思ったが、音楽初心者には難しいな
0086名無しサンプリング@48kHz
垢版 |
2020/03/17(火) 16:42:23.01ID:as/z2ULU
>>85
えっ?
0087名無しサンプリング@48kHz
垢版 |
2020/03/17(火) 17:03:53.99ID:c/JIVQwJ
こう言う微妙なところがあるから規約の厳しいソフトを避ける理由になるんだよな
0089名無しサンプリング@48kHz
垢版 |
2020/03/18(水) 19:28:44.43ID:1vGoaV2c
支援ソフトを開発されてる方々が出てきましたね。
少しずつ使いやすくなりそうです。
0090名無しサンプリング@48kHz
垢版 |
2020/03/20(金) 17:13:47.69ID:+y5WYCPB
こんなんフリーとか恐ろしい時代だな

非商用という概念はいとむつかし
●東北ずん子利用の手引き
クリエイターは非商用利用可能。同人誌は原価回収レベルでやってね
ニコ動のクリ奨は非商用の範囲
0092名無しサンプリング@48kHz
垢版 |
2020/03/20(金) 18:33:42.45ID:mNi5hUvS
普通に考えたら収益化したらダメだろ
まあ規約にないんだったらやってみたら?
世の中には書いてないんだったらOKって解釈する人もいるしどうとでも読める規約ならそっちの方が悪いって事もある
どうなっても知らんけど
0093名無しサンプリング@48kHz
垢版 |
2020/03/21(土) 01:55:57.68ID:tjuG2ofM
Youtubeやってないから知らないんだがぼろいのか?
最近流行りの事務所所属Vtuberは気になる
ギャラが発生するから商業利用になりそうだが今の規約では逃げられそう
0094名無しサンプリング@48kHz
垢版 |
2020/03/21(土) 03:02:26.17ID:H3n6P7q6
芸能系も含めプロがYouTubeに降りてきてるから趣味系もかなり辛いと思うけどな
内容が濃い人は本当に濃い
特に芸能人系の動画は周辺にもプロがついてるから撮影、編集クオリティが段違いな場合が多い
0095名無しサンプリング@48kHz
垢版 |
2020/03/21(土) 08:59:06.48ID:tjuG2ofM
>>94
言い換えるとその辺りの事務所所属未所属問わずプロが使って収益化するのはOK?という疑問はあるかもしれん
0096名無しサンプリング@48kHz
垢版 |
2020/03/21(土) 10:28:40.79ID:H3n6P7q6
人による解釈の話かも知れんがYouTubeとか動画サイト等の収益化=商用だと思ってる
同人の販売はあくまで原価回収が建前だから非商用扱いで許してるんだろう
規約が杜撰すぎるのよ
0099名無しサンプリング@48kHz
垢版 |
2020/03/21(土) 12:23:27.61ID:PFP9jhSf
きりたんやずん子の出自なんか知りたくもないから、早くこいつのボイスデータ消した完全フリーバージョン作ってくれ
残念ながら誰もこのキャラに興味なんかないよ
0100名無しサンプリング@48kHz
垢版 |
2020/03/21(土) 12:42:30.66ID:VO2u4cz0
いくら芸術にクリエイターの人間性は関係ないとはいえ
こんな奴の曲は聞きたくないな
0103名無しサンプリング@48kHz
垢版 |
2020/03/21(土) 14:29:41.75ID:4kcpP2UY
きりたんも秋田のクソガキ感出てて良いけどVY1V4みたいな無機質なイメージでもいいな
0106名無しサンプリング@48kHz
垢版 |
2020/03/22(日) 15:43:24.27ID:6XVIepN5
>>76
何個か試してみた程度だが、たぶん冒頭の空白は一小節分。
(ただし、 >>79 が指摘するように少し先行して発声している分はある。)
伴奏とかと合わせるならそのつもりでやったらだいたい合うと思う。
0107名無しサンプリング@48kHz
垢版 |
2020/03/23(月) 13:32:45.80ID:oKMoKrY5
>>105
70〜80年代のJPOPなら歌える
古い歌なので、当然ながら動画サイトでは人気がない
視聴回数かせぐなら、AI謡子でなくてAIきりたんにアニメソングを歌わせるに限る様です
0108名無しサンプリング@48kHz
垢版 |
2020/03/23(月) 14:19:32.42ID:cqMsnUVC
謡子はなんというか……オバハン声なんだよな。
いや、悪いわけではないし声楽的に正統派っぽい雰囲気すらあるけども、
大衆ウケはしないなぁというのもよくわかる。
0109名無しサンプリング@48kHz
垢版 |
2020/03/24(火) 03:41:16.07ID:UQyOa6XF
初音ミクとかのボカロもう完全にオワコンだろこれw大体味がある云々言うけど聞き取れやしねーよあんなもん
グッズ展開やら声だけ変えて数出してーの商業特化に夢中で より人に近く聞ける音声でっていう面を疎かにしたツケだろw
0110名無しサンプリング@48kHz
垢版 |
2020/03/24(火) 03:46:12.92ID:UQyOa6XF
調声した人によっちゃ化ける…ってベゼスダゲーかよw
新作のFo76も以前のシリーズでユーザーにMODでバグ修正だのコンテンツ追加だの尻拭いしてもらってきたツケが回ってきて満場一致のクソゲーだったよな
ゲームに限らずなんでも消費者舐めた商売してるとこうなるんやね
0111名無しサンプリング@48kHz
垢版 |
2020/03/24(火) 12:07:04.62ID:7rgMIQVV
使い方。
Run.bat(Run.sh)が鬼門なのかな?
俺はいきなりTarget(だっけ?)=$1
に書き換えたわ。Windowsなら%1だね。
現在のところWindowsでxmlまで作ってきりたんのwaveとかmidiのミックスまではMacで遊んでるけど全部無料でここまで楽しめるとは思わなかったよ。
ポケミクなんて無駄に3セットも買ったのに作る気しなかったけれども
0112名無しサンプリング@48kHz
垢版 |
2020/03/24(火) 16:17:50.33ID:fDZVM2L7
>>109
IT業界は先駆者の利が巨大で強大
アマゾン考えれば分かるだろ
きりたんはきりたんで生きていくだろうけど

競い合うように次のミクがより良くなるなら願ったりだけどな
0113名無しサンプリング@48kHz
垢版 |
2020/03/24(火) 18:23:05.09ID:KxZpgnax
NEUTRINO はかなり自然に歌ってくれるのはありがたいんだけど、調整の余地がないんよね。
微妙に休符とかブレスとか入れたパターンをたくさん作っていい感じになるのを祈るしかない。
こういう結果が欲しいからこういじるというのが通用しない。

が、 DAW 系のソフトで人間の歌を調整するのと同じような要領でいじれるわけだし、
調整に多大な労力を使うよりは賢い出力をちょっといじる方がだいぶんマシだよな。
ユーザーのほとんどは理想を追い求めて調整を続けるようなヘビーユーザーではなく
ほどほどになんかいい感じに歌って欲しいと思ってるだろうし。
0114名無しサンプリング@48kHz
垢版 |
2020/03/24(火) 18:52:56.99ID:KxZpgnax
弱起の曲だとリズムが狂うな。 短い小節の最後の音が間延びするみたい。
まあ普通の長さにして頭を休符で埋めればいいだけなんだが……。
0115名無しサンプリング@48kHz
垢版 |
2020/03/24(火) 23:59:31.58ID:fDZVM2L7
ボカロと違って仕様上「ここだけ」ビブラートとか「ここだけ」ファルセットとか出来ないっぽいよな
あくまで楽譜ベースでしか歌ってくれない的な
譜面記号でビブラートとか無いしな
0117名無しサンプリング@48kHz
垢版 |
2020/03/26(木) 18:21:40.00ID:7RI1IbQR
今朝、これを知りました。ショックです。

やればできるんだろうなって思って、ぼちぼち検討してた。
個人が趣味でやるレベルだと大量の生声が手に入らない
著作権的にアレだけれど、外に出さない実験段階なら、
商業CDのシングルのカラオケバージョンで差分とって
ボーカルだけ抽出して使うか?とか考えてるうちに・・・。

その分野か近い人なら誰もが、最初か早いうちに試すであろう、
王道かつ直球ストレートの手法で、ここまで出来てしまうなんて。
やればできるだろうって予想はついていたけれども、
いざ実際にやってみせられて、予想以上の結果にショックだよ。

これのブレイクスルーは学習に使われた生声データですよ。
ふつう、あれだけのデータは手に入らないですから。
声優さんが(意図的に不自然に作った)声優ボイスで歌った
音声で学習して、これですよ?
もし一流の歌手が普通に歌った音声で学習させたら、
もっと自然になるんじゃないかなぁ。
しかも、2桁くらい多くの音声で学習させたらば、
ちょっとマズいレベルになるんじゃないでしょうか。
0118名無しサンプリング@48kHz
垢版 |
2020/03/26(木) 18:31:55.20ID:7RI1IbQR
>>54
無償で提供されてるんだから、規約を読むくらいの手間を惜しむなよ。

それとも、
規約とかあまり気にせず、いかなる用途にも使えるように、
誰かが権利処理してくれて1ユーザ50万円で売られたら使う気になるのか?
0119名無しサンプリング@48kHz
垢版 |
2020/03/26(木) 18:33:41.67ID:7RI1IbQR
>>56
用途を狭く制限する代わりに安く提供されてる、
個人ホビー用ライセンスを買おうとするから面倒なんだぜ?
0122名無しサンプリング@48kHz
垢版 |
2020/03/26(木) 18:44:06.47ID:7RI1IbQR
>>92
厳密に言えば、
upした者が金銭を受け取らずとも、
広告は表示されYouTubeが利益を得るから、
どうなんだろうな。

たとえば、
動画つくった人Aがタダで別の人Bに動画データを渡して、
Bが収益化onでupして収益を得るけれども、
Aにはダイレクトには還元しない、
なんていうやり方で回避できちゃったら、おかしくないか?
0123名無しサンプリング@48kHz
垢版 |
2020/03/26(木) 18:44:59.15ID:/WKL0Nsb
元になった技術は論文で公開されてるみたいだから実装しようと思えば誰でも出来るんだろうけど声優とか歌手の歌声を集めるのにはコネとか資金が必要だよね
0125名無しサンプリング@48kHz
垢版 |
2020/03/26(木) 18:46:20.80ID:7RI1IbQR
>>99
自分で作ればいいじゃん。
ソースコードは公開されてるんでしょ?
ならば別の音声データを用意して食わせればいいだけじゃんかー。

その別の音声データってのが大変なんだけどな。
0129名無しサンプリング@48kHz
垢版 |
2020/03/26(木) 18:54:02.04ID:7RI1IbQR
>>115
中身を見てないので、たぶんアレだが、
譜面に埋め込んだ追加データを、
AIからボコーダにパススルーするように、
改造したらいいんでね?
0130名無しサンプリング@48kHz
垢版 |
2020/03/26(木) 19:00:35.45ID:cNLln9Xt
ボカロスレでガセネタ自演で3週間騒いでたひとと似たタイプのもう一人かな。文体やボキャブラリーに見覚えがある
0133名無しサンプリング@48kHz
垢版 |
2020/03/26(木) 20:38:09.97ID:7RI1IbQR
すまん、言葉が足りなかった。

×あーでも、ボコーダにファルセットがなければ、どーにもならんか。
○もし、ボコーダにファルセットがなければ、どーにもならんか。
0134名無しサンプリング@48kHz
垢版 |
2020/03/26(木) 20:45:30.36ID:3kdDeiA0
ファルセットって何でしたっけ。
オペラで声楽家がとんでもなく高い声を出す時の
裏声的な発声?
0136名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 02:04:17.67ID:s1kJnBdh
これ学習に使われた曲を歌わせたら、どうなるんだろ。
そうではない曲よりも、格段に上手に歌えてしまうのだろうか。

そしてこのエンジンの学習に単一の曲だけを与えたならば、
ほぼボイスチェンジャー並みの再現性になるのだろうか。
0138名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 04:37:57.06ID:s1kJnBdh
>>137
そのうち音声認識で、歌詞つき譜面を生成できるようになるんじゃないかなー。
さらにボーカルだけ抽出する技術と組み合わせたら、どんどん学習できちゃうね。
0140名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 07:47:32.02ID:bnwJZiu0
>>137
専用のボカロエディタ開発してる人が居るよ。
でもおそらくリアルタイムで発音できないから手間は減らない気がする。
0142名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 12:40:38.95ID:0eUIF/r1
これがネガティブ婆の書き込みか

135 名前:名無しサンプリング@48kHz [sage] :2020/03/27(金) 01:37:15.97 ID:XoFt2NGD
uragoe

141 名前:名無しサンプリング@48kHz [sage] :2020/03/27(金) 09:21:03.20 ID:XoFt2NGD
ボカロpボカロスレNEUTRINO
ボカロに恨みでもあるのかな
0146名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 15:15:08.69ID:azGFLzKN
突飛じゃなく「唐飛」という表記は
台湾の軍人の話題なのかな。

DTM板長期荒らしの天羽優子はテンパると
・スレ違いな話題で論点ずらしを始めたり
・身元がバレた後から「山形」という地名を出すのは
おかしいとゴネ始めたり
・自身の名前に幼児向け敬称や詐称肩書を付けてみたり
錯乱状態が酷いね
0147名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 15:29:50.35ID:vB6DNy4K
この単発IDの人は
他の誰かがその真っ当な業績で注目を浴びコラボレーションが進む度に嫉妬して
匿名掲示板になりすましスレを立ててイタコの口寄せみたいな妙な自演をするのだけど

単発IDのなかのひとは他人とまともに意思疎通できない人間だから、レスを付けられてもまともに反応できず>>135のような反応をして、即座に化けの皮が剥がれてしまう悲しい人なんだよね。
どんな人間だって、自身より有能な人間のなりすましなど能力的に不可能なのだから、最初から正直に真っ当に努力して成果を出して結果的に他の人に認めて貰えばそれで充分なのに、それが全くできない
0148名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 16:03:57.98ID:ihmU+kG4
あぁ、バカに見つかってしまったか
しかもヘイトまき散らす無能な味方っていう最悪の形で
終わったな
0150名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 16:31:20.15ID:azGFLzKN
このメンヘラおばさんはなりすまし対象のキャラを理解する人間的理解力に欠けているから
>>148のようにメンヘラおばさんの愚痴丸出しの文章を止め処なく垂れ流して
糞尿を撒き散らす不潔な動物扱いされているんだよね、職場で
0153名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 20:49:48.45ID:s1kJnBdh
昨日のID:7RI1IbQRだが、
この展開にドンビキしてる。

もう昔の2chとは客層が違うんだな。
0154名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 20:52:23.76ID:exZTQEIg
ここ2chじゃなくて5chですしおすし
0155名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 21:08:15.68ID:ihmU+kG4
昔もキチガイはおったでしょ、荒らしも多かった
今は人が居ない分より濃く見えるだけ
0156名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 21:09:55.93ID:q90JNsMc
合ってるんじゃね。「昔」と言えるほどの5chは存在しないのだから「昔の2ch」というしかなかろう
0158名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 23:02:09.65ID:eQfpAx0D
DTM板に関しては昔から一部では
意味不明な叩きとか名誉毀損とかあったね。

だけど2017年12月に上で名前の出てる人が猛烈な勢いで粘着を始めて板が機能しなくなった。

質問に対して回答を付けたり出典論文を示すとその度に、まるで親の仇にでも遭ったように発狂して1件1年単位で同じ繰り言を繰り返すようになって
さすがに教育機関の職員がそんな態度はあり得ないから職場にもクレームを入れたのだけど、
その職場でも敷地内で学生の投身自殺が相次ぐ状況で、そこでハラスメント対策をしてるのがこの人らしくてもう教育機関として箸にも棒にも掛からない状態。

この人は20年以上前からネットストーキングやネットハラスメントで悪名の高い人だから、老衰か事故でネットアクセス不可能になるまで、荒らしが続くと思うよ。
0160名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 23:15:21.35ID:LBA8wI2b
ほら早速、上で名前の挙がっている問題人物が脳内仮想敵の名前を出して責任転嫁し始めた。
職場通報されてもストーキングを辞めないんだから精神異常者と言うしかないねw
0161名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 23:17:44.63ID:TnBBioBV
ID:7RI1IbQRを執拗に叩いているID:mCtvgAXWが
ネットストーキングとネットハラスメントの常習犯本人
0162名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 23:19:25.87ID:rsqCrtmv
天羽優子の事だろ。そいつ基地外だから相手しちゃダメ
どっかでミスを指摘されて精神崩壊してあちこちのスレを荒らし回っているだけ
0163名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 23:22:07.52ID:J9nr8Lra
と、こんな感じで煽ってやると基地外おばさんは喜んでエクスタシーを感じるらしいよ。
誰も基地外おばさんには興味無いのに、執拗に付き纏って何度でもトラブルを起こす理由は、
他人に罵倒される事に歓びを感じる性的倒錯者だからだよ。
0164名無しサンプリング@48kHz
垢版 |
2020/03/27(金) 23:23:32.17ID:8e5QiM1A
a_watcherの事だろ。そいつ基地外だから相手しちゃダメ
どっかでミスを指摘されて精神崩壊してあちこちのスレを荒らし回っているだけ
0168名無しサンプリング@48kHz
垢版 |
2020/03/28(土) 04:55:53.67ID:LSXB/Fat
歌唱のいいところを徹底的に搾り出した結果、
機械に歌なんて必要ないのに、
人間より人間を気持ちよくしてくれるのが機械という世界
0169名無しサンプリング@48kHz
垢版 |
2020/03/28(土) 05:29:27.37ID:Jo/4ualA
これ言うと気分を害する人もいるだろうけどさ、
人工知能よりも機械的な歌い方する商業音楽が
シェアを取りすぎたんだと思うよ。

ボカロが人に近付いてるのではなく、
人がボカロに近付いてしまったんだよ。

そしてそれを聞き慣れているからさ、
慣れてる=ストレスがない、わけでさ、
そのほうが気持ちよくなっちゃうんだよね。

昔のアイドル曲とか聞いたら、
ボカロ世代にはストレスなんじゃないかな。
0170名無しサンプリング@48kHz
垢版 |
2020/03/28(土) 06:32:39.50ID:btGo8mMS
>>117
>商業CDのシングルのカラオケバージョンで差分とってボーカルだけ抽出して使うか?
ボーカルリップですね。実験段階では結構楽しめます。例えば
「アナと雪の女王」から松たか子及びMay J.をそれぞれリップして、「アナと雪の女王」
のカラオケにMixしたら、一緒に歌っているかの様に息もっぴたり作品になりました。

実験で「アナと雪の女王」をAIきりたんに歌わせて「アナと雪の女王」カラオケにMix
したが、当然ながら、原盤権のあるカラオケなので動画投稿はNGです。
かと言って、耳コピしてオーケストラのMIDIデータを作る能力はないです。
ヤマハミュージックデータショップから購入したMIDIデータを元にして、所持している
VSTi用に作り変えてMIDI演奏させたカラオケなら楽して動画投稿できるが、NGかな?
0171名無しサンプリング@48kHz
垢版 |
2020/03/28(土) 08:52:23.29ID:QK7CC4ZB
>>170
ミュージックデータショップの規約を読む
多分黒に近いグレー
0175名無しサンプリング@48kHz
垢版 |
2020/03/28(土) 20:06:16.35ID:Jo/4ualA
AIは著作権料なしで学習し放題
人間はピアノ教室での練習であっても著作権料を払って学習しなきゃいけない

人間の学習は不利すぎる。
0178名無しサンプリング@48kHz
垢版 |
2020/03/29(日) 21:58:13.89ID:s6egSJsz
AIきりたんで音声合成してみたが声の震えとかはかなりしっかり合成によって補完される一方
もとのデータベースにないか、あるいはデータベースの楽譜上はあるけど音声データ見ると声が出てない特定の音階、
特定の発音の声だったりすると、そこは合成されずに音が抜けてしまうな
データベースの曲がほとんどiRisのプリパラの曲でサンプリング音域が狭いから
音域も高いとことか低いところはうまく出てこない

毎日ものすごい勢いで歌わせてみたカバーとかがうpされててもう追い切れてないんだけど
システム的にはまだまだ改良の余地があるんじゃないかな
特定の母音子音での発声で、元データにない特定の音階の音を合成できるようにならないと完成とは言えないんじゃないだろうか
0179名無しサンプリング@48kHz
垢版 |
2020/03/29(日) 22:09:37.07ID:s6egSJsz
多分今のNEUTRINOの仕組みって
元の音源の音を楽譜の音符毎に区切って短音のデータ化し、それをつなぎ合わせた後に
各音のつなぎ方を元の曲と比較して一番それっぽい感じのものにするっていう学習方法なんだろうと推測できるけど
根本的には発音+音階で音を合成(これはボカロ的)してその音の自然さを生の単音発生データと比較する、
そのあとでそれをつなぎ合わせて今と同じように元の曲歌唱データと比較するっていう2段構成での合成にした方が精度がよくなりそう

って誰かAIきりたん作った人にいっといて
0180名無しサンプリング@48kHz
垢版 |
2020/03/29(日) 22:41:23.81ID:aXdlSL9B
>>178
よくわからんけど、
学習させてないものを発揮できないのは、
当たり前の話で、
学習させれればいいだけじゃないかな?

でも、それはNEUTRINO作った人の興味範囲外かもね。
やればできることを実証して見せたので満足してるかも。

今回も自前で学習データを用意したのではなく、
既存のものを流用してるんだしさ。
0181名無しサンプリング@48kHz
垢版 |
2020/03/29(日) 22:44:42.80ID:aXdlSL9B
>>179
なんか良く分からないけど、波形を切り貼りするって考え方してたら、
いつまでたっても前世紀のサンプラーの技術水準から抜け出せないぞ。
0183名無しサンプリング@48kHz
垢版 |
2020/03/30(月) 03:02:02.67ID:XuOU29N5
>>178で問題となるのは
DNNの多次元データ層における、外挿推定の精度低下
(周辺データが希薄な端っこ方向の延長上の推定、たとえば超高音はうまく推定できない)
の問題だろうから、その方向の学習データ(本来は存在しない超高音の学習データ)を増やさないと解決は難しいと思う。

DNN技術のこの問題を端的に示す例の一つは
点が4つしか打たれていない画像を自動車写真と認識してしまうDNN画像認識の問題。1年ほど前にバズっていた

>>179は、AIきりたんの説明としては的外れに見えるけど、DNNの内挿推定をあえてボカロ視点で解釈するとそういう話が出てくるのかなぁ。
0185名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 14:59:09.67ID:ytKI0IJu
1980年代ブーム時の多層パーセプトロン提案とその後1990年代のニューラルネット研究停滞期を知っている人にとっては、2004年DNNアルゴリズムによるブレークスルーと現在のブームは重要な事柄だから
略語の読み方で暴れる知恵遅れは放置だろ
0188名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 17:21:06.31ID:pNtmmrjt
知恵遅れ天羽が平日昼間から専門的説明が判らず発狂とはみっともないね。
還暦近くにもなって専門的説明がある度に発狂して無知を誤魔化す精神病患者
0189名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 17:28:13.04ID:pNtmmrjt
やまがたの@apjの発狂癖は、まともな話を遮って幼稚な嫉妬心を満足させる為のじい行為だからスルー推奨
0190名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 17:33:43.12ID:ytKI0IJu
仮に一番詳しい人が見てたら、>>183を踏まえて>>179をどこかで説明し直す筈だから無問題。
どこかで言及が無ければ>>179はその程度の流すべき話だから無問題。
見えない敵と戦うヒステリーおばさん以外、このスレで詳細説明不可能な空理空論を書く動機が無いから
扱いはとても簡単
0191名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 19:15:57.81ID:iszjIyz7
>>185
むかし課題に対して「ニューラルネットで」と答えるギャグがあったわ。
ゼミ発表で何かツッコミ入れられて答えに困ると「そこはニューラルネットで」といって逃げるの。
あまりに連続して教授がブチきれたこともあった。
0192名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 19:44:29.58ID:pNtmmrjt
それは2004年以降の話だろうな。
前回ブーム末期の90年代初期にニューラルネットの再ハード化をした所を紹介された事があったが
当時は多層ニューロンの可能性が大きな壁にぶち当たって本質的なブレークスルー待ちの状況だったから
そこをクリアせずにハードで高速化だけしても壁は乗り越えられないだろうという諦めムードを感じた
0193名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 21:25:22.63ID:iszjIyz7
>>192
90年代だよ。

自分ところはニューラルネット自体は研究対象ではなく、
他所で研究され確立されるであろう技術として扱ってた。
つまり、
いますぐ自分たちが使えるわけではないと思ってるからこそ、
課題に対して「ニューラルネットで」というのは、
自分のやるべきことじゃないし、ほっといても時間が解決するでしょ、
という態度を取ってることになるので、ギャグになったんだよ。
0194名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 21:34:59.35ID:iszjIyz7
ちなみにニューラルネットは天敵だったんだよね。
今ならニューラルネットを使えば簡単に出来ちゃうことを、
たった数十MHzのCPUと数十MBのメモリのマシンで、
どう実現しようかって何年も研究してたんだからなぁ。
0195名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 22:53:35.92ID:ytKI0IJu
90年代に「ニューラルネット実用化」を前提とした研究って人工知能学会論文集あたりでありそうな話だけど、コアな研究は冬の時代だったから捕らぬ狸の皮算用な感があった

某大手メーカーはLSIハード化、某大手家電メーカーでは多値論理との組合せで家電応用をやっていて、
応用分野は一度勢いがついたらなかなか止まらなくて、その中からブレイクスルーが飛び出る事もあるんだろうけどね。応用の皮を被った基礎研究のような
0197名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 23:25:59.41ID:iszjIyz7
そういやエアコンに「ニューロ自動」ってあったわ。

リモコンの表面には大きなボタン(on/off)が1つだったかな。
他のボタンは折りたたみを開いた内部に隠されてたんだけど、
ニューロ自動を使わないと頻繁に開閉を繰り返すことになって、
早々にフィルム基板が破断して故障するという。
0198名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 23:27:49.25ID:iszjIyz7
>>196
既視感?
複数箇所で見かけるのは普通だろ?
日本のあちこちで同時並行に見られた光景だろうからね。
だいたいみんな、考えることは一緒だからね。
0199名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 23:30:39.69ID:pNtmmrjt
完全にスレ違いだな
スレの縛りを無視しないと
目の前のお題に沿った書き込みが出来ない人は
書き込むべきじゃないよ。

スレのテーマはNEUTRINOだから
自分の知ってるニューラルネット小話を延々と書くスレ違いの人は退場
0200名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 23:32:29.07ID:pNtmmrjt
ID:iszjIyz7は中身のない書き込みを延々とする方の荒らし係だね。198にまでレスを付ける無分別さに爆笑した
0201名無しサンプリング@48kHz
垢版 |
2020/03/31(火) 23:35:28.45ID:pNtmmrjt
まあ197の書き込みで、話題がどんどんズレてく統失だって判定したわ。まともな人間なら二行目で話をすり替えない
0204名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 00:09:27.23ID:fYLuETUR
>>202>>203
はいサヨナラ。

>>179については、>>183に書いたように趣旨が今ひとつ理解しにくいので
もし本気で書いたのなら説明しといてくださいw
0205名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 00:13:43.94ID:t82+SBkc
NEUTRINOの話をしろよ。

スレチとか言ってるけど、
お前らだってNEUTRINOの話をしてねーじゃねーか。

そういう自治厨もまた荒らしなんだよ。
0206名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 00:17:16.79ID:ZRlBwJyP
ちょっとマジレスするとすぐ書き込みが止まったり
話題逸らしが始まるみっともない成りすましだったね

大した事を書けないのにやたら勿体ぶって、やれスレが荒らされたのスレが終わっただの言い出すチキンな芸風は、通用しないからこれっきりにしてね。
0208名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 02:12:30.77ID:ZRlBwJyP
自らの欠点を指摘されると、それは自分ではなく脳内妄想敵a_watcherの欠点だと言い換える幼稚な癖のある天羽は満53歳の幼児
0210名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 02:18:04.35ID:fYLuETUR
20年間も30年間もこの手の下らない言い争いを続けてきた天羽が、すっかり精神荒廃して誰にも相手にされなくなり若年性認知症になったのも当然だな。

馬鹿馬鹿しいから繰り言の続きは、精神病院でやってくれ
0212名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 04:07:37.92ID:BS41olla
>>205
お前はマジモンを知らないからそういうことが言えるのよ
糖質とかキチガイに目をつけられたスレはそいつが居なくなるか崩壊するかのどっちかだから
0213名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 04:12:37.43ID:z+UZ5upi
それは過疎スレだから。
本来の話題の流速が速ければ荒らしは追いつけないんだよ。
0214名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 04:12:42.55ID:66vZOc7b
公開前(開発中)の段階である2019年12月時点で、SHACHI氏がTwitter上で歌声合成手法に関する「能勢隆」(東北大学准教授)氏からの質問に回答したことがある。ぐらいか。内部構造について明らかにされたのは。
0215名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 04:14:17.31ID:66vZOc7b
Acoustic NNはAR付きのFFNNをResidualで繋いだ構成で、過去200 frameの対数基本周波数・メルケプ(0次)、過去20 frameのメルケプ(1~60次)・非周期性指標・有声/無声をARしています。
0216名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 04:14:48.34ID:66vZOc7b
NN Vocoderはh-sinc-NSFがベースで、入力をWORLDの基本周波数・メルケプ・非周期性指標、出力を24kHzに変更しています。学習率も段階的に下げるようにしています。
0217名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 04:15:22.71ID:66vZOc7b
継続長に関しては20曲では推定が難しい部分があるため一部修正を加えています。(母音脱落など)
フルセットの50曲での学習である程度改善されることを期待しています。
0218名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 05:59:12.32ID:TIXB7mhq
>>214-217
分かる人には分かる、門外漢には分からん、
細かい工夫がいろいろあるんだろうけども、

それにしたって、
https://www.youtube.com/watch?v=4yfBWiExuZw
こんなの聞いたら、みんな絶望して吹っ飛ぶ。
オリジナルの曲を聴いたことない人に、
事前情報ゼロで聞かせたら、まず気が付かんぞ。
0222名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 14:23:21.74ID:5PMsVjkD
>>218
DTM板はここ2〜3年極端に過疎っていて
たまにまともな話が出てレスが付いても
板荒らし天羽の大量荒らし書き込みで
レスが埋れてしまうので
掲示板として使うのは難しいと思いますが
ご健闘をお祈りします
0224名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 19:22:41.95ID:jV4j/tU+
かといって気軽に話せるコミュニティってないよなー
製品のフォーラムはテーマが限定的だったり登録あったりで面倒だし
0225名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 19:27:06.61ID:0FGI+EqU
専門性の高い話題ほど匿名で話すメリットが無いからな
専門板が軒並過疎ってるのはそういう事
0226名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 20:09:52.37ID:YkVuzUPB
コミュニケーション/議論プラットフォームの選択は
何を目的にどの層に働きかけ何を成果と見なすか
によってシビアな選択が必要だと思います。

元々ここ2ch改め5chは、何か有意義な議論をして成果を出す場所ではなく、
表舞台で有意義な事をやっている堅実な人に匿名で嫌がらせをして、無能者なりのマウント欲充足を第一とする某氏のような性格破綻者の為の場所です。

かつてその場所で勢いをつけてプロジェクトを立ち上げ、それなりの成果を収めた例もあるのは事実ですが
それは匿名掲示板に普通の人々が大量に集まっていた隆盛期特有の現象でしょう。
10年ほど前から(たとえばボカロ2ブーム以降)、ネットメディアの多様化で匿名掲示板は時代遅れとなり、
他所に実体のあるプロジェクトやコミュニティの盛況が匿名掲示板に飛び火して書き込みが増え、情報交換が行われているだけで
何かを立ち上げ皆で盛り上げるかつてのニコニコ動画のような場所としてはもう機能していないように思います。

それではどのメディアなら気楽に雑談できるのか?
それは難しい問題ですね。
0227名無しサンプリング@48kHz
垢版 |
2020/04/01(水) 21:32:32.29ID:TIXB7mhq
かつてニコ動が熱かったのは、
高いスキルあるのに不景気で仕事なくて暇な人が大量に出て、
その人たちがコンテンツを作ってたからなんじゃないかなー。
0229名無しサンプリング@48kHz
垢版 |
2020/04/03(金) 02:50:35.31ID:TaGMnYa/
それこそ気軽に話せるのはニコ百の掲示板くらいか
とはいえあそこもID固定にはなるが
0231名無しサンプリング@48kHz
垢版 |
2020/04/04(土) 00:58:59.07ID:AeB4fC0f
まあ敗北主義者は放置するとして。

このスレで多少なりとも空気入った感じがするのは事実だよ。
ここ12年ほど例の頭のおかしなひとが始終つきまとって議論妨害ばかり仕掛けてきて
西村式匿名掲示板に対する偏見が激化してたけど
自分の偏見が自分の世界を狭めるのは当たり前のことで
そーゆー病んだひとを助けてあげたいという気持ちは断ち切ってそろそろ次かな
0233名無しサンプリング@48kHz
垢版 |
2020/04/12(日) 00:15:29.33ID:LfQOAfV5
NSFいいな!ピッチいじれないのが難点だが、そこはVariAudioなりMelodyneなりV-Vocalなりで整えればかなりいい感じになる。
0240名無しサンプリング@48kHz
垢版 |
2020/05/06(水) 12:33:40.10ID:M3WEd/Oq
>>183
1ヶ月ぐらいみてなかったけどおおまかにいうとこういうことだと思っている



入力:楽譜+楽譜から合成された波形データ
学習ネットワーク:順伝播型ニューラルネットワーク(回帰有り)
教師データ:きりたんデータベースの楽譜+歌唱音声データ

波形データ = 元の音源の音を楽譜の音符毎に区切って短音のデータ化し、それをつなぎ合わせたもの
学習 = 各音のつなぎ方を元の曲(教師データ、、きりたんデータベース)と比較して一番それっぽい感じのものにする

>>179で書いた内容

入力1:楽譜+楽譜から合成された波形データ
学習ネットワーク1:何か
教師データ1:声優が発生した短音ボイスデータ

まず短音の声優の合成ボイスを作成する。やり方は基本はボカロとかボイスロイドと同じ
次に

入力2:楽譜+1で作った音声データをつないだ合成波形データ
学習ネットワーク2:今と同じ
教師データ2:きりたんデータベースの楽譜+歌唱音声データ

で楽曲音声データにする
短音の教師データ(母音+子音+音階で声優の声をサンプリングしたもの)を用意して1音1音を先に声優の声に変換
(このとき教師データに高低音を用意しておくことで音の脱落問題を事前にある程度なくす)
その後データベースの楽曲データを用いて歌として成立するように波形合成する
これを再帰型で行う方が精度があがるのでは?ということ
0241名無しサンプリング@48kHz
垢版 |
2020/05/06(水) 22:40:57.53ID:4GmqcRRj
皆が疑問に感じている事柄
「AIきりたん他NEUTRINOの合成方式は
WaveNetのようなニューラルネット中間層の高次元データにおける内挿推定ではなく
>>179が言うようなボカロのような素片接続合成なのか?その根拠はどこにあるのか?」

>>240は上記の疑問に全く答えていない。
0242名無しサンプリング@48kHz
垢版 |
2020/05/06(水) 22:52:18.86ID:GrwXe3KS
誰かのなりすましをしたい人が居て
でも能力不足で全然似てない上に
頭が悪くて説明が稚拙で要領を得ない
いつもの人でしょ。

なりすましのモデルらしい本人と直接話せば済む話を
なぜ匿名掲示板でイタコ芸したがるのか
頭の悪い人の行動は意味不明でござる
0243名無しサンプリング@48kHz
垢版 |
2020/05/07(木) 02:54:17.03ID:QmrnbdOW
根拠は>>214-217に書かれてるね

NEUTRINOの歌声合成部が次の2つからなるとして
S: 短音の波形合成
C: 短音(S)をつなぎ合わせる歌声合成

FFNN ARによる合成・比較・修正は
・現状では 上記SとCの結果全体に対して行われると推定されていて、それを関数的に表記すると:
 AR(C(S))   [Sの結果からCを計算しAR処理]

・改善案は S単体のAR処理も追加する事で精度が上がるという話で、それを関数的に表記すると:
 AR( C( AR(S) ) ) [SをAR処理し、その中間的結果からCを計算しAR処理]

AR処理を二段階に分ける事で、(教師信号に推定値を近付ける)最適化処理の自由度が上がり精度向上が期待されるのは判る。
ところで「再帰型で行う」(>>240)とは言うものの、CのAR処理各ループの度に、その内側でSのAR処理を再計算する必要はあるのかな?
平たく言うと、つなぎ方に関する最適化ループで、短音の波形がおかしいからうまくつながらないんだから直せ、という処理はあり得るのかな?
0244名無しサンプリング@48kHz
垢版 |
2020/05/07(木) 10:34:32.00ID:1BB91mZj
>>243
明確に二段階に処理を分けた場合、二段目の結果をもって一段目の答えを変えるのはありえないんだろうけど
現実に歌の連続音として発声された個別の短音の波形はある程度崩れる方が自然なんじゃないのかな
これもボカロみたいな話になるけど、二段階目でどうしても教師データに近づかない(不自然さが残るレベルの)とき
その誤差をもって1段階目の計算に補正を入れる必要はあると思う
普通に計算量が乗算になるからそのときの誤差の損失関数の出し方は多分工夫がいるけど
0245名無しサンプリング@48kHz
垢版 |
2020/05/07(木) 13:33:45.81ID:XQACgQtU
人間の場合も、歌い方だけを工夫してもうまく繋がらない/うまく模倣できない/(直接的な教師信号無しのより広い評価基準で)より良い表現ができないから、発音を変えて工夫するってのはあるよね。
Sauthern All Starsの英語風巻き舌日本語ロックとか、Brayan Ferryのスノッブな難解発音による繊細な表現とか。

他方、最適化を明確に二段階に分割すると
一見、自由度が増えたようでありながら
実際は、二段階分割による制約が入って最適化が上手くいかない=局所最適解に陥ってグローバル最適解に辿りつかない、ってな話もあるよね。
 (たとえば経路探索で正方形の対角線が距離最小の正解である場合に、問題を直交座標的な縦軸と横軸に二分割してしまうと、いくら計算パワーをかけて最適解を探しても縦横縦横のギザギザ線にしかならず距離は一向に減らない)

問題分割を誤ると正解にも最適解にも辿りつかない。
分割の仕方は難題だから、可能なら分割せずに一体型の問題として記述して、最急降下法(Numerical Recipes)でグローバル最適解を探すのが、NNの基本戦略だったような。

歌声模倣問題を「短音合成」と「つなぎ方」試行錯誤の二段階に分割記述しないといけないように見える理由は何なのだろうね。
もちろん、現時点ではそれが一番わかり易く実装しやすいからそれで進めるのが妥当、という事なのかもしれないけど
0246名無しサンプリング@48kHz
垢版 |
2020/05/07(木) 14:22:34.44ID:XQACgQtU
まあDNNの基本戦略は定石に過ぎなくて
今回のは分けるのが自然なのかな。

短音合成に関して、声優の発音と音声合成器の発音は基本的に別物だから、直接比較はできなくて何らかの特徴量(Worldの特徴量)を指標に模倣する必要がある。
歌声合成(つなぎ方)に関しては、その延長線上で新たな特徴量も追加されるのかな。

たぶん基本的に短音合成と歌声合成は別物だけど、その両者が相互干渉して互いに微調整が必要になる領域では、両者を一気通貫で一体として扱う統一記述モデルをでっち上げる必要があるのかなw
(シュトックハウゼンがセリー音楽でリズムを高速再生し発振音に変えて、両者の統一性を解き明かそうとしたような話)
現状では、両者を対等に連続性を持って扱う統一モデルが無いから、どちらが外側ループでどちらが内側ループとすべきかみたいな病んだ話(>>243)になってしまうw

まあ音色(短音、ミクロ領域)と音楽(つなぎ方、マクロ領域)の統一記述モデルなんてのは、現状には到達しようの無い彼岸の存在のような気もするけど。
物性物理だと、ミクロとマクロの両者が関わる領域を「メゾスコピック領域」としてモデル化する試みがあった。
0247名無しサンプリング@48kHz
垢版 |
2020/05/07(木) 21:28:43.63ID:9yzll2y2
真面目に追いかけてもいない話について
無理に何かを書くよりも
「マジで全然知らん」と書いておくのが正解みたいね
0248名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 12:44:07.60ID:M8pPdbTM
AIきりたんでHIMEHANAのうたかたよいかないでを歌ってもらいました。
個人的に、AIなのに「感情表現」が少しはうまくいったと思って、
なぜ上手くいったのか情報交換したいです。
https://www.youtube.com/watch?v=wnp0MAfz6zo

音符は長さ調整だけなのでお話ししたいのは、
FormantShiftが感情表現に与える影響です。
この歌の設定はFormantShift=0.98 にしました。
自分の好みの声はFormantShift=0.975なのですが、
FormantShift=0.979と0.98の間に 「幼さ」と「幼くない」差があり、
「この曲には0.98が適している」と感じました。
「0.979では感情的に聞こえない」と思いました。
0.98だと高域が強いから感情が乗るのか、
それとも曲に対するフォルマントの高さで感情を感じるという事でしょうか?
ご存じの方宜しければ教えて下さい。宜しくお願い致します。
0249名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 12:52:04.21ID:q5PbdaEo
FormantShift=0.979と0.98の間に 「幼さ」と「幼くない」差があり
そこは個人の認識よって誤差があるからね
別の方は0.978と0.981かもしれない

そこで逆転の発想が必要になるんですよ、続き聞きたいですか?
0250名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:00:17.35ID:q5PbdaEo
宇宙真理として、全ての答えは非常にシンプルなんですよ

小数点が入るわけがない、本当は世界は、ね(倒置法

1 にしてください

こだわりを捨ててください

凛として 整数世界 凛として 割きれる世界 凛として シャムール

黄金比率ですよ

それが全ての答えなんです

よーく物事の本質と向き合ってください

頭で考えてはダメ
0251名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:01:39.25ID:q5PbdaEo
凛として感じてください

凛としてキリタンポ

チュパチュパチュパチュパ

ほんのりと答えが見えてきたよね
0252名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:04:03.54ID:q5PbdaEo
世界中全てがひとつになって繋がっているという事

予定調和を信じて?

1が答えになる

私達は未来からきているから”最初から知っていた”というわけなの
0253名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:04:36.51ID:q5PbdaEo
>>248
あなた...人生に疲れてない?
0254名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:05:16.24ID:q5PbdaEo
相談に乗るわよ
0255名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:10:03.75ID:M64o8Hmy
>>248
ここまで自然に聞こえるなんて凄いですね。これはNSFですか?
自分はこれから導入しようと思っているところなので参考になります。
0256名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:13:23.10ID:e1knZ+n4
キリタンってデータ投げれば自動でやってくれるんじゃないの?w
細かくやりたければボカロ買ってエディットからやればいいと思うが
0257名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:13:34.94ID:M8pPdbTM
すみません、q5PbdaEoさんが優しい方だという事は分かったのですが、
何をおっしゃっているのか私の頭では理解が出来ません。
しかし何となくわかる気がします。すみません、どなたか翻訳をお願いします!
0260名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:20:37.46ID:q5PbdaEo
NEO相対性理論

私達は皆隣り合わせなんですよ

今は分からなくてもいい

未確認飛行物体がやっと認知された時代ですからね
0261名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:22:12.10ID:q5PbdaEo
ヒントは量子力学です

芸術家の異常性と物理学の関係

ちょっとフライングしまったわね
0262名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:23:00.44ID:q5PbdaEo
文章の抜け字を繋いでごらんなさい、私に言えるのはここまでよ・・・
0264名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 13:24:51.55ID:M8pPdbTM
>>255
ありがとうございます!
この曲の場合はNSFです。
WORLDも試したのですが、
NSFの方が歌に抑揚が生まれ、より人間らしいと感じました。
曲によって早口で音程の正確さが求められる場合や、
感情的な表現が不要な場合、冷淡に聞こえさせたい場合
私はWORLDが向いていると感じました!

音符はネットの情報を参考にして、
長さ、ひらがな調整を行いましたが、
個人的にはFormantShiftをかなりシビアに設定しました。
そのあたりの情報がなく、好みかと思っていたのですが、
「自分の好みではなく」というところがポイントでした。
0.979、0.98、0.981を聴き比べて、
この曲のメロディでより感情的に聞こえる0.98を選択しました。
そのあたり、難しく原理が良く分からないので
知りたいと思った次第です!
0265名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 15:32:29.12ID:G5cT3Xgy
また統失婆の自演連投かよ

こいつ専門スレに書き込みがある度に
どうでもいい妄想を大量連投する真性のゴミクズだな
0267名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 15:50:17.87ID:ClsaX3dk
てやんでぇ〜の江戸っ子精神論オバちゃんです、理論スレにもいるよ
独身で寂しいんやろな
0268名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 16:00:22.61ID:5wLPNwTF
SNSで反応ないとこっちで欲求不満爆発させる人いる...ネット世界の闇よな
下ネタスパムしてたのもこいつじゃね?...ドブス臭w
0269名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 17:04:15.27ID:G5cT3Xgy
統失婆が専門スレを妄想同期反復で埋め立てる理由は
学習障害で他人の話が全く理解できない、という致命的障害と向き合う事ができないからだろうね。
判らない話があると、幼稚な質問攻めや統失ズレズレ質問の飽和攻撃で回答できないと決め付けたり
未研究領域の未科学ですらニセ科学だと決め付ける癖も全く同じ理由。

統失婆の盟友キクマコをサイバーメディアセンターの閑職に取り立てた元阪大学長氏も言及した未科学問題に対してですら、統失婆はニセ科学だと決め付け、
筋が悪いと気付くと早大名誉教授大槻義彦氏をミスリードして、誤ったニセ科学叩きの犯人は大槻氏であるかのような虚言を重ねていた。
0272名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 17:32:42.16ID:dcMvUxwb
>>249
こういうのを見るとなんだかなぁ、っていつも思ってしまう
あらかじめ設定されたプリパラメータ弄るだけで「幼くなる」「大人になる」
その数字で興奮してる人って・・・音作りとは無縁そうやね

どの帯域と、ピッチ弄ると幼くなるとか、そういう基本から勉強した方がいいですよ
おちょくられるのも何かわかる気が・・・
0273名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 17:33:58.53ID:RUzhqb/o
ここのスレ主だか一番詳しいひとの基本ポリシーは
無知を知ったかぶりで誤魔化さず、自身の無知と良い意味で謙虚に向き合って何かを掴んで
さっさと這い上がって来て歌声音源作りを一緒に楽しもう、というスタンスに見えるね。
それは言葉を換えれば、ソクラテス的な無知の知の認識こそ(個人もしくは人類にとっての)新しい発見のきっかけだという話なのかもしれない。

妄想連投のひとはそれが著しく苦手なのだろう
0274名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 17:36:10.94ID:jEAB7ICV
>>264
これな~長いわりに全く意味が無い(・ω・)
新しいソフトに触れたゲーマーみたい
0275名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 17:37:47.43ID:tmh+Rk5L
ニュートロンの三種類の機能を得意げに語ってるみたいな(ID変え忘れ
0276名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 17:39:59.35ID:RUzhqb/o
顔文字NG推奨

統失婆の三大荒らしツール
・際限のない妄想連投/意味のない質問連投
・顔文字
・AA貼り
0277名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 17:40:15.72ID:tmh+Rk5L
ここはそういう場所、なんか賢そうに語ってるやつは瞬殺で見抜かれる

地頭も偏差値も低い沼は本当の沼に落とされる場所、つーか入り口だな
0279名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 17:41:34.97ID:RUzhqb/o
↑こいつも統失婆の同類

どう這い上がるかではなく
どう足を引っ張り全体レベルを低下させるか
の話しかできない負け犬
0280名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 17:42:57.95ID:tmh+Rk5L
そう?ヒント書いてあげたけどな?お前らロリ声作ってシコしたいんだろ?キモオタの変態諸君
0282名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 17:45:44.01ID:tmh+Rk5L
こういうのって商用というより、オタクの自己満のおもちゃなんじゃ?
動画公開すればキモいファンが付くんだろうけどなぁ

商用転用もありなのかな?本当の音楽やってるやつは一応、区別すると思うよ
ボカロから音を作りこむわけでもない、プリセットの塊みたいなものの
『オッパイスライダー』弄って興奮してんだろ?
0283名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 17:46:59.59ID:tmh+Rk5L
まぁ、どうでもいいけどさぁ
0284名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:24:23.25ID:tmh+Rk5L
もしかして滅茶苦茶怒ってる?wちょっと感想を書いておくよ
0285名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:25:10.75ID:tmh+Rk5L
オッパイスライダーで沈黙しちゃうからなぁ、本当にそっちの人かなぁと思ってしまったよ
原曲を知らなかったんだけど、さきほど聞かせてもらいました
0286名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:27:04.43ID:tmh+Rk5L
原曲が脂っこい肉だとしたら、とてもくさみが抜けてね、AIの方がいいんじゃないか?と思ったの
0.50あたりでちょっと気になるところもあった、このaiffをネクターやメロディオンに通して補正して
抑揚をつけてみると、もう少しよくなるかもしれない
0287名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:28:42.47ID:tmh+Rk5L
2.15秒当たり、この辺はAIとは思えない良さが出ている、途中で一か所ぶつりと切れてますよね
完璧な作品にするのであればちゃんとチェックしたほうがいいと思いますよ
0288名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:29:56.56ID:tmh+Rk5L
まぁ、私としてはね、AIがどうじゃなくて、曲ね?こういう曲ノータッチだったからとても勉強になります
これからアナリーゼしていきたいと思います
0289名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:31:09.41ID:tmh+Rk5L
ビックリしただろ?このまま「勝ち逃げ」すると思ったか?ババァ

残念だったなぁ
0290名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:33:06.57ID:tmh+Rk5L
俺は「基本的」にいい人だって事、よく覚えておけ
0291名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:47:13.29ID:tmh+Rk5L
いいか?お前たち、貴様らは何と戦わねばならないのか?何のために音楽をやっているのか?
目先の餌に誘導されてはいけない
そして選曲と歌詞、響くものがあったからこれを選んだはずだと「信じたい」
ここで、いやらしい商業的な淀みがあったとき、純粋な心は消えてしまうと思う

いずれ、「このような曲」を作る立場になりたいと思っているはず
ピュアな初心「だけ」は忘れてはいけない
しかし同時にズルはよくない、受け身のお客様では成長しない

入り口としてAIを使って音楽を作る、どのような逆風が来るのか?予想した上だったと思う
狂ったような口撃を見た時、私は前世を思い出してしまった...
その上で、少しだけ「名も無き援護射撃」をして差し上げたまでの事、礼には及ばず

君達が抱える悩みと、想いはシカと受け取った
0293名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:48:34.16ID:tmh+Rk5L
あの方に届け、私の音楽活動の糧とさせてもらう

ありがとう、養分達
0295名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:52:26.41ID:tmh+Rk5L
連投と言うか、スッキリしないんでねぇ、こういうのが尾をひくと私の活動に影響を与えてしまう
わたしは「敏感」なんでね、作曲中敏感モードになると「霊的」に全てを受信してしまうから大変なんだよ

>>292
悪態をつくのも許して差し上げよう、私は寛容だからな(植物ではない
いや、そうありたいと思っているのか・・・これも哲学かもしれない
悩ましいよね(自問自答)

言いたいことは言ったし「出したウンコ」は”ある程度”ふき取った感じがするんで失礼するよ
今夜はカレーなんでね
0296名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:53:07.46ID:HShxECFn
サ ンポールツルツルミクたん博士が暴れててワロタ
0297名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:53:14.13ID:tmh+Rk5L
ガイアが俺にレスしろって言ってるんだよ、黒塗りの乗用車がお前の「

続きが出てこないんでね、本当に失礼するよ
0298名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 18:59:08.67ID:M64o8Hmy
>>274
なんか変な連中が何匹も湧いてますが・・・

今まで聴いてきたNEUTRINOの曲の中ではピカイチの出来だと思いますよ。
自分のPCのGPUはAMDなので、NSFを使おうとしたらオンライン版を使うしかないのと、出力が24kHzというのが
若干気にはなるところかな。
支援ツールとかは使ってます?
0300名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 19:01:33.02ID:tmh+Rk5L
>>274
も俺だよ
0301名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 19:02:11.45ID:tmh+Rk5L
俺様の多重人格演技もなかなかじゃのぉ、ほんじゃ本当にさよならだ
0302名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 19:02:33.60ID:RUzhqb/o
キチガイメンヘラおばさんはID変えては即レスするから誰の目にも自演がバレてしまう
0303名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 19:03:58.18ID:QsSRJaBs
いやいや、分からなったじゃん、前から気になってたんだけど優子って誰?ググったら出てきたけどさぁ
俺は男だけどな

俺様の多重人格演技もなかなかじゃのぉ、ほんじゃ本当にさよならだ
0305名無しサンプリング@48kHz
垢版 |
2020/05/09(土) 20:42:09.68ID:7jNIJkoM
11年前に訴訟相手と実験講義学生と同僚その他を混同して誤爆ハラスメント事件を起こした天羽優子の
反社会性人格障害が炸裂中
0308名無しサンプリング@48kHz
垢版 |
2020/05/13(水) 03:04:00.24ID:kF4Xt+w0
使ってみたらボカロより楽だった
@平仮名入力
A楽譜
無料!!
https://youtu.be/_pXxiglKaKY
0309名無しサンプリング@48kHz
垢版 |
2020/05/15(金) 19:50:53.68ID:jbJ2amHV
NSFで出力しましたが、同じフレーズでも歌い方に違いがでるものなのでしょうか。
「あっという間」の「あ」音が、最初の部分と繰り返しで微妙に違う感じです。
気のせいなのか、そういうものなのか・・・気になります。
https://youtu.be/yq6zHexmB10
0310名無しサンプリング@48kHz
垢版 |
2020/06/05(金) 07:26:36.38ID:gLpwACqU
>>309
GJ!

中身がどういう作りになってるのか知らないので一般論で言うと、
前後の歌詞から発音のしかたを選んでいるのだと思うので、
同じフレーズでも出現位置によって発音が変わるかもしれない。
それとは別に、常に同じ発音をすると不気味さが出てくるので、
わざと発音に「揺らぎ」を与えているかもしれない。
0311名無しサンプリング@48kHz
垢版 |
2020/06/05(金) 08:00:49.90ID:gLpwACqU
NEUTRINOの本当のスゴさは、
きりたんではなく謡子さんでこそ分かると思う。

YouTubeで見かけたこれとか
https://www.youtube.com/watch?v=8M8Kb9bZVqw
びっくりするよね。

きりたんの中の人は声優さんであって歌手ではないので、
AIに学習させる音声としては難易度が高い気がするなぁ。

UTAU用の音声素片をFFT解析にかけて見たんだけど、
歌手の人の音声とは、だいぶ様子が違うんだよね。
NEUTRINO作った人は頑張ったんじゃないかなぁ。

ちらりちらりと不自然さが残るほうが好かれる理由もわかるけどね。
0314名無しサンプリング@48kHz
垢版 |
2020/06/24(水) 05:00:32.34ID:bx2pT4K2
技術的なことは詳しくないんだが、50曲学習でこんなに自然に歌えるの?
死んだ歌手を呼び寄せられそう
0315名無しサンプリング@48kHz
垢版 |
2020/06/24(水) 07:25:12.09ID:Z3fzUoHv
その50曲の音符全部に音素とタイムコードをつけていかなくちゃならんのだぞ
AIきりたんは学生10人ほど使って3ヶ月かかったって言ってたな
0316名無しサンプリング@48kHz
垢版 |
2020/06/24(水) 11:13:29.71ID:aY+LOeGq
Mさんところは学生1名×3ヶ月でしょ。
AIきりたんが学生10名雇ってタグ付けし直したとは初めて聞いた
0318名無しサンプリング@48kHz
垢版 |
2020/06/26(金) 08:38:12.10ID:70cto9g9
>>314
人間の聴覚や脳の認識能力って、
都合よく解釈する機能が強力だから、
いくつかの要点さえ合ってれば、
他のところは合ってなくても分かりにくいのだと思う。
0319名無しサンプリング@48kHz
垢版 |
2020/06/26(金) 08:45:13.97ID:70cto9g9
>>315
そこで今ホットなend-to-end音声合成ですよ。

日本語の50音は量子化しすぎかもしれないし、
音と音の区切りを適切に線引きするのは難しいだろうから、
AIに間違いを教えた結果として、
不自然な出力になってる可能性が考えられるので、
人間がラベリングしないほうが有利な気がするんだよね。
0320名無しサンプリング@48kHz
垢版 |
2020/06/26(金) 08:58:50.63ID:70cto9g9
いちおう言っとくと、
学習用の音声に添付されたラベルをNEUTRINOが使ってるかどうかは、
俺は知らないよ。
なんとなく予想としては使ってないと思うんだよねぇ。
0321名無しサンプリング@48kHz
垢版 |
2020/06/26(金) 09:17:53.69ID:70cto9g9
>>317
男声の実現は大変なんじゃないかなぁ。
低い音は不確定性原理に阻まれて学習できなさそうだもの。
0325名無しサンプリング@48kHz
垢版 |
2020/06/26(金) 20:44:28.54ID:70cto9g9
>>322
量子力学は知らないけど、数学的には同じ現象らしいね。
C4=262Hzでもモヤモヤするし、F3=175Hzは雲を掴むような感じだよ。
0327名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 06:00:48.10ID:U+XZzMgT
久しぶりにニコニ動画に行って、今更AIきりたんを知ったのですが、マジ人間にしか聞こえない。
もう、機械音が残るボーカロイドは消えていくと思った次第です。

国産スパコン「富岳」が9年ぶりに世界ランキング1位になったし、技術の発展って凄いね!
0328名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 09:31:25.09ID:dSVf0pr0
この手の研究って、電話の業界で、けっこう力を入れて行われてきたけど、
別業界で、新しい人たちがゼロから車輪の再発明したのが良かったのかも。

電話の業界だと、同じ学会に属して論文発表してたわけだから、
大学やメーカーが違っても、合成された音声が似通ってたんだよね。
帯域幅が限られていてCELPで無理やり圧縮される国際電話や携帯電話の
音声をターゲットにしていたので、まずCELPありきだったろうし、
比較や追試が可能なように皆おなじATRの音声データベースを使ってたような。
0329名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 09:41:16.24ID:dSVf0pr0
音程が狂ってたり、妙な変調かかったロボットっぽい声になる原因を、
AIきりたんは回避してるというか、同じ轍を踏んでないんじゃないかなー。

ちなみに、AIでなくても、Synth-Vもクリーンな音声だよね。
たとえば、
https://www.youtube.com/watch?v=bH5nSGYGnzU
これとか。
0330名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 10:57:32.42ID:y0w2pQhx
>>329
おおっ! これもまるで人が歌っているようだ。
もともと、ミクを筆頭として機械音が歌うのは苦手だったんだ。
これからはいい時代になると感じた。
0331名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 12:09:21.13ID:prvvVBxm
VocaloidでもLily V3やMACHAは割と自然な声なんだけどな。ミクを基準にするとVocaloidを誤解する。
0332名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 12:15:50.82ID:/E2HxfUi
ミクはエフェクターでわざと機械音にするPがいるだけで
地声は機械音じゃないだろ。
0333名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 13:09:24.67ID:N6AW+cmo
>>328
確かに。

日本では1940年代から世界トップレベルの音声分析研究成果が出て、関連分野に大量の人的リソースが投入されて来たのに
隣接分野の楽音合成を含む電子音楽分野では長年、科学や工学として学術的研究を行う拠点がほぼ皆無で
芸大や音大か海外研究拠点に留学するしか道が無かった。

だから潜在的にその分野に興味を持ちながら、他の分野に行った人が、大量に掘り起こされているのでしょうね
0334名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 13:18:55.19ID:N6AW+cmo
楽音合成分野で、倍音加算合成とフィルタによる減算合成を商業的に成功させたローレンス・ハモンドも
コンピュータによる音楽作成と楽音合成の基礎を築き大きく発展させたマックスVマシューズも
二人とも楽器は弾けず、音楽の伝統的教育訓練も受けていないまっさらのビジネスマン/研究者だったから
車輪の再発明に見える事にも臆さずチャレンジして成果を上げたのかもしれないね
0335名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 18:25:49.87ID:nNVfh5C8
V5の付属ライブラリとか色々な要素が合わさって言わないとバレないだろうなと思う日がある
まああいつら完成度低くて破綻させないのが難しすぎるんだけど
0336名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 20:14:51.33ID:dSVf0pr0
初代ボカロが商品化されるよりも前に、
電話系メーカーのテキスト読み上げソフトに、
おまけで歌声合成機能がついていた。

童謡を歌わせるデモンストレーションやっていて、
初代ボカロよりも格段に性能は良さそうだったが、
アナウンサーの声質で、しかも童謡だったのがなぁ。

いまでも、
AIきりたんは注目されるけどAI謡子はスルーされがちだよね。
0337名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 20:45:25.46ID:dSVf0pr0
>>333
基本的には同じ技術だからこそ、学生や研究者は、
莫大な売り上げから豊富な研究開発費がある電話の
業界に行ったのでしょう。

>>332
鼻声的な声優ボイスがベースだということを差し引いても、
なんかロボット風味の妙な変調かかった音してたような。
ネットで出回ってる作例しか聞いてないから違うかもだが。
0338名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 20:53:50.29ID:dSVf0pr0
>>334
むかしは音楽業界の人たちとは文化が違いすぎて、
テクニカルタームや常識が違ったのも懐かしい話だ。

いまは通じるようになったというか、
音楽業界の常識が、こっちに合わせてきたけど、
昔はフルスケールを0dBとして負の値で言うと怒られた。
彼らは最小可聴音を0dBとして正の値で言う文化だったから。
0339名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 21:12:48.53ID:dwIGYARt
謡子さんはSinsyの頃からすでに優秀だったから、AI謡子として登場してもそれほど
進化やインパクトを感じないんだよね〜♪

【Sinsy】 マグノリア 【UTAU曲カバー】
https://www.nicovideo.jp/watch/sm12331076

【Sinsy】 右廻りの世界 【UTAU曲カバー】
https://www.nicovideo.jp/watch/sm19361850

【猫村いろは・謡子(Sinsy)】 君の銀の庭(アカペラVer.) 【カバー】
https://www.nicovideo.jp/watch/sm24572001
0340名無しサンプリング@48kHz
垢版 |
2020/06/29(月) 22:28:31.35ID:N6AW+cmo
>>336
NECあたりですかね。
NECは嵯峨山先生が1977年発表した複合正弦波モデリング(CSM: Composite Sinusoidal Modeling; LPCボコーダーのPARCOR+加算合成版相当、海外のsinusoidal synthesisとパラレル)の共同開発でLSIを作って
歌う六本木パソコンことNEC PC-6601SRに搭載した歴史があるから、YAMAHA CX5搭載のCSM歌声合成、WonderhornのNTT(旧武蔵野研?)と並んで歌声合成の歴史を背負っている感があります。
0341名無しサンプリング@48kHz
垢版 |
2020/06/30(火) 00:01:21.15ID:RB3seA4d
>>340
当時の旧電々ファミリーのメーカー各社が音声合成ソフトを作ってたと思います。
私が見たのはWindows95時代のアプリで、研究発表ではなく市販品の販促でした。

本来の機能であるテキスト読み上げよりも、童謡の歌唱のほうが上手に聞こえました。
テキスト読み上げは、文章だけから合成しなきゃいけないけれども、
歌唱のほうは、音程も与えられているので有利だったのかもしれません。

テキスト読み上げの不自然さは目だって客引きにならないけれど、
歌唱は不自然さが目立ちにくいので客引きになるという考えだったのか、
あるいは、中の人が本当は歌声合成やりたかったのか・・・。
0342名無しサンプリング@48kHz
垢版 |
2020/06/30(火) 01:14:04.19ID:RB3seA4d
そういや、同じものを示していても、
業界によって用語が違うので面食らったものに、
「N次高調波」vs「N倍音」てのもあったなぁ。
0343名無しサンプリング@48kHz
垢版 |
2020/06/30(火) 06:24:56.83ID:a+of75pL
ソンな技術的なことは置いておいて、もうね、ボーカロイドは時代遅れになると思う。
老害が多い2CHは、スマホやラインが登場したとき、「2CHで十分!」でほざいていた。
しかしそうならなかった。だから予言しておく。AIの人口音声が今後主流になる! と。
0344名無しサンプリング@48kHz
垢版 |
2020/06/30(火) 07:28:04.78ID:a+of75pL
そう思う。5CHは老害の山。
WINDOWS10の時代でXPで頑張るとか抜かしていた連中だ。
古くはWINDOWS95が出た時代にMS-DOSで頑張るとか言っていた連中。

あと20年もすれば、ジジイしか使わないFAXも消えるハズ。
ITに中國なんかに抜かれているのは全部、老害のせい!!!!
0346名無しサンプリング@48kHz
垢版 |
2020/06/30(火) 07:45:19.45ID:Tr6YxF73
>>343
これからはAIの時代だって?
これまでもAIの時代だったんだぞ。

いまの若い人はディープ・ラーニングだけがAIだと思ってるのか。
おじいちゃん達がしてる前世紀の遺物もAIだったんだぞ。

コンピュータ業界ってのは流行り言葉が大好きでね、
一本の同じ流れの上にある=従来からあるものなのに、
あたかも画期的な新機軸かのようなキャンペーンするものなのよ。
そして、いままで使ってこなかった人たちが、
世の中が変わるとかいって浮かれちゃうわけ。

分野が違うけど、ホンダのアシモが登場したとき、何を思った?
二足歩行ロボットの研究の歴史を知っている人らは、
パッケージングと宣伝を除いて、新規性ないと冷めてたよ。
0347名無しサンプリング@48kHz
垢版 |
2020/06/30(火) 08:11:08.02ID:Tr6YxF73
ホビー層に初音ミクなどが愛されてきたのは、
たくさんの手間がかかるからだと思うんだよねー。
使い方をマスターするのに時間かかるとか、
手間をかければかけた分だけ良くなるとか、
そういうところがね。
つまり、ゲームみたいなものだったんだ。

だから、プレーンな譜面データを入力しただけで、
手を加える余地がない程度に歌うようになったらば、
ホビーとしてはオワコン化するんじゃないかなぁ。

これってDTMが辿った道と同じだと思うんだよね。
0349名無しサンプリング@48kHz
垢版 |
2020/06/30(火) 08:34:42.14ID:VRdaskI7
っていうか、そもそもAIはソフトウェアを開発すること自体が面白いのであって
ある程度完成してしまったらもうつまらなくなる。
0350名無しサンプリング@48kHz
垢版 |
2020/06/30(火) 08:43:24.75ID:YXHPn+kO
342までの超専門的な話の流れを一気に便所の落書きに戻した「ソンな技術的なことは置いておいて」の破壊力よ
0351名無しサンプリング@48kHz
垢版 |
2020/07/02(木) 11:09:17.77ID:XyMfIOve
前言撤回。
ニコニコ動画に上がっているAIきりたんの無調整の「鳥の詩」は聞けたものではなかった。
調整された初音ミクやIA(イア)のほうが、ず〜とましだった。合成音声にも得意分野があるようだね。
0352名無しサンプリング@48kHz
垢版 |
2020/07/02(木) 12:47:58.24ID:Yvf2mR6M
>>351
ニコ動の鳥の詩は聴いてないけど、つべの「鳥の詩 きりたん」検索でいくつか出てくる中で、
ttps://www.youtube.com/watch?v=RxKmfz3R7ws
これなんかは相当いいところまでいってると思うけどな
0353名無しサンプリング@48kHz
垢版 |
2020/07/03(金) 05:19:56.32ID:EXy9AWo6
人によって評価軸が違うんだよね。
何をもって機械っぽいと思うかが。

ライブで目の前の生身の人間が歌っていても、
ナチュラルではなく人工的に感じる場合もある。
0354名無しサンプリング@48kHz
垢版 |
2020/07/06(月) 08:17:08.93ID:Cq/gae7n
>>352
アレンジはいいが、原曲で歌うバージョンはちょっと・・・・・ちなみに「鳥の詩」の楽譜は、
AIR SOUND TRACKのブックレットに記載されている。
0356名無しサンプリング@48kHz
垢版 |
2020/07/07(火) 07:15:49.92ID:wNdmCdeS
東北イタコの歌唱データベース作られるかもしれないので期待しています。
0359名無しサンプリング@48kHz
垢版 |
2020/08/04(火) 14:47:38.75ID:jlNhtoI8
90年代は多層ニューラルネットが大きな壁にブチ当たっていて、2000年代〜2010年代のブレークスルー待ちでブームは沈静化

ファジー論理(3値論理)に関しては、コンピュータサイエンス視点での様相論理(多値論理)再評価の方向になって、ニューラルネットとは乖離

ファジーニューロは関西電器大手で応用製品を出したり電機大手が関連のLSI化をしていたけど尻すぼみ

歌声合成ではATRがサンプリング応用で音のリアルな素片接続型合成を試作して、テイトウワがアルバムで使用

3つの要素(ファジー論理、多層ニューラルネット、歌声合成)が結びつき得る時代では無かったね。

関西電器大手は初期サンプリング機材の輸入代理店をしていた事もあるし、90年代には物理モデル音源の製品も出してたけど
儲けの出ない基礎研究をしっかりやるような企業では無かったからしょうがないね
0361名無しサンプリング@48kHz
垢版 |
2020/08/04(火) 21:23:26.06ID:CSOWORhB
仮にそういうことが出来たとして、介入した部分としてない部分の繋ぎが不自然になるぞ
0362名無しサンプリング@48kHz
垢版 |
2020/08/04(火) 22:01:28.12ID:RKmRMcxi
なんで突然、確率的推計の話を持ち出したのかさっぱり意味不明だが。

確率的言語モデルであれば、形態素/統語/意味解析において複数の解釈が可能な場合に、学習データとして使った言語コーパス上でそれぞれの解釈がどの程度の確率で発生したかを参照して、
それに基づいてトータルでより確率の高い解を選択しようという程度の話だよね。
たとえば形態素解析の応用であるかな漢字変換だと、まずは確率の一番高そうなのを第一選択候補として出して、必要があれば人間が候補を再選択して、人間にとり望ましい結果に修正したり、
その修正結果も学習データとして取り込んだり確率値の修正を行う方式が30年以上前から普及している。

それに対し歌声合成の場合はまだ歴史が浅いし、
データやコンテキストや評価基準も複雑だし、
創作活動向きの候補選択ユーザーインタフェースもまだ試行錯誤状態だろうから、今まさに発展中なんじゃね。
0363名無しサンプリング@48kHz
垢版 |
2020/08/04(火) 22:43:07.84ID:vc7sr9o6
AIガチャってのが内部的にどうなってるのか知りたいんだよね
触れるなら触ってガチャ引く手間を削減したい
0365名無しサンプリング@48kHz
垢版 |
2020/08/04(火) 23:53:35.04ID:vc7sr9o6
要はNEUTRINOでユーザができる調整って原理的にどこからどこまでなのか知りたい
>>362の説明のIMEのやり方が音声合成にはやや適切でないというのは分かるんだけど
AI側がいくつか結果の候補を出せるなら並べて出してほしいところ
0366名無しサンプリング@48kHz
垢版 |
2020/08/04(火) 23:57:52.28ID:vc7sr9o6
まあ人間がどのフレーズのどの部分をどのようなパラメータについて候補を並べてほしいかUIで事前に指定しないといけないのは当然だろうから
いったん通しで出力したやつを人間が聴いて、それを踏まえての局所的にテイク2〜をAIにお願いしましょうって形になるのかな
そのためにはテイク1の合成の過程をAI側も覚えておかないといけないね
0368名無しサンプリング@48kHz
垢版 |
2020/09/12(土) 07:08:20.20ID:P9DaMtIj
来週あたり東北イタコ姉さん来ますね。
0370名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 04:01:31.13ID:E49KVGTF
>>330
機械音が歌っているのを聞くのは苦手だった
不快な音やもんなあれ
作り手満足だったし

>>1
MacOS対応は?
0371名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 04:27:28.98ID:G5ohJXCb
今のところNEUTRINOはコスパ最強だな
利用に制約はあるけどもAI合成のポテンシャルを界隈の末端まで知らしめた功績は大きい
これを超えるのは正直難しいと思う。
商業ソフトが対抗するなら制約をどこまで減らせるかと声のバリエーションの次元で戦うしかできない。
出音は良くて当たり前、エディットも手数少なく高品質に持っていけるのが当たり前、だからな。
0372名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 14:35:06.26ID:D+AwoRvG
無料で出しちゃうとそれが最低基準になっちゃうってのは有るよな。
少なくとも NEUTRINO (AI きりたん) 以上ってのは誰もが期待するようになった。
初音ミクなんてとても聞いてらんない。

ただ、歴史的には初音ミクに連なるシリーズも作品をとりあえず発表するという点では
大いに貢献したというのも間違いないんだけど、
いろんな人が「歌ってみた」をやって初めて完成という感覚はあったよね。
(つまに初音ミクは仮歌としてしか使い物にならない。)
0373名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 14:52:20.14ID:Sk03KuW8
>>370
Vocaloidの中でもミクが特にそう感じる声だっただけで、Lily V3とかMachaあたりは不快じゃなく普通に聞けると思う。
0374名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 14:53:59.25ID:mcmazsJb
>(つまに初音ミクは仮歌としてしか使い物にならない。)

ライブで日本だけでも何万人、世界中で何十万人も動員してる現実が見えてない人?
0375名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 15:08:49.17ID:Sk03KuW8
初音ミクを人間の声の代用として使おうとするやつはそりゃ仮歌にしかならんよ。せめて他のボカロにしろよ。
0377名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 15:36:05.77ID:G5ohJXCb
ミクは人間の声じゃないところがウリだからそこは認めないと。
AIきりたんとAIヨーコさんで比べるなら同じ土俵だからいいんじゃね
0378名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 15:41:50.82ID:PUJdPcRm
ジャズなんて音楽じゃないと言ってクラシックに固執してたり
ロックなんて音楽じゃないと言ってジャズに固執してるような化石みたいな音楽観だよね
0379名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 16:11:17.97ID:mcmazsJb
>>377
消失とか高音厨音域テストとか人間には歌うことが難しい曲が流行ったからそういうイメージが付いてるけど
クリプトン自身は別に人間の声じゃないことをウリにして売ったことは無いような

メロディがあって歌詞が聞き取れるから歌声と認識できる
あとは好き嫌いの範疇なんじゃないかな

ここで挙げるまでもなく有名Pの歌詞は聴き取りやすく調声されてるから
「初音ミクは使い物にならない=自分には使いこなせない」と言ってるように受け取れる
0380名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 16:14:42.37ID:D+AwoRvG
>>374
あれは初音ミクのキャラクターで売ってたのであって、
もちろんそれも商業的成功ではあるけど耳障りさを擁護する根拠にはならんよ。

いわゆる「不気味の谷」ってのは音にもある。
人間の声とは別種の楽器だといくら言い張ったところでボーカルとして使ったら
ボーカルとして聞いちゃう。
0381名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 16:27:44.26ID:mcmazsJb
>>380
「耳障りではない」とも「人の声に聞こえる」とも言ってないよ
「使い物にならない」という主張に対して活用している人はたくさんいるし成功事例もあると言ってるだけのこと
使い方の問題でしょ
0382名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 16:29:18.96ID:nE8izLea
使えないとか気になるとか全部主観で
現実として成功している部分を直視出来ていないよね
0383名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 16:48:22.98ID:2Q2mwt2f
もうキャラありきで公式や公式が拾ったコンテンツにファンがついてる様なもんだからねえ
色んな意味でもう比較しちゃいかんと思うわ
0384名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 16:48:59.34ID:0e2xb/jI
使い物にならないじゃなくて
使う気になれないと書いてれば突っ込まれなかったのでは
0385名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 18:08:12.09ID:G5ohJXCb
まあ発音が常に聞き取りやすいかと言われると現状のミクでもエディットヘタクソだと話にならん、かな
そこはAIシンガーの解像度の高さに軍配が上がるところ
0386名無しサンプリング@48kHz
垢版 |
2020/09/13(日) 18:09:12.69ID:G5ohJXCb
もちろん話し声じゃなくて歌声である限り、歌詞なんて全然聞き取れなくてもいいんだけどな
英語以外の洋楽と同じ
0388372
垢版 |
2020/09/14(月) 01:56:03.88ID:Bv2mv92m
>>384
ワイは創作者ではなくて、聞き手としての感覚で書いてたわ。
主観を正確に表現するなら「初音ミクを使った作品は出来が悪いように感じる」やな。
0389372
垢版 |
2020/09/14(月) 02:00:10.19ID:Bv2mv92m
もちろん上手く使えばいい感じというのも正しいんだろうけど、
そういう作品が多くない以上は消費者側の意見としては出来が悪いとしか言えない。
0390名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 05:13:11.24ID:r5CTsKLV
AIきりたんもヘタクソに打ち込むと割とロボくもなるんだよな
そちらの方が興味深い
0393名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 08:27:01.82ID:BRT1wDNL
初音ミクが13年に渡って歌声合成とヴァーチャルアイドル市場を切り拓いて盛り上げてきた上にNEUTRINOの存在があるのに
そのNEUTRINOと比べて初音ミクを出来が悪いて
さすが聞き手様は言うことが違うわ
0394名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 08:32:14.05ID:r5CTsKLV
この板にいるのはある程度長く生きてる人間ばかりだから初音ミク以前からの流れも理解してるだろう、音声合成の歴史は古いしな。
でも若いクリエイターはミクを見て聞いてクリエイターを志したピチピチもいるから、ミクのでかさが体感でまったく違うだろうて。
ぽっと出の新人ボーカルと人生に最大の影響を与えたボーカルの神くらい違うはず
こんなとんでもない存在と比べたら、AIきりたんは作られたご当地キャラとはいえ、ある意味そこらにいる普通の人間のボーカルよな
0397名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 08:38:18.15ID:eXv3pxiz
ボカロが出た当初、宅録に女声リードボーカルを取り入れるつもりでMIRIAMやMEIKOを買ったけど、結局は
自然さとは程遠い出音で断念した自分にとっては、NEUTRINOでやっと実現したいことが出来そうな気がする
0398名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 08:40:29.08ID:r5CTsKLV
ボカロ発売から十数年経てようやく人間にかなり近いボーカルがコンピューティングで作れるようになったという点で
NEUTRINOやこれから出るCeVIO AIはDTM史に名を遺すじゃろ。
一方で出来た作品の良し悪しなんて観点は歴史にあまり記されない。ミクファンからすりゃ思い出の名曲だらけだし。
みっくみくもメルトも千本桜もその他にも数万曲あるんだっけ、AIきりたんがそこまでの曲数を歌う機会に恵まれるかといえば
0399名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 08:43:16.40ID:r5CTsKLV
いずれ本格的な商業利用が始まれば、通信カラオケのガイドボーカルではAIシンガーが大活躍するかもしれんな。
0400名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 09:07:40.42ID:vrNuaztU
きりたんは合成と分かって聴いていても人間に聞こえるほどだし
街なかで聞こえてきたら誰も合成とは気付かないレベルではあると思う

でも何十曲も聴いていたいかというとそうでもない
可愛い声ではあるけど素人の女の子が歌っているレベルで歌に魅力が無い
でもこれがPVやヴァーチャルキャラクターがあって歌って踊っているとまた違うかもしれない

初音ミクは狙ってそうなったわけではなくたまたま技術の進歩と合致したんだけど
タイミングの良さや権利のコントロールなどやはり奇跡的だと思う
0401名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 09:33:04.08ID:vrNuaztU
初音ミクの歌声には人工の歌声が抵抗なく聴けるかどうかというハードルがある
一方のきりたんは声質や歌い方の好みで人間の歌手と並んで選ばれるレベルに達していてそのハードルを超えている

初音ミクを含むボカロはCDショップを見てもボカロコーナーがあるように
キャラクター性まで含めた「ボカロ」というジャンルになっている

これからきりたんがどういう展開を見せるか興味深いが
一つはっきりしてるのはきりたん(NEUTRINO)とボカロは合成方式以外の面でも現在のところは別物ということだね
0402名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 10:41:09.85ID:r5CTsKLV
多少合成に欠陥があるのも含めてAIきりたんが最初の研究成果なわけで、次に東北イタコさんが来てからが本番だな
どこがどれだけ変わってるのかボカロ耳じゃない本来の歌モノのプロの聴覚を問われるレベルの出来になってると期待してるよ
0403名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 10:42:20.86ID:r5CTsKLV
正確にはSinsyからの流れでヨーコさんも研究成果に含めなくちゃいけなかったな
あれが一番、合成方式の進化の恩恵が分かりやすい
0404372
垢版 |
2020/09/14(月) 10:48:44.34ID:Bv2mv92m
俺はアーティストではない。
産業技術 (テクノロジ) 的に見ているという自覚があってそこが齟齬なんだろうというのはわかってる。
上限が高いことよりも下限が保証されていることが重要という考え方をする。

ボーカルに楽譜を渡せば及第点程度には歌えるのが当然で、
細かな表現を付けて魅力的にするのはそこから先の話。
で、ボーカロイドはそれを達成できなかった。

そこを意地になって調整したりなんなりでボカロ曲というジャンルが出来たのは
アートとしては一種の成功ではあってもテクノロジ的にはも十分な成功ではないと思うんよ。

ボカロ曲というジャンルが確立したということは否定しないよ。
ワイにとっては耳障りなことも事実だがそれは単なる好みだしな。
0405名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 11:16:04.53ID:vrNuaztU
言葉の選択が不得手なんだな
2007年発売ということを考えればテクノロジー的にも十分成功だろう
当時誰がヴァーチャルシンガーがライブしたり地上波のMステに出たりすると想像した?
文脈的に「成功」ではなく「完成」が妥当だと思うがそれならきりたんでも未完だわ
0406372
垢版 |
2020/09/14(月) 14:37:23.03ID:Bv2mv92m
>>405
だからそれはキャラクター商売の部分でウケたんだって言ってるじゃん。
そのキャラクターなら許される音であって、キャラクターありきでどうにか受け入れてもらえる程度でしかない。
キャラクターを前面に押し出さなければいけなかったのはむしろテクノロジーの未熟さの証だろ。

テクノロジーとしては「歌声」が目指すべき目標なはずだろ?
だからまずは歌として及第点程度であるというのが俺の考えるテクノロジー的に十分な成功だ。
俺にはボーカロイドは歌声には聞こえない。
せいぜいが音階のある奇声、歌声としてはピーキーさが過ぎる。

俺が「十分な成功ではない」という言い方をしているのは、
失敗だと思っているわけでもないってことだ。
そりゃあ時代背景を考えれば部分的には成功でもあったんだろう。

でも「歌声」と言っている以上は普通の歌声に聞こえる程度を基準にするのが自然だろ?
0408名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 15:08:43.06ID:BRT1wDNL
聞いてらんない
使い物にならない
耳障り
出来が悪い
歌声には聞こえない

NEUTRINOスレをアンチボカロスレと勘違いしてるのかこいつは
0409名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 15:37:40.24ID:vrNuaztU
一応俺がリスペクトしているボカロ曲を何曲かあげておく
372氏の認識が少しでも変わることを願って

【VOCALOID Megpoid Gumi】Miracle∞Gumiracle【Touhou Vocal Cover】
https://youtu.be/-hZNtYfErfE

【VY1V4】Fairytale,【カバー】
https://youtu.be/4hNpxi0N-2U

【Fukase・Otomachi Una】Near【Cover】
https://youtu.be/_xGk3OY-uxM

【初音ミク】海の幽霊【カバー】
https://youtu.be/jfynSsb0qrw

投稿年の古い順
1番上は驚くことに11年前V2時代の作品
下3曲は全部kyaami(Cillia)さんになってしまった

検索したら1曲めのきりたんバージョンが出てきたので
NEUTRINOスレだし参考までに張っておく

【AIきりたん】Miracle∞Hinacle【カバー】
https://youtu.be/lEXmW6D0MpQ
0411372
垢版 |
2020/09/14(月) 17:58:59.96ID:Bv2mv92m
>>409
だからさ、良い曲があるよ〜、とか、上手く調整してるのがあるよ〜ってのはテクノロジーの敗北なの。
お前がそういうの紹介するのはテクノロジーの敗北の証拠なの。

一番へたくそなのでも歌声ではあるよね (その上でアーティストは魅力的な調整をしよう) ってのが
本来はテクノロジーに求められるものであって、
歌声になんなかったやつ、またはめっちゃ頑張って歌声っぽくなったやつもそれはそれでアートだよねってのは
派生的な成果に過ぎないんだってば。

「歌声を合成しよう」という目標に対してそれは (十分には) 達成できてないよねということを言ってるだけなのに
なんでそれがわかんないの。
0412名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 18:02:33.64ID:JaMfbESD
ボカロは登場した当初から、けっこう面白い楽曲が短期間で公開され新鮮だったよね。

今から振り返ってみれば、ボカロというあたらしい楽器に才能が集結し、その後も語り
継がれるような名曲を次々と発表していったことで、それが大きなムーブメントとなり
盛り上がっていった、というのが自分の実感かな。

下の楽曲など、各人がボカロに託した夢や希望みたいなものが歌詞や曲にあふれていて
いま聴いても色褪せない魅力がある。

「Ievan Polkka」を歌わせてみた(2007/09/04)、みくみくにしてあげる♪(2007/09/20)、
Packaged(2007/09/25)、ハジメテノオト(2007/10/14 )、教えて!! 魔法のLyric(2007/10/20)、
私の時間(2007/10/22)、ミラクルペイント(2007/11/22)、01_ballad 星に願いを(2007/12/24)

自分のように既存の商業音楽の歌詞やメロディに退屈していた人間からすると、まったく
別の物語の世界が開けたようで、すごく新鮮な気分になれたことを覚えている。
0414372
垢版 |
2020/09/14(月) 18:35:45.40ID:Bv2mv92m
>>408
ボーカロイドは歌声を作ろうとして (十分には) 歌声になりませんでした。 (事実)
しかしそれはそれで一つのジャンルを形成しました。 (事実)
私はボーカロイドの声をとても耳障りに聞こえます。 (感想)

NEUTRINO はまさに歌声らしい出力をします。 (事実)
なので (ボカロが苦手な) 私にとってはアーティストがこのような道具を得たのはありがたいですね。 (感想)
0415名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 18:38:18.47ID:XXfJuOES
>>372は歌声合成技術テクノロジー的な観点から述べていて、>>400は一般市場に受け入れられたかどうかに重点を置いているから話は平行線のままなんだよ(´・ω・`)
2人とも言ってることは間違っちゃいないが、もう少し歩み寄ったらどうだい(´・ω・`)
0416372
垢版 |
2020/09/14(月) 18:50:53.77ID:Bv2mv92m
もともとは「歌声」を指向してるんだから
より歌声らしい方がテクノロジー的には上等じゃん
(エンターテイメント的には知らん)
ってだけの話なんよね。

それと世間にとってどうだろうと俺にとって耳障りなものが耳障りでなくなることは無いんで、
別の選択肢が現れてありがたいですよねってだけ。
0417名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 19:00:24.20ID:eXv3pxiz
まぁあれじゃないの
生ドラムを代替するつもりでリンドラとかTR808を作ったけど、結局全然生ドラムの代わりにはなれなくて
その代わりに新しいジャンルを確立してしまったっていう
0418名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 19:00:29.39ID:vrNuaztU
>>415
誰が聞いても歌声に聞こえなかったら歌番組にTV出演までしてないと思うから
テクノロジー的にも一定のレベルに達している=一定の成功を納めていると俺は考えるけど372は違うらしいし
誰が聞いても歌声に聞こえそうな曲を紹介してみても「紹介するのはテクノロジーの敗北だ」とか
なぜか勝ち負けの話にすり替えて聴く気も無さそうだし
372が歩み寄る気なんてサラサラ無さそうだからお話になりません
0421372
垢版 |
2020/09/14(月) 22:55:58.12ID:Bv2mv92m
>>418
だからさー。 同じことを何度も書かせるなよ。

> 誰が聞いても歌声に聞こえなかったら歌番組にTV出演までしてないと思うから

キャラ人気で引っ張ってボカロ曲というカテゴリとして出たんだろ。
歌声合成が目指していたのは本当にそれだと思ってるのか。
繰り返すが部分的な成功であることは否定してない。
ただ、目指していたはずのものを達成しているとは思わん。

> 誰が聞いても歌声に聞こえそうな曲を紹介してみても

歌声を合成するソフトなんだから歌声に聞こえるのは当たり前なの。
それは大前提なの。
全部が (下手でもなんでもとりあえず) 歌声に聞こえるというのが出発点なの。

歌声に聞こえるものを選ばなきゃならないようではそこに到達してないわけ。
0422名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 23:08:57.84ID:BRT1wDNL
同じこと何度も書くなよウゼーわ
0424名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 23:11:38.33ID:BRT1wDNL
「ボクのかんがえるうたごえソフトのとうたつてん」とか知らんがな
自分のブログにでも書き散らかしてろって
0425名無しサンプリング@48kHz
垢版 |
2020/09/14(月) 23:13:20.06ID:r5CTsKLV
いずれにせよ自分が思うほど上手に歌わせられないのはこれもボカロも一緒だ
難易度とアプローチが違うだけ
なので使わない立場でモノを言うのはナンセンス
0427名無しサンプリング@48kHz
垢版 |
2020/09/15(火) 08:10:24.40ID:oLfWCwT5
俺が歌声に聞こえないソフトは歌声合成ソフトではない(キリッ
0433名無しサンプリング@48kHz
垢版 |
2020/09/16(水) 20:13:07.59ID:k3a2lZqV
フルートだってギターだって、楽器ってまともな音を出せるようになるまで時間かかるよね
練習して上達して「音楽」にしていくもんなんじゃないかな

なんでボカロだけ敗北になるんだろ?
0436名無しサンプリング@48kHz
垢版 |
2020/09/17(木) 01:05:16.92ID:eDs85d7y
どうしても高音を歌わせると声がかすれてしまう
かと言って1オクターブ下げると別の箇所が低くなりすぎる
どうしたらいいものか...
0438名無しサンプリング@48kHz
垢版 |
2020/09/17(木) 01:21:28.98ID:GQ8SKoEx
新バージョンもうすぐリリースですな
ひとつのソフトで2種類のエンジンが同時進行するのは面白い
0439372
垢版 |
2020/09/17(木) 03:27:29.94ID:1kBVm6Xi
>>433
音楽かどうか、とかそういうことは言ってないんだってば!
楽器に期待されるのは少なくとも期待する音階が出ることで、
ドを鳴らそうとしてレが出たりしないのは当たり前のことだろ。
表現はその後の話。

歌声だって少なくとも歌声であって奇声ではないことを期待するのが
そんなに不自然なことか?
0440名無しサンプリング@48kHz
垢版 |
2020/09/17(木) 04:25:12.00ID:1S7u5IlG
まだ言ってる
0441名無しサンプリング@48kHz
垢版 |
2020/09/17(木) 05:18:39.11ID:yYiEyvYh
>>433
最初から超上手い人がいるから
楽器だって小中学生でプロ顔負けの演奏できる奴いたら注目されるだろ
そういうのって何千万人に1人クラスだけど実際いるからね
そういう才能の前では皆その他大勢でしかない
0445名無しサンプリング@48kHz
垢版 |
2020/09/17(木) 06:21:05.32ID:GQ8SKoEx
少なくともNEUTRINOは「解像度が高い」のがすごいのであってピッチが完璧とかいう話をする対象じゃない
使ってればそんなことは口が裂けても言えないはず
0447名無しサンプリング@48kHz
垢版 |
2020/09/17(木) 06:27:06.60ID:GQ8SKoEx
人間の歌唱において「滑舌がいい(似たニュアンスだと音素の解像度が高い)」という状態をアーティキュレーション用語として表現する確立した言葉は存在してないみたいだから
歌声合成の評価基準としては研究者向けのそれしかなくて、一般人はフワフワとしたあいまない言葉で上手い下手を論じるからこうなるんだろうと思う。
そもそも音素が聞き取りやすいことは歌の良し悪しとは別の次元にある概念で、わざとモゴモゴ歌ったり掠れたりスキャットで言葉として意味のない聞いて気分が良い音素だけ並べたりと
芸術だから作る人と聞く人が気持ちよくなればそれで良い物なので、仮にカチカチに歯切れよくしか歌えないと逆に崩したくなる作り手も出てくるし逆も然りということだな。
0448名無しサンプリング@48kHz
垢版 |
2020/09/17(木) 06:31:13.05ID:GQ8SKoEx
音素というより波形の解像度と言った方がニュアンス正確なのかな
まあ低音部の解像度がもうひとつなのはみんなさすがに共通認識だろうから今後の課題はそれだと個人的には思ってるが
CeVIO Proが嵐のイケボイスで男声を高解像で歌わせて一般人に出してきたので期待が持てる
NEUTRINOにも誰かバス〜テノールのイケボな方が歌声DB提供してくれたらいいのにな
0452名無しサンプリング@48kHz
垢版 |
2020/09/17(木) 12:56:48.74ID:GQ8SKoEx
人間が歌が上手いと思っている人はDTMerでは絶対にないのでそろそろ出ていってほしい
0454名無しサンプリング@48kHz
垢版 |
2020/09/18(金) 10:17:07.52ID:nf+F+uCk
歌唱ソフトを人間に似させるためには、もっと多彩な表現力を持たせないとダメ
そういう意味では、やっと人に似させることができたという入り口の段階

これからは、軽く流すように歌うとか、鼻にかかった歌い方をするとか、声色を
変えて(ものまねやキャラ変で)歌うとか、泣くように歌うとか、もっと人間に
近づけていかないとエモーショナルな表現力や色気は乏しいままだと思う

亜蘭知子 I'm in Love
https://www.youtube.com/watch?v=pE2D3LWADFg

木村恵子 電話しないで
https://www.youtube.com/watch?v=oNQkWgrNbzU
0460名無しサンプリング@48kHz
垢版 |
2020/09/19(土) 10:12:48.92ID:3zpoLSHP
>>439
> ドを鳴らそうとしてレが出たりしない

これって演奏者のスキルの問題ですよね。
ピアノならミスタッチしない、とか。
0464名無しサンプリング@48kHz
垢版 |
2020/09/22(火) 03:35:02.71ID:B2PkTZYI
きりたんやイタコに歌わせるような普通の曲が全然作れん
ボカロっぽい曲ばかり作ってきた弊害を今更感じてる
0467名無しサンプリング@48kHz
垢版 |
2020/09/23(水) 08:38:04.45ID:cHha3trU
クソみてえな抱き合わせエディタ出してYAMAHAがサードパーティに見限られてる間に技術面でもフリーソフトに抜かれてるの情けなさすぎてウケる
0472名無しサンプリング@48kHz
垢版 |
2020/09/28(月) 16:38:11.05ID:oJSOULgB
ボカロの声が嫌いだった俺はこれのお陰で世界が変わった。歌ものを作れるようにしてくれたきりたんありがとう。
0473名無しサンプリング@48kHz
垢版 |
2020/09/29(火) 19:52:30.21ID:ioQWvclN
自分の場合はこれのおかげで今まで書いてたボカロ曲のメロディの不自然さに気づけたわ
そもそも発声のタイミングとかおかしいのを変な風に誤魔化す技術ばかり身につけていたんだよな
0474名無しサンプリング@48kHz
垢版 |
2020/10/03(土) 23:44:05.11ID:+z3rmHn4
んだな。ミクはケロケロを標準でつけてから売れやと言いたくなるくらい変声だと思うわw
0479名無しサンプリング@48kHz
垢版 |
2020/10/04(日) 12:49:14.10ID:LAs7J/rF
きりたんは歌手で言うと奥華子に近いものを感じる
外連味がなくって、ピュアでストレートな感じっていうのかなあ
松田聖子のような可憐なアイドル臭は無い
0480名無しサンプリング@48kHz
垢版 |
2020/10/04(日) 12:54:13.82ID:QX2X07yE
中の人のこと知らんからなんとも言えんがそれでも学習DBは全部アイドル曲らしいからなあ
難しいとこだね
0481名無しサンプリング@48kHz
垢版 |
2020/10/04(日) 12:58:46.89ID:pYfqoHHQ
CANDYCANDYとかパンツはけるもんとか
きりたん無調声に歌わせたらなんか壮絶なギャグになったわ
0483名無しサンプリング@48kHz
垢版 |
2020/10/07(水) 10:20:21.87ID:y3iSidDa
FormantShiftいじっても全然かわいくならないんで、きりたんは捨てることにしました・・・
0486名無しサンプリング@48kHz
垢版 |
2020/10/07(水) 12:21:54.86ID:3/EV3FC7
フィルタでガツっとロー削るとかまあ色々やってみたらいい
せっかく今一番発声品質が高いAI合成が使えるのだから外部で弄り倒してでも満足するまで使って
先行者利益(商業的にでなくノウハウ面で)を得よう
0490名無しサンプリング@48kHz
垢版 |
2020/11/02(月) 23:59:53.40ID:Z6BMo/7Q
おおむね満足なんだけど、鼻濁音ってどうやるのかな?
VOCALOIDの時はNを付けるんだったと思うけど
原則ひらがなしか受け付けないみたいだからなぁ

ちなみに「お」と「を」は同じ扱いっぽい
「wo」と発音させたいときは「うぉ」がいいみたい
0491490
垢版 |
2020/11/03(火) 00:46:35.53ID:EVSsZ77E
自己解決
「が」の鼻濁音だったら音符一個に「んが」って入れれば鼻濁音っぽくなる
あとはスラーが使えればいいんだけど、これはピッチカーブで描くしかないかなぁ
0494名無しサンプリング@48kHz
垢版 |
2020/11/03(火) 15:18:43.23ID:1SFRaWT8
鼻濁音の出し方は普通に義務教育で習ったのと同じってだけだな
というか、グーグルで発音記号を見てみ。知らない人にとっては目からうろこかもしれん
0495名無しサンプリング@48kHz
垢版 |
2020/11/03(火) 16:12:43.38ID:AVGG+2GF
シャクリもだけど、テンポや表現によってどれくらいの音価で置けば良いのかも変わってくるし難しい
0499名無しサンプリング@48kHz
垢版 |
2020/11/03(火) 20:08:05.97ID:KoikRQGB
ここでの音価はラベルファイルのタイミング情報と定義しておいた方がいいんじゃないかね
楽譜では表現できないけど発声で重要だし
0500名無しサンプリング@48kHz
垢版 |
2020/11/03(火) 20:08:55.93ID:lOinZ6eh
鼻濁音の話と全く関係ない一般論をドヤ顔で書いてる時点でゴミクズなのは一目瞭然
0501名無しサンプリング@48kHz
垢版 |
2020/11/03(火) 20:17:43.81ID:lOinZ6eh
音価とは楽譜上の音符や休止記号の長さの事。

DTMでは発音タイミングは大まかに音価に従うが
key on/key offの間の時間、いわゆるGate timeを音価以下の範囲で設定して演奏表現するのは基礎の基礎なので今更指摘するまでもない話だが
この人物は音価とGate timeを混同している臭い
0504名無しサンプリング@48kHz
垢版 |
2020/11/03(火) 21:04:50.42ID:lOinZ6eh
気狂いの気狂い文章にツッコミを入れたら
9分かかったのはおかしい、と気狂いが発狂連投
0505名無しサンプリング@48kHz
垢版 |
2020/11/03(火) 21:06:56.43ID:xxxiyagL
音価が楽譜上の音符や休止記号の時間的長さって
幼稚園や小学校レベルの基礎中の基礎だから

逆に>>495>>499のような妄想文章が何を言いたいのか、健常者視点では推測が難しいよね
0507名無しサンプリング@48kHz
垢版 |
2020/11/03(火) 21:29:17.82ID:KoikRQGB
ちなみに細かい話だけど小学校までで音価という単語は教えない
個々の音符や休符の名前(四分音符など)を教えるにとどまる
0508名無しサンプリング@48kHz
垢版 |
2020/11/03(火) 21:34:21.75ID:KoikRQGB
>>495はNote valueの意味で書いたのだろうけど言語学で音価というと文字で表される音 phonetic value の意味もあるんだな
0511名無しサンプリング@48kHz
垢版 |
2020/11/04(水) 06:55:50.61ID:PLc0AxXO
>>496で「音価なんて珍しい単語使って判ってる風w」みたいなスタンスで突っかかって行ったのに

>>505で「音価なんて基礎中の基礎ですから」って急変、キチガイすぎるだろ

これが噂のトビサワニカゲツ君ってヤツか
0513名無しサンプリング@48kHz
垢版 |
2020/11/04(水) 08:10:04.03ID:vBC9c435
簡単な概念に、普通使わない正式名称を使った挙句に
意味を取り違えてやっぱり判っていなかった事を
後から誤魔化すいつもの知恵遅れ
0514名無しサンプリング@48kHz
垢版 |
2020/11/04(水) 08:16:11.97ID:vBC9c435
「音価」ではなく、「発声継続時間」とか「gate time」とかそれに類する表現をすれば一発で伝わるのに、「音価」の意味を取り違えているから話が意味不明になったんだよね

譜面上の音価に対して、演奏表現として発声/発音継続時間あるいはシンセやDTMならgate timeを調整するのは基礎の基礎である事には変わりない
0515名無しサンプリング@48kHz
垢版 |
2020/11/04(水) 08:16:51.69ID:vBC9c435
こんなくだらない話をいつまでも言い訳するのは
未だに間違いを理解していない知恵遅れの証
0516名無しサンプリング@48kHz
垢版 |
2020/11/04(水) 12:55:02.45ID:O7ePg7E6
言い出しっぺがどういうニュアンスで音価と言ったのかはまだ誰も分かっていない
0517名無しサンプリング@48kHz
垢版 |
2020/11/04(水) 15:02:02.34ID:vBC9c435
元々の話は、楽譜レベルでは作曲時に確定済みの音価を、打ち込み時には演奏表現として持続時間何パーセントにするかという話なので、音価ではない
0518名無しサンプリング@48kHz
垢版 |
2020/11/04(水) 15:05:41.78ID:V84DYS6B
この手の話は、用語の用法を勘違いして誤用すると、より適切な言い換えもサクッと示されるのに
間違えた当人はいい加減な用語使いにいつまでも固執して、自分の間違いは確定していないと言い張る不毛な展開
0519名無しサンプリング@48kHz
垢版 |
2020/11/04(水) 17:40:14.08ID:zbWEytAT
AIきりたんを使っていて明らかにおかしな音になる場面に遭遇したので調べてみるとロングトーンが苦手ということなんですね。
これは音符の入力の工夫ではどうしようもないのでしょうか?
(出力した音をいじってどうにかする必要がある?)
0520名無しサンプリング@48kHz
垢版 |
2020/11/04(水) 17:59:52.91ID:4/s16byc
AIシンガーを今までみたいなボカロと同じように扱ってもうまく歌ってくれない
打楽器弦楽器管楽器、それぞれ出せる音域が違って奏法や適したフレーズが異なるように
AIシンガーにも適した音域や歌い方が存在するんだから
作曲側もそれに寄せないと理想的な仕上がりにはならないよ

逆に自分がやりたい音楽を突き通すなら無理が出てくる部分は妥協するしかない
0521名無しサンプリング@48kHz
垢版 |
2020/11/04(水) 20:42:39.93ID:O7ePg7E6
>>519
出音は外部で弄ってナンボの時代なのでダメなところはメロを直すとか切り貼りで対応する方が早いかな
人間ならブレス位置に気を付けて頑張って伸ばしてくれと指示すれば通じるがAIきりたんはブレスさせても厳しい時がある
0522名無しサンプリング@48kHz
垢版 |
2020/11/04(水) 23:03:57.42ID:bbLA/jli
ロングトーンは頑張っても1小節だね
こないだ2小節にまたがるロングトーン書いたら、ブレス置いてないのに
手前のノート無視で数秒ブレス吸い込んだあとロングトーン出力してて
肺活量まで人間ぽいんだなと妙に納得した

どうしてもロングトーンしたいなら、ロングトーン前のフレーズと
ロングトーンのみのフレーズに分けて波形でつなぎ合わせるかタイムストレッチ
どちらにしても波形レベルで、一発解決は今のところない
今後のバージョンアップでどこまで緩和されるかだな

ブレスなし早口は他の歌唱ソフトの得意とするところだから
適材適所で使い分けるのが吉だと思う
0523名無しサンプリング@48kHz
垢版 |
2020/11/05(木) 02:35:04.35ID:1nUGLBW9
ブレスも強いブレスとか長いブレスとか指示できたらいいのにな
大事な表現のひとつだし
0526名無しサンプリング@48kHz
垢版 |
2020/11/05(木) 10:06:10.53ID:K+uSqs4I
サイドチェーンで排他的処理できたっけ?
音楽の息継ぎ効果は、メイントラックに大音量のバスドラ等を重ねてコンプで潰して、バスドラ等が爆音で鳴った瞬間だけメイントラックの音量が下がる感じ
0528591
垢版 |
2020/11/09(月) 22:39:51.71ID:PZTTXfaH
>>521
ロングトーンで後半が苦しくなるのならきりたんの個性ってことでいいと思うんだけど、
子音のほうが破綻してしまうのはプログラムの改善を期待したいところだなぁ。

とりあえずきりたんには出来ないと割り切って出来るギリギリまでやってくれればいいやってことで
長さを縮めたけど思ったほど不自然にはならなかったわ。
二小節のところを一小節にしても案外こんなもんなんだな。
0529名無しサンプリング@48kHz
垢版 |
2020/11/10(火) 01:14:56.16ID:Qk9xnhDr
まだ母音のコントロールまでは気が回ってない感じだよね
ビブラート、ポルタメントとか、複雑だから難しいんだろうな
演歌や民謡の歌い方みたいに音程を完全に移動する歌唱法もあるし
言いたいことは自分で直したいから編集ソフトくれ
0533名無しサンプリング@48kHz
垢版 |
2020/11/26(木) 20:30:31.07ID:T67RdJAm
合唱するときにちょっとづつパラメータをずらしても
結局は同じ声だったら合唱って感じになりにくいんよね。
声の種類が増えるのはありがたいッス。
0534名無しサンプリング@48kHz
垢版 |
2020/11/29(日) 10:26:33.05ID:mh/zzP6u
シンガー違えばタイミングやピッチが微妙に違うから、ただ重ねても自然な合唱になりそうだね
東北三姉妹揃うとアイドルグループっぽい曲が合いそうなので楽しみ
0535名無しサンプリング@48kHz
垢版 |
2020/11/29(日) 12:29:49.76ID:2DmpSPbe
ボカロの場合はシンガー違ってもコピペだと変に打ち消し合ったりするから手動でずらしてたな
0537名無しサンプリング@48kHz
垢版 |
2020/12/22(火) 17:38:15.92ID:/pCy/3DL
新しい歌声モデル来てるね
0540名無しサンプリング@48kHz
垢版 |
2020/12/25(金) 06:29:19.40ID:cxSMLJak
学習の質と量を上げていけるということらしいから今後も期待できるね
来年もおそらくNEUTRINOが最強エンジンとして君臨するだろう
0541名無しサンプリング@48kHz
垢版 |
2020/12/25(金) 09:15:50.57ID:JaTomVDW
ファルセット(裏声?)の実装がまだなので対応が楽しみやな。
SyntheV AIの紅蓮歌では裏声出してたからCeVIO AIも出来るんだろうけど。
0542名無しサンプリング@48kHz
垢版 |
2020/12/26(土) 15:43:28.99ID:+yYSfJhE
同じモデル・パラメータでもバージョンによって結構出音が違うね
一概に新しいバージョンが良いとも限らない
ひょっとしてWin/Mac/オンラインのプラットフォーム違いでも出音が変わるのかな
0544名無しサンプリング@48kHz
垢版 |
2020/12/30(水) 16:41:54.12ID:Ajyqaj1n
AIきりたん最新モデルでも稀に一部がささやき声になるバグあるね
調声ツール使ってもピッチの線がそこだけ途切れてて、鉛筆で書き足すこともできない
0545名無しサンプリング@48kHz
垢版 |
2020/12/30(水) 20:23:49.28ID:DemwQ+ei
きりたんGUI付いたのか?
0547名無しサンプリング@48kHz
垢版 |
2020/12/30(水) 21:04:23.69ID:DemwQ+ei
何が言いたいかっつーと

> 調声ツール使ってもピッチの線がそこだけ途切れてて、鉛筆で書き足すこともできない

これはきりたん外のツールの問題できりたんの問題じゃないのでは
0548名無しサンプリング@48kHz
垢版 |
2020/12/30(水) 21:05:31.26ID:Nv+3x61m
ああ、そういう意味か
実際のデータをツール開発者さんに送って見てもらうのがいいかもしれないな。
0551名無しサンプリング@48kHz
垢版 |
2020/12/31(木) 00:06:21.62ID:LAukCy7q
>>544だけど非公式ツールの話だって把握はしてたけど区別なく話してしまって申し訳ない
外部の調声ツールを使わない段階でまずささやき声になってて、それをその調声ツールで治そうと思っても
「ピッチの線が途切れてて〜」って状態になってて治せない

歌詞を変える前は正常だったし、キーを半音下げて調声ツールで読み込んでからツール内で半音上げて出力っていう手順で一応
普通の声になるんだけど、一応NEUTRINO公式とツール開発者に教えたほうがいいかもしれない
0554名無しサンプリング@48kHz
垢版 |
2021/01/01(金) 12:27:49.67ID:9gq61SZd
ボカロからここまで進化したのは素直に凄いと思うが
いまだに何か下手糞なのはなんなんだ
声をエミュレートするにはパラメーターが足りないということか
0556名無しサンプリング@48kHz
垢版 |
2021/01/01(金) 16:51:29.48ID:mSvUuC5p
学習時に与えられるデータとパラメータの量と質でだいたい決まるからな
エンジンの調整はあまり関係ない(触れば変わるが必ずしも良い方向へ変わるとは限らない)
と思う
ユーザはガチャを引きながら美味しい部分をかき集めてなんとかする
0557名無しサンプリング@48kHz
垢版 |
2021/01/01(金) 16:55:29.89ID:LDqYMpRh
Voice Coder方式とDNN方式の相違を理解せずに
要素還元主義の更に一例に過ぎないVoice Coderを万能モデルと思い込んで
「パラメータガー」と言っておけば本質を外さない筈だとタカをくくるハッタリ老人って居るよな

DNNは限られた数の教師データを高次ベクトル空間の特徴量に還元・学習し、教師データとよく似たデータを生成する手法であり、パラメータ合成方式とは異なる手法
0559名無しサンプリング@48kHz
垢版 |
2021/01/01(金) 16:57:29.91ID:LDqYMpRh
頭の病気が原因で無限に妄想を紡ぎ出す欠陥生物は相手にする価値のないゴミクズだ
0560名無しサンプリング@48kHz
垢版 |
2021/01/01(金) 17:00:24.28ID:mSvUuC5p
もう教師なし学習に比重をおかないといけない段階に来ている
NEUTRINOが学習でGANを使っているのかどうかは知らない
0561名無しサンプリング@48kHz
垢版 |
2021/01/01(金) 17:03:39.35ID:mSvUuC5p
これから追加で必要なパラメータは声の明るさや口の開け具合、喉の開き具合、息の入れ具合など
学習元である歌手本人が意識的にそれを講じることで生まれる声質の変化と、その数値化かなと思う
そこまでやる学習コストは尋常じゃないだろう
0565名無しサンプリング@48kHz
垢版 |
2021/01/01(金) 17:15:31.99ID:mSvUuC5p
無料で仮歌が出せるんだから強いわ。シンガーの種類も順調に増えてるし。
歌声合成界隈において、MMDが出た当時の3DCG界隈のようなインパクトがあったんじゃないかね
DTMステーションでNEUTRINO他の合成シンガーシェアを調べてくれるといいんだが
0566名無しサンプリング@48kHz
垢版 |
2021/01/01(金) 17:16:09.42ID:zlEa8Df3
とりあえず駿台偏差値48の底辺国立大理学部に間違って入り込むと、いまどきDNNの概念すら知らずに
DNN方式をパラメータ合成だと決め付けて発狂してうんちを漏らす異常者が待ち構えているから
関わらない方が良い
0569名無しサンプリング@48kHz
垢版 |
2021/01/01(金) 19:33:27.72ID:9gq61SZd
いわゆるブライト感の学習とかは実際の人間のボイトレを参考にするのがいいかもな
もっというと後付の空間系エフェクターで
口の中をエミュレートする
口の開け閉めだけ真似るだけでもかなり違いそう
0570名無しサンプリング@48kHz
垢版 |
2021/01/02(土) 04:50:21.07ID:bN5LBkyE
今のNEUTRINOはDAW内で完結できず、めんどくさいのが欠点だな。フロントエンド的なものをVSTiあたりで作れたら便利になりそうな予感はある。
あとは、人らしく歌うけど、思い通りには歌わない問題か。

CevioAIやSynthesizerVも出てきそうだし、今後もいい方向に発展していきそうで希望がもてる。
0571名無しサンプリング@48kHz
垢版 |
2021/01/02(土) 19:39:07.88ID:nSKuKmMl
VST化は先にCeVIO AI Proが実施するんじゃなかろうか
それを見てから追随するなり、さらに改良した連携を模索するなり
0579名無しサンプリング@48kHz
垢版 |
2021/01/24(日) 23:33:24.64ID:SQQJMVo5
コメント有難うございました。DAWで直接エディットされている方もいらっしゃるんですね。自分は調声支援ツールで調声、DAWで二次調声という非効率なやり方をしてます。DAWで直接調声できるいいボーカルエディタが有ればなぁって思ってました。支援ツールはとても有難いのですが、スコアを書き換えると調声は一からやり直しですよね。(自分の認識合ってるかよくわからないですが)
0583名無しサンプリング@48kHz
垢版 |
2021/01/26(火) 01:17:55.17ID:lCa3utVM
教えてください

今日初めてNEUTRINOを使ってみたんですが
アウトプットフォルダににbap、f0、mgcファイルは作られるのにwavだけ生成されません

cmdの内容を覗いてみると
「Error:Failed tu run NSF. Please check log(NSF/NSF.log).」
ってのが見えたんで、

NEUTRINOの中のNSFフォルダにあったlogを見てみたら
「FAILED in GPU initialization: CUDA driver version is insufficient for CUDA runtime version」
という記載がありました

これってCUDAドライバーってのをインストールすればなんとかなるんですかね?
0585名無しサンプリング@48kHz
垢版 |
2021/01/26(火) 09:24:25.84ID:aYkpITvX
そのエラー出たときはGPUの最新版をアプデ出来るのにしてないときに出た
あとmusescoreで作ってるなら息が続かないほど歌わせてるときにも出た
間に少しでいいから休符いれたら直った
あくまで参考で
>>583
0587名無しサンプリング@48kHz
垢版 |
2021/01/26(火) 22:44:11.00ID:18djas11
レスありがとうございます

グラボがダメなんですかね
ワイのグラボは「Intel HD Graphics 4600」というざーこ♪ざこざこ、ざぁ〜こっ♪なグラボなんで
やはりお話にならないんでしょうか


で、この場合は調べた限りだと以下の2通りやり方があるのかと思ったのですが、合ってますかね?

(1) ひとつは>>584さんが言うようにWorld版ってのでWAVを生成する方法
 このWorld版ってのは
 @公式ページで0.200以前の過去バージョンを入手するか、あるいは
 ARun.batファイルの
 echo %date% %time% : start NSF
 bin\NSF_IO.exe score\label\full\〜
 って行の前に「:」を入れるって理解でいいんでしょうか?

(2) あとなんか調べたら
「NEUTRINOオンライン版でGoogleコラボラトリーを使った高速処理+NSF処理をしてみよう」
とかいう記事が見つかったんですが、
これはGoogleコラボラトリーとかいうクラウド上のデータを借用することで
ワイのザコザコグラボでもNSFを使ってWAVを生成できるってことでしょうか?

>>585
ありがとうございます
アプデもしてみます(´・ω・`)
0588名無しサンプリング@48kHz
垢版 |
2021/01/26(火) 23:06:59.70ID:WOzRnKb2
>>587
それってCPU内蔵機能ですよね。世間ではそれをグラボとは呼びません。
別途でCUDAが動くグラボを買ってきて挿せばGPU版が動くんじゃないかと思います。

でNSFは書かれたとおり自分のPCの能力は使いませんのでそちらをお試しあれ
0589名無しサンプリング@48kHz
垢版 |
2021/01/26(火) 23:30:00.27ID:f1Ywme4d
>>587
うん。グラボが対応してない。
Ver0.4 のWinかMacのインストーラー(Onlineじゃない奴)で問題ないはず・・・

NSF_IOのコメントアウトはいらない
(2)は、難易度が上がるから忘れていい

>NEUTRINOの中のNSFフォルダにあったlogを見てみたら
>「FAILED in GPU initialization: CUDA driver version is insufficient for CUDA runtime version」
問題ない。未対応なら出る。俺のも出てるがWaveは作成されてる。

Run.bat 実行時の出力で以下が出てれば、WORLDで動いてるはず
no NVIDIA-GPU was detected.
executing in CPU mode...
0590名無しサンプリング@48kHz
垢版 |
2021/01/26(火) 23:46:51.38ID:yp9OLToz
>>587
バージョンは最新で構わない
(1)のやり方(行の頭に「:」を入れる。「: bin\NSF_IO.exe〜」て感じ)でOK。world版の
wavファイルが作られる筈
これでできなければ何か別の原因
ちなみに(2)だと自分のPC環境に全く関係なくNSFが使える
0591名無しサンプリング@48kHz
垢版 |
2021/01/27(水) 00:17:53.61ID:hbLo4P1f
(1)の@はうまくいかず・・・
Aのコロン入れるヤツを試したらWAVが出力されてました!
めっちゃ元気に歌っとる・・・キリタンカワイイヤッター

>>588
基礎的な知識がなくてすみません・・・
グラボってオプションとして買ってきてPCの内部にぶっさすヤツですか(最近はUSB?)
WorldとNSFの比較動画を見たりして、今後検討してみます!

>>589
no NVIDIA-GPU was detected.
executing in CPU mode...
これは出てましたねえ!

グーグルコラボラトリーってのは確かに難易度高そうなので、
いただいたアドバイスに従って今はスルーしときます

>>590
できました!レスありがとうございます!


めっちゃ長文を投稿したのに、みなさんしっかり読んで丁寧に返信してくれてありがとうございます!
これからきりたんに好きな曲カバーしてもらったり、オリジナル曲を作りたいと思います。
本当にありがとうございましたm(_ _)m
0592名無しサンプリング@48kHz
垢版 |
2021/01/27(水) 00:23:03.49ID:H1mVpXhc
>>587
とりあえず、コマンドの出力結果残すようにしたら?

RunLog.bat を新規で作って以下の内容で保存して実行
Run.bat > Run.bat.log
0594名無しサンプリング@48kHz
垢版 |
2021/01/27(水) 00:54:15.01ID:Jtq9wxFv
>>591
とりあえずおめでとー
正直今お持ちの知識だとグラボ増設はハードルが高いと思うので、NSF使うなら
オンライン版の方がまだ近道かも、お金もいらないし
個人的には現時点ではNSFよりWorldの方が好み。NSFは何となくキツク聞こえる
0596名無しサンプリング@48kHz
垢版 |
2021/01/27(水) 01:31:09.23ID:jLKMtnW3
使いこなすにはややハード寄りなソフトだから最初のハードルが高いのは仕方ないか
とはいえGPUなくてもオフラインでもCPUで処理できないこともないのは有情だね時間かかるけど
0597名無しサンプリング@48kHz
垢版 |
2021/01/27(水) 01:46:03.30ID:n04sXKhL
その「有情」という場違いな単語を
他の意味の通る表現に書き換えてくれ

造語症臭いな
0598名無しサンプリング@48kHz
垢版 |
2021/01/27(水) 02:56:19.92ID:QTTWKNsw
他の板やスレならわからんでもないが歌詞書く人のスレで造語症気にしてどーする
ボカロなんて造語だらけなんだからイチイチ気にしてたら精神持たんだろ
0600587
垢版 |
2021/01/27(水) 23:03:50.62ID:7zcF0V6l
>>592
出力結果を残すとどうなるんですか?

>>594
ありがとうございます
そうなんですか、WorldもNSFもどっちもいいんですね
とりあえずしばらくWorldを使ってみます
0601名無しサンプリング@48kHz
垢版 |
2021/01/27(水) 23:36:24.94ID:H1mVpXhc
>>600
Dos窓からコマンド実行しているなら不要だが、エクスプローラー等から実行した場合、終了時に窓が閉じられる。ログが親切に出ないアプリに関しては一般的に使われる
0606名無しサンプリング@48kHz
垢版 |
2021/02/02(火) 01:28:48.16ID:YjWI8+Yx
@21日も残ってるじゃない
さすがにボイチェビ勢連続クラファン(琴葉、ついな、京町、ずん子)で勢い落ちてたけど。それでもジリジリと安定して早いな。
まぁコレ終わっても今度はONE IA関連のクラファンスタートするという。
0608名無しサンプリング@48kHz
垢版 |
2021/02/04(木) 17:57:28.92ID:QkIxHFSX
CevioもSynthVもAI版出してきたけど、なんかボカロ臭が残ってるんだよな
Neutrinoが現状一番生歌っぽい
0609名無しサンプリング@48kHz
垢版 |
2021/02/04(木) 18:14:47.28ID:9ZTojQNt
個人ごとにボカロ臭いと思うポイント違うだろうけど
俺はボカロ特有の鼻声とビブラートのかかりかたを聴くとボカロ臭いと思うし
NEUTRINOはそのへん優秀だと思う
0610名無しサンプリング@48kHz
垢版 |
2021/02/04(木) 20:14:10.65ID:TSIT+lOs
CeVIOゆかりさんはボカロに寄せてるからしゃーない
ボカロに近いAIシンガーだとロックに強くなるし
AIきりたんは偏在するから曲によって使い分けられる

フォルマントシフト(声質)の変更はNEUTRINOの方が自然な気がする
CeVIOきりたん声質-50だと結構ケロケロだったし
0611名無しサンプリング@48kHz
垢版 |
2021/02/04(木) 20:17:19.34ID:TSIT+lOs
てかCeVIO_AIでも無声化バグ出ててワロス
初期のNEUTRINOよりは発生数が稀みたいだけど機械学習音源の宿命なんかね
0612名無しサンプリング@48kHz
垢版 |
2021/02/04(木) 22:55:12.74ID:J3Oi/k3i
久々にニュートリノで遊んだなう
dominoでマウスポチポチしながら基本耳コピ。BPMは原曲と同時再生で手探り→musescoreで歌詞入れ→ニュートリノで出力→VocalShifterで調声→Audacityでエフェクト付け。曲と合わせる
音楽の知識が義務教育で止まってるから、歌詞入れまでがいつも面倒くさい(特に最新の曲はカンニング出来ない)。楽な方法があったら教えてほしいです
ちなみに音の加工は楽しい
0614名無しサンプリング@48kHz
垢版 |
2021/02/06(土) 01:52:34.24ID:QRd7DKvo
バージョン上がる毎にもう調声いらないんじゃね?って思うわ
まあ曲にもよるし、調声した方が楽しいけど
0616名無しサンプリング@48kHz
垢版 |
2021/02/08(月) 07:51:52.86ID:Ducs3k0t
さすがに、まだ調声無しはきついかな。
ユーザーの調声情報をディープラーニングで学習させる事ができたらいいのにね。
0617名無しサンプリング@48kHz
垢版 |
2021/02/08(月) 13:12:36.14ID:fiTNXTgY
多少のやんちゃは個性の内っていうスタンス
さすがに子音強すぎとかロングトーン最後のピッチ上ずりとかはDAWに取り込んだ
後でDAW側で修正するけど
0619名無しサンプリング@48kHz
垢版 |
2021/02/09(火) 01:39:12.14ID:e2twlp43
連投すまん
>>617
DOW側で修正ってMelodyne?
自分ボカロエディタの調整は全く国ならないだけど
Melodyneで修正めちゃくちゃきついくない?
0620名無しサンプリング@48kHz
垢版 |
2021/02/09(火) 19:00:42.05ID:TSjSaEAZ
>>619
Logicでやってる
子音の強すぎるところを下げるとかは普通にオートメーション、ピッチの調整は
LogicのFlexツール。実ボーカルを編集するのと同じイメージでやってるけど、
おそらくMelodyneもだけどそんなにしんどくはないと思うけどな。
0621名無しサンプリング@48kHz
垢版 |
2021/02/10(水) 05:47:23.05ID:67BETVll
Melodyneの編集作業は癖が強くてやりにくいのはそうなんだけど、
一番仕上がりが良いのはMelodyneなんだよな
換えが効かない
0622名無しサンプリング@48kHz
垢版 |
2021/02/10(水) 07:01:53.27ID:x+OuW9FK
MelodyneはEDMでよくあるゴッドボイスとかケロケロとかチョップとかやって遊ぶのにしか使ってない
やろうと思えばボカロのカクカクした部分を滑らかにしたりできるのはわかるがAIより上手くできる気がしない
0623名無しサンプリング@48kHz
垢版 |
2021/02/10(水) 12:41:23.14ID:A3tuip5/
>>620
あたしかに ここニュートリノだから撮り後の修正みたいにするしかないのか
ニュートリノもピアプロみたいにvstauでできるようになったらなぁー(願望)
0626名無しサンプリング@48kHz
垢版 |
2021/02/20(土) 12:42:55.76ID:pxvB7CVt
きりたんはストレートなロック以外は調整必要だなって思う
というかきりたん以外はあんまりデキが良くない気がする
初登場時のあれは神憑り的に上手くいっただけなのかもしれない
0627名無しサンプリング@48kHz
垢版 |
2021/02/20(土) 15:31:22.25ID:PMaLxU/J
イタコもきりたんと同程度に良いと思うけどな
めろうはもうちょっと成長待ち(まだα版だし)
他2つはまぁ・・・
0632名無しサンプリング@48kHz
垢版 |
2021/02/20(土) 18:36:38.04ID:PmV0ltA+
たぶんずん子はめろうに近い感じになるんだろうな
ロングトーンに強い声になってくれると嬉しい
0633名無しサンプリング@48kHz
垢版 |
2021/02/20(土) 18:39:39.70ID:iO3t0tcN
知名度はさすがのトップバッターきりたん
イタコさん声は好きだけど二重母音の繋がりがまだぎこちない
めろうさんは貴重なオリジナル音源でキャラ依存低めを好む層の拠り所
謡子さんはオペラ・ミュージカル・クラシカルクロスオーバー向けか
0636名無しサンプリング@48kHz
垢版 |
2021/02/21(日) 00:37:23.82ID:k+4Ue/vi
きりたんDBって明大の教授がきっかけだけど
コイントスで表出てなかったら博士課程進んでないので教授にになっておらず
教授になってもTwitterのつぶやきをずん子が見逃してたらきりたんDB作られず
AIきりたんも生まれなかったんやな。
0638名無しサンプリング@48kHz
垢版 |
2021/02/21(日) 08:51:20.59ID:cqnxJGim
それこんな所でいまさら蘊蓄するまでもなく
本人がTwitterで前から言ってるし
関連本家スレにたまーに本人書き込みあるじゃん

AI方式(機械学習)とVOice CODER方式(人間が解析的に設計する従来方式)は対立する概念ではなく、相補的に機能し発展する手法である事、
特に「人間の」音楽表現には必須である楽器としての歌声の制御は、前者(機械学習)の観点だけでは不充分で後者(人間による設計と制御)の発展形として今後拡充する必要がある
といった議論は関連本家スレで行われ、
新しい研究プロジェクトとして立ち上げたそうだ。
0640名無しサンプリング@48kHz
垢版 |
2021/02/21(日) 12:01:20.66ID:k+4Ue/vi
もしかして自分へのレスなんだろうか?
たんにAIきりたんが生まれない世界線も3分の2くらいはあったんやろなー的なカキコやったんやが
0644名無しサンプリング@48kHz
垢版 |
2021/02/22(月) 17:37:15.57ID:YOB0X/48
なにしろ東北家公式の貪欲な活動はハンパじゃない
創作界隈にとっては良い環境だわな
0645名無しサンプリング@48kHz
垢版 |
2021/02/26(金) 15:20:22.58ID:AZR0kqhX
東北系は震災便乗商法的なのと関わってた榊が胡散臭いので使わないことにしてる
0648名無しサンプリング@48kHz
垢版 |
2021/02/26(金) 17:42:39.32ID:Y0MSTZr6
プロジェクトの行方はともかく、ずん子のAI歌声の出来が良くなることを願っとるよ
0651名無しサンプリング@48kHz
垢版 |
2021/03/15(月) 01:23:22.48ID:7DlPIHdj
いい感じに抑揚つけてくれるけどこれは何を元にしてくれてるの?
音の上下?歌詞のパターン?
色々実験してみるか
0652名無しサンプリング@48kHz
垢版 |
2021/03/18(木) 14:21:01.85ID:0WtnozMk
>>651
諸々のパラメータを元に機械学習で重みづけを決定しているので
ちょっとした実験で傾向をつかめるほどわかりやすくはないよ。
0654名無しサンプリング@48kHz
垢版 |
2021/03/25(木) 20:38:27.77ID:ZkK52Nq8
男声ライブラリ楽しみ
0656名無しサンプリング@48kHz
垢版 |
2021/03/26(金) 20:43:01.13ID:P+KkLNzK
男声ライブラリは来月に延期ですってね
0657名無しサンプリング@48kHz
垢版 |
2021/03/26(金) 23:15:53.29ID:UHOnzGu8
男性ボーカルは来月中旬に延期決定だそうだ
3月に急遽収録が入ったかららしいがずん子クラファンのやつかなー?
0658名無しサンプリング@48kHz
垢版 |
2021/03/27(土) 03:47:34.88ID:dsKGlHAX
知る限りはずん子だけでしょうねえ
クラファン側からゴリ押ししたのかなあ・・・
0659名無しサンプリング@48kHz
垢版 |
2021/03/27(土) 08:18:13.97ID:3RbQv0Cp
男声はどうでもいいけど、
・めろうの改善
・ブレスのバグの改善
お願いしたいのはこの2点かな
0662名無しサンプリング@48kHz
垢版 |
2021/03/27(土) 23:27:13.30ID:Ry2QF6V/
AIシンガーはどのソフトでも結構スケージュール逼迫してるっぽい
ずん子クラファンとNEUTRINOの年内スケジュール発表ほぼ同時だったしクラファン成功する前にもしかすると収録枠だけは抑えていたのでは?
ついなちゃんもSynthV AI収録は今しかチャンス無いとか言って駆け込みクラファンしてた
0663名無しサンプリング@48kHz
垢版 |
2021/03/27(土) 23:32:18.19ID:dsKGlHAX
肝心のヤマハがボカロAIを製品化する気なさそうなのがなんとも寂しい
せっかくひばりでノウハウ得られただろうにな
0664名無しサンプリング@48kHz
垢版 |
2021/03/31(水) 19:29:02.21ID:jhRt30Xw
NEUTRINOのGUIは秋頃公開予定だそうな

>>手法的な面でも機械学習ベースの手法オンリーで構成するのでは無く、信号処理・経験則的なヒューリスティックな手法も取り入れていけたらと思っています

信号処理・経験則的なヒューリスティックってなんじゃらほい
0666名無しサンプリング@48kHz
垢版 |
2021/03/31(水) 20:14:49.59ID:g2iR9XwX
ver0.430で「ブレス音のノイズを緩和した」って書いてあるけど、直ってない・・・
めろうは何となく良くなった
0671名無しサンプリング@48kHz
垢版 |
2021/04/01(木) 00:27:48.18ID:gZcgsLsR
めろうとなんたらの息多めライブラリはNSFと相性悪いのでWORLD推奨らしい
普段はGPU対応のNSFでテストして仕上げはWORLDって感じか
0672名無しサンプリング@48kHz
垢版 |
2021/04/02(金) 09:44:28.74ID:b1chp1Ov
AIシンガーテックってので男性シンガーチラ見せするらしい
塩沢兼人みたいな声だったら良いんだが
0674名無しサンプリング@48kHz
垢版 |
2021/04/02(金) 11:16:09.89ID:u2gDXbL4
男の声聞き続けて調整すんの拷問なんだろうな・・・
と、思ったがソースのボイスがないだけか?
0678名無しサンプリング@48kHz
垢版 |
2021/04/02(金) 19:19:52.61ID:b1chp1Ov
夏目悠李も玄武も何故かKAITOっぽく
ガクぽは知らん

めろうの男性化のアカペラは中々良かった
0682名無しサンプリング@48kHz
垢版 |
2021/04/03(土) 18:28:59.18ID:vlxH4L5H
成果物が似ていてもエンジンは全然違うというのは面白いのでどんどんやってほしい
0686名無しサンプリング@48kHz
垢版 |
2021/04/15(木) 12:28:01.92ID:EWI5hP1P
そろそろ中旬ですけど男性ボーカル出るんですかね?
無個性のように見えて個性強いのであまり使われそうなイメージですが。
0688名無しサンプリング@48kHz
垢版 |
2021/04/21(水) 09:53:46.29ID:0bfNoyae
ブレスの不具合、ver0.430で直ってなかったの作者さんも認識してたみたいで
4/23に直すって言ってくれてる。よかったよかった
0689名無しサンプリング@48kHz
垢版 |
2021/04/21(水) 11:11:45.64ID:MiMawKuz
基本的なことですまんがブレスは音符と音符の間に入れないと機能しない?
要は休符と音符の間に入れても意味ないのかなーと。
0690名無しサンプリング@48kHz
垢版 |
2021/04/21(水) 12:00:59.47ID:0bfNoyae
>>689
自分MuseScoreでやってるけど、ブレス記号は休符に付けても機能せず、音符に
付けても直後が休符だと機能しないみたい
面白いのは、付けた音符の長さでブレスの長さも変わるところ。全音符に付けると
一拍分くらいの長さのブレスになるので、実質付点2分音符+4分休符て感じにできる
0692名無しサンプリング@48kHz
垢版 |
2021/04/21(水) 12:35:30.22ID:Kc1RKVLN
>>690
なるほど、有益な情報をありがとう。
ブレスがついたりつかなかったりするからそこを意識してみるよ。
0693名無しサンプリング@48kHz
垢版 |
2021/04/21(水) 12:48:18.63ID:0bfNoyae
但し現時点では一拍分くらいの(長い)ブレスは妙にノイジーになってしまうっぽいので
その辺を改善してもらえたらなぁと思ってる
0696名無しサンプリング@48kHz
垢版 |
2021/04/21(水) 20:26:02.27ID:a0gPEd3s
ネーミング(No.7)もキャラデザもNEUTRINO向けらしいけど
きりたん・イタコ・謡子・JSUT・めろう・ナクモに続く7番目って意味なのかな?
だとするとずん子はその後に公開か(6〜7月予定らしい)
てかここ最近のアクティビティが凄いなー
0698名無しサンプリング@48kHz
垢版 |
2021/04/22(木) 01:51:23.45ID:ktrApGX+
歌唱DB用の著作権フリー楽曲が無いなら全曲作ればいいじゃないとか誰もが思いつくけど手間暇技術不足で出来ない事を仕事の片手間にやってしまうヤベー声優がいるらしい
0699名無しサンプリング@48kHz
垢版 |
2021/04/22(木) 01:54:35.30ID:xjwwWcST
人気声優なのかどうかよく分からんけどマルチタレントという意味では業界でもかなりの兵
0700名無しサンプリング@48kHz
垢版 |
2021/04/22(木) 10:16:26.38ID:CEPkZ2mh
一番面倒なのは発声のタイムコード付けだろうけど
それがテンプレ化するとか起業して有償で引き受けるとか
とにかく個人がちょっと頑張れば製品化できるまでやって欲しい
0701名無しサンプリング@48kHz
垢版 |
2021/04/22(木) 12:09:04.07ID:xjwwWcST
有償引受は今まさにやってるんじゃないの
個人でも金持ちなら依頼できるレベルの金額だろ
0703名無しサンプリング@48kHz
垢版 |
2021/04/22(木) 21:55:49.27ID:QylznwrR
あくまで学習用で観賞用ではない前提であれば完パケ・フルコーラスである必要がないとはいえ
本業の片手間でやっちゃうなんて頭が下がるわ
歌詞に関しては音素の穴を埋めるために特殊な単語とかも使ってそうだけど
ボカロの「呪文」ほどじゃないにしろ電波ソングやナンセンス歌詞のようなカオス状態になってそう
0705名無しサンプリング@48kHz
垢版 |
2021/04/23(金) 13:48:02.99ID:uWc/n5v3
もう一部のAIプログラマーがAI自動ラベリングを試行錯誤しててラベリング作業そのものがちょっとした手直し程度で良くなるかも
歌声DBの規格決まってるなら最適化で更に精度上がりそうだけど
0706名無しサンプリング@48kHz
垢版 |
2021/04/23(金) 13:52:38.83ID:IAHALOzQ
AIプログラマー呼ばわりワロタ
こいつミュージシャンを楽隊屋、聴衆を聴かせて乞食、購入者を購入厨とか呼ぶ構って乞食だな
0707名無しサンプリング@48kHz
垢版 |
2021/04/23(金) 13:54:27.66ID:IAHALOzQ
ラベリングは基本手作業、AIで自動化という話はどっから出てきたのかな、ソースがあるのか想像話なのか
0711名無しサンプリング@48kHz
垢版 |
2021/04/23(金) 19:56:01.38ID:uWc/n5v3
初っ端からAIナクモ、AIシンガーナクモ、ナクモ(NEUTRINO)でタグ分散しててわろす
0713名無しサンプリング@48kHz
垢版 |
2021/04/23(金) 22:58:48.24ID:BF1myToT
>>708
その判断はピンポイントでは的確だと思うけど
この板は妄想デマを流す異常者が張り付いているから
ソースを添えて話をする習慣がないのは頂けないね
0714名無しサンプリング@48kHz
垢版 |
2021/04/23(金) 23:19:24.08ID:dCsAyzfK
最近の動向を知らないだけでしょ
ソース求める前にもっとアンテナ広げた方がいいよ
0715名無しサンプリング@48kHz
垢版 |
2021/04/23(金) 23:25:08.80ID:BF1myToT
ソース出せないキチガイジおばさんの方か

この人英文がまともに読めないから
ソースを出したなら知ってて当然の話を知らなかったり
ソースに書かれていない話をソースがあると言い張ったり
毎回トラブルを起こして他の研究者から失笑されるからソースを出せなくなったんだよな
0716名無しサンプリング@48kHz
垢版 |
2021/04/23(金) 23:26:31.57ID:dCsAyzfK
論文がないとソースじゃないとか言い出した人までいるからね
技術的なことはあえて触れない方がスレのためだよ
0717名無しサンプリング@48kHz
垢版 |
2021/04/23(金) 23:27:11.76ID:BF1myToT
普通の人はソースを出せと言われたら、ソースを出す
言い訳して出さないのはソースを出せない印だと
皆は理解する
他人を罵倒しておけばソースを出せない事を誤魔化せると思い込んで54年間生きている惨めな生き物だ
0718名無しサンプリング@48kHz
垢版 |
2021/04/23(金) 23:30:17.27ID:BF1myToT
・専攻分野の学位論文未提出
・英語論文の紹介や引用に毎度深刻な誤訳や超解釈があり、まともに読みこなせていない
・匿名掲示板に入り浸り自演連投でスレを埋め立て、他の人からツッコミを受けると宇宙の法則が狂ったかのように罵倒と罵詈雑言をする

どう見てもただの発達障害
0721名無しサンプリング@48kHz
垢版 |
2021/04/24(土) 00:51:43.76ID:621xO+wR
>>693
ver0.431で、一拍分くらいのブレスも違和感がないくらいまで改善してもらえてる。
まだ少しおかしくなることがあるけど
0722名無しサンプリング@48kHz
垢版 |
2021/04/24(土) 08:08:40.19ID:8kmDSpta
なんか自動ラベリングで荒れてるな
投稿されてる動画見た感じ現状は半自動ラベリングな上に最後は手動だったな
出来としてはNEUTRINO比較で70〜90%位な出来だった

てかNEUTRINOというAIシンガーの出来の基準があると比較が楽だな
0724名無しサンプリング@48kHz
垢版 |
2021/04/24(土) 10:08:06.47ID:acV/zlok
NSFよりもWORLDの完成度が上がってきてるというのはちょっと意外だな
採用する学習本の声質次第ではNSFが神がかったりするんだろうか
0725名無しサンプリング@48kHz
垢版 |
2021/04/24(土) 10:38:08.11ID:8exuPJ47
ナクモやべえわw
はよGUI実装して5000円以下で販売して
開発途上という欠陥品を高い値段でドヤ顔して売ってる勢を駆逐してほしい
0728名無しサンプリング@48kHz
垢版 |
2021/04/24(土) 21:27:31.28ID:UrtkdrOS
ボカロでも同じでは
得意ジャンルや適合する音域を無視されて作られているボカロ楽曲の多いこと多いこと
0729名無しサンプリング@48kHz
垢版 |
2021/04/24(土) 21:30:17.15ID:acV/zlok
まあ作り手への批判はやめとこうか
得意な音域やテンポがあるという点はAIになってもまったく変わらんな
0731名無しサンプリング@48kHz
垢版 |
2021/04/26(月) 02:03:38.64ID:P0YVVe65
NEUTRINOから始めたからボカロはよくわからんのだけど
どっかの記事でボカロはMIDI楽器、NEUTRINOは歌声合成ソフト、っての見て
ボカロは得意な音域とかは特にないもんなんだと思ってたけどそうでもないのかな
0732名無しサンプリング@48kHz
垢版 |
2021/04/26(月) 02:47:53.57ID:xuuHQPt8
ボカロでもMachaやLily V3や優月ゆかりはそんなにケロケロ感ないような調整ができるけどな。妙に高音を歌わせるような使い方でなければ。
上記のボイスがボカロの中では比較的まともなのであって、ボカロ特有の違和感が出てしまう音源が多いのも事実。

あと、ミックスで大胆にEQでカットしていくこと。単体で聞くと目も当てられないような状態にして、ギターやベースに上手く乗せると、曲全体として違和感がなくなる。
他の楽器の音が少ない、ソロとか静かなパートではその手は使えない。リバー部とか強めてオケとなじませて使うぐらいか。
0733名無しサンプリング@48kHz
垢版 |
2021/04/26(月) 11:10:20.35ID:4O9pLwXb
V5のkenとUTAUの最新音源のなんちゃら連続音?は割といい線行ってたけど
きりたんピッチを手動で移植したAI初音ミクはかなり自然だったし
ボカロがAIピッチ生成機能もてば割と解決しそうな
0734名無しサンプリング@48kHz
垢版 |
2021/04/26(月) 12:30:16.72ID:LqUWTOVs
ボカロは「新しい楽器」だと言い張って人の声と比較するのを否定する奴らもいるんだけど、
実際問題としてどうしてもボカロでなければならないボカロを前提とした歌ってほとんど無いんよね。
ボカロソングのほとんどはやっぱ人が歌ったほうが良い感じになる。
ボカロソングの隆盛が始まってそこそこの時間がたった今でも。

十分に上手い歌い手を確保できないときでも最低限度として歌として成立させられる、
つまりはアマチュアを底上げする道具がボカロなんだと思う。

そういうボカロはアマチュアの道具だという前提に立てば
「上手く調整すれば上手く歌ってくれる」ってのはそれほど役に立たなくて、
「いいかげんな指定でもほどほどには歌ってくれる」のほうがありがたいと思うし、
そう思ってたところに現れた NEUTRINO は素晴らしい道具に感じる。

(念のために断っておくが、こういう前提に立つならという仮定なのでそうでない背景を否定するものではない。)
0735名無しサンプリング@48kHz
垢版 |
2021/04/26(月) 12:55:46.79ID:4O9pLwXb
いかにもボカロ曲だとケロケロ大丈夫だけど普通の曲でケロケロだと聞いてて萎える
0736名無しサンプリング@48kHz
垢版 |
2021/04/26(月) 13:03:08.33ID:gHK1AOiL
というか、身近に女性ボーカルを担当できる人材がいなかったから、ボカロを使っている人が多いと思う
有名ボカロ曲の作者には、ボカロがきっかけで女性ボーカルと組めるようになった人も少なくないよね

もう1つは、仮歌としてボカロを使う
あとは、カラオケを用意しておけば、気に入れば歌ってくれる人たちが現れる
JASRACからがんじがらめに管理されていない、誰もが歌えるフリーの曲が爆発的に増えたという点も、
ボカロ流行の大きな成果だったと思う
0737名無しサンプリング@48kHz
垢版 |
2021/04/26(月) 13:17:45.42ID:LqUWTOVs
今は主要な動画投稿サイトが JASRAC と包括契約しちゃったから逆に JASRAC 管理曲以外のほうが使いにくいんだよな。
管理されていなくても権利は存在するので、管理されていないということがマイナスに働く。
0745名無しサンプリング@48kHz
垢版 |
2021/05/12(水) 09:34:34.85ID:CA230bzK
これがフリーってのは凄いな
ひも付きじゃなく自由に使える音源がもっと増えて欲しいけど
0746名無しサンプリング@48kHz
垢版 |
2021/05/12(水) 09:36:53.44ID:nNFWxXtR
商業にも条件付きで採用できそうなラインを残したのが強いな
というか他の強豪が弱すぎた
0747名無しサンプリング@48kHz
垢版 |
2021/05/13(木) 19:25:11.12ID:H76cWMtY
自然さではNEUTRINOがぶっちぎり優勝だけど、細かいとこいじるのに非公式ツール必須で、
それでも出力結果は運任せなとこがあるから、ここらへんが改善されたら他ソフトは壊滅するな
0748名無しサンプリング@48kHz
垢版 |
2021/05/13(木) 19:28:40.28ID:Ig1mr10r
とはいえNEUTRINOの原理上そのへんは改善が困難なのでは? と思ってしまう
理解が浅いだけなら嬉しいが
0749名無しサンプリング@48kHz
垢版 |
2021/05/13(木) 19:42:47.94ID:H76cWMtY
調声支援ツールでピッチはいじれるけど、ダイナミクスはいじる前と変わらんから変な感じになるのとりあえず改善してほしい
音がちっさくなってるとこを拡大してマウスでポチポチして平らにしてみても元の音量が低いから音質おかしくなってしまう

あとフォルマントシフトのNSF対応と1音ずつフォルマントシフト変えれるようにして、あとかすれ声とか叫び系の声も指定して出せるようになってほしい
0750名無しサンプリング@48kHz
垢版 |
2021/05/13(木) 19:51:16.18ID:E5+/HCgL
学習パターンを何種類か作りこめば歌い方を選べるようには出来るのかも知れないね
ただ細かいとこまで利用者がコントロールすることやはり原理的に出来ないんじゃないかな
0751名無しサンプリング@48kHz
垢版 |
2021/05/13(木) 19:54:14.71ID:HXVeQJEk
細かいピッチやダイナミクスはDAWに取り込んでからいじるから(調声支援ツールは
使ってない)別に今のままでいいかな・・・
0752名無しサンプリング@48kHz
垢版 |
2021/05/13(木) 19:56:34.19ID:wj/UYDdx
DTMの初心者質問スレに間違って書いてしまったのですがこちらで質問させていただきます
曲に歌を付けるためにニュートリノを使っているんですが
スコアを変換して出力する際の出力後のファイル名(wav)は
Runの設定を毎回かえないといけないのでしょうか?
0754名無しサンプリング@48kHz
垢版 |
2021/05/13(木) 20:09:24.29ID:H76cWMtY
入力ファイル名をrun.batにセットしたら、出力もそのファイル名でされるのでは

batファイル魔改造して出力ファイル名を変える事もできるだろうけど、やり方はわからん
0759名無しサンプリング@48kHz
垢版 |
2021/05/13(木) 20:38:56.53ID:wv0mRmyE
上書き回避する古典的な手法としては出力ファイル名に年月日時秒を付与するってのがあったのでRun.batに追記すればできるね。

BASENAMEは引数として渡すのとRun.batを直接編集するのとどっちが早いのかしら。
0760名無しサンプリング@48kHz
垢版 |
2021/05/13(木) 21:54:42.47ID:+WkkmItD
set BASENAME=%~n1
に書き換えて、musicxmlファイルをRun.bat(またはそのショートカット)に
ドラッグすればいちいちファイル名書き換えなくてもいけるかも
誰か試してみれ
出力ファイル名は元々末尾に_synや_nsfが付加されたwavファイル名になるけど
そこも気に入らなければbatファイル書き換えれば何とかなると思う

今の仕組みではピッチやかすれ具合以外をコントロールできるような設計になってないよね
modelにバリエーション付けて、途中で切り替えたりはできるかもしれんけど
他の市販ソフトみたいにカーブ書いて可変するようなのは仕組みから変えないと難しいと思う
そもそもガチ調声から解放されて楽譜渡せば歌ってくれるのがコンセプトっぽいから
ガッツリいじりたければ他を当たったほうがいいのかも
0762名無しサンプリング@48kHz
垢版 |
2021/05/13(木) 23:01:57.51ID:gzpY3ACc
この長文のくどさと内容の簡単さのアンバランスさにニヤニヤした

バッチファイルの書き方自慢って20年前でも絶滅危惧種
0763名無しサンプリング@48kHz
垢版 |
2021/05/13(木) 23:10:21.76ID:wv0mRmyE
NEUTRINOだからこその懐かしいテク披露ではあるね
逆に言うとこういうちょっとした工夫のしどころがあるということで
0764名無しサンプリング@48kHz
垢版 |
2021/05/19(水) 07:46:31.29ID:mI6u/jCG
女性ボーカルってフォルマントシフトで男性化するけどイントネーションが女性なのでオカマになるんやな
男性音源のナクモ出たしオフラインで使ってるユーザーは声質差し替えで完璧なTS化できるのでは?
0765名無しサンプリング@48kHz
垢版 |
2021/06/15(火) 20:05:59.67ID:q3/Fb5k2
お、AIずん子のリリース日決定か
息成分多めの音源ってじゃじゃ馬なイメージだが大丈夫か?
0768名無しサンプリング@48kHz
垢版 |
2021/06/20(日) 21:44:17.92ID:jy+XzwG6
昨日初めて使ってみた。
Synth V のSaki aiのデータをmidiで出力してMusescoreでmxlにしてMellowに歌わせた。
途中にへ音記号が混入してたのに気付かずエラーが出て苦労した。
100点ではないが素直な声がいい。フォルマントを少し下げるとアニヲタと距離を置くお姉さんな声になっていいね
時々ドキっとするくらい色気
感じたわ
0772名無しサンプリング@48kHz
垢版 |
2021/06/21(月) 11:29:47.90ID:DI5HpzS1
7月5日からのずん子解禁が楽しみだのう
それまでにどれだけ先行者が使い込めるかによるところはあるが
0775名無しサンプリング@48kHz
垢版 |
2021/06/22(火) 03:02:56.95ID:3sEUr6N7
NEUTRINO AIずん子音源開発リザルト
2021/03/08 収録開始
2021/04/16 収録完了、音源制作開始
2021/06/21 CF支援者先行リリース
収録 40日
制作 66日
AIシンガートータル開発期間106日(概ね3ヶ月半)
(この間他音源のバグ取り最適化等実施)


うーん、歌声合成って割とすぐ作れるんやなぁ?
0776名無しサンプリング@48kHz
垢版 |
2021/06/22(火) 03:12:44.94ID:3sEUr6N7
資金調達開始しからリリースまで6ヶ月
資金調達完了してからリリースまで4ヶ月


すっごいスピーディーやな・・・
0779名無しサンプリング@48kHz
垢版 |
2021/06/23(水) 13:12:52.38ID:7DCEbQIX
リリースまでくそはやいな
確かにきりたんでワークフローつくったてのはあるかもしれないね
0780名無しサンプリング@48kHz
垢版 |
2021/06/23(水) 20:30:47.20ID:uhxn/Bso
ディープラーニングは学習のためのデータセット作りと環境作りが面倒くさいところあるから、それが終わってるとかなり楽なはず。今回は最も手間がかかる部分であろうデータセットのラベル付けがほぼ終わってると思うから、手間なのは音源の調整くらいなんじゃなかろうか

ところでロングトーンってどうやったら崩壊させずにすみますか?できればタイムストレッチは避けたいのですが
0782名無しサンプリング@48kHz
垢版 |
2021/06/23(水) 21:41:57.33ID:7JEyQigw
・肺活量足りてないか注意する
・sigさんのNEUTRINOエディターで修正
・スタイルシフトオプションの値を設定してみる
(キー変更+ピッチ変更ガチャを公式が機能として実装したオプション)
・キー変更+ピッチ変更ガチャ
0785名無しサンプリング@48kHz
垢版 |
2021/06/24(木) 10:49:29.93ID:xaliM1iU
>>783-784
処理のパラメータとして意図的に設定しなかったとしても
機械学習の技術が基礎にあるんだから
学習の結果として息を吸える場所が効いてくるのは普通にあることでしょ。

公式ページには「学習データの関係上、ブレス記号は特に効果があります」とは書いてあるし、
ユーザーの感覚では (人間の歌い手に対してそうであるように) 肺活量に
配慮する必要があると思って使うしかないと思う。
0787名無しサンプリング@48kHz
垢版 |
2021/06/24(木) 12:31:05.36ID:Smz4zGtY
推論時にブレスからブレス(休符でも可)までをフレーズとして同時に使うとのことだから、肺活量というより学習データにないロングトーンに対応する音声パラメータの推論に失敗してると思ってる

やりたいのはテンポ60の4/4で数小節のロングトーンなんだけど、後から無理やりするにしろなにか上手く誤魔化す方法がテクニックとしてあればと思ったのだが
調整するにしてもf0もmgcもどっちも崩壊してしまうから困る
0788名無しサンプリング@48kHz
垢版 |
2021/06/24(木) 18:35:28.74ID:QJkqqzI6
一応裏の処理ではきりたんよりタコ姉のほうが肺活量あるらしい
試し方ははブレスなしで歌わせる(鬼畜)
0789名無しサンプリング@48kHz
垢版 |
2021/06/28(月) 03:13:59.02ID:EUdyngoJ
関ジャム見たけど本間照光がこっそりAIきりたんのボカロPで仕事では実際に仮歌提出で使ってるっぽい
クリプトン中の人がきりたん仮歌で使ってる人居たとかちらっと言ってたけど実際に現場でも使われてるんだねぇ
0791名無しサンプリング@48kHz
垢版 |
2021/06/28(月) 07:18:28.36ID:EUdyngoJ
オワタPとかピアノロールが苦手で楽譜派とかも居るらしいし
年配だとボカロのオペレーションが苦手で逆にMuseScoreが直感的な場合も
0793名無しサンプリング@48kHz
垢版 |
2021/06/28(月) 07:34:14.12ID:fS8Du0N/
ピアノロールだと横方向にばっかり伸びるのと、他の楽器の兼ね合いとかを確認しにくいからね
だから私は調声もある程度出来るようにpythonで書いてる
musescoreの譜表テキストを使ってビブラートかけたり、pとかfとかのダイナミクスをmgc[:,0]に適応したりの簡単なものだけど
これやってから有志GUI使うほうが効率がいい
0794名無しサンプリング@48kHz
垢版 |
2021/06/28(月) 21:08:37.29ID:0Tf+28qS
のろまったからGYAOで見直したけど、あれだとNEUTRINOかCeVIO AIかわからんな
ていうか歌声の一つでも聞かせるかと思ったら喋り(ボイロ?)だけだったし
(まぁ主役がボカロPだから面目潰しちゃ…ってのはあっただろうけど)
本間さんくらいの人だと楽譜ポンで仮歌のほうが肌に合ってそう
0795名無しサンプリング@48kHz
垢版 |
2021/06/29(火) 03:31:39.66ID:E8WwQ+Bl
ExVoice(生声)のきりたん自己紹介使ってるけど
ボカロの特集なのにAIシンガーの出力を出してしまうと放送の軸がブレるしねー
「AIきりたん」だけでも話題として放送に載せられるギリギリのラインでは?

おかげできりたんの声人間みたいってツイートが散見
0796名無しサンプリング@48kHz
垢版 |
2021/06/29(火) 03:33:15.84ID:E8WwQ+Bl
AIきりたんの動画伸びない傾向にあるけど本間探しという妙なバフつくようになるのかw
0798名無しサンプリング@48kHz
垢版 |
2021/06/29(火) 10:01:35.69ID:rdMy8qAX
ツールとしてはDAW上で使えるのが理想なんだろうけど
そうなると無料ってのは無理そうか
0799名無しサンプリング@48kHz
垢版 |
2021/06/29(火) 10:21:49.56ID:kJ3aX418
>>798
musicxmlで書き出せるなら実質どんなソフトでも対応してると言える
ただ、再生するには特徴量推定をしてからVocoder合成が必要な都合上、DAWとしての魅力が活かせない
AIシンガー自体がDTMの畑と異なってて、それこそUTAUなどがその畑なのだと思う
0801名無しサンプリング@48kHz
垢版 |
2021/06/29(火) 13:47:04.81ID:E8WwQ+Bl
DAWだと一応有志がREAPER上で完結できるようなの作ってたね
Reaper NEUTRINOでググると出てくる
0802名無しサンプリング@48kHz
垢版 |
2021/07/02(金) 11:36:06.15ID:IVbnzJvb
ロングトーンって一小節がギリギリってくらい? それを超えたら破綻するよね。
譜面通りの長さの声が出なくて途中で途切れてもいいから破綻はしないようにして欲しいよな。
0803名無しサンプリング@48kHz
垢版 |
2021/07/02(金) 12:08:03.87ID:3NkIpiXU
メロウは今回のアップデートで気になってたところが改善されてる印象
声を書き出しただけなので完パケのボーカル差し替えてどうなるか
0805名無しサンプリング@48kHz
垢版 |
2021/07/02(金) 12:49:29.00ID:XuF1qA9Q
>>802
>>787のものだけど、詳しく見るとf0に関してはブレ出すのが問題で、mgcは消滅しちゃうのが問題だった
一応引き伸ばして線形補間してやるだけで、ほぼ違和感なくロングトーンさせられたから、しきい値みたいなのを決めて、それを超えると補間を使うって風にするといい感じだよ
0808名無しサンプリング@48kHz
垢版 |
2021/07/02(金) 23:45:08.77ID:IkNOIHUF
公式ページに言及がないっぽいけどフェルマータは無視されるってことでいい?
テンポの調整で代用するのが一般的なのかな。
0810808
垢版 |
2021/07/03(土) 00:26:21.00ID:aKMJsEsY
と思ったら musescore で musicxml 形式にエクスポートした段階で
フェルマータの長さ情報が脱落して 1.0 になってたわ。
musicxml はフェルマータの長さデータを持たないみたいやね。
データフォーマットが情報を持たない以上は機能もしないのは当然か。
0813名無しサンプリング@48kHz
垢版 |
2021/07/05(月) 07:58:18.79ID:a5of4XVD
ずん子解禁になったんでいくつか聴いてるけど、なんか悪い意味でボカロっぽくない?
0814名無しサンプリング@48kHz
垢版 |
2021/07/05(月) 08:03:47.50ID:N/SrCZ+2
ずん子は結構ストレートに歌うな
よく言うと加工しやすそう
悪く言うとボカロっぽい

他のキャラにMGC(声質)ファイル差し替えしてアイボスのクロスシンセシスみたいな事したらきれいにハマりそう
イタコさんにずん子を憑依させたい
0817名無しサンプリング@48kHz
垢版 |
2021/07/05(月) 08:25:30.07ID:N/SrCZ+2
ナクモMGCを憑依させて昭和アイドルっぽく歌うカマっぽいナクモとかも出来るっぽいね
解説記事見ただけでまだやったこと無いけど
0818名無しサンプリング@48kHz
垢版 |
2021/07/05(月) 10:24:01.03ID:C70KpHXw
Twitter見ても絶賛しかされてないけどずん子の出来最悪すぎない……?
ボカロっぽいというか電子音みたいな出音
収録失敗したか?
0819名無しサンプリング@48kHz
垢版 |
2021/07/05(月) 10:28:18.54ID:XuHqy19Y
歌声合成としては悪いとは言わない
じゃあその声はまさしくずん子なのかと聞かれると答に窮する
0822名無しサンプリング@48kHz
垢版 |
2021/07/05(月) 10:39:23.46ID:XuHqy19Y
これは俺の直感的な理解なので無視してもらっていいが
やっぱ低音寄りの成分をたくさん持ってる歌い手さんの声色では再現度が下がるんじゃないかと思う
0827名無しサンプリング@48kHz
垢版 |
2021/07/06(火) 15:55:41.24ID:wDyMKR+u
ずん子がボカロもどきになっちゃってたんで、明日のNo.7に期待だな
でもなんであんな風になったんだろ、きりたん/イタコと作り方が違うのかな
0828名無しサンプリング@48kHz
垢版 |
2021/07/06(火) 17:01:22.54ID:cbHBny+g
>>827
トークのデータは声優のトークから、歌声のデータは声優の歌声から学習してる。
歌うときにキャラ作りを維持できない声優もいて、
東北ずん子の声優である佐藤聡美はそのタイプなんじゃないかな。
佐藤聡美の歌を聞いたら NEUTRINO の東北ずん子と納得できるわ。
0829名無しサンプリング@48kHz
垢版 |
2021/07/06(火) 19:08:33.83ID:ApND9H+J
>>828
いや、ずん子の問題はそこじゃない……演技の話するとそもそもきりたんがVOICELOIDとNEUTRINOかけ離れてるから……
0831名無しサンプリング@48kHz
垢版 |
2021/07/07(水) 01:32:14.35ID:ArcwOMMP
カッペ臭がいや歌愛ユキも
0832名無しサンプリング@48kHz
垢版 |
2021/07/07(水) 07:14:56.83ID:srqIwsQ+
東北家は例の秋田弁でもないのに言ってる意味が分からないアニメがあったからな
しかたない
0835名無しサンプリング@48kHz
垢版 |
2021/07/07(水) 18:31:39.28ID:K209VQbi
ナクモって女性キーで歌わせると苦しい感じになり恐怖だなw また酔って息切れしているようにもなりオモシロイ
0836名無しサンプリング@48kHz
垢版 |
2021/07/07(水) 19:31:38.96ID:zWlX3RBm
AIシンガーもなかなか難しいな
声帯や喉、口の形状までシミュレートするような物になったらゴールになるか
0837名無しサンプリング@48kHz
垢版 |
2021/07/07(水) 20:10:01.74ID:Mxh4Of9D
そいやCeVIOトークの口パクデータを使用してNEUTRINO喋らせてた動画あったけど普通に喋ってたな
ボカロの無理に喋らせた感じがほぼ無かった
0838名無しサンプリング@48kHz
垢版 |
2021/07/07(水) 20:28:54.60ID:UEt+EAo1
SEVENめっちゃ面白いなw
Dual Alter World的な歌い方を学習させたんかな?
バラード系には無力w
0840名無しサンプリング@48kHz
垢版 |
2021/07/07(水) 22:23:16.16ID:Mxh4Of9D
SEVENちゃんのオリジナル曲聞いたら普通に生歌の歌謡曲でワロス
これ普通の人が聞いても歌声合成って分からんやつや
0848名無しサンプリング@48kHz
垢版 |
2021/07/09(金) 23:16:29.39ID:4b+dPp7x
これA#3から下の音が変換されないんだけど仕様ですか?
ナクモの音域がほとんど変換されず飛び飛びになる。
解決方法知ってる方いますか?
0849名無しサンプリング@48kHz
垢版 |
2021/07/10(土) 14:30:05.96ID:9Tm/fyp0
youtubeのNEUTRINOに喋らせてる動画は
NEUTRINOってlabファイルを元にしてAIが歌ってくれるから
CeVIOトークのlabファイル渡せばNEUTRINOで喋ってくれるって感じかな?

まぁ所々触る必要あるかもだけど?
0851名無しサンプリング@48kHz
垢版 |
2021/07/13(火) 07:29:56.62ID:rFIWGIfi
アウトプトのmgc使って別のシンガーに憑依させるのって具体的にどういう手順でやるんですか
0852名無しサンプリング@48kHz
垢版 |
2021/07/13(火) 10:35:05.20ID:rFIWGIfi
自己解決
憑依させたい歌手で出力させたmgcをもとのmgcと入れ替え支援ツールでmgc読み込んでWORLD実行で出来るね
0858名無しサンプリング@48kHz
垢版 |
2021/07/16(金) 14:45:43.55ID:RVVjoL7y
Twitter見てるとCeVIO CS7でMUSIC XML作ってsigさん調整支援ツールに投げると楽というのを知らずに
MuseScoreで苦戦してる人が結構いるけどNEUTRINO解説動画はほとんどMuseScoreでCeVIOつかう解説動画はめったに無い
下手すると無いかも
0859名無しサンプリング@48kHz
垢版 |
2021/07/16(金) 14:49:56.33ID:RVVjoL7y
NEUTRINOはCeVIO CS7の拡張音源って聞くとメガドライブのSUPER32Xを思い出す
メガドラタワー
0860名無しサンプリング@48kHz
垢版 |
2021/07/16(金) 17:26:59.58ID:aaFqTJcF
そりゃ無料だしね……
0861名無しサンプリング@48kHz
垢版 |
2021/07/16(金) 18:11:37.68ID:bLPtNcG5
>>858
広い目で見たらCeVIOとNeutrinoの両方を使うユーザーがめったにいないってことになるかも
0862名無しサンプリング@48kHz
垢版 |
2021/07/16(金) 18:25:49.63ID:woRZCjnl
>>858
CeVIO:ピアノロール入力、MuseScore:音符入力ってことで、自分なんかはピアノロール
より音符入力の方が早いし得意なんだけど、それ以外にCeVIO使うメリットって何か
ありますか?
0863名無しサンプリング@48kHz
垢版 |
2021/07/16(金) 20:08:04.90ID:LivKrG61
ひと手間かかるがSynth vでメロと歌詞入力してmidi吐かせてMusescoreに食わせてmxl吐かせば無料で出来る
0868名無しサンプリング@48kHz
垢版 |
2021/07/16(金) 20:55:21.16ID:zx8OC5az
MIDIキーボードから打ち込みできるぶん、MuseScoreの方が効率が良いという人もいると思う。
あと、いちど楽譜にした方が、全体を俯瞰できおかしな部分も見つけやすいという人もいるよね。
0869名無しサンプリング@48kHz
垢版 |
2021/07/16(金) 21:00:22.93ID:RVVjoL7y
楽譜とピアノロールで好きなほうでやれば良いんだけど
解説動画では楽譜でしか解説してないので
ピアノロールから始めた人は意外と苦戦してるって話やな
SynthVだとMUSIC XML直に出力出来ないので間にワンクッション挟みましょうって感じ
0871名無しサンプリング@48kHz
垢版 |
2021/07/17(土) 02:13:34.86ID:133ezC8Z
調整ツールでアポストロフィーつければ母音だけに出来るはずなんだが、上手くいかないんだけど解決法わかる人いますか?
ゆ'→y にしたいのにyuになってしまう

バージョンは最新の1.5.1です
0872名無しサンプリング@48kHz
垢版 |
2021/07/17(土) 02:36:25.11ID:HFM1wkQ/
特殊記号

「’」は母音脱落になります。
サンプル5小節目の「すこし’」のように、母音は発声せずに子音のみの発音になります。英語歌詞の部分や速めの歌唱の際に使うと効果的です。
※子音のみでの入力はできません。必ず「母音+子音」「子音+子音+母音」など母音を一つ含む形にしてください。

https://n3utrino.work/332/
0874名無しサンプリング@48kHz
垢版 |
2021/07/17(土) 03:33:18.13ID:133ezC8Z
解説サイトのやつコピペで使ってもダメだったからツール的な不具合だと思ってたけど、なんか普通に間違えてる可能性高そう…。
触れる環境に戻れたら試してみます、ありがとうございます!
0875名無しサンプリング@48kHz
垢版 |
2021/07/17(土) 04:37:42.46ID:fXKILtfn
既存の楽譜を入力するなら楽譜通りに入力したいし、
作曲するなら伴奏とセットで考えたいので
ピアノロール方式ってそんなに良いとは思わんな。

ピッチの微調整には便利なことはあると思うけど。
0876名無しサンプリング@48kHz
垢版 |
2021/07/17(土) 05:08:39.76ID:WFoZGt24
別にメロの入力は好きなDAWで作成→歌詞入力だけMuseScoreでmxl出力→調整支援ツール

なのでピアノロールとか譜面ビューとか何を言ってるのという感じ
0878名無しサンプリング@48kHz
垢版 |
2021/07/20(火) 04:32:58.22ID:sCaPIVsH
871だができたわ。ありがとう。
ただこれって>>877さんの言う通り「と’」だけだと「t」にはならないんよね?
同じ音が続く時は「きっと’」とかすればいいんだろうけど、「き」と「と」が別の音で続く時はどうしようもないって感じですかね?

後からピッチで無理矢理下げちゃうしかないのかな?
0879名無しサンプリング@48kHz
垢版 |
2021/07/22(木) 19:15:56.47ID:enwdZjct
「と」で入力しておいて、調声支援ツールで「t」「o」になってる「o」を
その次の音と重ねてしまうと、ほぼ「o」が聞こえなくなる(聞こえなくなるとは言ってない)
0880名無しサンプリング@48kHz
垢版 |
2021/07/26(月) 18:27:29.34ID:XWtVR9lg
カバー用のmidisynthVやutauから書き出した物とmuse scoreの相性が悪くて(何故か声部が別れた楽譜になる
フリー版studio oneに手出してみたけど上手くいくだろうか
0881名無しサンプリング@48kHz
垢版 |
2021/07/26(月) 20:35:53.31ID:h5zjSlsy
MIDIを読み込んで.bat内で歌詞書いてエクスポートしたい
xmlエディター使いたくないという我儘
0883名無しサンプリング@48kHz
垢版 |
2021/07/27(火) 02:56:41.77ID:v7O1D/H8
音の大小ではない声の強弱が調整出来るといいのにな
ウイスパーからシャウトみたいな
0885名無しサンプリング@48kHz
垢版 |
2021/07/29(木) 17:45:20.59ID:eVZU2WKk
YouTubeは事前にある程度視聴者付いた投稿者じゃないと検索にもヒットしないからなぁ
まず見てもらうという土俵にすら上がれない
日付順で決め打ちすれば出てくるけど
0886名無しサンプリング@48kHz
垢版 |
2021/07/29(木) 20:57:48.81ID:YDHjSfRn
つべに投稿始めた頃、いくら検索しても自分が投稿した動画がヒットせずに凹んだのを
思い出したわ
0887名無しサンプリング@48kHz
垢版 |
2021/07/29(木) 21:57:34.79ID:eVZU2WKk
ニコニコの場合は掘ってくれる人がいて出来が良ければ広告してくれるしね
まぁニコニコ衰退してるから無名で良曲だと1000行ければ良い感じ

小中高生に人気なのはtiktokだけど触ったこと無いので分からん
ニコニコ以上に見る人居るみたいだけど
0889名無しサンプリング@48kHz
垢版 |
2021/07/30(金) 00:42:25.62ID:B/fQn2yV
つべはタグや自己紹介コメントなどの有無にもよる感じなので、こちらから視聴者にアピールが必要なんじゃないかな。
自分は制作ではないけど、アジア系ポップスを集めたプレイリストを作成して各国の言葉や名称のタグ・コメントを入れて公開していたら、プレイリスト経由で再生してくれる視聴者が増えたな。で検索でも自分のチャンネルが出てきたり、まとめサイトみたいなところにリストアップされたりもしたな。今は面倒くさくなってやめたけど
0890名無しサンプリング@48kHz
垢版 |
2021/07/30(金) 01:06:41.58ID:r2mD0ZeW
利便性で言ったら YouTube とニコ動は全くレベルが違うんよね。
YouTube に慣れたらわざわざニコ動を使う気が全くしない。

ただ投稿者の平均的な気質はニコ動のほうが「コンテンツを作る」ということに強い意欲を持ってるという印象はある。
ネット上で交流するにあたってツイッタを選ぶか YouTube を選ぶかといったレベルの気安さで
誰もが動画を投稿できる世界になったのはきっと良いことなんだろうけど、
自分が作っているのが人に見せるコンテンツなのだという意識はニコ動の投稿者のほうが (平均的) には上
なんじゃないかな。
0891名無しサンプリング@48kHz
垢版 |
2021/07/30(金) 02:55:24.31ID:0ATgJPmx
・ニコニコ、YouTube、tiktok等複数のサイトで投稿
・初音ミクやカフ等の人気や話題になりやすいコンテンツで地道に視聴者を増やす
・海外の人にも分かりやすい説明文を添えておく
・海外の人にもわかりやすいアジア系ポップスやアニソン&ボカロプレイリストで客を呼ぶ

超テキトーだけど上レスの参考にしたらこんな感じ?
NEUTRINOはただでさえアタリショックなのにりんごろうで更に悪化した気が
0892名無しサンプリング@48kHz
垢版 |
2021/07/30(金) 10:36:34.23ID:ANXq+mT7
NEUTRINOはアタリショックとは言えんでしょ
そもそもショックで暴落するほどのヒット曲が出せてないんだから
むしろりんごろうあれなかったらもっと悲惨よ
開発にやる気あるからそういう風に見えんあたり開発のやる気は大事なんだなと感じるけども
0893名無しサンプリング@48kHz
垢版 |
2021/07/30(金) 14:34:39.07ID:r2mD0ZeW
音楽について詳しくないから作曲とかできんし、
学生時代の音楽の教科書とかひっぱり出して NEUTRINO に歌わせてるわ。
YouTube に投稿してるけどほとんどは 100 に届かないくらいの再生数だな。

人気曲にりんごろうネタの歌詞を付けただけの雑な替え歌は数百くらいにはなってるから
コンテンツへの入口というか動線があるかどうかってのはかなりデカい要素なんだと思う。
0894名無しサンプリング@48kHz
垢版 |
2021/07/30(金) 19:11:47.35ID:YE8UHwgE
ボカロほど固定のファンが居ないからNeutrinoでオリジナル曲だしても見る人が少ないんだろうな…。
ボカロよりリアルで、歌う必要がない(歌のスキルに依存しない)けど、人間の声にかなり近いってのがNeutrinoの強みだと思うんだけど、結局つくり手のメリットであって聞く側のメリットでは基本無いんだよね。(キャラや声当ててる人が好きな人は除く)
Neutrinoで高品質なオリジナル曲が増えるか、元々人気の高い人に声を当ててもらうかしないとコンテンツ自体が盛り上がっていかない…。
0895名無しサンプリング@48kHz
垢版 |
2021/07/30(金) 22:16:34.88ID:qBBGGbUx
NEUTRINOは正常進化だと思う。
だから、これから音楽の制作現場では徐々に普及していくことになるだろうと見ている。

自分のようなアマチュアの立場からしても、これでやっと(ボカロうんぬん関係なく)ふつうに歌を評価してもらえる環境が整ったと喜んでいるところ。
NEUTRINOというタグを入れず、「これ、いい曲だね、だれが歌ってるの?」と聞かれるような時代がついに来たかという感じ。
0896名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 00:18:33.78ID:zpDuIat8
そこまでいくには音の面だけでもあまりにも足りないものが多すぎるのよね
無料なのにこのペースで音源増やしてくれるのはありがたいけど正直増えるたびにがっかりしてる自分もいるわ
0897名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 00:30:50.36ID:nl1kRGmm
新しい声どれもきりたんのクォリティ超えれてないのはなんでなんだろう
NEUTRINOの開発手法に合う声質みたいのがあるのかな
0898名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 00:37:25.09ID:oPdpBrIO
そーかなー個人的にはずん子が残念な出来だった以外は大体満足してるけど
※最初の2つとナクモは使ったことが無いので知らない
0899名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 01:01:01.58ID:2oOkKVkt
イタコは気に入ってる。俺は逆にきりたんがダメ、何か聴いてるとイライラしてくる
0900名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 01:31:24.83ID:+d1TUFds
声の感情のバリエーションが乏しすぎるから正統進化とは思えない
だからといってそれを楽譜から推定できるようにするのも楽譜上で指定できるようにするのも難しい
0902名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 04:30:33.75ID:q/jhVDxc
きりたんは純粋にユーザーがよってたかって揉んだことで不具合が解消されて品質が上がった。
そして最初に出たということで声のイメージが単体で確立できた。
後から追随するボイスはどうしてもきりたんとの比較という形での評価になりやすい。
声質の違いとか歌唱の癖の違いとかそういったところ。そうすると単体出しした時の純粋な評価が得られにくいだろう。
0903sage
垢版 |
2021/07/31(土) 08:29:39.47ID:oPdpBrIO
感情のバリエーションはもちろんあった方が良いけど、現状では個性に合った曲を選ぶことが重要かも
0905名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 08:36:57.59ID:+d1TUFds
そういうことじゃなくて、一曲の中でずっと同じ感情ってのがなんとなく怖いところある
個性に合わせようにも、個性側が淡白に聴こえてしまう
0910名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 13:23:06.21ID:7S2bcNvm
ウイスパー、ノーマル、芯のある強い声、ファルセット、シャウトとかキースイッチみたいに音符毎に指定出来ると最強やね
0911名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 13:42:06.83ID:NQcTEqPr
自分の場合、歌い手はできるだけ無色に近い(癖の少ない)ほうが好み。
感情の起伏や作品の世界観などは、歌詞とメロディと編曲、あとはミックスダウンなどの音作りで作り上げればいいという考えかた。

>>906に続け NEUTRINO 「めろう」 の例で話をすると、Youtubeにアップされている曲だけでも、(>>906とあわせ)下のように歌の世界観をかなり表現できているのが判る。
たとえば、実際に自分でバンドを組もうとしても、これだけの声質と歌唱力を備えた女性ボーカルを探すのはけっこう大変だと思う。

もちろん、めろうに合わない曲もあるだろうけど、NEUTRINOの場合は歌唱ライブラリがあまり被っておらず使い分けできる点もいい。
自分の場合は、ポップス&バラード系にめろう、アイドル系にイタコ、ロック系にNo.7、という感じで考えている。

AIシンガー“めろう”で 「ふゆびより(ゆるキャン△ED)」 カバー
https://www.youtube.com/watch?v=u7Bta0ca5xA

【めろう】 長い間 / kiroro 【NEUTRINO】
https://www.youtube.com/watch?v=1BlScyeiFJM

【めろう】 ドライフラワー 【NEUTRINOカバー】
https://www.youtube.com/watch?v=HKKA54nnEbE
0912名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 14:08:19.82ID:IPCtTdKi
一通り聞いてみたけど母音と子音間?のカクつきというか引っかかり感みたいなのが結構あってまだ途上だなーって感じ
0914名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 15:47:34.98ID:NQcTEqPr
>>912-913
もう、そのレベルになると半分以上は好みの問題だと思う。

きりたんのダンデライオンはちょっとダメだった、というか、きりたんにはどういう曲を作ればいいのかも思い浮かばない。
自分にとって、きりたんは色々な部分で曲者(癖もの?)だったりするんだよね。
いま無理に考えてみると、ラブコメのアニソンみたいなポップで明るいイメージの曲ならこちらも合わせられるのかなぁ....

そういう意味では、上の>>903-904でも話が出たよう、ボーカルに合う曲というのは絶対あるし、曲を作る側からしても自分と相性の良いボーカルと悪いボーカルは絶対あると感じている。
0915名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 15:52:29.80ID:cQzZY5WT
イマイチという評価をしている人は「下手な人間に聞こえる」なのか「人間を再現しきれてない」なのか。
どっち?
0916名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 16:13:25.85ID:4jBtdLti
人間の一部分を再現しているので全てを平均的にバランス良く再現しきれておらず下手な人間の歌に聞こえると判断している
0917名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 16:23:00.32ID:cQzZY5WT
合唱曲で全員の声を合わせると個々の個性が相殺かつ相乗されて割と自然に聞こえる気がしてる。
0918名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 16:31:16.44ID:4jBtdLti
>>916
質問に合わせて用語をチョイスしたので語弊がある書き方だった
仮歌シンガーとするなら下手って意味で素人が歌うカラオケなら巧さも外し具合も再現できていると思う
歌唱の技法はいくつか知っていて知ってる技法を随所に盛り込んで歌うだけで1曲を通じてみたら仮歌シンガーとして下の方の評価になってしまう
0919名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 17:15:57.27ID:7S2bcNvm
作品として仕上げるなら支援ツールでピッチと強弱は編集するよ
メロウはこれにより見違えるね
でも音量に応じた声色の変化は難しい

同じ曲を例えばメロウと7に歌わせて7のf0とbapはそのままにmgcだけメロウにしてworldして出来たメロウ7のwavとメロウ単体のwavを切り貼りすると多少表現力は上がる

コーラスなどはずん子のf0、bapを使うと癖なくほぼノンビブラートの歌声に仕上がる
0920名無しサンプリング@48kHz
垢版 |
2021/07/31(土) 17:25:16.47ID:06meCIBK
めろうは出た当初はロングトーンくっそ音痴で調整支援ツールで全部直さないと行けなかったから
MAC派は絶望だっただろうなぁ
今は少しまともになったかな?
0921名無しサンプリング@48kHz
垢版 |
2021/08/01(日) 01:01:18.87ID:xmdLnQ30
>>910
技術的に難しいなら、新しい声実装する感じできりたんの別Ver(シャウトきりたんやウィスパーきりたん等)作ってほしいなあ。
継ぎ接ぎ編集はもうこっちでやるので…
0925名無しサンプリング@48kHz
垢版 |
2021/08/01(日) 21:20:00.49ID:TebeOoRr
Neutrinoが商業的に成功しない(というかそもそもそのつもりでない)のなら基本的に継続した進化は望めないと思うんだが、
MMD的なコンテンツの盛り上がり方したらワンチャンあるかなあと思ってる
0926名無しサンプリング@48kHz
垢版 |
2021/08/01(日) 21:21:46.37ID:W/pWOwNF
MMDと違って寄付は受け付けてくれてるからまめに支援することで継続できると思う
0927名無しサンプリング@48kHz
垢版 |
2021/08/01(日) 22:04:50.23ID:iYyNZQB7
専用エディター次第で化けそうな気がする
調音支援ツールも良いんだけど細かな使い勝手向上はできそうだし

sigさんもしかしてヘッドハンティングされちゃったかなぁ?
0928名無しサンプリング@48kHz
垢版 |
2021/08/01(日) 22:10:18.89ID:jJBtCPbp
>>925 >>927
答えは出ているのだから、違う路線で盛り上げたいなら他人任せにするのではなく率先してMMDやエディタを製作して提供すればいいんだよ。
0929名無しサンプリング@48kHz
垢版 |
2021/08/01(日) 23:02:45.09ID:TebeOoRr
>>928
ま、そうだな。
曲作る方はみんなに任せて映像やツール面で支援していきたい。勉強するかあ…。

てかまとめwikiみたいなのも今のところないよな?
需要あれば作ろうかな。
0930名無しサンプリング@48kHz
垢版 |
2021/08/01(日) 23:20:54.78ID:I9bK41Px
みんなエディタには何が欲しいんだろ
個人的には複数パート対応とオケの同時再生ができればいいなとは思ってるけど
0931名無しサンプリング@48kHz
垢版 |
2021/08/01(日) 23:24:23.72ID:W/pWOwNF
同じ楽譜でとりあえずありったけのボイスを合成するバッチくらいならまあ一瞬でできるけど
オケの再生とタイミングを厳密に合わせるとなるとそれなりに頑強な作りにしないと難しいだろね
0932名無しサンプリング@48kHz
垢版 |
2021/08/07(土) 17:44:56.44ID:RXJzGObN
AIきりたんに歌ってもらったときの感動は
きりたんがわたしのために歌ってくれてるうううう
って思った(抑えきれないヲタ感

いや、まじなかなか言い難いですが、そうなるんですよ・・・
発展性ありそうなんだけどなぁ
クリエイターと視聴者で温度差あるのかも
0935名無しサンプリング@48kHz
垢版 |
2021/08/08(日) 08:46:11.64ID:HMJQlOt8
カバーを作るときにオケを他所から借りてくる人に聞きたいんだけど、そのオケのBPMも一緒に書かれていると嬉しいものですかね?
0936名無しサンプリング@48kHz
垢版 |
2021/08/08(日) 12:35:57.35ID:+sMt2FiT
あれば楽な場合もあるけど、DAWでビート抽出できるのが今時当たり前なので別になくてもいいな。
0938名無しサンプリング@48kHz
垢版 |
2021/08/08(日) 14:28:15.55ID:JCX5JYmv
エディターは希望を言うなら
複数パート対応とオケの同時再生

最低限これだけあれば、いいんじゃないでしょうか
あとから追加できるし

非営利なのかな、カンパシステムも実装してもいいと思う
0939名無しサンプリング@48kHz
垢版 |
2021/08/08(日) 15:07:04.36ID:HMJQlOt8
>>936
>>937
ありがとう
なくても良いがあると楽とのことなので、自分が公開しているオケには記載することにするよ
ニコニコのNEUTRINOカバー曲を見ていたらオケとテンポが合っていないものが散見されたので
0942名無しサンプリング@48kHz
垢版 |
2021/08/08(日) 19:33:32.02ID:Zlx1ztqM
とりあえず歌わせたいだけって人もいるからね
それは個人のスタンスによるし、それこそ自作曲でこそって人もいるし
0943名無しサンプリング@48kHz
垢版 |
2021/08/08(日) 19:41:18.92ID:w1pqS9Y5
JPOPの曲なんかだと、オリジナルをコピーしただけのショボい自作オケを使うくらいなら
CDに入ってるカラオケ使えばいいじゃん、と思うことが良くある
0944名無しサンプリング@48kHz
垢版 |
2021/08/08(日) 20:22:50.66ID:2U0b4SjP
以前はCD音源アウトだったけど今はおkだからね
人それぞれだけど、借り物なら歌声はガチ調声であれば配分的にはいいと思う
オケ込みなら昔のMIDI職人作品聴くような楽しみもある
オケ借り物で無調声でも動画でカバーするのもアリだろうし
0949名無しサンプリング@48kHz
垢版 |
2021/08/08(日) 23:56:48.32ID:iUaMm4LE
>>943
CDに入ってるカラオケはコーラスとか入ってることが多くて、NEUTRINOで作った声と合わせるとマッチしなかったりするのがこまる
0950名無しサンプリング@48kHz
垢版 |
2021/08/09(月) 00:05:02.46ID:yUJ+eiOB
昔のMIDI職人作品で思い出したけどWRD付きMIDIのカバー作品とかも最近は出てきてて面白い。
うちも当時大量に集めてたけどHDDクラッシュで全部吹っ飛んで、今や手に入れる手段は無し…
0953名無しサンプリング@48kHz
垢版 |
2021/08/09(月) 23:01:20.86ID:JRGpNkS3
>>951
そういう時は、もっと上手なお手本を示してもらわないと、ただのビッグマウスじゃないかと疑ってしまう。
0954名無しサンプリング@48kHz
垢版 |
2021/08/10(火) 01:39:11.65ID:ufNRhiPZ
>>953
俺が思うに >>946 みたいなのは原曲と比較しちゃうからあまり高くは評価できないと思う。
合成でやる以上はどう頑張っても人が歌う感じに似せようとした (しかし出来ていない) 作品として聞こえる。
(技術的チャレンジとしてはこういう試みを積極的にやって欲しいとも思ってるけど。)

CeVIO の使い方が上手いとかミックスの上手さとかいう話じゃないんよ。
原曲が「正解」として存在してしまうからそこに届かないものにしかならんのよ。
カバーするなら原曲を再現することを目指すよりは別の魅力を引き出すように、
CeVIO が活きるようにアレンジしたほうが良いと思うから
CD 音源を上手く使うのは元々ハードルが高いものだと思う。
0955名無しサンプリング@48kHz
垢版 |
2021/08/10(火) 02:03:38.55ID:d4AuqAxx
原曲から歌声抽出してピッチ情報コピペして作った初音ミクの渡良瀬川がすごかったけど
それもオリジナルを超えてるかっていうと到底そうは思えないからね
0957名無しサンプリング@48kHz
垢版 |
2021/08/10(火) 08:26:57.21ID:INzGWujM
わざわざ比較も出す気ないから別にビッグマウスと思ってもらっていいよ

正直原曲も聞いた記憶ないから1曲の音楽を聴いたうえで
CeVIO の使い方の上手さとかミックスの上手さって話。
0960名無しサンプリング@48kHz
垢版 |
2021/08/10(火) 13:24:19.20ID:4EUtjh/K
>>954
> 原曲が「正解」として存在してしまうからそこに届かないものにしかならんのよ。
> カバーするなら原曲を再現することを目指すよりは別の魅力を引き出すように、

そういう話じゃなくて、>>946は、上の>>942-945に続けた発言なんだよね。
> ショボい自作オケを使うくらいならCDに入ってるカラオケ使えばいい

というのもあるし、新しい歌唱ソフトが出た直後はサンプルが少ないから、市販の
オケを使ってくれた方が、早くサンプルを出せるし、比較できる原曲がある分ソフト
の質や実力も評価しやすい。

とくに、946については、自分がCeVIOを購入するとき参考にした曲の1つでもある。
市販のオケに負けずこれだけ歌えるなら、自分の目的にも十分使えるという参考
材料になった点は大きい。

NEUTRINOの場合は、キャラ絵を使わず、聴く側に誰が(何が?)歌っているのか
あまり意識させないような使い方をするつもりでいる。

>>957
おそらく、参考になるようなサンプルは探しても簡単に見つけられないだろうと思う。

市販のオケにのせ歌唱ソフトを上手に歌わせている動画というのは、意外と少ない。
ベテランは市販のオケを使わないことが多いし、市販のオケを使うユーザーは逆に
初心者が多いため、一定以上のレベルまで仕上げられていない作品が多い。

>>946の曲は、そうした狭間でこれだけのバランスに仕上げた点が貴重だといえる。
0961954
垢版 |
2021/08/10(火) 14:38:52.67ID:ufNRhiPZ
>>960
繰り返すが技術的なチャレンジとして面白いということはわかってる。
CeVIO を評価するには比較対象があったほうがよいというのもわかる。

しかしそこで >>951 のような意見が出る背景としてはこういう見方をしているせいではないかな
ということを想像して補足をしただけ。
0968名無しサンプリング@48kHz
垢版 |
2021/08/11(水) 11:00:23.18ID:377p3+B1
音楽やってる人でもない一般の視聴者には生ギターもシンセのギター音色さえもそう変わらないという事実
0969名無しサンプリング@48kHz
垢版 |
2021/08/11(水) 11:22:44.04ID:K6G3f8+Y
最近のギター音源は、上手く打ち込めば下手な生ギターより良い結果になることも
多い、特にオケの他の音数が多い場合
0970名無しサンプリング@48kHz
垢版 |
2021/08/11(水) 11:32:48.02ID:ih026oRy
よく調整した声を聴かせたい曲だと表明されてるならオケは単なる額縁だと思って聴くようにはしてるな
0974名無しサンプリング@48kHz
垢版 |
2021/08/11(水) 17:19:22.12ID:4WA0EbLF
下はMIDIのクラシックギター打ち込み専門サイトで、MIDIデータもダウンロードできる。

カディス (スペイン組曲第4番) 【ギター版】 / I.アルベニス
  解説上部の再生ボタンで視聴、右下のダウンロードクリックでMIDIデータ入手。
http://www.guitarsound.net/elixir/htm/cadiz.htm
0975名無しサンプリング@48kHz
垢版 |
2021/08/12(木) 12:43:38.75ID:JdjiUdPg
2009年か・・・MIDI文化は廃れてしまった感が/(^o^)\

歌唱データを抽象化したデータ配布が流行る時代来たか・・・?

オリジナルしか作らないから分からないけど
piaproとかでオケMIDIデータ取ってるくのかな

個人的には下手でも耳コピしたデータの方がいいぜ・・
結果的に耳コピならぬアレンジになるから
0976名無しサンプリング@48kHz
垢版 |
2021/08/12(木) 14:11:37.74ID:D7cmPmKG
ないだろうね
昔MIDIデータがスタンダードだったのはテレホやISDNの通信能力が貧弱な時代でMP3(当時はコーデックの質も今ほど良くなかったしビットレートも128kbpsが主流)に比べてはるかに計量だったことと、
ローランドやヤマハのハード音源がDTMをするほとんどの人にとっての標準装備だったって理由がある
ハイレゾ音声さえも簡単に配布できる時代に、作る側がわざわざ生データを配る理由がない
0978名無しサンプリング@48kHz
垢版 |
2021/08/12(木) 17:56:46.52ID:7PEeFw2l
midiで配布してもハード音源持ってる人は少ないしOS標準の音源もショボい
MSがmidi音源にもう少し拘りを持ってたら状況が違ってたのかもな
0984名無しサンプリング@48kHz
垢版 |
2021/08/13(金) 12:47:03.15ID:JE8UxVE4
DTMをやっているWindowsユーザーなら、VirtualMIDISynth に サウンドフォント SGM-V2.0.1.sf2 を
設定して、MIDIの音質を改善しているという人も多いんじゃないかな。

Windows標準では草笛みたいにしか聞こえないバイオリンの音が、しっかりバイオリンに聞えるように
なるなど見違えるように音が良くなるし、どちらも無料で入手できるからね。

良くできたMIDIファイルは編曲の勉強にもなるし、自分は色々なMIDIファイルを落とし良く聴いている。
下はフリー音楽素材サイト TAM Music Factory のMIDIファイルを演奏させたもの。 (全8曲)
https://d.kuku.lu/84ff0b5f6
0988名無しサンプリング@48kHz
垢版 |
2021/08/14(土) 16:14:06.44ID:j8RvUzrj
今のところは NEUTRINO 用のモデルは8キャラ分あるわけだけど
憑依の組み合わせで考えると64あるとも言えるわけだよね。
憑依を積極的に活用した作品の例とかありませんか?
0991名無しサンプリング@48kHz
垢版 |
2021/08/14(土) 17:23:06.46ID:2LFXiWzV
>>989
使いたい声の奴と憑依させたい奴のmgc入れ替えてWorldするだけや
メロウにずんこ憑依させると声の震えがなくなるがほぼノンビブラートになる
他も色々おもろいで
0993名無しサンプリング@48kHz
垢版 |
2021/08/14(土) 22:54:18.66ID:oABSg6WR
なんで憑依のスタンダードってmgc入れ替えになったの?
どっちかというとf0入れ替えのほうが適切な気がするんだが
0995名無しサンプリング@48kHz
垢版 |
2021/08/15(日) 02:27:47.31ID:Iw+PHiCy
バッチファイルじゃなくて調声支援ツールでworld実行してるんだけど、
この場合でもmgc入れ替えでいける?
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 535日 6時間 43分 10秒
10021002
垢版 |
Over 1000Thread
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況