X



【AI】元歌手と判別できないレベルのAI歌声合成、名古屋工業大学と音声ベンチャーが開発[12/14]
■ このスレッドは過去ログ倉庫に格納されています
0001しじみ ★
垢版 |
2018/12/14(金) 14:59:47.35ID:CAP_USER
名古屋工業大学 国際音声言語技術研究所と音声合成を柱とするベンチャー企業テクノスピーチは12月12日、これまでの歌声合成とは一線を画す、元の歌い手の声質、癖、歌い方といった特徴を捉えた歌い方をディープラーニング技術などの適用で実現した。約2時間分の音声データで学習し、日本語、英語、中国語に対応する。

 名古屋工業大学の徳田恵一教授を中心とするチームはこれまで、隠れマルコフモデルを使った統計的手法により、音声合成のOpen JTalk、歌声合成のSinsyを開発し、提供してきた。テクノスピーチはこれらを発展させた商用製品CeVIO Creative Studioの開発にも携わっている。今回の新技術はこれらを新たな次元に推し進めるものと言える。

 名古屋工業大学とその出身者によるテクノスピーチの共同研究は、2019年3月に開催される日本音響学会2019年春季研究発表で公開される。

 Sinsyと同じく、人手による調整がされていない「ベタ打ち」の歌詞付き楽譜データをMusicXML形式で与えるだけで、元歌手の特徴を再現する。

今回のデモはCeVIOで歌声を提供している、さとうささら、IAが使われていることから、CeVIOの将来バージョンまたは後継製品で使われることも予想される。

 故人である三波春夫さんをバーチャルシンガーにした「ハルオロイド・ミナミ」がCeVIOに対応する歌声として製品化しているが、この新技術を使った、本物と区別がつかない仮想三波春夫による「世界の国からこんにちは」を期待したいところだ。

http://image.itmedia.co.jp/news/articles/1812/14/koya_cevio2.png
http://image.itmedia.co.jp/news/articles/1812/14/koya_cevio3.png

※記事の音源はこちらのlinkから聞けます
https://www.techno-speech.com/news-20181214a

ITmedia NEWS
http://www.itmedia.co.jp/news/articles/1812/14/news089.html
0042ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 17:55:44.82ID:AYts/VpI
エルビスがいまの歌をうたったら  というのが成り立つわけか
ジミヘンやジャニスやジョンレノンが最新曲をかばーしたらとか
0045ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 18:31:13.41ID:Q+qmcmfR
>>20
あれは人間に近づけるのとは少し違う方向で生き残るかもしれん。
ヴィジュアルでメカっぽいキャラクターや獣っぽいキャラクターがあるのと同様に
0046ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 18:34:07.41ID:9pUUNdAk
とりあえずlinux/firefoxでは音が出ない
0047ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 18:41:20.03ID:G3X0YDtl
>>11
>>14に見事一本取られたなw

一本!そこまで!
0050ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 19:09:35.96ID:W1IqA9Gu
>>43
例えばNHKのアナウンサーをアニメ声優にしても面白くないだろ?
アニメ声優をNHKのアナウンサーにしたらニュースの信憑性が疑われる
初音ミクの声で無ければ歌えない歌もある
0051ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 19:12:11.19ID:nB655Hi1
日本語の萌え声だけ聞いて「おっ」と思ったけど、他の言語はダメダメだな。
やっぱり人間の喉の構造を物理シムするくらいでないと同じにはならないな。
0052ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 19:14:33.87ID:9BRl0hWj
>>43
この技術verの初音ミクが出るだけだと思うぞ
0053ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 19:23:16.53ID:vCiUas87
犬作先生のお言葉はまだですか
0054ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 19:27:01.07ID:Ti39EcJp
生成系と判別系、合体させた?ディープラーニング。
0055ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 19:31:44.78ID:T00t8HWR
>約2時間分の音声データで学習

データ量としてはかなり少ない印象だわ。これ例えば盗聴して音声データから音源作って
本人になりすまして第三者に話しかけるとかできそうだな。名探偵コナンのボイスチェンジャー
みたいな感じで。
0056ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 19:35:50.26ID:jZJo2pWx
これなら三波春夫先生がいなくても2025年大阪万博は大丈夫だな。
よかった、よかった。
0057ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 19:36:00.11ID:CNwdN8uw
Fランの発想。
0059ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 20:03:28.42ID:6V2/ebZu
アニメ声の声優が苦手だから吹き替えとかでAIで選べるようになって欲しい
0061ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 20:32:28.56ID:cYFvw8PC
英語が若干不自然? そうでもないか。
0063ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 20:39:59.59ID:YuVIw6va
IAといえば、ずどどんPの「点」って曲がいい
0064ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 20:49:39.83ID:C+DvT4fb
声優の仕事がマジでなくなりそうだな
どうすんだこれ
0065ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 20:49:44.12ID:r6smViI5
「ハルオロイド・ミナミ」が歌う「2025年・大阪万博の歌」
0066ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 20:50:48.72ID:TSoD2Pkr
>>59
あああ!
全員をお気に入りキャストに
変更も可能ってことだな。

エロいアニメも
0067ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 21:02:25.98ID:r6smViI5
譜面がある「歌声」を再現できたとしても、
「声当て」やら「芝居」を再現するのは難しいと思うけれどな。
0068ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 21:36:42.75ID:CVtH+kTm
これはすごい
0071ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 21:45:25.21ID:xA6k/S0Q
>>1
逆に人間の歌声もエフェクトでボカロに近づけてるのもあるんじゃね
0072ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 21:51:07.62ID:SQU8sfUr
10年おせぇわ
ボカロが出て数年でこのくらいになるかと思ったのに平成も終わる時にもまだ機械音声のボカロ声だからな
0073ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 21:53:45.31ID:i4SkRGPd
ミクヲタがファビョるよ。
あの甲高い声こそが至高であって元々の技術的到達目標点であるはずの藤田咲の声の再現にはヤツらには耐えられないことだろうから
0074ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 21:55:33.28ID:0GYgVHle
即興とかレゲエやラップのDJ-ingは出来ないだろうから
この技術では黒人音楽はムリだな
こういう技術って、歌の下手な奴の恨みの結晶って感じだから
歌の上手い奴がゴロゴロいてライヴの即興を重視するアメリカその他の国では
無視されるだろう
0075ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 21:58:30.93ID:mN/nwQM+
嫌な予感しかしない。電気羊の夢でも見て寝るわ
0076ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 22:10:39.70ID:qdSm3Phv
なんか小説ってもうAIが書けるらしいなw
つまり、もう作詞は出来るって事だ

あと作曲できたら、曲も詩も唄も演奏もAIだなw
0077ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 22:23:29.29ID:V6ppidNx
大げさなw

不自然すぎる
0079ニュースソース検討中@自治議論スレ
垢版 |
2018/12/14(金) 23:32:35.59ID:14qf5s4v
>>76
Orpheusっていう自動作曲システムがある
つべにも作曲した動画が上がっているけど
ハッキリ言って、歌詞が特定の弁護士を
誹謗中傷する内容だから視聴はオススメしない
0080ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 01:24:07.03ID:l/3lJ9lC
「paypay社から情報が流出した事実は無いニダ!」
 「日本は韓国さま無しでは成り立たない哀れな国ニダ!」
「地震で日本人がいっぱい死んで超うれしいニダ〜!」
 「安倍首相が韓国に来て、土下座で謝罪すれば許してやるニダ!」
「弟の日本には、兄の韓国さまからの指導が絶対に必要ニダ!」
0081ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 02:23:46.56ID:fykCERLA
>>43
ミクとかも手作業で追い込めばこのくらいは出来るぞ。
これをAI化すれば同じレベルじゃない?
https://youtu.be/s5L9VoQUR6U
0086ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 06:15:15.26ID:SfMgzUoo
>84
ある程度知識がないと、昔手が届いた範囲のAI、
今AIと呼ばれているもの、未だ遠い究極のAI、それぞれが
大きく違うものだと言う事はわからないから、しかたないよ

AIより意味が狭い「機械学習」を使う方が少しましになるかもしれない
0087ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 08:19:31.33ID:ANcki7LB
美空ひばロイドとか、マリアカラソイドとか、パバロッティドとか期待してしまうする。

桜田淳コロイドとか、森高千ロイドとか
0089ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 08:44:54.49ID:zADLa+T3
名古屋は飯が不味い
0090ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 08:46:47.75ID:3jH8ddvF
やばばばば!拍手!!
0092ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 09:07:12.29ID:Czabf+Rz
金正恩の声を再現して、韓国の文が利用するニダ。
北朝鮮は朝鮮民族の誇りニダ。
0093ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 09:27:22.98ID:bqL14OdX
いくら技術が優秀でも萌えキャラつけて売った時点で終了
下品なオタクのおもちゃになるだけ
0096ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 09:57:39.98ID:EhgBNpXl
AIでデザイン
並能力の デザイン職 なくなる
0097ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 11:20:03.25ID:5W4ySsDu
今回で大事なのは声が非常に明瞭でハイファイになっていること。
その過程で歌い方まで学習してるけどそれは副次的な産物。
広音域で聞き取りやすく、ネイティブの人間と同じように音素が波形レベルで
きっちりしてる発音ができることが歌声合成の現状最大の壁だったから。
0098ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 11:24:46.03ID:kGcdErjD
よく聞くと息つぎもしてるよな
0099ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 11:45:57.38ID:jiC+u7xd
ボーカロイドも終焉か
そのうち誰でもボタンひとつで曲ができるようになって、曲に価値なんてなくなるんだろうな
0100ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 11:53:34.68ID:UIDf96/T
エロゲに使えるレベルなら、制作費が相当圧縮できるが
あえぎ声とかはまだ無理だろうな
0102ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 12:16:26.92ID:hh2Jzy0u
人が歌うより透明感が数段上と感じた
0103ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 12:33:20.99ID:B3M1TVbK
自分の声で口パクできるようになる?

もしそうなら「lemon」を歌っている自分の歌声を聞きたい

いまは音痴杉で真似すらできね
0104ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 12:35:00.46ID:KzxDbgw5
意味が理解出来ないんだが、
タイトルの「元歌手」って誰の事?

この記事もAIかなんかが書いてるんじゃないか?チューリングテスト失敗レベル。
0105ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 12:46:07.22ID:oh4oi3f1
>>5
生身の歌手がその場で歌うのを聴く事が喜びなわけで...
0109ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 14:00:33.02ID:6wrJO0/5
初音ミク涙目wwwwwwwwww
0110ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 14:17:06.38ID:Ppz4jAHM
AKB終わったな
0111ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 14:20:57.06ID:5W4ySsDu
既存製品では公式に水瀬いのりさんが声色と癖担当とアナウンスされているが今回も同じかどうかは不明。
歌い方が上手いとそのように学習するわけだが、ライブに通ってるファンなら断定できるかもしれない。
0112ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 18:13:17.35ID:ANcki7LB
第九のコーラス隊も要らなくなるな。PCを200台並べてスピーカーを繋げばOKだもの。
0116ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 19:26:16.29ID:eipJHp0q
女を知らない名工大生の努力の結晶だぬ(・я・`)
0118ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 20:33:19.91ID:lSKkYjc0
>>92
湾岸戦争?の頃にCIAがフセイン大統領の失脚を企てて
フセイン大統領にソックリな男優を出演させた
ゲイ・ポルノビデオを制作したそうだ

もし、選挙の直前に安倍晋三の声を合成した
安倍ロイドで、籠池と密談した音声が
公開されたりしたら、選挙結果に影響するだろう?

音声合成技術の進歩は、使い方によっては
大変な力を発揮するよ
0119ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 21:43:35.42ID:lSKkYjc0
>>20
>>43
>>69
>>73
>>109
初音ミクの良さって科学では説明出来ない
実在感じゃないアイドル性って解るかな?
天使の歌声だよ?
例えどれだけ美味しい料理でも
人肉を模していたら美味しくないでしょ?
感性の問題なんだよ
0121ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 01:56:34.98ID:DLuam/HH
ハルオロイドミナミってスゲー世紀末感あるな
0122ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 03:21:54.50ID:bk1sgUGi
落語家の話も、AIに奪われる時が来るのかもしれない。
そおそも話の内容や語り口自身もAIが自動創作してしまうようになったなら。
0123ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 03:55:58.23ID:HTDMmBEX
オーディオマニアもころっと
0127ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 09:39:33.66ID:E/OZIc1V
>>1
歌手の売り込みに新たな一手が追加されたな
0128ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 10:13:47.55ID:wNjUUHlA
調整無しでこれかよw
かなり自然に聞こえる
0129ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 10:43:48.85ID:PtJVV4Fj
初音ミクが売れるまで、VOCALOIDのサンプル音声で
プロの歌手を使うのは難航した。仕方が無いので
クリプトンフューチャーメディアはアニメ声優を起用し
アニメキャラクターが歌っているかのような演出をした
案の定これには硬派な業界から反発を受けた

そもそも芸能人は自分を機械で置き換えされるのを嫌う
芸能界も低コストの人工アイドルが増えれば
予算を削減されて、中抜きできなくなる

ホリプロの伊達杏子が鳴かず飛ばずだったのに
門外漢の初音ミクが大ヒット
芸能界にとって面白くないのは当たり前

初音ミクを超えようとするなら
初音ミク以上に強烈な逆風を覚悟すべき
0130ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 10:49:09.56ID:BZb0S5pr
井上 裕太@yutainoue
これヤバい。以下の写真はどれも実在する人ではなく、AIが作り出した顔。
あまりにリアルで見分けられない。NVIDIAの研究。Kevin Kellyは「写真のが証拠になる時代は終わった」と。
論文はこちら https://arxiv.org/pdf/1812.04948.pdf
https://pbs.twimg.com/media/DuXo7wKUUAAKeu3.jpg:large
https://www.youtube.com/watch?time_continue=1&;v=G06dEcZ-QTg
0131ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 11:06:15.55ID:H+5W/JIm
この技術もっと進歩して、遺体が残ってたら、そこから歌声を
再現できるとかになったらすごいな
ファリネリがどんな風に歌ってたかとか実際に音で聞けたらすごい
0132ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 11:09:20.22ID:ICT6oOTn
声にも肖像権同様の権利が必要になるのでは?
ゼロから声を作ってそれが人気を集められればいいけれど、
生身の人間の(声以外を含む魅力に基づく)人気に乗っかり
声だけパクって商売するのはなんとも
0133ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 11:25:42.38ID:xBqunPUO
元歌手とは判別できる程度に別人の声にしてあるんよねこれ
声紋分析したら確かに似てるけど違う声、になるはず
ミクと声優さんの声が違うのと同じ発想
0134ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 11:29:07.77ID:W24ZXUVq
聞いてきた
音の解像度が上がっただけで、音痴な点は変わってないのな
これ単にモデルのoutput層で表現できる値が増えたから良くなった感じ
変な声聞いて育つと色々音痴になったり発話障害になったりしてで嫌だな
もっと改善するまで広めないで欲しいところ
0135ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 13:02:26.79ID:B/GK/XJ+
AI使うと楽できるってこと?
0136ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 13:12:39.44ID:xBqunPUO
合成の精度を非常に上げることができるという点でディープラーニングはめっちゃ使えるという良い研究結果だな
ただこれだけの精度を出すために、再生(再現)する時にも計算処理が大きくなっているようで、GPUを使っても
それなりに処理時間がかかるとのこと。これが今のネック。
ユーザーとしてはいきなりトライ&エラーの修正回数が激減している状態から始められると思うのでトータルでは
メリットが圧倒的に上回ると思う。
0137ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 13:30:39.46ID:ONm9mJHr
>>1
ヒトとモノの区別が付かなくなっていくな

こうなると、アニミズムのある文化圏が伸びてくる
0139ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 20:11:36.46ID:fA9ADDcB
音声データってくらいだから生声は数理化出来てるわけじゃん?
合成音声ってそんな難しいことじゃなさそうなんだけど初音ミクから10年以上経つのに革新的なものが出てこないな
やる気が足りないんじゃないの?
0140ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 20:36:20.64ID:xBqunPUO
初音ミクは実のところ職人芸で成立してる方式だからね
今回は開発環境問題をAIとマシンパワーで解決できたので
来年にものすごい音声合成ブームがもう一度来るでしょうな
0141ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 20:54:49.96ID:j/NW85hd
職人芸に頼る日本人
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況