【ＡＩ】元歌手と判別できないレベルのAI歌声合成、名古屋工業大学と音声ベンチャーが開発［12/14］

**しじみ ★** · 2018/12/14(金) 14:59:47.35

名古屋工業大学国際音声言語技術研究所と音声合成を柱とするベンチャー企業テクノスピーチは12月12日、これまでの歌声合成とは一線を画す、元の歌い手の声質、癖、歌い方といった特徴を捉えた歌い方をディープラーニング技術などの適用で実現した。約2時間分の音声データで学習し、日本語、英語、中国語に対応する。

　名古屋工業大学の徳田恵一教授を中心とするチームはこれまで、隠れマルコフモデルを使った統計的手法により、音声合成のOpen JTalk、歌声合成のSinsyを開発し、提供してきた。テクノスピーチはこれらを発展させた商用製品CeVIO Creative Studioの開発にも携わっている。今回の新技術はこれらを新たな次元に推し進めるものと言える。

　名古屋工業大学とその出身者によるテクノスピーチの共同研究は、2019年3月に開催される日本音響学会2019年春季研究発表で公開される。

　Sinsyと同じく、人手による調整がされていない「ベタ打ち」の歌詞付き楽譜データをMusicXML形式で与えるだけで、元歌手の特徴を再現する。

今回のデモはCeVIOで歌声を提供している、さとうささら、IAが使われていることから、CeVIOの将来バージョンまたは後継製品で使われることも予想される。

　故人である三波春夫さんをバーチャルシンガーにした「ハルオロイド・ミナミ」がCeVIOに対応する歌声として製品化しているが、この新技術を使った、本物と区別がつかない仮想三波春夫による「世界の国からこんにちは」を期待したいところだ。

http://image.itmedia.co.jp/news/articles/1812/14/koya_cevio2.png
http://image.itmedia.co.jp/news/articles/1812/14/koya_cevio3.png

※記事の音源はこちらのlinkから聞けます
https://www.techno-speech.com/news-20181214a

ITmedia NEWS
http://www.itmedia.co.jp/news/articles/1812/14/news089.html

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 17:55:44.82

エルビスがいまの歌をうたったら　　というのが成り立つわけか
ジミヘンやジャニスやジョンレノンが最新曲をかばーしたらとか

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 18:14:06.01

わああああ　これ
初音ミクはどうなるの？？？？
おわるの？？？
えろいひとおしえて

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 18:17:23.51

これ歌うまい歌手のデータで学習させることができるの？？
それとも特別に協力してもらわないと無理？

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 18:31:13.41

>>20
あれは人間に近づけるのとは少し違う方向で生き残るかもしれん。
ヴィジュアルでメカっぽいキャラクターや獣っぽいキャラクターがあるのと同様に

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 18:34:07.41

とりあえずlinux/firefoxでは音が出ない

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 18:41:20.03

>>11
>>14に見事一本取られたなｗ

一本！そこまで！

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 18:56:32.61

仮歌歌手やコーラス要員が不要になるな

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 19:01:24.68

これをオリンピックで流すんかな？

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 19:09:35.96

>>43
例えばNHKのアナウンサーをアニメ声優にしても面白くないだろ？
アニメ声優をNHKのアナウンサーにしたらニュースの信憑性が疑われる
初音ミクの声で無ければ歌えない歌もある

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 19:12:11.19

日本語の萌え声だけ聞いて「おっ」と思ったけど、他の言語はダメダメだな。
やっぱり人間の喉の構造を物理シムするくらいでないと同じにはならないな。

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 19:14:33.87

>>43
この技術verの初音ミクが出るだけだと思うぞ

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 19:23:16.53

犬作先生のお言葉はまだですか

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 19:27:01.07

生成系と判別系、合体させた？ディープラーニング。

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 19:31:44.78

>約2時間分の音声データで学習

データ量としてはかなり少ない印象だわ。これ例えば盗聴して音声データから音源作って
本人になりすまして第三者に話しかけるとかできそうだな。名探偵コナンのボイスチェンジャー
みたいな感じで。

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 19:35:50.26

これなら三波春夫先生がいなくても２０２５年大阪万博は大丈夫だな。
よかった、よかった。

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 19:36:00.11

Ｆランの発想。

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 19:48:51.33

リンク先いって聞いてきたけどすごいな
これがベタ打ちって言うから尚凄い

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 20:03:28.42

アニメ声の声優が苦手だから吹き替えとかでＡＩで選べるようになって欲しい

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 20:26:59.73

正門のとこにあるメイちゃんに実装するんか

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 20:32:28.56

英語が若干不自然？　そうでもないか。

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 20:35:28.18

何も知らずにBGMとして流されてると
合成音声とは気付けなそう

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 20:39:59.59

IAといえば、ずどどんPの「点」って曲がいい

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 20:49:39.83

声優の仕事がマジでなくなりそうだな
どうすんだこれ

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 20:49:44.12

「ハルオロイド・ミナミ」が歌う「２０２５年・大阪万博の歌」

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 20:50:48.72

>>59
あああ！
全員をお気に入りキャストに
変更も可能ってことだな。

エロいアニメも

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 21:02:25.98

譜面がある「歌声」を再現できたとしても、
「声当て」やら「芝居」を再現するのは難しいと思うけれどな。

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 21:36:42.75

これはすごい

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 21:41:03.13

>>1
初音ミク（笑）

棒読みちゃん（笑）

YouTuberには超朗報だな

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 21:41:55.18

まだ違和感あるけどもう一息

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 21:45:25.21

>>1
逆に人間の歌声もエフェクトでボカロに近づけてるのもあるんじゃね

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 21:51:07.62

10年おせぇわ
ボカロが出て数年でこのくらいになるかと思ったのに平成も終わる時にもまだ機械音声のボカロ声だからな

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 21:53:45.31

ミクヲタがファビョるよ。
あの甲高い声こそが至高であって元々の技術的到達目標点であるはずの藤田咲の声の再現にはヤツらには耐えられないことだろうから

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 21:55:33.28

即興とかレゲエやラップのDJ-ingは出来ないだろうから
この技術では黒人音楽はムリだな
こういう技術って、歌の下手な奴の恨みの結晶って感じだから
歌の上手い奴がゴロゴロいてライヴの即興を重視するアメリカその他の国では
無視されるだろう

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 21:58:30.93

嫌な予感しかしない。電気羊の夢でも見て寝るわ

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 22:10:39.70

なんか小説ってもうAIが書けるらしいなｗ
つまり、もう作詞は出来るって事だ

あと作曲できたら、曲も詩も唄も演奏もAIだなｗ

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 22:23:29.29

大げさなｗ

不自然すぎる

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 22:47:37.81

>>76
グーグルの研究者が開発したAI歌詞家、その残念な出来ばえ
http://ascii.jp/elem/000/001/771/1771813/

**ニュースソース検討中＠自治議論スレ** · 2018/12/14(金) 23:32:35.59

>>76
Orpheusっていう自動作曲システムがある
つべにも作曲した動画が上がっているけど
ハッキリ言って、歌詞が特定の弁護士を
誹謗中傷する内容だから視聴はオススメしない

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 01:24:07.03

「paypay社から情報が流出した事実は無いニダ！」
　「日本は韓国さま無しでは成り立たない哀れな国ニダ！」
「地震で日本人がいっぱい死んで超うれしいニダ～！」
　「安倍首相が韓国に来て、土下座で謝罪すれば許してやるニダ！」
「弟の日本には、兄の韓国さまからの指導が絶対に必要ニダ！」

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 02:23:46.56

>>43
ミクとかも手作業で追い込めばこのくらいは出来るぞ。
これをAI化すれば同じレベルじゃない？
https://youtu.be/s5L9VoQUR6U

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 02:45:33.60

途中で息を吸う音もあるけどそれも歌い方の癖として学習してるって事？

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 03:51:29.50

映画の吹き替えが本人の声でできるな

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 03:59:06.02

>>13
どうしてこうAIを勘違いする奴が減らないのだろうか

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 04:56:30.12

>>12
AI（人工知能）を使って
歌手のAIの歌声を使った歌がどんどん作れるって事かｗ

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 06:15:15.26

>84
ある程度知識がないと、昔手が届いた範囲のAI、
今AIと呼ばれているもの、未だ遠い究極のAI、それぞれが
大きく違うものだと言う事はわからないから、しかたないよ

AIより意味が狭い「機械学習」を使う方が少しましになるかもしれない

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 08:19:31.33

美空ひばロイドとか、マリアカラソイドとか、パバロッティドとか期待してしまうする。

桜田淳コロイドとか、森高千ロイドとか

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 08:32:57.63

コルタナさんの方が歌うの上手い

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 08:44:54.49

名古屋は飯が不味い

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 08:46:47.75

やばばばば！拍手！！

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 08:52:39.18

カラオケトラックとの差分で歌手のボーカルだけ2時間分抜ければ好きなアイドルの歌声も自分の物に出来ちゃうのか

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 09:07:12.29

金正恩の声を再現して、韓国の文が利用するニダ。
北朝鮮は朝鮮民族の誇りニダ。

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 09:27:22.98

いくら技術が優秀でも萌えキャラつけて売った時点で終了
下品なオタクのおもちゃになるだけ

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 09:46:53.40

劣化コピーじゃないか？
最近のボーカロイドとか、ある意味では歌手以上だぞ

学習と創作は違うって事か

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 09:49:51.62

>>20
あれ、何気にバージョンかなり上げてるからなぁ。終了より、更新が正しい。

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 09:57:39.98

AIでデザイン
並能力のデザイン職　なくなる

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 11:20:03.25

今回で大事なのは声が非常に明瞭でハイファイになっていること。
その過程で歌い方まで学習してるけどそれは副次的な産物。
広音域で聞き取りやすく、ネイティブの人間と同じように音素が波形レベルで
きっちりしてる発音ができることが歌声合成の現状最大の壁だったから。

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 11:24:46.03

よく聞くと息つぎもしてるよな

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 11:45:57.38

ボーカロイドも終焉か
そのうち誰でもボタンひとつで曲ができるようになって、曲に価値なんてなくなるんだろうな

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 11:53:34.68

エロゲに使えるレベルなら、制作費が相当圧縮できるが
あえぎ声とかはまだ無理だろうな

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 12:07:16.23

AIの会話ソフトと組み合わせれば、アイドルとテレ友に！

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 12:16:26.92

人が歌うより透明感が数段上と感じた

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 12:33:20.99

自分の声で口パクできるようになる？

もしそうなら「lemon」を歌っている自分の歌声を聞きたい

いまは音痴杉で真似すらできね

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 12:35:00.46

意味が理解出来ないんだが、
タイトルの「元歌手」って誰の事？

この記事もAIかなんかが書いてるんじゃないか？チューリングテスト失敗レベル。

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 12:46:07.22

>>5
生身の歌手がその場で歌うのを聴く事が喜びなわけで．．．

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 12:48:13.43

呼吸音を加えただけじゃないかな？

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 12:56:38.11

これは技術の正しい使い道

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 13:35:09.17

>>104
声色の提供元の歌手

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 14:00:33.02

初音ミク涙目ｗｗｗｗｗｗｗｗｗｗ

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 14:17:06.38

AKB終わったな

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 14:20:57.06

既存製品では公式に水瀬いのりさんが声色と癖担当とアナウンスされているが今回も同じかどうかは不明。
歌い方が上手いとそのように学習するわけだが、ライブに通ってるファンなら断定できるかもしれない。

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 18:13:17.35

第九のコーラス隊も要らなくなるな。PCを200台並べてスピーカーを繋げばOKだもの。

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 18:47:09.39

>>2
「いちゃもんつけるんかわれ」
http://www.officiallyjd.com/wp-content/uploads/2012/07/20120707_kashouryoku_11.jpg

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 19:03:06.45

>>112
コーラスは人間だからできる部分を無視できないのでAI歌手では当分無理かな
ハーモニーはAIには分からない人間の感覚が為せる技なので

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 19:18:18.06

よくはなってると思うが判別できないは言い過ぎじゃない？ｗ

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 19:26:16.29

女を知らない名工大生の努力の結晶だぬ(･я･`)

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 19:45:30.64

妙にリアルなコメントやめ

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 20:33:19.91

>>92
湾岸戦争？の頃にCIAがフセイン大統領の失脚を企てて
フセイン大統領にソックリな男優を出演させた
ゲイ・ポルノビデオを制作したそうだ

もし、選挙の直前に安倍晋三の声を合成した
安倍ロイドで、籠池と密談した音声が
公開されたりしたら、選挙結果に影響するだろう？

音声合成技術の進歩は、使い方によっては
大変な力を発揮するよ

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 21:43:35.42

>>20
>>43
>>69
>>73
>>109
初音ミクの良さって科学では説明出来ない
実在感じゃないアイドル性って解るかな？
天使の歌声だよ？
例えどれだけ美味しい料理でも
人肉を模していたら美味しくないでしょ？
感性の問題なんだよ

**ニュースソース検討中＠自治議論スレ** · 2018/12/15(土) 21:57:22.71

V5のデキがアレだからこっちに未来があるのは間違いないと思うよ

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 01:56:34.98

ハルオロイドミナミってスゲー世紀末感あるな

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 03:21:54.50

落語家の話も、AIに奪われる時が来るのかもしれない。
そおそも話の内容や語り口自身もAIが自動創作してしまうようになったなら。

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 03:55:58.23

オーディオマニアもころっと

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 03:59:07.17

藤田ミク

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 06:34:16.86

ミクは時代の徒花になるのかどうか

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 09:30:26.24

小田正和とかうまいひとがカバーすると原曲越えしまくるけど
そういう時代が来そうだな

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 09:39:33.66

>>1
歌手の売り込みに新たな一手が追加されたな

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 10:13:47.55

調整無しでこれかよｗ
かなり自然に聞こえる

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 10:43:48.85

初音ミクが売れるまで、VOCALOIDのサンプル音声で
プロの歌手を使うのは難航した。仕方が無いので
クリプトンフューチャーメディアはアニメ声優を起用し
アニメキャラクターが歌っているかのような演出をした
案の定これには硬派な業界から反発を受けた

そもそも芸能人は自分を機械で置き換えされるのを嫌う
芸能界も低コストの人工アイドルが増えれば
予算を削減されて、中抜きできなくなる

ホリプロの伊達杏子が鳴かず飛ばずだったのに
門外漢の初音ミクが大ヒット
芸能界にとって面白くないのは当たり前

初音ミクを超えようとするなら
初音ミク以上に強烈な逆風を覚悟すべき

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 10:49:09.56

井上裕太@yutainoue
これヤバい。以下の写真はどれも実在する人ではなく、AIが作り出した顔。
あまりにリアルで見分けられない。NVIDIAの研究。Kevin Kellyは「写真のが証拠になる時代は終わった」と。
論文はこちら　https://arxiv.org/pdf/1812.04948.pdf …
https://pbs.twimg.com/media/DuXo7wKUUAAKeu3.jpg:large
https://www.youtube.com/watch?time_continue=1&;v=G06dEcZ-QTg

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 11:06:15.55

この技術もっと進歩して、遺体が残ってたら、そこから歌声を
再現できるとかになったらすごいな
ファリネリがどんな風に歌ってたかとか実際に音で聞けたらすごい

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 11:09:20.22

声にも肖像権同様の権利が必要になるのでは？
ゼロから声を作ってそれが人気を集められればいいけれど、
生身の人間の(声以外を含む魅力に基づく)人気に乗っかり
声だけパクって商売するのはなんとも

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 11:25:42.38

元歌手とは判別できる程度に別人の声にしてあるんよねこれ
声紋分析したら確かに似てるけど違う声、になるはず
ミクと声優さんの声が違うのと同じ発想

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 11:29:07.77

聞いてきた
音の解像度が上がっただけで、音痴な点は変わってないのな
これ単にモデルのoutput層で表現できる値が増えたから良くなった感じ
変な声聞いて育つと色々音痴になったり発話障害になったりしてで嫌だな
もっと改善するまで広めないで欲しいところ

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 13:02:26.79

AI使うと楽できるってこと？

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 13:12:39.44

合成の精度を非常に上げることができるという点でディープラーニングはめっちゃ使えるという良い研究結果だな
ただこれだけの精度を出すために、再生（再現）する時にも計算処理が大きくなっているようで、GPUを使っても
それなりに処理時間がかかるとのこと。これが今のネック。
ユーザーとしてはいきなりトライ＆エラーの修正回数が激減している状態から始められると思うのでトータルでは
メリットが圧倒的に上回ると思う。

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 13:30:39.46

>>1
ヒトとモノの区別が付かなくなっていくな

こうなると、アニミズムのある文化圏が伸びてくる

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 13:38:25.31

>>137
日本は情弱だから伸びないさ
技術があっても何に使うのか想像力が働かない

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 20:11:36.46

音声データってくらいだから生声は数理化出来てるわけじゃん？
合成音声ってそんな難しいことじゃなさそうなんだけど初音ミクから10年以上経つのに革新的なものが出てこないな
やる気が足りないんじゃないの？

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 20:36:20.64

初音ミクは実のところ職人芸で成立してる方式だからね
今回は開発環境問題をAIとマシンパワーで解決できたので
来年にものすごい音声合成ブームがもう一度来るでしょうな

**ニュースソース検討中＠自治議論スレ** · 2018/12/16(日) 20:54:49.96

職人芸に頼る日本人