X



【AI】元歌手と判別できないレベルのAI歌声合成、名古屋工業大学と音声ベンチャーが開発[12/14]
■ このスレッドは過去ログ倉庫に格納されています
0001しじみ ★
垢版 |
2018/12/14(金) 14:59:47.35ID:CAP_USER
名古屋工業大学 国際音声言語技術研究所と音声合成を柱とするベンチャー企業テクノスピーチは12月12日、これまでの歌声合成とは一線を画す、元の歌い手の声質、癖、歌い方といった特徴を捉えた歌い方をディープラーニング技術などの適用で実現した。約2時間分の音声データで学習し、日本語、英語、中国語に対応する。

 名古屋工業大学の徳田恵一教授を中心とするチームはこれまで、隠れマルコフモデルを使った統計的手法により、音声合成のOpen JTalk、歌声合成のSinsyを開発し、提供してきた。テクノスピーチはこれらを発展させた商用製品CeVIO Creative Studioの開発にも携わっている。今回の新技術はこれらを新たな次元に推し進めるものと言える。

 名古屋工業大学とその出身者によるテクノスピーチの共同研究は、2019年3月に開催される日本音響学会2019年春季研究発表で公開される。

 Sinsyと同じく、人手による調整がされていない「ベタ打ち」の歌詞付き楽譜データをMusicXML形式で与えるだけで、元歌手の特徴を再現する。

今回のデモはCeVIOで歌声を提供している、さとうささら、IAが使われていることから、CeVIOの将来バージョンまたは後継製品で使われることも予想される。

 故人である三波春夫さんをバーチャルシンガーにした「ハルオロイド・ミナミ」がCeVIOに対応する歌声として製品化しているが、この新技術を使った、本物と区別がつかない仮想三波春夫による「世界の国からこんにちは」を期待したいところだ。

http://image.itmedia.co.jp/news/articles/1812/14/koya_cevio2.png
http://image.itmedia.co.jp/news/articles/1812/14/koya_cevio3.png

※記事の音源はこちらのlinkから聞けます
https://www.techno-speech.com/news-20181214a

ITmedia NEWS
http://www.itmedia.co.jp/news/articles/1812/14/news089.html
0096ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 09:57:39.98ID:EhgBNpXl
AIでデザイン
並能力の デザイン職 なくなる
0097ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 11:20:03.25ID:5W4ySsDu
今回で大事なのは声が非常に明瞭でハイファイになっていること。
その過程で歌い方まで学習してるけどそれは副次的な産物。
広音域で聞き取りやすく、ネイティブの人間と同じように音素が波形レベルで
きっちりしてる発音ができることが歌声合成の現状最大の壁だったから。
0098ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 11:24:46.03ID:kGcdErjD
よく聞くと息つぎもしてるよな
0099ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 11:45:57.38ID:jiC+u7xd
ボーカロイドも終焉か
そのうち誰でもボタンひとつで曲ができるようになって、曲に価値なんてなくなるんだろうな
0100ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 11:53:34.68ID:UIDf96/T
エロゲに使えるレベルなら、制作費が相当圧縮できるが
あえぎ声とかはまだ無理だろうな
0102ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 12:16:26.92ID:hh2Jzy0u
人が歌うより透明感が数段上と感じた
0103ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 12:33:20.99ID:B3M1TVbK
自分の声で口パクできるようになる?

もしそうなら「lemon」を歌っている自分の歌声を聞きたい

いまは音痴杉で真似すらできね
0104ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 12:35:00.46ID:KzxDbgw5
意味が理解出来ないんだが、
タイトルの「元歌手」って誰の事?

この記事もAIかなんかが書いてるんじゃないか?チューリングテスト失敗レベル。
0105ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 12:46:07.22ID:oh4oi3f1
>>5
生身の歌手がその場で歌うのを聴く事が喜びなわけで...
0109ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 14:00:33.02ID:6wrJO0/5
初音ミク涙目wwwwwwwwww
0110ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 14:17:06.38ID:Ppz4jAHM
AKB終わったな
0111ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 14:20:57.06ID:5W4ySsDu
既存製品では公式に水瀬いのりさんが声色と癖担当とアナウンスされているが今回も同じかどうかは不明。
歌い方が上手いとそのように学習するわけだが、ライブに通ってるファンなら断定できるかもしれない。
0112ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 18:13:17.35ID:ANcki7LB
第九のコーラス隊も要らなくなるな。PCを200台並べてスピーカーを繋げばOKだもの。
0116ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 19:26:16.29ID:eipJHp0q
女を知らない名工大生の努力の結晶だぬ(・я・`)
0118ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 20:33:19.91ID:lSKkYjc0
>>92
湾岸戦争?の頃にCIAがフセイン大統領の失脚を企てて
フセイン大統領にソックリな男優を出演させた
ゲイ・ポルノビデオを制作したそうだ

もし、選挙の直前に安倍晋三の声を合成した
安倍ロイドで、籠池と密談した音声が
公開されたりしたら、選挙結果に影響するだろう?

音声合成技術の進歩は、使い方によっては
大変な力を発揮するよ
0119ニュースソース検討中@自治議論スレ
垢版 |
2018/12/15(土) 21:43:35.42ID:lSKkYjc0
>>20
>>43
>>69
>>73
>>109
初音ミクの良さって科学では説明出来ない
実在感じゃないアイドル性って解るかな?
天使の歌声だよ?
例えどれだけ美味しい料理でも
人肉を模していたら美味しくないでしょ?
感性の問題なんだよ
0121ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 01:56:34.98ID:DLuam/HH
ハルオロイドミナミってスゲー世紀末感あるな
0122ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 03:21:54.50ID:bk1sgUGi
落語家の話も、AIに奪われる時が来るのかもしれない。
そおそも話の内容や語り口自身もAIが自動創作してしまうようになったなら。
0123ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 03:55:58.23ID:HTDMmBEX
オーディオマニアもころっと
0127ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 09:39:33.66ID:E/OZIc1V
>>1
歌手の売り込みに新たな一手が追加されたな
0128ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 10:13:47.55ID:wNjUUHlA
調整無しでこれかよw
かなり自然に聞こえる
0129ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 10:43:48.85ID:PtJVV4Fj
初音ミクが売れるまで、VOCALOIDのサンプル音声で
プロの歌手を使うのは難航した。仕方が無いので
クリプトンフューチャーメディアはアニメ声優を起用し
アニメキャラクターが歌っているかのような演出をした
案の定これには硬派な業界から反発を受けた

そもそも芸能人は自分を機械で置き換えされるのを嫌う
芸能界も低コストの人工アイドルが増えれば
予算を削減されて、中抜きできなくなる

ホリプロの伊達杏子が鳴かず飛ばずだったのに
門外漢の初音ミクが大ヒット
芸能界にとって面白くないのは当たり前

初音ミクを超えようとするなら
初音ミク以上に強烈な逆風を覚悟すべき
0130ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 10:49:09.56ID:BZb0S5pr
井上 裕太@yutainoue
これヤバい。以下の写真はどれも実在する人ではなく、AIが作り出した顔。
あまりにリアルで見分けられない。NVIDIAの研究。Kevin Kellyは「写真のが証拠になる時代は終わった」と。
論文はこちら https://arxiv.org/pdf/1812.04948.pdf
https://pbs.twimg.com/media/DuXo7wKUUAAKeu3.jpg:large
https://www.youtube.com/watch?time_continue=1&;v=G06dEcZ-QTg
0131ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 11:06:15.55ID:H+5W/JIm
この技術もっと進歩して、遺体が残ってたら、そこから歌声を
再現できるとかになったらすごいな
ファリネリがどんな風に歌ってたかとか実際に音で聞けたらすごい
0132ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 11:09:20.22ID:ICT6oOTn
声にも肖像権同様の権利が必要になるのでは?
ゼロから声を作ってそれが人気を集められればいいけれど、
生身の人間の(声以外を含む魅力に基づく)人気に乗っかり
声だけパクって商売するのはなんとも
0133ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 11:25:42.38ID:xBqunPUO
元歌手とは判別できる程度に別人の声にしてあるんよねこれ
声紋分析したら確かに似てるけど違う声、になるはず
ミクと声優さんの声が違うのと同じ発想
0134ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 11:29:07.77ID:W24ZXUVq
聞いてきた
音の解像度が上がっただけで、音痴な点は変わってないのな
これ単にモデルのoutput層で表現できる値が増えたから良くなった感じ
変な声聞いて育つと色々音痴になったり発話障害になったりしてで嫌だな
もっと改善するまで広めないで欲しいところ
0135ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 13:02:26.79ID:B/GK/XJ+
AI使うと楽できるってこと?
0136ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 13:12:39.44ID:xBqunPUO
合成の精度を非常に上げることができるという点でディープラーニングはめっちゃ使えるという良い研究結果だな
ただこれだけの精度を出すために、再生(再現)する時にも計算処理が大きくなっているようで、GPUを使っても
それなりに処理時間がかかるとのこと。これが今のネック。
ユーザーとしてはいきなりトライ&エラーの修正回数が激減している状態から始められると思うのでトータルでは
メリットが圧倒的に上回ると思う。
0137ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 13:30:39.46ID:ONm9mJHr
>>1
ヒトとモノの区別が付かなくなっていくな

こうなると、アニミズムのある文化圏が伸びてくる
0139ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 20:11:36.46ID:fA9ADDcB
音声データってくらいだから生声は数理化出来てるわけじゃん?
合成音声ってそんな難しいことじゃなさそうなんだけど初音ミクから10年以上経つのに革新的なものが出てこないな
やる気が足りないんじゃないの?
0140ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 20:36:20.64ID:xBqunPUO
初音ミクは実のところ職人芸で成立してる方式だからね
今回は開発環境問題をAIとマシンパワーで解決できたので
来年にものすごい音声合成ブームがもう一度来るでしょうな
0141ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 20:54:49.96ID:j/NW85hd
職人芸に頼る日本人
0143ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 21:28:33.57ID:N2KdcQpX
>>1
すげぇな、おい!
また三波春夫の五輪音頭を聞きながら熱い応援ができるのか?!
0144ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 21:31:12.09ID:j/NW85hd
歌歌わなくていいから、会話とかの性能向上してくれ
0146ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 22:21:57.86ID:xBqunPUO
ちなみにSinsyというこの技術の前身となるサービスがあるんだが
そこでは既にDNNを採用した女声音源が実装されて歌わせることができる
聴けば分かるけど既存技術より地味に声の解像度が向上してる
変なブレス入るようになったけど
0147ニュースソース検討中@自治議論スレ
垢版 |
2018/12/16(日) 22:52:36.90ID:Ng4MlcO8
凄いなこれ
ちゃんと商用歌声として聴けるレベルになってる
嗜好品としてのヴォーカルの魅力は再現できないとしても
コマーシャルソングとか企業のテーマソングとか「破綻のないプロの歌であれば良い」というニーズならこれで十分だろ
0150ニュースソース検討中@自治議論スレ
垢版 |
2018/12/17(月) 00:35:11.68ID:0o4vadW6
>>3
そういう音楽には何の価値も無い時代に突入だな
益々下手でも生歌の価値が上がる時代になるんだろう
0151ニュースソース検討中@自治議論スレ
垢版 |
2018/12/17(月) 00:41:09.80ID:Y21N2pt/
聴いてみたど
三波春夫にしてはちょっと声が高いな
0155ニュースソース検討中@自治議論スレ
垢版 |
2018/12/17(月) 06:19:15.90ID:i91sOYNM
機械ロボ音が消えてるな
これ消すのにものすごく苦労するんだ
簡単処理でリアル音声ぽく出来そうで何より
早く出せ
ただし雑魚い声のヤツ元声に使うなよ
0159ニュースソース検討中@自治議論スレ
垢版 |
2018/12/17(月) 14:42:00.64ID:vRY0ksjO
ちゃんと呼吸音があるんだな、声の後に吐く息が聞こえるのが凄い
0162ニュースソース検討中@自治議論スレ
垢版 |
2018/12/17(月) 21:57:23.78ID:g5PQ3ncT
アーティスト(故人を含む)の歌声の再現

楽曲作品制作やゲーム開発への応用

バーチャルユーチューバーによる配信・イベント

バーチャルアクターによるアフレコシステム

人工知能や音声対話システムの発声モジュールへの導入

外国語教育・歌唱教育における柔軟な参照音声の生成

ALS・喉頭がん等の患者様が用いる発声デバイス

介護施設用デジタルサイネージ

https://www.techno-speech.com/news-20181214a
0163ニュースソース検討中@自治議論スレ
垢版 |
2018/12/18(火) 02:40:45.28ID:q5I1Litl
藤圭子の新譜だしてくれ
ヒカルはやるきねぇし
0164ニュースソース検討中@自治議論スレ
垢版 |
2018/12/18(火) 04:23:26.83ID:9QjK3Rhn
ボーカロイドで、音痴のやつの声をサンプリングして
うまく歌わせるのをテレビでやってた

歌手にこだわる必要ない
むしろ声はいいのに音痴にこそ使え
0166ニュースソース検討中@自治議論スレ
垢版 |
2018/12/18(火) 10:07:44.83ID:ZoFJkY9A
技術にケチつけるのもあれだけど、人間の歌い方とかイントネーションを真似してるだけだよね、、、
パクリというか。
全然ときめかないんだけど。
0168ニュースソース検討中@自治議論スレ
垢版 |
2018/12/18(火) 12:05:29.72ID:TBhm0nan
>>1
あえぎ声はよ

エロ小説朗読も頼む
0169ニュースソース検討中@自治議論スレ
垢版 |
2018/12/18(火) 12:19:38.82ID:g3/EDECT
>>165
ボカロっていうのは肉声の再現よりは
絶対に音程を外さない歌手をアマチュアの作詞作曲家でも
気軽に利用出来るシステムを構築した功績が大きい
プロの歌手に自作曲を歌ってもらうなんて
しかもレコーディングで何ヶ月でも何年でも
しかしボカロなら思いのまま
人間の声は同一人物でも常に同じ声で歌えるとは限らない「生もの」だが
ボカロの声は楽器だ、いつでも同じ声で歌ってくれる
0170ニュースソース検討中@自治議論スレ
垢版 |
2018/12/18(火) 13:04:30.51ID:2SgZRwEI
>>165
ボーカロイドは相当深く習熟した人間が1曲ごとに調整しないと
>1くらいにならないんじゃない?
>1は2時間分くらい聞かせたら聞かせてない曲を楽譜だけで
歌えるようになるということだから、労力の違いが大きい
0172ニュースソース検討中@自治議論スレ
垢版 |
2018/12/18(火) 16:31:55.19ID:EIWvkKRC
>>167
人とミクとで、コストの差を考えろよ
金だけじゃない。自分の作った曲がその場でポンッと歌になるんだから、そりゃ皆すげーって言うわ
人より劣る歌にも関わらず、猛烈なムーブメントが起こったのには理由があるんだよ
0173ニュースソース検討中@自治議論スレ
垢版 |
2018/12/18(火) 19:57:25.44ID:7pBua+AL
人とイクとで、コストの差を考えろよ
金だけじゃない。自分の作ったAV台詞がその場でポンッとAV作品になるんだから、そりゃ皆すげーって言うわ
人より劣る喘ぎ声、泣き声、絶頂声にも関わらず、猛烈なムーブメントが起こったのには理由があるんだよ
0178ニュースソース検討中@自治議論スレ
垢版 |
2018/12/19(水) 01:29:30.10ID:tNfPcZJf
声優の声再現できんの?
0180ニュースソース検討中@自治議論スレ
垢版 |
2018/12/19(水) 05:08:59.43ID:T3G9iYfr
>>172
でも人より発声は劣ってるし曲聞いて心が動いたことないんだよね。
だからこれからも凄いと思うことはないだろう。
冨田勲がミクとコラボしたのは意味があったんだろうけどあれも感動はなかったし。
0181ニュースソース検討中@自治議論スレ
垢版 |
2018/12/19(水) 06:58:25.10ID:UOTB8ZIs
>>180
例えば初期のワープロ、フォントが16ドットや
24ドットで字がカクカク、ガタガタ
字を書くのが極めて下手な人が、初めてワープロを使うと
誰でも読める字を印字出来て感激する
字を書くのが上手い人にとっては、字に心がこもってない
自分なら、もっと綺麗に書けると
0183ニュースソース検討中@自治議論スレ
垢版 |
2018/12/19(水) 07:10:32.97ID:T3G9iYfr
書道をAIが書いてるようなもんかな。
機械学習できれいな書体を機械がかけたとしても、ツールとして便利だけど出力したものに感動はないよねという。
ただし知らなければ騙されるだろうけど、それなら死ぬまで騙し続けてもらわないと困る
0185ニュースソース検討中@自治議論スレ
垢版 |
2018/12/19(水) 07:48:06.83ID:Lq3Ew3mH
>>184
なんか分かる。
ルパン三世の最新シリーズで、ネット技術やクラッキングを駆使した盗みや追跡等の表現がされてたんだけど
凄く地味なんだよね…
アニメという創作物の枠内ってところを差し引いても、PCやネットで完結する技術は何故か感動やワクワクに結びつかない怪

とはいえ、人の手で調整せずに>>1まで出来るのは凄いなw ボカロ界隈にも再びフィーバー来そう
0186ニュースソース検討中@自治議論スレ
垢版 |
2018/12/20(木) 02:10:53.40ID:lNtdXGDA
>>184
ボトルネック解消に向けての改良だよ
キー入力がなければ音声入力で代用する
0189ニュースソース検討中@自治議論スレ
垢版 |
2018/12/20(木) 04:48:37.96ID:Dvw4W1Az
>>183
ツールとして便利で、完成に至るまでのコストが超絶安い
その結果として現れた作曲文化の裾野の広がり、多様性こそが初音ミクの本質だよ

そもそも初音ミクの歌は、別に人間の歌う歌の劣化版というわけではない
初音ミクというツール、文化が存在しなかったら決して生まれなかった、作曲家自身から
直接生まれて形になった歌なわけで、人の歌とは成り立ちからして別物だよ

別に、その上で「人の歌の方が好き」というのは全く自由だけど、その辺に思い至りもしない
というのは、音楽鑑賞の上で相当問題があると思うぞ
0190ニュースソース検討中@自治議論スレ
垢版 |
2018/12/20(木) 05:33:07.50ID:/W/DBiai
なんだよ元歌手って。
元歌手とは判別できない程の音痴雇ってもしょうがないだろ。
0191ニュースソース検討中@自治議論スレ
垢版 |
2018/12/20(木) 05:35:13.50ID:/W/DBiai
>>185
映画のマトリックスは古いビルに侵入して廃棄された
オフィスに残った配線にひとつだけ残ってる電話機から
交換機に侵入する表現の序盤の方がスリリングでカッコいいじゃん。
0193ニュースソース検討中@自治議論スレ
垢版 |
2018/12/23(日) 09:06:58.71ID:pgzqJjTb
いずれ、音痴のあなたが歌った録音を自動修正して、音程の正しい歌唱の
録音データーにしてくれるソフトは実現するだろう。

全国の音痴の皆さん、期待してね。
0194ニュースソース検討中@自治議論スレ
垢版 |
2018/12/23(日) 15:20:30.45ID:pgzqJjTb
ジャリタレとかアイドル歌手も、実際には音程が不良で、エコーをかけずには
BGM無しでは聞くに堪えないレベルの者がよく居る。そういう本来歌手として
2流3流の技量しかなくても、修正ソフトを使って音程を直すことでCDとして
売れるレベルの作品に仕上げることができるのだ。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況