【AI】まるで『名探偵コナン』…遂に誕生した万能「変声機」の凄さと怖さ[03/26]
■ このスレッドは過去ログ倉庫に格納されています
■名探偵コナン』のアノ発明品が現実に
もはや国民的アニメと呼んでも良いだろう『名探偵コナン』。その中でお馴染みなのが、主人公・江戸川コナン(実は高校2年生の工藤新一が、悪の組織によって小学1年生に変えられてしまった姿)が私立探偵・毛利小五郎の体を借りて事件の真相を暴くシーンだ。
コナンは彼を睡眠薬で眠らせると、胸に付けた「蝶ネクタイ型変声機」を使って、自分の声を毛利小五郎そっくりに変換する。そして自らつきとめた事実を語って、問題を解決するのである――あたかも毛利小五郎が事件の謎を解いたかのようにして。
もちろん名探偵コナンはフィクション作品だが、多くのフィクション作品と同様に、劇中に登場するテクノロジーに現実のテクノロジーが追い付こうとしている。そう、この蝶ネクタイ型変声機さながらの「声の変換」を実現する技術が登場しているのだ。
まずはこちらのデモ映像をご覧いただこう。
(中略)
自分や誰かの声を任意に変化させることを「音声モーフィング」と呼び、いまAI技術をこの分野に応用しようという取り組みが盛んになっている。
そしてModulateがこのサービスを実現するのに活用したのが、「GAN(Generative Adversarial Networks、競争式生成ネットワーク)」と呼ばれる最新のAI技術だ。
■悪用防止の対策はあるものの…
GANについては、以前フェイクニュースに関する記事でも取り上げたことがある。簡単に説明すると、目標とするコンテンツを自動生成するAIと、そのコンテンツが本物かどうか見破るAIを用意し、その間でコンテンツ生成と真偽鑑定の「競争」を何千何万回と繰り返させることで、より自然で本物に近いコンテンツを生成できるようにするという手法である。
GANはいま、映像コンテンツ生成の分野で大きく注目されており、その威力を見せつけるものとして、同じくオバマ前大統領をサンプルとした(なぜか彼はデモの素材として人気らしい)有名なフェイク動画がある。
■動画
You Won’t Believe What Obama Says In This Video! 😉 https://youtu.be/cQ54GDm1eL0
この中で偽のオバマ氏は、「キルモンガー(映画『ブラックパンサー』に登場する悪役)は正しい」「トランプ大統領は大バカ者」など、本物がまったく言いそうにないセリフを口にしている。
そのため彼をよく知る人であれば、「何かおかしい」というフェイクの可能性を疑うことだろう。しかし彼の性格や表現のスタイルについてよく知らないという場合は、これがフェイクかどうか見破るのは至難の業に違いない。
そうした高品質のフェイク映像をつくり出せるAI技術を活用しているのが、Modulateのサービスというわけだ。となれば悪用が心配されるところだが、当然ながら同社もそのような使い道は推奨しておらず、たとえばオンラインゲームなどで使用するアバターに好きな声を喋らせるといった活用法を想定しているそうである。
最近は他のユーザーとマイクを通じてコミュニケーションできるオンラインゲームも増えているが、いくらアバターを可愛らしい女性にしても、野太い声では自分が中年男性だとばれてしまう(もちろんその逆のパターンもあるだろう)。そこでアバターを自分好みに着飾るのと同様に、声も好きなようにカスタマイズできれば、というわけだ。
■動画
Modulate: Unlock Your Voice https://youtu.be/lJBJOnryOLU
https://amd.c.yimg.jp/amd/20190326-00063693-gendaibiz-000-1-view.jpg
https://gendai.ismedia.jp/articles/-/63693
続き) 続く)>>1
■オレオレ詐欺がさらに横行?
人間がいかに音声によるコミュニケーションに騙されやすいか、振り込め詐欺、つまり「オレオレ詐欺」の被害が一向に無くならない日本に住む私たちには、痛いほどわかっているだろう。そんな状況でModulateのような音声モーフィングサービスが普及すれば、さらに詐欺行為が横行してしまう不安はないのだろうか。
実際に、気になる研究結果が出ている。アラバマ大学バーミンガム校コンピューターサイエンス学部の研究によると、人間の脳は、よく似た人間の音声の聞き比べができない可能性があるそうだ。
この研究を指揮した、主任研究者のNitesh Saxena博士は、同校のニュースリリースにおいて「人間は音声モーフィングを使用した攻撃に対し、根本的に脆弱な存在である可能性がある」と指摘している。
この研究では、オリジナルの声と変換によってつくられた声を被験者に聞かせ、その際に脳がどのような反応を示すかを、機能的近赤外分光法(fNIRS)という手法を使って観測した。
すると違う人の音声を聞かせた際には、脳の動きに違いが見られたものの、オリジナルの音声と、変換によってそれに似せた音声を聞かせた際には、脳内で同じ処理が行われていたそうである。つまりあくまで音声だけをインプットとした場合、人間の脳はオリジナルの声と、変換によってつくられた声に対して、脳のレベルで聞き分けができていないわけだ。
前述のSaxena博士は、こうした脳の構造について「現在および将来における音声合成技術を悪用したさまざまな詐欺行為に対し、人間を弱い立場においてしまうかもしれない」と解説し、さらに「たとえば誰かがあなたの母親のふりをしてボイスメッセージを残しても、それが本物かどうか見極められない可能性がある」とコメントしている。
続きはソースで
https://amd.c.yimg.jp/amd/20190326-00063693-gendaibiz-000-1-view.jpg
https://gendai.ismedia.jp/articles/-/63693 コナン、小五郎、園子なんかの声が出せる蝶ネクタイの商品化も夢じゃない? これで好きな声優にいくらでもエロイことを言ってもらえるな お手軽に声優の声が出せる変声器が実現したとしても、
今度は自分の演技力に絶望することになりそう むしろ声優という職業が不要になる可能性が
一人で収録 AI「ボイスチェンジャーのデモジュラーも実はあるけど内緒 まるで『名探偵コナン』…遂に誕生したチコちゃん「キム兄ィ」の凄さと怖さ さっさとカラオケ屋はこのシステムを入れるべき 街中が歌うま 24ってドラマで大統領夫人の声を用意しろって場面が
オレオレ詐偽よりも
イタズラから政治問題が発生し
取り返しがつかない緊張からの
ボタンポチッとなも
インパがしでかしそう バーチャルだのアバターだのは現状では視覚的なものが主体だが
音声的なものもそうなりうるわけだな >>12
金
朴
李
今のNHKの人材ってこんなのばっか ゲームのキャラメイキングでキャラの外観だけじゃなく
声も好きなように選んだり編集できるようにってもは割と早く実現しそう……課金オプションで 出会い系サイトで有名声優やタレントなどのふりして騙すのが流行るのかー むかしむかし電話でエロがあったがおやじが若い女の声もだせるなw これ本人レベルの演技力が必要
有能な俳優なら使っても真似できない。 >>21
つうか有名声優てすでに10代の人口減ってるのでだれそれだぞ?
ジャニーズやら音楽業界のおしすらすでに学校知らんがなな世界だぞ >>8
完全には無くならんわ…演技する人間は要る
亡くなった声優の声を再現するとか、やって欲しいかも >>19
子供がコナンごっこやるぶんには問題ない
>>18
そちらはあるかもな >>25
山田ルパンとか?
演技はうまいけど顔がイマイチ、モーションアクター
声質がイマイチ、デビュー
価格下落 オッサンのあえぎ声も美少女に変換できるんだろ?
もうエロゲ買えないなwww 顔を好きに変えられる機械ができたら「変顔機」になるのだろうか 録音に証拠能力がなくなって言いたい放題になるかもな >>25
演技もAIで学習させれば声優業は完全に機械化されてしまうだろうな
過去の声優の最盛期の声質を永遠に保存して再利用できるようになったら
職業としての声優はなくなるだろう いや、CGなどの演技、振り付けのソースコード化が難しい様に
声だけでもソースコード化は相当手間だと思う。
少なくとも現時点の延長線上のAIは文脈を読めないし、演技も無理
CGモーションアクターのタレントとしての価値が低いのと同様に
声優の価値が下がるというところは同意
未来永劫出来んとは思わんが、予見できる近未来ではアカンやろ
いわゆるシンギュラリティーが実現した後の話 演技力のある人間がひとりで全ての声をあてるのは
十分に現実的だとは思うが、実際には
下手糞でも顔だしで可愛いアイドル声優の方が売れるんだろうし
そうなるとゴースト声優みたいなものが出てくるんだけど
そんで実は顔の方もGAN生成で非実在だったりして、これはもうディストピアですわ >>1
でもあれって声優が入れ替わって喋ってるんだよね? 女装して外見だけはどうにかなっても声だけは男なまま。
これで女声出せればかなり嬉しい。 電話で聞こえてくる相手の声は相手本人の声ちがうんやで >>35
声質だけを変化させられるということは声質を同じにすれば演技だけを抽出できるということ
過去の声優の演技を抽出して蓄積していけばパターン化できてAI化が可能になるだろう 動画、チェンジされた声と話し方がオバマそっくりなのかtがそもそも分からんw 実用化されて市販されるのはいつになるかな?
これは是非俺も欲しい。
名探偵コナン26巻で灰原が使用していたマスクを付けて他の人物に声変えて変装するやつ
あれならばリアルタイムでも会話できる。
もっというと超小型化すればまるで何もつけていないのに声を変えて別の声で話せたりとかそうなると良いなあ… >>41
日本語で話すやつを見てみたかった。
安部総理の声を出してみたりとかな。 >>40
そのアプローチだと新しい驚きは出てこなさそうだな 似たアニメ声を出せてもやはり多少声質は違いそう。
山田康雄ルパンと栗田貫一ルパン
矢島晶子しんのすけと今のしんのすけ
灰原哀と綾波レイくらいに良く聞くと微妙に偽物という。 誰でも頭が良くなる、プログラムが書けるようになる方法が発見される 98739
https://you-can-program.hatenablog.jp 誰でも頭が良くなる、プログラムが書けるようになる方法が発見される 98739
https://you-can-program.hatenablog.jp 木村祐一が出てるとチャンネル替える人でもチコちゃんに叱られる!は見てるみたいな
ことが実際あるからな 本当は、オソロシイ ドクロみたいな声の人でも、アイドルみたいな声優になれちゃうわけかぁ?
芸能変声マシーンですね そりゃ顔認証の次に声紋で個人追跡はやりやすそうだからな
変装よりも変声器のほうが情報偽装が楽ではあるんだが どんなポップソングも松田聖子の若いときの声とかで聞こえるなら歓迎じゃないか >>45
オリジナルを知らない世代にとっては十分実用的だろう 今日勉強したイディオム
Stay woke, bitches!! 名探偵コナン映画 blue sapphire?
主題歌ですか? 聴きましたよー ^^
行く鳥の
とまりし 塔に
透過光
鱗肌 裂き
脱ぐ 旅衣
(^^) 💎⛪ 実際、声優がとか小さいことじゃなく、
メディアから得る情報全てがフェイクになる可能性が懸念されてるよ。 声優なんてアイドルに下駄はかすためにやってるだけなんだから
これで仕事を失うなんてあるわけないだろうに
可愛い子はこれからも色つけるために仕事がどんどん来るよ 版権モノエロ同人に本人そっくりのエロボイス加えられるようになるのか
胸熱 女性が使いそうだな
化粧と同じで、女性の地声を旦那は知らないまま死ぬってありそう くぎゅボイスで電話が掛かってきたら
うっかり振り込んでしまうかも >>63
逆に男性でも婚活やお見合いや合コンで使えないかな?
俺方言の訛りが酷くてしゃべり方がおかしい。
声も甲高くてキモいとか言われているのだが、これでイケメンボイスになれるなら使ってみたいなの。
営業や接客なんかの仕事でも使えないだろうか? 大体人間は、性格>外見>声で見られるからね。
よっぽど変な声でない限りはイケメン、美少女ならば全く問題ないけど。
しかし顔は可愛いのに声が減んな娘とかもこれでむくわれるか。
あとは病気で声帯摘出したりして上手く話せなくなった人もこれでむくわれるかな? 外国人が日本語話すとどんなに頑張ってもイントネーションおかしい。
日本人が英語話すとイントネーションおかしい
外国人「ワターシハ、マイケルデース。ドーゾヨロシク〜オネガーイシマス」
こういった部分もこの変声機で修正できないのかな? 「あれ? 毛利探偵の口は動いていない。 それに声はあのソファの方から聞こえてくる…。 どういうことだ?」 >>70
仮に本当に変声機のようなものが出来ても
コナンがいつも小五郎を眠らせて代わりに推理ショーしているようなことやっても絶対にばれるよね。 >>68-69
キック力増強シューズは?
…と思ったけどあれはほとんど利用価値ないよな。
実際のサッカーの試合で使ったら反則、護身用ならスタンガン
実際の戦争ならば今はもっと近代的な兵器あるし。 >>45
これ声優さんが病気やら産休やら入ったときの代役で使えないだろうか?
ドラえもんの声優交代のときもかなり叩かれたがこれで大山のぶ代声を引き続き出せれば… >いくらアバターを可愛らしい女性にしても、野太い声では自分が中年男性だとばれてしまう(もちろんその逆のパターンもあるだろう)。
ネカマの偽装が捗るな。 毛利小五郎の首には、シャブ中患者の手首のように注射アザがたくさん出来ている。 >>63,65
対面でどうやって音声変換使うんですか…
いつもマイクとスピーカー持ちながら会話するの?
訛りを気にする以前の話じゃないですかソレ >>72
あれ、キック力じゃ無くて脚力とかなら現実でも使い道有るのにな
>>77
おっちゃん、麻酔撃たれたとき「キタッ」って喜んでる時あるからもう麻酔の虜です これで声だけじゃなく外見まで他人に化けられる機械とかができれば
まさにドラえもんの秘密道具にも匹敵する凄い大発明でやりたい放題になるよな。
30分立つと効果が切れるとかそんなのでも良いけどさすがにそこまでは無理かな… 携帯電話の通話音声が100%音声合成なんだから
それいじればすぐ他人の声に化けるだろうよ >>79
作中での理論的には「電気と磁力で足つぼを刺激することで筋力を極限まで高める」だけだから、解釈としては脚力で合ってる
コナンつーか新一がサッカー小僧だから、もっぱら蹴ることに使われてるけどw
映画だと、空飛ぶレベルの超ハイジャンプに使った例もあることはある ■ このスレッドは過去ログ倉庫に格納されています