【AI】パナソニックやNECも採用、NICTが開発した多言語音声翻訳技術のスゴさ 「なぜ精度が上がるのか誰も説明できない」

■ このスレッドは過去ログ倉庫に格納されています
0001野良ハムスター ★2018/07/23(月) 08:44:18.31ID:CAP_USER
■先進的音声翻訳研究開発推進センターの木俵豊センター長に聞く

情報通信研究機構(NICT)が開発する多言語音声翻訳技術が、民間企業の製品やサービスに採用され始めた。パナソニックやNECなど、大企業向けの事例も多い。ただ人工知能(AI)を活用した精度向上の取り組みは国際競争が激化する。NICTの先進的音声翻訳研究開発推進センター(ASTREC)の木俵豊センター長に、取り組む翻訳技術の動向を聞いた。

―NICTの多言語音声翻訳技術は、スマートフォン向け音声翻訳アプリケーション「ボイストラ」として広く知られています。

「ボイストラはあくまで実証実験用のアプリ。これを通じてNICTの翻訳技術を知ってもらい、民間企業への技術移転につなげている。その後は技術移転した企業同士で連携し、それぞれの製品の改善を進めてもらう」

―ディープラーニング(深層学習)を使う「ニューラル機械翻訳」により、従来の統計翻訳と比べて大幅に精度が向上しました。

「我々の技術は自然で分かりやすい文章に翻訳できるのが特徴。深層学習は層を増やせば性能が上がるが、従来は膨大な計算量を処理できなかった。それが画像処理半導体(GPU)を使う汎用計算(GPGPU)の活用で可能となった。産業技術総合研究所がAI技術用として整備中のGPU基盤と連携し、開発を進めている」

―単語の抜け落ちなど、深層学習ならではの誤訳もあります。

「深層学習でなぜ精度が上がるのか、逆に問題が起こるのか、誰も説明できない。トライアル・アンド・エラーでさまざまなデータを学習させるしかない。NICTは『翻訳バンク』という仕組みで、企業から幅広くデータを収集している。それを分野ごとに整理し、各分野の翻訳エンジンをつくっている」

―世界的にグーグルがGPGPUを大規模に活用し、急速に翻訳精度を高めています。

「日本企業は規模では立ち行かない。また日本は著作権や個人情報保護に慎重な考えがあり、データ共有も進めにくい。グーグルに真っ向勝負するのでなく、データを活用しやすくするなどの法整備が重要となる。NICTとしても研究開発したものをより発展できるよう、民間企業へ技術移転を進めていく」

日刊工業新聞2018年7月23日
https://newswitch.jp/p/13793

0067ニュースソース検討中@自治議論スレ2018/07/23(月) 17:35:40.78ID:+IFFDl3J
技術移転なんてしないで開発者がベンチャー立ち上げろよ。
そのベンチャーに当面は国が仕事を与えればいい。
大手電機メーカーとかに技術移転しても製品開発するアイ
デアもなく,国際的に営業展開する力もなく,中で腐らす
だけ。

0068ニュースソース検討中@自治議論スレ2018/07/23(月) 17:41:20.80ID:+IFFDl3J
>>22
というか,国語を表現する手段として強化しないと,
英語もうまくならない。人に伝えたいことが何も無
い人間には言語なんて必要ないでしょ。

似非翻訳家というレベルの層の上にプロ翻訳家がい
るわけだけど,似非がAIで淘汰されたらプロ候補
が少なくなってプロがそのうちいなくなる。

0069ニュースソース検討中@自治議論スレ2018/07/23(月) 17:42:24.80ID:UwJVTmvd
>>55
やっぱそうか
おれはもうちっとやるわ
後、Programingももしかしたらいらなくなるかもなと思ってる

0070ニュースソース検討中@自治議論スレ2018/07/23(月) 17:47:18.51ID:Nw4ohJHB
>>55
それは分かるw
楽しくて趣味でやるんなら、それはいいけど

0071ニュースソース検討中@自治議論スレ2018/07/23(月) 18:02:49.11ID:X+0e+/63
>>13
誤:朝鮮語による文章は翻訳が難しい
正:朝鮮語による文書はそもそも意味を成していない

0072ニュースソース検討中@自治議論スレ2018/07/23(月) 19:42:55.42ID:cYVCtNI0
>>55
正しい。5年で翻訳ツールは進化することが分かってるのに、大学入試の英語がどーのとか笑えるわ
小学生の子供いたら、スマホにひたすら話しかけさせる

0073ニュースソース検討中@自治議論スレ2018/07/23(月) 20:10:00.38ID:JmWx9aVL
パナソニックはパニックソニックに名前変えるといいねん

0074ニュースソース検討中@自治議論スレ2018/07/23(月) 20:55:00.21ID:nQmkUNxc
逆だ、逆に考えるんだ!AIに仕事を取られて失業するのが先伸ばしできると考えるんだ!\(^o^)/

0075ニュースソース検討中@自治議論スレ2018/07/23(月) 21:43:12.29ID:8FN0d0c3
人工知能、ディープラーニングやビッグデータ処理には、高速大容量メモリが必要になる。

もし東芝が原発に手を出さず、手堅くメモリから人工知能研究を続けてたら、NVIDIAと並ぶ世界的人工知能メーカーになってた。
馬鹿の文系さえ社長にしなければ。
  

0076ニュースソース検討中@自治議論スレ2018/07/23(月) 21:47:26.80ID:8FN0d0c3
小学校からの英語教育は不要だよな。
そんなのは機械に任せればいい。

それよりまともな日本語の理解ができるように国語の時間でも増やしとけ。
人工知能が理解できて、正しく翻訳できるように正しい日本語の読み書きできる能力を。

0077ニュースソース検討中@自治議論スレ2018/07/23(月) 21:57:34.91ID:Ydz7f2SZ
NICTの翻訳結構すごいよね

0078ニュースソース検討中@自治議論スレ2018/07/23(月) 22:13:10.00ID:dfcyQnsi
>>5
それ数年前の考え方
知識をアップデートしなきゃ

0079ニュースソース検討中@自治議論スレ2018/07/23(月) 22:25:43.36ID:vIBinSbg
 


>>17

いや、
世界中の人間が手話を憶えればいいと思う。


 

0080ニュースソース検討中@自治議論スレ2018/07/23(月) 22:29:14.74ID:RPyp5fD0
英語の手話と日本語の手話は違うんだぞ

0081ニュースソース検討中@自治議論スレ2018/07/23(月) 23:12:41.67ID:/MMqdd/x
>>3
「教師」データが最も豊富な言語のひとつだぞ

0082ニュースソース検討中@自治議論スレ2018/07/23(月) 23:12:44.53ID:TzIlJx87
ネトウヨって本当に韓国について詳しいよな

0083ニュースソース検討中@自治議論スレ2018/07/23(月) 23:28:26.71ID:qZ3Lr/nm
たしかに韓国語って論理的に破綻してるところが多いよな
あとなんか言い回しがすごいゲスくなる

0084ニュースソース検討中@自治議論スレ2018/07/23(月) 23:28:46.91ID:wUZ8Af+A
>>1
久しぶりに日本初の技術で期待できそうなものが?!
どうせぬか喜びだろうけどね(笑)

0085ニュースソース検討中@自治議論スレ2018/07/24(火) 00:28:43.72ID:thYxJh+f
>>83
なんでそんなに韓国の事に詳しいの?

0086ニュースソース検討中@自治議論スレ2018/07/24(火) 01:06:46.33ID:3G5LApW1
>>85
5ちゃん見てるとわかるだろ

0087ニュースソース検討中@自治議論スレ2018/07/24(火) 01:35:22.20ID:SZexB+lI
>>5
それは非AIの話

0088ニュースソース検討中@自治議論スレ2018/07/24(火) 15:10:31.85ID:QI17aDCU
>>65
AI同士が人間に理解できない言語で会話し始めて慌てて止めたってニュースがあった

0089ニュースソース検討中@自治議論スレ2018/07/24(火) 17:06:05.46ID:2QLgIdre
>>88
それフェイクニュースというか、
曲解されかねない見出しw
https://toyokeizai.net/articles/-/214077

0090ニュースソース検討中@自治議論スレ2018/07/24(火) 17:48:18.75ID:L9biyEq0
アメリカのヨセミテを旅行してた時に使ってみたいが、ニッチな単語やフレーズにはまったく対応されてないから、まだまだこれからの技術だとは思った

でも将来的には英語とか習う意味が無くなりそう

0091ニュースソース検討中@自治議論スレ2018/07/24(火) 17:56:35.43ID:R+UU1ZbG
>>1
「深層学習でなぜ精度が上がるのか、逆に問題が起こるのか、誰も説明できない。トライアル・アンド・エラーでさまざまなデータを学習させるしかない。」


こんなものを自動運転や、ポイント利用履歴でユーザーのスコアリングに使われたら怖すぎる

0092ニュースソース検討中@自治議論スレ2018/07/24(火) 18:05:46.63ID:r+xEahf8
5chの全内容を丸ごと学習させよう(提案

0093ニュースソース検討中@自治議論スレ2018/07/24(火) 18:13:41.97ID:htLL7tcC
むかし
中国経由して中国人が人海戦術で多言語翻訳する 人力翻訳サービスがあったな

どーなんたんだろ?

0094ニュースソース検討中@自治議論スレ2018/07/24(火) 18:33:10.80ID:TS5Pn6Jv
>>91
あなたの脳みそだって何がどうなってそういう思考結論を導き出しているのか
その回路図や神経伝播フローを全部明確に示せと言われて誰もできない誰も分からない。

脳みその物理的仕組みを真似たのが機械学習なのだから同様に明確に示すことはできない。

だが「調教」により、より望んだ判定基準に従って結果を考えるよう誘導することはできる。

0095ニュースソース検討中@自治議論スレ2018/07/24(火) 19:16:16.70ID:8RCaeLny
>>94
行列計算できる?

0096ニュースソース検討中@自治議論スレ2018/07/24(火) 20:25:05.02ID:uIZ1HYpq
>>1
>また日本は著作権や個人情報保護に慎重な考えがあり、データ共有も進めにくい。
えぇ…
日本の議会でAmazonやGoogleの情報収集が
海外みたく問題になってるの見たことないんですけど
私用メール問題すらないで

0097ニュースソース検討中@自治議論スレ2018/07/24(火) 21:27:28.28ID:Wl2muwZw
>>79
手話は各国語に分かれていて、一般言語語と変わらんぞ

0098ニュースソース検討中@自治議論スレ2018/07/25(水) 09:46:34.50ID:jSnLlkxd
<丶`∀´>ノ ギャラクシーに載せるからよこすニダ

0099ニュースソース検討中@自治議論スレ2018/07/26(木) 22:08:28.33ID:JHWuggV+
唐突に「韓国」が出てくる。
嫌われているのだろうけど、嫌う価値もないと思う。

0100ニュースソース検討中@自治議論スレ2018/07/26(木) 22:14:15.92ID:qogQkn1k
>>3
それは日本が魅力的なマーケットであり続けられるかどうかに掛かっている

0101ニュースソース検討中@自治議論スレ2018/07/26(木) 22:23:02.16ID:y+JjBbVN
人間だってうまい翻訳者がなぜうまいのか説明できない
経験があるとか知識があるとか、漠然と言って説明した気分になってるだけ
人工知能がたくさんデータを入れたら精度が上がったって言ってるのと何も違いはない

0102ニュースソース検討中@自治議論スレ2018/07/27(金) 15:08:11.70ID:AeWrDHex
ほんと俺が生まれた時に全世界の言語が一つだったら良かったのにな

0103ニュースソース検討中@自治議論スレ2018/07/28(土) 07:41:05.99ID:xzficEU8
PanasonicとNECって大した事なくね?
マイクロソフトとかなら別だけど

0104ニュースソース検討中@自治議論スレ2018/07/28(土) 07:58:57.06ID:y1MaTtMH
顔判別はNECのがMSより上かもと言われてる。
MSの顔判別はMSだけでは売れないけど、NECのはNECが警察や警備会社に売ってる。

全世界でスマホの接続先に使われてるデジタル交換器は80年代に規格化されNECが日本のINSサービスの実装として実用化した。
なので世界でインターネットが携帯で見られてる限り、ありとあらゆるところでNECの技術が使われている。
ある意味インターネット網の原型を作った連中よりすごい。
そして松下はそのデジタル交換機網を実現する基地局のスタンダード。
それからありとあらゆるビル・住宅の電気設備から配線金具までを供給してる。
国内ではもちろんシェアNo.1だ。昔は家庭内の配線用品は東芝と日立とNationalブランドの松下だったけど、いまはほぼ全てPanasonicだ。

0105ニュースソース検討中@自治議論スレ2018/07/28(土) 08:17:09.97ID:v2jjuLVJ
>>3
実際はかなり精度がいい

一流の研究者が各国の文学を日本語翻訳しているのでデータは豊富、日本語と各国語の言語的・文学的比較研究も大量にある

0106ニュースソース検討中@自治議論スレ2018/07/28(土) 08:19:03.87ID:8riMyIS2
>>96
国内メディアは外資が何やってもスルーするけど
国内企業が個人情報の取り扱いでミスをすると
人を殺したかのようなバッシングを行う

0107ニュースソース検討中@自治議論スレ2018/07/28(土) 08:29:57.08ID:Dl7y4Q5m
翻訳アプリは原語と翻訳両方を発音すれば人間側が順応していくはずだと思う。
さらに翻訳を聴いた相手の反応もセンターで解析すればいいんよ。

0108ニュースソース検討中@自治議論スレ2018/07/29(日) 20:10:47.85ID:LPhpYxZx
説明するAI作ればいいやろ

0109ニュースソース検討中@自治議論スレ2018/08/21(火) 21:03:22.57ID:JAU9Vl1B
翻訳力がアップする医療大麻オイル販売(弁護士御用達)
戦国時代は黒田官兵衛が使ってました
秀吉に天下を取らせた人物です
また日本銀行の総裁の子孫です
https://plaza.rakuten.co.jp/denkyupikaso/diary/201806090001/

AIにももちろん使われてます→世界ではほぼ合法化されている

0110ニュースソース検討中@自治議論スレ2018/09/01(土) 14:53:58.73ID:ksjESyMF
良い文章を書ける人間、
良い音楽を作曲出来る人間、
良い証明を思いつく数学者、

などなどは、なぜそうであるのかは、説明できない。
Gifted(天与の才)と言われるゆえんだ。

0111ニュースソース検討中@自治議論スレ2018/09/01(土) 15:05:41.05ID:ksjESyMF
各分野での天才と言えるレベルのAIが人間のいろんな知恵や、自己学習によって
育成されていったとしよう。しかし、ある段階では非常に聡明であった
AIシステムが、ますます経験や学習を積むうちに、独善に陥ったり、
過去の経験に囚われがちになったり、なんだか創造的ではなくなったり
するかもしれないから、常にそれぞれの分野の新しいAIを育て続ける
努力をしなければならないのかもしれない。そういったAIを教育する
教師AIが開発されて、それもまた優劣があり、教師AIも次第に学習や
経験を積んでいった結果、ピークを過ぎると却ってダメになるかも
しれないなどがあれば、これもまた常に教師AIを育成する必要が
あって、教師AIを育成する教師AIが、。。。ということになりそうだ。
  それぞれのエキスパートAIは、巨大なデーターの記憶を背景にして
実現されている(たとえそれがニューラルネットのようなものであろうと)
すれば、それでなぜうまく行くのかは簡単な論理では説明できない
だろうから、状態を保存するのには、バックアップが必要になるのだろうが、
そのバックアップを別の少しハードが異なるシステムに移しても使える
ものにはならないかもしれないな。1つのAIあたりたとえば1ヘキサバイトの
記憶容量が要ったら、そのようなAIシステムを100台、あるいは数億台
を保管したり、運営するのには、どれだけの資源が要るのだろうか?

0112ニュースソース検討中@自治議論スレ2018/09/23(日) 11:12:36.58ID:n7cCWlMo
>>109
日本銀行って戦国時代以前から存在してたのか?

0113ニュースソース検討中@自治議論スレ2018/09/23(日) 14:50:32.29ID:39M+oAs3
>>112
民明書房の本で探せばきっと存在していたことが判る

0114ニュースソース検討中@自治議論スレ2018/09/24(月) 00:53:08.45ID:lSAJXbZ9
今に、源氏物語、平家物語、なども自動翻訳で英語になる時代が来るので
あろうか?

0115ニュースソース検討中@自治議論スレ2018/09/24(月) 08:51:29.75ID:QPIp/7vR
Google翻訳はいまだに肯定文を否定文に訳したり否定文を肯定文に訳したりする。
なかなか改善しない。
誰かがAIに嘘を吹き込んでいたずらしているんじゃないかと疑っている。

0116ニュースソース検討中@自治議論スレ2018/09/24(月) 11:59:32.08ID:V4aLhKzb
人間でも日常会話のほうを先に幼少から覚えて、文章理解は小学生レベルから順々に
上がっていって長い年月を掛けて大学入試レベルや専門レベルの文章理解に到達

AIでもいきなり専門レベルの文章の機械翻訳やらせても苦しく、日常会話から深層学習
させていくのが合理的

0117ニュースソース検討中@自治議論スレ2018/09/24(月) 12:15:08.83ID:lSAJXbZ9
AIもいつか反抗期を迎えるときが来るかもしれない。
そうして青春の悩みを抱えて自殺したりなど。

■ このスレッドは過去ログ倉庫に格納されています