【AI】パナソニックやNECも採用、NICTが開発した多言語音声翻訳技術のスゴさ 「なぜ精度が上がるのか誰も説明できない」
■ このスレッドは過去ログ倉庫に格納されています
■先進的音声翻訳研究開発推進センターの木俵豊センター長に聞く
情報通信研究機構(NICT)が開発する多言語音声翻訳技術が、民間企業の製品やサービスに採用され始めた。パナソニックやNECなど、大企業向けの事例も多い。ただ人工知能(AI)を活用した精度向上の取り組みは国際競争が激化する。NICTの先進的音声翻訳研究開発推進センター(ASTREC)の木俵豊センター長に、取り組む翻訳技術の動向を聞いた。
―NICTの多言語音声翻訳技術は、スマートフォン向け音声翻訳アプリケーション「ボイストラ」として広く知られています。
「ボイストラはあくまで実証実験用のアプリ。これを通じてNICTの翻訳技術を知ってもらい、民間企業への技術移転につなげている。その後は技術移転した企業同士で連携し、それぞれの製品の改善を進めてもらう」
―ディープラーニング(深層学習)を使う「ニューラル機械翻訳」により、従来の統計翻訳と比べて大幅に精度が向上しました。
「我々の技術は自然で分かりやすい文章に翻訳できるのが特徴。深層学習は層を増やせば性能が上がるが、従来は膨大な計算量を処理できなかった。それが画像処理半導体(GPU)を使う汎用計算(GPGPU)の活用で可能となった。産業技術総合研究所がAI技術用として整備中のGPU基盤と連携し、開発を進めている」
―単語の抜け落ちなど、深層学習ならではの誤訳もあります。
「深層学習でなぜ精度が上がるのか、逆に問題が起こるのか、誰も説明できない。トライアル・アンド・エラーでさまざまなデータを学習させるしかない。NICTは『翻訳バンク』という仕組みで、企業から幅広くデータを収集している。それを分野ごとに整理し、各分野の翻訳エンジンをつくっている」
―世界的にグーグルがGPGPUを大規模に活用し、急速に翻訳精度を高めています。
「日本企業は規模では立ち行かない。また日本は著作権や個人情報保護に慎重な考えがあり、データ共有も進めにくい。グーグルに真っ向勝負するのでなく、データを活用しやすくするなどの法整備が重要となる。NICTとしても研究開発したものをより発展できるよう、民間企業へ技術移転を進めていく」
日刊工業新聞2018年7月23日
https://newswitch.jp/p/13793 終わりの始まり
人類は種としてのアイデンティティを失っていくだろう 音声入力の精度も格段に向上してるもんな
スマホも数年で同時通訳が実現すると思う >なぜ精度が上がるのか
そりゃその都度これは違うぞと間違いを指摘してやれば教育成果として精度は向上するだろ
条件分岐を無数に内包した空間演算なんだから当たり前
この場合はこう、という、予め答えのわかっている問題には強いのだ 働き方改革なんてするよりも
AIに投資するほうがよかったんじゃないか >>6
その二つはどちらかしか出来ない
性質のモノなのか? 今更、日本企業や日本の研究機関が音声翻訳やる意味あるのか?
日本語研究はもうグーグルの圧勝だし、勝ち目ないんだから
とっとと撤退して、グーグルの胸を借りればいいよ ・
深層学習じゃないだろ、強化学習だろ。クズ産経。 ・
それに
精度が上がる理由が不明 っていうのは ディープラーニング 全般の 特徴であって、
音声翻訳の独自の こと、じゃないはず。
もう
大嘘 すれ。 >>3
韓国語がもっとも翻訳しにくいw
日本語はまだマシなほう。 >>10
AIにも投資している事を知らないお前がバカなんだぞ 優秀なユダヤ人が開発したエスペラント語をみんなが話せば
翻訳ソフトは不要となり、世界が平和になる どう考えても、近い将来語学バカは要らなくなると思うのだが
その点語学に特化している連中は何考えてるんだろう
大量の時間と金をかけて機械抜きで外国人と世間話できるようになりたいのか 理由はわからないが、使うことはできる。そうなっちゃったのかしら >>17
懐かしい。昔、教科書で読んだ。
今や英語がエスペラント語に匹敵する言語なんだな。
英語が世界を征服した。 翻訳家(ぷろ)の需要は変わらないけど専門的な知識も要求されるし
英語教育にたいする重みを軽くして国語を強化したほうが良いと思うわ 立法機関があまりにもトロ過ぎるから、
法律が出来る頃には全部が終わってそうだよね。 深層学習といっても、大量のデータを集めて最適化する統計技術。
昔は力技だったけど今はハードの性能が上がって割と簡単になったからね。
ま、グーグル翻訳に負けないものを作ってほしいわ。 >>8
でもグーグル日本語入力が性能がいいか?というと疑問だし、グーグルにしてみれば日本でしか使ってない言語は重視する意味ないよね。
コストの問題出てきたら後回しじゃない? 地図は今や(C)Googleが当たり前の時代だし
いずれ音声翻訳や文字変換も(C)Googleになっていくのだろう はてな、我々人類が地球上で生きていく意味そのものにも直結しそうな深さのあるニュースかも >>25
そこはほんとどうなるんだろうね
このままだとAIの扱いの有無で、経済面で絶対的な差が国家間で生まれるはずなんだけど、
今のままの日本だと置いていかれる側になっちまう >>19
AIの学習ってそういうもの
将棋AIの開発者も、AIがなんでその手を指したのか誰も説明できない
厳密に言えばできるけど、膨大なログを何日もかけて解析するから、やる意味がない AIはブラックボックス、黒魔術と呼ばれている
何故そうなるのか誰も分からない >>4
スマホ内完結してくれるようになってほしいわ
今みたいにサーバー使うタイプだと、電波ないとこで使えない >>13
朝鮮語は一語一語の単語の翻訳は出来る。
でも話の筋が通ってないから文章として文頭・文末の辻褄が合わず
翻訳文を理解できない事が多発する、詰めて言えば朝鮮文となると翻訳不能の場合が多い。 >>35
朝鮮語は語られる内容がそもそも意味不明だからな。
論理じゃなく恨みなどの感情を表す言葉だから、他言語への翻訳は難しいだろう。 暗記の学習はどんどん価値が低下していくな。
学校で社会・政治経済軍事を分けて教育する意味あるのか?日本では教育界に間抜な自虐左翼教員が跋扈して軍事を絶対に教えないが、これ抜きでは国際政治・経済を教える意味が半減だ ここって、研究成果を中国に譲渡する契約結んでるって
国会議員が指摘してたっけ >>18
俺は趣味が高じて、英仏独伊西とやってしまったが、
それはそれで手応えというものはあるんだよ。
とてつもなく面倒臭かったのは事実だが。
あなたが言ってるのは、エベレストの頂上は
ヘリで行けるのに、徒歩で登頂するクライマーは
馬鹿だ、と言ってるのと同じだ。 語学をやると、日本語と違う思考回路ができる。
苫米地英人氏が、別人格が完成するといってたのも
あながち誇張し過ぎではない。
脳内の再フォーマット化だよね。副産物としては
日本人はよく欧米では〜と吹かす場合の、
インチキが一発で見抜けるようになることとかw これは好評だ。使う人が増えると、学習でどんどん改善されるんじゃないか
国研のなので、変な広告もない >>10 のレスがバカすぎて
なんか読む気失せた (´・ω・`) そのうち中国のAIの書き込んだレスに釣られる輩が大量に出るんだろうな 意味がある言葉を繋げてるだけの日本語がなぜ翻訳難易度高いのか 人間の赤ちゃんは数年で会話できる様になるんだから、これよりも高性能な学習機能があるって事だよな
後どれくらいで追いつくのだろう >>3
それは日本人がどれだけ真剣に取り組むか次第じゃん >>35
識字率はいいが文章理解力は世界で平均以下っていう韓国人そのもの >>44
日本的な論理、英語的な論理、というのは出来てくるね
誉め言葉→皮肉、への変化の仕方とか、国によって異なるから楽しいと思う >>52
主語とか省略して構文テキトーでも単語並べただけなんとなく通じる日本語の自由度の高さが従来の機械翻訳には不向きだったんだと思う
最近のAIは統計処理ベースだから例文大量に学習させればなんとなくの日本語処理とは相性いいのかもしれない
誤読・誤訳もあるだろうけど、あいまいな日本語は人間でも意味を取り違えることは普通にあるから
AIでも人間並みの日本語処理はできるようになるんじゃないかな >>44
ありきたりだが警察は事前には動かない。
今じゃどこの家庭もSECOMが当たり前の時代なんだから
襲われるのが嫌なら隣にボディーガードを付けとけばいいんだよ。
http://guard-dog.crayonsite.com/
格安ボディガードのガードドッグなんか時給2500円で付いてくれるから相手が確実に来るときに付けとくだけでもかなりの抑止効果になるよ。 AIに責任ある仕事を任せられるようにならないから、人間の手を離れることはないよ
AIが責任をとることを嫌がるように作れないから。責任をとることを嫌がるようにすると、メンタル維持でいまよりも手がかかるようになる >深層学習でなぜ精度が上がるのか、逆に問題が起こるのか、誰も説明できない。
怖すぎ・・・ やりたいことだけ言って、後の詳細設計はアウトソーシングしかしてないから
何もわかっていない。 人間や脳にも言えることだなそこらがはっきりわかればAIの進歩も捗るんじゃまいか >また日本は著作権や個人情報保護に慎重な考えがあり、データ共有も進めにくい。
日本は既得権益層のせいで絶賛衰退中 技術移転なんてしないで開発者がベンチャー立ち上げろよ。
そのベンチャーに当面は国が仕事を与えればいい。
大手電機メーカーとかに技術移転しても製品開発するアイ
デアもなく,国際的に営業展開する力もなく,中で腐らす
だけ。 >>22
というか,国語を表現する手段として強化しないと,
英語もうまくならない。人に伝えたいことが何も無
い人間には言語なんて必要ないでしょ。
似非翻訳家というレベルの層の上にプロ翻訳家がい
るわけだけど,似非がAIで淘汰されたらプロ候補
が少なくなってプロがそのうちいなくなる。
る >>55
やっぱそうか
おれはもうちっとやるわ
後、Programingももしかしたらいらなくなるかもなと思ってる >>55
それは分かるw
楽しくて趣味でやるんなら、それはいいけど >>13
誤:朝鮮語による文章は翻訳が難しい
正:朝鮮語による文書はそもそも意味を成していない >>55
正しい。5年で翻訳ツールは進化することが分かってるのに、大学入試の英語がどーのとか笑えるわ
小学生の子供いたら、スマホにひたすら話しかけさせる パナソニックはパニックソニックに名前変えるといいねん 逆だ、逆に考えるんだ!AIに仕事を取られて失業するのが先伸ばしできると考えるんだ!\(^o^)/ 人工知能、ディープラーニングやビッグデータ処理には、高速大容量メモリが必要になる。
もし東芝が原発に手を出さず、手堅くメモリから人工知能研究を続けてたら、NVIDIAと並ぶ世界的人工知能メーカーになってた。
馬鹿の文系さえ社長にしなければ。
小学校からの英語教育は不要だよな。
そんなのは機械に任せればいい。
それよりまともな日本語の理解ができるように国語の時間でも増やしとけ。
人工知能が理解できて、正しく翻訳できるように正しい日本語の読み書きできる能力を。 >>5
それ数年前の考え方
知識をアップデートしなきゃ
>>17
いや、
世界中の人間が手話を憶えればいいと思う。
>>3
「教師」データが最も豊富な言語のひとつだぞ たしかに韓国語って論理的に破綻してるところが多いよな
あとなんか言い回しがすごいゲスくなる >>1
久しぶりに日本初の技術で期待できそうなものが?!
どうせぬか喜びだろうけどね(笑) >>65
AI同士が人間に理解できない言語で会話し始めて慌てて止めたってニュースがあった アメリカのヨセミテを旅行してた時に使ってみたいが、ニッチな単語やフレーズにはまったく対応されてないから、まだまだこれからの技術だとは思った
でも将来的には英語とか習う意味が無くなりそう >>1
「深層学習でなぜ精度が上がるのか、逆に問題が起こるのか、誰も説明できない。トライアル・アンド・エラーでさまざまなデータを学習させるしかない。」
こんなものを自動運転や、ポイント利用履歴でユーザーのスコアリングに使われたら怖すぎる むかし
中国経由して中国人が人海戦術で多言語翻訳する 人力翻訳サービスがあったな
どーなんたんだろ? >>91
あなたの脳みそだって何がどうなってそういう思考結論を導き出しているのか
その回路図や神経伝播フローを全部明確に示せと言われて誰もできない誰も分からない。
脳みその物理的仕組みを真似たのが機械学習なのだから同様に明確に示すことはできない。
だが「調教」により、より望んだ判定基準に従って結果を考えるよう誘導することはできる。 >>1
>また日本は著作権や個人情報保護に慎重な考えがあり、データ共有も進めにくい。
えぇ…
日本の議会でAmazonやGoogleの情報収集が
海外みたく問題になってるの見たことないんですけど
私用メール問題すらないで >>79
手話は各国語に分かれていて、一般言語語と変わらんぞ <丶`∀´>ノ ギャラクシーに載せるからよこすニダ 唐突に「韓国」が出てくる。
嫌われているのだろうけど、嫌う価値もないと思う。 >>3
それは日本が魅力的なマーケットであり続けられるかどうかに掛かっている ■ このスレッドは過去ログ倉庫に格納されています