【テクノロジー】唇の動きを画像認識、会話を解読 中国のIT企業が開発
■ このスレッドは過去ログ倉庫に格納されています
【12月25日 CNS】
中国のIT大手「捜狗(Sogou)」が業界初となる口唇形状認識の開発に成功した。
音声認識に頼らず、話す人の唇の動きを画像認識することによって会話の内容を解読する。
口唇形状認識は画像認識と自然言語処理が一体となった技術。ディープラーニング(深層学習)を応用し、
中国語の口の動きを数千時間かけて学習させた。認識の正確率は60%以上で、
米グーグル(Google)による英語の口唇形状認識システムの正確率50%を上回った。
12月上旬に中国・浙江省(Zhejiang)で行われた
「世界インターネット会議(World Internet Conference)烏鎮サミット」で捜狗の口唇形状認識が初めて公開され、注目を集めた。
今後は、音声認識と画像認識技術を補助する「マン・マシン・インタフェース」の一つとして、
さまざまな場面で広く応用されるだろう。周囲の雑音が大きい場合、公共の場など声を発することができない場合、
会話の内容を他人に知られたくない場合など、日常生活でも実用性が高い。
また、マイクの付いていない監視カメラにも応用できる。さらに、障害がある人や高齢者の意思疎通にも活用できる。
人工知能技術の発展に伴い、近い将来、口唇形状認識も音声認識や画像認識と同じように我々の生活に欠かせないものになるかもしれない。(c)CNS/JCM/AFPBB News
画像:「世界インターネット会議・烏鎮サミット」で展示されていた口唇形状認識システムを試す来場者
http://afpbb.ismcdn.jp/mwimgs/7/0/700x460/img_703df7a4a35647bada937fc2d8793b7f216762.jpg
AFP
http://www.afpbb.com/articles/-/3156363?pid=19657948 これで街中でも中国共産党のヒソヒソ話で批判しようものなら投獄ができますね 中国共産党が目をつけたら莫大な予算がつくんだろーなー あー、えー、いー、おー、うー!
発声練習のこのぐらいならシナテクでも解読できるだろう。 これで共産党の噂すらも言えなくなったな
証拠が残るしな
次は何なんだろう、ワクワクするな 日本語みたいに単純な音声ならわかるけど中国語みたいな複雑な発音の言語を唇だけで判別できるんかね?
ngとnのちがいとか。 いやあこれは結構あんがい使いどころありそうで怖いな
国家だけにかぎらず企業とかも結構ヤバいんじゃない? ヒソヒソ話でも大声で喋ってる中国人が
どうしてこんな技術を開発する必要があるんだ? 単体だと使い物にならないけど
音声とかと組み合わせたら100%に近づけるのjか? 次は人が何を考えてるか判る機械だろうなぁ。
昔、秋葉原の怪しげな店に念力で動くマウスってのが売ってたなぁ。 青森あたりじゃ通用しないな 日本人でもわからんからな 「ほら、アベは金を払うと言ってるアル、早く払うアルヨ」 聴覚障害者は普通にやってるわけで
読唇術の機械化は可能だろな あの国はこういうスパイじみた技術は必死に開発するよな / ̄ ̄^ヽ
l l ∧ ∧
_ ,--、l ノ / ゙i─/ ,ヽ
,--、_ノ:: `ー':: 、ミー---‐,,l / 支 \ これで防犯カメラに映った人民を
,/ ::: i ̄ ̄ | 、.‐'`´________`゛'‐ ,
/ l::: l::: ll  ̄/ ─ ─ \ ̄ ̄ 逮捕出来るアルネ!
l . l !:: |::: l / /・\ /・\ \
| l l |:: l: l . | ⌒┏(__人__)┓⌒ | プギャーーーー!
| l . } l:::::,r----- l. \ ┃ トェェェイ: ┃ /
ヽ :l:::: ト:;;;;;;;;;/-/__........... / / ┃ : ┃ \ リップリーディングをDNN でやるって、
一年前にNVIDIA も発表しているし、世界初でも新しい技術でもない。 zhengzhouみたいな言語 マスターできる気がしない >>34
世界初じゃなくて精度の高さが売りみたい
あと英語ではなくて中国語であることとか ■ このスレッドは過去ログ倉庫に格納されています