X



【AI】ディープラーニングの「教師ラベル不足」とNTTの解決策[04/04]
■ このスレッドは過去ログ倉庫に格納されています
0001しじみ ★
垢版 |
2019/04/04(木) 21:11:47.12ID:CAP_USER
 ディープラーニング(深層学習)を活用する上でのネックとして「教師ラベル不足」がしばしば挙げられる。ディープラーニングの学習には教師ラベルが付いた大量のデータが必要で、このラベル付け作業には膨大な時間と手間がかかる。特に、専門性の高い分野ではこうしたデータを大量に集めるのはなかなか難しい。

 こうした課題を受け、NTT研究所は少ない学習データから効率的に学習できる「教師ラベル補正技術」を開発。この技術を応用した、AI(人工知能)で道路の陥没を未然に防ぐサービスを、NTTテクノクロスが「第3回 AI・人工知能EXPO」(4月3〜5日、東京ビッグサイト・青海展示棟)で参考展示している。
https://image.itmedia.co.jp/news/articles/1904/04/aiexpo_ntttex_01.jpg

■専門性の高い「道路の陥没」判定

 道路陥没の一因として挙げられるのが、地下にある配管の老朽化だ。配管が破損したりして水が地中に漏れることで周辺の地盤が削られ、陥没を引き起こす空洞が生じるという。国や自治体では、道路の下の空洞を検知して陥没を未然に防ぐ取り組みをしているが、これをAIでサポートする。

 空洞を調査するには、地表からレーダーを当てて取得した画像を専門家が目視で確認する必要がある。空洞があるかどうかの判定は熟練者でないと難しく、1日に調査できる道路の距離にも限界があるという。
https://image.itmedia.co.jp/news/articles/1904/04/aiexpo_ntttex_02.jpg

 この確認作業をAIで効率化。AIが地中画像データを解析し、空洞になっていそうな箇所を赤色に塗りつぶす。空洞の見逃しも防止する狙いだ。

 NTTテクノクロスの担当者は「例えば道路2キロ分の画像データを判定するには目視だと数日〜数十日かかることもあるが、AIを使えば40〜50分に短縮できる。現状、AIの認識精度は80%ほど」と説明する。

 AIの精度を上げるには、専門家が画像内のどこに空洞があるか印を付けて(正解ラベルの付与)、AIに読み込ませる必要がある。同社のメディアイノベーション事業部の松浦宣彦さん(第一ビジネスユニット 統括マネージャー、工学博士)は「学習用データを大量に用意するには、熟練した作業者が見つけた空洞箇所について、実際に道路を掘って正解だったかどうか確認する必要があり、膨大なコストがかかる」と話す。

 NTT研究所が開発した「教師ラベル補正技術」は、少ない教師データで効率的な学習を可能にする技術。正解ラベルが付与されたデータと、ラベルなしのデータを適切に組み合わせて学習させることで正解ラベルを“疑似的”に生成できるとしている。

 松浦さんは「例えば“サビ”がある箇所とそうでない箇所を画像内でラベル付けした場合、ラベルのない画像内でサビがありそうな箇所を自動的にラベル付けする」と話す。少量の正しい教師ラベルさえあれば、ラベルが不明な多数のデータに対して自動でラベル付けを行えるという。

 「実用化については検討中だが、AIがどれほど作業者の負担を軽減できるか引き続き検証していきたい」(松浦さん)

https://image.itmedia.co.jp/news/articles/1904/04/aiexpo_ntttex_01.jpg

ITmedia NEWS
https://www.itmedia.co.jp/news/articles/1904/04/news088.html
0003ニュースソース検討中@自治議論スレ
垢版 |
2019/04/04(木) 21:24:20.60ID:sJ/zeBsH
ラベルを作るためのAIが必要じゃね?
0004ニュースソース検討中@自治議論スレ
垢版 |
2019/04/04(木) 21:38:13.11ID:8+lU0ItI
自動でラベル付けできんだったら AI なんかいらないじゃん
0006ニュースソース検討中@自治議論スレ
垢版 |
2019/04/05(金) 00:53:17.28ID:Ivhu7mWO
データサイエンティスト(笑)のお仕事だね。
工場でゲインチューニングしてるおっさんとの違いが判らん。
0007ニュースソース検討中@自治議論スレ
垢版 |
2019/04/05(金) 01:19:44.16ID:ot3/5wJL
いつもの多次元配列の距離の近い順に振りわけるタイプ、あるいはその複雑なやつなんだろ
秋田県
0008ニュースソース検討中@自治議論スレ
垢版 |
2019/04/05(金) 01:25:48.43ID:EfBAhnJ/
水増しテクニック
0009ニュースソース検討中@自治議論スレ
垢版 |
2019/04/05(金) 01:36:28.33ID:7EovOO9z
簡単にでも最初に「教師ラベル」の説明しろよ。
唐突過ぎだろ。
0010ニュースソース検討中@自治議論スレ
垢版 |
2019/04/05(金) 01:50:54.47ID:lok0laXf
だから、これ 教師無なし学習だろ。 それ細かくクラスタリングして  教師ありのデータとセットで
判定していくんじゃないの?
0012ニュースソース検討中@自治議論スレ
垢版 |
2019/04/05(金) 06:52:53.47ID:ICZciar7
世界でも信頼されてるNECの顔認証はどうやってデータ作ったんだろうな。
毎晩数万枚の写真の分類を社員にやらせてたのかな
0013ニュースソース検討中@自治議論スレ
垢版 |
2019/04/05(金) 10:05:29.64ID:NnWtc/lf
少ない答えから学習して正解を探すのがAIの肝なのに
初めから100点の正解を覚えさせようとしてる時点でAI使う意味ねーだろ
0014ニュースソース検討中@自治議論スレ
垢版 |
2019/04/05(金) 10:21:47.74ID:gbT/uFu/
>>12
一人につき複数枚、誰のものかわかってる画像を用意すればいいだけだ。
同意してくれる社員から集めればかなりの数になるし、
電子的な社員証による建物の出退管理システムを使ってる
他社からデータを買ってもいい。
手作業で写真が誰もののか見分ける作業は必要ない。
0016ニュースソース検討中@自治議論スレ
垢版 |
2019/04/06(土) 07:53:09.97ID:Ci5A6pW1
俺だったら顔認証の登録データにマンガの絵紛れ込ませて国籍・人種の代わりに作者名答えられるデータベース作るぜ
0017ニュースソース検討中@自治議論スレ
垢版 |
2019/04/06(土) 09:38:41.82ID:RZWQma9U
運転免許証を発行してる警察は人物と紐づいた顔画像を
数千万人分入手できる。免許の更新があるから一人複数枚。

個人情報うんぬんで使えないかもしれないが、名前を誰だかわからない記号に
置き換えてしまえば使っていいことになるかもしれん
0019ニュースソース検討中@自治議論スレ
垢版 |
2019/04/06(土) 14:40:28.17ID:HCEt8c5b
一番怖いのは、政権がひっくり返ったり、外国に占領されたりしたときだな。
都合の悪い人間を間引くとかマジでやりそう。
北中ロあたりはやるだろうな。もう計画しているかも。
0021ニュースソース検討中@自治議論スレ
垢版 |
2019/04/23(火) 07:19:10.79ID:nIO1ESRk
事実を捏造するNTT
0022ニュースソース検討中@自治議論スレ
垢版 |
2019/04/23(火) 08:58:06.68ID:n3blrCA8
AIは万能ではない
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況