X



【AI】ヤフー、分散表現の学習時間を短縮するAI技術「yskip」をオープンソース化[04/18]
■ このスレッドは過去ログ倉庫に格納されています
0001しじみ ★垢版2019/04/19(金) 03:33:19.32ID:CAP_USER
ヤフーは4月18日、AI(人工知能)の機械学習における自然言語処理技術の1つである分散表現の学習時間を短縮する技術「yskip」をGitHubで公開した。

https://image.itmedia.co.jp/news/articles/1904/18/mm_yahoo_aioss_01.jpg

 分散表現は、単語をベクトルで表現する自然言語処理技術の1つ。大量のテキストデータからさまざまな単語の関係性を機械学習することで、単語同士の意味の違いを機械的に推定できる。同社ではユーザーの興味関心と、記事や広告をマッチングするための技術として活用している。

 AIの精度を向上させるために、日々増えていく検索キーワードやSNSの投稿などを活用する場合は、分散表現の学習モデルを頻繁に更新する必要がある。これまでは、新しいデータだけでなく、学習済みのデータも合わせていちから学習し直す必要があり、非効率的だった。

 yskipを使えば、新しいデータのみの学習で済むため学習時間を短縮でき、全データを学習する場合と同等の精度を維持できるとしている。同社は、Twitterへの投稿を検索できる「リアルタイム検索」でyskipを活用し、サービスの質の向上に役立てているという。

https://image.itmedia.co.jp/news/articles/1904/18/mm_yahoo_aioss_02.jpg

yskipは代表的な分散表現学習法である「skip-gram model with negative sampling」を拡張した技術。ヤフーは同技術の特許権を取得しており、研究と商業用途それぞれでライセンスを無償提供する形でオープンソース化した。

 「本技術のさらなる利便性向上を図り、データサイエンス領域の研究者・エンジニアコミュニティーへ貢献したい」(ヤフー)

ITmedia NEWS
https://www.itmedia.co.jp/news/articles/1904/18/news120.html
0002ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 03:40:53.22ID:jSGMyNn8
文章内の単語とそれらの繋がりを構造的に調べて
文章が表現しているのと類似の状況の画像を合成し素早く表示できるようなAIは作って欲しいもんだ

そしてそれっぽい状況の画像が、人間にどんな心情を作り出すか(寂しい感情とかうきうきするとか希望とか)
そしてそれらの心情を表す単語がまたどんな単語あるいは映像とリンクしてるか

この辺を組み合わせて続けたら、AIが人間の心情に一定レベルまで共感できるようになるかどうか
0003ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 03:55:44.01ID:hZpqp0pC
コンピュータがチェスで世界チャンピオンに勝ってから、囲碁で世界チャンピオンに勝てるまで、何年かかると
思っているんだ。ルールは少なく明確、結果も「勝敗」で明確。
つまりは、ルールが明確になっていない問題に対しては、AIを使って正解に辿り着くには、少なくとも何十年か
かかるだろうこと、答えを出してもそれを判定する方法論が未熟なこと、今回のAIブームで使うようになった
理論は、以前からあったものであることなどを考え合わせると、AIが「人間の心情に言ってレベルまで共感」など
今世紀中にはほぼ有り得ないと言える。

要は、地道に目標を掲げてやっていくしかないんだよ。
0005ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 06:15:16.62ID:oh9T87Zz
(゚∀。)ナルヘソ
0006ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 06:29:43.97ID:iLoPF/2/


馬鹿は ベクトルの意味、調べてから 書け。
0007ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 06:59:38.13ID:JW+awHQ4
AIが自分で新しい言葉作って新しい概念の定義をしだしたらホンモノだろうな
0008ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 07:00:45.73ID:JW+awHQ4
ちなみに数学的にはそうなっている可能性はある
それを言語化できるかどうかというところだね〜
0009ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 07:49:44.15ID:Mk7ScpNJ
>>7
概念って何?
0011ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 08:31:59.08ID:1D3jpQ2A
致命的な欠陥があるということ。
0012ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 08:48:37.48ID:no635CE2
ykkap?
0013ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 09:19:04.74ID:jGSmzXYw
>>3
自分はバカだと宣言したい趣味の人?
0015ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 12:46:20.16ID:KT7bVVUz
>>10
企業が社会に貢献しているということ
本件、尊敬に値する
0016ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 13:32:08.29ID:TEGBpgeP
核心部分の特許を維持したまま、オープンソース化してんなら
開発の主導権は、ヤフーが握ったままだし
事実上、フォークも出来んのじゃないか?

こんなもんで開発とかしたら
ヤフー支配の闇に堕ちていきそうだ
0017ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 13:53:15.28ID:4EhJjiXE
>>1
こんな言いかえはどうですか? という機能の実装に役立ちそうだな
文章書くのに一役買いたい
またコーパスなどの辞典を作成する参入障壁が低くなるな(解析は楽になる。データ集めなどはがんばれ)
0018ニュースソース検討中@自治議論スレ垢版2019/04/19(金) 20:32:28.17ID:iLoPF/2/
>>7
なかなか 良い表現。だなぁ。
人間は モノ見れば  感性で  一般的な概念をイメージできるけど
AIには 感性が無いので それでも 判別はできる。アルゴリズム的に。
0020ニュースソース検討中@自治議論スレ垢版2019/04/20(土) 08:26:51.98ID:nSHtRIv4
データも欲しい
0022ニュースソース検討中@自治議論スレ垢版2019/04/20(土) 12:39:00.82ID:MyNcuzRa
>>7
「ヴぁんrし〓k
「お4幵
0023ニュースソース検討中@自治議論スレ垢版2019/04/20(土) 12:42:25.23ID:MyNcuzRa
>>18
言語体系ごとにある概念やない概念の差が結構あるので
単に翻訳を極めていくだけでもどうしても表面化してくると思う
0025ニュースソース検討中@自治議論スレ垢版2019/04/21(日) 08:37:36.14ID:+CqZFzkF
>>2
センサ側技術側の研究ですが
快、不快の画像も国による違いが有るとか
標準画像も盲信しちゃいけないってAIも学ぶんだろうか
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況