【AI】「難解な論文をわかりやすく要約してくれるAI」が開発される[04/27]

■ このスレッドは過去ログ倉庫に格納されています
0001しじみ ★2019/04/28(日) 21:41:58.14ID:CAP_USER
専門雑誌に掲載された難解な論文を読み込み、科学的背景を持たない読者にもわかりやすいようにかみ砕いて文章として伝える「サイエンスライター」と同じように機能するAIをマサチューセッツ工科大学(MIT)の研究者らが発表しました。

Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications | Transactions of the Association for Computational Linguistics | MIT Press Journals
https://www.mitpressjournals.org/doi/full/10.1162/tacl_a_00258

Rotational Unit of Memory
http://super-ms.mit.edu/rum.html

Can science writing be automated? | MIT News
http://news.mit.edu/2019/can-science-writing-be-automated-ai-0418

MITの大学院生であるRumen Dangovski氏とLi Jing氏、物理学教授のMarin Soljačić氏らの研究チームは、専門的な論文を1、2文程度に要約するAIを開発しました。AIが生成できる文章は非常に短いため、2019年4月時点では実際のサイエンスライターが作成するような記事を作り出すことはできないとのことですが、大量の論文を読む際に軽くチェックして内容を予備的に把握するのに役立つ可能性があります。

もともと、研究チームは物理学的な問題に対処することを目的としてAIでのアプローチを試みていたそうで、論文の要約などの処理に焦点を当てていなかったそうです。ところが、研究チームは自身が開発したアプローチが物理学の分野だけでなく、自然言語処理を含むほかの分野にも同じアプローチが適用できることに気づいたとのこと。

一般的なニューラルネットワークは、コンピューターが非常に多くの事例についてのパターンを「学習」して進歩します。たとえば写真に写っているオブジェクトを識別したり、写真や音声から特定のものを抜き出したりするシステムに、ニューラルネットワークは広く活用されています。

その一方で、ニューラルネットワークは長い一連のデータから情報をピックアップし、関連付けることが困難だとのこと。この能力は長い論文から必要な情報を見つけ出して要約する、サイエンスライターのような仕事に求められる技術の一つです。長距離の依存関係をモデル化する長期短期記憶(LSTM)ネットワークなどの手法がこの問題を解決するために使用されていますが、自然言語処理を実用的なものに近づけるには至っていません。

研究チームは従来のニューラルネットワークに使われてきた行列の乗算に基づくシステムではなく、多次元空間で回転するベクトルに基づく代替システムを考案しました。このシステムは「記憶回転単位(rotational unit of memory)」と名付けられており、研究チームは「RUM」と呼んでいます。RUMはニューラルネットワークが要素を記憶するのを助け、より正確に要素を思い出すことにも有効とのこと。RUMはもともと光の振る舞いのような複雑な物理学的問題を解決するために考案されたアプローチでしたが、やがて研究チームはRUMが自然言語処理のような他分野でも有用である可能性に気づきました。
https://i.gzn.jp/img/2019/04/27/science-writing-be-automated/03_m.png

自然言語処理において、RUMは文章中に登場する個々の単語を多次元空間におけるベクトルで表すとのこと。文章中の単語が特定の長さと特定の向きを持つ線になることで、数千もの次元を持つ理論上の空間で文章が表され、最終的なベクトルが文章となって出力されると研究チームは述べています。


試しに研究チームがLSTMネットワークを用いた要約AIに、「Baylisascariasis」という動物に感染する回虫の一種に関する論文を読み込ませ、要約を出力してみたところ、以下のような文章が生成されました。この要約は非常に反復的であり、実用に耐えうる精度であるとはいえません。

https://gigazine.net/amp/20190427-science-writing-be-automated
続く)

0049ニュースソース検討中@自治議論スレ2019/04/29(月) 12:23:03.57ID:IQ6u+0GP
テレビキャスターの通訳に使うと良いよ!
日本語が分りやすくなる。
国会中継には是非。

0050ニュースソース検討中@自治議論スレ2019/04/29(月) 13:03:15.85ID:Now5EhdP
天声人語を要約させてみたところ、

「今日もまた原稿用紙を埋めてみた」

と出たら正解。

0051ニュースソース検討中@自治議論スレ2019/04/29(月) 16:19:55.07ID:zoFg6uhH
>>1 これはありがたい 論文のグラフって単位が書いて無いのがなぜか多いからな
ちゃんと縦軸と横軸に単位を書いて欲しい 頭が良い人が科学論文を書くから
単位を書かなくてもわかるだろ、とか思ってるんだろうな

0052ニュースソース検討中@自治議論スレ2019/04/29(月) 18:35:32.58ID:2mryK9RM
わざと難しく書くと評価される経済学の論文も何とかしてくれませんかねえ…(´・ω・`)

0053ニュースソース検討中@自治議論スレ2019/04/29(月) 18:53:01.21ID:BV5UOfSl
望月センセの宇宙際タイヒミューラー理論の論文をわかりやすく説明してくれたらみんな喜ぶぞ

0054ニュースソース検討中@自治議論スレ2019/04/29(月) 19:24:01.85ID:+A6qmN/R
英語の方が簡単だろうな
てか日本語で欲しいけどそっちは時間かかりそうw

0055ニュースソース検討中@自治議論スレ2019/04/29(月) 19:24:50.77ID:VecC4EjB
医療系の原著論文はAbstractのConclusionを読めばとりあえずわかるように
なっているからこんなのは必要ないな。他の領域はどんな感じかね。

0056ニュースソース検討中@自治議論スレ2019/04/29(月) 20:08:46.82ID:CEJrkfER
要約してみた。

MITの大学院生Rumen Dangovski氏とLi Jing氏、物理学教授のMarin Soljačić氏らの研究チームは、専門的な論文を1、2文程度に要約するAIを開発しました。
研究チームは多次元空間で回転するベクトルに基づく代替システム「RUM」を考案しました。RUMはもともと複雑な物理学的問題を解決するために考案されたが
自然言語処理のような他分野でも有用である可能性に気づきました。

RUMは文章中に登場する個々の単語を多次元空間におけるベクトルで表すとのこと。
文章中の単語が特定の長さと特定の向きを持つ線になることで、数千もの次元を持つ理論上の空間で文章が表され、
最終的なベクトルが文章となって出力されると研究チームは述べています。

0057ニュースソース検討中@自治議論スレ2019/04/29(月) 23:58:59.10ID:nM30608s
サザエさんとかガンダムにたとえてくれるやつも作ってくれ

0058ニュースソース検討中@自治議論スレ2019/04/30(火) 06:34:44.50ID:ASYGHZG8
できればキン肉マンで例えてほしい

0059ニュースソース検討中@自治議論スレ2019/04/30(火) 15:45:47.73ID:BTDVn5An
>>17
まあまあそんだけ大衆が増えたってことさ

0060ニュースソース検討中@自治議論スレ2019/04/30(火) 19:07:29.15ID:sAqMEU4W
>>55
そういうのはただ単にデータを増やしてるだけだからな
既存の手法をこれまでに実験されてない別のものに試してみました、ってだけだから
アブストでまとめてくれてるだけで良い

他の領域はネイチャーやサイエンス読めばわかるでしょ
アブストは論文全体の要約になってるのがほとんど

0061ニュースソース検討中@自治議論スレ2019/04/30(火) 19:26:21.75ID:KM0iQflQ
マスコミ報道よりは信頼できそうだ

0062ニュースソース検討中@自治議論スレ2019/04/30(火) 19:53:43.18ID:x6xsoalD
世界一つまらない小説が出来そうですね

0063ニュースソース検討中@自治議論スレ2019/04/30(火) 20:06:59.63ID:tKSEEGSk
ガンダムに例えてくれるAIはよ

0064ニュースソース検討中@自治議論スレ2019/04/30(火) 20:15:24.16ID:/785EJnT
日本語論文は特に難解なんだよな
日本人の俺でも読むだけで疲れる

0065ニュースソース検討中@自治議論スレ2019/04/30(火) 20:15:47.77ID:YReURBoZ
どーショーもない「岩波語」をまともな日本語に翻訳するAIなんて出来るんかね? 絶望的
不可能事だと思うがね。 あー、云い忘れたわ、 あの大江健ざぶろーたら云う朝鮮人の小
説、何書いてあるんか訳わかめじゃね。 これもAIたらで翻訳できるか?

0066ニュースソース検討中@自治議論スレ2019/04/30(火) 20:19:10.15ID:D/waG67y
【レッドカーペット事件】 トランプ 対 統一教会
http://matsuri.5ch.net/test/read.cgi/news5/1556623053/l50

0067ニュースソース検討中@自治議論スレ2019/04/30(火) 20:28:37.06ID:jhnF5bUM
■ベクトル処理すれば
アブストくらいなら いい要約文書になるってこと。確実に。

学部卒程度の学生は 勉強しないで済むだろ。つまり 使えない馬鹿ってこと。

0068ニュースソース検討中@自治議論スレ2019/04/30(火) 21:52:47.52ID:4cU10H0J
つまらないのつまるは要約とか要点だけ纏めるって意味でつまらない話ってのは要点がわからない話って意味なんだな

0069ニュースソース検討中@自治議論スレ2019/05/01(水) 10:50:36.52ID:/RurLnrr
要約作成サイトで要約してみた。

Can science writing be automated ?、
MIT News
http:// news . mit . edu /2019/ can - science - writing - be - automated - ai -0418
物理学教授のMarin Soljačić氏らの研究チームは、論文を2文程度に要約するAI を開発しました。
長期短期記憶( LSTM )ネットワークなどの手法が問題を解決するために使用されています
やがて研究チームは他分野でも有用である可能性に気づきました。
実用に耐えうる精度であるとはいえません。
2名前:しじみ★[ sage ]投稿日:2019/04/28(日)21:42:18.35 ID : CAP _ USER [2/2]
“ baylisascariasis ,” kills mice , has endangered the allegheny woodrat .
日本語に直すと以下のようになります。、◆日本語訳:
「質疑応答やテキスト要約、連想などのタスクに関する結果を示しています」とGülçehre 氏は述べました。

0070ニュースソース検討中@自治議論スレ2019/05/01(水) 12:19:33.27ID:v6FYO/fk
理系脳よりも文系脳のほうがはるかに高度。
コンピュータによるエミュレーションがより困難なのは文系脳だろう。

0071ニュースソース検討中@自治議論スレ2019/05/01(水) 18:12:57.24ID:nzA+otYf
文系って、数学から逃げたやつらのことじゃん

0072ニュースソース検討中@自治議論スレ2019/05/01(水) 22:25:03.01ID:V6TBXcTV
ポアンカレ予想のペレルマン論文を要約してほしい

0073ニュースソース検討中@自治議論スレ2019/05/02(木) 02:28:50.42ID:2ZCuvfvA
よこみち
日本語は枝葉が多いからわかりにくい。
枝葉は、()いいれば分かりやすくなるかも

0074ニュースソース検討中@自治議論スレ2019/05/02(木) 03:23:49.04ID:5Aky15IY
AIが大暴走 サービス緊急停止
https://www.sankei.com/world/news/170803/wor1708030008-n1.html

0075ニュースソース検討中@自治議論スレ2019/05/02(木) 10:42:12.26ID:C4kThVpt
結局RUMがなんなのかわからん

0076ニュースソース検討中@自治議論スレ2019/05/02(木) 23:40:25.90ID:FU2ZfGi/
つまりケミカルアブストラクトが安価になる?

0077ニュースソース検討中@自治議論スレ2019/05/07(火) 05:29:17.94ID:xrxN/I5w
違うよ逆だよ逆!

単純な結果を難解な文章にこねくりまわすAIが欲しいのよ。
そうすりゃ掲載確率がぐんと上がるし、補助金も通りやすくなる!

査読者でも役人でもマスゴミでも一般市民でも
「ふむ…内容はよく分からないが多分スゴいのだろう」
って思わせたら勝ちなんだから。

0078ニュースソース検討中@自治議論スレ2019/05/10(金) 02:27:20.06ID:IoIPm+4Z
>>71
お前は体育と道徳から逃げた未就学児だろ?
その筋肉で何歳まで生きるつもりだよ早期介護予備軍のお荷物が

0079ニュースソース検討中@自治議論スレ2019/05/10(金) 20:46:48.93ID:kna6WFoO
>>55
出版社によっては短い数文での要約が求められる

0080ニュースソース検討中@自治議論スレ2019/05/20(月) 18:08:19.71ID:RrnRKTWq
日本では論文や発表原稿は、要旨と本文をそれぞれ日本語と英語で出すのが普通じゃない?
日本の論文数が少な目なのは、こういう手間が原因かもね

0081ニュースソース検討中@自治議論スレ2019/05/21(火) 09:28:09.96ID:+gzE+9by
日本語が覇権言語じゃないからだろ
先の戦争で勝って首尾よく世界征服してりゃこんなバカげたことにはならなかった
覇権言語であれば戦争関連軍事関連の研究も盛んになって論文数も増えてた
それもこれも先の敗戦がおかしい

しかも「軍事関連の研究はしません」とか、アメリカの手先のアホどもを一掃しないと論文数は増えない
アメリカや中国の軍事関連の論文数がどれだけあると思ってんだ
もっと言えば大学入試の外部化で大学の能力や独立性を徹底的に削ごうとしてるだろ
アメリカに染まった敗戦国の奴隷官僚の考えそうなことだ
自主独立なんてのは如何わしいからそのての自由地帯を徹底的に潰そうとしてる
日本はゴミみたいな奴隷国家だよ

0082ニュースソース検討中@自治議論スレ2019/05/21(火) 13:18:06.49ID:dkDuuV54
本気でシンギュラリティ近づいてきたかもな
自然言語を処理できるようになれば出来ることが一気に広がるぞ

0083ニュースソース検討中@自治議論スレ2019/06/04(火) 00:07:39.32ID:k+DrO5Oq
官僚文とか法律関係、判決文が早いんじゃね
裁判官で系統違うとか

0084ニュースソース検討中@自治議論スレ2019/06/04(火) 00:09:50.00ID:k+DrO5Oq
業界ごとにある形式がかなりきつく決まってるから、図や数式を追うだけでなんとかなるもん
近隣分野にも応用可能。読むものじゃなくて見るものだ
話題になる論文なんかはレファレンスで感覚つかめたりする

0085ニュースソース検討中@自治議論スレ2019/06/04(火) 00:12:09.27ID:k+DrO5Oq
米国科学のええところだな。西欧ではない
日本も西欧の影響強かったけど、80年代以降米国寄り。
わかりやすく説明できないのは、そいつが分かってないかアホかと思っていい

0086ニュースソース検討中@自治議論スレ2019/06/04(火) 00:38:38.57ID:hsxlnbPL
http://www.kurims.kyoto-u.ac.jp/~motizuki/papers-japanese.html
この中の一つでもいいからオレにわかるように頼むぜ。

0087ニュースソース検討中@自治議論スレ2019/06/04(火) 03:20:33.75ID:5R8wopCy
コンピュータのプログラムも読みやすく最適化してくれたりする?

0088ニュースソース検討中@自治議論スレ2019/06/04(火) 07:04:12.20ID:/eBMfuzd
>>86
数学は日本語で書いてあっても余白を埋めるのが、大変だからな。コンピューターに余白埋められるかな?

0089ニュースソース検討中@自治議論スレ2019/06/04(火) 07:12:27.50ID:16yTFs2C
>>36
上司「要するに、働け」

0090ニュースソース検討中@自治議論スレ2019/06/04(火) 07:30:46.43ID:iyYUIwXf
AIで三段活用された文章を拡大解釈して使うようになるぞ

0091ニュースソース検討中@自治議論スレ2019/06/04(火) 07:35:51.58ID:57eoHKJq
>>87
コンパイラがある。コンピュータにとっては分かりやすい。

0092ニュースソース検討中@自治議論スレ2019/06/04(火) 08:48:33.30ID:OgItuPWV
>>89
就業時間5分前
「コレ、明日アサイチまでに終らせとけな!あ、残業はするなよ!」

0093ニュースソース検討中@自治議論スレ2019/06/04(火) 08:49:31.45ID:NUvQiR0s
てか、最初から論文をわかりやすく書けないのかねえ。
難しく見せるためにわかりにくい言い回しにしているだけじゃ?

0094ニュースソース検討中@自治議論スレ2019/06/04(火) 09:27:32.47ID:co/T/qKU
アライグマが感染するみたいになってるやん。

0095オーバーテクナナシー2019/06/04(火) 13:46:12.34ID:m9y5VZyJ
正直ロボットが進化したら人間は必要なくなるよな
https://rio2016.5ch.net/test/read.cgi/future/1521907596/

0096ニュースソース検討中@自治議論スレ2019/06/04(火) 18:30:23.74ID:Z7UcClJS
>>18
アホな研究者が量産されるか
まあ、時代の流れだろうけど

0097ニュースソース検討中@自治議論スレ2019/06/12(水) 16:42:34.02ID:/vMUefjh
要約前にアライグマとか7%とかないやん
これソース読まなわからんやつ?

0098ニュースソース検討中@自治議論スレ2019/06/13(木) 16:03:39.75ID:d34CWa+Q
セマンティックの問題が解決しないのに、「要約」だなんて笑わせる。
人間の中学生にでもできることを、「AIできたぁー」なんて言われてもね。

0099ニュースソース検討中@自治議論スレ2019/07/10(水) 06:47:40.78ID:NDlNNWwN
記事を要約するAI、富士通が試験公開 言葉の表現を変えて54文字以内に
2019年07月08日
https://www.itmedia.co.jp/news/articles/1907/08/news122.html

■ このスレッドは過去ログ倉庫に格納されています