【AI】「難解な論文をわかりやすく要約してくれるAI」が開発される[04/27]

**しじみ ★** · 2019/04/28(日) 21:41:58.14

専門雑誌に掲載された難解な論文を読み込み、科学的背景を持たない読者にもわかりやすいようにかみ砕いて文章として伝える「サイエンスライター」と同じように機能するAIをマサチューセッツ工科大学(MIT)の研究者らが発表しました。

Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications | Transactions of the Association for Computational Linguistics | MIT Press Journals
https://www.mitpressjournals.org/doi/full/10.1162/tacl_a_00258

Rotational Unit of Memory
http://super-ms.mit.edu/rum.html

Can science writing be automated? | MIT News
http://news.mit.edu/2019/can-science-writing-be-automated-ai-0418

MITの大学院生であるRumen Dangovski氏とLi Jing氏、物理学教授のMarin Soljačić氏らの研究チームは、専門的な論文を1、2文程度に要約するAIを開発しました。AIが生成できる文章は非常に短いため、2019年4月時点では実際のサイエンスライターが作成するような記事を作り出すことはできないとのことですが、大量の論文を読む際に軽くチェックして内容を予備的に把握するのに役立つ可能性があります。

もともと、研究チームは物理学的な問題に対処することを目的としてAIでのアプローチを試みていたそうで、論文の要約などの処理に焦点を当てていなかったそうです。ところが、研究チームは自身が開発したアプローチが物理学の分野だけでなく、自然言語処理を含むほかの分野にも同じアプローチが適用できることに気づいたとのこと。

一般的なニューラルネットワークは、コンピューターが非常に多くの事例についてのパターンを「学習」して進歩します。たとえば写真に写っているオブジェクトを識別したり、写真や音声から特定のものを抜き出したりするシステムに、ニューラルネットワークは広く活用されています。

その一方で、ニューラルネットワークは長い一連のデータから情報をピックアップし、関連付けることが困難だとのこと。この能力は長い論文から必要な情報を見つけ出して要約する、サイエンスライターのような仕事に求められる技術の一つです。長距離の依存関係をモデル化する長期短期記憶(LSTM)ネットワークなどの手法がこの問題を解決するために使用されていますが、自然言語処理を実用的なものに近づけるには至っていません。

研究チームは従来のニューラルネットワークに使われてきた行列の乗算に基づくシステムではなく、多次元空間で回転するベクトルに基づく代替システムを考案しました。このシステムは「記憶回転単位(rotational unit of memory)」と名付けられており、研究チームは「RUM」と呼んでいます。RUMはニューラルネットワークが要素を記憶するのを助け、より正確に要素を思い出すことにも有効とのこと。RUMはもともと光の振る舞いのような複雑な物理学的問題を解決するために考案されたアプローチでしたが、やがて研究チームはRUMが自然言語処理のような他分野でも有用である可能性に気づきました。
https://i.gzn.jp/img/2019/04/27/science-writing-be-automated/03_m.png

自然言語処理において、RUMは文章中に登場する個々の単語を多次元空間におけるベクトルで表すとのこと。文章中の単語が特定の長さと特定の向きを持つ線になることで、数千もの次元を持つ理論上の空間で文章が表され、最終的なベクトルが文章となって出力されると研究チームは述べています。

試しに研究チームがLSTMネットワークを用いた要約AIに、「Baylisascariasis」という動物に感染する回虫の一種に関する論文を読み込ませ、要約を出力してみたところ、以下のような文章が生成されました。この要約は非常に反復的であり、実用に耐えうる精度であるとはいえません。

https://gigazine.net/amp/20190427-science-writing-be-automated
続く)

**ニュースソース検討中＠自治議論スレ** · 2019/04/29(月) 12:23:03.57

テレビキャスターの通訳に使うと良いよ！
日本語が分りやすくなる。
国会中継には是非。

**ニュースソース検討中＠自治議論スレ** · 2019/04/29(月) 13:03:15.85

天声人語を要約させてみたところ、

「今日もまた原稿用紙を埋めてみた」

と出たら正解。

**ニュースソース検討中＠自治議論スレ** · 2019/04/29(月) 16:19:55.07

>>1 これはありがたい　論文のグラフって単位が書いて無いのがなぜか多いからな
ちゃんと縦軸と横軸に単位を書いて欲しい　頭が良い人が科学論文を書くから
単位を書かなくてもわかるだろ、とか思ってるんだろうな

**ニュースソース検討中＠自治議論スレ** · 2019/04/29(月) 18:35:32.58

わざと難しく書くと評価される経済学の論文も何とかしてくれませんかねえ…(´・ω・`)

**ニュースソース検討中＠自治議論スレ** · 2019/04/29(月) 18:53:01.21

望月センセの宇宙際タイヒミューラー理論の論文をわかりやすく説明してくれたらみんな喜ぶぞ

**ニュースソース検討中＠自治議論スレ** · 2019/04/29(月) 19:24:01.85

英語の方が簡単だろうな
てか日本語で欲しいけどそっちは時間かかりそうw

**ニュースソース検討中＠自治議論スレ** · 2019/04/29(月) 19:24:50.77

医療系の原著論文はAbstractのConclusionを読めばとりあえずわかるように
なっているからこんなのは必要ないな。他の領域はどんな感じかね。

**ニュースソース検討中＠自治議論スレ** · 2019/04/29(月) 20:08:46.82

要約してみた。

MITの大学院生Rumen Dangovski氏とLi Jing氏、物理学教授のMarin Soljačić氏らの研究チームは、専門的な論文を1、2文程度に要約するAIを開発しました。
研究チームは多次元空間で回転するベクトルに基づく代替システム「RUM」を考案しました。RUMはもともと複雑な物理学的問題を解決するために考案されたが
自然言語処理のような他分野でも有用である可能性に気づきました。

RUMは文章中に登場する個々の単語を多次元空間におけるベクトルで表すとのこと。
文章中の単語が特定の長さと特定の向きを持つ線になることで、数千もの次元を持つ理論上の空間で文章が表され、
最終的なベクトルが文章となって出力されると研究チームは述べています。

**ニュースソース検討中＠自治議論スレ** · 2019/04/29(月) 23:58:59.10

サザエさんとかガンダムにたとえてくれるやつも作ってくれ

**ニュースソース検討中＠自治議論スレ** · 2019/04/30(火) 06:34:44.50

できればキン肉マンで例えてほしい

**ニュースソース検討中＠自治議論スレ** · 2019/04/30(火) 15:45:47.73

>>17
まあまあそんだけ大衆が増えたってことさ

**ニュースソース検討中＠自治議論スレ** · 2019/04/30(火) 19:07:29.15

>>55
そういうのはただ単にデータを増やしてるだけだからな
既存の手法をこれまでに実験されてない別のものに試してみました、ってだけだから
アブストでまとめてくれてるだけで良い

他の領域はネイチャーやサイエンス読めばわかるでしょ
アブストは論文全体の要約になってるのがほとんど

**ニュースソース検討中＠自治議論スレ** · 2019/04/30(火) 19:26:21.75

マスコミ報道よりは信頼できそうだ

**ニュースソース検討中＠自治議論スレ** · 2019/04/30(火) 19:53:43.18

世界一つまらない小説が出来そうですね

**ニュースソース検討中＠自治議論スレ** · 2019/04/30(火) 20:06:59.63

ガンダムに例えてくれるAIはよ

**ニュースソース検討中＠自治議論スレ** · 2019/04/30(火) 20:15:24.16

日本語論文は特に難解なんだよな
日本人の俺でも読むだけで疲れる

**ニュースソース検討中＠自治議論スレ** · 2019/04/30(火) 20:15:47.77

どーショーもない「岩波語」をまともな日本語に翻訳するＡＩなんて出来るんかね？　絶望的
不可能事だと思うがね。　あー、云い忘れたわ、　あの大江健ざぶろーたら云う朝鮮人の小
説、何書いてあるんか訳わかめじゃね。　これもＡＩたらで翻訳できるか？

**ニュースソース検討中＠自治議論スレ** · 2019/04/30(火) 20:19:10.15

【レッドカーペット事件】　トランプ　対　統一教会
http://matsuri.5ch.net/test/read.cgi/news5/1556623053/l50

**ニュースソース検討中＠自治議論スレ** · 2019/04/30(火) 20:28:37.06

■ベクトル処理すれば
アブストくらいなら　いい要約文書になるってこと。確実に。

学部卒程度の学生は　勉強しないで済むだろ。つまり　使えない馬鹿ってこと。

**ニュースソース検討中＠自治議論スレ** · 2019/04/30(火) 21:52:47.52

つまらないのつまるは要約とか要点だけ纏めるって意味でつまらない話ってのは要点がわからない話って意味なんだな

**ニュースソース検討中＠自治議論スレ** · 2019/05/01(水) 10:50:36.52

要約作成サイトで要約してみた。

Can science writing be automated ？、
MIT News
http:// news . mit . edu /2019/ can - science - writing - be - automated - ai -0418
物理学教授のMarin Soljačić氏らの研究チームは、論文を2文程度に要約するAI を開発しました。
長期短期記憶( LSTM )ネットワークなどの手法が問題を解決するために使用されています
やがて研究チームは他分野でも有用である可能性に気づきました。
実用に耐えうる精度であるとはいえません。
2名前：しじみ★[ sage ]投稿日：2019/04/28(日)21:42:18.35 ID : CAP _ USER [2/2]
“ baylisascariasis ,” kills mice , has endangered the allegheny woodrat .
日本語に直すと以下のようになります。、◆日本語訳：
「質疑応答やテキスト要約、連想などのタスクに関する結果を示しています」とGülçehre 氏は述べました。

**ニュースソース検討中＠自治議論スレ** · 2019/05/01(水) 12:19:33.27

理系脳よりも文系脳のほうがはるかに高度。
コンピュータによるエミュレーションがより困難なのは文系脳だろう。

**ニュースソース検討中＠自治議論スレ** · 2019/05/01(水) 18:12:57.24

文系って、数学から逃げたやつらのことじゃん

**ニュースソース検討中＠自治議論スレ** · 2019/05/01(水) 22:25:03.01

ポアンカレ予想のペレルマン論文を要約してほしい

**ニュースソース検討中＠自治議論スレ** · 2019/05/02(木) 02:28:50.42

よこみち
日本語は枝葉が多いからわかりにくい。
枝葉は、()いいれば分かりやすくなるかも

**ニュースソース検討中＠自治議論スレ** · 2019/05/02(木) 03:23:49.04

ＡＩが大暴走　サービス緊急停止
https://www.sankei.com/world/news/170803/wor1708030008-n1.html

**ニュースソース検討中＠自治議論スレ** · 2019/05/02(木) 10:42:12.26

結局RUMがなんなのかわからん

**ニュースソース検討中＠自治議論スレ** · 2019/05/02(木) 23:40:25.90

つまりケミカルアブストラクトが安価になる？

**ニュースソース検討中＠自治議論スレ** · 2019/05/07(火) 05:29:17.94

違うよ逆だよ逆！

単純な結果を難解な文章にこねくりまわすAIが欲しいのよ。
そうすりゃ掲載確率がぐんと上がるし、補助金も通りやすくなる！

査読者でも役人でもマスゴミでも一般市民でも
「ふむ…内容はよく分からないが多分スゴいのだろう」
って思わせたら勝ちなんだから。

**ニュースソース検討中＠自治議論スレ** · 2019/05/10(金) 02:27:20.06

>>71
お前は体育と道徳から逃げた未就学児だろ？
その筋肉で何歳まで生きるつもりだよ早期介護予備軍のお荷物が

**ニュースソース検討中＠自治議論スレ** · 2019/05/10(金) 20:46:48.93

>>55
出版社によっては短い数文での要約が求められる

**ニュースソース検討中＠自治議論スレ** · 2019/05/20(月) 18:08:19.71

日本では論文や発表原稿は、要旨と本文をそれぞれ日本語と英語で出すのが普通じゃない？
日本の論文数が少な目なのは、こういう手間が原因かもね

**ニュースソース検討中＠自治議論スレ** · 2019/05/21(火) 09:28:09.96

日本語が覇権言語じゃないからだろ
先の戦争で勝って首尾よく世界征服してりゃこんなバカげたことにはならなかった
覇権言語であれば戦争関連軍事関連の研究も盛んになって論文数も増えてた
それもこれも先の敗戦がおかしい

しかも「軍事関連の研究はしません」とか、アメリカの手先のアホどもを一掃しないと論文数は増えない
アメリカや中国の軍事関連の論文数がどれだけあると思ってんだ
もっと言えば大学入試の外部化で大学の能力や独立性を徹底的に削ごうとしてるだろ
アメリカに染まった敗戦国の奴隷官僚の考えそうなことだ
自主独立なんてのは如何わしいからそのての自由地帯を徹底的に潰そうとしてる
日本はゴミみたいな奴隷国家だよ

**ニュースソース検討中＠自治議論スレ** · 2019/05/21(火) 13:18:06.49

本気でシンギュラリティ近づいてきたかもな
自然言語を処理できるようになれば出来ることが一気に広がるぞ

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 00:07:39.32

官僚文とか法律関係、判決文が早いんじゃね
裁判官で系統違うとか

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 00:09:50.00

業界ごとにある形式がかなりきつく決まってるから、図や数式を追うだけでなんとかなるもん
近隣分野にも応用可能。読むものじゃなくて見るものだ
話題になる論文なんかはレファレンスで感覚つかめたりする

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 00:12:09.27

米国科学のええところだな。西欧ではない
日本も西欧の影響強かったけど、80年代以降米国寄り。
わかりやすく説明できないのは、そいつが分かってないかアホかと思っていい

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 00:38:38.57

http://www.kurims.kyoto-u.ac.jp/~motizuki/papers-japanese.html
この中の一つでもいいからオレにわかるように頼むぜ。

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 03:20:33.75

コンピュータのプログラムも読みやすく最適化してくれたりする？

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 07:04:12.20

>>86
数学は日本語で書いてあっても余白を埋めるのが、大変だからな。コンピューターに余白埋められるかな？

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 07:12:27.50

>>36
上司「要するに、働け」

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 07:30:46.43

AIで三段活用された文章を拡大解釈して使うようになるぞ

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 07:35:51.58

>>87
コンパイラがある。コンピュータにとっては分かりやすい。

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 08:48:33.30

>>89
就業時間５分前
「コレ、明日アサイチまでに終らせとけな！あ、残業はするなよ！」

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 08:49:31.45

てか、最初から論文をわかりやすく書けないのかねえ。
難しく見せるためにわかりにくい言い回しにしているだけじゃ？

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 09:27:32.47

アライグマが感染するみたいになってるやん。

**オーバーテクナナシー** · 2019/06/04(火) 13:46:12.34

正直ロボットが進化したら人間は必要なくなるよな
https://rio2016.5ch.net/test/read.cgi/future/1521907596/

**ニュースソース検討中＠自治議論スレ** · 2019/06/04(火) 18:30:23.74

>>18
アホな研究者が量産されるか
まあ、時代の流れだろうけど

**ニュースソース検討中＠自治議論スレ** · 2019/06/12(水) 16:42:34.02

要約前にアライグマとか7%とかないやん
これソース読まなわからんやつ？

**ニュースソース検討中＠自治議論スレ** · 2019/06/13(木) 16:03:39.75

セマンティックの問題が解決しないのに、「要約」だなんて笑わせる。
人間の中学生にでもできることを、「AIできたぁー」なんて言われてもね。

**ニュースソース検討中＠自治議論スレ** · 2019/07/10(水) 06:47:40.78

記事を要約するAI、富士通が試験公開　言葉の表現を変えて54文字以内に
2019年07月08日
https://www.itmedia.co.jp/news/articles/1907/08/news122.html