【AI】「難解な論文をわかりやすく要約してくれるAI」が開発される[04/27]
■ このスレッドは過去ログ倉庫に格納されています
専門雑誌に掲載された難解な論文を読み込み、科学的背景を持たない読者にもわかりやすいようにかみ砕いて文章として伝える「サイエンスライター」と同じように機能するAIをマサチューセッツ工科大学(MIT)の研究者らが発表しました。
Rotational Unit of Memory: A Novel Representation Unit for RNNs with Scalable Applications | Transactions of the Association for Computational Linguistics | MIT Press Journals
https://www.mitpressjournals.org/doi/full/10.1162/tacl_a_00258
Rotational Unit of Memory
http://super-ms.mit.edu/rum.html
Can science writing be automated? | MIT News
http://news.mit.edu/2019/can-science-writing-be-automated-ai-0418
MITの大学院生であるRumen Dangovski氏とLi Jing氏、物理学教授のMarin Soljačić氏らの研究チームは、専門的な論文を1、2文程度に要約するAIを開発しました。AIが生成できる文章は非常に短いため、2019年4月時点では実際のサイエンスライターが作成するような記事を作り出すことはできないとのことですが、大量の論文を読む際に軽くチェックして内容を予備的に把握するのに役立つ可能性があります。
もともと、研究チームは物理学的な問題に対処することを目的としてAIでのアプローチを試みていたそうで、論文の要約などの処理に焦点を当てていなかったそうです。ところが、研究チームは自身が開発したアプローチが物理学の分野だけでなく、自然言語処理を含むほかの分野にも同じアプローチが適用できることに気づいたとのこと。
一般的なニューラルネットワークは、コンピューターが非常に多くの事例についてのパターンを「学習」して進歩します。たとえば写真に写っているオブジェクトを識別したり、写真や音声から特定のものを抜き出したりするシステムに、ニューラルネットワークは広く活用されています。
その一方で、ニューラルネットワークは長い一連のデータから情報をピックアップし、関連付けることが困難だとのこと。この能力は長い論文から必要な情報を見つけ出して要約する、サイエンスライターのような仕事に求められる技術の一つです。長距離の依存関係をモデル化する長期短期記憶(LSTM)ネットワークなどの手法がこの問題を解決するために使用されていますが、自然言語処理を実用的なものに近づけるには至っていません。
研究チームは従来のニューラルネットワークに使われてきた行列の乗算に基づくシステムではなく、多次元空間で回転するベクトルに基づく代替システムを考案しました。このシステムは「記憶回転単位(rotational unit of memory)」と名付けられており、研究チームは「RUM」と呼んでいます。RUMはニューラルネットワークが要素を記憶するのを助け、より正確に要素を思い出すことにも有効とのこと。RUMはもともと光の振る舞いのような複雑な物理学的問題を解決するために考案されたアプローチでしたが、やがて研究チームはRUMが自然言語処理のような他分野でも有用である可能性に気づきました。
https://i.gzn.jp/img/2019/04/27/science-writing-be-automated/03_m.png
自然言語処理において、RUMは文章中に登場する個々の単語を多次元空間におけるベクトルで表すとのこと。文章中の単語が特定の長さと特定の向きを持つ線になることで、数千もの次元を持つ理論上の空間で文章が表され、最終的なベクトルが文章となって出力されると研究チームは述べています。
試しに研究チームがLSTMネットワークを用いた要約AIに、「Baylisascariasis」という動物に感染する回虫の一種に関する論文を読み込ませ、要約を出力してみたところ、以下のような文章が生成されました。この要約は非常に反復的であり、実用に耐えうる精度であるとはいえません。
https://gigazine.net/amp/20190427-science-writing-be-automated
続く) テレビキャスターの通訳に使うと良いよ!
日本語が分りやすくなる。
国会中継には是非。 天声人語を要約させてみたところ、
「今日もまた原稿用紙を埋めてみた」
と出たら正解。 >>1 これはありがたい 論文のグラフって単位が書いて無いのがなぜか多いからな
ちゃんと縦軸と横軸に単位を書いて欲しい 頭が良い人が科学論文を書くから
単位を書かなくてもわかるだろ、とか思ってるんだろうな わざと難しく書くと評価される経済学の論文も何とかしてくれませんかねえ…(´・ω・`) 望月センセの宇宙際タイヒミューラー理論の論文をわかりやすく説明してくれたらみんな喜ぶぞ 英語の方が簡単だろうな
てか日本語で欲しいけどそっちは時間かかりそうw 医療系の原著論文はAbstractのConclusionを読めばとりあえずわかるように
なっているからこんなのは必要ないな。他の領域はどんな感じかね。 要約してみた。
MITの大学院生Rumen Dangovski氏とLi Jing氏、物理学教授のMarin Soljačić氏らの研究チームは、専門的な論文を1、2文程度に要約するAIを開発しました。
研究チームは多次元空間で回転するベクトルに基づく代替システム「RUM」を考案しました。RUMはもともと複雑な物理学的問題を解決するために考案されたが
自然言語処理のような他分野でも有用である可能性に気づきました。
RUMは文章中に登場する個々の単語を多次元空間におけるベクトルで表すとのこと。
文章中の単語が特定の長さと特定の向きを持つ線になることで、数千もの次元を持つ理論上の空間で文章が表され、
最終的なベクトルが文章となって出力されると研究チームは述べています。 サザエさんとかガンダムにたとえてくれるやつも作ってくれ >>55
そういうのはただ単にデータを増やしてるだけだからな
既存の手法をこれまでに実験されてない別のものに試してみました、ってだけだから
アブストでまとめてくれてるだけで良い
他の領域はネイチャーやサイエンス読めばわかるでしょ
アブストは論文全体の要約になってるのがほとんど 日本語論文は特に難解なんだよな
日本人の俺でも読むだけで疲れる どーショーもない「岩波語」をまともな日本語に翻訳するAIなんて出来るんかね? 絶望的
不可能事だと思うがね。 あー、云い忘れたわ、 あの大江健ざぶろーたら云う朝鮮人の小
説、何書いてあるんか訳わかめじゃね。 これもAIたらで翻訳できるか? ■ベクトル処理すれば
アブストくらいなら いい要約文書になるってこと。確実に。
学部卒程度の学生は 勉強しないで済むだろ。つまり 使えない馬鹿ってこと。 つまらないのつまるは要約とか要点だけ纏めるって意味でつまらない話ってのは要点がわからない話って意味なんだな 要約作成サイトで要約してみた。
Can science writing be automated ?、
MIT News
http:// news . mit . edu /2019/ can - science - writing - be - automated - ai -0418
物理学教授のMarin Soljačić氏らの研究チームは、論文を2文程度に要約するAI を開発しました。
長期短期記憶( LSTM )ネットワークなどの手法が問題を解決するために使用されています
やがて研究チームは他分野でも有用である可能性に気づきました。
実用に耐えうる精度であるとはいえません。
2名前:しじみ★[ sage ]投稿日:2019/04/28(日)21:42:18.35 ID : CAP _ USER [2/2]
“ baylisascariasis ,” kills mice , has endangered the allegheny woodrat .
日本語に直すと以下のようになります。、◆日本語訳:
「質疑応答やテキスト要約、連想などのタスクに関する結果を示しています」とGülçehre 氏は述べました。 理系脳よりも文系脳のほうがはるかに高度。
コンピュータによるエミュレーションがより困難なのは文系脳だろう。 よこみち
日本語は枝葉が多いからわかりにくい。
枝葉は、()いいれば分かりやすくなるかも 違うよ逆だよ逆!
単純な結果を難解な文章にこねくりまわすAIが欲しいのよ。
そうすりゃ掲載確率がぐんと上がるし、補助金も通りやすくなる!
査読者でも役人でもマスゴミでも一般市民でも
「ふむ…内容はよく分からないが多分スゴいのだろう」
って思わせたら勝ちなんだから。 >>71
お前は体育と道徳から逃げた未就学児だろ?
その筋肉で何歳まで生きるつもりだよ早期介護予備軍のお荷物が >>55
出版社によっては短い数文での要約が求められる 日本では論文や発表原稿は、要旨と本文をそれぞれ日本語と英語で出すのが普通じゃない?
日本の論文数が少な目なのは、こういう手間が原因かもね 日本語が覇権言語じゃないからだろ
先の戦争で勝って首尾よく世界征服してりゃこんなバカげたことにはならなかった
覇権言語であれば戦争関連軍事関連の研究も盛んになって論文数も増えてた
それもこれも先の敗戦がおかしい
しかも「軍事関連の研究はしません」とか、アメリカの手先のアホどもを一掃しないと論文数は増えない
アメリカや中国の軍事関連の論文数がどれだけあると思ってんだ
もっと言えば大学入試の外部化で大学の能力や独立性を徹底的に削ごうとしてるだろ
アメリカに染まった敗戦国の奴隷官僚の考えそうなことだ
自主独立なんてのは如何わしいからそのての自由地帯を徹底的に潰そうとしてる
日本はゴミみたいな奴隷国家だよ 本気でシンギュラリティ近づいてきたかもな
自然言語を処理できるようになれば出来ることが一気に広がるぞ 官僚文とか法律関係、判決文が早いんじゃね
裁判官で系統違うとか 業界ごとにある形式がかなりきつく決まってるから、図や数式を追うだけでなんとかなるもん
近隣分野にも応用可能。読むものじゃなくて見るものだ
話題になる論文なんかはレファレンスで感覚つかめたりする 米国科学のええところだな。西欧ではない
日本も西欧の影響強かったけど、80年代以降米国寄り。
わかりやすく説明できないのは、そいつが分かってないかアホかと思っていい http://www.kurims.kyoto-u.ac.jp/~motizuki/papers-japanese.html
この中の一つでもいいからオレにわかるように頼むぜ。 コンピュータのプログラムも読みやすく最適化してくれたりする? >>86
数学は日本語で書いてあっても余白を埋めるのが、大変だからな。コンピューターに余白埋められるかな? AIで三段活用された文章を拡大解釈して使うようになるぞ >>87
コンパイラがある。コンピュータにとっては分かりやすい。 >>89
就業時間5分前
「コレ、明日アサイチまでに終らせとけな!あ、残業はするなよ!」 てか、最初から論文をわかりやすく書けないのかねえ。
難しく見せるためにわかりにくい言い回しにしているだけじゃ? >>18
アホな研究者が量産されるか
まあ、時代の流れだろうけど 要約前にアライグマとか7%とかないやん
これソース読まなわからんやつ? セマンティックの問題が解決しないのに、「要約」だなんて笑わせる。
人間の中学生にでもできることを、「AIできたぁー」なんて言われてもね。 ■ このスレッドは過去ログ倉庫に格納されています