【技術】数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』　Meta AI [すらいむ★]

**すらいむ ★** · 2023/09/05(火) 22:24:09.63

数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』

　科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。
　しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。
　この問題に対処するために、Meta AIの研究チームは『Nougat（Neural Optical Understanding for Academic Documents）』という新しいOCR（光学式文字認識）技術を開発しました。

（以下略、続きはソースでご確認ください）

aiboom　2023/9/5
https://aiboom.net/archives/54869

**名無しのひみつ** · 2023/09/06(水) 00:14:25.56

本田望結、美くびれ際立つ抜群のスタイルに「ウエストラインの美しさよ」「スタイルほんといいな」の声
https://fgjuyt.paulgross.net/0906/j4sq4ejl.html

**名無しのひみつ** · 2023/09/06(水) 01:08:26.53

それでも日月と明を識別できるようになるには結構な壁がある

**名無しのひみつ** · 2023/09/06(水) 02:26:26.51

「インド人を右に」は最後の伝説

**名無しのひみつ** · 2023/09/06(水) 06:33:46.74

これ、ヌガーって読むの？

**名無しのひみつ** · 2023/09/06(水) 08:13:40.66

※内容は治りません

**名無しのひみつ** · 2023/09/06(水) 23:12:07.87

盗み撮りした機密文書の状態が悪くてもデータ化できますとか

**名無しのひみつ** · 2023/09/07(木) 02:00:20.66

>>3
前後の文脈で判断するんじゃね？

**名無しのひみつ** · 2023/09/07(木) 11:01:48.16

アルファベットは読めても漢字は難しいだろう

**名無しのひみつ** · 2023/09/08(金) 10:14:51.12

古い論文だとpdf化していても単にスキャンして画像データ化しただけのものって今だに多いからな

>>9
そもそも漢字が使われる論文自体が限定的

**名無しのひみつ** · 2023/09/08(金) 10:21:42.10

OCRって似た文字に誤変換されるから
それ探すのに時間がかかって
時間的に手打ちするのとかわらなかったりするのな

**名無しのひみつ** · 2023/09/08(金) 14:14:34.66

>>11
その時代はもう過ぎ去りそうだよ
アッカド語ローマニゼーションですら結構いい読み取りする
日本語ももう王手かかってるような状態

【技術】数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 Meta AI [すらいむ★]

【技術】数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』　Meta AI [すらいむ★]