X



【技術】数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 Meta AI [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
0001すらいむ ★
垢版 |
2023/09/05(火) 22:24:09.63ID:y/N6f1WW
数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』

 科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。
 しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。
 この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。

(以下略、続きはソースでご確認ください)

aiboom 2023/9/5
https://aiboom.net/archives/54869
0003名無しのひみつ
垢版 |
2023/09/06(水) 01:08:26.53ID:kyzzQG/w
それでも日月と明を識別できるようになるには結構な壁がある
0007名無しのひみつ
垢版 |
2023/09/06(水) 23:12:07.87ID:t/uSz4PZ
盗み撮りした機密文書の状態が悪くてもデータ化できますとか
0008名無しのひみつ
垢版 |
2023/09/07(木) 02:00:20.66ID:cQiFlVKi
>>3
前後の文脈で判断するんじゃね?
0009名無しのひみつ
垢版 |
2023/09/07(木) 11:01:48.16ID:X4/BCAPh
アルファベットは読めても漢字は難しいだろう
0010名無しのひみつ
垢版 |
2023/09/08(金) 10:14:51.12ID:WE2yPhY4
古い論文だとpdf化していても単にスキャンして画像データ化しただけのものって今だに多いからな

>>9
そもそも漢字が使われる論文自体が限定的
0011名無しのひみつ
垢版 |
2023/09/08(金) 10:21:42.10ID:hblXy8SZ
OCRって似た文字に誤変換されるから
それ探すのに時間がかかって
時間的に手打ちするのとかわらなかったりするのな
0012名無しのひみつ
垢版 |
2023/09/08(金) 14:14:34.66ID:fXQbEJvk
>>11
その時代はもう過ぎ去りそうだよ
アッカド語ローマニゼーションですら結構いい読み取りする
日本語ももう王手かかってるような状態
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況