【技術】数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 Meta AI [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』
科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。
しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。
この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。
(以下略、続きはソースでご確認ください)
aiboom 2023/9/5
https://aiboom.net/archives/54869 本田望結、美くびれ際立つ抜群のスタイルに「ウエストラインの美しさよ」「スタイルほんといいな」の声
https://fgjuyt.paulgross.net/0906/j4sq4ejl.html それでも日月と明を識別できるようになるには結構な壁がある 盗み撮りした機密文書の状態が悪くてもデータ化できますとか 古い論文だとpdf化していても単にスキャンして画像データ化しただけのものって今だに多いからな
>>9
そもそも漢字が使われる論文自体が限定的 OCRって似た文字に誤変換されるから
それ探すのに時間がかかって
時間的に手打ちするのとかわらなかったりするのな >>11
その時代はもう過ぎ去りそうだよ
アッカド語ローマニゼーションですら結構いい読み取りする
日本語ももう王手かかってるような状態 ■ このスレッドは過去ログ倉庫に格納されています