数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』

 科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。
 しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。
 この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。

(以下略、続きはソースでご確認ください)

aiboom 2023/9/5
https://aiboom.net/archives/54869