【技術】数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 Meta AI [すらいむ★]

■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
垢版 |
2023/09/05(火) 22:24:09.63ID:y/N6f1WW
数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』

 科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。
 しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。
 この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。

(以下略、続きはソースでご確認ください)

aiboom 2023/9/5
https://aiboom.net/archives/54869
2023/09/08(金) 14:14:34.66ID:fXQbEJvk
>>11
その時代はもう過ぎ去りそうだよ
アッカド語ローマニゼーションですら結構いい読み取りする
日本語ももう王手かかってるような状態
■ このスレッドは過去ログ倉庫に格納されています
16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面