数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』
科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。
しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。
この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。
(以下略、続きはソースでご確認ください)
aiboom 2023/9/5
https://aiboom.net/archives/54869
探検
【技術】数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 Meta AI [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2023/09/05(火) 22:24:09.63ID:y/N6f1WW2023/09/06(水) 00:14:25.56ID:KsubIiCX
本田望結、美くびれ際立つ抜群のスタイルに「ウエストラインの美しさよ」「スタイルほんといいな」の声
https://fgjuyt.paulgross.net/0906/j4sq4ejl.html
https://fgjuyt.paulgross.net/0906/j4sq4ejl.html
3名無しのひみつ
2023/09/06(水) 01:08:26.53ID:kyzzQG/w それでも日月と明を識別できるようになるには結構な壁がある
2023/09/06(水) 02:26:26.51ID:fx3sqApX
「インド人を右に」は最後の伝説
2023/09/06(水) 06:33:46.74ID:ZCK366KO
これ、ヌガーって読むの?
2023/09/06(水) 08:13:40.66ID:+ith8zYD
※内容は治りません
2023/09/06(水) 23:12:07.87ID:t/uSz4PZ
盗み撮りした機密文書の状態が悪くてもデータ化できますとか
8名無しのひみつ
2023/09/07(木) 02:00:20.66ID:cQiFlVKi >>3
前後の文脈で判断するんじゃね?
前後の文脈で判断するんじゃね?
2023/09/07(木) 11:01:48.16ID:X4/BCAPh
アルファベットは読めても漢字は難しいだろう
10名無しのひみつ
2023/09/08(金) 10:14:51.12ID:WE2yPhY411名無しのひみつ
2023/09/08(金) 10:21:42.10ID:hblXy8SZ OCRって似た文字に誤変換されるから
それ探すのに時間がかかって
時間的に手打ちするのとかわらなかったりするのな
それ探すのに時間がかかって
時間的に手打ちするのとかわらなかったりするのな
12名無しのひみつ
2023/09/08(金) 14:14:34.66ID:fXQbEJvk■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【東京湾岸署】「ドリフト走行」運転誤り、見物客はねたか 重傷ひき逃げ容疑で川崎区の築地天人容疑者(28)を逮捕 [ぐれ★]
- 【横浜ゴム工場】「職場でいじめられた」殺人未遂の疑いで逮捕された男(39)は工場の元従業員 いじめの腹いせで犯行に…静岡・三島★3 [ぐれ★]
- 【ラジオ】田中みな実 8年間で恋愛観の変化明かす「地味で真面目でつまらない人だって浮気する」 [湛然★]
- 【調査】女性に聞いた“経験のない男性との交際”20、30代ならOK「リード」より「無理せず対等に」 [ぐれ★]
- 医師3割「不要な入院させた」 病院の指示も、医療費膨張の一因に [蚤の市★]
- 【大炎上】港区の居酒屋「スミビヤ田町本店」でバイトテロ再来 悪ノリ動画が招いた地獄絵図 提供前の料理を素手でパクリ ★2 [ぐれ★]
- 小野田紀美さん「私が忠誠を誓っているのは国民ではなく国です」★3 [256556981]
- 【ネトウヨ発狂w】高市政権、外国人実習生が家族を日本に呼び寄せ無期限で日本に住めるように制度を変更する方針を決定。人数は123万人 [314039747]
- 小野田紀美「私ね、正義の味方になりたかったんだ」 [165981677]
- 高市卑弥呼勢台頭 [256556981]
- カニカニ詐欺が流行ってるらしいけど…
- 日本の会社「文系は出世させます、理系は出世させません」👈これ何でなの? [762037879]
