数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』
科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。
しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。
この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。
(以下略、続きはソースでご確認ください)
aiboom 2023/9/5
https://aiboom.net/archives/54869
探検
【技術】数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 Meta AI [すらいむ★]
■ このスレッドは過去ログ倉庫に格納されています
1すらいむ ★
2023/09/05(火) 22:24:09.63ID:y/N6f1WW2023/09/06(水) 00:14:25.56ID:KsubIiCX
本田望結、美くびれ際立つ抜群のスタイルに「ウエストラインの美しさよ」「スタイルほんといいな」の声
https://fgjuyt.paulgross.net/0906/j4sq4ejl.html
https://fgjuyt.paulgross.net/0906/j4sq4ejl.html
3名無しのひみつ
2023/09/06(水) 01:08:26.53ID:kyzzQG/w それでも日月と明を識別できるようになるには結構な壁がある
2023/09/06(水) 02:26:26.51ID:fx3sqApX
「インド人を右に」は最後の伝説
2023/09/06(水) 06:33:46.74ID:ZCK366KO
これ、ヌガーって読むの?
2023/09/06(水) 08:13:40.66ID:+ith8zYD
※内容は治りません
2023/09/06(水) 23:12:07.87ID:t/uSz4PZ
盗み撮りした機密文書の状態が悪くてもデータ化できますとか
8名無しのひみつ
2023/09/07(木) 02:00:20.66ID:cQiFlVKi >>3
前後の文脈で判断するんじゃね?
前後の文脈で判断するんじゃね?
2023/09/07(木) 11:01:48.16ID:X4/BCAPh
アルファベットは読めても漢字は難しいだろう
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【競馬】有馬記念 皐月賞馬ミュージアムマイルが古馬撃破で日本一!C・デムーロ絶好枠生かす [久太郎★]
- 【💸】最高賞金3倍超でも、売れ行き20年で3割減 宝くじ販売低迷のなぜ [ぐれ★]
- 👧「座席倒していいですか?」に🙅「赤ちゃんいるんで無理」に波紋!帰省ラッシュの新幹線で起きたリクライニング論争 [パンナ・コッタ★]
- 松村沙友理「なんで関東って焼きのりなん?」「コンビニのおにぎりも」関西で主流の味付海苔のほうが絶対美味いと語る [muffin★]
- 【速報】堂本光一が結婚発表、お相手は一般女性「これからも感謝の気持ち」DOMOTOは2人とも既婚者に [Ailuropoda melanoleuca★]
- 【炎上】元class 岡崎公聡、GACKTへの差し入れでドーナツ30個購入を断られ店員侮辱「バーカ」「デブ」「早く潰れちまえ」 [Anonymous★]
- 【実況】博衣こよりのえちえちシャドバ大会同時視聴🧪
- ●中山11R有馬記念、5レガレイラの単勝1000万買った
- 高市早苗😊「ニッコリ」俺「何わろとんねん。」💢 [153490809]
- Fate/GOスレ
- 🏡あ、ちんぽイクイクイクイクイクイクイク👶💦💦💦💦
- 【実況】博衣こよりのえちえち有馬🧪
