【文字認識】OCRソフト(3文字目)【 自炊 】

2024/03/21(木) 15:32:59.39ID:L+i98pj10
光学文字認識(こうがくもじ にんしき、Optical character recognition)ソフト

主なOCRソフトウェア(市販ソフト)
・読取革命16(開発元パナソニック、販売元ソースネクスト)
・本格読取5(開発元パナソニック、販売元ソースネクスト)
・e.Typist v.15.0(メディアドライブ)
・ABBYY FineReader PDF 16(ABBYY)

主なOCRソフトウェア(フリーソフト)
・tesseract-ocr
・PaddleOCR
・RapidOCR
・NDLOCR
・MangaOCR
・bunkoOCR

過去スレ
【文字認識】OCRソフト【 自炊 】
https://egg.5ch.net/test/read.cgi/software/1470745451/l50

【文字認識】OCRソフト(2文字目)【 自炊 】
https://egg.5ch.net/test/read.cgi/software/1701326685/l50
703名無しさん@お腹いっぱい。
垢版 |
2025/12/25(木) 10:24:38.64ID:KlbY4T//0
読取革命はマジでクソゴミだからやめとけ
704名無しさん@お腹いっぱい。
垢版 |
2025/12/25(木) 11:29:51.80ID:ac9LOP4P0
Thanks 質問者と別人だけど
705名無しさん@お腹いっぱい。
垢版 |
2025/12/25(木) 18:33:25.03ID:3uDKEtEP0
数式をTeXで認識したいとかなら、なんかモデルあったはず。
それとは別に図版多いならYomitokuが強かったような
706名無しさん@お腹いっぱい。
垢版 |
2025/12/25(木) 18:36:31.31ID:3uDKEtEP0
数式混じりの日本語の本で、図版入っているやつ
私もスキャンしてOCRしたいんだけど、最終形態としてどうするのがいいんだろうか。
単なるテキストにすると、数式辛いし図版飛ぶし
図だけjpgで持っとくとしても、どの部分に入ってたかとかmdにするとかかなぁ
数式はTeX形式にするとしても、ふつうの人間はそのままで読めないという
結局レンダリングするなら、画像でよくねとかも思う
2025/12/25(木) 19:36:32.32ID:TlC6gcR80
画像と透明テキストのpdfはどうかな
>>625~のbunkoOCRのpdf作成に期待してる
図表や数式を誤OCRしてても目で見る分には正しい画像だから問題ない気がする
レスを投稿する

16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面