【文字認識】OCRソフト（3文字目）【自炊】

**名無しさん＠お腹いっぱい。** · 2024/03/21(木) 15:32:59.39

光学文字認識（こうがくもじにんしき、Optical character recognition）ソフト

主なOCRソフトウェア（市販ソフト）
・読取革命16（開発元パナソニック、販売元ソースネクスト）
・本格読取5（開発元パナソニック、販売元ソースネクスト）
・e.Typist v.15.0（メディアドライブ）
・ABBYY FineReader PDF 16（ABBYY）

主なOCRソフトウェア（フリーソフト）
・tesseract-ocr
・PaddleOCR
・RapidOCR
・NDLOCR
・MangaOCR
・bunkoOCR

過去スレ
【文字認識】OCRソフト【自炊】
https://egg.5ch.net/test/read.cgi/software/1470745451/l50

【文字認識】OCRソフト（２文字目）【自炊】
https://egg.5ch.net/test/read.cgi/software/1701326685/l50

**名無しさん＠お腹いっぱい。** · 2025/10/29(水) 10:41:12.98

pythonとかわかんね。これならdeepseek ocr簡単に使えるの？　https://github.com/TimmyOVO/deepseek-ocr.rs　https://egg.5ch.net/test/read.cgi/software/1711002779/l50

**名無しさん＠お腹いっぱい。** · 2025/11/03(月) 03:43:04.79

DeepSeek-OCRはvLLM版じゃないと本気出してくれなさそう
ってことらしい。また試すか

**名無しさん＠お腹いっぱい。** · 2025/11/06(木) 06:29:20.69

YomiTokuがCPUでも高速に動くように進化したらしい

**名無しさん＠お腹いっぱい。** · 2025/11/16(日) 19:48:56.44

bunkoOCRで三桁の数字がバラバラになってしまうのが結構あった
123が132や231になったり二桁や四桁は問題ないけど

**名無しさん＠お腹いっぱい。** · 2025/11/16(日) 20:13:58.10

なんで3桁だけなんやろ
ちょっとテストしてみるわ。よければサンプルいただけますか

**名無しさん＠お腹いっぱい。** · 2025/11/16(日) 20:32:03.06

>>544のとこに送っておきました

**名無しさん＠お腹いっぱい。** · 2025/11/16(日) 21:08:13.64

>>693
ありがとうございます。

手元の最新の開発中バージョンでは、101のところが上手くいっているみたいなので、早くリリースできるようにします。
割注と縦中横の判定をいじって上手くいくようになった気がする

**名無しさん＠お腹いっぱい。** · 2025/12/13(土) 21:24:20.24

yomitokuでpdfファイル入力、PDF出力したら、17.5 x 24.5 cm, 400 dpiが、97.3 x 136 cm, 72 dpiになった。ディスプレイで見るぶんには問題ないが、やや気持ち悪い。仕様でしょうか？

**名無しさん＠お腹いっぱい。** · 2025/12/15(月) 00:19:00.46

使ってるライブラリの、デフォルトdpiが72なんだと思う。ソースのdpiを引き継ぐようにすればよさそう

**名無しさん＠お腹いっぱい。** · 2025/12/15(月) 13:09:53.21

読み取り解像度は指定できるけど、ソースのdpiが引き継げそうなやり方はなさそう？に思いました。

**名無しさん＠お腹いっぱい。** · 2025/12/15(月) 13:40:14.61

ソース読んでみたけど、一発で出力のdpi設定できなさそう。
canvasの設定で、ちゃんと換算して設定しないとだめっぽ。githubにissue立てるか、
Twitterアカウントに突撃して報告したら直してくれそうではある。

reportlab.pdfgen の Canvasを使ってるみたいだけど、このライブラリは72dpi前提で
簡単には変わらないっぽい。画像のサイズの方をPixelから実サイズに調整する必要があって
けっこうめんどくさそう。
後から変換するソフトとか(あれば)調整した方が早そう

**名無しさん＠お腹いっぱい。** · 2025/12/15(月) 18:23:34.34

詳しくありがとうございます。私には難しそうなので、印刷する必要がある場合はどうなるのか考えて継続して使えるか検討してみます。縮小印刷したら普通に印刷できそうな気もする。
bunkoOCRならこういう問題は生じないと思うので、必要あればiPad airでOCRも検討です。遅いし電池が減るけど、、、。Windowsの新版に期待。

**名無しさん＠お腹いっぱい。** · 2025/12/16(火) 05:20:20.23

ocrarena
https://www.ocrarena.ai/battle
ちょっと試しただけだけどgpt5と5.2でだいぶ認識率が向上してるみたい

**名無しさん＠お腹いっぱい。** · 2025/12/24(水) 11:13:31.85

それによるとdots ocrとQwen 8Bが優秀ってことかな

**名無しさん＠お腹いっぱい。** · 2025/12/25(木) 09:58:36.11

初見。OCRソフトが欲しい。アドバイス下さい。

・紙の本を電子化してOCRを掛けるのが主目的。理系学術書(従って数式多数)が過半数。他はPC関係の図表の多い書籍。
・現状、Acrobat 9を使っている。文章のレイアウトがちょっとでも非定型となると即座に精度悪化。数式なんておよそ認識しない。
・Amazonで読取革命v17が7870円だったが、★2.9。ソースネクストでFineReader v15が27500円。Acrobat最新版は高すぎ。

**名無しさん＠お腹いっぱい。** · 2025/12/25(木) 10:24:38.64

読取革命はマジでクソゴミだからやめとけ

**名無しさん＠お腹いっぱい。** · 2025/12/25(木) 11:29:51.80

Thanks 質問者と別人だけど

**名無しさん＠お腹いっぱい。** · 2025/12/25(木) 18:33:25.03

数式をTeXで認識したいとかなら、なんかモデルあったはず。
それとは別に図版多いならYomitokuが強かったような

**名無しさん＠お腹いっぱい。** · 2025/12/25(木) 18:36:31.31

数式混じりの日本語の本で、図版入っているやつ
私もスキャンしてOCRしたいんだけど、最終形態としてどうするのがいいんだろうか。
単なるテキストにすると、数式辛いし図版飛ぶし
図だけjpgで持っとくとしても、どの部分に入ってたかとかmdにするとかかなぁ
数式はTeX形式にするとしても、ふつうの人間はそのままで読めないという
結局レンダリングするなら、画像でよくねとかも思う

**名無しさん＠お腹いっぱい。** · 2025/12/25(木) 19:36:32.32

画像と透明テキストのpdfはどうかな
>>625～のbunkoOCRのpdf作成に期待してる
図表や数式を誤OCRしてても目で見る分には正しい画像だから問題ない気がする

**名無しさん＠お腹いっぱい。** · 2025/12/26(金) 07:03:25.73

bunkoocrのwindows板って最新になってないんだっけ?
iosでやれってことか

**名無しさん＠お腹いっぱい。** · 2025/12/26(金) 19:06:20.17

ごめんまだwindowsのやつ作業できてない。お正月に作業してみるわ

**名無しさん＠お腹いっぱい。** · 2025/12/27(土) 00:21:40.07

>>709
楽しみにしてます

【文字認識】OCRソフト（3文字目）【 自炊 】

【文字認識】OCRソフト（3文字目）【自炊】