探検
【文字認識】OCRソフト(3文字目)【 自炊 】
669名無しさん@お腹いっぱい。
2025/10/03(金) 23:39:12.47ID:VUABJA2R0 縦書きのePubとか止めてくれ
670名無しさん@お腹いっぱい。
2025/10/04(土) 10:46:48.40ID:YYSU4Zh/0 >>669
なんで? 便利じゃん
なんで? 便利じゃん
2025/10/15(水) 21:52:29.81ID:4+SnkVL80
bunkoOCR使ってみたら、普通に読めるレベルに認識してすごい
ドキュメントスキャナーのソフトは、誤字があまりに多く読めなかったのでありがたい
windows版の新バージョン期待してます
ドキュメントスキャナーのソフトは、誤字があまりに多く読めなかったのでありがたい
windows版の新バージョン期待してます
2025/10/15(水) 23:40:03.08ID:4+SnkVL80
2025/10/17(金) 16:40:11.01ID:RuTaM5ue0
bunkoOCR on macOSで、旧字が大量にある縦書き文書のPDFをOCRしました
認識率がすごいですね、感動しました
で、これをPDFのテキストデータとして戻したいのですが、元のPDFの描画はそのまま
保持することはできますかね? 現行は書き出すとPDFのページは画像化するようですが
画像化でもかなりいけてますが、より高い解像度(600dpiとかそれ以上)って選べます?
あと、処理中はCPUが200%ぐらいしかいきませんが、もっと並列化とかもできる
ものなんですかね
認識率がすごいですね、感動しました
で、これをPDFのテキストデータとして戻したいのですが、元のPDFの描画はそのまま
保持することはできますかね? 現行は書き出すとPDFのページは画像化するようですが
画像化でもかなりいけてますが、より高い解像度(600dpiとかそれ以上)って選べます?
あと、処理中はCPUが200%ぐらいしかいきませんが、もっと並列化とかもできる
ものなんですかね
674名無しさん@お腹いっぱい。
2025/10/18(土) 01:32:44.93ID:sL8FEi0V0 >>673
画像の部分だけを処理したい場合は、「PDFから画像を抽出する」の方を選んで
画像の部分だけを処理して、エクスポートのボタンから
「全てのページ」「PDF(元の画像を保持する、ふりがなを無視する)」で出力すると
テキストで元々ある部分はそのままにされて、画像の部分にだけ透明テキスト埋め込みになるはずです。
Windows版に反映しようとしている途中に、ロジックにバグが見つかり
直している途中で、別のタスクが割り込んできてちょっと時間が取れていません。
お待たせして申し訳ない。
画像の部分だけを処理したい場合は、「PDFから画像を抽出する」の方を選んで
画像の部分だけを処理して、エクスポートのボタンから
「全てのページ」「PDF(元の画像を保持する、ふりがなを無視する)」で出力すると
テキストで元々ある部分はそのままにされて、画像の部分にだけ透明テキスト埋め込みになるはずです。
Windows版に反映しようとしている途中に、ロジックにバグが見つかり
直している途中で、別のタスクが割り込んできてちょっと時間が取れていません。
お待たせして申し訳ない。
675名無しさん@お腹いっぱい。
2025/10/18(土) 01:35:17.01ID:sL8FEi0V0 並列度はわざと落として、iPadとかでkillされないように調整してたのを元に戻すの忘れてますね。
次いじるときに調整できるようにするか、もっと並列度あげておきます。
次いじるときに調整できるようにするか、もっと並列度あげておきます。
676名無しさん@お腹いっぱい。
2025/10/21(火) 19:15:01.75ID:oUl8PwmQ0 いくつか試したのでレポ
DeepSeek OCR
一応日本語読める。いくつかのサンプルで試したところ、画像によっては途中でLLMが崩壊してしまうこともある。
英語は精度よさそうだけど、日本語の精度はちょいちょいミスがある感じがする。
dots.ocr
日本語も対応してて精度も良いんだけど、LLMに起因する「嘘」が時々混じるのが残念ポイント
少々の誤差を許容できるなら、精度よさそうでいい感じ
DeepSeek OCR
一応日本語読める。いくつかのサンプルで試したところ、画像によっては途中でLLMが崩壊してしまうこともある。
英語は精度よさそうだけど、日本語の精度はちょいちょいミスがある感じがする。
dots.ocr
日本語も対応してて精度も良いんだけど、LLMに起因する「嘘」が時々混じるのが残念ポイント
少々の誤差を許容できるなら、精度よさそうでいい感じ
2025/10/21(火) 21:09:05.68ID:4p/wAbxG0
bunkoOCRやyomitokuとどっちが精度が高いのよ
それが問題だ
PaddleOCRも新しいの出したよね
特化型vsリソース食いのごり押しVLMの戦い
それが問題だ
PaddleOCRも新しいの出したよね
特化型vsリソース食いのごり押しVLMの戦い
678名無しさん@お腹いっぱい。
2025/10/22(水) 00:35:00.94ID:Q8EWz51f0 PaddleOCR
日本語の縦書きで試してみた。
合っているところはほぼ合ってるけど、なぜか認識に失敗しているところが所々ある。
認識結果が所々飛ぶイメージ。ふりがなは律儀に認識してるけど、多分座標で自前で何とかしないとだめっぽ。
認識結果は失敗の出方に特性があって評価が難しいけど、独断と偏見でいうと
dots.ocr > PaddleOCR > DeepSeek OCR
の順に精度がよさそう。ただし、自前で環境構築するのはどれもちょい面倒。
Dockerイメージあるならそれ使った方が楽できる。
なお、独断と偏見によるとbunkoOCRやyomitokuの方が日本語性能はずっと高そう。
多言語対応すると、個別の性能はチューンされきってない感じがしますね。
日本語の縦書きで試してみた。
合っているところはほぼ合ってるけど、なぜか認識に失敗しているところが所々ある。
認識結果が所々飛ぶイメージ。ふりがなは律儀に認識してるけど、多分座標で自前で何とかしないとだめっぽ。
認識結果は失敗の出方に特性があって評価が難しいけど、独断と偏見でいうと
dots.ocr > PaddleOCR > DeepSeek OCR
の順に精度がよさそう。ただし、自前で環境構築するのはどれもちょい面倒。
Dockerイメージあるならそれ使った方が楽できる。
なお、独断と偏見によるとbunkoOCRやyomitokuの方が日本語性能はずっと高そう。
多言語対応すると、個別の性能はチューンされきってない感じがしますね。
2025/10/22(水) 10:45:15.53ID:QmjHWyGj0
参考になった。ありがとう
今DoclingやVLM OCRとか流行りだけど期待のDeepseek OCRしょぼーんやな
ローカルLLMとかも性能向上そろそろ限界かな
今DoclingやVLM OCRとか流行りだけど期待のDeepseek OCRしょぼーんやな
ローカルLLMとかも性能向上そろそろ限界かな
2025/10/22(水) 19:38:07.66ID:YZI2zzo60
精度90%って高そうだけど10文字に1文字はずっこけるってことだから使えんよな
95%は20文字に1文字はずっこけ これもきっつ
98%は50文字に1文字はずっこけ ここら辺になると実用的やな
95%は20文字に1文字はずっこけ これもきっつ
98%は50文字に1文字はずっこけ ここら辺になると実用的やな
681名無しさん@お腹いっぱい。
2025/10/22(水) 22:11:37.43ID:q0StTNJ80 もう全部DeepSeekOCRでいいや
bunko も yomitoku もバイバイ
bunko も yomitoku もバイバイ
682名無しさん@お腹いっぱい。
2025/10/23(木) 18:57:28.03ID:zLYIM62O0 DeepSeek 中国製だから漢字圏では勝ってしまう可能性大有り
683名無しさん@お腹いっぱい。
2025/10/23(木) 22:55:35.97ID:Sj2lpXBu0 >>682
なお字体
なお字体
2025/10/23(木) 23:59:05.09ID:F491YrjO0
依然としてbunkoOCRがトップ
685名無しさん@お腹いっぱい。
2025/10/24(金) 06:27:27.27ID:Cv7etXwJ0 欧米製:Tesseract、EasyOCR
中国製:dots.ocr、PaddleOCR、DeepSeek OCR
日本製:bunkoOCR、yomitoku、NDL OCR
フリーのOCRをまとめてみたが実行・利用するにはプログラミング知識(可能ならGPUも)が必須なのが多い印象
フロントエンドができればTesseractやbunkoOCR以外も少しは普及しそう
中国製:dots.ocr、PaddleOCR、DeepSeek OCR
日本製:bunkoOCR、yomitoku、NDL OCR
フリーのOCRをまとめてみたが実行・利用するにはプログラミング知識(可能ならGPUも)が必須なのが多い印象
フロントエンドができればTesseractやbunkoOCR以外も少しは普及しそう
2025/10/24(金) 06:59:00.70ID:5Fw7+vc80
日本製は日本語だけ?
せねて、英語やフランス語とか西洋だけでもいけるといい
せねて、英語やフランス語とか西洋だけでもいけるといい
2025/10/24(金) 07:00:55.18ID:5Fw7+vc80
まか、日本製はモデルサイズが圧倒的に小さくて日本語性能優秀ってのが特徴であるが
2025/10/29(水) 10:41:12.98ID:kULpbrQP0
pythonとかわかんね。これならdeepseek ocr簡単に使えるの? https://github.com/TimmyOVO/deepseek-ocr.rs https://egg.5ch.net/test/read.cgi/software/1711002779/l50
689名無しさん@お腹いっぱい。
2025/11/03(月) 03:43:04.79ID:xDQZqNcO0 DeepSeek-OCRはvLLM版じゃないと本気出してくれなさそう
ってことらしい。また試すか
ってことらしい。また試すか
690名無しさん@お腹いっぱい。
2025/11/06(木) 06:29:20.69ID:RXGQOp/A0 YomiTokuがCPUでも高速に動くように進化したらしい
2025/11/16(日) 19:48:56.44ID:UMKxDmno0
bunkoOCRで三桁の数字がバラバラになってしまうのが結構あった
123が132や231になったり二桁や四桁は問題ないけど
123が132や231になったり二桁や四桁は問題ないけど
692名無しさん@お腹いっぱい。
2025/11/16(日) 20:13:58.10ID:+ptPvWyC0 なんで3桁だけなんやろ
ちょっとテストしてみるわ。よければサンプルいただけますか
ちょっとテストしてみるわ。よければサンプルいただけますか
2025/11/16(日) 20:32:03.06ID:UMKxDmno0
>>544のとこに送っておきました
694名無しさん@お腹いっぱい。
2025/11/16(日) 21:08:13.64ID:+ptPvWyC0 >>693
ありがとうございます。
手元の最新の開発中バージョンでは、101のところが上手くいっているみたいなので、早くリリースできるようにします。
割注と縦中横の判定をいじって上手くいくようになった気がする
ありがとうございます。
手元の最新の開発中バージョンでは、101のところが上手くいっているみたいなので、早くリリースできるようにします。
割注と縦中横の判定をいじって上手くいくようになった気がする
レスを投稿する
ニュース
- 【台湾有事】トランプ氏 電話会談で高市総理に発言抑制を要求か 米メディア報道… [BFU★]
- 【台湾有事】トランプ氏 電話会談で高市総理に発言抑制を要求か 米メディア報道… ★2 [BFU★]
- 【文春】元TOKIO・国分太一(51)「女性スタッフ2名への“わいせつ事案”」日テレ事情聴取の全貌が分かった! ★7 [Ailuropoda melanoleuca★]
- 中国「日本で中国人への犯罪が多発」 日本側の否定に「先週も5人逮捕」と反論 [夜のけいちゃん★]
- 首相、台湾有事答弁で釈明に終始 政治とカネには「そんなことより」 ★2 [蚤の市★]
- 円安で増加の風俗目的の中国人インバウンド 客に処罰規定なし、悲しき売春観光大国の現状 [蚤の市★]
- 【速報】ヤフウヨ民大発狂開始 [194819832]
- WSJなど米メディア一斉に高市トランプとの電話会談は全て台湾問題に振り分けられ中国をこれ以上刺激するなという内容だったと報じられる [709039863]
- たぬかな、結婚してるのに「うちも未婚やし」とゆいながら2年間も弱男からスパチャを貰っていたと判明 [329329848]
- 【悲報】日本でandroidスマホをiPhone以上に普及させる方法、この円安でiPhone買い続ける民を救いたい [605029151]
- トランプ「高市にアドバイスしたが発言撤回すると支持を失うという説明を受けた」
- 【悲報】高市早苗首相、日本の保守層に愛想つかされるので撤回は出来ないとトランプおやびんに説明なさる [115996789]
