【文字認識】OCRソフト(3文字目)【 自炊 】

2024/03/21(木) 15:32:59.39ID:L+i98pj10
光学文字認識(こうがくもじ にんしき、Optical character recognition)ソフト

主なOCRソフトウェア(市販ソフト)
・読取革命16(開発元パナソニック、販売元ソースネクスト)
・本格読取5(開発元パナソニック、販売元ソースネクスト)
・e.Typist v.15.0(メディアドライブ)
・ABBYY FineReader PDF 16(ABBYY)

主なOCRソフトウェア(フリーソフト)
・tesseract-ocr
・PaddleOCR
・RapidOCR
・NDLOCR
・MangaOCR
・bunkoOCR

過去スレ
【文字認識】OCRソフト【 自炊 】
https://egg.5ch.net/test/read.cgi/software/1470745451/l50

【文字認識】OCRソフト(2文字目)【 自炊 】
https://egg.5ch.net/test/read.cgi/software/1701326685/l50
2025/03/13(木) 17:06:11.45ID:pvNGOBQk0
新バージョンでも482のexeに差し替えてDirectMLでIntel Iris Xeが使えました
遅いけど消費電力が小さいのでファンが静かでいいです
528名無しさん@お腹いっぱい。
垢版 |
2025/03/13(木) 18:36:21.87ID:2PKx2Ptv0
>>527
新バージョンでは、設定からDirectMLで使用するGPU番号が決めうちできるようにしたので、番号を指定するとそのGPUを使う、はずです。
-1の時だけ、detectGPUで探すようにしました
2025/03/13(木) 19:22:24.88ID:pvNGOBQk0
detectGPUを差し替えしなくてもDirectMLでidを0に指定したら確かにIntel Iris Xeが使用されました
530名無しさん@お腹いっぱい。
垢版 |
2025/03/13(木) 23:28:54.36ID:H24E0L8b0
>>524
bunkoOCR_20250314_patch.zip
多分リストに残る原因が分かった気がするので、修正しました。
いわゆるスレッド競合というやつをやらかしたっぽいです。
2025/03/14(金) 16:14:41.94ID:8upJ8geF0
11世代のcore i7を使っていますが、あるサンプルで処理時間を比較してみました
CPU 55秒
DirectML 55秒 (内蔵GPUが使用される)
Open VINO 43秒 (内蔵GPUは使用されない)

CPUとDirectMLが同じというのは意外でした
2025/03/14(金) 17:37:29.68ID:L4e/Ml6f0
>>530
更新ありがとうございます
処理できなかったファイルは2バイト文字を含むフォルダの7階層ぐらい下にあるファイル
だったのでそれが原因かと思ってました
10数冊OCRしていますが処理できないファイルが数個残ったのはその一冊だけでした

小さいひらがなは設定を変えてもあまり上手くいかないのですが
普通に理解は出来るのでそのままにするか
気になる場合は「《」をエディタで検索して手作業で直すか
それとも一括処理できる方法があるか考えてます

あと今回は嬉しい改善点があって、正式な名称がわからないのですが強調に使う傍点?
これは以前のバージョンだと青空文庫用にしてもルビ無し設定にしても
1行として認識されてレイアウトがかなり崩れていたのですが
今回はデフォルト設定でもしっかりと認識されてました

https://imgur.com/a/Rd23WtH

こういう表現は小説ではよく見るのでかなり助かります

すごく精度が高いので、あとは読み込ませる画像ファイルをちゃんとノンブル削除しておくと
出来上がった数百個のテキストファイルを結合して、
改行コード一括削除、『「』を文頭に『。』や『」』の次を改行
空白の後も改行。目次は余裕があったら設定して表紙を付ければ
誤字ゼロではないですが読むには全く問題ない電子書籍が出来ますね

これで電子化にあまり積極的ではない作家の著作を自炊するのが捗ります
どれだけ感謝してもし足りないぐらいです ありがとうございました
533名無しさん@お腹いっぱい。
垢版 |
2025/03/14(金) 18:50:56.21ID:c/t5Sn160
CPUの演算は int8に量子化してるので、ちょっと精度落ちる分だけ速いはず。
DirectMLはfloat16じゃなくてfloat32になってるっぽいからちょっと速度損してる
と思われる
534名無しさん@お腹いっぱい。
垢版 |
2025/03/14(金) 19:22:49.69ID:c/t5Sn160
>>531
float16で計算するようにしてみたのですが、これでDirectMLの速度と精度は変わりますか?
bunkoOCR_20250314b_patch.zip
2025/03/14(金) 21:41:44.19ID:8upJ8geF0
>>534
早速のご対応ありがとうございます
同じサンプルで55秒が45秒まで短縮されました(プログラム起動後それぞれ2回目の処理時間を目視で測りました)

サンプルが文庫本のスキャンではなくて対象外かもしれませんがOCR後のレイアウトは崩れています。パッチ前後での相違はテキストファイルの31行目の「[6]」が「助」から「囮」に変わったことだけです

ファイルをアップしました
https://2.gigafile.nu/0622-bc206218ec4003ae69eed667b4091af4b
536名無しさん@お腹いっぱい。
垢版 |
2025/03/14(金) 22:24:02.86ID:c/t5Sn160
>>535
サンプルありがとうございます。

フォーマットが崩れるのは、竹と藁のとこらへんが一文字なので、ここだけ縦書きじゃないかと
誤認してる感じですね。
Mac版で同じロジックで図示するとこんな感じ
https://i.imgur.com/AOSYw9k.png
区切り部分が連続してるから、隣の段落だと誤解してるので本文と泣き別れてしまっています。

この辺は、ロジックでがんばっているところなので、段組を処理するのと別々にして
上から(右から)順に処理するモードも必要そうですね。

[6]は、括弧が近接しすぎているので認識が難しいみたいです。
どっちみち化けるなら、ちゃんと取れている部分が高速に処理できる方がいいかしら。
fp16にしちゃおうかな。モデルサイズも半分になるし
2025/03/15(土) 10:52:50.58ID:WTpLRrTY0
bunkoOCRの作者様へ質問ですが
https://imgur.com/a/HcKL7d6
のように前後が空行の見出し行というのはよくありますがどうして字下げにならないのでしょうか
何か設定がありますか
538名無しさん@お腹いっぱい。
垢版 |
2025/03/15(土) 11:22:31.89ID:C1ATbMq80
>>537
字下げの判定のロジックが、そのブロックの他の行よりも下がってるかどうか、に今なってるので、単独行が下にあっても字下げにならないです。
対策するには、ブロック全体がほかのブロックよりも下にある、というのは検出できそうなので、その場合は字下げを追加する、とかがいいかもしれません。
もうちょいこの辺のロジックは良い感じにいじってみます。
539名無しさん@お腹いっぱい。
垢版 |
2025/03/15(土) 20:07:02.01ID:wtA0GHpr0
ルビの文字が少しおかしくなってるのがあったわ

「ちゆう」が「ちゆう」、「しよう」が「しうよ」 になってたり

本文は大丈夫みたい
540名無しさん@お腹いっぱい。
垢版 |
2025/03/15(土) 20:08:26.41ID:wtA0GHpr0
間違えた、

「ちゆう」が「ちうゆ」

みたいに入れ替わってるみたい
2025/03/15(土) 21:28:06.13ID:HR9ch8n80
ルビを無視する設定にできるように上か下にあるページ番号や章の名前などを無視する項目は追加可能ですかね?
一括でトリミングすると削りすぎて本文まで消えたり、逆に消しきれなかったりするのであると便利だと思います
542名無しさん@お腹いっぱい。
垢版 |
2025/03/15(土) 22:07:21.03ID:C1ATbMq80
>>539
もし可能なら、ふりがながおかしくなる該当画像を提供していただけますか。
こちらで、どこにバグがあるか確認しやすくなるので。
手元でもいろいろ不具合はあるので直してますが、入れ替わってるのは別の原因がありそうな気がします。
メールでよければcontact@lithium03.info
543名無しさん@お腹いっぱい。
垢版 |
2025/03/15(土) 22:09:07.66ID:C1ATbMq80
>>541
私も困ってるので、いま効率的にヒットできる方法を考えています。
いいアイデアが出るかフォーマット解析モデルが上手くいくまで、しばしお待ちください
544名無しさん@お腹いっぱい。
垢版 |
2025/03/15(土) 23:21:39.09ID:C1ATbMq80
bunkoOCRで上手く処理できない画像があった場合、作者に匿名で届けれるように
https://lithium03.info/upload/
作りました。コメント欄にどの辺りがおかしいか書いてもらえると助かります。
2025/03/16(日) 10:51:53.43ID:MAo5rcrf0
532さんが電子書籍化のことを書かれていたが自分もそのことを考えていた
完璧な物ができなくてもいいけどリフロー化できれば便利になる
段落が空白で始まり会話文の行頭が「であるような小説は機械的に処理するロジックはできそうだが、そうでない本もあるので汎用的に作るのは難しそうだ
新書的な本で本文だけでよければ図表は事前にグラフィックソフトで消しておくしかないかな
546名無しさん@お腹いっぱい。
垢版 |
2025/03/16(日) 11:36:14.47ID:KPuRHLPa0
縦書きで、上や下にページ番号と章タイトル書いてあるパターンと、横書きで右や左にあるパターンは
多分簡単に外せそうな感じ
横書きで上下にあるパターンはどうしよう。文字の大きさで何とかしようかしら。

図や表は、真面目に解析しないとダメなので、もうちょい時間かかるです。
NDLの認識エンジン使ってみようかしら。
2025/03/16(日) 11:54:13.81ID:MAo5rcrf0
図表についても考えていただけているとはうれしいです
548名無しさん@お腹いっぱい。
垢版 |
2025/03/17(月) 15:39:06.11ID:U1+W+Yaq0
>>539
ルビが順序入れ替わるバグ、確認しました。どこが原因か探してみます。
2025/03/18(火) 14:46:00.77ID:C3wFnwK40
bunkoOCRの作者様、
1画像の最終行には論理的には改行を付けるべきではないでしょうか
複数画像のテキストを結合するにも手間がかかりませんし

ちなみに市販品「読取革命」でも最終行には改行が付いています
550名無しさん@お腹いっぱい。
垢版 |
2025/03/18(火) 19:38:32.49ID:S/mZBAgF0
>>549
修正してて抜けてることに気付きました。
空改行を含めて改行を入れるように仕様を変更します。
ページ結合する際にやりやすいよう、2行または1行の空改行が入るようにして
2行の連続空改行を置換すると文が連続するようにしようと考えています。
2025/03/19(水) 10:38:27.72ID:jWeWGRgn0
読取革命は文章だけの本で勝手なレイアウト認識をされるのが邪魔だ
ページ等を事前に削除した画像で1ページ全体を1つの領域にするにはページを選択して右クリックの「すべて選択」→「属性変更」でできることがわかったが
それを全画像でまとめてやることができないようだ
何かいい方法ある?
2025/03/19(水) 11:15:07.52ID:OSii6Jk50
枠固定みたいなのあったような
2025/03/19(水) 11:19:14.21ID:OSii6Jk50
かえって扱いづらくなるかも
2025/03/19(水) 17:28:33.58ID:jWeWGRgn0
UWSCでマウスを操作するスクリプトを作って「ページ一覧」ウィンドウの「次ページ」ボタンと画像ウィンドウとを行き来させることで
読取革命で自動的に全画像をそれぞれ単一領域に設定できるとわかった
2025/03/19(水) 20:45:02.29ID:jWeWGRgn0
どうしてそんなことにこだわっているかと言うとテキストファイルに変換するのに読取革命を自動レイアウト認識で使うと
空行が無視されてしまうためです
出来が悪いとしか言いようがない


https://1.gigafile.nu/0627-c0d522a2ed7abb86d0ee3d804f786bb33
2025/03/19(水) 21:05:17.67ID:jWeWGRgn0
bunkoOCR作者様、
上にアップした例を変換するとbunkoOCRは文字も正確に認識されていていいのですが、
最後の行頭の「 一一月」が「一月」になってしまうのはどうしてでしょうか
2025/03/19(水) 21:16:44.54ID:5W0SNsbt0
読取革命、テンプレート作って、かんたん認識で設定したらできるかな
558名無しさん@お腹いっぱい。
垢版 |
2025/03/20(木) 02:36:57.81ID:jueOGt7Y0
>>556
なんかバグ踏んでました。手元で修正している最新版ではちゃんと「一一月」に取れてるので、
処理の繋ぎ目で文字が行方不明になるバグだったっぽいです。
2025/03/20(木) 10:01:12.90ID:vGimLzjT0
>>557
画像が同じような大きさならば一気にできますね
アドバイスありがとうございました
560名無しさん@お腹いっぱい。
垢版 |
2025/03/30(日) 14:19:40.37ID:OMKQug+O0
bunkoOCR、前後の文字が消えて同じ文字になるのがあったわ
「顔顔」「目目」「がが」「でで」みたいに

漢字なら正規表現([一-龯])\1で探せるけど
ひらがな([ぁ-ん])\1はマッチするのが多いから見つけるのが大変
561名無しさん@お腹いっぱい。
垢版 |
2025/03/30(日) 18:57:40.83ID:/ik3ZoFT0
>>560
ごめん今直してるところです。もうしばしお待ちを
2025/03/31(月) 17:02:05.31ID:NQoUZ0wV0
bunkoocr作者様、お世話になっております
おま環の可能性も高いのですが、bunkoOCR_20250314_patch、bunkoOCR_20250314b_patchの2つのバージョンから
使っているうちにだんだん速度が遅くなってくる現象が見られます(それでも数年前のよりは早いですが)
同じファイルでもbunkoOCR_20250311の方が倍以上の速度で処理できます

例 bunkoOCR_20250311 337ページで10分
bunkoOCR_20250314b_patch 337ページで22分

20250311版はGPU使用率がほぼ9割以上で推移するのに対して
https://imgur.com/ovAhXBI
20250314以降は開始直後は上記と同じで高速で処理してくれるのですが2分ほど経つと使用率にたまに0〜10%が出始め、
https://imgur.com/D0fXWCx
だんだんそれの頻度が多くなっていき10分も経つと一瞬だけ90%台で処理、あとはずっと0〜5%で処理する状態が続きます
https://imgur.com/a/5wZgwIc
一回終了して再び起動するとまた高速で処理してくれますが、やはり2分程度で遅くなっていきます
2025/03/31(月) 17:03:54.57ID:NQoUZ0wV0
負荷が軽いのはいいことなのですが同時に処理速度もかなり遅くなるので
今は20250311版にTextDetector.fp16.onnxを入れて処理しています
(これは入れたほうが速度が速くなりました)
ただ、もしかしてradeonのドライバの問題かもしれないです
一応、最新の25.3.1にしたうえでradeon chillなどの省電力機能が干渉してるかもと思い全部オフにして
GPUもデフォルトからOCしてみたりもしたのですが症状は変わらず
温度に関してはソフト実行中でも50度以下で制限がかかるほど熱くはなっていません

環境は以下です

Win10 22H2
Ryzen 5 2600X
radeon 7600←xtだと思ってましたが無印でした
メモリ 32GB
directMLのみチェック

そもそもこのスレでradeon使ってるのは私だけっぽいから他に同じ症状の人はいないのかな?
564名無しさん@お腹いっぱい。
垢版 |
2025/03/31(月) 18:48:41.90ID:3C9nSBip0
処理してるうちに遅くなるのは、開発環境でもそう言われてみると起きてたような気がします。
あまり長時間のテストをWindowsでしてなかったので気付いていませんでした。
今iOS版でロジックの修正を行っているのがもうちょいで終わるので、Windows版に反映するときに
一緒にみてみます。
565名無しさん@お腹いっぱい。
垢版 |
2025/03/31(月) 21:41:14.63ID:qycdQAum0
パッチを当てた後、似たように処理が遅くなるのはあったな
キャッシュを削除して新しくキャッシュを生成したら直ったけど
566名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 05:22:43.86ID:UwX3QHjb0
>>562
すみません。単純なポカしてました
ログを表示していますが、そこの領域の行数に比例して遅くなっているみたいです
計算自体は遅くなっていないのですが、表示が詰まって最終的には計算まで巻き込まれて
遅くなっていそうです
どっちみちこの部分は進行具合を表示するためのものなので、過去30行くらい残して昔のを
消していくように修正します

その他、iOS版3.2で修正したOCRの処理上のエラーも一緒に直していますので次のバージョンを
お待ちください
2025/04/04(金) 06:18:19.94ID:sYdJwQEc0
>>566
対応ありがとうございます
楽しみに待ってます
568名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 21:21:47.40ID:xONGlnES0
bunkoOCR抜群です。旧字体もへっちゃらです。凄い。
困ってるのは頁が、左欄、右欄が分かれて、コンサイス英和の様な体裁の時、
左欄一行、右欄一行、左欄二行、右欄二行、〃〃 になってしまう。

左欄全部、次に、右欄全部に指定する方法とかありますか。
569名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 21:55:17.12ID:UwX3QHjb0
>>568
見開き+段組と、単ページ+段組で順序が違うので、オプションを導入する予定です。
このオプション入れたら、真ん中らへんに境目があればたぶんいけると思います。
2025/04/04(金) 22:02:43.53ID:++fNMCDT0
縦書き本画像を左90°回転させて横倒れ文字のまま横書き専用OCRソフトが対応してくれればいいのに
2025/04/04(金) 22:05:18.07ID:++fNMCDT0
そうしたらみんな左上から右に向かって解析できる
572名無しさん@お腹いっぱい。
垢版 |
2025/04/04(金) 23:10:01.91ID:xONGlnES0
568 です。
レスポンス、ありがとうございます。気長に待ってます。

現版5.7G!!でかい。 1Mbit/secでダウンロード14時間余かかりました。
256Gメモリー・ステックにセーブ試みるとエラー「大きすぎ、保存不可」
ベクター・フリー・ソフトの[ファイル分割 FDHoot]で分割して保存しました。

色んな方々のお世話になってます。
573名無しさん@お腹いっぱい。
垢版 |
2025/04/05(土) 07:59:20.85ID:5gmEcGA80
あんまりにアーカイブサイズがでかいので、自分の要らないプラグインに必要なdllを外してダウンロードできる
ダウンローダ作るわ。DirectMLの人やCPUの人はcuda要らないものね
2025/04/10(木) 05:03:58.39ID:DVbx1C1T0
bunkoOCRすごいね
久々に感動した
2025/04/10(木) 09:02:23.68ID:AvcOBBMH0
bunkoOCRは色々改良していただいているようだが更新公開頻度を上げていただけるといいんだが・・・
576名無しさん@お腹いっぱい。
垢版 |
2025/04/10(木) 10:20:07.21ID:T2B8zrS10
>>575
すまんの。自分で使ったり報告があったバグを潰してたら、バグのモグラ叩きになってて時間かかってたです。
iOSの方で直したやつを、Windowsの方に持ってきてる形なので、遅くなってます
2025/04/10(木) 14:20:39.96ID:P8TyB0Jh0
主流のcuda以外も見捨てずに対応してくれるだけで大感謝です
2年前のに比べて認識精度がかなり上がっているので昔OCRしたものも再度やり直してます
578名無しさん@お腹いっぱい。
垢版 |
2025/04/12(土) 15:53:51.86ID:BULBwN9g0
透明テキストPDF化をなにとぞお願いいたします
2025/04/13(日) 08:24:07.90ID:xMwpL3+B0
全ファイルのOCRが完了した時に何らかの音が鳴ると嬉しいですね
以前と違ってかなり早く終わるので気づかないことも多い
2025/04/14(月) 02:02:21.59ID:ENlBum6U0
GUIだけでなくCUIでも動作できるようにしていただけると超うれしいですが、優先度は低めでも
581名無しさん@お腹いっぱい。
垢版 |
2025/04/14(月) 04:07:41.77ID:V0n1487Y0
>>580
基本的には、OCRengine.exeでほとんど処理してるので、標準入力に順番に対象ファイルを入れて行けば処理される感じです。
次のやつにコマンドラインから呼ぶ時の方法も書いておきますね。
2025/04/14(月) 10:42:25.37ID:ENlBum6U0
>>581
ありがとうございます!気長にお待ちしております
2025/04/14(月) 20:27:42.51ID:vcf9bSuT0
連続した会話文で2つ目以降の「(カギカッコ)が抜ける例ですが
bunkoocrの最新のバージョンですと、ある程度の高解像度の画像ファイルならほぼ無くなりましたが
古いスキャナやデジカメで撮影したような低解像度のファイルだとたまに出てきますね
文意はわかるのであまり気にはなりませんが
584名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 02:55:05.25ID:QrYL8PWV0
ゴミを除去するための空白閾値が高すぎると、細い文字や薄い文字が巻き込まれて除去されるので、0に近づけるとよいかも
blank_cutoffというやつ。20だと薄めの字は飛ぶと思うです
585代行
垢版 |
2025/04/15(火) 06:33:59.42ID:LOCXpazd0
>>1にあるフリーのOCRの中ではフロントエンドがないNDLOCRが一番敷居高い気がする
586名無しさん@お腹いっぱい。
垢版 |
2025/04/15(火) 11:03:36.31ID:j4ru0Sre0
【脳科学】「政治行動の激しさ」に関連する脳回路の存在が研究で判明 [すらいむ★]
http://egg.5ch.net/test/read.cgi/scienceplus/1744637408/

上記のリンクをたどったリンク先の本文とコメントを読まれると・・・
余裕ありますか・・・
大々的にインターネット上にばらまかれました!
2025/04/15(火) 19:23:00.94ID:7bXQIrnr0
bunkoOCRさん、小説の節っていうのか知らないけど
1、2、3ってのが中盤にあっても文章の頭に表示されるのを修正してほしい

     1

みたいになってるやつ
空白が多いと難しいのかな
2025/04/16(水) 05:43:06.25ID:Xe/B+xr80
本性露骨に露したな
2025/04/16(水) 20:08:12.64ID:nf8WVJSp0
>>572
分割するよりNTFSでフォーマットしたほうが早いと思う。
590名無しさん@お腹いっぱい。
垢版 |
2025/04/16(水) 22:50:44.19ID:Eccel3Mp0
>>572 です
新品のスティックならNTFSでフォーマットもありえます。
今回は、新品のスティックではなく、既に幾つかのファイルが保存されてる使いふるし品への追加です。

ベクター・フリー・ソフトの[ファイル分割 FDHoot]は手っ取り早く分割できました。
よくできてます。
591名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 16:38:47.18ID:qQw+9RmR0
bunkoOCRで「こ」が「と」に認識されるのがあった
出版社によって使ってるフォントが違うせいだと思うけど
「こ」の間が「乙」みたいにつながってる文字が誤認識するみたい
592名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 17:38:18.94ID:IXNKC84m0
>>591
どこの出版社のやつとかわかりますか。次の再学習の時に入れたいので、サンプルになる本を教えていただけるとありがたいです
593名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 18:39:07.75ID:qQw+9RmR0
>>592
新潮文庫で辻村深月「ツナグ」という本です

「こ」の部分
https://i.imgur.com/RNf6Qv1.jpg
594名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 19:29:33.60ID:5r9yYGXf0
>>593
ありがとうございます。新潮文庫は、手持ちにあるので同様の文字が無いか確認してみます。
595名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 19:35:04.55ID:5r9yYGXf0
あ、これ
内容からすると特別にフォント変えてあるのかな。実物見てみます。
2025/04/17(木) 19:55:06.63ID:Fet/c6EA0
人間さんも読み間違いしそうで...
aとoを読み間違える某教科書体にはムカついている。
597名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 20:14:07.75ID:qQw+9RmR0
>>595
画像は「こ」が入ってるところを幾つか抽出して貼っただけです
小説全体でこんな感じのフォント使ってますね
探したところ講談社でも似たようなフォントで見つかりました
2025/04/17(木) 20:28:26.15ID:l3abfBfd0
bunkoocr様、目次や登場人物紹介のレイアウトが崩れるのはどうしようもないことなんでしょうか?

目次だと漢数字のページ数(一ニ三など)が全部まとめて文章後方に行って
見出し部分は前に固まる感じ

登場人物も、 人名A---------その説明文、のようなものですと中盤から崩れ始めます
数ページなので手動で直してもあまり手間はかかりませんが
2025/04/17(木) 20:43:48.25ID:l3abfBfd0
と、書き込んだら何やら興味深い話

新潮文庫は自分も10冊近くやりましたが画像とは違う繋がっていないフォントでしたね
文春・講談社・集英社・小学館・角川・朝日ソノラマなど150冊以上ocrしましたが
そのような事例はなかったと思います
ジャンルや発行年代が違うのかな?
2025/04/17(木) 21:12:57.57ID:GmXyYCXS0
作家によってはこだわりでフォントを指定してくることがある…みたいな話をなんかでみたことがある
出版関係者じゃないのでホントかどうかはしらんけど
601名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 21:35:06.21ID:5r9yYGXf0
>>598
iOS版では多分直ったと思うので、windows版に反映させているところです。
文のブロックの形成方法を少し修正しました。
2025/04/17(木) 21:46:53.46ID:df3Tx6mU0
bunkoOCRを使わせてもらいましたがすごく良かったです。
だた「廣」が「広」になってしまうのが気になりました。
ある意味正しいのでしょうけど人名だったので手打ちで修正しました・・・
603名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 22:28:52.93ID:5r9yYGXf0
「こ」も必ずしも失敗しないのがまた悩ましい
https://i.imgur.com/n3bTQ0f.png

>>602
旧字のあたりは、勝手に変換してしまう時があるんですよね。見つけ次第直してたんですが、
廣と広は学習が足りてなかったみたいです。
どこの学習データにそのへんの変換が入ってしまっているのかが実はよく分かってなくて。
文字コードと字体の変換テーブルが、新しい字の方になってしまっているフォントが
使っている中にあるのかな。
604名無しさん@お腹いっぱい。
垢版 |
2025/04/17(木) 23:06:12.17ID:5r9yYGXf0
>>597
ありがとうございます。貼っていただいた画像で試したところ、なぜか95%のサイズに縮小すると
ちゃんと認識しました。
一応リサイズオプションつけたような気がするので、もしよければ試していただけますか。
今のモデルは、大きい字になった場合繋がっていると間違えるやすいようなので、追加学習でまた直しておきます。
605代行
垢版 |
2025/04/19(土) 07:38:13.13ID:XB6Cyug10
bunkoOCRの作者に聞きたいことがある

・Android版を作る予定はある?
・(NDL古典籍OCR-Liteみたいに)精度が多少落ちてもいいので、CPUのみで高速処理できるバージョンは作れる?
2025/04/19(土) 10:56:57.48ID:ITaD2JJG0
Android版なんていらんだろ
607名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 11:41:42.75ID:iEMWshJg0
>>605
Androidだと、性能の保証ができないので難しそうだなと。
なお、Androidのスマホをプレゼントしてくれるなら別ですけど、使ってないデバイスで開発するのは難しいです。
精度があんまり落ちないCPUバージョンは一応できましたが、これ以上速くするにはモデルサイズを
刈り込まないといけないのでちょと面倒。蒸留とかすればいいんでしょうけど、そんなにすぐにはできないです。
608名無しさん@お腹いっぱい。
垢版 |
2025/04/19(土) 16:29:00.37ID:rFpYTTcg0
bunkoocrで出力されたjsonファイルを皆さんはどうやって活用してるんですか?
そのままじゃ読みにくいですよね
epubやら変換するツールみたいなのがあるんですか?
609代行
垢版 |
2025/04/22(火) 07:32:38.20ID:L2Zcjzd/0
>>607
>蒸留とかすればいいんでしょうけど、そんなにすぐにはできないです。
わかりました、無理に急がなくても大丈夫です
2025/05/28(水) 15:57:35.30ID:8Uj7rV060
しかしソフ板でなんでエロ広告?
2025/06/18(水) 15:54:40.27ID:qU06wBhm0
bunkoOCR作者様、とても重宝させてもらってます
ありがとうございます

ところで横書き縦書きを指定することはできないでしょうか
横書きの文書で各ページ中の4行ぐらいが縦書きに判定されてしまいます
612名無しさん@お腹いっぱい。
垢版 |
2025/06/18(水) 18:23:50.70ID:Md5cQHFm0
>>611
windows版の方でしょうか。
オプション入れ忘れてる気がしますので、次のバージョンで足しておきますね
2025/06/18(水) 20:05:12.30ID:qU06wBhm0
>>612
Windows版です
よろしくお願いします!
2025/06/19(木) 13:48:15.39ID:EanrVXIz0
次のバージョンはまだ時間がかかりそうですかね?
楽しみに待っています
615名無しさん@お腹いっぱい。
垢版 |
2025/06/19(木) 19:05:28.87ID:VZAv1k7a0
ついでにTransformerの部分の再学習をさせてるので、もうちょいかかりそうです。
もう少しのところで微妙に精度が上がらないので苦しんでいるところです。
2025/06/20(金) 20:22:39.16ID:WjXrk/tl0
>>615
ありがとうございます
作者様のおかげで私の自炊ライフはかなり捗っています
もう数百冊自炊して一人でスマホの本棚画面を見てニヤニヤしてる感じです
617名無しさん@お腹いっぱい。
垢版 |
2025/06/23(月) 18:47:06.12ID:LFHGqfnT0
ocrbunkoで、これみたいに括弧内が2行になってるの読み取り方法ありますか?
https://i.imgur.com/LCXKvKF.jpeg
618名無しさん@お腹いっぱい。
垢版 |
2025/06/23(月) 20:37:06.16ID:/qScaGrz0
>>617
19 インスマウスの影
たちが、いろいろ毛色の変わった各地の人間を連れてきたということもよくごぞんじのことと
思います。セイラム(マサチュセッツ州北東部にある港町)の男が支那人を妻にして帰ってきたという話をお聞きに
なったことがあるでしょう。それに、ほら、どこかコッド岬(マサチュセッツ州にある大西洋につきだした岬)の近くに
は、フィジー諸島(太平洋南部の英領植民地)の住民がいまでも大ぜいいるそうじゃありませんか。
 まあ、なんですね、インスマウスの連中の背後には、なにかそんなことがあるにちがいあり
ませんな。あの町は、沼や入江がたくさんあって、よその町とはいつも連絡が遮断されたよう
な形になっているものですから、くわしいことはよくわからないんです。が、マーシュ老船長
が、自分に任されている三隻の船を使って、二十人、三十人と、妙な住民たちを連れ帰ったに
ちがいないことだけは、かなりはっきりわかっています。現在インスマウスに住んでいる連中
には、確かに妙な特徴がありますな――もっともそれを、どう説明したらいいのかわたしには
わかりませんが、なにかこう、背すじがむずむずしてくるようなものなんです。あのサージェ
ントのバスにお乗りになれば、あの男にも、そういうところがあるから、ははあこれだな、と
すぐわかりますよ。あの連中のなかには、妙に頭が狭くって鼻が平べったく、それに眼はふく
らんでいて開きっぱなしみたいにじっと人をにらんでいるようなご面相のものがいるんですが、
こいつらの皮膚ときたら、お話になりません。鮫肌で吹きでものだらけだし、頸の両側はしわ
だらけでくびれているんです。おまけに、若いうちから、頭が禿げるときています。年を取っ
た連中は、それぁもう、見られたもんじゃありません――まったくの話が、あの連中をこの目
で見たときは、まさかと思いましたよ。自分の姿を鏡で見たら、きっと死ぬにちがいありませ
こんな感じでよければ。
ふりがなの判定と、割注(文中に2行に分けて注釈を入れる)の判定が難しいので誤判定されることがあります。
この画像の場合、ちょっと文字が小さい(解像度が低い)ので、少し拡大すると判定が上手くいくようです。
x2.5くらいリサイズしてみてください。
619名無しさん@お腹いっぱい。
垢版 |
2025/06/24(火) 05:48:46.88ID:0WVb4N5Y0
>>617
ありがとうございます。帰ったらやってみます
620名無しさん@お腹いっぱい。
垢版 |
2025/06/24(火) 19:12:34.99ID:0WVb4N5Y0
>>618
自分の環境では3倍でうまくいきました!ありがとうございます
2025/06/29(日) 08:10:40.59ID:iQ6N++/I0
非常に高速なプログラムではUIの更新がボトルネックになるそうだけど
デバッグ出力を止めたら速くなりそう
2025/06/29(日) 08:24:47.07ID:iQ6N++/I0
エラーが発生したファイルはWait listに残りますが、もう一度やり直せませんか?
Windows版です
2025/07/22(火) 10:44:44.00ID:n3CEfl3W0
読取革命を持っているがPDFにOCRをかけてPDFで保存すると元画像を維持できない
FineReaderは画像を改変しないとのこと(AIで調べただけ)
FineReaderを使っている方 いかがですか
2025/07/22(火) 16:19:35.07ID:n3CEfl3W0
FineReaderはバージョン16になるとサブスクだけになるようだ
今はまだソースネクストで15の買い切り版が買える
27,500円と安くはないけど

ScanSnap付属の古いバージョンは持っているがOCR精度はよくない
元画像は維持されるから有料バージョンでも同じだとは思うが
2025/07/28(月) 16:51:27.27ID:z8/RWwAJ0
ScanSnap SV600に付属していたScanSnap Organizerをずっと使っていたが
PCのクラッシュを機に後継のScanSnap Homeをインストールしてみた
日本語縦書き雑誌をOCRしてみたが精度は変わらなかった
ScanSnap Homeは使いにくいので元に戻そうかな

bunkoOCRの精度が最も高いことはわかっているがPDFに埋め込めないのが残念
626名無しさん@お腹いっぱい。
垢版 |
2025/07/29(火) 04:24:38.85ID:PZp6wd/J0
bunkoOCRで埋め込みPDFを作るべく、フォーマットのお勉強してるのでしばしお待ちを
いまここまで来た
https://github.com/lithium0003/pdf_addtext
2025/07/29(火) 04:43:02.86ID:xGNOwNOF0
すばらしい
楽しみにしてます
レスを投稿する

16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面

ニューススポーツなんでも実況