【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net

■ このスレッドは過去ログ倉庫に格納されています
2016/08/09(火) 21:24:11.61ID:zXdCMkkb0
光学文字認識(こうがくもじ にんしき、Optical character recognition)ソフト
848名無しさん@お腹いっぱい。
垢版 |
2023/09/17(日) 18:53:34.19ID:6FdPC6Jr0
>>0846
すみませんjsonファイル作るときに20230917だと上書きのミスがあるかもです。
元ファイル確認してください。末端のヌル文字を抜き忘れてjsonが足せてないファイルに書いた可能性が。
2023/09/17(日) 21:56:52.74ID:Y9TuI/LZ0
>>847
>>848
折角神に骨折っていただいのに、残念ながらVer.917bでも起動後にエラーが出てダメでした。

あとjsonToText.exeで対象ファイルを一括選択したくて。Ctrl+Aを押しても反応せず、Shift+→でまとめて選択しようとしても、なんか反応が遅いです。
850名無しさん@お腹いっぱい。
垢版 |
2023/09/17(日) 22:52:44.22ID:6FdPC6Jr0
>>0849
エラー出るけども、別のexeに分けたので無視して続けるとそのまま処理できませんか?
jsonToText.exeでCtrl+Aが効かないのは、wineの方が悪い感じがします。Windows11だと効くので。
なんかフラグ足したらましになるとかありますかね(クラシックモードなら効くとか)
2023/09/18(月) 00:44:25.25ID:kMx4hZfp0
>>850
エラーが出てもあまりにも堂々とウィンドウが出ているので、ファイルを選択して食わせるまではできるのですが、ステータスに"Host version: 5.10.0-25-amd64"と出て、そこから先がいくら待っても進まないですね。残念ながら。

jsonToText.exeでCtrl+A不可の件、大変失礼しました。
連日のように付き合っていただいているというのに。

Wineのモード? もwindwos7相当からWindows10相当にしてもダメでした。
それにしても、何であの一回だけ動いたんだろう……。
852名無しさん@お腹いっぱい。
垢版 |
2023/09/18(月) 08:36:49.25ID:0SjZIDuo0
>>851
Ver.917bのOCRengine.exeだけを、直接wineで実行したらどこで止まりますか。

wine OCRengine.exe
wine OCRengine.exe 0
で、エラーは変わりそうですか。
上はCPUモード、下はDirectMLモードになるようにしています。

試してて気付いたのですが、winehq-devel まで上げるとエラーウインドウ出ないような気がします。
853名無しさん@お腹いっぱい。
垢版 |
2023/09/18(月) 09:58:23.02ID:0SjZIDuo0
bunkoOCR_20230918.zip

パラメータが保存されているparam.configをテキストエディタで開き、
use_GPU:0に書き換えるとDirectMLを使用しないように強制できます。

wine OCRengine.exe
で落ちないようなら、use_GPU:0にしてもらうと処理できるようになると思います。
2023/09/18(月) 11:05:06.87ID:kMx4hZfp0
早朝からすいません。
CPUモードなら正常、ということでしょうか。

wine OCRengine.exe の場合
--------
MESA-INTEL: warning: Performance support disabled, consider sysctl dev.i915.perf_stream_paranoid=0
(略)
OpenVINO
OpenVINO
OpenVINO
ready
--------
23行目のredyまで実行。エラーウィンドウは出ない。

wine OCRengine.exe 0 の場合
--------
MESA-INTEL: warning: Performance support disabled, consider sysctl dev.i915.perf_stream_paranoid=0
(略)
00c8:fixme:ntdll:NtQuerySystemInformation info_class SYSTEM_PERFORMANCE_INFORMATION
wine: Unhandled exception 0xc06d007e in thread c8 at address 000000007B037FC8 (thread 00c8), starting debugger...
013c:fixme:imm:ImeSetActiveContext (0x154e00, 1): stub
013c:fixme:imm:ImmReleaseContext (0000000000010064, 0000000000154E00): stub
006c:fixme:imm:ImeSetActiveContext (0x15dba0, 0): stub
006c:fixme:imm:ImmReleaseContext (0000000000010020, 000000000015DBA0): stub
--------
19行目までは同じ。25行目が出てエラーウィンドウが出る。

今Ver.918をダウンロードしてますので、追試結果はもう少々お待ちください。
855名無しさん@お腹いっぱい。
垢版 |
2023/09/18(月) 11:22:23.69ID:0SjZIDuo0
こっちで考えた状態であってたようです。DirectMLでロードしようとすると落ちちゃうようですので、
Ver.918でuse_GPU:0に書き換えて実行すると、とりあえずは動くようになりそうです。
2023/09/18(月) 11:49:45.66ID:kMx4hZfp0
Windows版bunkoOCRをMX-Linux上のWine6.22で実行してみた-7

bunkoOCR_20230918を試してみました。

・私にとっての戦争は終わりました

素で起動するとやはりエラーになったが、神の指示に従いparam.configの"use_GPU:1"を"use_GPU:0"に書き換えて保存/実行したところ、エラーウィンドウは現れず、ドライブをまたいだ別ドライブ中の日本語フォルダの.tif画像を複数指定でき、画像と同じファルダ内に.jsonファイルができあがりました!!

ここまで対応していただいた神に感謝します。
857名無しさん@お腹いっぱい。
垢版 |
2023/09/18(月) 12:29:17.11ID:0SjZIDuo0
linuxでGPUの方がよければ、CUI版にしてfind inputdir -name '*.png' | OCRengine -
とかできるようにもできるけど、需要あるのかしら。
Linuxの民なら、オリジナルのpython版で実行しそうな気もする。
2023/09/21(木) 18:58:09.85ID:IZK9wj/L0
AozoraEpub3の説明
青空文庫をEPUBやMOBIファイルなどに変換して、kobo、kindle,などのEPUBリーダーなどで読むことができるソフトウェアです。作成したEPUBは電子書籍販売サイトで販売できるので、電子出版ツールとしても使うことができます。
https://github.com/kyukyunyorituryo/AozoraEpub3/wiki
2023/09/21(木) 23:06:22.12ID:LsrnBNJV0
むしろepubを青空文庫形式に変換してくれるツールが欲しい。
縦書きルビ入りとかきれいに表示してくれるソフトがあんまないから。
2023/09/22(金) 06:50:57.37ID:dJI/QveM0
>>859
半自動で変換するツールなら作った。
HTMLのタグを変換と削除、ルビの変換、UTF文字のタグ変換くらいだが。
画像やタグの追加は全自動化出来ないので手動だが。
2023/10/02(月) 15:23:29.76ID:dw1v1evD0
bunkoOCRに読み込ませる画像ファイルは、縦横256ピクセルの倍数のサイズが効率よいのかな
2023/10/02(月) 15:23:46.66ID:dw1v1evD0
bunkoOCRに読み込ませる画像ファイルは、縦横256ピクセルの倍数のサイズが効率よいのかな
863名無しさん@お腹いっぱい。
垢版 |
2023/10/03(火) 06:17:08.75ID:8+ujl4QD0
512 x 512に区切って処理してて、256でウインドウをスライドさせているので256の倍数だと
最後のブロックに余りが出ないですね。
2023/10/04(水) 20:44:44.74ID:vRUF6acm0
>>860
ベクターあたりでの公開希望
2023/10/09(月) 23:35:14.38ID:WG0A8Uhb0
iOS17から縦書き日本語が読み取れるようになった
APIなりSDKあれば縦書き日本語OCRでは最強かもしれん知らんけど
ペラ紙書類の縦書きはもうiPhoneで完結だわ
866名無しさん@お腹いっぱい。
垢版 |
2023/10/19(木) 07:36:34.92ID:zGVZ5rc10
>>0860
私もEPUBから青空文庫形式への変換を試みています
がEPUBの仕様の自由度が高くて難航しています。
出来れば公開してほしいです
お願いいたします。
2023/10/19(木) 09:00:07.52ID:9iReVXET0
公開するとメンテナンスしなきゃならないし、バグ対象はともかくおま環にまで対応しなきゃならないしエラー処理も細かく作らなきゃならないからヤダ。
2023/10/19(木) 09:27:27.40ID:bNKbLe6D0
epub, mobi →青空文庫の変換は対応タグに違いがいろいろあって、青空文庫では調整できないのも多いし、一部は標準化されてなくてビュアーごとの独自拡張だったりする。
結局、書籍の特徴や自分の好みや使ってるツールに合わせて決め打ちで変換することになる。汎用のツールを作るのは無理。
2023/10/30(月) 01:26:39.09ID:zJhf5BLT0
>>866
https://kyukyunyorituryo.github.io/aozora/
870名無しさん@お腹いっぱい。
垢版 |
2023/10/31(火) 01:41:42.92ID:dvkv99P10
pdfに画像透明テキスト埋め込みするのって最適のライブラリって何かあるですか?
縦書きに対応は必須で、ふりがなに対応できるとうれしい。
それとも、コピペするとき不便だから、ふりがなは除去して埋め込むのが普通ですかね
871名無しさん@お腹いっぱい。
垢版 |
2023/11/05(日) 14:23:45.25ID:0L6HLOnn0
PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0〜1000以内で、
無料のCapture2Text試しましたが使い物にならなくて
872名無しさん@お腹いっぱい。
垢版 |
2023/11/05(日) 14:24:06.46ID:0L6HLOnn0
PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0〜1000以内で、
無料のCapture2Text試しましたが使い物にならなくて
873名無しさん@お腹いっぱい。
垢版 |
2023/11/05(日) 14:24:11.27ID:0L6HLOnn0
PC画面の文字を認識して即翻訳できるソフトってありますか?できれば\0〜1000以内で、
無料のCapture2Text試しましたが使い物にならなくて
2023/11/05(日) 15:35:03.26ID:UJ3RQ2Wr0
使ってないから違うかもだがCapCapはどう?
2023/11/05(日) 15:46:34.82ID:dDirpvM+0
スマホのGoogle翻訳アプリで画面撮影。
876名無しさん@お腹いっぱい。
垢版 |
2023/11/07(火) 11:11:28.34ID:g1O/GcqC0
bunkoOCRの作者様へ
要望が有ります
1.
ルビに関係ない所に挿入された特殊文字(U+FFF9からU+FFFB)は、無視してほしい
2.
行頭の全角スペースと”「”の認識精度を上げてほしい
3.
青空文庫形式での出力時は以下の文字を置換してほしい
ルビ以外外での「《」を「[#始め二重山括弧]」に
ルビ以外外での「》」を「[#終わり二重山括弧]」に
縦書き未対応の記号の「≪」を「[#始め二重山括弧]」に
縦書き未対応の記号の「≫」を「[#終わり二重山括弧]」に
★変換したい文字は、ファイルで指定できればなお良い
4.
空行も出力してほしい
自炊小説の場合は空行も重要です
2023/11/07(火) 13:45:16.04ID:EgBq2MV30
>>873
PCOTならデスクトップは無理だがアプリ内OCR&翻訳はいける
878名無しさん@お腹いっぱい。
垢版 |
2023/11/08(水) 19:09:27.13ID:EULq7AvV0
>>0873
ソフトウェアとして配布はされていませんが
以下のリンク先の記事は参考になりませんか?
ttps://qiita.com/gabigabi/items/2c58eb9a500fc0b33e19
879名無しさん@お腹いっぱい。
垢版 |
2023/11/09(木) 02:26:10.64ID:cayyqdYs0
>>0876

ルビが変なところに認識されるのは、孤立したものを除くルーチンがバグっているので直します
今、認識エンジンを再学習させているので、行頭の認識ももう少し改善する予定です
文字置換は、なにか変換テーブルを作ればいいのかしら
空行については、実は仕組み上めっちゃむずいのでちょっと考えます。

文字のブロックの座標は取れるのですが、その間隔が何行に相当するかをちゃんと
算出するのがかなりむずい。
今は、ブロックごとに空行を1行挟んで出力しています。
章番号とかも明後日に飛んでいくので、本当は間にちゃんと挟みたいのですが。
880名無しさん@お腹いっぱい。
垢版 |
2023/11/09(木) 05:17:19.73ID:HO7qvDxE0
>>879
876です
回答ありがとうございます。
改善に期待しています
さて、文字の置換については
>>文字置換は、なにか変換テーブルを作ればいいのかしら
この方向でお願いします
実装して頂けるのであれば、ルビの表記の変換前に挿入して下さい
青空文庫形式の時のみの仕様ですので、他の形式には影響が
無いようにお願いします。
2023/11/10(金) 21:38:20.35ID:qu/YelkG0
Googleレンズみたいにリアルタイムにレシートを読み取ってくれるのがないか検索。

https://www.isp21.co.jp/solution/quickdata/
リアルタイムテキスト解析
独自のかざしOCR技術

spexperts が かざしOCR を利用
spexperts は LINEレシートを提供

でもLINEレシートは写真撮影してから解析で時間かかる。かなり正確だけど。
882名無しさん@お腹いっぱい。
垢版 |
2023/11/11(土) 00:14:35.40ID:bRi6xLZA0
memo

>>881
特許6435017
■ このスレッドは過去ログ倉庫に格納されています
16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面

ニューススポーツなんでも実況