【文字認識】OCRソフト【自炊】 [無断転載禁止]©2ch.net

**名無しさん＠お腹いっぱい。** · 2016/08/09(火) 21:24:11.61

光学文字認識（こうがくもじにんしき、Optical character recognition）ソフト

**名無しさん＠お腹いっぱい。** · 2019/01/24(木) 18:19:29.58

>>126
なかなか良さそう。帰ったら試してみる。

もっとも、本当に欲しい機能は、
GoogleのOCRの前処理で
1. ノンブルを含む余白の自動カットと、
2. 縦複数段組の自動分割なので、
かゆいところには手が届かない、かな。

**名無しさん＠お腹いっぱい。** · 2019/01/24(木) 20:58:14.74

エチル、読取革命時代からなんも進歩してないじゃねえか

**名無しさん＠お腹いっぱい。** · 2019/01/28(月) 19:33:43.72

ScanTailorはだいぶ前から全然アップデートされてないと思ってたら、別の所にScanTailor Advancedなんてのが出てるんだな。
まだ普通に検索しても一発で出てこない。

ScanTailor Advanced
https://github.com/4lex4/scantailor-advanced/releases

**名無しさん＠お腹いっぱい。** · 2019/04/22(月) 13:29:43.28

LINE(PC版とAndroid版)の新機能がOCRの文字起こし機能をいつのまにか搭載してたようだよ

Googleやtesseractと比べてどうなのかな？

こうなってくるとLINEの友達にOCR変換投げつけ用アカウントの人が必要だｗ

**名無しさん＠お腹いっぱい。** · 2019/04/23(火) 03:18:57.23

レシート読み取りに関してはレシーピが最高。
グラム（ｇ）を９と読み取るためにおかしくなる以外は濁音半濁音を間違う程度で正確に読み取る。
濁音半濁音は出来るだけ画面いっぱいで手振れ無しで撮らないとよくミスる。
グラム（ｇ）とか数字＋改行とかは修正ペンで消してから撮影すれば、金額はほぼ１００％正確に読み取ってくれるんで修正が必要ない。
割引もマイナス値で読み取ってくれる。

**名無しさん＠お腹いっぱい。** · 2019/04/24(水) 17:27:12.85

OCRする前に、原稿が上下逆かどうかを自動判別する手法、何か無いですか？
Linuxで使える物で

**名無しさん＠お腹いっぱい。** · 2019/04/24(水) 23:45:13.63

普通に考えて「OCRする前に」は無理だろう。

**名無しさん＠お腹いっぱい。** · 2019/04/26(金) 21:22:29.83

そのままOCRをして。上下逆にしてOCRして、
2種類の日本語の単語数を数えて、(どんな方法かは分からない)
多い方を正解にするとかは？

**名無しさん＠お腹いっぱい。** · 2019/04/29(月) 11:28:12.88

>>132
ドキュメントスキャナには上下を自動的に判別する機能があるよね｡ドライバを解析すればわかるかもね｡

**名無しさん＠お腹いっぱい。** · 2019/05/01(水) 07:14:36.04

>>132
領域を9等分して、明るさを数値化する。明るい区画は空白が多いという事だから、下になる。
領域を細かく分ければ精度が上がる。

**名無しさん＠お腹いっぱい。** · 2019/05/04(土) 09:49:33.30

>>136
なるほど。ありがとうございます。
これだと、言語を問わず判定出来そう。

**名無しさん＠お腹いっぱい。** · 2019/05/04(土) 15:42:35.53

>>137
横書きなら右に空白が増え、
縦書きなら下に空白が増え、
同じ横書きでもアラビア語みたいに右から書くと左に空白が増える。

この方法を使うためには、縦書きか横書きかを決めておく必要があるのでは？

**名無しさん＠お腹いっぱい。** · 2019/05/08(水) 21:36:16.90

>>75　に追加

読取革命でほとんどのエラー（フリーズ、エンドレス処理など）は
属性変更→認識→文字種→
で「記号」のチェックを外すことで回避できる
必要な記号は「ユーザー定義」欄に入れる
「」『』（）、。ー…・！？々　など

ようやく気付けた・・・
私の環境だけ？

**名無しさん＠お腹いっぱい。** · 2019/05/29(水) 07:43:25.13

tesseractでそれぞれの文字の一致率が何％だったのか取得することってできない？
もしくは高性能なOCRソフトで一致率が何％だったのか取得できるものない？

**名無しさん＠お腹いっぱい。** · 2019/05/29(水) 17:19:09.12

論理矛盾と言うか哲学的な質問だな

**140** · 2019/06/01(土) 06:03:42.02

わかりにくくてすまん　　tesseractにある字体データと対象の文字の一致率って意味　
https://tesseract.patagames.com/help/html/b4effc4b-310d-4f1f-99a0-65bc001cd765.htm
このサイトにある　↓0.125って数字は一致率0.875以上だった場合、Good Matchを返すって意味だと思う　
matcher_good_threshold 0.125 Good Match (0-1)
matcher_perfect_threshold 0.02 Perfect Match (0-1)
やりたいことはこの一致率が指定した値以下だった場合、テキストファイルになにも書き込まないという処理をしたい　読み込む画像はすべて１行
一致率を取得できればほかのプログラムと組み合わせてできるようになる
もしくはこのサイトの関数をうまく使えばできそう
それっぽいのをいじってみたけどうまくいかなかった

**名無しさん＠お腹いっぱい。** · 2019/06/23(日) 10:49:31.56

まぁtesseractは精度悪くはないけど
実用には値しないよなぁ

**名無しさん＠お腹いっぱい。** · 2019/06/23(日) 11:32:22.27

何を持って実用というかによると思うが
tesseractエンジンのCapture2Textにはずいぶんお世話になってる

**名無しさん＠お腹いっぱい。** · 2019/06/23(日) 15:55:40.30

tesseractって認識精度はともかく校正はどうやんの？
なんかいいツールある？

**名無しさん＠お腹いっぱい。** · 2019/06/24(月) 00:53:07.52

テキストエディタで認識結果のファイルを開いて、
誤認識している文字列を肉眼で拾ったら、
Grepツールに渡してフォルダごと全ページを正規表現検索して、
ヒットしたら正しい文字列に置換。
の繰り返しが基本。

最初にやるのは、まず一行の文字数を揃えること。
一行40文字で組まれているのに、それ以上あればその行はどこか
間違っている。

例：一行41文字以上で行末が句読点ではない文字列を検索する正規表現
^(.{41,}[^、。]$

**名無しさん＠お腹いっぱい。** · 2019/06/26(水) 20:48:52.13

仕事で手書きのファックスがバンバンきて、金額いれて計算して合計送り返す昭和なことしてるんだけど、
pc.スマホでスキャンしてエクセルで自動計算するには何が良いですかね？pc買い替え？タブレット購入？
ちなみに得意先のファックスの連打はパソコン持ってない奴らがほとんどでそちらの改善はほぼ無理

**名無しさん＠お腹いっぱい。** · 2019/06/28(金) 09:45:39.33

最近の手書きOCRは優秀らしいぞ。
でも､ソリユーション価格だから数百万円とかなんだろうな

**名無しさん＠お腹いっぱい。** · 2019/07/05(金) 13:04:14.42

C2Tの翻訳結果に変な文字列↓が挟まるようになったけど、何ぞこれ
ce4eb3e12fa6d7940ab33a38d4d816ab
文章の終端にくっついてるみたいだから、改行記号か何かが化けてるんだろうか

**名無しさん＠お腹いっぱい。** · 2019/07/17(水) 14:53:00.47

>>149
tesseract-ocrでOCRすると、たしかテキストの末尾に何か挟まってることが多いね。
Meryだと一文字の記号で[FF]と表示されるけど、同じものかしら。
検索/置換で真っ先に削除するから実害は感じないけど。

**名無しさん＠お腹いっぱい。** · 2019/09/15(日) 22:59:06.77

MicrosoftのLensを使って、FAXで送られた書類をスマホで撮影して取り込んだけど
文字小さいから全然読み込めなかったわ

**名無しさん＠お腹いっぱい。** · 2019/09/15(日) 22:59:40.51

あげ

**名無しさん＠お腹いっぱい。** · 2019/09/23(月) 22:23:53.52

Capture2Text使ってたら突然翻訳されなくなりました
英語と日本語で上下に別れていた枠が上の英語のみ
再翻訳のボタンも消えました
設定見直してもまったく変わっておらず
対処方検索してみてもみつからないです

**名無しさん＠お腹いっぱい。** · 2019/10/16(水) 04:14:51.41

>>143
tesseractの最大の欠点は、認識できなかった文字を無かったことにして何も出力しないこと。

認識できなかったら変な文字でよいから出力すべき。これだと後から目で見て気付きやすい。

**名無しさん＠お腹いっぱい。** · 2019/10/16(水) 04:18:09.12

>>146
おっしゃるとおり。
この方法の最大の欠点は、少しずつOCRに掛けながら校正出来ないこと。
最初に全部をOCRに掛けてから、全部を校正するしかない。

**名無しさん＠お腹いっぱい。** · 2019/10/16(水) 07:25:42.98

>>154
tesseract --print-parameters

A list of useful control parameters
https://github.com/tesseract-ocr/tesseract/wiki/ControlParams

認識に自信が無くても何かの文字を出力するようなパラメータが見つけられません。

**名無しさん＠お腹いっぱい。** · 2019/10/16(水) 08:24:23.64

いつまでたっても小説テキスト化位では
eTilTran　読取革命の組み合わせが最強だな
進歩なし

winでは

**名無しさん＠お腹いっぱい。** · 2019/11/05(火) 18:14:11.50

Capture2TextのCLI版で日本語をスキャンして結果をコマンドプロンプトに出力すると
文字化けするのですが対処法はありませんでしょうか
オプションで--clipboardをつけてクリップボードを経由すると文字化けなしで結果が取得出来るのですが
クリップボードを汚したくないので文字化け無しで出力したいです
OCR実行前にコマンドプロンプトの文字コードを変えても効果がありませんでした

**名無しさん＠お腹いっぱい。** · 2019/12/10(火) 01:29:48.62

つい最近OCRソフト探し始めたんだけど、日本じゃ結構前から開発してるとこ無いと知って唖然。
ネットで検索すると丁寧に比較解説してるサイトがすぐ見つかるけど、そこによるとパナの読取革命が一番高性能みたいだね。
ただ長らくバージョンアップしてないしこれからもする事はないみたいだ。
その点アドビは性能面ではパナに劣るけどこれからも開発続けてくし何よりOCR化した時のサイズが小さい。
パナのほうは最大10倍近く膨れ上がるしどうにかならんかの

**名無しさん＠お腹いっぱい。** · 2019/12/10(火) 03:32:57.63

>>159
読取革命でOCR透明テキストを足してからAcrobatで圧縮

**名無しさん＠お腹いっぱい。** · 2019/12/10(火) 03:36:47.74

>>159
DeepLearningに期待しよう。まず手書き文字認識と、版木本の古文書文字認識から始めて、手書き古文書文字認識が目標。

**名無しさん＠お腹いっぱい。** · 2019/12/10(火) 06:54:24.38

Adobeの認識エンジンは自社開発ではなかったような。
今は違うのかな。

GoogleのAPIが実用的になってきている。
あとフロントエンドのGUIさえあれば良いのだが。

**名無しさん＠お腹いっぱい。** · 2019/12/11(水) 06:28:23.68

PDFelementtってやつ買おうと思ってるんだが、これも結局パナソニックのシステム利用してるんかね。
買い切りでPDFも編集も出来るからいいのかなって思って。

**名無しさん＠お腹いっぱい。** · 2019/12/11(水) 08:50:49.67

>>160
横からだけどこれで圧縮可能なのか
試してみるわ
ありがとね

**名無しさん＠お腹いっぱい。** · 2019/12/13(金) 14:39:43.81

結局のところ修正作業がしやすいのが一番
なんなら必ず同じ読み取りミスをするならそのほうがいいくらい
あとルビ対応が少なすぎる

**名無しさん＠お腹いっぱい。** · 2019/12/22(日) 14:43:51.13

e.Typist使ってるが
透明テキストPDFにするなら修正しないし、
txt化するなら良くある読み取りミスを一括で置き換えてそれだけになっちまうわ
ルビはレイアウトを誤認識することがあるから無視してる
高圧縮のPDFの出来がAcrobatより良いんでそこは良い

**名無しさん＠お腹いっぱい。** · 2019/12/25(水) 11:59:05.90

縦書きの透明テキスト付きpdfで
読取革命超える認識率のOCRって無いんかな？
Google Cloud Visionで出来れば最高なのになぁ

**名無しさん＠お腹いっぱい。** · 2020/01/04(土) 06:33:55.83

正月休みでGoogle Compute VisionのOCRで透明テキスト付pdf作るの作ったけど需要ある？

現状バグあり、Google API Key必要。
Windows用、複数ページは連番のjpgファイルをあらかじめ作ること。

日曜に削除予定。githubに置こうと思う。

https://1drv.ms/u/s!Agi0gM6bLD5Wr2wURjeqAok7F450

**名無しさん＠お腹いっぱい。** · 2020/01/04(土) 06:38:57.88

あとpython入ってないと動かないかもしれんw

**168** · 2020/01/04(土) 20:16:15.28

Python入れなくても動くようにした。

https://1drv.ms/u/s!Agi0gM6bLD5WsALWMKVa2ub96WSG?e=Yc19Fs

需要ないのかなｗ

**160** · 2020/01/04(土) 20:28:29.43

バグってたので差し替えｗ

https://1drv.ms/u/s!Agi0gM6bLD5WsAPZ9F1s7wGI7PVa?e=ymPlj1

**名無しさん＠お腹いっぱい。** · 2020/01/04(土) 21:08:20.99

正月明け土曜じゃリアルが忙しくて5ch見てる暇ない人も多いんじゃない？
見てても今時はスマホの専ブラだし

ていうか家帰ったらPCから落とすからちょっと待って

**名無しさん＠お腹いっぱい。** · 2020/01/04(土) 21:16:47.30

ありがとうー
そっちでも動くといいなw

**名無しさん＠お腹いっぱい。** · 2020/01/04(土) 23:54:22.70

試してみました
gcv2hocrの作者さんですかな、ご苦労様です
win環境でexe実行するもエラーで動かず
WSLでsrcを直接実行してみようとしたけど無理でした。
(なおWSL環境下では従来のgcv2hocrのmakepdf.shからの検索PDFは作成できてます)

WSLでgcvocr.py実行したときのメッセージ
$ python ./gcvocr.py ./page001.jpg "API key"
Traceback (most recent call last):
File "./gcvocr.py", line 8, in <module>
from requests import Request, Session
ImportError: No module named requests

つづく

**名無しさん＠お腹いっぱい。** · 2020/01/04(土) 23:59:20.20

winからmakepdfgui.exeを直接実行したときのメッセージ(長いので1枚分だけ)

google OCR page002.jpg
Traceback (most recent call last):
File "E:\tmp\makepdfGUI\makepdf\urllib3\connectionpool.py", line 588, in urlopen
File "E:\tmp\makepdfGUI\makepdf\urllib3\connectionpool.py", line 248, in _get_conn
File "E:\tmp\makepdfGUI\makepdf\urllib3\connectionpool.py", line 816, in _new_conn
urllib3.exceptions.SSLError: Can't connect to HTTPS URL because the SSL module is not available.

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
File "E:\tmp\makepdfGUI\makepdf\requests\adapters.py", line 439, in send
File "E:\tmp\makepdfGUI\makepdf\urllib3\connectionpool.py", line 637, in urlopen
File "E:\tmp\makepdfGUI\makepdf\urllib3\util\retry.py", line 399, in increment
urllib3.exceptions.MaxRetryError: HTTPSConnectionPool(host='vision.googleapis.com', port=443):
Max retries exceeded with url: /v1/images:annotate?key="APIキー"
(Caused by SSLError("Can't connect to HTTPS URL because the SSL module is not available."))

During handling of the above exception, another exception occurred:

つづく

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 00:00:30.96

つづき

Traceback (most recent call last):
File "E:\tmp\makepdfGUI\makepdf\gcvocr.py", line 63, in <module>
File "E:\tmp\makepdfGUI\makepdf\gcvocr.py", line 50, in recognize_image
File "E:\tmp\makepdfGUI\makepdf\requests\sessions.py", line 646, in send
File "E:\tmp\makepdfGUI\makepdf\requests\adapters.py", line 514, in send
requests.exceptions.SSLError: HTTPSConnectionPool(host='vision.googleapis.com', port=443): Max retries exceeded with
url: /v1/images:annotate?key="APIキー" (Caused by SSLError("Can't connect to HTTPS URL because the SSL module is not available."))
Convert page002.jpg to hocr
No input file.
Generating out.pdf
Traceback (most recent call last):
File "E:\tmp\makepdfGUI\makepdf\hocr-pdf.py", line 171, in <module>
File "E:\tmp\makepdfGUI\makepdf\hocr-pdf.py", line 74, in export_pdf
File "E:\tmp\makepdfGUI\makepdf\hocr-pdf.py", line 84, in add_text_layer
File "src\lxml\etree.pyx", line 3469, in lxml.etree.parse
File "src\lxml\parser.pxi", line 1839, in lxml.etree._parseDocument
File "src\lxml\parser.pxi", line 1865, in lxml.etree._parseDocumentFromURL
File "src\lxml\parser.pxi", line 1769, in lxml.etree._parseDocFromFile
File "src\lxml\parser.pxi", line 1163, in lxml.etree._BaseParser._parseDocFromFile
File "src\lxml\parser.pxi", line 601, in lxml.etree._ParserContext._handleParseResultDoc
File "src\lxml\parser.pxi", line 711, in lxml.etree._handleParseResult
File "src\lxml\parser.pxi", line 638, in lxml.etree._raiseParseError
OSError: Error reading file 'E:/tmp\page002.hocr': failed to load external entity "file:/E:/tmp/page002.hocr"
Done!

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 00:03:08.67

すまぬ、dllがいくつか足らないようです。

チョット調べてみます。

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 00:11:55.50

ちなみにWinで動かした時、ウインドウは出ますか？

WSLの時は、モジュールが足らないのでpip installが必要かもです。

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 00:22:37.06

実行するのは4つexeがあるうち、makepdfgui.exeです。これをダブルクリックしてみてください。

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 00:28:58.36

プロンプトとボタンが3つあるGUIが別窓で出てます

WSLではghostscriptとhocr-toolsが使ってるライブラリ(Pillow / lxml / reportlab)はインストールしましたが
後は何が必要か分からなくて入れてないです

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 00:37:03.33

ありがとうございます。

今dllを全部入れたのを作ってますのでしばしお待ち下さい。

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 00:44:00.95

再アップしました。お試しいただければ幸いです。

https://1drv.ms/u/s!Agi0gM6bLD5WsAXIZw7kr90bLghC?e=hFLhW0

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 01:00:42.23

Linux版はこちらです。WSLで動くかもしれません。

https://1drv.ms/u/s!Agi0gM6bLD5WsAYHp7BPFWjaiCk6?e=RLjW5c

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 21:43:56.51

>>182
修正ありがとうございます　無事動きました

makepdfgui.exeは簡易的なフロントエンドという感じですが
gcv2hocr / gcvocr / hocr-pdf をそれぞれexe化されたものが同梱されているので
各プログラムのコマンドライン解説があればバッチ処理で連続実行させられそうですね
あと個人的には出力パス(PDFファイル名)と中間ファイルのテンポラリパスも指定して画像ソースできればいいなと思いました

まあそのあたりはせっかくソース同梱ですし.pyが動かせれば自分で改変できるので
おま環で実行環境づくりに試行錯誤してました
WSLはPython2.7のままだったのでTkinterでハマって一旦断念
dosプロンプト+miniconda でパッケージにrequestsを足してなんとか

```
conda create -n makepdf python=3.7 Pillow lxml reportlab requests
conda activate makepdf
python makepdfGUI.py
```

なお os.path.dirname(__file__) は os.path.dirname(os.path.abspath(sys.argv[0])) に書き換える必要がありました

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 21:46:07.12

×画像ソースできればいいなと思いました
〇画像ソースと分離できればいいなと思いました

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 22:01:04.34

ありがとうございます！

動いてよかったです。
来週にでもgithubに上げますのでforkするなりなんなり宜しくお願いします。

Windows版は.pyファイルのコンパイルにnuitkaを使ってます。コンパイルオプションが長いのでそれも併せてアップします。

Windowsで使えれば少し拡がるかな、と思ってますw

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 22:19:24.41

python由来のexeファイル（gcvocr.exe, hocr-pdf.exe)は単体での起動ができなくて、一緒にたくさん入っている
共有ライブラリが必要になります。

gcv2hocrはMingw64でコンパイルしているので、単体で動作すると思います。

大したものでもないですが、誰かに使ってもらえると嬉しいものです。
ありがとうございます。

**名無しさん＠お腹いっぱい。** · 2020/01/05(日) 22:43:03.98

こちらこそ有用なものを上げていただいてありがとうございます

自分もgcv2hocrをexe化できないかなあと思って弄ってた時期もあったんですがニワカ知識だとなかなか
winだとサーチャブルPDFをスキャン時ではなく後から作ろうと思うと
いまだにAcrobatか旧来の有料OCRソフトかみたいな感じでなかなか歯がゆいとこあります

**名無しさん＠お腹いっぱい。** · 2020/01/06(月) 11:35:46.65

とりあえずGithubにあげました。

https://github.com/dinosauria123/makepdf

**名無しさん＠お腹いっぱい。** · 2020/01/06(月) 22:22:51.95

★入れときました

**名無しさん＠お腹いっぱい。** · 2020/01/07(火) 05:50:46.58

ありがとうー

**名無しさん＠お腹いっぱい。** · 2020/01/08(水) 19:11:22.77

出力pdfを任意の場所に置けるようにしました。

上のgithubのページにダウンロードのリンクがあります。

中間ファイルは別フォルダに置くようにしました。

**名無しさん＠お腹いっぱい。** · 2020/01/09(木) 10:44:21.50

実行時にコンソールウインドウが出ないようにしました。

**名無しさん＠お腹いっぱい。** · 2020/01/09(木) 23:57:29.83

改良乙

**名無しさん＠お腹いっぱい。** · 2020/01/10(金) 00:17:04.04

乙

**名無しさん＠お腹いっぱい。** · 2020/02/04(火) 10:31:25.64

Googleドライブに入れてGoogleドキュメントで開いて…のOCRって、使用量に
何か制限があるのかねえ？

1枚に2000文字程度書かれたビットマップファイルを1800枚ほどOCRしてたら、
途中なぜかGoogleに繋がらなくなった。(googleトップページにも繋がらない・
Google以外は問題なく繋がるので回線の問題では無い)
怪しい利用者と思われ、ロックアウトされたのかねえ？
色々やってたら(20分ぐらい？)復活したが・・・

最初e.TypistOneを使ったが、誤認識があまりにも多く断念。

プログラミングのスキルがあれば Google Cloud Vision API を使うアプリ
を作るのだが、無いのでGoogleドライブ経由で利用。

一旦全てのビットマップをGoogleDriveに入れ、ブラウザ上で、
(1) ビットマップファイルをGoogleドキュメントで開く
(2) 書式無しテキストでダウンロード＆閉じる
(3) 処理の終わったファイルをDriveから削除
という一連のマウス操作を、UWSCというアプリを使って記録、繰り返し再生し
てる。(1枚約1分)

**名無しさん＠お腹いっぱい。** · 2020/02/04(火) 12:00:35.26

Google DriveでのOCRで上限を感じたことはない。
でも1800枚は時間なり量なりの制限にかかるのかもね。

同じ作業をPowershellのスクリプトで行っているが、
無料のGoogle Driveと有料のCloud VisionAPIとでは
認識結果が異なり、精度は意外にも前者が高く、
処理速度は後者が速い。ゆえに使い分けている。

**名無しさん＠お腹いっぱい。** · 2020/02/04(火) 13:11:16.64

>>197
＞無料のGoogle Driveと有料のCloud VisionAPIとでは
＞認識結果が異なり、精度は意外にも前者が高く、
これは意外＆嬉しい情報です。ありがとうございます。

まだ細かくは見ていませんが、Google DriveでのOCR結果は満足いく物のようです。

**名無しさん＠お腹いっぱい。** · 2020/02/04(火) 20:20:23.79

UWSCは自分も使っている。良いソフトだね。
でもUWSCのスクリプトが組めるならば、
PythonなりPowershellなりへの移行も容易では？
速度が当社比10倍にはなると予想。

**名無しさん＠お腹いっぱい。** · 2020/02/04(火) 21:22:14.83

**名無しさん＠お腹いっぱい。** · 2020/02/04(火) 22:00:57.38

この辺？

https://qiita.com/rarara_x16/items/639ebc3069c4d5a4fb8a

**名無しさん＠お腹いっぱい。** · 2020/02/04(火) 22:06:17.89

https://github.com/thinkAmi-sandbox/google-api-python-client-sample/blob/master/README.md

**名無しさん＠お腹いっぱい。** · 2020/02/05(水) 11:23:36.13

>>199
とりあえず今回は、Google-Drive+UWSCでTEXT化を終えました。
次回があればCloud VisionAPIも検討します。
(何もインストールせずに使えるということで、とりあえずPowerShellで
「Hallo World!」を表示させてみた)

参考に教えて頂きたいのですが、>>197でGoogle Driveより精度が低かっ
たと書かれているCloud VisionAPIは DOCUMENT_TEXT_DETECTION か
TEXT_DETECTION のどちらでしょうか？

**名無しさん＠お腹いっぱい。** · 2020/02/06(木) 15:41:42.18

Foxit PDF は英語と日本語を混ぜてスキャンするとエラーになる？

**名無しさん＠お腹いっぱい。** · 2020/02/16(日) 22:18:12.73

>>189
ありがとうございます
1200dpiのスキャナー欲しくなりましたw

**名無しさん＠お腹いっぱい。** · 2020/02/29(土) 06:41:24.12

昭和４０年頃の手書き青焼きのコピー（Ａ４　２３行×１００Ｐ以上）をテキスト化したいんですが
そういう悪条件につよいソフトって家庭用で存在しますか。
ゴミ、旧漢字、略字・・・　「多」の上が「ヨ」だったり

◆JAVA/drQNg · 2020/02/29(土) 08:46:14.92

Adobe Acrobat はバージョンが上がるごとにOCR精度は向上しますか？

**名無しさん＠お腹いっぱい。** · 2020/03/04(水) 10:38:36.74

とりあえず「Capture2Text」使ってみたんだけど、まったく使えなかった…
これ常用してる人いる？

**名無しさん＠お腹いっぱい。** · 2020/03/10(火) 07:56:51.41

そんな使えないの誰もいないでしょ

**名無しさん＠お腹いっぱい。** · 2020/03/10(火) 09:51:38.16

使いこなせないアホなどいないと言いたいのか
使えないから常用者がいないと言いたいのか

**名無しさん＠お腹いっぱい。** · 2020/03/10(火) 18:32:34.56

Capture2Textはtesseract & Google翻訳のフロントエンドとしては有能だぞ
基本よその国のマンガやゲームのフキダシを母国語に翻訳しながら読む用途向けなので長文は苦手だが
tessdataをtessdata_fastと入れ替え jpn_vert.traineddataも足せばOCR精度は多少マシになる

あとググってたら Capture2TextみたいなのをGoogle OCR でやってるツールもあった
SSTRとかいうの
要GCPキーだがクソ速い

**名無しさん＠お腹いっぱい。** · 2020/04/16(木) 08:24:43.33

さっきPDF-XChange Editorの最新版(フリー)を入れたんだが、これめっちゃ機能多いな
無料版だから殆ど使えないけど、こんな機能豊富なアプリ見せられたら買いたくなってくるんだが、
実際はどうなんかな?
5000円ぐらい何だが、買う価値ある?
自炊愛好家にとっては画像圧縮とOCRの機能がどの程度なんかが超重要なんだが、有料版使ってる奴居たら意見聞きたい

**名無しさん＠お腹いっぱい。** · 2020/04/18(土) 09:56:41.39

あるある。絶対買うべし

**名無しさん＠お腹いっぱい。** · 2020/04/20(月) 18:31:31.52

小説テキストデータ化の最終工程で
>>77の通りやってるんだけど
スキャンした元画像の行間がいまいち狭くてやり辛い

スキャンしたテキスト画像の「行間だけ』を広げることのできるソフトはないもんだろうか
（当然用紙の横幅が広がるのは問題なし）
メチルでできるかと思って設定をいろいろいじくりまわしてるんだけどうまくできない

**名無しさん＠お腹いっぱい。** · 2020/04/25(土) 22:50:37.58

( ´･ω･) 民珍♪

**名無しさん＠お腹いっぱい。** · 2020/04/26(日) 15:34:50.65

>>206
昭和44年の手書き謄写版印刷物をスキャンして試してみました。
Googleドライブにアップロードして、Googleドキュメントにすると、認識率9割以上でした。

**名無しさん＠お腹いっぱい。** · 2020/05/06(水) 21:23:20.10

スキャン後のPDFファイルに透過ocrテキストを組み込むことや削除をすることはできますか？
スキャン代行600dpi+ocrをつけて依頼しようかと思っています。
透過ocrテキストが不満な場合、後日（～数年後等)に発売されるかもしれないocrソフトやgoogle等のocrでpdfファイルに
透過テキストを組み込みこんだり削除したいです。
やったことがなく、詳しい人いましたら教えてください。

**名無しさん＠お腹いっぱい。** · 2020/06/22(月) 20:49:34.26

自分用に作ってみました。
良かったらどうぞ。
https://eznavi.net/app/index2.php?pagetop=63&;only=one

**名無しさん＠お腹いっぱい。** · 2020/07/13(月) 21:18:26.68

質問です。
OCR化ソフト：読取革命
音声出力アプリ：EZ PDF reader
1ページのうち複数のパートに分かれたものをOCR化した順にスマホで音声読み上げしたいのですが、
読取革命側で順番を指定してOCR化しても、スマホアプリ側で音声出力の際に最初のパート以外の順番がバラバラになってしまいます。
おそらくアプリ側の問題なのでPDF読み上げの新しいアプリを探しているのですが中々見つからず、おすすめを教えてほしいです。
MOON proは音声出力時にエラーで強制終了でした。。

**名無しさん＠お腹いっぱい。** · 2020/07/14(火) 04:07:13.49

>>219
読取革命が読み取った結果をPDFに出力するのは何故？
Textファイルに出力したら？

**名無しさん＠お腹いっぱい。** · 2020/07/14(火) 19:02:18.52

>>220
テキストファイル出力での読み上げアプリも２つ試したのですが、
文字化けや改行の挿入、いったんアプリを閉じて再度開いた際に前回の再生位置から開始が出来ないなど、
文庫サイズのテキストを読む際での不都合が多かったです。
PDFアプリの方も現在使用しているez pdf reader以上に動作の安定したアプリが中々見つからず、
スレチで申し訳ないのですがスマホ端末での音声出力メインでOCR化されてる方がいれば、、と思い質問させて頂いた次第です。

**名無しさん＠お腹いっぱい。** · 2020/07/15(水) 10:23:16.57

>>221
Androidは、使用してないので分かりませんが
iPhoneならVoice Dream Readerがオススメです。個人的に。

**名無しさん＠お腹いっぱい。** · 2020/07/17(金) 10:09:33.44

>>222
試してみます。有難うございます。

**名無しさん＠お腹いっぱい。** · 2020/07/17(金) 19:57:43.35

>>223
Voice Dream Readerでテキスト読み上げさせるには、読取革命で生成されたままだと
文字化けすると思いますよ。
メモ帳で開いて文字コードをANSIからUTF-8に変更保存が必要です。
最近は使用してませんが以前自分も、読取革命でOCRしてましたので。

**名無しさん＠お腹いっぱい。** · 2020/07/18(土) 22:53:37.67

qiitaでOCRを検索したら、日本語に対応したオリジナルのOCRが公開されていた。

フリーの日本語OCR（と学習済みのモデル）を公開しています。
　ttps://qiita.com/tanreinama/items/e171449e66d5221afe7e

日本語OCRを作ったので解説してみる
　ttps://qiita.com/tanreinama/items/8fc1c8af6554654aae00

GitHub
　ttps://github.com/tanreinama/OCR_Japanease

すげい良さげなのでインストールしてみたのだが、GPUがないせいかどうなのか、
うちの環境ではPytorchとかCUDAのインストールがうまくいかなかった。

Linuxを使える誰か、試してみてはくれまいか。

**名無しさん＠お腹いっぱい。** · 2020/07/18(土) 22:59:29.26

GPUなしでも動かせるみたいだしWSL入れたらwin10でもいけんじゃね

**名無しさん＠お腹いっぱい。** · 2020/07/20(月) 11:49:35.26

tegakiとか簡単に開発できるらしいけどフリーだと無いよな

【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net

【文字認識】OCRソフト【自炊】 [無断転載禁止]©2ch.net