探検
【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
2016/08/09(火) 21:24:11.61ID:zXdCMkkb0
光学文字認識(こうがくもじ にんしき、Optical character recognition)ソフト
261名無しさん@お腹いっぱい。
2020/12/18(金) 14:30:16.91ID:lA9GnPM30 >>260
OCRHelper使えば、比較的楽。
OCRHelper使えば、比較的楽。
262名無しさん@お腹いっぱい。
2020/12/28(月) 21:00:44.55ID:VlqH5s5B02021/01/11(月) 19:08:54.94ID:cCWQR2l/0
校正に一番必要なのはデカイモニター
一行をはみ出さずに表示して
間聞開闇ここらが一目で見分けられるやつ
一行をはみ出さずに表示して
間聞開闇ここらが一目で見分けられるやつ
2021/01/17(日) 19:34:10.00ID:QPWOr2470
2021/01/17(日) 20:29:10.19ID:p7Uj5Bfi0
>>264
そのオプションはフォークされた改造版で追加されてたんだが
本家のプルリクに上がることもなくフォーク先も今は見えなくなってる
(おそらくフォーク主がプライベートリポジトリに変更したんだと思う
MS買収で無料で非公開にできるようになったから)
フォーク版は他にも画像ソースにjpg以外の形式も指定できるようになってたりと
色々便利そうだったんだけどね、残念
そのオプションはフォークされた改造版で追加されてたんだが
本家のプルリクに上がることもなくフォーク先も今は見えなくなってる
(おそらくフォーク主がプライベートリポジトリに変更したんだと思う
MS買収で無料で非公開にできるようになったから)
フォーク版は他にも画像ソースにjpg以外の形式も指定できるようになってたりと
色々便利そうだったんだけどね、残念
2021/01/18(月) 16:07:24.44ID:4aq7gtM60
2021/01/18(月) 18:23:18.22ID:lqqeSLpf0
2021/01/19(火) 16:59:59.15ID:nJ0mxE500
2021/01/29(金) 07:49:55.72ID:wxsf7Wfh0
今Acrobat 9 std使ってるけど、
読取革命とかの方が認識率高いとかありますか?
あとマルチスレッド対応でしょうか
Acrobat9はシングルスレッドみたいで、
PCが8コア16スレッドなのに1スレッドしか働いてません
読取革命とかの方が認識率高いとかありますか?
あとマルチスレッド対応でしょうか
Acrobat9はシングルスレッドみたいで、
PCが8コア16スレッドなのに1スレッドしか働いてません
2021/01/29(金) 08:24:46.05ID:1HVM47hB0
読取革命を使うのは認識率の高さではなく
校正のしやすさが目的かな
マルチスレッドはわかんね
校正のしやすさが目的かな
マルチスレッドはわかんね
2021/02/11(木) 18:21:51.86ID:26F+m0Y80
突然失礼します。
現在仕事の関係で大量の画像から主要文章を抜き出し、まとめている作業をしているのですが画像がまとめてあるファイルから一括で読みとってくれるOCRソフトは何かないでしょうか?
現在仕事の関係で大量の画像から主要文章を抜き出し、まとめている作業をしているのですが画像がまとめてあるファイルから一括で読みとってくれるOCRソフトは何かないでしょうか?
2021/02/11(木) 19:00:46.81ID:IHq/iUj+0
>>271
若干知識が必要だけどGoogleアカウント作れば無料
GDriveのフォルダにほうりこんだファイル全部処理してくれる
【GAS】OCRを使ってスキャンしたい画像の文字取得を自動化する
http://www.initialsite.com/w01/14488
若干知識が必要だけどGoogleアカウント作れば無料
GDriveのフォルダにほうりこんだファイル全部処理してくれる
【GAS】OCRを使ってスキャンしたい画像の文字取得を自動化する
http://www.initialsite.com/w01/14488
2021/02/11(木) 20:17:36.01ID:26F+m0Y80
分かりました!やってみます!!
2021/02/11(木) 21:36:37.94ID:26F+m0Y80
どうにかコピペしたコマンドを実行しるところまでこぎつけましたが、いまいち使い方が分かりません(泣)
勉強してできるようにしたいと思います。
勉強してできるようにしたいと思います。
2021/02/13(土) 16:42:15.51ID:ZeIWlZfb0
医学者を大量にOCRかけたいのですがオススメのOCRソフトはどれになりますでしょうか?
2021/02/13(土) 17:58:27.11ID:IFB3FsXw0
OCR で遺伝子は認識しないだろ(ゲノムスキャン?)
2021/02/13(土) 18:38:25.90ID:ZeIWlZfb0
医学書です
2021/02/14(日) 04:32:22.06ID:JX8dJfP00
2021/02/14(日) 06:39:37.00ID:57AdeLvf0
ありがとうございます
2021/02/18(木) 14:26:16.02ID:YBVmHAJp0
度々失礼します。
以前教えていただいたGoogleDrive方式を試してみたところ、どうにかファイル内の画像を読み込んでテキストに出力するところまでこぎつけました。
ただ、設定が悪いせいか、せいぜい2 枚を読み込んだところで変換が終了してしまいます。
手っ取り早くソフト購入を考えていますが、そこそこの精度で大量読み込みをしてくれる物を御存知の方がいればぜひ教えてください。
よろしくお願いします。
以前教えていただいたGoogleDrive方式を試してみたところ、どうにかファイル内の画像を読み込んでテキストに出力するところまでこぎつけました。
ただ、設定が悪いせいか、せいぜい2 枚を読み込んだところで変換が終了してしまいます。
手っ取り早くソフト購入を考えていますが、そこそこの精度で大量読み込みをしてくれる物を御存知の方がいればぜひ教えてください。
よろしくお願いします。
2021/02/18(木) 18:53:15.29ID:sbM29q5M0
ScanSnap買うのが吉かも
2021/02/18(木) 19:26:00.10ID:RZJx4jaI0
Kofax Power PDF Standard
https://www.kofax.jp/Products/power-pdf
https://www.kofax.jp/Products/power-pdf
2021/02/18(木) 19:39:21.13ID:PhET5XgP0
お金出せるなら ABBYY FineReader あたりがいいんじゃない バッチ処理もあるし
CZERのOCRエンジンがABBYYなんだが認識精度は悪くないよ
デフォルト設定でPDFにすると画像めっちゃ汚くなるけどテキストで抽出するなら関係ないだろうし
CZERのOCRエンジンがABBYYなんだが認識精度は悪くないよ
デフォルト設定でPDFにすると画像めっちゃ汚くなるけどテキストで抽出するなら関係ないだろうし
2021/02/18(木) 21:18:15.99ID:FuM14PBd0
テキスト抽出じゃなくて検索可能なPDFを作りたい場合のおすすめは?
2021/02/18(木) 22:04:26.68ID:/MMQ5ij10
画像ファイルから検索可能なPDFに変換するソフトは、いきなりPDFとかJUSTPDFとかあるな、体験版あるかな
2021/02/18(木) 22:14:42.16ID:rFCUPf3V0
>>284
OCR機能のついたドキュメントスキャナーでスキャン
OCR機能のついたドキュメントスキャナーでスキャン
2021/02/18(木) 23:34:26.27ID:PhET5XgP0
>>284
横書き文書オンリーで仕上がりの良さ最優先なら>189
フリーのツールなんで設定の難しさやUIの面倒さはある
googleにお布施も必要
簡単さで選ぶなら市販のOCRだろうけど詳しくないので分からん
とりあえずwindowsサンドボックスでABBYY試してみたが
MRC圧縮をオフにすれば画質は保たれるぽい
横書き文書オンリーで仕上がりの良さ最優先なら>189
フリーのツールなんで設定の難しさやUIの面倒さはある
googleにお布施も必要
簡単さで選ぶなら市販のOCRだろうけど詳しくないので分からん
とりあえずwindowsサンドボックスでABBYY試してみたが
MRC圧縮をオフにすれば画質は保たれるぽい
288名無しさん@お腹いっぱい。
2021/02/19(金) 14:18:04.61ID:/LGznBXV0 e.Typist使ってるよ
検索可能PDFにするときのMRC圧縮はPCで見ると汚いのに、タブレットで見ると良く見えるから不思議
PCの画面を範囲指定してOCR出来る機能はふとしたときに便利
画像読み込みが500枚までしか対応しないのはクソ
検索可能PDFにするときのMRC圧縮はPCで見ると汚いのに、タブレットで見ると良く見えるから不思議
PCの画面を範囲指定してOCR出来る機能はふとしたときに便利
画像読み込みが500枚までしか対応しないのはクソ
2021/02/19(金) 14:51:13.32ID:pqe2wozU0
e.typistか読取革命で迷う
290名無しさん@お腹いっぱい。
2021/02/19(金) 17:56:41.05ID:b3qLx0/L0 洋書死ぬほどつらい
pdf→ocr→誤字とか改行チェック→自動翻訳→翻訳チェック
pdf→ocr→誤字とか改行チェック→自動翻訳→翻訳チェック
2021/02/19(金) 18:34:37.99ID:zfdZU+YJ0
>>288の方へ
前から気になっていたのですが、500枚の読み込みというのは一度にですか?それとも上弦ですか?
前から気になっていたのですが、500枚の読み込みというのは一度にですか?それとも上弦ですか?
2021/02/20(土) 13:37:22.40ID:0EiJ9/Or0
>>288
タブレットのアプリに画像補正機能があるのでは?
タブレットのアプリに画像補正機能があるのでは?
2021/02/20(土) 22:00:35.33ID:Z3ERY2/H0
2021/02/20(土) 22:44:13.29ID:u7vHQ+N90
>>293
え、単純にppiの差だったら不思議でも何でもないじゃん
え、単純にppiの差だったら不思議でも何でもないじゃん
2021/02/24(水) 14:51:12.19ID:aqSvsfDI0
TESSERACT-ocrで 紙読ませたら
「シャンプードレッサー」 が 「にャンプードジったー」 になった
「シャンプードレッサー」 が 「にャンプードジったー」 になった
2021/02/25(木) 22:13:45.52ID:cLb3BFZQ0
OCR精度が高くて動作が高速なソフトは?
2021/02/25(木) 22:25:33.45ID:ttwjBNUo0
adobe acrobat
2021/02/25(木) 22:32:06.79ID:cLb3BFZQ0
サブスク以外で頼みます
2021/02/25(木) 23:16:42.87ID:ttwjBNUo0
ワープロ打ちした会議資料など、状態が良い原稿からの日本語の横書きと縦書き文章のOCR化を考えているならe.Typist
文章認識の性能は、読取革命と較べた場合、僅かな差ですがこちらの認識性能が上
雑誌や本などレイアウトが複雑なものや、新聞や古い原稿など状態が良くない日本語文章の他、英語文字が入る場合や、小説や雑誌などの2段組の文章などは読取革命が上
文章認識の性能は、読取革命と較べた場合、僅かな差ですがこちらの認識性能が上
雑誌や本などレイアウトが複雑なものや、新聞や古い原稿など状態が良くない日本語文章の他、英語文字が入る場合や、小説や雑誌などの2段組の文章などは読取革命が上
2021/02/26(金) 10:13:46.63ID:RR89ZAlv0
300
2021/05/01(土) 12:22:34.25ID:wPbgt6E/0
tesseract OCRチャレンジ中。プログラミングの技術書PDFを何とか透明PDF付きにしたいという欲求。
飾り文字とか目次とかが壮大にこける。下のような・・・を無視したいんだけど何かうまい方法ないでしょうか。
02 はじめに・・・・・・・2
飾り文字とか目次とかが壮大にこける。下のような・・・を無視したいんだけど何かうまい方法ないでしょうか。
02 はじめに・・・・・・・2
302名無しさん@お腹いっぱい。
2021/05/01(土) 17:39:13.89ID:CU4T262z0 >>301
トランプのマーク4種を認識させるときにその文字に限定させることでうまく認識したことがあった。
トランプのマーク4種を認識させるときにその文字に限定させることでうまく認識したことがあった。
2021/05/01(土) 21:39:33.27ID:wPbgt6E/0
2021/05/02(日) 17:57:02.87ID:fc3xJsqr0
50冊くらいの教科書、手技書等を裁断して、職場の複合機で、スキャンしてPDF化予定です。
検索可能PDFにしたいと考えています。認識率はそこまで厳密に高くなくても、キーワードで該当箇所が分かれば便利かなぁという程度です。テキストで出力などは予定していません。
分厚い表紙などは別でスキャンして中身のPDFと統合できると良いと思っています。
読取革命を第一候補に考えています。いきなりPDFスタンダードというのはOCR絡みのエンジンがパナソニックと書かれていますが、これは読取革命のものとは違うものでしょうか?ほとんど一緒というレベルならいきなりPDFの方が随分安いので良いなぁという感じなのですが、誰かわかりますか?
検索可能PDFにしたいと考えています。認識率はそこまで厳密に高くなくても、キーワードで該当箇所が分かれば便利かなぁという程度です。テキストで出力などは予定していません。
分厚い表紙などは別でスキャンして中身のPDFと統合できると良いと思っています。
読取革命を第一候補に考えています。いきなりPDFスタンダードというのはOCR絡みのエンジンがパナソニックと書かれていますが、これは読取革命のものとは違うものでしょうか?ほとんど一緒というレベルならいきなりPDFの方が随分安いので良いなぁという感じなのですが、誰かわかりますか?
2021/05/02(日) 18:48:29.25ID:Xx835nqP0
読取革命は読取結果を修正できる
いきなりPDFスタンダードはたぶん修正できない
いきなりPDFスタンダードはたぶん修正できない
2021/05/02(日) 20:26:16.72ID:lQUzaBSR0
>>305
ありがとうございます。修正するつもりがなければいきなりPDFで良さそうですね。
ありがとうございます。修正するつもりがなければいきなりPDFで良さそうですね。
2021/05/02(日) 20:55:33.98ID:ajDJAhT50
職場に複合機あるなら機械単体でサーチャブルPDF作れるんじゃない?
画質は高圧縮でだいたい酷いことになるっぽいが
画質は高圧縮でだいたい酷いことになるっぽいが
2021/05/03(月) 17:07:18.50ID:WHA1lrAT0
2021/05/03(月) 18:31:46.14ID:FElEuZiq0
読取革命などのOCRソフトは、画像を読み込み、文字認識、修正、PDFや、ワードなどに出力する。
PDFも読み込めるが、新たにPDFとして出力される。
いきなりPDF COMPLETEなどの最上位板のPDFソフトは、PDFの透明テキストを修正できる。
画像の上に、文字色が透明のテキストが貼り付けられてる。
文字を赤に変えてチェックするけど面倒くさい。
もっといい方法があるかも知れない。
PDFも読み込めるが、新たにPDFとして出力される。
いきなりPDF COMPLETEなどの最上位板のPDFソフトは、PDFの透明テキストを修正できる。
画像の上に、文字色が透明のテキストが貼り付けられてる。
文字を赤に変えてチェックするけど面倒くさい。
もっといい方法があるかも知れない。
2021/05/09(日) 01:03:19.05ID:jmsS93J00
いきなりPDFを購入したものの、肝心のスキャンしたPDF→透明テキスト付きPDFの作業でソフトが強制終了してしまいます。問題なくファイル変換できるものと出来ないものがあるみたいです。
Q&Aにはフォントを追加しているとエラー出るかもとか書いてありますが、そもそもフォントを追加なんかした事ないし、どれを消せばいいのかも分からない。というかこれが原因なのかすら分からない。
サポートに問い合わせてみていますが、返事があるのかすら怪しい。。。やはり大人しくAdobeのサブスクリプションにしておくべきだったのか。
愚痴でした。
Q&Aにはフォントを追加しているとエラー出るかもとか書いてありますが、そもそもフォントを追加なんかした事ないし、どれを消せばいいのかも分からない。というかこれが原因なのかすら分からない。
サポートに問い合わせてみていますが、返事があるのかすら怪しい。。。やはり大人しくAdobeのサブスクリプションにしておくべきだったのか。
愚痴でした。
2021/05/09(日) 12:44:48.40ID:B+KqUkb30
スキャナの設定で、ocrをしてるとかあるのではないかな
2021/05/10(月) 22:12:57.20ID:6JH0PhBK0
>>310
ストレージの空き容量を確認してみて。こういったアプリは作業ファイルを多量に作るので...
ストレージの空き容量を確認してみて。こういったアプリは作業ファイルを多量に作るので...
2021/05/10(月) 22:38:16.43ID:4N16DkIp0
jpgでスキャンするか、jpgに変換して、jpgを読み込めば大丈夫だろう
314名無しさん@お腹いっぱい。
2021/05/12(水) 21:30:34.59ID:obNff0Ek0 まあ、10ページでエラーが出るのか、100ページでエラーが出るのか、1000ページでエラーが出るのかの場合分けだな
2021/05/13(木) 16:38:29.73ID:SLu4UeqC0
色々とありがとうございます。
スキャナにはOCRの機能はありませんでした。ストレージにもかなり余裕がありそうですが、ものによるのでしょうか。
何度やってもダメなPDFは4ページ、3/4の表示のところで文字認識中というところで落ちてしまいます。同じ日にスキャンしたPDF(2-6ページ程度のもの複数)はOCR化出来ました。
150ページくらいの200MB程度のものは2個/21個は変換できましたが他はダメでした。JPG経由はまだ試してませんのでやってみたいと思います。
サポセンから連絡があり、調べてみます的なお返事でした。
スキャナにはOCRの機能はありませんでした。ストレージにもかなり余裕がありそうですが、ものによるのでしょうか。
何度やってもダメなPDFは4ページ、3/4の表示のところで文字認識中というところで落ちてしまいます。同じ日にスキャンしたPDF(2-6ページ程度のもの複数)はOCR化出来ました。
150ページくらいの200MB程度のものは2個/21個は変換できましたが他はダメでした。JPG経由はまだ試してませんのでやってみたいと思います。
サポセンから連絡があり、調べてみます的なお返事でした。
2021/05/18(火) 18:05:36.41ID:p+07QIeH0
ワクチン接種記録システムの利用者番号読取がOCRで、読取間違いが発生するそうだ
317名無しさん@お腹いっぱい。
2021/05/19(水) 02:26:34.81ID:HWxuzQfn0 フォントはOCRBで共通でタブレットも同一機種を配布らしいけど撮影環境がマチマチで人によって得られる画像が異なってくるのでそう言う結果になるのは仕方がない。
手振れや角度とかの癖でどういう間違いが出易いとかはあると思う。手振れは持ち方でも変わってくる。
タブレットが大きいから影が映りこむけど、照明が適切か分からない。
ライトは使ってないようだったが、ライトをつけた方が認識しやすい。反射する場合はライト無しにする必要がある。
ピント合わせが出来ない場合が多すぎる。マジ糞。ピント合わせに時間かかる。
カメラが複数ついてる奴はピント合わせ速そうだけど、安いのはカメラ1個だから遅い。
撮影台に乗せて使う場合はピント合わせを固定に出来た方が故障しないし撮影一瞬で出来るしいいことづくめのはず。
セルフレジでも読み取りできないことがよくあるけど、一旦しっかり外して再びしっかり読ませれば一秒で読み取ってくれる。
手振れや角度とかの癖でどういう間違いが出易いとかはあると思う。手振れは持ち方でも変わってくる。
タブレットが大きいから影が映りこむけど、照明が適切か分からない。
ライトは使ってないようだったが、ライトをつけた方が認識しやすい。反射する場合はライト無しにする必要がある。
ピント合わせが出来ない場合が多すぎる。マジ糞。ピント合わせに時間かかる。
カメラが複数ついてる奴はピント合わせ速そうだけど、安いのはカメラ1個だから遅い。
撮影台に乗せて使う場合はピント合わせを固定に出来た方が故障しないし撮影一瞬で出来るしいいことづくめのはず。
セルフレジでも読み取りできないことがよくあるけど、一旦しっかり外して再びしっかり読ませれば一秒で読み取ってくれる。
318名無しさん@お腹いっぱい。
2021/05/19(水) 10:32:09.32ID:JDDtGBtH0 フォント共通で数字のみでも読み取り間違い出るなら、100%認識のOCRなんて夢のまた夢だな
2021/05/20(木) 04:54:15.76ID:KDnYz3pE0
最近利用しているガソリンスタンドの料金機(セルフの店なんで)が
QRコードで割引とかあって、
まぁ、レシート出すとその季節の割引券が付くんだけど
それの読み込みが遅くてイライラするのよ
QRコードなのにクイックじゃ無い
結局読み取りのところにレシートを押しつけて、
少しずつ遠ざけていくとまぁまぁ(2回目ぐらいで)読み取るぐらいに安定したわ
レシートだから裏が透けたり、角度が付いていたりピントが合わなかったり
そう言うのに強いのがQRコードじゃないんかね?
QRコードで割引とかあって、
まぁ、レシート出すとその季節の割引券が付くんだけど
それの読み込みが遅くてイライラするのよ
QRコードなのにクイックじゃ無い
結局読み取りのところにレシートを押しつけて、
少しずつ遠ざけていくとまぁまぁ(2回目ぐらいで)読み取るぐらいに安定したわ
レシートだから裏が透けたり、角度が付いていたりピントが合わなかったり
そう言うのに強いのがQRコードじゃないんかね?
2021/05/20(木) 08:30:39.20ID:4Fq3eRUr0
OCRとQRは別物だし完全にスレ違いなんだが
あえてツッコむとそれカメラがタコなだけだからスマホ変えたほうがいいよ
QRの規格に文句言うのは筋違い
あえてツッコむとそれカメラがタコなだけだからスマホ変えたほうがいいよ
QRの規格に文句言うのは筋違い
2021/05/26(水) 00:13:19.62ID:kuNfd1Ht0
ガソリンスタンドのセルフ給油機を客が交換するってのはどういう発送なんだろうか?
2021/05/28(金) 12:05:47.29ID:P2WCflXp0
2000冊分くらいのpdfファイルがあり OCR済みのものとしていないものが混ざっています。これをまとめてOCRしたいのですが安くあげるにはどうしたらいいですか。
バンドル版のacrobatXはこういう目的に使えますか。
https://m.qoo10.jp/item/%E3%82%A2%E3%82%AF%E3%83%AD%E3%83%90%E3%83%83%E3%83%88-ADOBE-ACROBAT-X-10-STANDARD-%E3%83%90%E3%83%B3%E3%83%89%E3%83%AB%E7%89%88/601688005
バンドル版のacrobatXはこういう目的に使えますか。
https://m.qoo10.jp/item/%E3%82%A2%E3%82%AF%E3%83%AD%E3%83%90%E3%83%83%E3%83%88-ADOBE-ACROBAT-X-10-STANDARD-%E3%83%90%E3%83%B3%E3%83%89%E3%83%AB%E7%89%88/601688005
2021/06/18(金) 13:05:44.71ID:y51nqA8T0
官報を機械可読で公開してくれ
2021/07/10(土) 11:32:58.13ID:oCPigeEQ0
2021/07/17(土) 20:46:01.69ID:Nx+D16Ts0
Windows 10上で無料利用できるAI-OCR 認識精度は95% 認識枚数は制限なし
https://ledge.ai/seagp-ai-jimy-ocr/
https://ledge.ai/seagp-ai-jimy-ocr/
326名無しさん@お腹いっぱい。
2021/07/18(日) 02:32:22.76ID:oQLnYNbx0 >>325
認識率95%ってそんなに凄いの。今使ってるの Acrobat の OCR で困ったことないんだけど、それよりもすごいのかな。
認識率95%ってそんなに凄いの。今使ってるの Acrobat の OCR で困ったことないんだけど、それよりもすごいのかな。
2021/07/18(日) 09:04:36.93ID:lnw1fm580
> ※ 認識精度は数字に関するもので、条件で左右されます。
数字だけに限定してさえ100文字中5文字は間違うってことでしょ
手書き認識も含むから活字だけならもっと認識率上がるのかも知らんけど
数字だけに限定してさえ100文字中5文字は間違うってことでしょ
手書き認識も含むから活字だけならもっと認識率上がるのかも知らんけど
2021/07/18(日) 09:15:41.36ID:P3XK5s350
2021/07/18(日) 16:32:03.31ID:8SefTmjA0
無償OCRか。この企業、どうやってマネタイズするんだろ
情報抜いて横流しするのかな
情報抜いて横流しするのかな
2021/07/19(月) 01:07:30.29ID:F9XeLcaj0
2021/07/19(月) 05:34:45.46ID:fvfQWF3L0
AIって自主学習して精度上がる問じゃないのん?
332名無しさん@お腹いっぱい。
2021/07/19(月) 07:58:50.76ID:F9XeLcaj0 全ての文字が文字化けだから。コードを選ばなきゃいけないのかね。
自己学習をしなくてもある程度の精度が出なきゃ学習のための動力が大変だよ。
自己学習をしなくてもある程度の精度が出なきゃ学習のための動力が大変だよ。
2021/07/19(月) 08:28:19.56ID:fvfQWF3L0
全てとなるともう根本的に対応してないのか…?
334名無しさん@お腹いっぱい。
2021/07/19(月) 10:34:39.69ID:F9XeLcaj0 インストールして試してください。約1 GB のアプリです。もしかしたら私の使い方が根本的に間違ってるのかもしれない。
2021/07/19(月) 16:42:09.54ID:3A2XjCut0
アクセス集中で大変だったりして
2021/07/19(月) 21:27:30.10ID:8sS8G9mf0
アカウント作れがうざすぎ
2021/07/19(月) 23:38:16.48ID:DpU5b5C20
やっぱり情報抜く系みたいだな
やめとき
やめとき
2021/07/20(火) 01:05:44.37ID:LR2/vrCo0
きっと背後に中国がいるぞ
339名無しさん@お腹いっぱい。
2021/07/21(水) 01:43:25.56ID:qQ5Ez8Mv0 本を見開きでスキャンしたらできる本の周りの影と真ん中の影を消すソフトないでしょうか?どちらか一つでもいいです。
2021/07/21(水) 09:17:53.10ID:9Y2uwqlR0
マルチ乙
2021/07/21(水) 09:18:19.15ID:gZhpeJ+z0
さらに歪曲まで修正するのがあったような
342名無しさん@お腹いっぱい。
2021/07/21(水) 13:02:55.40ID:qQ5Ez8Mv0 >>341
是非教えてください
是非教えてください
343名無しさん@お腹いっぱい。
2021/07/21(水) 13:04:34.65ID:qQ5Ez8Mv0 自分で調べたけど発見できませんでした。
念のためですがスキャン自体は Acrobat の スキャン機能 を使ってます。スキャン後の PDF の影を取るソフトです。
念のためですがスキャン自体は Acrobat の スキャン機能 を使ってます。スキャン後の PDF の影を取るソフトです。
2021/07/21(水) 13:07:50.05ID:gZhpeJ+z0
OCR機能は無い
2021/07/21(水) 13:12:00.06ID:9Y2uwqlR0
マルチ乙
346名無しさん@お腹いっぱい。
2021/07/22(木) 16:50:26.47ID:fGMCvnhV0 スマホのOCR、ピントが固定になるようにして使ってるけど
たまに下敷きの量が変わって距離がわずか数ミリずれるだけで認識精度50%とかになる。
レシートがしっかり幅いっぱいになるようにして撮影しなおすと95%くらい認識する。
影ができると精度かなり落ちるから今はスマホのライトOnで撮影している。
たまに下敷きの量が変わって距離がわずか数ミリずれるだけで認識精度50%とかになる。
レシートがしっかり幅いっぱいになるようにして撮影しなおすと95%くらい認識する。
影ができると精度かなり落ちるから今はスマホのライトOnで撮影している。
2021/07/23(金) 11:27:10.26ID:rD1VLEV50
読取革命DL版セールしてんね
2021/07/23(金) 14:20:26.16ID:xlv839tH0
まま?
2021/07/23(金) 14:33:46.10ID:8RLvQ8nD0
まままーままーまま
350名無しさん@お腹いっぱい。
2021/07/23(金) 18:30:19.88ID:KFQ0x8UC0 読取革命で認識させると文字が少し小さくなるのは何でかな
351名無しさん@お腹いっぱい。
2021/07/29(木) 10:14:59.19ID:0JzdyqZz0352名無しさん@お腹いっぱい。
2021/07/31(土) 21:04:10.52ID:3gNkzigk0353351
2021/08/01(日) 12:17:19.04ID:EKgADGMN0 >>352
ありがとうございます! お陰様で、解決できました。
コマンドプロンプトからの動作は chcp 65001 で改善したのですが、
実は、UWSCのDOSCMD関数から叩きたくて、これは、何をやっても解決しませんでした。
(レジストリでAutoRun弄ってもダメ)
UWSCにはPOWERSHELL関数もあって、そちらからは文字化けせずに取得することができました。
ありがとうございます! お陰様で、解決できました。
コマンドプロンプトからの動作は chcp 65001 で改善したのですが、
実は、UWSCのDOSCMD関数から叩きたくて、これは、何をやっても解決しませんでした。
(レジストリでAutoRun弄ってもダメ)
UWSCにはPOWERSHELL関数もあって、そちらからは文字化けせずに取得することができました。
2021/08/03(火) 18:25:28.98ID:1yBwwluW0
スキャンで作成したPDFをOCRで文字認識させました。
表示されている文字で検索してもヒットしませんでした。
当該文字をコピーしてテキストファイルに貼り付けると別の文字になっていました。
OCRに詳しくないので教えてほしいのですが
1、認識後の文字はもとの文字の上に透明のフォントで重ねているのでしょうか?
2.今は、グラフの線が白黒だと判別できないのグレースケールで600DPIでスキャンしています
(300DPIだと文字の周りがにじむので)。認識率を向上させるために注意する設定項目があれば教えて下さい。
表示されている文字で検索してもヒットしませんでした。
当該文字をコピーしてテキストファイルに貼り付けると別の文字になっていました。
OCRに詳しくないので教えてほしいのですが
1、認識後の文字はもとの文字の上に透明のフォントで重ねているのでしょうか?
2.今は、グラフの線が白黒だと判別できないのグレースケールで600DPIでスキャンしています
(300DPIだと文字の周りがにじむので)。認識率を向上させるために注意する設定項目があれば教えて下さい。
355名無しさん@お腹いっぱい。
2021/08/07(土) 08:52:19.64ID:rqbKqC/20 >>354
僕はプリンタ付属のOCRでスキャンしてますが、600dpiより300dpiのグレーが認識率高いです。
文字がにじんだ方が線が分離しなくなるので機械には読み取りやすくなるようです。
僕は数字の表だけ読み取れればいいんで英数で読み取って数字以外は捨ててます。
矩形でタブを入れ、空白を置換で削除することでExcelでも表として認識できます。
昨日は1ページスキャンして1文字だけ認識してませんでした。
もしかすると、矩形の空白を削除するときにその数字だけはみ出していて削除してしまったのかもしれません。
元が英数ならいいんですが、日本語の文字化けでずれが大きくなるので。
ブラザーの複合機ですが、新しいアプリより ControlCenter4 のOCRの方が使いやすかったです。
PDFの方は詳しくありませんが、PDFにはレイヤ機能があって重ね合わせが出来ます。
WORDでもハガキのイメージに合わせて郵便番号や宛先など配置できますよね。
文字が正しく読み取れなかったとしても、その化けた文字が配置されるので検索では本来の文字は出てこないでしょうね。
僕はプリンタ付属のOCRでスキャンしてますが、600dpiより300dpiのグレーが認識率高いです。
文字がにじんだ方が線が分離しなくなるので機械には読み取りやすくなるようです。
僕は数字の表だけ読み取れればいいんで英数で読み取って数字以外は捨ててます。
矩形でタブを入れ、空白を置換で削除することでExcelでも表として認識できます。
昨日は1ページスキャンして1文字だけ認識してませんでした。
もしかすると、矩形の空白を削除するときにその数字だけはみ出していて削除してしまったのかもしれません。
元が英数ならいいんですが、日本語の文字化けでずれが大きくなるので。
ブラザーの複合機ですが、新しいアプリより ControlCenter4 のOCRの方が使いやすかったです。
PDFの方は詳しくありませんが、PDFにはレイヤ機能があって重ね合わせが出来ます。
WORDでもハガキのイメージに合わせて郵便番号や宛先など配置できますよね。
文字が正しく読み取れなかったとしても、その化けた文字が配置されるので検索では本来の文字は出てこないでしょうね。
356名無しさん@お腹いっぱい。
2021/08/07(土) 12:24:46.27ID:iSVP+I520 >>355
コメントありがとうございます。
私もブラザーのプリンターを使ってます。ブラザーの OCR ソフトは使い方がよくわからなかったので日本語の縦書きの認識もそこそこ良かったAcrobat の OCR を使うようになりました。
300 DPI の方が認識率が高いというのは新発見です。
コメントありがとうございます。
私もブラザーのプリンターを使ってます。ブラザーの OCR ソフトは使い方がよくわからなかったので日本語の縦書きの認識もそこそこ良かったAcrobat の OCR を使うようになりました。
300 DPI の方が認識率が高いというのは新発見です。
2021/08/08(日) 10:01:09.25ID:kyf68uXo0
スキャンした画像をChainLPなどの画像処理ソフトで下処理してからOCRに掛ける
358名無しさん@お腹いっぱい。
2021/08/08(日) 13:44:29.33ID:7AjcYiKn02021/08/08(日) 19:14:09.75ID:0wTn0qmR0
自分で仕組、理屈を考えてみろよ
2021/08/08(日) 20:38:22.55ID:IfVfnYiT0
OCR前にソフト側で2値画像に変換されてしまうし
事前補正はあんまり意味ないよ
画像をどうこうするよりOCRソフトのユーザー辞書学習カスタマイズして
パターン登録するほうが効果は高い
事前補正はあんまり意味ないよ
画像をどうこうするよりOCRソフトのユーザー辞書学習カスタマイズして
パターン登録するほうが効果は高い
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 高市内閣、支持率横ばい75% (日経・テレ東 世論調査) ★3 [少考さん★]
- 【調査】クレジットカード、1人何枚持つのが「平均的」?★3 [ひぃぃ★]
- 【テレビ】池上彰氏 報道の自由度が高い国の特徴「どんどん政府を批判する。政治家は受け入れる」 一方独裁国家は… [冬月記者★]
- 【国防】防空ミサイル(中SAM) 輸出検討へ 政府、フィリピンと非公式協議 [シャチ★]
- 【作家】高市総理支持の背景に見えるヤンキー的「ケンカ上等!」と「日本人は特別だ」感がとても怖い 北原みのり [少考さん★]
- 「ヘイトスピーチをやめろ」 各地の「移民反対デモ」に抗議活動 [蚤の市★]
- 安倍晋三「いわばまさに、月末なのでサブスクなど不要な月額サービスは解約するべきなのであります」 [744361492]
- 1人で1000レスいってみる
- 【実況】わため!!!のえちえちラムベガス(こよりあり?)🐏🧪
- 参政党・神谷「このアニメをみてください」 [792147417]
- 現役JKのお茶会スレ( ¨̮ )︎︎𖠚ᐝ174
- フィフィ「「歌唱強制中断」騒動、この時期に中国でライブ公演しようとするアーティストの方にも問題があるのでは?」 [377482965]
