【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net

■ このスレッドは過去ログ倉庫に格納されています
2016/08/09(火) 21:24:11.61ID:zXdCMkkb0
光学文字認識(こうがくもじ にんしき、Optical character recognition)ソフト
2022/02/21(月) 11:29:34.65ID:e3F9aiKE0
>>472
すばらしい。

リリースの暁は、日本語文書き出しの行頭一文字空白も認識させてください。
479名無しさん@お腹いっぱい。
垢版 |
2022/02/22(火) 23:37:13.04ID:KG6iI0vy0
>>477
まだ前半だけだけどとりあえずソース
https://github.com/lithium0003/findtextCenterNet

学習済み重みはreleaseのところにリンクがあるです
文字の大きさは、20pixel-200pixel位で覚えさせてるので
見かけの大きさがそのくらいになる様にリサイズするとよいです。
カラーは適当に処理するはずですが、上手くいかない場合は
コントラストとかいじる必要があるかも。
2022/02/25(金) 01:47:43.46ID:oU6IT1Qa0
神アプリ誕生の予感...
481名無しさん@お腹いっぱい。
垢版 |
2022/02/26(土) 02:15:28.14ID:d9ue173/0
>>479
のモデルで、iPhoneとかiPadで推論できるようにしました
https://testflight.apple.com/join/X68qbEsJ

iPhone13とかの最新デバイスだとまともに動くと思うのですが
昔のデバイスだと微妙かも。落ちる場合はCPU onlyにしたら
遅いながらも落ちなくはなります。
2022/02/27(日) 01:31:27.11ID:Zp2vBZkX0
>>481
Android しか持っていないので試せないです。残念。

>>476
文字のある領域を示すのに IIIF manifest の形式を使うのが標準的なようですが、対応してますか?
483名無しさん@お腹いっぱい。
垢版 |
2022/02/27(日) 23:10:43.63ID:1WOIRC0G0
>>482
IIIF manifestの形式は知りませんでした。どこかよい説明のリンクありますでしょうか。

Androidでも機械学習モデルが簡単に動けばいいのですが。iPhoneの最近のやつは
推論エンジン積んでるのでかなり速く認識できます。
484名無しさん@お腹いっぱい。
垢版 |
2022/03/05(土) 01:38:16.55ID:iWInWTln0
いまだによくロシア企業のOCR使えるな
485名無しさん@お腹いっぱい。
垢版 |
2022/03/06(日) 22:12:54.20ID:p5crT8Gx0
AcrobatでOCRした透明テキストの修正ってどうしてます?
Acrobat上だとやりづらすぎて
2022/03/10(木) 08:35:47.81ID:cWyR5z8H0
漫画翻訳再加工でおすすめのありますかね
グーグルのカメラ翻訳みたいなのが一番なんだけどさすがに無理か
これしか見つからない
https://www.imagetranslate.com
https://github.com/minux302/manga_global
2022/03/30(水) 19:16:25.05ID:aBrCbYCH0
>>468
ありゃダメだよ
ま、値段を考えたら自ずと理解できると思うけどね
488名無しさん@お腹いっぱい。
垢版 |
2022/03/31(木) 19:28:57.72ID:0TmFtm2N0
読取革命を経理業務で使ってる人いる?
領収書や請求書なんかの文字認識や精度はどの程度なのか気になってます
2022/03/31(木) 20:59:05.31ID:gur9KTQl0
認識させた後どうやって使うつもりなの?
490名無しさん@お腹いっぱい。
垢版 |
2022/04/03(日) 10:55:17.93ID:AGhKdTzD0
読取革命を業務で使ってる人なんていないと思う
そのレベルのOCRだから
2022/04/03(日) 14:38:33.39ID:OgQuX8lP0
まさに革命やな。
2022/04/03(日) 20:05:43.65ID:Jsg5j8K40
そもそも、読取革命みたいなレベルのソフトを法人が使うわけないやろw
2022/04/03(日) 21:08:08.14ID:rMkt3H120
それこそ革命やで。
2022/04/03(日) 22:51:40.78ID:TpRPDKza0
滑り芸か?
2022/04/04(月) 06:49:29.29ID:YzNd9QN20
ごめんなさい。ふざけすぎました。
2022/04/21(木) 20:39:05.61ID:vYl46slD0
streamed高いからなあ
自分で出納帳読み込んで仕訳作成できれば
streamedなんか使う必要ないんだけど
そんな優れた市販のOCRソフトが無いんだよね
2022/04/22(金) 12:05:06.71ID:xT58YArZ0
まあ出納帳Excelで作ればOCR化なんて挟む必要もないんだけどな
2022/04/23(土) 12:38:43.18ID:SDF278rq0
Google の OCR 使いたかったらPDF ファイルを Google ドライブにあげてGoogle ドキュメントで開けばいいと思ってたんだけど文字認識していない
どうすれば使えるんだったっけ?
誰かわかる人教えてください
2022/04/23(土) 12:39:18.96ID:SDF278rq0
この PDF はスキャンしただけの画像です
2022/04/23(土) 13:39:01.77ID:vfksCYOj0
>>498
PDFではやった事ない
自分はPNGでやってる
2022/04/23(土) 15:47:28.78ID:SDF278rq0
>>500
https://support.google.com/drive/answer/176692?hl=ja&;co=GENIE.Platform%3DDesktop

Google の説明では PDF ファイルも文字認識するのでなんだけど
2022/04/23(土) 16:29:35.50ID:SDF278rq0
>>500
498だけそ,1ページだけ抽出してpng形式変換した後,Google ドキュメントで開いたけどやっぱ文字認識してない.
2022/04/23(土) 18:16:25.26ID:vfksCYOj0
>>502
特に問題無くできるけどなあ・・・
ttps://i.imgur.com/ooEoPEj.png
設定見てもOCRを阻害しそうな項目は見当たらないし・・・

ごめん、わからん
2022/04/23(土) 18:33:13.03ID:wmkK3m2e0
ヘルプに書いてあるいくつかの条件は確認してるのですね
2022/04/23(土) 19:28:16.96ID:SDF278rq0
>>503
https://imgur.com/a/pFWtlW7
これなんですがそちらの環境で文字認識しますか?
2022/04/25(月) 21:32:24.29ID:/wxbOJYz0
そういや、読取革命16を買って、ほとんど使ってないわw
修正面倒臭いから
2022/05/05(木) 02:00:37.35ID:MOkzV1Bk0
PDF エレメントプロの OCR はアクロバットのOCRに比べてどうでしょうか
経験がある方がいれば教えてください
2022/05/07(土) 14:36:40.20ID:UgcE4ImC0
国会図書館、OCR処理プログラム及び学習用データセットを公開
https://srad.jp/story/22/05/05/1624259/
2022/05/07(土) 14:41:33.85ID:UgcE4ImC0
モルフォAIソリューションズが国立国会図書館の最新AI技術を活用したOCR処理プログラムの開発を完了
https://www.jiji.com/jc/article?k=000000053.000064140&g=prt
2022/05/09(月) 08:09:09.82ID:zcEHCKRp0
Google の OCR が優秀でもスキャンした画像の上に非表示の文字を載せてくれないので自炊用には使えないと思う。
自分は自炊用にはAcrobat の OCR を使っているけどこれよりも 認識率が高いOCR ってありますか?
2022/05/23(月) 11:27:12.22ID:7qUjQCGH0
読取り革命14を使用しています.PDFに透明テキストで出力していますが,デフォルト(自動)ではフォントサイズが小さくて選択したときに表示文字列よりも小さくななります.
メニューの「結果」で領域ごとの設定できますが300頁の専門書の自炊では領域ごとの設定ですと手間がかかりすぎます.

手動でPDFに出力する透明テキストのフォントサイズを全ページ一括で変更したいのですが,そのような設定は可能でしょうか.
2022/05/23(月) 17:39:34.25ID:AEOqr8aw0
読取革命はマジで使えない
あれはめちゃくちゃ評判悪いぞ
2022/05/23(月) 20:52:29.86ID:7qUjQCGH0
>>512
お言葉ですけど自分はスキャナー 添付の OCR ソフト、アクロバット 添付の OCR ソフト、Google の OCR ソフト、e.Typist、本格読み取りなども全部試して縦書きのアルファベット 混在、図表混在のOCR 認識は読取革命が群を抜いてるという結論に落ち着きました。読取革命の強みは1ページを領域ごとに認識方法をカスタマイズできることです。読取革命 の評価が低い人はマニュアルが分かりにくいためにおまかせ設定だけで使って性能を100%引き出してないのだと思います。

私の質問の解決方法が見つかればほぼ完璧です。
2022/05/23(月) 21:03:06.42ID:7ETshV7p0
スキャンスナップとどっちがいい?
2022/05/23(月) 21:03:45.14ID:AEOqr8aw0
あれは、手直しに手間暇がかかりすぎて使えないという評価が定着してるのだが
文字だけならともかく、図表や表に記入された文字などの読み取りはまったくダメダメで手直しに苦労する
2022/05/23(月) 21:24:15.81ID:7qUjQCGH0
>>514
ScanSnap は試したことがないので分かりません
2022/05/23(月) 21:29:16.10ID:7qUjQCGH0
>>515
領域に分けてそれぞれずっとか表とか横書き縦書きとか指定すればかなり認識精度は高いです。簡単認識設定で標準の領域設定を使い、図表が混在しているページだけ手で領域を複数に分割して設定すれば割合効率的にできます。自動レイアウト機能で認識させるとおっしゃるように手直しが大変ですね。

他のソフトは読取革命臍のカスタマイズの機能がないので縦書きのアルファベット図表混在は使い物になりませんでした

横書きの英語はアクロバットが一番いいです
Google のは認識はいいのですがレイアウトがぐちゃぐちゃになるのと元の PDF の上に非透明テキストを重ねる機能がないのでつかえないです
2022/05/24(火) 00:11:00.61ID:nP066gSa0
>>517
そんなことしてられんわ
メンくさい
2022/05/24(火) 00:54:53.66ID:cADfl0Dk0
>>518
だから君には無理なの
2022/05/24(火) 10:52:15.53ID:nP066gSa0
>>519
そんなんだから読取革命は顧客が離れてるのに
バカだねぇ、あんたもw
2022/05/24(火) 13:35:33.40ID:cADfl0Dk0
>>520
顧客が離れてるのは事実だと思うが、顧客離れとソフトの可能な事は同じじゃない。

縦書き、アルファベット混在、図表混在という条件で認識率の高い別のソフトがあげることができるか?
できたらあなたの意見を認めよう
2022/05/24(火) 13:59:59.00ID:KekWsjEY0
横だけど、OCRソフトってのはできる限り修正の必要がないものでないと実用的ではない
俺は読取革命を使ってみたことがあるが、図表混在の文字の修正がハンパなく手間だった
もうスクショでいいわって思った
2022/05/24(火) 14:41:38.54ID:cADfl0Dk0
>>522

> 横だけど、OCRソフトってのはできる限り修正の必要がないものでないと実用的ではない
→それは 使用目的によるんじゃない。めんどくさいならスクショ でもいいや、という目的ならあなたの言う通りだろ。
自分の場合は絶対に文字起こし が必要なんで読取革命程度の手間だったらOCR を使う。と言うか それ以外に選択肢がない。

> 俺は読取革命を使ってみたことがあるが、図表混在の文字の修正がハンパなく手間だった
→ちゃんと複数の領域を設定して、各領域毎に最適な属性設定やった?

ぶっちゃけた話、読取革命はマニュアルが使いにくいんで俺も6~7年前に紙のカード明細のExcel への取り込みようにひと月ほど集中的に使ってからはずっと使わんかった。

昨年から専門書の自炊始めたんだけどAcrobat の OCR で十分だと思ってた。
だけど透明のテキスト 文字をコピペして使わなきゃいけない事情になって誤認識の多さに閉口した。それで色々調べて読取革命の性能 引き出す使い方を紹介しているネットの記事を見てこういう風に使うのかというのがわかった。
2022/05/24(火) 15:35:09.82ID:aJH4exft0
目指すところが違うんだろうな

完璧なテキスト化を目指すためには多少の手間は惜しまないか
少しでも手間をかけるくらいなら完璧とまではいかなくてもいいか
2022/05/24(火) 16:03:36.35ID:cADfl0Dk0
透明のテキスト 文字をコピペして使うことが必須なんで、認識用設定時に手間を惜しんでコピーした後に修正に手間をかけるか、それとも認識用設定に手間をかけてコピペした後は修正なしにできるかの選択。認識用の設定の手間というのもそんなに大したことない。
2022/05/24(火) 16:50:45.74ID:5b9IkS690
>多少の手間は惜しまないか

多少なんてもんじゃないのがミソなw
まぁ暇人には使えるソフトってことでしょ
2022/05/24(火) 17:56:05.13ID:cADfl0Dk0
>>526
暇?
暇ではないぞ、仕事で使ってるから

君は漫画小僧だな
2022/05/24(火) 18:35:40.13ID:aJH4exft0
論理的合理的思考ができるかどうかだな
2022/05/24(火) 19:47:58.91ID:5b9IkS690
それができない奴が使うんだろうな
2022/05/24(火) 20:10:20.97ID:cADfl0Dk0
>>529
プッ、君が出来てないよ
2022/05/24(火) 22:01:22.15ID:uwTIOOOb0
ID:cADfl0Dk0
こいつ、朝から晩まで張り付いてるみたいだけど単なるキチガイか?
プっとか言ってるけど、オツムやられてるっぽいw
2022/05/24(火) 23:54:55.53ID:cADfl0Dk0
>>531
朝じゃないよ,昼からだよ(笑)
2022/05/25(水) 07:20:56.84ID:W3iKtSQ90
どっちでもいいけど、頭おかしい自覚はしておいた方が 笑
2022/05/25(水) 10:29:01.39ID:wWoQec/h0
ID:5b9IkS690、uwTIOOOb0、W3iKtSQ90
こいつらは悪口しか言えないやつだな。

社会問題になってる、ネットで攻撃衝動を発散するしかない御可哀想な奴らだ(笑)
2022/05/25(水) 11:57:42.04ID:i/AJgx3d0
どっちもバレバレだよ
2022/05/25(水) 13:13:20.52ID:f5GblV+t0
>>534
性格悪そう
2022/05/25(水) 13:14:26.95ID:3nRqErRs0
>>511
で、
>手動でPDFに出力する透明テキストのフォントサイズを全ページ一括で変更したいのですが,そのような設定は可能でしょうか.
は解決したの??
2022/05/25(水) 13:17:26.16ID:wWoQec/h0
>>537
してません(:_;)
悪口書き込むやつと、それへのレスだけです。
トホホですね(´;ω;`)
2022/05/29(日) 09:17:29.01ID:dezXzM1d0
これが革命って奴やな。
2022/05/29(日) 13:00:28.66ID:qWf9pQE10
革命詐欺w
2022/06/01(水) 12:57:24.87ID:ktMvq3Ub0
511です。
バージョン16にアップデートするとフォントサイズが小さすぎる問題は解決していました。表示上のサイズと透明テキストのサイズはほぼ一致してます。
2022/06/18(土) 20:26:54.16ID:2jCbEwjL0
>>497
そりゃ当たり前
PCなんて使えない高齢者がいっぱいいるんだから
そのためのOCRだよ
2022/06/19(日) 06:08:07.29ID:nQI82VN80
手書きを補正してあってんのかあってないのかわかんないデータが完成するより普通に入力した方が早いと思う
2022/06/19(日) 08:00:38.74ID:SMFRVfVR0
普通に入力してもtypoはあるし
校正抜けは自分で入力したもののほうが起こりやすいという罠もある
545名無しさん@お腹いっぱい。
垢版 |
2022/06/22(水) 20:32:48.05ID:aWOqOAmW0
仕事で手書きの帳票の入力をしているのでOCRを使って自動化したく、いくつか無理のものを試してみたのですが上手くいきませんでした
入力内容は型番と数字だけなので、型番の登録とかができれば精度も上がると考えているのですが、いいOCRツールがあれば教えてください
2022/06/22(水) 22:38:51.44ID:cbR9tsx10
ないんだな、これが(画像略)
ほんとにみんなそれを欲しがってると思うよ
2022/06/23(木) 07:46:57.82ID:F2BXam9K0
>>545
>>479 のリンク先はみた?
2022/06/25(土) 00:23:31.70ID:M5gx6zVR0
>>545
ソリューションとして何百万円で売ってるようなものだからなあ。
549名無しさん@お腹いっぱい。
垢版 |
2022/06/25(土) 03:38:17.30ID:0PVpsHFx0
>>545
手書き文字は、かなり難易度が高い。
字体に個人差が大きいのと、文字ごとの区切りが取りづらい
型番がアルファベットなら、学習データを用意すれば可能性はあるけど、
本質的に1とかIとかlを手書き文字から読み取るのは無理ゲーなので
近い登録型番を引っぱってくるとかの方がよさそう。
2022/06/25(土) 11:36:36.59ID:XawCiBfQ0
達筆こと汚い殴り書きすら判読できるOCRキボンヌ
2022/06/26(日) 00:59:41.69ID:u0oZCNU/0
20年くらい前に
東芝が郵便局に納入してる手書き宛名OCRが有能という話聞いたのを思い出したので
ぐぐてみたらこんなのでてきた
www.it-innovation.c
o.jp/wordpress/wp-content/uploads/2021/08/Session6_AAcon2_2021
0827_tdslj.pdf
手書き「IOデータ」がエロデータに変換される恐怖・・・
2022/06/26(日) 13:06:43.52ID:MrxyXubs0
郵便局でバイトしてたときの、宛名OCRの精度の感覚は
フォントだと100%、手書きで95%くらい当たってた
手書きだと3-10とかを漢数字で縦書きされると辛い様子(三が12と見分け付かない)
あと、達筆は無理なので弾かれてたな
553名無しさん@お腹いっぱい。
垢版 |
2022/08/06(土) 23:14:15.46ID:KxBYYb3L0
>>479 の後半部分がだいぶ進んだ
https://i.imgur.com/W5JwUh8.png

もうちょい1とかが認識できるといいんだけど
2022/11/11(金) 16:50:50.83ID:wJwec+Hh0
ユーザーローカルの無償のOCRはどうですか?
2022/11/11(金) 18:04:01.27ID:rp6GMXxX0
手書き文字をgoogle driveにアップしてドキュメントに変換するとOCRされる
わりと認識されるようだ
556名無しさん@お腹いっぱい。
垢版 |
2022/11/16(水) 01:13:33.38ID:S5so+53A0
凸版印刷、明治期から昭和初期の手書き文字を
解読するAI-OCRを日本で初めて開発
https://www.toppan.co.jp/news/2022/11/newsrelease221111.html
https://www.toppan.co.jp/news/2022/11/sto3as000000876e-img/TOPPAN_221111_img1.jpg
2022/11/26(土) 08:06:32.03ID:D8kis3AF0
>>556
どうせソリューションで1000万円以上
558名無しさん@お腹いっぱい。
垢版 |
2022/12/22(木) 04:52:11.23ID:D7BYsnDs0
OCRかけたPDFで、Googleドライブで閲覧するときは、文字選択も検索もできるんだけど、ドライブから他のiPadアプリへインポートすると、文字選択も検索もできなくなります。

対応策知ってる方いたら教えてもらえないでしょうか。
559名無しさん@お腹いっぱい。
垢版 |
2022/12/25(日) 14:05:23.99ID:UNDWLpRR0
バージョンが違うとかじゃね?
2023/01/05(木) 23:31:26.85ID:/v8QR8d30
>>508
https://twitter.com/NDLJP/status/1610557944952946688
NDLOCRについては国立国会図書館月報2022年11月号の特集記事でも紹介しています。
https://twitter.com/5chan_nel (5ch newer account)
2023/01/08(日) 20:04:39.43ID:5uNVO8JT0
スマホのグーグルレンズだとかなり正確なのに
PCの画像取り込みでグーグルドキュメントだとまったく認識できないのはなぜかわかりますか?
2023/01/09(月) 20:16:16.65ID:2gSKg0450
>>560
>>508
自炊技術総合スレでこれに関していろんな人が議論しているけど、結局外部の人間が使いこなすのは至難であると言う状況
日本の it 開発に関する公金の使い方は最悪
2023/01/09(月) 20:31:05.78ID:+xJlSjJo0
余計なGUI作っで金と取るより、遥かにいいよ。
Python あれば コマンドラインで動くんでしょ。
十分だよ。
2023/01/09(月) 20:47:53.13ID:2gSKg0450
>>563
Python でも動かし方がわからないみたいよ

動かし方であーだこーだ時間を使うよりは有料でも使いやすいインターフェースがあった方がいい
こういうのは所詮道具だから
2023/01/11(水) 20:40:11.59ID:RZPLrb1r0
規制された?
566名無しさん@お腹いっぱい。
垢版 |
2023/01/15(日) 15:43:45.29ID:d/Jt3FpO0
>>561
多分AIチップの有無
2023/01/16(月) 10:13:41.53ID:ARaKc39v0
制限された?
2023/01/17(火) 08:02:43.09ID:JLVUHZYJ0
制限きつくなった
2023/01/19(木) 20:26:45.79ID:WqtzRSbq0
TEST
570名無しさん@お腹いっぱい。
垢版 |
2023/01/21(土) 01:51:12.94ID:OCOnSa520
>>561
スマホのカメラのレンズは顔認識にはじまり、そのレンズ通して画像(映像)からフォントやらワンタップで楽々と認識+特定できるようになるかもしれない。
既にある気もするけど。googleとかやりそうだし。
AIと言うと、KRITA Paintって無料(フリーウェア)のペイントアプリで超簡単お手軽に消したい任意の人や車をこの画像みたいに消せるのがなんだかすごい。
コラージュには欠かせないツールかもしれない。
https://i.imgur.com/HPssPV5.png
GIGAZINEで知った。
2023/01/23(月) 09:06:58.16ID:IEgo6gO30
test
2023/01/23(月) 18:07:45.55ID:uTX11U8P0
非破壊型ScanSnapに添付のソフトでPDFに透明テキストを付けていたが性能が悪いので
読取革命の体験版を入手して試してみた
テキストは大体正しく読み取れているが不満点2つ
・ページの枠等でゴミ文字が大量に発生
・元のPDFの画像を再エンコしてしまっている
2023/01/23(月) 20:37:55.46ID:uDMkpynR0
>>572


> ・ページの枠等でゴミ文字が大量に発生
たぶんページ番号とか上の方にある見出しとかを言ってると思うんだけど本文だけを領域に指定したテンプレートを使って、それを簡単認識という一種のマクロで読み込ませればいい

> ・元のPDFの画像を再エンコしてしまっている
これは何とかしてほしいよね
2023/01/24(火) 14:53:20.86ID:pgLtZU8s0
レスありがとうございます。「簡単認識」というのは何ですか?
読取革命15の体験版を使っています
2023/01/24(火) 14:55:11.57ID:pgLtZU8s0
読取革命15の体験版を使ってみて不具合と思うこと

1. 複数のjpgをいれたフォルダーを用意する
2. 「画像ファイルを開く」でそのフォルダーを指定して「画像ファイルを追加して読み込む」に
チェックを付けた上でCtrl+Aで全ファイルを選択して開く
3. 複数ページとして読み込まれる
4. ところが「レイアウト」も「認識」も「保存」も最後のページしか処理できない

現行バージョン16ではどうですか?
2023/01/24(火) 20:12:23.68ID:JDh+ktVS0
ちょっと何言ってるかわからない
2023/01/24(火) 20:24:39.65ID:pgLtZU8s0
では逆に質問させてもらえますか
1ページが1つのjpgで、ファイル名に連番ついているものが多数ある場合
それらをまとめて読み込んでまとめてOCR処理することはできますか
■ このスレッドは過去ログ倉庫に格納されています
16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面

ニューススポーツなんでも実況