【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net

■ このスレッドは過去ログ倉庫に格納されています
2016/08/09(火) 21:24:11.61ID:zXdCMkkb0
光学文字認識(こうがくもじ にんしき、Optical character recognition)ソフト
2021/05/20(木) 08:30:39.20ID:4Fq3eRUr0
OCRとQRは別物だし完全にスレ違いなんだが

あえてツッコむとそれカメラがタコなだけだからスマホ変えたほうがいいよ
QRの規格に文句言うのは筋違い
2021/05/26(水) 00:13:19.62ID:kuNfd1Ht0
ガソリンスタンドのセルフ給油機を客が交換するってのはどういう発送なんだろうか?
2021/05/28(金) 12:05:47.29ID:P2WCflXp0
2000冊分くらいのpdfファイルがあり OCR済みのものとしていないものが混ざっています。これをまとめてOCRしたいのですが安くあげるにはどうしたらいいですか。
バンドル版のacrobatXはこういう目的に使えますか。
https://m.qoo10.jp/item/%E3%82%A2%E3%82%AF%E3%83%AD%E3%83%90%E3%83%83%E3%83%88-ADOBE-ACROBAT-X-10-STANDARD-%E3%83%90%E3%83%B3%E3%83%89%E3%83%AB%E7%89%88/601688005
2021/06/18(金) 13:05:44.71ID:y51nqA8T0
官報を機械可読で公開してくれ
2021/07/10(土) 11:32:58.13ID:oCPigeEQ0
Abbyy FineReader15 が7,980円
今日が最終日だよ〜♪

https://www.sourcenext.com/cp/s/2107/c_0000055494/?i=ecgt
2021/07/17(土) 20:46:01.69ID:Nx+D16Ts0
Windows 10上で無料利用できるAI-OCR 認識精度は95% 認識枚数は制限なし
https://ledge.ai/seagp-ai-jimy-ocr/
326名無しさん@お腹いっぱい。
垢版 |
2021/07/18(日) 02:32:22.76ID:oQLnYNbx0
>>325
認識率95%ってそんなに凄いの。今使ってるの Acrobat の OCR で困ったことないんだけど、それよりもすごいのかな。
2021/07/18(日) 09:04:36.93ID:lnw1fm580
> ※ 認識精度は数字に関するもので、条件で左右されます。
数字だけに限定してさえ100文字中5文字は間違うってことでしょ
手書き認識も含むから活字だけならもっと認識率上がるのかも知らんけど
2021/07/18(日) 09:15:41.36ID:P3XK5s350
>>326
まじ?
どういう条件で読んでんの?
2021/07/18(日) 16:32:03.31ID:8SefTmjA0
無償OCRか。この企業、どうやってマネタイズするんだろ
情報抜いて横流しするのかな
2021/07/19(月) 01:07:30.29ID:F9XeLcaj0
>>325
試してみた。インストールにすごく時間かかった。
説明がなくて使いにくい。
認識実行すると文字化けの出力結果。
これは暇な人が色々試して遊ぶソフトと思った。
即、アンインストールした。
2021/07/19(月) 05:34:45.46ID:fvfQWF3L0
AIって自主学習して精度上がる問じゃないのん?
332名無しさん@お腹いっぱい。
垢版 |
2021/07/19(月) 07:58:50.76ID:F9XeLcaj0
全ての文字が文字化けだから。コードを選ばなきゃいけないのかね。
自己学習をしなくてもある程度の精度が出なきゃ学習のための動力が大変だよ。
2021/07/19(月) 08:28:19.56ID:fvfQWF3L0
全てとなるともう根本的に対応してないのか…?
334名無しさん@お腹いっぱい。
垢版 |
2021/07/19(月) 10:34:39.69ID:F9XeLcaj0
インストールして試してください。約1 GB のアプリです。もしかしたら私の使い方が根本的に間違ってるのかもしれない。
2021/07/19(月) 16:42:09.54ID:3A2XjCut0
アクセス集中で大変だったりして
2021/07/19(月) 21:27:30.10ID:8sS8G9mf0
アカウント作れがうざすぎ
2021/07/19(月) 23:38:16.48ID:DpU5b5C20
やっぱり情報抜く系みたいだな
やめとき
2021/07/20(火) 01:05:44.37ID:LR2/vrCo0
きっと背後に中国がいるぞ
339名無しさん@お腹いっぱい。
垢版 |
2021/07/21(水) 01:43:25.56ID:qQ5Ez8Mv0
本を見開きでスキャンしたらできる本の周りの影と真ん中の影を消すソフトないでしょうか?どちらか一つでもいいです。
2021/07/21(水) 09:17:53.10ID:9Y2uwqlR0
マルチ乙
2021/07/21(水) 09:18:19.15ID:gZhpeJ+z0
さらに歪曲まで修正するのがあったような
342名無しさん@お腹いっぱい。
垢版 |
2021/07/21(水) 13:02:55.40ID:qQ5Ez8Mv0
>>341
是非教えてください
343名無しさん@お腹いっぱい。
垢版 |
2021/07/21(水) 13:04:34.65ID:qQ5Ez8Mv0
自分で調べたけど発見できませんでした。
念のためですがスキャン自体は Acrobat の スキャン機能 を使ってます。スキャン後の PDF の影を取るソフトです。
2021/07/21(水) 13:07:50.05ID:gZhpeJ+z0
OCR機能は無い
2021/07/21(水) 13:12:00.06ID:9Y2uwqlR0
マルチ乙
346名無しさん@お腹いっぱい。
垢版 |
2021/07/22(木) 16:50:26.47ID:fGMCvnhV0
スマホのOCR、ピントが固定になるようにして使ってるけど
たまに下敷きの量が変わって距離がわずか数ミリずれるだけで認識精度50%とかになる。
レシートがしっかり幅いっぱいになるようにして撮影しなおすと95%くらい認識する。
影ができると精度かなり落ちるから今はスマホのライトOnで撮影している。
2021/07/23(金) 11:27:10.26ID:rD1VLEV50
読取革命DL版セールしてんね 
2021/07/23(金) 14:20:26.16ID:xlv839tH0
まま?
2021/07/23(金) 14:33:46.10ID:8RLvQ8nD0
まままーままーまま
350名無しさん@お腹いっぱい。
垢版 |
2021/07/23(金) 18:30:19.88ID:KFQ0x8UC0
読取革命で認識させると文字が少し小さくなるのは何でかな
351名無しさん@お腹いっぱい。
垢版 |
2021/07/29(木) 10:14:59.19ID:0JzdyqZz0
Capture2Text使っていて、>>158 と同じ症状。
どなたか、詳しい人はいませんか?
GUIだと認識できる日本語が、CLIだと化けて出力される。
英語や数字の認識には差異は無さそう。
352名無しさん@お腹いっぱい。
垢版 |
2021/07/31(土) 21:04:10.52ID:3gNkzigk0
https://qiita.com/user0/items/a9116acc7bd7b70ecfb0

PowerShell で CMD と入力してコマンド実行してもいいかも。
353351
垢版 |
2021/08/01(日) 12:17:19.04ID:EKgADGMN0
>>352
ありがとうございます! お陰様で、解決できました。

コマンドプロンプトからの動作は chcp 65001 で改善したのですが、
実は、UWSCのDOSCMD関数から叩きたくて、これは、何をやっても解決しませんでした。
(レジストリでAutoRun弄ってもダメ)

UWSCにはPOWERSHELL関数もあって、そちらからは文字化けせずに取得することができました。
2021/08/03(火) 18:25:28.98ID:1yBwwluW0
スキャンで作成したPDFをOCRで文字認識させました。
表示されている文字で検索してもヒットしませんでした。
当該文字をコピーしてテキストファイルに貼り付けると別の文字になっていました。

OCRに詳しくないので教えてほしいのですが
1、認識後の文字はもとの文字の上に透明のフォントで重ねているのでしょうか?
2.今は、グラフの線が白黒だと判別できないのグレースケールで600DPIでスキャンしています
(300DPIだと文字の周りがにじむので)。認識率を向上させるために注意する設定項目があれば教えて下さい。
355名無しさん@お腹いっぱい。
垢版 |
2021/08/07(土) 08:52:19.64ID:rqbKqC/20
>>354
僕はプリンタ付属のOCRでスキャンしてますが、600dpiより300dpiのグレーが認識率高いです。
文字がにじんだ方が線が分離しなくなるので機械には読み取りやすくなるようです。
僕は数字の表だけ読み取れればいいんで英数で読み取って数字以外は捨ててます。
矩形でタブを入れ、空白を置換で削除することでExcelでも表として認識できます。

昨日は1ページスキャンして1文字だけ認識してませんでした。
もしかすると、矩形の空白を削除するときにその数字だけはみ出していて削除してしまったのかもしれません。
元が英数ならいいんですが、日本語の文字化けでずれが大きくなるので。

ブラザーの複合機ですが、新しいアプリより ControlCenter4 のOCRの方が使いやすかったです。

PDFの方は詳しくありませんが、PDFにはレイヤ機能があって重ね合わせが出来ます。
WORDでもハガキのイメージに合わせて郵便番号や宛先など配置できますよね。
文字が正しく読み取れなかったとしても、その化けた文字が配置されるので検索では本来の文字は出てこないでしょうね。
356名無しさん@お腹いっぱい。
垢版 |
2021/08/07(土) 12:24:46.27ID:iSVP+I520
>>355
コメントありがとうございます。
私もブラザーのプリンターを使ってます。ブラザーの OCR ソフトは使い方がよくわからなかったので日本語の縦書きの認識もそこそこ良かったAcrobat の OCR を使うようになりました。

300 DPI の方が認識率が高いというのは新発見です。
2021/08/08(日) 10:01:09.25ID:kyf68uXo0
スキャンした画像をChainLPなどの画像処理ソフトで下処理してからOCRに掛ける
358名無しさん@お腹いっぱい。
垢版 |
2021/08/08(日) 13:44:29.33ID:7AjcYiKn0
>>357
汚れてもないしトリミングの必要もない場合でも CHAIN LP で何かをすれば認識率は上がりますか?
上がる場合はchainLP のどの項目を使えば良いか教えていただけますか
2021/08/08(日) 19:14:09.75ID:0wTn0qmR0
自分で仕組、理屈を考えてみろよ
2021/08/08(日) 20:38:22.55ID:IfVfnYiT0
OCR前にソフト側で2値画像に変換されてしまうし
事前補正はあんまり意味ないよ
画像をどうこうするよりOCRソフトのユーザー辞書学習カスタマイズして
パターン登録するほうが効果は高い
361名無しさん@お腹いっぱい。
垢版 |
2021/08/09(月) 01:03:41.06ID:oBYKB49n0
>>360
なるほど、そうなんですね。
362名無しさん@お腹いっぱい。
垢版 |
2021/08/09(月) 09:41:20.64ID:a4Sxnc9w0
chainLPで検索したら漫画は16階調が一般的で一括変換出来るツールだと出て来た。
僕が16階調に加工するとき、画像の濃さを細かく調整しないとあちこち消えてなくなる現象があった。
少なくとも256階調はないとOCRには向かない。

256階調のままで600dpiを300dpiにしてくれるなら認識率が上がるかもしれない。
・・・そう言うツールではないようですね。

> V0.37-3
> ChainLPでは、画像を1ピクセルあたり1ポイントとしてPDFに配置します。つまり72dpiです。
> よって、出力サイズとして600×800ピクセルを設定した場合は、PDFのページサイズは約8.3×11.1インチとなります。
> これは、ほぼA4サイズに近い大きさです。

> ChainLP v0.38-2
> ・元画像の解像度(dpi)を引き継ぐようにしました。しかし、あまり意味はないと思います。


https://lifehack-lab.com/chainlp_set1/
> Kindle PaperWhiteで自炊本を読む場合、PDFそのままでは非常に読みにくいです。
> mobiというファイル形式に変換してあげるととても読みやすくなります。
> そこで登場するのが、「ChainLP」というソフトです。
> 各種ファイルに変換できるのですが、画像の補正、トリミングが同時にできるので、Kindle用のmobiファイルをつくるのには重宝します。

> どうやってもきれいにならない場合は、別のツールを試してみましょう。
> >こちらのページを参考に(Xnconvertというソフトです)
> Xnconvertできれいにしてから、ChainLPに再挑戦してください。

> XnConvert. 画像のリサイズやフォーマット変換からフィルタ加工まで一括処理
2021/08/09(月) 10:23:52.59ID:OqeDcUJs0
色々勘違いしてそうだけどChainLPでも256階調出力は可能
つってもそれだけのためにChainLP使うよりRalphaとかの方が楽だけど

あともし漫画をOCRしようとしてるなら諦めたほうがいい
capture2textみたいにフキダシ抽出の機能のあるアプリか
GCV系のAI型じゃないとほぼほぼ無理
2021/08/09(月) 19:56:02.71ID:V0NxvfPM0
>>360
実際やってみたの?
俺は効果ありまくったから毎回下処理してるよ
2021/08/09(月) 20:52:04.70ID:dAASpWa80
ドキュメントスキャナの類だとある程度スキャナドライバ側で補正かけられてるから
いうほど効果ない場合もある
機種や設定次第

ノイズの多いスキャン画像なら補正も有効だけど
設定のわかりにくいCainLPより一括処理できる画像ソフトのほうが
シンプルに分かりやすいんではないかとは思う
366名無しさん@お腹いっぱい。
垢版 |
2021/08/10(火) 00:19:46.38ID:9pRWSzRN0
>>364
具体的にどんな元原稿に対してどんな効果があったか言ってくれないと効果ありありと言われてもね。
2021/08/12(木) 19:07:27.37ID:M3IwL1EP0
フリーで優れたocrソフトってありますか?
用途は、アマゾンキンドルで実用書読んでるんですけど、
参考になった部分をスクショで撮ってそれをocrで文字起こし、メモ帳にまとめる
ってことがしたいです
2021/08/12(木) 19:17:55.60ID:W1e/W8C/0
>>367
>211
https://twitter.com/shira_t22/status/1348264731610529794?s=19
https://twitter.com/5chan_nel (5ch newer account)
2021/08/12(木) 19:23:21.80ID:W1e/W8C/0
ああごめん翻訳いらなくてスクショ起こしだけならCopyfishでいいんじゃない?
ブラウザ拡張だけどデスクトップのキャプチャもできたはず
370名無しさん@お腹いっぱい。
垢版 |
2021/08/22(日) 12:15:30.21ID:InGHoZ6h0
衝撃…世界が馬鹿にした日本のFAX、実は米国でもコロナ報告で普通に使っていた
https://president.jp/articles/-/37491?page=3
> 北見工業大学教授で公衆衛生分野の情報化に詳しい奥村貴史氏が同サイトに寄稿にした記事によると、

> 同氏からの改善につながる提言に、「OCR(光学文字認識、活字を文字コードに変換するソフト)処理を前提としたフォーマットをFAXで扱う」というものがあります。
> これなら、FAXによる一元的管理機能を担保しつつ、
> アナログでデータを受信しても、
> OCRスキャンすれば直ちにデジタル化できますから、
> 入力する現場の手間を減らすことができます。

OCRでレシートや売上表読み取りしてる身からすると、
数字ですら完全には読み取れないのに
どうしてFAXなんかで送った人名を読み取れるんだと。
せめてQRコード化して送れよと。

工業大学の教授ですらこの程度の事が分からないんだな。
2021/08/23(月) 11:49:45.91ID:OlmLkjoZ0
いまだにFAXを使うしかない事情として
> 医療機関、自治体、保健所など複数の関係者で共通のシステムを整える必要があり、そのためには膨大なコストと時間がかかる
つってるのにQRコード化して送れとか無理でしょ


> 数字ですら完全には読み取れないのに
> どうしてFAXなんかで送った人名を読み取れるんだと。
そこはフォントの種類とサイズ次第じゃない?

FAX機が吐き出した紙をスキャンしてOCRかけるイメージなのかも知らんけど
FAX受信した複合機でそのままFax TIFFとして保存すれば
FAX形式データってほぼ G3 FAX(200x200dpi)だから200dpiの白黒データとして確保できる
200dpiあればOCR性能は充分という説もあるし
(それだけあれば完璧にOCRできるということではなく、
それ以上にしてもOCR精度の向上は望めないという意味)

カラーやグレスケでスキャンしてもOCR時は内部的に2値に変換してから処理することになるので
スキャン時に白黒(2値)を選ぶのはコスト減らすためにはあり
保存フォーマットは大体勝手にFax TIFFになるので
> 「OCR(光学文字認識、活字を文字コードに変換するソフト)処理を前提としたフォーマットをFAXで扱う」
というのも正しい
372名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 15:49:32.12ID:fGb2UNbz0
>>371
そんな反論は予想通り。

OCRできるんなら送る側が自分でOCRしてQRコードを追加で印字すればいいだろ。

パソコンから直接FAXと電話回線に繋げて送るんなら精度は高いかもしれんが、
一回印刷してからFAXに入れるんなら、読み取るときに字がくずれるしゴミも読み取ってしまう。

仮に直接FAXと電話回線に繋げてたとしても、送信に成功したかどうかってすぐわかるの?
送ったかどうかって履歴に残るの?
PDFに印刷してからメールに添付して送れば履歴残るし
PDFを印刷してスキャンしてOCRもできるし
PDFからOCRできるし
PDFのフォントと文字コードがそのまま使えて検索までできちゃうんですけど?

そもそもFAXと聞いて手書きを想定してない時点でダメだけどね。
373名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 15:54:44.90ID:fGb2UNbz0
・QRコードをFAXで送る方法
・PDFファイルをメールで送る方法

この2つだとシステムが専用だとQRコードは難しいかもしれんが
Windows使ってるならPDF印刷は標準機能だから簡単に追加できると思うよ。

そして役所は基本的にメールでやり取りしてる。相手がFAXしか使えないならFAXも使ってるけど。

コロナ補助金申請したけどExcelのファイルをメールでやり取りしたよ。
印刷した奴も郵送したけど。
郵送した理由は「印鑑がないと正式な書類にならないから。」
ようするに技術的な理由じゃなくてルールの問題なんだよ。
2021/08/23(月) 19:28:55.86ID:OlmLkjoZ0
>>372
FAX使ったことない人か
送信の成功失敗は履歴から分かる
普通のFAX機なら失敗しても3回なり5回なりの時間置いてリトライする機能も付いてる

現状でFAX廃止できない状況だからそれを活用しましょうってことで
FAX以外は受け付けませんってことではないでしょ
PDFながせるそれでいいだろうしメールはだめですとも書いてない

各関係団体はそれぞれの基幹システムやデータベースで既に管理してるが
そこから出力できる形式にはだいたい制限があるし書式もフォーマットもバラバラ
お役所仕事のようにExcelのこのフォーマット以外はだめです、
送信のためにもう一度体裁整えて新たに入力して下さいとかやってる暇がないので
エクスポートや印刷で出せるものをそのまま流してもらうしかないのがおそらく今の現状

アナログで対応するというのは、そこはそのまま送り手に負担を強いず
どんな書類が来ても受け側で自動でどうにかできるすげえ力技システム組んじゃいましょうってことで
FAXで受けるなら手書き書類も考慮してるだろうし
(手書きOCRの実用性はググればまあまあ出てくる)
リソースは当然必要だろうけど大学ならAI OCR研究やってるとこと提携して
市販の既成OCRソフトとは規模の違う精度のものが組めるアテがあるのかもしれん
375名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 20:18:25.89ID:CYyOePzH0
>>374
> (手書きOCRの実用性はググればまあまあ出てくる)
> リソースは当然必要だろうけど大学ならAI OCR研究やってるとこと提携して
> 市販の既成OCRソフトとは規模の違う精度のものが組めるアテがあるのかもしれん

馬鹿だろお前。
大学の無能教授と無能学生になにが作れると思ってんだ?

作ることが可能ならとっくの昔に存在してるし、
今存在してないならこれから先も作ることは不可能なんだよ。
作れる人間が生まれてくるまではな。
2021/08/23(月) 21:54:40.53ID:YrGASWyP0
うるせえ
よそでやれ
2021/08/23(月) 22:10:01.75ID:OlmLkjoZ0
FAXに続きスマホも使ったことない人なのか
https://i.imgur.com/gyeNbob.jpg

googleのこのOCRエンジンがGCV登録すればAPIで使えるので
個人でも高精度OCRアプリが作れる時代ですよ

お金出せば使えるそこそこ運用実績のあるシステムもググれば出てくる
(存在してる)
https://www.tegaki.ai/
2021/08/23(月) 22:12:17.86ID:OlmLkjoZ0
あっ紙に書いたID 自分のじゃないやん間違えちゃった
痛恨のヒューマンエラー
379名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 22:46:53.84ID:CYyOePzH0
俺はGoogle検索しただけで50万円請求されたからね。Googleから。2回ほど。
馬鹿は50万でも一千万でも請求されてろ。
380名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 22:53:28.53ID:CYyOePzH0
> Cloud Vision API には画像解析のための各種機能があります。どの場合でも、ご利用いただいた分だけお支払いいただきます。最低料金などは設定されていません。

> TEXT_DETECTION 画像内のテキストに対して光学式文字認識(OCR)を実行します。

> 1,001〜5,000,000 ユニット/月
> テキスト検出 $1.50

あら、お安い。
> 1,000 ユニットあたりの料金

5,000,000 ユニットの料金は$7,500
381名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 22:54:59.36ID:CYyOePzH0
日本円だと82万円だね。お安いね。
2021/08/24(火) 08:18:42.85ID:6FahnTPL0
50万2回請求ってw
規約も読まずにOCRしまくっちゃったの?

> 日本円だと82万円だね。お安いね。
500万ユニットが月に処理する回数として妥当値なのか知らんけど
運用費用としてはありなんじゃないの
日本中のコロナデータ集積して人力入力させてる人件費を考えたら
383名無しさん@お腹いっぱい。
垢版 |
2021/08/24(火) 09:19:52.10ID:NY7D9FCw0
>>382
>Google検索しただけで

字も読めないほど耄碌したの?

OCRする人件費がないから日本中の自治体でワクチンの発注ができなくなったのを忘れたの?
2021/08/24(火) 09:58:03.25ID:6FahnTPL0
人に説明するの下手な人か
今更だが触っちゃいけないタイプだったな
ゴメンな?独り言の邪魔しちゃって
385名無しさん@お腹いっぱい。
垢版 |
2021/08/24(火) 12:44:38.28ID:NY7D9FCw0
>>384
「Google検索しただけで」では説明が下手ですか。

Google検索を一日中繰り返していたらブラウザに請求書が表示されてそれが50万円で請求者はGoogleとなっていました。
チャットで交渉出来たので支払いは免れましたが、「今後このようなことがあれば業務利用とみなし、契約を結んでもらいます。」との事。

業務でGoogleの機能を使えば毎月80万円程度のお金がかかることは >>377>>382 も認めている。
2021/08/24(火) 14:12:24.41ID:6FahnTPL0
???
ごめん何言ってるかサッパリわからない
どういう状況でGoogle検索したら50万も請求が来るのか全く理解できない

> 業務でGoogleの機能を使えば毎月80万円程度のお金がかかることは > >>377>>382 も認めている。

Cloud Vision API は Google Cloudプラットフォームにアカウント登録して
クレジット カードまたは銀行口座情報を入力して初めて使えるサービスだぞ
業務か個人ユースかに関係なく使った分だけの従量課金で
手順踏んでAPIキー取得してAPI叩かなきゃ従量カウントは上がらないし
「Google検索しただけで」勝手に請求が来るような代物ではもちろんない

あと80万かかるのは月に500万ユニット使った場合の話でしょ?
処理回数に応じてそれ以上にもそれ以下もなる
こっちは君が言ったからランニングコストはとしてはありじゃない?って返しただけで
500万ユニットがコロナのデータ集積に毎月かける回数として妥当なのかは知らんよ
387名無しさん@お腹いっぱい。
垢版 |
2021/08/24(火) 14:23:54.92ID:NY7D9FCw0
>>386
> ???
> ごめん何言ってるかサッパリわからない
> どういう状況でGoogle検索したら50万も請求が来るのか全く理解できない

一日中Googleのホームページ(https://www.google.co.jp/)のテキストボックスに検索したいテキストを入力して検索ボタンをクリックすることを繰り返したら
ブラウザに請求書が表示されてそれが50万円で請求者はGoogleとなっていました。
388名無しさん@お腹いっぱい。
垢版 |
2021/08/24(火) 14:31:13.96ID:NY7D9FCw0
>>386
> あと80万かかるのは月に500万ユニット使った場合の話でしょ?
> 500万ユニットがコロナのデータ集積に毎月かける回数として妥当なのかは知らんよ

ユニットが何を意味するか分からんけど一つのブロックだと仮定すると
1ページで30くらいのユニットがあると考えられるので
10万枚処理すれば500万ユニットに近い数字になると思われる。

Googleより
> 米国での感染者数は増加傾向にあり、平均で1日147,420人の新規感染者が報告されている。
147,420*30=4,422,600/月

アメリカの感染者数が毎月442万人出てる計算だから
仮に1ページ1ユニットで計算しても500万ユニットは妥当な数字。

日本の感染者数がアメリカより少ないと言うなら、ユニットが1ページ30で計算すればいいんじゃね?
2021/08/24(火) 17:32:00.46ID:6FahnTPL0
一日中つったって手動で検索繰り返した程度で50万請求が来るような検索回数になるとはとても思えないんだけど
マルウェアが裏でF5アタック繰り返してたとかじゃないの知らんけど

https://cloud.google.com/vision/pricing?refresh=1
ユニットは1枚の画像に対し適応する機能タイプ別に発生する
1枚の書類(画像)に対してテキスト検出(OCR)しかしないのであればユニット数は1
結果はjson形式ファイルで画像中にブロックがある場合はで個別に分けて取り出せる
https://cloud.google.com/vision/docs/ocr?hl=ja
2021/08/24(火) 18:53:54.94ID:U1hPfsKA0
うるせえ
よそでやれ
391名無しさん@お腹いっぱい。
垢版 |
2021/08/24(火) 18:57:00.72ID:NY7D9FCw0
>>389
おまえさあ、Google検索してて「私はロボットではありません」って表示出たことある?

その表示が出るまでに何回検索してるか分かる?
そして検索にいくらかかったか分かる?

著作権裁判だと単に製品の代金だけじゃなく懲罰的請求をされるって知ってる?
アメリカだと自分でコーヒーこぼしただけで3億円も請求されるんですよ。
50万円って実質無料でしょ。
2021/08/24(火) 19:06:08.39ID:ubSdBvKx0
詭弁 答えのない問題に対して他の場所で出た答えを持ち出して
その答えはあの問題と同じだよと根拠もないのに言い張ってるだけのキチガイ
お前の言ってることは何の答えにもなってない
2021/08/24(火) 19:33:29.79ID:6FahnTPL0
何言ってるのかさっぱり分かんない
やっぱ会話無理な人か

>>390
ゴメンねもうやめるわ
394名無しさん@お腹いっぱい。
垢版 |
2021/08/24(火) 19:35:22.71ID:NY7D9FCw0
>>392
答えは最初っから言ってるだろ。Google検索したらGoogleから50万円請求されました。

お前が信じないだけだ。
ソースは出せない。

お前は企業がどういうときに金を請求するか知ってる?
費用が掛かった時だよ。
チンピラがたまたま目の前にいた通行人に金を請求するゆすりたかりとは違うんですよ。

じゃあ、どういう場合に「私はロボットではありません」って表示を出すか分かる?
無駄な費用を抑えるためですよ。

金を請求するのと「私はロボットではありません」と表示するのは目的が同じ。
お金ですよ。
かかった分請求するか、最初からかからないようにするかの違いだけ。

俺が50万円請求された証拠は出せないが、「私はロボットではありません」と表示される問題は無数にソースがある。
どれくらい検索していたかもその証言から推定できる。
そしたら、少なくともどれくらい使ったらGoogleが許容できない費用がかかっているかも推定でき、
50万円を請求するとしたらどれくらいの検索をしたかも推定できるはず。頭のいい人なら。

日本人は、どれだけ使ったらいくら請求と言う計算はできるけど、
いくら請求されたらどれくらい使ったかっていう計算は出来ない。
そう言う典型的日本人が>>392
2021/08/24(火) 20:12:01.67ID:PyFmfN7N0
論点1 QRコード化が可能か不可能か
論点2 人名が読み取れているか否か
論点3 手書きに対してOCRが有効かどうか
論点4 送信に成功したかどうかが分かるか

1 現場にしか分からないが個人単位では不可能ではない
2 現場にしか分からないが個人単位では不可能ではない
3 現場にしか分からないが個人単位では不可能ではない
4 現場にしか分からないが個人単位では不可能ではない

これだけの話なのに論点5のgoogle検索しただけで50万請求された人がいる
が一番どうでもいいし馬鹿らしいんだが 自覚しろよ
2021/08/24(火) 20:15:34.99ID:PyFmfN7N0
当然論点6のOCRの活用が現場で可能かどうかも現場にしか分からない
こんな所で無能だなんだ言ってないで現場に連絡取る位の努力しろよカス
2021/08/26(木) 22:54:38.68ID:fktTc4eK0
日本語横書きで時々アルファベットの引用を含んでいる文章をAcrobat の OCR で認識させるとアルファベットの一部の認識が失敗します。オプションは日本語文章を選んでおります。アルファベットもうまく認識させる方法はないでしょうか。
398名無しさん@お腹いっぱい。
垢版 |
2021/08/27(金) 20:30:24.89ID:939FgqXL0
この車のナンバーって人工知能で解析できんかね。
http://himado.in/492909
399名無しさん@お腹いっぱい。
垢版 |
2021/09/11(土) 09:26:02.33ID:XEPKqxnl0
CloudのAI OCRではGoogleのCloud Visionが優れていたが
最近AzureのCognitive Serviceを試してみたところ
文字の認識誤りの少なさではさらに上回る

ただし課題もあり、右から左へ改行していく縦書き文書を
左から右へ認識するので、行の順序が逆になる
読取順序をbasicからnaturalへ変えても同じ

幸い出力のjsonには座標情報が含まれているので
スクリプトによる後処理で行を並び替え
ついでにルビも削って整えているが
この辺をうまくやってくれるGUIがほしいところ
2021/09/11(土) 10:34:50.20ID:LOlOzN870
そのスクリプトは公開してるの?
PythonでGUI作れるかも。
401名無しさん@お腹いっぱい。
垢版 |
2021/09/11(土) 11:06:47.97ID:XEPKqxnl0
>>400
公開するほど大したことない
AzureのAPIとのやりとりはPythonで
後処理はluaでやっている(速いしYAMAHA使いなので)

小ネタで、Google Cloud Visionには
Microsoft Automate Desktop が何気に対応していて
フォルダ内の画像に一括OCRをかける程度なら
ノーコードで簡単にGUI化できる
2021/09/11(土) 14:41:17.75ID:e30+Z8z90
e.Typistは終了
読取革命も終了
企業向け帳簿用以外の個人用OCRはもうおしまいだ
403名無しさん@お腹いっぱい。
垢版 |
2021/09/15(水) 20:58:46.28ID:Vw0PVGR20
日本語OCRはくそ
404名無しさん@お腹いっぱい。
垢版 |
2021/09/16(木) 07:00:29.94ID:oHPqQDLA0
ニーズはあるはずなのに程よくまとまったアプリがない
スクリプトでGoogleなりAzureなりのAIを使えば
認識精度は高いけど、求めるのはそれじゃない

画像をクラウドへ送りたくない向き用に
いわば認識エンジンをローカルへダウンロードできる
Docketの仕組みもあるし、
誰か小綺麗にパッケージ化してくれたら買うのにな
2021/09/17(金) 00:22:23.73ID:0acrvs2j0
>>404
それ、tesseract以外で作るのなら、エンジンライセンスだけで安くて数十万かかるんじない。買うって法人で買うの?
406名無しさん@お腹いっぱい。
垢版 |
2021/09/17(金) 02:47:20.06ID:7J187VR90
自前で日本語認識エンジン作って遊ぼうとしてるけど、かなり難易度高い。
特に日本語は文字種が多くて、しかも英単語とか普通に混じってくるし。
売り物としたら数十万の売値になるくらい、計算機回してるわ

後半(文字の場所が分かっていて、それをテキストにする)はできたけど、
前半(どこに文字のboxがあるか)を当てるところで苦しんでる
407名無しさん@お腹いっぱい。
垢版 |
2021/09/17(金) 07:14:06.31ID:pFveJpOG0
>>405
それがMicrosoft AzureのDockerなら
目安として1,000枚あたり112円の完全従量制で
個人でも検討範囲に十分入るんだ
エンジンはローカルで、クラウドとは
課金のための小容量の通信が時折発生するくらいで
2021/09/17(金) 12:13:11.15ID:wHT5xdlK0
Dockerってそういう使い方できるのか、ちょっと触ってみようかな。
2021/09/18(土) 12:21:57.09ID:q+UM7OU/0
>>406
CenterNet を試してみては如何ですか?
物体の中心を特徴点として検出した後、幅・高さのサイズを予測する手法です
2021/09/18(土) 14:19:37.46ID:kRyIOOu20
OCRも光学読み取りの精度にこだわりすぎずにBARTなどの文脈推定を入れればトータルの性能が上がる気がする
411名無しさん@お腹いっぱい。
垢版 |
2021/09/18(土) 14:25:05.85ID:nHCGcW6c0
BERTっていうのね これ面白そうだ
小説でpre-trainedなモデルってあるのかな
2021/09/18(土) 14:40:51.41ID:Bzc3NP9C0
https://nlp.ist.i.kyoto-u.ac.jp/?BART日本語Pretrainedモデル
413名無しさん@お腹いっぱい。
垢版 |
2021/09/18(土) 18:05:35.08ID:eBkRmb3c0
>>409
サンクスです。良い手法を教えていただきました

今やってるモデルは、u-net ベースで、CenterNetの中心ヒートマップを使ってる
感じです。
これを参考に改造して作ってます。
https://github.com/tanreinama/OCR_Japanease

lossを調整したら、ほぼうまく行くようになってきました。
完成したら公開しますので、また来ます。
2021/09/19(日) 08:55:39.56ID:nf9M18go0
>>413
お役に立てたようで良かったです。成果を楽しみにしております。
2021/09/30(木) 21:55:51.09ID:VNbgOTa80
>>269
Acrobat pro DC (2015年の製品版)をまだ使ってるんだけど、
横書きの整備マニュアル370Pを
Canonの複合機TR9530のADFで地道にスキャンして(400dpiカラー)
CanonのPDFソフトでPDF化(OCR有)したものと、
それをAcrobatで再OCR化(圧縮無し)したものを比べてみた。
2021/09/30(木) 21:56:43.99ID:VNbgOTa80
検索は全て完全一致無しのオプションで。
検索文字「バッテリ」
Canon  286件
Acrobat  262件

検索文字「ボルト」
Canon  290件
Acrobat  270件

検索文字「注意」
Canon  506件
Acrobat  215件

検索文字「交換」
Canon  419件
Acrobat  418件

検索文字「目」
Canon  66件
Acrobat  77件
2021/10/22(金) 18:41:13.88ID:KWvJbojp0
キヤノンの優秀だね。自社エンジンなのかなぁ
2021/10/22(金) 22:01:30.34ID:CBrjiuuX0
ぺパレス電子化コラム - OCRソフトの比較
ttps://pepaless.com/column/180614_01/
画像部分とか、網かけ部分とかの認識も優れているかどうかはわからないけどね。
2021/10/27(水) 11:37:37.49ID:UgMif3Au0
>>418
コレ三年前の記事かよ。
つってもソフトは当時のバージョンとほとんど同じだから、実害はなしか。

『読取革命』も最新版だからって、とくに画期的に変わった訳でもあるまいに。
■ このスレッドは過去ログ倉庫に格納されています
16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面

ニューススポーツなんでも実況