X



【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0283名無しさん@お腹いっぱい。
垢版 |
2021/02/18(木) 19:39:21.13ID:PhET5XgP0
お金出せるなら ABBYY FineReader あたりがいいんじゃない バッチ処理もあるし
CZERのOCRエンジンがABBYYなんだが認識精度は悪くないよ
デフォルト設定でPDFにすると画像めっちゃ汚くなるけどテキストで抽出するなら関係ないだろうし
0285名無しさん@お腹いっぱい。
垢版 |
2021/02/18(木) 22:04:26.68ID:/MMQ5ij10
画像ファイルから検索可能なPDFに変換するソフトは、いきなりPDFとかJUSTPDFとかあるな、体験版あるかな
0287名無しさん@お腹いっぱい。
垢版 |
2021/02/18(木) 23:34:26.27ID:PhET5XgP0
>>284
横書き文書オンリーで仕上がりの良さ最優先なら>189
フリーのツールなんで設定の難しさやUIの面倒さはある
googleにお布施も必要

簡単さで選ぶなら市販のOCRだろうけど詳しくないので分からん
とりあえずwindowsサンドボックスでABBYY試してみたが
MRC圧縮をオフにすれば画質は保たれるぽい
0288名無しさん@お腹いっぱい。
垢版 |
2021/02/19(金) 14:18:04.61ID:/LGznBXV0
e.Typist使ってるよ
検索可能PDFにするときのMRC圧縮はPCで見ると汚いのに、タブレットで見ると良く見えるから不思議
PCの画面を範囲指定してOCR出来る機能はふとしたときに便利
画像読み込みが500枚までしか対応しないのはクソ
0290名無しさん@お腹いっぱい。
垢版 |
2021/02/19(金) 17:56:41.05ID:b3qLx0/L0
洋書死ぬほどつらい
pdf→ocr→誤字とか改行チェック→自動翻訳→翻訳チェック
0293名無しさん@お腹いっぱい。
垢版 |
2021/02/20(土) 22:00:35.33ID:Z3ERY2/H0
>>291
例えば520枚のフォルダ読み込ませても、500枚までしか画像リストに登録されない。もちろん追加しようとしても出来ない。
分割して認識させて、後からPDFを結合させれば良いだけではあるけど

>>292
PCと違って画面が小さいから文字の輪郭のがたつきが気にならなくなる、一方で、白黒がハッキリするから綺麗に見えるんでないかなと思ってる
普通のPDFビューアアプリだし
0295名無しさん@お腹いっぱい。
垢版 |
2021/02/24(水) 14:51:12.19ID:aqSvsfDI0
TESSERACT-ocrで 紙読ませたら
「シャンプードレッサー」 が 「にャンプードジったー」 になった
0299名無しさん@お腹いっぱい。
垢版 |
2021/02/25(木) 23:16:42.87ID:ttwjBNUo0
ワープロ打ちした会議資料など、状態が良い原稿からの日本語の横書きと縦書き文章のOCR化を考えているならe.Typist
文章認識の性能は、読取革命と較べた場合、僅かな差ですがこちらの認識性能が上

雑誌や本などレイアウトが複雑なものや、新聞や古い原稿など状態が良くない日本語文章の他、英語文字が入る場合や、小説や雑誌などの2段組の文章などは読取革命が上
0301名無しさん@お腹いっぱい。
垢版 |
2021/05/01(土) 12:22:34.25ID:wPbgt6E/0
tesseract OCRチャレンジ中。プログラミングの技術書PDFを何とか透明PDF付きにしたいという欲求。
飾り文字とか目次とかが壮大にこける。下のような・・・を無視したいんだけど何かうまい方法ないでしょうか。
02 はじめに・・・・・・・2
0302名無しさん@お腹いっぱい。
垢版 |
2021/05/01(土) 17:39:13.89ID:CU4T262z0
>>301
トランプのマーク4種を認識させるときにその文字に限定させることでうまく認識したことがあった。
0304名無しさん@お腹いっぱい。
垢版 |
2021/05/02(日) 17:57:02.87ID:fc3xJsqr0
50冊くらいの教科書、手技書等を裁断して、職場の複合機で、スキャンしてPDF化予定です。
検索可能PDFにしたいと考えています。認識率はそこまで厳密に高くなくても、キーワードで該当箇所が分かれば便利かなぁという程度です。テキストで出力などは予定していません。
分厚い表紙などは別でスキャンして中身のPDFと統合できると良いと思っています。
読取革命を第一候補に考えています。いきなりPDFスタンダードというのはOCR絡みのエンジンがパナソニックと書かれていますが、これは読取革命のものとは違うものでしょうか?ほとんど一緒というレベルならいきなりPDFの方が随分安いので良いなぁという感じなのですが、誰かわかりますか?
0307名無しさん@お腹いっぱい。
垢版 |
2021/05/02(日) 20:55:33.98ID:ajDJAhT50
職場に複合機あるなら機械単体でサーチャブルPDF作れるんじゃない?
画質は高圧縮でだいたい酷いことになるっぽいが
0308名無しさん@お腹いっぱい。
垢版 |
2021/05/03(月) 17:07:18.50ID:WHA1lrAT0
>>307
職場の複合機見たけども、OCRっぽい設定がなかったんですよね。
調べてみると拡張モジュールなるものがあれば良いようなのですが。連休明けにまた調べてみます。ありがとうございます。
0309名無しさん@お腹いっぱい。
垢版 |
2021/05/03(月) 18:31:46.14ID:FElEuZiq0
読取革命などのOCRソフトは、画像を読み込み、文字認識、修正、PDFや、ワードなどに出力する。
PDFも読み込めるが、新たにPDFとして出力される。

いきなりPDF COMPLETEなどの最上位板のPDFソフトは、PDFの透明テキストを修正できる。
画像の上に、文字色が透明のテキストが貼り付けられてる。
文字を赤に変えてチェックするけど面倒くさい。
もっといい方法があるかも知れない。
0310名無しさん@お腹いっぱい。
垢版 |
2021/05/09(日) 01:03:19.05ID:jmsS93J00
いきなりPDFを購入したものの、肝心のスキャンしたPDF→透明テキスト付きPDFの作業でソフトが強制終了してしまいます。問題なくファイル変換できるものと出来ないものがあるみたいです。
Q&Aにはフォントを追加しているとエラー出るかもとか書いてありますが、そもそもフォントを追加なんかした事ないし、どれを消せばいいのかも分からない。というかこれが原因なのかすら分からない。

サポートに問い合わせてみていますが、返事があるのかすら怪しい。。。やはり大人しくAdobeのサブスクリプションにしておくべきだったのか。

愚痴でした。
0314名無しさん@お腹いっぱい。
垢版 |
2021/05/12(水) 21:30:34.59ID:obNff0Ek0
まあ、10ページでエラーが出るのか、100ページでエラーが出るのか、1000ページでエラーが出るのかの場合分けだな
0315名無しさん@お腹いっぱい。
垢版 |
2021/05/13(木) 16:38:29.73ID:SLu4UeqC0
色々とありがとうございます。
スキャナにはOCRの機能はありませんでした。ストレージにもかなり余裕がありそうですが、ものによるのでしょうか。
何度やってもダメなPDFは4ページ、3/4の表示のところで文字認識中というところで落ちてしまいます。同じ日にスキャンしたPDF(2-6ページ程度のもの複数)はOCR化出来ました。
150ページくらいの200MB程度のものは2個/21個は変換できましたが他はダメでした。JPG経由はまだ試してませんのでやってみたいと思います。
サポセンから連絡があり、調べてみます的なお返事でした。
0317名無しさん@お腹いっぱい。
垢版 |
2021/05/19(水) 02:26:34.81ID:HWxuzQfn0
フォントはOCRBで共通でタブレットも同一機種を配布らしいけど撮影環境がマチマチで人によって得られる画像が異なってくるのでそう言う結果になるのは仕方がない。
手振れや角度とかの癖でどういう間違いが出易いとかはあると思う。手振れは持ち方でも変わってくる。
タブレットが大きいから影が映りこむけど、照明が適切か分からない。
ライトは使ってないようだったが、ライトをつけた方が認識しやすい。反射する場合はライト無しにする必要がある。
ピント合わせが出来ない場合が多すぎる。マジ糞。ピント合わせに時間かかる。
カメラが複数ついてる奴はピント合わせ速そうだけど、安いのはカメラ1個だから遅い。

撮影台に乗せて使う場合はピント合わせを固定に出来た方が故障しないし撮影一瞬で出来るしいいことづくめのはず。

セルフレジでも読み取りできないことがよくあるけど、一旦しっかり外して再びしっかり読ませれば一秒で読み取ってくれる。
0318名無しさん@お腹いっぱい。
垢版 |
2021/05/19(水) 10:32:09.32ID:JDDtGBtH0
フォント共通で数字のみでも読み取り間違い出るなら、100%認識のOCRなんて夢のまた夢だな
0319名無しさん@お腹いっぱい。
垢版 |
2021/05/20(木) 04:54:15.76ID:KDnYz3pE0
最近利用しているガソリンスタンドの料金機(セルフの店なんで)が
QRコードで割引とかあって、
まぁ、レシート出すとその季節の割引券が付くんだけど
それの読み込みが遅くてイライラするのよ

QRコードなのにクイックじゃ無い
結局読み取りのところにレシートを押しつけて、
少しずつ遠ざけていくとまぁまぁ(2回目ぐらいで)読み取るぐらいに安定したわ
レシートだから裏が透けたり、角度が付いていたりピントが合わなかったり
そう言うのに強いのがQRコードじゃないんかね?
0320名無しさん@お腹いっぱい。
垢版 |
2021/05/20(木) 08:30:39.20ID:4Fq3eRUr0
OCRとQRは別物だし完全にスレ違いなんだが

あえてツッコむとそれカメラがタコなだけだからスマホ変えたほうがいいよ
QRの規格に文句言うのは筋違い
0322名無しさん@お腹いっぱい。
垢版 |
2021/05/28(金) 12:05:47.29ID:P2WCflXp0
2000冊分くらいのpdfファイルがあり OCR済みのものとしていないものが混ざっています。これをまとめてOCRしたいのですが安くあげるにはどうしたらいいですか。
バンドル版のacrobatXはこういう目的に使えますか。
https://m.qoo10.jp/item/%E3%82%A2%E3%82%AF%E3%83%AD%E3%83%90%E3%83%83%E3%83%88-ADOBE-ACROBAT-X-10-STANDARD-%E3%83%90%E3%83%B3%E3%83%89%E3%83%AB%E7%89%88/601688005
0326名無しさん@お腹いっぱい。
垢版 |
2021/07/18(日) 02:32:22.76ID:oQLnYNbx0
>>325
認識率95%ってそんなに凄いの。今使ってるの Acrobat の OCR で困ったことないんだけど、それよりもすごいのかな。
0327名無しさん@お腹いっぱい。
垢版 |
2021/07/18(日) 09:04:36.93ID:lnw1fm580
> ※ 認識精度は数字に関するもので、条件で左右されます。
数字だけに限定してさえ100文字中5文字は間違うってことでしょ
手書き認識も含むから活字だけならもっと認識率上がるのかも知らんけど
0330名無しさん@お腹いっぱい。
垢版 |
2021/07/19(月) 01:07:30.29ID:F9XeLcaj0
>>325
試してみた。インストールにすごく時間かかった。
説明がなくて使いにくい。
認識実行すると文字化けの出力結果。
これは暇な人が色々試して遊ぶソフトと思った。
即、アンインストールした。
0332名無しさん@お腹いっぱい。
垢版 |
2021/07/19(月) 07:58:50.76ID:F9XeLcaj0
全ての文字が文字化けだから。コードを選ばなきゃいけないのかね。
自己学習をしなくてもある程度の精度が出なきゃ学習のための動力が大変だよ。
0334名無しさん@お腹いっぱい。
垢版 |
2021/07/19(月) 10:34:39.69ID:F9XeLcaj0
インストールして試してください。約1 GB のアプリです。もしかしたら私の使い方が根本的に間違ってるのかもしれない。
0339名無しさん@お腹いっぱい。
垢版 |
2021/07/21(水) 01:43:25.56ID:qQ5Ez8Mv0
本を見開きでスキャンしたらできる本の周りの影と真ん中の影を消すソフトないでしょうか?どちらか一つでもいいです。
0342名無しさん@お腹いっぱい。
垢版 |
2021/07/21(水) 13:02:55.40ID:qQ5Ez8Mv0
>>341
是非教えてください
0343名無しさん@お腹いっぱい。
垢版 |
2021/07/21(水) 13:04:34.65ID:qQ5Ez8Mv0
自分で調べたけど発見できませんでした。
念のためですがスキャン自体は Acrobat の スキャン機能 を使ってます。スキャン後の PDF の影を取るソフトです。
0346名無しさん@お腹いっぱい。
垢版 |
2021/07/22(木) 16:50:26.47ID:fGMCvnhV0
スマホのOCR、ピントが固定になるようにして使ってるけど
たまに下敷きの量が変わって距離がわずか数ミリずれるだけで認識精度50%とかになる。
レシートがしっかり幅いっぱいになるようにして撮影しなおすと95%くらい認識する。
影ができると精度かなり落ちるから今はスマホのライトOnで撮影している。
0350名無しさん@お腹いっぱい。
垢版 |
2021/07/23(金) 18:30:19.88ID:KFQ0x8UC0
読取革命で認識させると文字が少し小さくなるのは何でかな
0351名無しさん@お腹いっぱい。
垢版 |
2021/07/29(木) 10:14:59.19ID:0JzdyqZz0
Capture2Text使っていて、>>158 と同じ症状。
どなたか、詳しい人はいませんか?
GUIだと認識できる日本語が、CLIだと化けて出力される。
英語や数字の認識には差異は無さそう。
0353351
垢版 |
2021/08/01(日) 12:17:19.04ID:EKgADGMN0
>>352
ありがとうございます! お陰様で、解決できました。

コマンドプロンプトからの動作は chcp 65001 で改善したのですが、
実は、UWSCのDOSCMD関数から叩きたくて、これは、何をやっても解決しませんでした。
(レジストリでAutoRun弄ってもダメ)

UWSCにはPOWERSHELL関数もあって、そちらからは文字化けせずに取得することができました。
0354名無しさん@お腹いっぱい。
垢版 |
2021/08/03(火) 18:25:28.98ID:1yBwwluW0
スキャンで作成したPDFをOCRで文字認識させました。
表示されている文字で検索してもヒットしませんでした。
当該文字をコピーしてテキストファイルに貼り付けると別の文字になっていました。

OCRに詳しくないので教えてほしいのですが
1、認識後の文字はもとの文字の上に透明のフォントで重ねているのでしょうか?
2.今は、グラフの線が白黒だと判別できないのグレースケールで600DPIでスキャンしています
(300DPIだと文字の周りがにじむので)。認識率を向上させるために注意する設定項目があれば教えて下さい。
0355名無しさん@お腹いっぱい。
垢版 |
2021/08/07(土) 08:52:19.64ID:rqbKqC/20
>>354
僕はプリンタ付属のOCRでスキャンしてますが、600dpiより300dpiのグレーが認識率高いです。
文字がにじんだ方が線が分離しなくなるので機械には読み取りやすくなるようです。
僕は数字の表だけ読み取れればいいんで英数で読み取って数字以外は捨ててます。
矩形でタブを入れ、空白を置換で削除することでExcelでも表として認識できます。

昨日は1ページスキャンして1文字だけ認識してませんでした。
もしかすると、矩形の空白を削除するときにその数字だけはみ出していて削除してしまったのかもしれません。
元が英数ならいいんですが、日本語の文字化けでずれが大きくなるので。

ブラザーの複合機ですが、新しいアプリより ControlCenter4 のOCRの方が使いやすかったです。

PDFの方は詳しくありませんが、PDFにはレイヤ機能があって重ね合わせが出来ます。
WORDでもハガキのイメージに合わせて郵便番号や宛先など配置できますよね。
文字が正しく読み取れなかったとしても、その化けた文字が配置されるので検索では本来の文字は出てこないでしょうね。
0356名無しさん@お腹いっぱい。
垢版 |
2021/08/07(土) 12:24:46.27ID:iSVP+I520
>>355
コメントありがとうございます。
私もブラザーのプリンターを使ってます。ブラザーの OCR ソフトは使い方がよくわからなかったので日本語の縦書きの認識もそこそこ良かったAcrobat の OCR を使うようになりました。

300 DPI の方が認識率が高いというのは新発見です。
0358名無しさん@お腹いっぱい。
垢版 |
2021/08/08(日) 13:44:29.33ID:7AjcYiKn0
>>357
汚れてもないしトリミングの必要もない場合でも CHAIN LP で何かをすれば認識率は上がりますか?
上がる場合はchainLP のどの項目を使えば良いか教えていただけますか
0360名無しさん@お腹いっぱい。
垢版 |
2021/08/08(日) 20:38:22.55ID:IfVfnYiT0
OCR前にソフト側で2値画像に変換されてしまうし
事前補正はあんまり意味ないよ
画像をどうこうするよりOCRソフトのユーザー辞書学習カスタマイズして
パターン登録するほうが効果は高い
0361名無しさん@お腹いっぱい。
垢版 |
2021/08/09(月) 01:03:41.06ID:oBYKB49n0
>>360
なるほど、そうなんですね。
0362名無しさん@お腹いっぱい。
垢版 |
2021/08/09(月) 09:41:20.64ID:a4Sxnc9w0
chainLPで検索したら漫画は16階調が一般的で一括変換出来るツールだと出て来た。
僕が16階調に加工するとき、画像の濃さを細かく調整しないとあちこち消えてなくなる現象があった。
少なくとも256階調はないとOCRには向かない。

256階調のままで600dpiを300dpiにしてくれるなら認識率が上がるかもしれない。
・・・そう言うツールではないようですね。

> V0.37-3
> ChainLPでは、画像を1ピクセルあたり1ポイントとしてPDFに配置します。つまり72dpiです。
> よって、出力サイズとして600×800ピクセルを設定した場合は、PDFのページサイズは約8.3×11.1インチとなります。
> これは、ほぼA4サイズに近い大きさです。

> ChainLP v0.38-2
> ・元画像の解像度(dpi)を引き継ぐようにしました。しかし、あまり意味はないと思います。


https://lifehack-lab.com/chainlp_set1/
> Kindle PaperWhiteで自炊本を読む場合、PDFそのままでは非常に読みにくいです。
> mobiというファイル形式に変換してあげるととても読みやすくなります。
> そこで登場するのが、「ChainLP」というソフトです。
> 各種ファイルに変換できるのですが、画像の補正、トリミングが同時にできるので、Kindle用のmobiファイルをつくるのには重宝します。

> どうやってもきれいにならない場合は、別のツールを試してみましょう。
> >こちらのページを参考に(Xnconvertというソフトです)
> Xnconvertできれいにしてから、ChainLPに再挑戦してください。

> XnConvert. 画像のリサイズやフォーマット変換からフィルタ加工まで一括処理
0363名無しさん@お腹いっぱい。
垢版 |
2021/08/09(月) 10:23:52.59ID:OqeDcUJs0
色々勘違いしてそうだけどChainLPでも256階調出力は可能
つってもそれだけのためにChainLP使うよりRalphaとかの方が楽だけど

あともし漫画をOCRしようとしてるなら諦めたほうがいい
capture2textみたいにフキダシ抽出の機能のあるアプリか
GCV系のAI型じゃないとほぼほぼ無理
0365名無しさん@お腹いっぱい。
垢版 |
2021/08/09(月) 20:52:04.70ID:dAASpWa80
ドキュメントスキャナの類だとある程度スキャナドライバ側で補正かけられてるから
いうほど効果ない場合もある
機種や設定次第

ノイズの多いスキャン画像なら補正も有効だけど
設定のわかりにくいCainLPより一括処理できる画像ソフトのほうが
シンプルに分かりやすいんではないかとは思う
0366名無しさん@お腹いっぱい。
垢版 |
2021/08/10(火) 00:19:46.38ID:9pRWSzRN0
>>364
具体的にどんな元原稿に対してどんな効果があったか言ってくれないと効果ありありと言われてもね。
0367名無しさん@お腹いっぱい。
垢版 |
2021/08/12(木) 19:07:27.37ID:M3IwL1EP0
フリーで優れたocrソフトってありますか?
用途は、アマゾンキンドルで実用書読んでるんですけど、
参考になった部分をスクショで撮ってそれをocrで文字起こし、メモ帳にまとめる
ってことがしたいです
0369名無しさん@お腹いっぱい。
垢版 |
2021/08/12(木) 19:23:21.80ID:W1e/W8C/0
ああごめん翻訳いらなくてスクショ起こしだけならCopyfishでいいんじゃない?
ブラウザ拡張だけどデスクトップのキャプチャもできたはず
0370名無しさん@お腹いっぱい。
垢版 |
2021/08/22(日) 12:15:30.21ID:InGHoZ6h0
衝撃…世界が馬鹿にした日本のFAX、実は米国でもコロナ報告で普通に使っていた
https://president.jp/articles/-/37491?page=3
> 北見工業大学教授で公衆衛生分野の情報化に詳しい奥村貴史氏が同サイトに寄稿にした記事によると、

> 同氏からの改善につながる提言に、「OCR(光学文字認識、活字を文字コードに変換するソフト)処理を前提としたフォーマットをFAXで扱う」というものがあります。
> これなら、FAXによる一元的管理機能を担保しつつ、
> アナログでデータを受信しても、
> OCRスキャンすれば直ちにデジタル化できますから、
> 入力する現場の手間を減らすことができます。

OCRでレシートや売上表読み取りしてる身からすると、
数字ですら完全には読み取れないのに
どうしてFAXなんかで送った人名を読み取れるんだと。
せめてQRコード化して送れよと。

工業大学の教授ですらこの程度の事が分からないんだな。
0371名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 11:49:45.91ID:OlmLkjoZ0
いまだにFAXを使うしかない事情として
> 医療機関、自治体、保健所など複数の関係者で共通のシステムを整える必要があり、そのためには膨大なコストと時間がかかる
つってるのにQRコード化して送れとか無理でしょ


> 数字ですら完全には読み取れないのに
> どうしてFAXなんかで送った人名を読み取れるんだと。
そこはフォントの種類とサイズ次第じゃない?

FAX機が吐き出した紙をスキャンしてOCRかけるイメージなのかも知らんけど
FAX受信した複合機でそのままFax TIFFとして保存すれば
FAX形式データってほぼ G3 FAX(200x200dpi)だから200dpiの白黒データとして確保できる
200dpiあればOCR性能は充分という説もあるし
(それだけあれば完璧にOCRできるということではなく、
それ以上にしてもOCR精度の向上は望めないという意味)

カラーやグレスケでスキャンしてもOCR時は内部的に2値に変換してから処理することになるので
スキャン時に白黒(2値)を選ぶのはコスト減らすためにはあり
保存フォーマットは大体勝手にFax TIFFになるので
> 「OCR(光学文字認識、活字を文字コードに変換するソフト)処理を前提としたフォーマットをFAXで扱う」
というのも正しい
0372名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 15:49:32.12ID:fGb2UNbz0
>>371
そんな反論は予想通り。

OCRできるんなら送る側が自分でOCRしてQRコードを追加で印字すればいいだろ。

パソコンから直接FAXと電話回線に繋げて送るんなら精度は高いかもしれんが、
一回印刷してからFAXに入れるんなら、読み取るときに字がくずれるしゴミも読み取ってしまう。

仮に直接FAXと電話回線に繋げてたとしても、送信に成功したかどうかってすぐわかるの?
送ったかどうかって履歴に残るの?
PDFに印刷してからメールに添付して送れば履歴残るし
PDFを印刷してスキャンしてOCRもできるし
PDFからOCRできるし
PDFのフォントと文字コードがそのまま使えて検索までできちゃうんですけど?

そもそもFAXと聞いて手書きを想定してない時点でダメだけどね。
0373名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 15:54:44.90ID:fGb2UNbz0
・QRコードをFAXで送る方法
・PDFファイルをメールで送る方法

この2つだとシステムが専用だとQRコードは難しいかもしれんが
Windows使ってるならPDF印刷は標準機能だから簡単に追加できると思うよ。

そして役所は基本的にメールでやり取りしてる。相手がFAXしか使えないならFAXも使ってるけど。

コロナ補助金申請したけどExcelのファイルをメールでやり取りしたよ。
印刷した奴も郵送したけど。
郵送した理由は「印鑑がないと正式な書類にならないから。」
ようするに技術的な理由じゃなくてルールの問題なんだよ。
0374名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 19:28:55.86ID:OlmLkjoZ0
>>372
FAX使ったことない人か
送信の成功失敗は履歴から分かる
普通のFAX機なら失敗しても3回なり5回なりの時間置いてリトライする機能も付いてる

現状でFAX廃止できない状況だからそれを活用しましょうってことで
FAX以外は受け付けませんってことではないでしょ
PDFながせるそれでいいだろうしメールはだめですとも書いてない

各関係団体はそれぞれの基幹システムやデータベースで既に管理してるが
そこから出力できる形式にはだいたい制限があるし書式もフォーマットもバラバラ
お役所仕事のようにExcelのこのフォーマット以外はだめです、
送信のためにもう一度体裁整えて新たに入力して下さいとかやってる暇がないので
エクスポートや印刷で出せるものをそのまま流してもらうしかないのがおそらく今の現状

アナログで対応するというのは、そこはそのまま送り手に負担を強いず
どんな書類が来ても受け側で自動でどうにかできるすげえ力技システム組んじゃいましょうってことで
FAXで受けるなら手書き書類も考慮してるだろうし
(手書きOCRの実用性はググればまあまあ出てくる)
リソースは当然必要だろうけど大学ならAI OCR研究やってるとこと提携して
市販の既成OCRソフトとは規模の違う精度のものが組めるアテがあるのかもしれん
0375名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 20:18:25.89ID:CYyOePzH0
>>374
> (手書きOCRの実用性はググればまあまあ出てくる)
> リソースは当然必要だろうけど大学ならAI OCR研究やってるとこと提携して
> 市販の既成OCRソフトとは規模の違う精度のものが組めるアテがあるのかもしれん

馬鹿だろお前。
大学の無能教授と無能学生になにが作れると思ってんだ?

作ることが可能ならとっくの昔に存在してるし、
今存在してないならこれから先も作ることは不可能なんだよ。
作れる人間が生まれてくるまではな。
0379名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 22:46:53.84ID:CYyOePzH0
俺はGoogle検索しただけで50万円請求されたからね。Googleから。2回ほど。
馬鹿は50万でも一千万でも請求されてろ。
0380名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 22:53:28.53ID:CYyOePzH0
> Cloud Vision API には画像解析のための各種機能があります。どの場合でも、ご利用いただいた分だけお支払いいただきます。最低料金などは設定されていません。

> TEXT_DETECTION 画像内のテキストに対して光学式文字認識(OCR)を実行します。

> 1,001〜5,000,000 ユニット/月
> テキスト検出 $1.50

あら、お安い。
> 1,000 ユニットあたりの料金

5,000,000 ユニットの料金は$7,500
0381名無しさん@お腹いっぱい。
垢版 |
2021/08/23(月) 22:54:59.36ID:CYyOePzH0
日本円だと82万円だね。お安いね。
0382名無しさん@お腹いっぱい。
垢版 |
2021/08/24(火) 08:18:42.85ID:6FahnTPL0
50万2回請求ってw
規約も読まずにOCRしまくっちゃったの?

> 日本円だと82万円だね。お安いね。
500万ユニットが月に処理する回数として妥当値なのか知らんけど
運用費用としてはありなんじゃないの
日本中のコロナデータ集積して人力入力させてる人件費を考えたら
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況