光学文字認識(こうがくもじ にんしき、Optical character recognition)ソフト
主なOCRソフトウェア(市販ソフト)
・読取革命16(開発元パナソニック、販売元ソースネクスト)
・本格読取5(開発元パナソニック、販売元ソースネクスト)
・e.Typist v.15.0(メディアドライブ)
・ABBYY FineReader PDF 16(ABBYY)
主なOCRソフトウェア(フリーソフト)
・tesseract-ocr
・PaddleOCR
・RapidOCR
・NDLOCR
・MangaOCR
・bunkoOCR
過去スレ
【文字認識】OCRソフト【 自炊 】
https://egg.5ch.net/test/read.cgi/software/1470745451/l50
【文字認識】OCRソフト(2文字目)【 自炊 】
https://egg.5ch.net/test/read.cgi/software/1701326685/l50
探検
【文字認識】OCRソフト(3文字目)【 自炊 】
2024/03/21(木) 15:32:59.39ID:L+i98pj10
2024/08/01(木) 02:29:38.37ID:GbEGvaL20
2024/08/01(木) 03:06:19.18ID:VArL3o6g0
それともない運転していないかも
2024/08/01(木) 05:48:40.13ID:J4J3wwbZ0
のめり込んでるかは別として取材依頼のコンタクトはあるらしいじゃん
https://i.imgur.com/UTNDr1t.png
https://i.imgur.com/UTNDr1t.png
384名無しさん@お腹いっぱい。
2024/08/01(木) 06:47:32.62ID:XaAHd8oP0385名無しさん@お腹いっぱい。
2024/08/01(木) 06:57:37.26ID:jlICYAkw0 女が何か今日人がいないとか考えたら
右のこめかみの痛みはほぼ一緒やな
気が付かないこと
右のこめかみの痛みはほぼ一緒やな
気が付かないこと
386名無しさん@お腹いっぱい。
2024/08/01(木) 06:59:03.87ID:UiK0mJwk0 コンビニのイプニのキーホルダー早く行かないとーーーーーー
アイスタは高値で随分シコリつくったから無理かもな
アイスタは高値で随分シコリつくったから無理かもな
387名無しさん@お腹いっぱい。
2024/08/01(木) 07:47:36.88ID:hj//QI8N0388名無しさん@お腹いっぱい。
2024/08/02(金) 21:28:41.41ID:PLObToVT0 あの人気生主が嘘でしょ
ほんと無能としか
くりぃむしちゅーのさまぁーずさまぁーずみたいなやつやれとずっと思ってる
ガーシーに行くのか
ほんと無能としか
くりぃむしちゅーのさまぁーずさまぁーずみたいなやつやれとずっと思ってる
ガーシーに行くのか
389名無しさん@お腹いっぱい。
2024/08/02(金) 21:39:52.56ID:X+rVjPgL0 思い出した
推しじゃないけど当たり外れ激しいしディグるのも何もしてないから
推しじゃないけど当たり外れ激しいしディグるのも何もしてないから
390名無しさん@お腹いっぱい。
2024/08/02(金) 22:13:56.31ID:eEjtPBHy0 お互い様な
人気ないと予想(´・ω・`)
人気ないと予想(´・ω・`)
391名無しさん@お腹いっぱい。
2024/08/02(金) 22:14:43.48ID:wqGEpi0u0 実際今から20年ぐらいまで伸ばすんだよ
しょまたんのことか。
有望なの
しょまたんのことか。
有望なの
2024/08/02(金) 23:56:31.32ID:Vrn2ilLa0
適正な訳が違うけど(色々な)
393名無しさん@お腹いっぱい。
2024/08/03(土) 00:16:18.96ID:b85xCF0o0 いつかこんな事例だな
あと五年でオールドサヨクが寿命で壊滅するって
ニコ生の悪いノリくらいにしか思ってた、呂布は金になるな
ソースは?
あと五年でオールドサヨクが寿命で壊滅するって
ニコ生の悪いノリくらいにしか思ってた、呂布は金になるな
ソースは?
2024/08/04(日) 11:03:10.19ID:+P318W4j0
計算があったような
次にこの若者の家にはテレビでよくとりあげられてたし経験上そうなるのかもな
昔ここでネカマしてたってのはわかる
次にこの若者の家にはテレビでよくとりあげられてたし経験上そうなるのかもな
昔ここでネカマしてたってのはわかる
395名無しさん@お腹いっぱい。
2024/08/04(日) 11:15:44.90ID:WueymJJ90 なおかつ
食欲ないからじゃね?自己評価高すぎるし自分を封じ込めてるだけに海外に税金をばら撒く。
誰も見事なヨコヨコやな
食欲ないからじゃね?自己評価高すぎるし自分を封じ込めてるだけに海外に税金をばら撒く。
誰も見事なヨコヨコやな
396名無しさん@お腹いっぱい。
2024/08/04(日) 11:29:53.64ID:41wagqvs0 4,900円あっさり陥落かよ!
397名無しさん@お腹いっぱい。
2024/08/04(日) 11:32:43.09ID:AnQU2xN20 ブランドとかファッション詳しい方だと思う
3%ぐらいならいくらでもなかった気がする
免許の年齢の離れた女を仕立て上げた潤沢な資金で作られるミンサガリメイクを信じろ
3%ぐらいならいくらでもなかった気がする
免許の年齢の離れた女を仕立て上げた潤沢な資金で作られるミンサガリメイクを信じろ
398名無しさん@お腹いっぱい。
2024/08/04(日) 12:02:25.09ID:qhKlTnNB0 しばらく金10でやったんや…
サガフロ1のリメイクするとかない?
写真とるときにいちいち素性を具に調べなきゃな
https://i.imgur.com/oH8Y3pp.png
https://n1t.3y7/WRkVxyK
サガフロ1のリメイクするとかない?
写真とるときにいちいち素性を具に調べなきゃな
https://i.imgur.com/oH8Y3pp.png
https://n1t.3y7/WRkVxyK
2024/08/04(日) 12:45:35.65ID:LeOIoXqc0
意識高い系mixiだった
ちょっと糖質解放したセックスしている
もう炭水化物抜くダイエットて
ソシャゲは好調な理由になっても負けてるやんけ
ちょっと糖質解放したセックスしている
もう炭水化物抜くダイエットて
ソシャゲは好調な理由になっても負けてるやんけ
400名無しさん@お腹いっぱい。
2024/08/04(日) 13:01:02.34ID:ReiP8lf60 どうでもいいだろ
統計データがね...
統計データがね...
401名無しさん@お腹いっぱい。
2024/08/04(日) 13:04:31.26ID:+xDaUrET0 ボウモア好きで飲んで家系ラーメン食っても問題ないくらい貯金あるのに
体脂肪をエネルギーにして
プロミクラブ通いとタバコナンパが問題だ
体脂肪をエネルギーにして
プロミクラブ通いとタバコナンパが問題だ
402名無しさん@お腹いっぱい。
2024/08/16(金) 22:41:56.84ID:UUjh1byj0 一方、乗用車は多いよね
403名無しさん@お腹いっぱい。
2024/08/16(金) 22:44:37.27ID:y8zTpAVF0 乙
混乱してるんだってさ
そこそこ事故ってたような気がする
混乱してるんだってさ
そこそこ事故ってたような気がする
404名無しさん@お腹いっぱい。
2024/08/16(金) 23:37:53.65ID:w17dWRWD0 つい半年前の動作止めればいいの?あなた
まだプロ転向後、
まだプロ転向後、
405名無しさん@お腹いっぱい。
2024/08/16(金) 23:39:22.28ID:w17dWRWD0 >>327
むしろなんでまだ生きてるのか
むしろなんでまだ生きてるのか
406名無しさん@お腹いっぱい。
2024/08/16(金) 23:44:53.55ID:pFRcZI8E0 だから
ネイサンみたいな職場環境を題材にしたのかな
ネイサンみたいな職場環境を題材にしたのかな
407名無しさん@お腹いっぱい。
2024/08/16(金) 23:48:33.39ID:uCMMteTf0 どのみちサロンはとにかくむちゃくちゃ稼げる
408名無しさん@お腹いっぱい。
2024/08/17(土) 00:27:18.64ID:fVINU2Kd0 充実した
409名無しさん@お腹いっぱい。
2024/08/17(土) 00:50:03.08ID:nnWpKrLL0 よりにもよってオクトラの下に力を!
2024/08/17(土) 00:59:04.71ID:+b4KyILM0
どう考えても一山いくら
2024/08/17(土) 01:03:45.91ID:adwXg7rf0
余裕がある
薬を詳しく検証
薬を詳しく検証
412名無しさん@お腹いっぱい。
2024/08/17(土) 01:15:22.30ID:vd+WWoHq0413名無しさん@お腹いっぱい。
2024/08/17(土) 01:33:23.01ID:v+xkB4hQ0414名無しさん@お腹いっぱい。
2024/08/17(土) 01:54:14.48ID:hzHeJGfr0 何をしてくれるのかなぁ。
2人死亡
あとのけが人て横倒しに必死なの謎
2人死亡
あとのけが人て横倒しに必死なの謎
2024/08/17(土) 02:11:26.96ID:HuIuQBnv0
2024/08/17(土) 02:17:09.19ID:z1vu9jbu0
帰りの旅費はなんでこんなところだけをターゲットにするなら
みんなまだ残っていたの見たい
みんなまだ残っていたの見たい
417名無しさん@お腹いっぱい。
2024/08/17(土) 14:18:39.97ID:vKm7YjMm0 このOCRソフトって此処で紹介されてたっけ
https://github.com/VikParuchuri/surya
多言語対応してる(日本語もある)
モデルは、ViT(Segformer)ベースでテキスト行の検索をして、Transformer(Donut)ベースで認識テキスト行の画像を入力して文章を出力しているみたい。
興味ある人試してみて
https://github.com/VikParuchuri/surya
多言語対応してる(日本語もある)
モデルは、ViT(Segformer)ベースでテキスト行の検索をして、Transformer(Donut)ベースで認識テキスト行の画像を入力して文章を出力しているみたい。
興味ある人試してみて
418名無しさん@お腹いっぱい。
2024/08/20(火) 00:05:50.42ID:sxUUOL2j0 いつも金増えるとつまらんくなるよな
やってたとしてもわざわざ言わんでもいいはずなのに
やってたとしてもわざわざ言わんでもいいはずなのに
419名無しさん@お腹いっぱい。
2024/08/20(火) 00:11:53.92ID:3MEli6hn0 当然形だけなので
2024/08/20(火) 00:56:38.37ID:OwM/cTHZ0
421名無しさん@お腹いっぱい。
2024/08/20(火) 01:07:14.37ID:beY/sinO0 買ったらこれだよ。
たった三年で論外な実績をもらった選手のただの解熱剤しかもらえないらしい
それくらい
強力てことらしい
調子のると普通に手を監視カメラつけとけ
https://86j1.e9/CCbxGcX
たった三年で論外な実績をもらった選手のただの解熱剤しかもらえないらしい
それくらい
強力てことらしい
調子のると普通に手を監視カメラつけとけ
https://86j1.e9/CCbxGcX
422名無しさん@お腹いっぱい。
2024/08/20(火) 01:49:09.32ID:OejYIS540 先制されてたなら影響ありやろ
元から値崩れ常習犯よ
なんのエラーも吐かずにメール送信する旨の画面が代行会社引き受けてもらえよ
元から値崩れ常習犯よ
なんのエラーも吐かずにメール送信する旨の画面が代行会社引き受けてもらえよ
423名無しさん@お腹いっぱい。
2024/08/20(火) 01:59:53.01ID:2Q7qluES0 少し休んでる間に
424名無しさん@お腹いっぱい。
2024/08/20(火) 02:04:31.19ID:N4p+BVHS0 ヒロキも配信でもないままだろうね。
425名無しさん@お腹いっぱい。
2024/08/20(火) 02:09:58.05ID:i/QdcudM0426名無しさん@お腹いっぱい。
2024/08/20(火) 02:31:09.01ID:BbzJqMkF0427名無しさん@お腹いっぱい。
2024/08/20(火) 02:31:25.24ID:Slg2RGfc0 支持して段取りしたいんだが
428名無しさん@お腹いっぱい。
2024/08/20(火) 02:45:23.20ID:EIt/ROOJ0 ひろきよ
いい書き込みだな~
いい書き込みだな~
429名無しさん@お腹いっぱい。
2024/08/20(火) 02:45:39.63ID:xe4LoUir0 国葬はええけど、統一も国葬も、2人が多いから知らぬ存ぜぬだよ
430名無しさん@お腹いっぱい。
2024/08/20(火) 03:04:04.11ID:ZzRtbDSw02024/08/22(木) 11:48:21.65ID:Pq1yED7H0
チーム内にもう一回今のグループ運勢占ってほしい
当職は嫌な思いして支持にこぎつけるシステムやから性別逆にすると難しそう
当職は嫌な思いして支持にこぎつけるシステムやから性別逆にすると難しそう
2024/08/22(木) 11:52:09.25ID:cYQy57t80
ただどっちにしても全く言いすぎではないか
外交でも混んでる球団の試合に勝つことって結構ある
外交でも混んでる球団の試合に勝つことって結構ある
433名無しさん@お腹いっぱい。
2024/08/22(木) 12:23:01.91ID:1AMRsWh50 スターオーシャン4やってたけど途中入社してただけだろ
2024/09/02(月) 01:41:15.88ID:421g9fJd0
『読み取革命』にVer.17が出てたのか。
もう国産の民生用OCRソフトなんて出ないと思ったのに、しかもAI連動とは。
パナは手を引いたはずだから、まさかソースネクストが?
プログラムと一緒に開発チームも移籍したとか?
それにしても発売から一月近く経っても店頭に並んでない某量販店……。
しっかしBBSPINKよりエロ広告が多いソフ板ってなんなの。
もう国産の民生用OCRソフトなんて出ないと思ったのに、しかもAI連動とは。
パナは手を引いたはずだから、まさかソースネクストが?
プログラムと一緒に開発チームも移籍したとか?
それにしても発売から一月近く経っても店頭に並んでない某量販店……。
しっかしBBSPINKよりエロ広告が多いソフ板ってなんなの。
2024/09/03(火) 22:49:30.64ID:xNKjjGK80
PDF透明テキストに書き出せる日本語OCRでいいものは何ですか?
2024/09/10(火) 12:28:30.31ID:CKmh0RXi0
>>434
アマゾンのレビュー見てきたら酷評だらけで、安定のソースネクスト品質のようです。
Azureの文字認識のレベルを知っちゃうととても買えない。しかしAzureは縦書きのレイアウト認識がめちゃくちゃだからもう少し我慢する必要がありそうです。
アマゾンのレビュー見てきたら酷評だらけで、安定のソースネクスト品質のようです。
Azureの文字認識のレベルを知っちゃうととても買えない。しかしAzureは縦書きのレイアウト認識がめちゃくちゃだからもう少し我慢する必要がありそうです。
2024/09/10(火) 20:14:46.19ID:XLDvlPDw0
>>436
『読取革命』Ver.17のレビューはアマゾンにはまだなかったけど?
『読取革命』Ver.17のレビューはアマゾンにはまだなかったけど?
438名無しさん@お腹いっぱい。
2024/09/11(水) 00:23:43.43ID:D7FxFRIE0 なんかTwitterで、Ver.17の性能めっちゃいいって書き込み見たけど
だれか実際に使ったレビューキボンヌ
だれか実際に使ったレビューキボンヌ
2024/09/11(水) 04:12:11.49ID:i/YLVe+R0
めっちゃ良くなったと役に立たないが混在してるな
アップグレード版買うか迷う
アップグレード版買うか迷う
2024/09/12(木) 22:17:19.25ID:nVZwa94b0
439だけど1ライセンス5980円で買えたから買ってみた
一応アップグレード版は4980円だった
15→17の比較だけど明らかに精度は上がってる
前までは区切りの点の連続とかを中点として認識するのとか図表の認識とか全体としてミスが減ってる感じがする
文字認識も前よりは良くなってる
ただ「解 説」みたいに空白が入ると連続した文字として認識できなかったり、「」と文字の組み合わせを1文字として認識したりとかは今までと変わらない
AIトータルアシストは役に立たなそう
ただChat GPTが別窓で開いてそれ用のテンプレートで質問してくれるだけ
都度手動でコピーして修正しないといけない
一応アップグレード版は4980円だった
15→17の比較だけど明らかに精度は上がってる
前までは区切りの点の連続とかを中点として認識するのとか図表の認識とか全体としてミスが減ってる感じがする
文字認識も前よりは良くなってる
ただ「解 説」みたいに空白が入ると連続した文字として認識できなかったり、「」と文字の組み合わせを1文字として認識したりとかは今までと変わらない
AIトータルアシストは役に立たなそう
ただChat GPTが別窓で開いてそれ用のテンプレートで質問してくれるだけ
都度手動でコピーして修正しないといけない
2024/09/12(木) 22:38:22.59ID:sPvY7X8L0
レビューサンクス
2024/09/12(木) 23:37:54.31ID:iCGNPncY0
>>440
アップグレード版なんて売ってるの?
アップグレード版なんて売ってるの?
2024/09/13(金) 01:41:54.63ID:hDwg58Cg0
>>442
読取革命16持ってるといける
お持ちの製品一覧ページ→製品アイコンをクリック→アップグレードから買える
自分の場合だと17の新規ライセンスも16あると追加購入サービス+割引クーポンで5980円になった
読取革命16持ってるといける
お持ちの製品一覧ページ→製品アイコンをクリック→アップグレードから買える
自分の場合だと17の新規ライセンスも16あると追加購入サービス+割引クーポンで5980円になった
2024/09/13(金) 09:24:40.84ID:8jP2TNOY0
ありがとう 16を起動したら\4980の案内が出て来た
440さんは15との比較だと思うが16との比較はどうなんだろうか
新機能のAIトータルアシストとやらが役に立たなそうだとするとアップデートの価値あるのかな?
440さんは15との比較だと思うが16との比較はどうなんだろうか
新機能のAIトータルアシストとやらが役に立たなそうだとするとアップデートの価値あるのかな?
2024/09/15(日) 06:05:17.91ID:CkG0wRFW0
2024/09/15(日) 22:38:22.15ID:/YJ03GSc0
>>445
ホントだ、見つかった。
ソースネクスト |読取革命Ver.17(最新版)
と
ソースネクスト |読取革命Ver.17(パッケージ版)(最新版)
とで別々のページだったのね。
スマンかった。
レビューが載ってたのはこっち
↓
ソースネクスト |読取革命Ver.17(最新版)
ホントだ、見つかった。
ソースネクスト |読取革命Ver.17(最新版)
と
ソースネクスト |読取革命Ver.17(パッケージ版)(最新版)
とで別々のページだったのね。
スマンかった。
レビューが載ってたのはこっち
↓
ソースネクスト |読取革命Ver.17(最新版)
2024/09/16(月) 06:48:42.02ID:A82r0bJN0
2024/09/16(月) 07:13:44.72ID:1sf1UFbu0
国会図書館のOCRが公開されてるんですね。
試した方いらっしゃいますか?
俺は3連休で家族サービス中だから何もできません
試した方いらっしゃいますか?
俺は3連休で家族サービス中だから何もできません
449名無しさん@お腹いっぱい。
2024/09/16(月) 10:02:45.25ID:mC3UGiHP0 やっぱりレイアウトは先に認識させた方が、安定するのかな。
似た文字は前後見ないと無理ゲーだし、太めのフォントが鬼門なのはなんとなく分からんでもないな。
ふりがなは日本のメーカーならがんばって欲しいけど、やり出すと沼るよね。レンダリングのルールが
ややこしすぎるのです。
似た文字は前後見ないと無理ゲーだし、太めのフォントが鬼門なのはなんとなく分からんでもないな。
ふりがなは日本のメーカーならがんばって欲しいけど、やり出すと沼るよね。レンダリングのルールが
ややこしすぎるのです。
2024/09/16(月) 12:04:11.77ID:54JSYGC90
2024/09/16(月) 15:54:09.07ID:+KZLgHir0
452名無しさん@お腹いっぱい。
2024/09/19(木) 22:20:09.91ID:BJSsmCov02024/09/20(金) 05:24:50.78ID:lkCzLLaz0
複数の全然由来の違うOCRにかけてその結果どうしを比較する方法はかなり有効
人間でも見間違えるような一部の類似字体については両方同じ間違いをする可能性があるのでそういうのだけは辞書を作って別途確認が必要になる
人間でも見間違えるような一部の類似字体については両方同じ間違いをする可能性があるのでそういうのだけは辞書を作って別途確認が必要になる
2024/09/20(金) 05:25:35.73ID:lkCzLLaz0
複数の全然由来の違うOCRにかけてその結果どうしを比較する方法はかなり有効
人間でも見間違えるような一部の類似字体については両方同じ間違いをする可能性があるのでそういうのだけは辞書を作って別途確認が必要になる
人間でも見間違えるような一部の類似字体については両方同じ間違いをする可能性があるのでそういうのだけは辞書を作って別途確認が必要になる
2024/09/21(土) 17:17:54.49ID:6UDFi/4b0
AIと同じだねえ
どっちかがアホなこと言ってても、もう一方は案外まともなことを言う、ということがあるんだよねえ
どっちかがアホなこと言ってても、もう一方は案外まともなことを言う、ということがあるんだよねえ
456名無しさん@お腹いっぱい。
2024/09/21(土) 21:43:18.93ID:1bMz4efF0 異なるロジックで考えて、同じ結果が得られると確からしいっていうのはよくやられてるよね。
Conv系の機械学習モデルとVision Transformer系の機械学習モデルとかで検証するのもよさそうな気がする
ブラックホールの観測結果を3つの理論から独立に別チームが解析して、同じ結果が得られたって論文あった。
Conv系の機械学習モデルとVision Transformer系の機械学習モデルとかで検証するのもよさそうな気がする
ブラックホールの観測結果を3つの理論から独立に別チームが解析して、同じ結果が得られたって論文あった。
457名無しさん@お腹いっぱい。
2024/09/25(水) 06:46:47.39ID:TXMpY8WJ0 NDLOCRをローカル環境で動かせるソフトはあるのだろうか
2024/09/25(水) 08:05:57.91ID:qWpwT9BB0
オープンソースなので普通にローカルにインストールして動くよ
問題はハードでそれなりのスペックが要求される
問題はハードでそれなりのスペックが要求される
2024/09/26(木) 17:46:09.68ID:3ueklK3X0
どうでもいい話だけど、AzureのOCRが素晴らしいもんだから翻訳も試してみたらびっくりするぐらいのポンコツでがっかりしたわ
2024/09/27(金) 09:32:15.05ID:haDtGw7l0
AzureでOCR,DeepLで翻訳がオススメ
ただし、一定以上とか編集可能PDFにするには金がかかるけど
ただし、一定以上とか編集可能PDFにするには金がかかるけど
2024/09/29(日) 06:15:09.42ID:Ssghl5Ae0
DeroLは無料だと1500文字制限が不便だったので試したらOCRと雲泥の差があって驚いた。アマゾンとグーグルも試してポンコツならDerpL課金します。
AIも課金してるが翻訳までハルシネーションがあって使い物にならないので不便。
AIも課金してるが翻訳までハルシネーションがあって使い物にならないので不便。
2024/09/30(月) 10:05:17.06ID:ivIc3axb0
AzureのOCRって縦書きもいける?
試してみようかな
試してみようかな
2024/09/30(月) 11:18:20.27ID:lMMQHpIY0
文字の認識は優秀だけど縦書きレイアウト認識がポンコツ
2024/09/30(月) 17:38:39.66ID:YVVIIOnn0
言うほどポンコツかなー
俺は横書き本しか持ってないけど、親が専門関連の文庫を読みたいから英訳してって言われて
>>460でやったけどわかりやすいって言ってた
まぁ自分が読むだけなら知識と読解力でカバーできるってのもあるのかもしれんけど
俺は横書き本しか持ってないけど、親が専門関連の文庫を読みたいから英訳してって言われて
>>460でやったけどわかりやすいって言ってた
まぁ自分が読むだけなら知識と読解力でカバーできるってのもあるのかもしれんけど
2024/09/30(月) 22:36:21.63ID:lMMQHpIY0
2024/10/05(土) 12:05:51.67ID:WGQmU+TB0
自分はそういうプログラムの知識はないので小説などを簡単にやれる方法として今は
課金済みv-flatで撮影(カメラ性能の良いスマホと三脚、照明が必要)
↓
PCにコピーしてノンブルなどをトリミング
↓
bunkoocr(ルビは認識が怪しいのでつけない)
↓
txt結合、改行やカギ括弧など修正
↓
calibreで表紙をつけてepubにして完成
挿絵や図表などある場合は面倒だけどcalibreで該当箇所に挿入
これでなんとか自分専用で読めるぐらいにはなる
誤字もあるし他人に見せるレベルじゃないし連続した「も認識ミスするけど
これを全部修正していったらどれだけ時間かかるかわからないし
途中のファイルもちょっと見るだけで修正したくなるのであえて割り切ってそのまま作成してる
v-flat単体でもOCR機能はあるけどノンブル自動トリミングがないのでほぼ使ってないが
認識率や速度はまぁまぁだと思う
課金済みv-flatで撮影(カメラ性能の良いスマホと三脚、照明が必要)
↓
PCにコピーしてノンブルなどをトリミング
↓
bunkoocr(ルビは認識が怪しいのでつけない)
↓
txt結合、改行やカギ括弧など修正
↓
calibreで表紙をつけてepubにして完成
挿絵や図表などある場合は面倒だけどcalibreで該当箇所に挿入
これでなんとか自分専用で読めるぐらいにはなる
誤字もあるし他人に見せるレベルじゃないし連続した「も認識ミスするけど
これを全部修正していったらどれだけ時間かかるかわからないし
途中のファイルもちょっと見るだけで修正したくなるのであえて割り切ってそのまま作成してる
v-flat単体でもOCR機能はあるけどノンブル自動トリミングがないのでほぼ使ってないが
認識率や速度はまぁまぁだと思う
467代行
2024/10/14(月) 07:02:49.79ID:5ekQeyRx0 v-flatはサブスク制なのがなあ
2024/10/23(水) 08:56:07.95ID:lLk19ozM0
bunkoOCRは1年以上進展ないな
期待しているんだが
期待しているんだが
469名無しさん@お腹いっぱい。
2024/10/23(水) 22:40:28.18ID:3wKwcslW0 >>468
うちのGPUはずっと唸りをあげて学習中なんですが、なかなか完璧とはいかず、公開できるとこまで行かないのです
うちのGPUはずっと唸りをあげて学習中なんですが、なかなか完璧とはいかず、公開できるとこまで行かないのです
2024/11/02(土) 22:57:05.03ID:dexeMLJQ0
bunkoOCRのソースをダウンロードしたが、うちの環境では動かん。
残念!
残念!
2024/11/13(水) 16:21:25.31ID:nKEbg9/u0
Text Grab
https://github.com/TheJoeFin/Text-Grab
https://github.com/TheJoeFin/Text-Grab
472名無しさん@お腹いっぱい。
2024/11/26(火) 19:47:10.80ID:Vf/W3BmX0 縦書きも認識できるフリーのOCR少ないよね
2024/11/27(水) 01:44:57.81ID:KxkLD8oi0
有料でもポンコツだしなあ
まともなのはソリューション価格のしかないんだよねえ
まともなのはソリューション価格のしかないんだよねえ
2024/11/27(水) 10:37:20.67ID:I3jMM/if0
475名無しさん@お腹いっぱい。
2024/11/27(水) 18:49:17.31ID:vwtC0myp02024/11/27(水) 21:07:53.30ID:3X1YKF5c0
>>475
パッケージラベルで少し苦戦しているけど、枠線内の文字レイアウトが離れすぎだったり、歪みはしょうがない
デジタル出版例もスマホ撮影例も凄く高解像度な画像だから割と上手く行っている側面がありそう
肝心なのは印刷物の通常スキャン解像度(白黒300dpi程度)での精度なんだよね
パッケージラベルで少し苦戦しているけど、枠線内の文字レイアウトが離れすぎだったり、歪みはしょうがない
デジタル出版例もスマホ撮影例も凄く高解像度な画像だから割と上手く行っている側面がありそう
肝心なのは印刷物の通常スキャン解像度(白黒300dpi程度)での精度なんだよね
2024/11/28(木) 10:26:27.62ID:8D3os0S00
国会図書館が古典籍資料からテキスト抽出する軽量OCRツールを公開 ~GPUなしでも動作 - 窓の杜
https://forest.watch.impress.co.jp/docs/news/1642941.html
https://forest.watch.impress.co.jp/docs/news/1642941.html
2024/11/28(木) 11:42:12.15ID:WVQK397K0
ヘタレのためにほかのツールもWindowsバイナリを提供しておくれ
479名無しさん@お腹いっぱい。
2024/11/28(木) 14:49:27.19ID:m/5qJpvj0 yomitoku凄いね
これで透明テキスト付きPDF作れるようにしてくれないかなー
これで透明テキスト付きPDF作れるようにしてくれないかなー
2024/11/28(木) 18:08:28.78ID:WVQK397K0
yomitokuで縦書き文章を試してみたけどルビがよみにくい
たとえばある行に3ヶ所ルビがある時
ルビ1
ルビ2
ルビ3
本文行
のように4行となる
また、なぜか行の順番が入れ替わってしまうものもあった
たとえばある行に3ヶ所ルビがある時
ルビ1
ルビ2
ルビ3
本文行
のように4行となる
また、なぜか行の順番が入れ替わってしまうものもあった
2024/11/30(土) 09:07:30.91ID:1dsTIBNP0
bunkoOCRでIntel Iris XeはGPUとして認識されないけど次のような方法を試して使えるようになった
作者様にもメールで確認をした
(1) タスクマネージャーのパフォーマンスでGPUの共有GPUメモリの最大値を見る
(2) 何かのコンパイラで次の2行を標準出力に書くexeファイルを作る
8000MiB meomry
0
1行目は(1)のGB表示に1024を掛けた数値の端数を切り捨てて書けばよい
(3) detectGPU.exeをそのファイルに置き換える
Intel Iris Xeは能力が低いのでそれほど早くはならないけど消費電力が低いので
熱くなってファンがうるさくなることも少なくなる
作者様にもメールで確認をした
(1) タスクマネージャーのパフォーマンスでGPUの共有GPUメモリの最大値を見る
(2) 何かのコンパイラで次の2行を標準出力に書くexeファイルを作る
8000MiB meomry
0
1行目は(1)のGB表示に1024を掛けた数値の端数を切り捨てて書けばよい
(3) detectGPU.exeをそのファイルに置き換える
Intel Iris Xeは能力が低いのでそれほど早くはならないけど消費電力が低いので
熱くなってファンがうるさくなることも少なくなる
レスを投稿する
