【文字認識】OCRソフト(2文字目)【 自炊 】

■ このスレッドは過去ログ倉庫に格納されています
1名無しさん@お腹いっぱい。
垢版 |
2023/11/30(木) 15:44:45.66ID:oxe9L3uM0
光学文字認識(こうがくもじ にんしき、Optical character recognition)ソフト

OCRソフト 製品版
【ソースネクスト】
1.読取革命 16
2.本格読取 5
【メディアドライブ】
3.e.Typist v.15.0
OCRソフト フリーソフト
4.bunkoOCR
小説を自炊してテキスト化するのであれば3と4にはルビに対応している分有利かも!?
このリストって2016年とほぼ一緒
皆さんは、グーグルドライブとか使うの?
私は、PDFでは残さないのでbunkoOCRに期待しています。
1610
垢版 |
2023/12/18(月) 19:50:49.20ID:VFyF28wk0
詳細に聞いてくる人がいるとは思わなかったので話を簡単にする為にちょっと嘘ついた…ちゃんと書きます

25年前の文庫本でかなり黄ばみあり
10ページ近く上側角が折れ曲がっていたので、アルコールを吹きかけて折れ曲がりを直そうと広範囲にアルコールを吹きかけた
1ページ中5行ぐらい上から8文字50ページぐらい濡れる
乾かして折れ曲がりは直るもヨレヨレになったので5kgぐらいの重しで1週間置くほんの1部ヨレヨレが残る
だが、50ページ分インク滲みが発生

背表紙をドライヤーをかけて文庫本全て解体
この時点でOCRというものがある事を知らなかった
知ってたらグレースケールでスキャンしてたと思う
1710
垢版 |
2023/12/18(月) 19:51:16.84ID:VFyF28wk0
>>16
プリンターで1枚1枚モノクロで600dpi、BMP形式でスキャン
インク滲みのページはやはりインク滲みまで写り込むので
裏に黒画用紙を乗せて再スキャンするとインク滲みの写り込みが薄くなり、モヤがかかってる程度で読めないという事は無い
全て終わりインク滲みが写らない方法を調べてるうちにOCRというのがあるのを知る…ここでグレースケールで再スキャンは面倒なのでモノクロのまま

bunkoOCRを試してレスの10~12になる

さて、インク滲みの部分の話だが
blank cutoffを200にして実行してみると、インク滲みの部分は1文字も間違えて無い
ただし、文字部分ではなく空白部分で・のゴミのように滲んでる部分は文字化けした
だが文字の部分のインク滲みによる文字化けは無い
1810
垢版 |
2023/12/18(月) 20:17:18.10ID:VFyF28wk0
調べて見ると有料ソフトでも文字認識が100%ではないので
bunkoOCRは無料ソフトとしては優秀だと思う

実はGPUは積んでるが古いRADEONなのでエンコード支援は無いと思うのでCPUだけといってもいいかな
古いCPUでまわすなら文庫本数冊ならまだしも…
何十冊以上はbunkoOCRがーじゃなく
他ソフト含めてOCR化する事自体が無茶だと思うw
■ このスレッドは過去ログ倉庫に格納されています
16歳の水野カイトが封印の刀を見つけ、時間が裂けて黒い風と亡霊の侍が現れ、霊の時雨と契約して呪われた刀の継承者となる場面

ニューススポーツなんでも実況