探検
【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
2016/08/09(火) 21:24:11.61ID:zXdCMkkb0
光学文字認識(こうがくもじ にんしき、Optical character recognition)ソフト
2018/04/23(月) 01:44:27.61ID:ATRq3RKx0
>>67
>>68
高度なアドバイスをありがとう。ご存知の通り画像処理はやったことないし、知識もない。
出がらし状態の死体にいくら細胞活性剤を注入したところで生き返る訳がないのは当然だけど、
せめてゾンビ程度に動けるようにできないかなと、今度はInkscapeを使ってビットマップを
ベクターデータに変換したものを再度pngにしてみたよ。
肉眼にはノイズが減ってクッキリとしたように見えるが、さてOCRからはどう見えるか。
https://i.imgur.com/u1WXYIs.png
上記画像を最新のtesseract-ocrでOCRした結果のスクリーンショット
https://i.imgur.com/Ky49xV0.png
上記画像を一つ前のtesseract-ocrでOCRした結果のスクリーンショット
https://i.imgur.com/i9QwHS7.png
……やはり修正しやすさからいうと、一つ前のtesseract-ocrかな。
不完全なテキストを校正するには、sedによるフィルター処理で複数箇所の一括置換を
やってるんだけど、途中でもっと良いやり方がないかと思って何度もOCRからやり直す
もんだから、文庫や新書をひらきにしたスキャン画像は十冊分くらいあるんだけど、
テキストデータの校正を終わらせて完品にまで至ったのは実はないんだわ。
何度も繰り返すうちにちょっとずつ正解率も向上してはいるんだけど、今度は再スキャンも
検討してみます。
>>68
高度なアドバイスをありがとう。ご存知の通り画像処理はやったことないし、知識もない。
出がらし状態の死体にいくら細胞活性剤を注入したところで生き返る訳がないのは当然だけど、
せめてゾンビ程度に動けるようにできないかなと、今度はInkscapeを使ってビットマップを
ベクターデータに変換したものを再度pngにしてみたよ。
肉眼にはノイズが減ってクッキリとしたように見えるが、さてOCRからはどう見えるか。
https://i.imgur.com/u1WXYIs.png
上記画像を最新のtesseract-ocrでOCRした結果のスクリーンショット
https://i.imgur.com/Ky49xV0.png
上記画像を一つ前のtesseract-ocrでOCRした結果のスクリーンショット
https://i.imgur.com/i9QwHS7.png
……やはり修正しやすさからいうと、一つ前のtesseract-ocrかな。
不完全なテキストを校正するには、sedによるフィルター処理で複数箇所の一括置換を
やってるんだけど、途中でもっと良いやり方がないかと思って何度もOCRからやり直す
もんだから、文庫や新書をひらきにしたスキャン画像は十冊分くらいあるんだけど、
テキストデータの校正を終わらせて完品にまで至ったのは実はないんだわ。
何度も繰り返すうちにちょっとずつ正解率も向上してはいるんだけど、今度は再スキャンも
検討してみます。
70sage
2018/04/23(月) 15:36:58.50ID:3ep7Hu9S0 OCRで、ごくまれになのだけど、な-た の誤読があって。
これにまいったのが遠い思い出。されたい されない というのは
あまりに神経を使うので、自分で校正するのを諦めた。
これにまいったのが遠い思い出。されたい されない というのは
あまりに神経を使うので、自分で校正するのを諦めた。
2018/04/26(木) 02:18:58.59ID:dUhJb3xD0
されたい と されない をどうやって校正してたんですか?
72sage
2018/04/26(木) 11:36:23.50ID:ek6J62ek0 突き合わせ。それしかないだろう。みつけるのは、文脈。
2018/04/26(木) 21:38:26.21ID:dUhJb3xD0
さすがに肉眼じゃなくて、検索/置換とかgrep的なツールを使ってサーチ、ですよね?
2018/04/28(土) 22:11:29.01ID:bWQs2w/K0
あのね、ほんの30年前までは万葉集の中に「●」という文字が
何か所使われているか、一晩徹夜で5回最初から最後までめくって
書き出してリストを作ってたの。
何か所使われているか、一晩徹夜で5回最初から最後までめくって
書き出してリストを作ってたの。
2018/06/01(金) 10:48:04.16ID:Qi+8uYQ40
同好の士がいるみたいなので私のやり方の一つを紹介
縦書き小説のテキスト化限定
段組み無しか2段組み程度のレイアウトの単純なもの限定
読取革命使用前提
スシャン画像の傾き補正余白除去など画像処理を程々にする
処理した画像を横に8ページ分つなげる(2段組みの場合は縦に6ページ)※これが校正作業効率化の肝
つなげた画像を読み込ませて読取革命で作業
認識率アップは程々に
校正作業効率アップの方が気楽
縦書き小説のテキスト化限定
段組み無しか2段組み程度のレイアウトの単純なもの限定
読取革命使用前提
スシャン画像の傾き補正余白除去など画像処理を程々にする
処理した画像を横に8ページ分つなげる(2段組みの場合は縦に6ページ)※これが校正作業効率化の肝
つなげた画像を読み込ませて読取革命で作業
認識率アップは程々に
校正作業効率アップの方が気楽
2018/06/01(金) 10:50:24.17ID:Qi+8uYQ40
スキャン画像・・・
2018/06/01(金) 11:02:23.02ID:Qi+8uYQ40
もう一つ
校正前のテキストをワードで開く
原本のページ体裁出来るだけワードで再現する
(用紙サイズ、字数、行数、字間、行間など)
ウインドウ透明化ソフトでワードを半透明化最前面
元画像をにワードを重ねる(行間に重ねたり)
比較校正作業
校正前のテキストをワードで開く
原本のページ体裁出来るだけワードで再現する
(用紙サイズ、字数、行数、字間、行間など)
ウインドウ透明化ソフトでワードを半透明化最前面
元画像をにワードを重ねる(行間に重ねたり)
比較校正作業
2018/06/07(木) 22:56:25.84ID:oM4s8ZW30
ルビが扱いたいと結局e.Typistしか選択肢がない感じがあるけど
e.Typistは――とか・・・・・・にすごく弱い感じがする
ーや1として認識されるならまだいい方で
空白を認識する設定にすれば空白として出力してくれるけど
逆に言えば文字としては認識されてないことが多いので修正も不能で困る
e.Typistは――とか・・・・・・にすごく弱い感じがする
ーや1として認識されるならまだいい方で
空白を認識する設定にすれば空白として出力してくれるけど
逆に言えば文字としては認識されてないことが多いので修正も不能で困る
2018/06/15(金) 21:07:25.53ID:lat6DNLI0
>>75-77
新たなノウハウの提供ありがとうございます。
OCRからの校正作業は未踏の部分が多いし、未だ正解がある訳でもないですから、
こうして持ち寄ったノウハウが少しでも蓄積していくと良いですね。
透過して元画像とテキストを重ねるってのは自分も一度は考えたけど、当時
Linuxでまともに縦書き表示のできるテキストエディタとかワープロはなかった
ので、結局縦書きの元画像と横書きのOCR化テキストを横に並べて見比べるしかなかった。
まあでもLinuxも悪いところばかりじゃなく、1ページずつ200件超えに分割されたまま
一冊分のテキストファイルをタブで全部開き(ページの移動はタブ上でスクロール)、
開いた全ページに跨って検索/置換ができるBluefish(本来はHTMLエディタ)とか
Geany(本来はIDE)が使えるので、Meryやotbedit時代のように検索/置換のために
ひとつのファイルに結合してから校正という手段を取らなくて済むのは良かった。
(好みというか選択肢の問題ね)
今は元画像とテキストファイルを一対一で、突き合わせが終わった分だけ閉じています。
ただ何故かLinuxのエディタって行間を広げるオプションがないのが多くて、仕方なく
ttfname3.exeを用いて(Wineで実行)フォント側で行間を広げる加工をしたのは余談。
新たなノウハウの提供ありがとうございます。
OCRからの校正作業は未踏の部分が多いし、未だ正解がある訳でもないですから、
こうして持ち寄ったノウハウが少しでも蓄積していくと良いですね。
透過して元画像とテキストを重ねるってのは自分も一度は考えたけど、当時
Linuxでまともに縦書き表示のできるテキストエディタとかワープロはなかった
ので、結局縦書きの元画像と横書きのOCR化テキストを横に並べて見比べるしかなかった。
まあでもLinuxも悪いところばかりじゃなく、1ページずつ200件超えに分割されたまま
一冊分のテキストファイルをタブで全部開き(ページの移動はタブ上でスクロール)、
開いた全ページに跨って検索/置換ができるBluefish(本来はHTMLエディタ)とか
Geany(本来はIDE)が使えるので、Meryやotbedit時代のように検索/置換のために
ひとつのファイルに結合してから校正という手段を取らなくて済むのは良かった。
(好みというか選択肢の問題ね)
今は元画像とテキストファイルを一対一で、突き合わせが終わった分だけ閉じています。
ただ何故かLinuxのエディタって行間を広げるオプションがないのが多くて、仕方なく
ttfname3.exeを用いて(Wineで実行)フォント側で行間を広げる加工をしたのは余談。
2018/06/16(土) 09:37:39.11ID:TK7ks+ws0
長文駄レスは過疎の元
自分語りは程々に
自分語りは程々に
2018/06/16(土) 13:35:14.61ID:7Ojo0RlC0
スレの性質上、情報提供は歓迎
長くても読みとれる情報はある
脳のOCR機能を鍛えるべき
長くても読みとれる情報はある
脳のOCR機能を鍛えるべき
2018/06/16(土) 14:01:15.28ID:TK7ks+ws0
情報提供レスが長文になるからこそ雑談は短文で抑えるべき
要点の無い長文日記と入り混じるとどれが重要なレスなのかわからなくなる
この手のスレは情報収集&提供目的を主として見に来る人がほとんどだし
匿名掲示板で名無し書込みする人間の多くは(特定のコテハンとの)
「過度」の慣れ合いは求めてない、ということを念頭に入れましょう
winユーザーにlinuxでの苦労話で返すようなのは相手の目線に立ってるとも言い難い
雑談するにしても簡潔に
要点の無い長文日記と入り混じるとどれが重要なレスなのかわからなくなる
この手のスレは情報収集&提供目的を主として見に来る人がほとんどだし
匿名掲示板で名無し書込みする人間の多くは(特定のコテハンとの)
「過度」の慣れ合いは求めてない、ということを念頭に入れましょう
winユーザーにlinuxでの苦労話で返すようなのは相手の目線に立ってるとも言い難い
雑談するにしても簡潔に
2018/06/16(土) 17:16:54.01ID:DpwT78Ra0
長文駄レスやめーや
2018/06/17(日) 14:51:45.64ID:UW0RCtPR0
そんなルールはないぞ
2018/06/20(水) 00:23:42.81ID:4KCvLiUk0
2018/07/10(火) 16:36:25.03ID:oMs2MPt30
>>82
うーん、>>79を『Linuxの苦労話』としか読んでもらえなかったのは残念だな。
後半の「おかげでWindowsだけ使っていた頃にはできなかった
・200件超えのテキストファイルを一度に開ける
・開いている複数のファイルに跨って検索/置換ができる
ことができるソフトに出会えた」ってのがキモなので(だから固有名詞を出してる)、
期待していたレスは『○○というエディタならWindowsでも同じことができますよ』
だったんだけどね。
実際「Windowsで(上記2点)ができるエディタを教えてください」って質問を投げれば
一行で済むけど、経験上質問を一行しか書かない奴って返答してもダンマリだし、人様の
知見をお借りする前に自分でどこまで試したか? を加えて書き直すと、
「Meryやotbeditではできない(上記2点)ができるエディタを教えてください」
『そんなことできるのか?』というツッコミがあるかもしれないので、自分なりの
知見を追加して更に書き直すと、
「Meryやotbeditではできない(上記2点)ができるエディタを教えてください。ちなみに
LinuxではBluefish(本来はHTMLエディタ)とGeany(本来はIDE)ではできました」
これを自分なりに雑談めかして書くと >>79になるのだが、内容がつまらないと言われると
申し訳ないとしか言えないけどね。
で「Windowsで(上記2点)ができるエディタ」について何かご存じない?>>all
うーん、>>79を『Linuxの苦労話』としか読んでもらえなかったのは残念だな。
後半の「おかげでWindowsだけ使っていた頃にはできなかった
・200件超えのテキストファイルを一度に開ける
・開いている複数のファイルに跨って検索/置換ができる
ことができるソフトに出会えた」ってのがキモなので(だから固有名詞を出してる)、
期待していたレスは『○○というエディタならWindowsでも同じことができますよ』
だったんだけどね。
実際「Windowsで(上記2点)ができるエディタを教えてください」って質問を投げれば
一行で済むけど、経験上質問を一行しか書かない奴って返答してもダンマリだし、人様の
知見をお借りする前に自分でどこまで試したか? を加えて書き直すと、
「Meryやotbeditではできない(上記2点)ができるエディタを教えてください」
『そんなことできるのか?』というツッコミがあるかもしれないので、自分なりの
知見を追加して更に書き直すと、
「Meryやotbeditではできない(上記2点)ができるエディタを教えてください。ちなみに
LinuxではBluefish(本来はHTMLエディタ)とGeany(本来はIDE)ではできました」
これを自分なりに雑談めかして書くと >>79になるのだが、内容がつまらないと言われると
申し訳ないとしか言えないけどね。
で「Windowsで(上記2点)ができるエディタ」について何かご存じない?>>all
2018/07/10(火) 16:44:44.78ID:DcKO8Dw00
長い
要点3行でまとめて
要点3行でまとめて
88名無しさん@お腹いっぱい。
2018/07/11(水) 00:52:02.90ID:xEXPfRdD0 画像背景のエディタはAA用のがあったと思うけど縦書きには対応してないと思う。
MS WORD には、画像背景として重ねて文字を入力できる機能があった気がするけど
HTMLなら透過レベル指定できると思う。
HTMLでも writing-mode vertical-rl で縦書きできるんだな。
MS WORD には、画像背景として重ねて文字を入力できる機能があった気がするけど
HTMLなら透過レベル指定できると思う。
HTMLでも writing-mode vertical-rl で縦書きできるんだな。
2018/07/11(水) 11:08:12.89ID:oaLZdIB/0
Linuxなんてただで手に入るし、情報の入手が簡単な現代では小学生でも導入できます。
2018/07/11(水) 11:36:57.04ID:exMQ5TB90
いろいろずれているな
2018/07/11(水) 11:59:37.61ID:gc/ZijI10
ぶっちゃけOCRの用途はPDFに透明テキスト埋め込むのが目的な人が多いだろうし
それは置いとくとしてもテキストエディタ云々はもうOCR関係なくない?
200pを各ページごとにファイル分けて全部一遍に開きたいというのは運用としても特殊すぎる
Grepで横断検索できてピンポイントでファイル開ければ
同時オープンファイル数は20もあれば充分だと思うが
それは置いとくとしてもテキストエディタ云々はもうOCR関係なくない?
200pを各ページごとにファイル分けて全部一遍に開きたいというのは運用としても特殊すぎる
Grepで横断検索できてピンポイントでファイル開ければ
同時オープンファイル数は20もあれば充分だと思うが
2018/07/11(水) 16:59:13.66ID:exMQ5TB90
完全なテキスト化を目指す人にしてみればそっちも重要
2018/07/11(水) 17:04:31.64ID:exMQ5TB90
校正作業効率化 その3
複数ファイル複数条件一括置換ソフト
「TextSS.net]
いろいろ捗る
複数ファイル複数条件一括置換ソフト
「TextSS.net]
いろいろ捗る
2018/07/25(水) 21:52:36.75ID:u4/38rAZ0
>>91
まあ確かに完全テキスト至上派といえども、200ページ以上にまたがった
要・校正テキストファイルをイッキに処理できる集中力の持ち主なんてのは
完璧超人か紙一重だろうから、常人は真似できないしするべきでもないし、
確かに実際は一度に20件も開ければ十分だろう。
ただ、できるけどしない と できないからやれない とは違うから、
ツールの限界は少ないほうがいいし、選択肢は多いほうがいいと思うぞ。
せめてタブで開いた複数のファイルに対して一度に検索/置換できた方が
便利だと思うが、Windows用でご存じないか?
ちなみにBluefishもGeanyもオープンソースなソフトだから、Windows版も
実はある。
まあ確かに完全テキスト至上派といえども、200ページ以上にまたがった
要・校正テキストファイルをイッキに処理できる集中力の持ち主なんてのは
完璧超人か紙一重だろうから、常人は真似できないしするべきでもないし、
確かに実際は一度に20件も開ければ十分だろう。
ただ、できるけどしない と できないからやれない とは違うから、
ツールの限界は少ないほうがいいし、選択肢は多いほうがいいと思うぞ。
せめてタブで開いた複数のファイルに対して一度に検索/置換できた方が
便利だと思うが、Windows用でご存じないか?
ちなみにBluefishもGeanyもオープンソースなソフトだから、Windows版も
実はある。
2018/07/25(水) 22:14:26.85ID:u4/38rAZ0
#折角なので乗っかる
校正作業効率化 その4
対象がフォルダでもファイルでも検索して、置換もできるツール
Devas
すでに開発は終了したようだが、Wineを介せばLinux上でも動作するのが◎。
検索結果の文字がセンタリングされて上下でビシッと揃うので視認性も◎。
検索結果を好みのエディタで開けるように設定できるのも◎。
校正作業効率化 その4
対象がフォルダでもファイルでも検索して、置換もできるツール
Devas
すでに開発は終了したようだが、Wineを介せばLinux上でも動作するのが◎。
検索結果の文字がセンタリングされて上下でビシッと揃うので視認性も◎。
検索結果を好みのエディタで開けるように設定できるのも◎。
2018/07/26(木) 00:25:51.34ID:ehCn6mO80
ファイル開いてなくてもgrepで一括検索も置換もできるし
200ファイル開いて操作するほうが大変なのでできないよりできたほうがいいとも思わない
が
>ちなみにBluefishもGeanyもオープンソースなソフトだから、Windows版も実はある。
ならそれ使えばいいんじゃないですかね
無理難題系をわざわざ人に聴かなくても自分で出来るソフト知ってるならさー
200ファイル開いて操作するほうが大変なのでできないよりできたほうがいいとも思わない
が
>ちなみにBluefishもGeanyもオープンソースなソフトだから、Windows版も実はある。
ならそれ使えばいいんじゃないですかね
無理難題系をわざわざ人に聴かなくても自分で出来るソフト知ってるならさー
2018/07/31(火) 00:40:51.95ID:XFv/+RTU0
>>96
>ファイル開いてなくてもgrepで一括検索も置換もできるし
>200ファイル開いて操作するほうが大変なのでできないよりできたほうがいいとも思わない
――そんなふうに考えていた時期が、俺にもありました。
確かにファイルを開かずともgrepやsedで検索/置換はできるけど、修正すべき間違いを見つけるには
結局一件ずつファイルを捲って見つけなきゃならなかったのよ。
勿論こういう作業に正解がある訳もなく、己の趣味とか流儀に従って粛々と各自でやっていくしか
ないけど、多様性の確保のためにも自分の流儀にかなわない手法を否定してほしくはないけどね。
>>ちなみにBluefishもGeanyもオープンソースなソフトだから、Windows版も実はある。
>ならそれ使えばいいんじゃないですかね
>無理難題系をわざわざ人に聴かなくても自分で出来るソフト知ってるならさー
ィャ自分が知らないだけで世の中にはもっと優れたソフトがあるかもしれないから、
それを知りたくて、知ってる誰かに会えるかもしれないから、ひとはこうして掲示板に
集うんじゃないの?
>ファイル開いてなくてもgrepで一括検索も置換もできるし
>200ファイル開いて操作するほうが大変なのでできないよりできたほうがいいとも思わない
――そんなふうに考えていた時期が、俺にもありました。
確かにファイルを開かずともgrepやsedで検索/置換はできるけど、修正すべき間違いを見つけるには
結局一件ずつファイルを捲って見つけなきゃならなかったのよ。
勿論こういう作業に正解がある訳もなく、己の趣味とか流儀に従って粛々と各自でやっていくしか
ないけど、多様性の確保のためにも自分の流儀にかなわない手法を否定してほしくはないけどね。
>>ちなみにBluefishもGeanyもオープンソースなソフトだから、Windows版も実はある。
>ならそれ使えばいいんじゃないですかね
>無理難題系をわざわざ人に聴かなくても自分で出来るソフト知ってるならさー
ィャ自分が知らないだけで世の中にはもっと優れたソフトがあるかもしれないから、
それを知りたくて、知ってる誰かに会えるかもしれないから、ひとはこうして掲示板に
集うんじゃないの?
98名無しさん@お腹いっぱい。
2018/09/13(木) 11:21:16.21ID:E3IKZGva0 3年ぶりに覗きに来たけど読み取り革命まだバージョン上がってないんか。
250dpiぐらいの低解像度のOCR得意なオススメありませんか?
250dpiぐらいの低解像度のOCR得意なオススメありませんか?
2018/09/13(木) 12:21:48.97ID:MMXNUVI90
2018/09/13(木) 12:22:24.02ID:MMXNUVI90
>>99
2年前から読み取り革命を使ってます。
2年前から読み取り革命を使ってます。
2018/09/13(木) 20:22:21.28ID:fiE6t4/U0
日本語音声入力と日本語OCRの停滞ぶりは凄いよね。日本語というのは損な言語なんだね。
2018/09/13(木) 21:27:50.69ID:/U9Rgttz0
2018/09/23(日) 22:14:27.95ID:6ExiKjjd0
>>102
ぜんぜん電子化されてないじゃん。いまだに断裁しているよ。紙の本は滅びて欲しいわ。
ぜんぜん電子化されてないじゃん。いまだに断裁しているよ。紙の本は滅びて欲しいわ。
2018/09/23(日) 23:33:25.62ID:zSxXIagU0
とりあえず>101がGCV使ったことないのは分かった
googleさんはここ数年でむっちゃ進化すすめてるやろ
googleさんはここ数年でむっちゃ進化すすめてるやろ
2018/09/23(日) 23:48:00.36ID:SMtG23ki0
GoogleのCloud Visionでアプリ作ったものですが
これをWindows向けに開発して
リリースしたら需要あるみたいですね?
まぁGCV自体従量制なんで、
ポイント式にしないと危ないですが
Windowsでも出来たかなぁ
これをWindows向けに開発して
リリースしたら需要あるみたいですね?
まぁGCV自体従量制なんで、
ポイント式にしないと危ないですが
Windowsでも出来たかなぁ
2018/09/24(月) 02:04:54.60ID:7ukO3Jjb0
手書きとか写真からの文字抽出とかは進化してるけど、
スキャン文書の99.9%の認識率を99.99%に上げるような進化はしてないよ
ーー(二重ダッシュ)がかすれ扱いされて消されたり
ルビを巻き込んで盛大にグチャるのも10年前から変わらん
スキャン文書の99.9%の認識率を99.99%に上げるような進化はしてないよ
ーー(二重ダッシュ)がかすれ扱いされて消されたり
ルビを巻き込んで盛大にグチャるのも10年前から変わらん
2018/09/24(月) 09:48:02.72ID:rfZDVbAs0
そりゃどこまで行ったって100%完璧にはならんだろ
それを停滞というのならもうOCRは諦めろとしか
>>105
ユーザーが自分のAPIキーを設定できるようにしてくれるとありがたい
もちろんGCP使えるエンドユーザーは限られるだろうからソフト内の課金制度も
平行して必要だとは思うけど
それを停滞というのならもうOCRは諦めろとしか
>>105
ユーザーが自分のAPIキーを設定できるようにしてくれるとありがたい
もちろんGCP使えるエンドユーザーは限られるだろうからソフト内の課金制度も
平行して必要だとは思うけど
2018/09/24(月) 12:06:18.22ID:7VNGbKqX0
>>104
本当に?じゃあ使ってみるわ。俺はメディアドライブとかAdobeとかXEROXのOCRを使って毎日ゲンナリしています。
本当に?じゃあ使ってみるわ。俺はメディアドライブとかAdobeとかXEROXのOCRを使って毎日ゲンナリしています。
2018/09/25(火) 13:21:20.30ID:1YzzlqqB0
2018/09/25(火) 20:38:03.49ID:z28g25+q0
良かったら作ったOCRアプリの名前教えてほしい
せっかくだから試してみたい
せっかくだから試してみたい
2018/09/25(火) 21:00:00.34ID:1YzzlqqB0
2018/09/26(水) 02:36:36.23ID:Z9NJjTaq0
iosかあ残念持ってないや
GCV使用だからって泥アプリとは限んないやね
GCV使用だからって泥アプリとは限んないやね
2018/09/26(水) 15:32:33.40ID:3VULbJ260
Windowsアプリ興味あるんで
OCRアプリ作ってみようかなと思います。
今ゲームアプリ作ってるんで
平行しながらになるとは思いますが。
OCRアプリ作ってみようかなと思います。
今ゲームアプリ作ってるんで
平行しながらになるとは思いますが。
2018/09/26(水) 15:46:44.32ID:6shTwqUF0
がんばれー
2018/10/18(木) 06:31:56.70ID:xqmBS9U/0
ocrで自炊完全テキスト化なんて幻だろ
自炊本全部リフローにしたい野望はみんな一度は夢見るが現実はまだ無理
自炊本全部リフローにしたい野望はみんな一度は夢見るが現実はまだ無理
2018/10/21(日) 21:47:44.30ID:J8kL1sRl0
「できらあ!」
と言いたいところだけど、現実は
「(時間と手間さえかければ)できらあ……」
くらいしか言えないけど、それじゃイヤなんだよね?
スキャンするなり即修正無しで使えるようでないと。
と言いたいところだけど、現実は
「(時間と手間さえかければ)できらあ……」
くらいしか言えないけど、それじゃイヤなんだよね?
スキャンするなり即修正無しで使えるようでないと。
2018/10/22(月) 08:29:07.17ID:lKYGaXGm0
AI のできしだいだろうなぁ
2018/10/22(月) 11:56:35.83ID:9+FR8jVB0
結局のところ、googleのエンジンが一番優秀ということ?
そうなら、googleエンジンを組み込んでる市販ソフト買えば使えるね。
そうなら、googleエンジンを組み込んでる市販ソフト買えば使えるね。
119名無しさん@お腹いっぱい。
2018/10/29(月) 16:05:36.04ID:URrtjB+G0 Google様でも手書き文字は全然ダメだね。
国内メーカーの企業向けのOCRって月ん百万取ってるけど、
Googleエンジンより出来が良いのだろうか?
国内メーカーの企業向けのOCRって月ん百万取ってるけど、
Googleエンジンより出来が良いのだろうか?
120名無しさん@お腹いっぱい。
2018/10/29(月) 17:58:02.72ID:cRbXFyKJ0121名無しさん@お腹いっぱい。
2018/11/05(月) 18:13:32.12ID:18FQZOi802018/11/05(月) 18:17:14.26ID:0FMJmniL0
すげー処理が遅くなると思うけど、レイアウト認識・文字の切り取り・文字認識 等、各プロセスで得た複数の候補を(結果的に膨大な候補になる)、すべて辞書と照らし合わせるみたいな、
ディープラーニング(自分門外漢なので言葉の使い方に不安)みたいな事をやってくれるソフトは無いものか。
計算資源をバカ食いする点以外は、技術的にはそれほど難しくないとおもうけど。
ディープラーニング(自分門外漢なので言葉の使い方に不安)みたいな事をやってくれるソフトは無いものか。
計算資源をバカ食いする点以外は、技術的にはそれほど難しくないとおもうけど。
2018/11/05(月) 18:21:01.26ID:0FMJmniL0
連投すまない。補足。既存の技術の組み合わせで出来るのではという意味。
2018/11/05(月) 18:28:05.57ID:/T2ZmVqB0
2018/11/05(月) 20:57:32.60ID:0FMJmniL0
>>124
返信ありがとう。
レイアウト認識の段階で誤りがあるとその次のステップに進んでも答えに辿り着けないという事でしょうか?
自分もそれについては全く同意見なのですが、前段階での認識候補を複数出し、その次でのステップでも、前段階で上がった複数候補を愚直にすべて処理し、各候補ごとに更に複数候補を‥というのを続け、
ネズミ算的に膨れ上がった候補から辞書を使って答を探る事は出来ないのかなと思ってます。
そうではなくて言葉通り”レイアウト認識と文字の切り出しを別のステップに分けるのが難しい”という意味でしたらすみません。
返信ありがとう。
レイアウト認識の段階で誤りがあるとその次のステップに進んでも答えに辿り着けないという事でしょうか?
自分もそれについては全く同意見なのですが、前段階での認識候補を複数出し、その次でのステップでも、前段階で上がった複数候補を愚直にすべて処理し、各候補ごとに更に複数候補を‥というのを続け、
ネズミ算的に膨れ上がった候補から辞書を使って答を探る事は出来ないのかなと思ってます。
そうではなくて言葉通り”レイアウト認識と文字の切り出しを別のステップに分けるのが難しい”という意味でしたらすみません。
2019/01/24(木) 02:28:33.48ID:q/RnbuRc0
喰いが止まってるので投下。
校正作業効率化 その5
「ScanTailor」
えるち某みたいなのがLinux陣営にも欲しいものだと思っていたら
ちゃんとあった。Windows版も。
画像フォルダを丸ごと読み込んで、
・見開き画像を左右に分割
・傾きを補正
・トリミング
・余白付加
・ゴミ取り
・dpi変更
・濃度調整
上記を複数頁に対して一括自動実行して、新たな画像が作られる。
使ってみたがOCRのヒット率は向上したような気がするし、少なくとも
生スキャン画像にありがちな上下左右への偏りを除去できるから、
ビュアーでペラペラめくるときに同じ位置に揃うので見やすくはなる。
惜しむらくはノンブルを自動除去できないのと、上下に分割はできない
こと(二段組の小説とかで)だな。
校正作業効率化 その5
「ScanTailor」
えるち某みたいなのがLinux陣営にも欲しいものだと思っていたら
ちゃんとあった。Windows版も。
画像フォルダを丸ごと読み込んで、
・見開き画像を左右に分割
・傾きを補正
・トリミング
・余白付加
・ゴミ取り
・dpi変更
・濃度調整
上記を複数頁に対して一括自動実行して、新たな画像が作られる。
使ってみたがOCRのヒット率は向上したような気がするし、少なくとも
生スキャン画像にありがちな上下左右への偏りを除去できるから、
ビュアーでペラペラめくるときに同じ位置に揃うので見やすくはなる。
惜しむらくはノンブルを自動除去できないのと、上下に分割はできない
こと(二段組の小説とかで)だな。
127名無しさん@お腹いっぱい。
2019/01/24(木) 18:19:29.58ID:ltsIJbyU0 >>126
なかなか良さそう。帰ったら試してみる。
もっとも、本当に欲しい機能は、
GoogleのOCRの前処理で
1. ノンブルを含む余白の自動カット と、
2. 縦複数段組の自動分割 なので、
かゆいところには手が届かない、かな。
なかなか良さそう。帰ったら試してみる。
もっとも、本当に欲しい機能は、
GoogleのOCRの前処理で
1. ノンブルを含む余白の自動カット と、
2. 縦複数段組の自動分割 なので、
かゆいところには手が届かない、かな。
2019/01/24(木) 20:58:14.74ID:oC0eBe300
エチル、読取革命時代からなんも進歩してないじゃねえか
2019/01/28(月) 19:33:43.72ID:YbE5uvwR0
ScanTailorはだいぶ前から全然アップデートされてないと思ってたら、別の所にScanTailor Advancedなんてのが出てるんだな。
まだ普通に検索しても一発で出てこない。
ScanTailor Advanced
https://github.com/4lex4/scantailor-advanced/releases
まだ普通に検索しても一発で出てこない。
ScanTailor Advanced
https://github.com/4lex4/scantailor-advanced/releases
2019/04/22(月) 13:29:43.28ID:EQQ1i8Cu0
LINE(PC版とAndroid版)の新機能がOCRの文字起こし機能をいつのまにか搭載してたようだよ
Googleやtesseractと比べてどうなのかな?
こうなってくるとLINEの友達にOCR変換投げつけ用アカウントの人が必要だw
Googleやtesseractと比べてどうなのかな?
こうなってくるとLINEの友達にOCR変換投げつけ用アカウントの人が必要だw
131名無しさん@お腹いっぱい。
2019/04/23(火) 03:18:57.23ID:f3SIBRKk0 レシート読み取りに関してはレシーピが最高。
グラム(g)を9と読み取るためにおかしくなる以外は濁音半濁音を間違う程度で正確に読み取る。
濁音半濁音は出来るだけ画面いっぱいで手振れ無しで撮らないとよくミスる。
グラム(g)とか数字+改行とかは修正ペンで消してから撮影すれば、金額はほぼ100%正確に読み取ってくれるんで修正が必要ない。
割引もマイナス値で読み取ってくれる。
グラム(g)を9と読み取るためにおかしくなる以外は濁音半濁音を間違う程度で正確に読み取る。
濁音半濁音は出来るだけ画面いっぱいで手振れ無しで撮らないとよくミスる。
グラム(g)とか数字+改行とかは修正ペンで消してから撮影すれば、金額はほぼ100%正確に読み取ってくれるんで修正が必要ない。
割引もマイナス値で読み取ってくれる。
2019/04/24(水) 17:27:12.85ID:H2ck4f350
OCRする前に、原稿が上下逆かどうかを自動判別する手法、何か無いですか?
Linuxで使える物で
Linuxで使える物で
2019/04/24(水) 23:45:13.63ID:3bEMxS/C0
普通に考えて「OCRする前に」は無理だろう。
2019/04/26(金) 21:22:29.83ID:AqpcAtpT0
そのままOCRをして。上下逆にしてOCRして、
2種類の日本語の単語数を数えて、(どんな方法かは分からない)
多い方を正解にするとかは?
2種類の日本語の単語数を数えて、(どんな方法かは分からない)
多い方を正解にするとかは?
2019/04/29(月) 11:28:12.88ID:0UVs2aXB0
>>132
ドキュメントスキャナには上下を自動的に判別する機能があるよね。ドライバを解析すればわかるかもね。
ドキュメントスキャナには上下を自動的に判別する機能があるよね。ドライバを解析すればわかるかもね。
2019/05/01(水) 07:14:36.04ID:ACgFkkVG0
2019/05/04(土) 09:49:33.30ID:G0ocSySL0
2019/05/04(土) 15:42:35.53ID:mwZ9gCOS0
>>137
横書きなら右に空白が増え、
縦書きなら下に空白が増え、
同じ横書きでもアラビア語みたいに右から書くと左に空白が増える。
この方法を使うためには、縦書きか横書きかを決めておく必要があるのでは?
横書きなら右に空白が増え、
縦書きなら下に空白が増え、
同じ横書きでもアラビア語みたいに右から書くと左に空白が増える。
この方法を使うためには、縦書きか横書きかを決めておく必要があるのでは?
2019/05/08(水) 21:36:16.90ID:mvroD7C30
>>75 に追加
読取革命でほとんどのエラー(フリーズ、エンドレス処理など)は
属性変更→認識→文字種→
で「記号」のチェックを外すことで回避できる
必要な記号は「ユーザー定義」欄に入れる
「」『』()、。ー…・!?々 など
ようやく気付けた・・・
私の環境だけ?
読取革命でほとんどのエラー(フリーズ、エンドレス処理など)は
属性変更→認識→文字種→
で「記号」のチェックを外すことで回避できる
必要な記号は「ユーザー定義」欄に入れる
「」『』()、。ー…・!?々 など
ようやく気付けた・・・
私の環境だけ?
140名無しさん@お腹いっぱい。
2019/05/29(水) 07:43:25.13ID:AmFhZwjQ0 tesseractでそれぞれの文字の一致率が何%だったのか取得することってできない?
もしくは高性能なOCRソフトで一致率が何%だったのか取得できるものない?
もしくは高性能なOCRソフトで一致率が何%だったのか取得できるものない?
2019/05/29(水) 17:19:09.12ID:b/cfiGBx0
論理矛盾と言うか哲学的な質問だな
142140
2019/06/01(土) 06:03:42.02ID:i2RMvlxm0 わかりにくくてすまん tesseractにある字体データと対象の文字の一致率って意味
https://tesseract.patagames.com/help/html/b4effc4b-310d-4f1f-99a0-65bc001cd765.htm
このサイトにある ↓0.125って数字は一致率0.875以上だった場合、Good Matchを返すって意味だと思う
matcher_good_threshold 0.125 Good Match (0-1)
matcher_perfect_threshold 0.02 Perfect Match (0-1)
やりたいことはこの一致率が指定した値以下だった場合、テキストファイルになにも書き込まないという処理をしたい 読み込む画像はすべて1行
一致率を取得できればほかのプログラムと組み合わせてできるようになる
もしくはこのサイトの関数をうまく使えばできそう
それっぽいのをいじってみたけどうまくいかなかった
https://tesseract.patagames.com/help/html/b4effc4b-310d-4f1f-99a0-65bc001cd765.htm
このサイトにある ↓0.125って数字は一致率0.875以上だった場合、Good Matchを返すって意味だと思う
matcher_good_threshold 0.125 Good Match (0-1)
matcher_perfect_threshold 0.02 Perfect Match (0-1)
やりたいことはこの一致率が指定した値以下だった場合、テキストファイルになにも書き込まないという処理をしたい 読み込む画像はすべて1行
一致率を取得できればほかのプログラムと組み合わせてできるようになる
もしくはこのサイトの関数をうまく使えばできそう
それっぽいのをいじってみたけどうまくいかなかった
2019/06/23(日) 10:49:31.56ID:RXmepqIZ0
まぁtesseractは精度悪くはないけど
実用には値しないよなぁ
実用には値しないよなぁ
2019/06/23(日) 11:32:22.27ID:cmA3lp6Y0
何を持って実用というかによると思うが
tesseractエンジンのCapture2Textにはずいぶんお世話になってる
tesseractエンジンのCapture2Textにはずいぶんお世話になってる
2019/06/23(日) 15:55:40.30ID:oeEPZCVa0
tesseractって認識精度はともかく校正はどうやんの?
なんかいいツールある?
なんかいいツールある?
2019/06/24(月) 00:53:07.52ID:GF5eEgcd0
テキストエディタで認識結果のファイルを開いて、
誤認識している文字列を肉眼で拾ったら、
Grepツールに渡してフォルダごと全ページを正規表現検索して、
ヒットしたら正しい文字列に置換。
の繰り返しが基本。
最初にやるのは、まず一行の文字数を揃えること。
一行40文字で組まれているのに、それ以上あればその行はどこか
間違っている。
例:一行41文字以上で行末が句読点ではない文字列を検索する正規表現
^(.{41,}[^、。]$
誤認識している文字列を肉眼で拾ったら、
Grepツールに渡してフォルダごと全ページを正規表現検索して、
ヒットしたら正しい文字列に置換。
の繰り返しが基本。
最初にやるのは、まず一行の文字数を揃えること。
一行40文字で組まれているのに、それ以上あればその行はどこか
間違っている。
例:一行41文字以上で行末が句読点ではない文字列を検索する正規表現
^(.{41,}[^、。]$
2019/06/26(水) 20:48:52.13ID:VPvPk7G50
仕事で手書きのファックスがバンバンきて、金額いれて計算して合計送り返す昭和なことしてるんだけど、
pc.スマホでスキャンしてエクセルで自動計算するには何が良いですかね?pc買い替え?タブレット購入?
ちなみに得意先のファックスの連打はパソコン持ってない奴らがほとんどでそちらの改善はほぼ無理
pc.スマホでスキャンしてエクセルで自動計算するには何が良いですかね?pc買い替え?タブレット購入?
ちなみに得意先のファックスの連打はパソコン持ってない奴らがほとんどでそちらの改善はほぼ無理
2019/06/28(金) 09:45:39.33ID:WMaziBi/0
最近の手書きOCRは優秀らしいぞ。
でも、ソリユーション価格だから数百万円とかなんだろうな
でも、ソリユーション価格だから数百万円とかなんだろうな
2019/07/05(金) 13:04:14.42ID:8rCNDdqb0
C2Tの翻訳結果に変な文字列↓が挟まるようになったけど、何ぞこれ
ce4eb3e12fa6d7940ab33a38d4d816ab
文章の終端にくっついてるみたいだから、改行記号か何かが化けてるんだろうか
ce4eb3e12fa6d7940ab33a38d4d816ab
文章の終端にくっついてるみたいだから、改行記号か何かが化けてるんだろうか
2019/07/17(水) 14:53:00.47ID:fjEXnK4S0
>>149
tesseract-ocrでOCRすると、たしかテキストの末尾に何か挟まってることが多いね。
Meryだと一文字の記号で[FF]と表示されるけど、同じものかしら。
検索/置換で真っ先に削除するから実害は感じないけど。
tesseract-ocrでOCRすると、たしかテキストの末尾に何か挟まってることが多いね。
Meryだと一文字の記号で[FF]と表示されるけど、同じものかしら。
検索/置換で真っ先に削除するから実害は感じないけど。
2019/09/15(日) 22:59:06.77ID:KlCpzq3m0
MicrosoftのLensを使って、FAXで送られた書類をスマホで撮影して取り込んだけど
文字小さいから全然読み込めなかったわ
文字小さいから全然読み込めなかったわ
2019/09/15(日) 22:59:40.51ID:KlCpzq3m0
あげ
153名無しさん@お腹いっぱい。
2019/09/23(月) 22:23:53.52ID:E/6na/zQ0 Capture2Text使ってたら突然翻訳されなくなりました
英語と日本語で上下に別れていた枠が上の英語のみ
再翻訳のボタンも消えました
設定見直してもまったく変わっておらず
対処方検索してみてもみつからないです
英語と日本語で上下に別れていた枠が上の英語のみ
再翻訳のボタンも消えました
設定見直してもまったく変わっておらず
対処方検索してみてもみつからないです
2019/10/16(水) 04:14:51.41ID:v6/B1Ui70
2019/10/16(水) 04:18:09.12ID:v6/B1Ui70
2019/10/16(水) 07:25:42.98ID:v6/B1Ui70
>>154
tesseract --print-parameters
A list of useful control parameters
https://github.com/tesseract-ocr/tesseract/wiki/ControlParams
認識に自信が無くても何かの文字を出力するようなパラメータが見つけられません。
tesseract --print-parameters
A list of useful control parameters
https://github.com/tesseract-ocr/tesseract/wiki/ControlParams
認識に自信が無くても何かの文字を出力するようなパラメータが見つけられません。
2019/10/16(水) 08:24:23.64ID:LNV65aKZ0
いつまでたっても小説テキスト化位では
eTilTran 読取革命の組み合わせが最強だな
進歩なし
winでは
eTilTran 読取革命の組み合わせが最強だな
進歩なし
winでは
2019/11/05(火) 18:14:11.50ID:cSgW8apd0
Capture2TextのCLI版で日本語をスキャンして結果をコマンドプロンプトに出力すると
文字化けするのですが対処法はありませんでしょうか
オプションで--clipboardをつけてクリップボードを経由すると文字化けなしで結果が取得出来るのですが
クリップボードを汚したくないので文字化け無しで出力したいです
OCR実行前にコマンドプロンプトの文字コードを変えても効果がありませんでした
文字化けするのですが対処法はありませんでしょうか
オプションで--clipboardをつけてクリップボードを経由すると文字化けなしで結果が取得出来るのですが
クリップボードを汚したくないので文字化け無しで出力したいです
OCR実行前にコマンドプロンプトの文字コードを変えても効果がありませんでした
159名無しさん@お腹いっぱい。
2019/12/10(火) 01:29:48.62ID:sT0hUZAS0 つい最近OCRソフト探し始めたんだけど、日本じゃ結構前から開発してるとこ無いと知って唖然。
ネットで検索すると丁寧に比較解説してるサイトがすぐ見つかるけど、そこによるとパナの読取革命が一番高性能みたいだね。
ただ長らくバージョンアップしてないしこれからもする事はないみたいだ。
その点アドビは性能面ではパナに劣るけどこれからも開発続けてくし何よりOCR化した時のサイズが小さい。
パナのほうは最大10倍近く膨れ上がるしどうにかならんかの
ネットで検索すると丁寧に比較解説してるサイトがすぐ見つかるけど、そこによるとパナの読取革命が一番高性能みたいだね。
ただ長らくバージョンアップしてないしこれからもする事はないみたいだ。
その点アドビは性能面ではパナに劣るけどこれからも開発続けてくし何よりOCR化した時のサイズが小さい。
パナのほうは最大10倍近く膨れ上がるしどうにかならんかの
2019/12/10(火) 03:32:57.63ID:UgLmsfEi0
>>159
読取革命でOCR透明テキストを足してからAcrobatで圧縮
読取革命でOCR透明テキストを足してからAcrobatで圧縮
2019/12/10(火) 03:36:47.74ID:UgLmsfEi0
>>159
DeepLearningに期待しよう。まず手書き文字認識と、版木本の古文書文字認識から始めて、手書き古文書文字認識が目標。
DeepLearningに期待しよう。まず手書き文字認識と、版木本の古文書文字認識から始めて、手書き古文書文字認識が目標。
162名無しさん@お腹いっぱい。
2019/12/10(火) 06:54:24.38ID:tVn6fHFe0 Adobeの認識エンジンは自社開発ではなかったような。
今は違うのかな。
GoogleのAPIが実用的になってきている。
あとフロントエンドのGUIさえあれば良いのだが。
今は違うのかな。
GoogleのAPIが実用的になってきている。
あとフロントエンドのGUIさえあれば良いのだが。
2019/12/11(水) 06:28:23.68ID:XqwDZL500
PDFelementtってやつ買おうと思ってるんだが、これも結局パナソニックのシステム利用してるんかね。
買い切りでPDFも編集も出来るからいいのかなって思って。
買い切りでPDFも編集も出来るからいいのかなって思って。
2019/12/11(水) 08:50:49.67ID:djMuwAyz0
2019/12/13(金) 14:39:43.81ID:9aicjBgH0
結局のところ修正作業がしやすいのが一番
なんなら必ず同じ読み取りミスをするならそのほうがいいくらい
あとルビ対応が少なすぎる
なんなら必ず同じ読み取りミスをするならそのほうがいいくらい
あとルビ対応が少なすぎる
2019/12/22(日) 14:43:51.13ID:ri547sjN0
e.Typist使ってるが
透明テキストPDFにするなら修正しないし、
txt化するなら良くある読み取りミスを一括で置き換えてそれだけになっちまうわ
ルビはレイアウトを誤認識することがあるから無視してる
高圧縮のPDFの出来がAcrobatより良いんでそこは良い
透明テキストPDFにするなら修正しないし、
txt化するなら良くある読み取りミスを一括で置き換えてそれだけになっちまうわ
ルビはレイアウトを誤認識することがあるから無視してる
高圧縮のPDFの出来がAcrobatより良いんでそこは良い
2019/12/25(水) 11:59:05.90ID:w0pZX05+0
縦書きの透明テキスト付きpdfで
読取革命超える認識率のOCRって無いんかな?
Google Cloud Visionで出来れば最高なのになぁ
読取革命超える認識率のOCRって無いんかな?
Google Cloud Visionで出来れば最高なのになぁ
2020/01/04(土) 06:33:55.83ID:oSFqms1b0
正月休みでGoogle Compute VisionのOCRで透明テキスト付pdf作るの作ったけど需要ある?
現状バグあり、Google API Key必要。
Windows用、複数ページは連番のjpgファイルをあらかじめ作ること。
日曜に削除予定。githubに置こうと思う。
https://1drv.ms/u/s!Agi0gM6bLD5Wr2wURjeqAok7F450
現状バグあり、Google API Key必要。
Windows用、複数ページは連番のjpgファイルをあらかじめ作ること。
日曜に削除予定。githubに置こうと思う。
https://1drv.ms/u/s!Agi0gM6bLD5Wr2wURjeqAok7F450
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【速報】立花孝志容疑者、起訴 [おっさん友の会★]
- 【芸能】長嶋一茂 高層ビル住民にパラシュートのススメ 香港火災を例に「理性を最後まで失わずに対処できる…」 [冬月記者★]
- 「東京で年収1000万世帯」は負け組か?地方の「イオンで楽しそうな家族👨‍👧‍👦」がまぶしく見える [パンナ・コッタ★]
- 【おっぱい】「女性を見つけた瞬間に揉みたいという衝動にかられ…」路上で25歳女性にわいせつ行為か 21歳土木作業員の男を逮捕★2 [nita★]
- 【テレビ】玉川徹「これ天災じゃなくて人災でしょ。責任どうするんだ」 日本のホテル、中国人観光客からのキャンセルが相次ぐ★2 [冬月記者★]
- 石破茂氏、「高市さんよくぞ言った」の空気に待った 存立危機事態…考えてはいても「公の場で言うことか」:東京新聞 ★2 [少考さん★]
- 【朗報】最近の日本、ルックスがヤバい子どもが絶滅しているらしい [242521385]
- 【緊急アンケート❗】みんなの好きな声優は❓【求参考画像】🏡
- 【高市速報】立花孝志起訴wwwwwwwwwwwwww [931948549]
- 風俗女「見た目汚い50代のおばさんと枕SEXできる?」→ホスト「無理無理😂。」→女「私はそれやってアンタに会いに来てんだよ!」 [153490809]
- 中国「誠意を見せる気があるなら高市早苗は辞任しろ。」キタ━(゚∀゚)━! [153490809]
- 日本で「半うつ」という病が増加中。仕事や家事はできるけど心が動かない [663766621]
