【超解像】画像拡大ソフト総合スレ2【waifu2x】 [無断転載禁止]©2ch.net

2016/05/10(火) 11:28:05.20

画像を人工知能(Neural Network)を利用して拡大、あるいはノイズ除去するソフトウェアの話題を総合的に扱うスレです。
本来の用途は静止画が対象ですが動画のアプコン処理に関する話題もOKです。
ただし動画編集ソフトの使い方の部分の話は各ソフトのスレに行って下さい。

--主なソフト--
・waifu2x
本家Webサービス
http://waifu2x.udp.jp/

・waifu2x概要：二次元画像を拡大したいと思ったことはありませんか？ (waifu2x作者氏のブログ)
http://ultraist.hatenablog.com/entry/2015/05/17/183436

・waifu2xとその派生ソフト一覧
※リンクがNGワードに！

・waifu2xのベンチマーク結果まとめ - Togetter
http://togetter.com/li/831437

・無料で二次元画像を人工知能が補完してハイクオリティで1.6倍/2倍に拡大できる「waifu2x」 (gigazinの記事)
http://gigazine.net/news/20150519-waifu2x/

・Otaku ワールドへようこそ！［212］嫁を拡大する人工知能／GrowHair (日刊デジタルクリエイターズの記事)
※従来の拡大手法とwaifu2x、SRCNNの違いについての丁寧な解説記事
http://blog.dgcr.com/mt/dgcr/archives/20150605140100.html

・NeuronDoubler
人工知能超解像プログラム NeuronDoubler
http://loggialogic.blogspot.jp/2012/06/neurondoubler.html

VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured

2016/05/10(火) 11:29:30.45

MSE・PSNRによる画像拡大アルゴリズム10種・ソフト8種、計14パターンの画質評価結果
http://loggialogic.blogspot.jp/2015/09/msepsnr10814.html

・waifu2xとその派生ソフト一覧
http://kourindrug.sa kura.ne.jp/waifu2x.html

Q． waifu2xの派生バージョン多いけどどれがオススメ？
A． Windows 64bitかつGPUがnVidia製なら、Waifu2x-caffe。それ以外の環境なら、tanakamura版あたりを試すと良い。
2015/11/11現在tanakamura版はアルファチャンネルを上手く処理できないようなので、その場合はWaifu2x-caffeを使うと良い。

・歴代スレ
waifu2x [転載禁止]??2ch.net
http://anago.2ch.net/test/read.cgi/software/1433637613/

【超解像】画像拡大ソフト総合スレ1【waifu2x】 [転載禁止]??2ch.net
http://potato.2ch.net/test/read.cgi/software/1447218757/

2016/05/10(火) 11:57:50.59

いちおつ

2016/05/10(火) 12:11:54.14

　　　　　　　　　旦旦旦旦旦
　　　　　　　　　旦旦旦旦旦
　　　　　　　　　旦旦旦旦旦
　　　　　　　　　旦旦旦旦旦
　　　　　　　　　旦旦旦旦旦
　　　　　　　　　旦旦旦旦旦
　　　　　　　　　旦旦旦旦旦
.　　 ∧＿∧　　旦旦旦旦旦
　　 ( ´･ω･ ).　旦旦旦旦旦
.　　 /ヽ○==○ 旦旦旦旦旦
　　/　　||＿　|_ 旦旦旦旦旦
　　し'￣(_)）￣(_)）￣(_)）￣(_)）　

2016/05/10(火) 12:52:09.56

>>2
> 2015/11/11現在tanakamura版はアルファチャンネルを上手く処理できないようなので、その場合はWaifu2x-caffeを使うと良い。

これは古い情報で、20151130以降のバージョンならアルファ対応してる。

2016/05/10(火) 13:32:05.47

>>1乙
>>5
cppの0101入れてFireGL環境でqtのGUIつこうてますけれど
元画にあるPNGアルファチャンネル消えて色があふれたみたいな画になるよ
使い方が悪いのか見当がつかない

2016/05/10(火) 13:55:21.96

ここは暴言多いんで、ﾜｯﾁｮｲありでいいわ

2016/05/10(火) 13:57:29.01

おつおつ

2016/05/10(火) 14:49:07.77

こっちが本スレかな？
乙

2016/05/10(火) 15:11:00.81

スレ立て乙

2016/05/10(火) 17:42:07.13

ﾜｯﾁｮｲで特に必要性薄くなったけど念のため・・・
オススメ追加NGワード（正規表現）の手順　（改訂版）

１．[ツール]→[設定]→[機能]→[あぼーん]→[NGEx]→テキストボックス内に適当な名前（例：caff荒らし）を入力して→[追加]

２．次に開くウィンドウで、以下の様に設定する。
　　　NGWORDのタイプを「正規(含む)」に変更し、そしてキーワードに以下をコピペ（予め1行にすること）
(は([ 　\.]+)?み([ 　\.]+)?出|V([ 　\.]+)?G([ 　\.]+)?A|1([ 　\.]+)?0([ 　\.]+)?2([ 　\.]+)?4|7([ 　\.]+)?6([ 　\.]+)?8|
1([ 　\.]+)?9([ 　\.]+)?2([ 　\.]+)?0|6([ 　\.]+)?4([ 　\.]+)?0|M([ 　\.]+)?D([ 　\.]+)?.?([ 　\.]+)?5([ 　\.]+)?5([ 　\.]+)?0([ 　\.]+)?0([ 　\.]+)?|
L([ 　\.]+)?7([ 　\.]+)?9([ 　\.]+)?7|解([ 　\.]+)?像([ 　\.]+)?度([ 　\.]+)?|糞|雑([ 　\.]+)?魚|ク([ 　\.]+)?ソ|ザ([ 　\.]+)?コ|客|干([ 　\.]+)?[さしすせ])

３．左下のリストボックスを「透明あぼ～ん」に設定。[OK]を押すれば新規レスからあぼ－んされるので取り敢えず終わり。
　　　既存のレスも消去したいなら４．も実行。

４．[スレッド]→[このログを削除]して、[ファイル]→[最近閉じたスレ]から削除したスレを開き直す。
　　　レス番号が歯抜けになっているはず。

２．のキーワードはその動向を見ながら変更追加して下さい。中には関係ないのも巻き込むので注意ですね。
正規表現をもう少し駆使すればかなりの精度でNGできます。ただ上記とその変更でも十分活用出来るでしょう。

2016/05/10(火) 18:18:00.24

>>6
qtのGUIって↓のやつだよね？
https://github.com/khws4v1/waifu2x-converter-qt

試しに使ってみたけどアルファ保持されたよ。
アルファ消えるのはもしかして古いバイナリを使うように設定してるとかかな？

2016/05/10(火) 18:19:52.36

ﾜｯﾁｮｲのおかげでレトロガイジが駆逐されたみたいやな

2016/05/10(火) 18:42:31.00

レトロガイジって何ですか？

2016/05/10(火) 18:48:05.87

「レトロなキチガイ児」のことじゃね？知らんけど。

2016/05/10(火) 19:40:07.52

>>12
お手数かけました情報ありがとう
そちらで保持されておられるのなら自分の方法が間違ってるに違いないと確信した
qt側の設定で最新のcppの実行ファイル指定はできていたので何か間違いがないか
手順を再確認してみる

2016/05/10(火) 19:52:07.36

昔の栄光にすがってる、哀れな独りよがりのピエロのことだよ。

2016/05/10(火) 20:02:00.70

>>12
試行した結果
自作PNG→OK
webで拾ってきた透過PNG→NGなのもある
作者さんが注意書きされておられた
bKGDに変な値入ってると変な色が出る可能性はある。
上記に該当する画像だと判断できました
アプリで開いて透過PNGで保存し直しwaifuするとOKでした
いまさらな話題で失礼しました

2016/05/10(火) 23:59:53.00

新しい機器が買えないニート

2016/05/11(水) 15:04:46.70

一応連絡です(作者の人ではないのですが)
waifu2x-c/c with Batchfile and HTA-GUIをご利用中の方へ

・画像アップロードでウェブサイトを乗っ取られる攻撃が進行中--「ImageMagick」脆弱性
http://japan.zdnet.com/article/35082361/
というニュースが少し前より出ております。
念のため、最新のImageMagickに更新されておいた方がいいかと思います。

・ImageMagickダウンロードページ
http://www.imagemagick.org/script/binary-releases.php#windows
(種類がいろいろあるようですが、ImageMagick-7.0.1-3-Q16-x64-dll.exeでよいかと思います。)

なお更新するにあたって、事前に古いバージョンを手動削除し、念のためCCleaner等できれいにしてから最新版をインストールされた方がいいと思います。
(手動で削除しないと古いバージョンが残ったままになってしまうため)

・インストール時の注意点
途中で「Select Additional Tasks」の画面が表示されたら

上から2番目
Add application directory to your system path

1番下
Install ImageMagickObject OLE Control for VBscript,Visual Basic,and WSH

この2点に必ずチェックが入った状態にして先に進めること。

2016/05/11(水) 15:20:21.00

ちなみに、先ほどImageMagickを更新してから久々にwaifu2x-c/c with Batchfile and HTA-GUIを起動して使ってみましたが、
やはり私のPCでは利用できないままなのは変わらないようです。
(起動時にエラーは出るし、ファイルの選択すらできない。)

2016/05/14(土) 10:55:12.05

前スレで画像のbit深度について書いていた件なんだけど、いろいろ調べていたら
・ImageMagickのビット深度と画質劣化
http://mikio.hatenablog.com/entry/2016/02/12/220435
という興味深いページに行き当たった。

曰く、「ImageMagick 7からはHDRIがデフォルトになる」そうです。
※HDRIとは、「内部表現を浮動小数点数で持つ機能」のことだそうです。
先日>>20にてアップデート推奨と書きましたが、現在のバージョンが7.0.1-3ですので、おそらく対応しているものかと思います。

ImageMagick 7以降を使うと旧バージョンに比べて画像フォーマットの変換時の劣化を抑えられるかも。
旧バージョンを利用中の方は更新されておく方がいいと思います。

ところでもともと調べていたのは「各色8bitの画像を各色16bitにきれいに変換できるフリーソフト」を探すことが目的だったのですが、案外ないものですね。
(Photoshop関連の情報はたくさん出てくるのですが)
ImageMagickだとできるかなと調べているのですが、よくわからんです。
誰かご存知でしたらよろしくです。

2016/05/14(土) 11:04:35.89

HDRIについてさらなる考察をされている件も興味深いので合わせてどうぞ
(HDRIかつ16bit、あるいは32bit、64bitのケースなど)

・ImageMagickのビット深度と画質劣化その2
http://mikio.hatenablog.com/entry/2016/02/15/221433

2016/05/14(土) 11:13:20.68

＞「各色8bitの画像を各色16bitにきれいに変換できるフリーソフト」
綺麗に、ってのは、オーディオで言うところのアップサンプリングみたいなのを考えてる？

解像度を上げつつ、補完するピクセルの色を16bitでしか
表現できない色で表現する、ならわかるけど
解像度を上げないでそのまま16bit化するのはただ
ファイル容量増えるだけで何も変わらないよ

2016/05/14(土) 11:44:34.95

>>24
「オーディオで言うところのアップサンプリングみたいなの」ということになるのかどうかわかりませんが、
各色16bitに変換する際にトーンジャンプが起きないように補完しつつ変換するような感じの動作をするものを探しています。

2016/05/14(土) 12:20:35.15

表現が間違っているかも。
元画像に含まれるトーンジャンプ(バンディング)を滑らかに補正しつつ、bit深度を拡張、というべきかも。
つまり元画像が高圧縮された画像であればあるほどトーンジャンプが発生している確率が高いので、
そのまま拡大するのではなく、あらかじめ階調をできる限り滑らかに補正しておいてからwaifu2xに渡す、というような前準備を考えています。
等倍サイズでは目立たなくとも、拡大するとトーンジャンプは目立つことが多いので。

2016/05/14(土) 12:29:11.32

可能性の話になるけれど、ディープラーニングを利用したノイズ除去とは別にやの、トーンジャンプ除去モードとかbit深度拡張モードがあればいいのか？
(等倍での出力も対応)

ノイズ除去も目的に応じてより細かいモードがあるといいのかも。
ブロックノイズ軽減モードとか、モスキートノイズ軽減モード、カラーノイズ除去モード、などなど。

2016/05/14(土) 18:50:49.16

思いつきのメモ
画像を圧縮することによって発生する問題(ブロックノイズとかトーンジャンプとか)を、圧縮前はこうだっただろうという想定で復元する「超復元」。
さすがにそんな都合のいいものは無理？

2016/05/14(土) 19:20:53.65

>>28
1.00000001倍に拡大して自動判別してノイズ除去で良いんじゃね

2016/05/14(土) 21:32:59.96

>>28
トーンジャンプ／ブロックノイズした絵を入力・解除された絵を出力するように学習させれば可能かも

2016/05/15(日) 04:52:32.51

＞画像が高圧縮された画像であればあるほどトーンジャンプが発生している確率が高いので
トーンジャンプ(バンディング) が判るような圧縮画像じゃ、8bit諧調ですらないのでは？ってレベルの画像なんじゃないだろうか・・・

2016/05/16(月) 15:12:06.66

処理時間半分以下になるバージョンの公開が待ち遠しい

2016/05/16(月) 16:35:15.65

フィギュアの写真をアニメ調にしてくれる機能があったらなぁ。

2016/05/16(月) 18:25:08.61

新バージョン待ち遠しいな

2016/05/16(月) 19:44:29.81

新モデルはupconvブランチに置いてますけど
ピクセルアートなどでひどいアーティファクトが出てることに気付いたのでまだ変更します。
時間半分以下でイラストでのベンチマークも上ではありますけど
以前より悪くなるパターンもあってあやしくなってきました。

2016/05/16(月) 21:18:27.97

処理時間よりどれくらい綺麗に処理出来るようになったかが気になるな
特に前スレで書かれてたノイズを使ったときの溶けた感じや輪郭線など

とにかく作者さん頑張って

2016/05/17(火) 08:12:24.79

モデルデータなんだけど、現状はアニメ用とか写真用とかに分かれていて利用者が選択するやり方になっているけど、
絵柄の部分ごとに自動的に切り替えて適用させることはできないものなんだろうか？
(切り替える判断をディープラーニングでさせる)
・階調情報が少ない面が一定以上ある部分→アニメモデル
・輪郭線が複雑に構成されている部分→Yモデル
・それ以外→RGBモデル
みたいな。

2016/05/17(火) 11:39:19.21

>>35
ピクセルアートはコントラスト比が高い絵柄が多いから、現状のwaifu2xのやり方だと溶ける症状が出やすいかもしれませんね。
どうも溶ける症状が出やすいところって、コントラスト比の高い部分が隣接しているような場所でおこりやすい気がしますね。
(だから結果として輪郭周辺部とかで目につきやすいのかも)

コントラスト比が高い部分とコントラスト比の低い部分を同じ割合で強調してしまっているのかな？
元画像のコントラスト比が高くなるほど、強調する度合いを低下させておくような仕掛が必要だと思います。

2016/05/18(水) 21:27:07.33

新バージョンでは輪郭線が綺麗になる？
SDからFHDにアップコンバートするとこんな感じになるんだよね…
http://i.imgur.com/GhxuUH3.png

2016/05/19(木) 11:36:41.13

>>39
みんなそれを期待していると言っても過言ではないのけど、実際問題としては相当難しいんだろうなとも思う。
というのは、人間の目には輪郭とは「一本の繋がった線」として認識しているので、目に見えにくいところが少しくらい途切れていても
脳内で補完される(これを「アモーダル効果」とかいうそうです)仕組みがあるけれど、コンピューターに勝手にそのような効果が備わっているわけではないので、
輪郭線の細部の「ムラ」になっていたり、ノイズまみれになっているところを、いかに連続した線としてきれいに見せる＝すなわち「連続した線として認識できる」
かが鍵になるのだと思う。
つまり、現状のwaifu2xは細かい点ごとを処理している状態であるところを、あらかじめディープラーニングを使って「この連続成分は線なのか？」ということを
事前に認識する前処理を施したうえで、「線成分(＝連続成分)」と認識した場所と、そうではないところで処理方法を切り替えることが必要なのではないかと個人的に
思ってはいるのだけど(連続成分については超解像効果をオフ、もしくは弱めて適用)、作者様、そんな前処理&処理方法の切り替えはできないものでしょうか？

2016/05/19(木) 11:54:46.91

現状が出力1px出すのにその周りの7x7pxがどうなっているかで出力を決めているので
その範囲でそれが線か点か平面かみたいなところは判定できていると思います
新モデルはこれが12x12に広がるのでもう少し複雑なパターンも分かるのではと思うけど
フィルタが大きくなるとそれだけ無関係なピクセルから影響を受けやすくもなるので
アーティファクトも出やすくなってしまう

2016/05/19(木) 12:34:06.20

>>41
参照範囲を拡張されるのですか？
それはいいですね。
アーティファクトについては元画像が圧縮画像である場合に発生しやすいかと思いますので、現在装備しているノイズ除去とは別に、
アーティファクトの影響が出やすそうな圧縮ノイズだけを事前に除去するようなモードをつけておくことで対処することは難しいのでしょうか？
(>>28で書いたような感じのブロックノイズとかトーンジャンプに加え、輪郭周辺部に出やすいモスキートノイズなどを個別にオン・オフできるといいかと思いますが)

2016/05/19(木) 12:42:22.08

作者様のTwitterを見たところ、「Imager::AnimeFace」なる輪郭検出に必要になりそうなソフトウェアをすでに作られていたご様子。
このソフトの技術で認識した輪郭部だけに適用する「輪郭ノイズ除去フィルター」なんて組み込めないものですかね？

2016/05/19(木) 12:44:38.11

こんなソフトもあるようですね。
・JPEGノイズ除去フィルタ
http://www.webtech.co.jp/help/ja/optpixlabs/jpeg_noise_filter/

2016/05/19(木) 12:49:58.03

人のいるところでは開かないほうがいいページだけれども、参考にはなりそうなところ。

Googleで「輪郭ノイズ除去フィルター」で検索すると、「プロカメラマンのPhotoshop女性写真補正術」なるところが表示されますのでそこに出てきます。

人前では見るなよ！見るなよ！

2016/05/19(木) 12:51:00.20

>>40
分かりやすい説明ありがとう
やっぱりみんなもそこ気になってるんだね
輪郭線も気になるけど、画像みたいな色が違う境界線も新バージョンで改善されると嬉しいな

要望ばかりで申し訳ないが、作者様頑張って下さい

2016/05/19(木) 12:57:20.90

アニメって原寸でも少しボケ気味だから拡大前に若干縮小するか、シャープかけてからの方が良い結果になることが多い

2016/05/24(火) 01:06:43.33

waifu2x-c/c with Batchfile and HTA-GUI作者です、ご無沙汰してます

>>20
ありがとうございます。私もこのレスを見て始めて脆弱性のことを知りました...
>>21
申し訳ないです。。。もしよければバッチファイルだけでもご利用ください。

重いのに使ってくださる方がいて嬉しい限りです。
リアルが多忙ですが、tanakmura氏版がLv3に対応した後ぐらいの時期に次版をリリースしようと考えています。
次版は少々軽くなっているはずです。
また、近いうちに選択肢が簡単な(コマンドライン準拠でない)バージョンも用意したいと考えています。
個体差でエラー&起動しない問題の解決にも取り組みたいところです。

2016/05/24(火) 09:35:22.04

>>48
ImageMagickの件については、>>22-23に記述した件もありますので、更新しておいて損はないかと思います。
なお、「各色8bitの画像を各色16bitにきれいに変換できるフリーソフト」の件ですが、どうやらImageMagickにそのような機能があるっぽいのですが、まだよくわからず。
引き続き調査中。
(ImageMagickをGUIで使える汎用性の高いフロントエンド(AviUtlみたいな)ってないのかな？)

2016/05/24(火) 10:00:09.81

ひょっとして8bit→16bitをImageMagickで変換するには

convert input.png -depth 16 output.png

だけでよかった？

2016/05/24(火) 10:13:01.51

そんなわけはなかった・・・
引き続き調査。

2016/05/24(火) 17:42:11.99

倍速バージョンがcaffeに採用される日はまだ遠いのでしょうか？

2016/05/24(火) 18:13:16.41

各16bitにしてもグラボやモニタが対応してないと確認できないよーな

2016/05/24(火) 19:22:40.86

16bitは編集前提だから
まぁ、Radeonの次期モデルから10bit出力対応になるし、モニターも対応モデルが増えていくから無駄にはならん

2016/05/24(火) 20:29:37.48

>>39
これ学習時に縮小するときにジッタ成分としてランダムにサンプリング位置を僅かにずらしたのを学習させれば
ノイズとして巧いこと処理できるようにならないかな
縮小したのをWarpsharpとかランダムシフトでずらして凸凹を再現してもいいけど

2016/05/24(火) 20:41:22.46

>>54
ちゃんとｷﾚーに処理されてたら無駄にならないからいいけど、
いざ確認できるようになってから、誤差拡散ノイズまみれとかになってたら嫌じゃね？

2016/05/24(火) 20:59:08.32

ビット拡張は暗部階調に意味があるんだからガンマカーブやトーンカーブいじって明るくしてやれば確認は出来るでしょ
10bit出力だってDirectXやOpenGLのフルスクリーンで相当昔から出来るがDeepColorのTVでもそのままじゃわからん
Blu-Ray再生でRGBのまま再生したいときにロスが減るという意味がある程度かもしれん

2016/05/28(土) 18:13:12.85

新バージョンはいつ頃になりそうですか？

2016/05/29(日) 03:27:38.86

rigayaの日記兼メモ帳技研公開 2016
http://rigaya34589.blog135.fc2.com/blog-entry-788.html

NHKの方でも縮小して拡大、PSNR算出みたいな事するのね

2016/05/29(日) 03:40:46.10

ムッ、ブログ記事の画像URLのGiken2016_10s.jpgをGiken2016_10.jpgにすると読みやすいのが出るな

2016/05/31(火) 00:49:27.83

>>58
平均的にはいいんだけど，現在のモデルよりすごく悪くなる例がいくつかあってどうしてもよくならないので苦悩しています
（ウェブの方を置換するので現在より悪い例はできるだけ無くしたい）
あと2倍といっていたけど，モデルのロード時間も測ってしまっていて
測りなおしたら4倍近く速かったので，もう少し遅くなっていいのでよくできないかなと考えています

2016/05/31(火) 10:03:28.13

>>61
お疲れ様です。
すごく悪くなる例というのは、以前おっしゃられていたピクセルアートなどの場合でしょうか？
私はプログラミングのことはよくわかりませんが、悪くなる原因というのは現行方式にくらべて新方式が速く処理できる以上、
何か重要な処理が省かれてしまっている、もしくは簡略化されてしまっている、という可能性はないのでしょうか？
逆に言うと、省かれたか簡略化された処理がかねてより問題の輪郭線などが溶けてしまう要素とも関係していたりはしないのでしょうか？

もしそうであるならばですが、拡大処理などをする前にまず画像全体をチェックして、新方式で問題ないと判断される場所は新方式で高速処理し、
問題が出そうと判断される場所は現行方式、あるいはさらに改良した方式をあてがうなど、処理を切り替える必要性があるのではないでしょうか？

それと3年ほど前の記事ですが、こんな記述も参考になるかも
・東芝「REGZA Z8X」開発陣に聞く、「本格的4K時代」　4Kだから差が出る画質。地デジを高画質化の秘密
http://av.watch.impress.co.jp/docs/series/rt/20130809_610976.html

「ではなにが実物感に繋がっているのかというと、グラデーションの美しさであったり、自然なエッジの持つ「柔らかいが細かい」という感覚です。
映像エンジンとしては、階調性や微小な振幅が失われないよう、いかに内部のバス幅を広くとるか、ということを意識して開発しています。

最後まで12bitで伝送するといったことにこだわらないと、4Kらしい実物感が出てこないのです。」
→つまり、前回お話ししていた8bit画像を高bit化する際の処理方法とその後の情報精度維持が効く！

2016/05/31(火) 10:04:09.16

・微細テクスチャー復元
http://av.watch.impress.co.jp/img/avw/docs/610/976/html/ppt05.jpg.html

「2Kの段と4Kの段をしっかりわけて処理しないと、そうした「リアリティ」が出ない

そんなにゲインをかけてはいないです。微小なところしかかけていないんですが、それを入れるか入れないかで、4Kになってしまうと大きくかわってきます。」
→微小な階調差の領域とそうでないところを同じ処理(＝強調)をしてはいけない！
※協調具合は逆ガンマ特性であてがうといいのかも

・絵柄構造適応型MPEG-NR
http://www.toshiba.co.jp/regza/lineup/z700x/quality_03.html#psa
→絵柄の相関性に基づいてフィルターの形状を適正化の部分を取り込むことで、参照範囲を拡張することによるアーティファクトの問題を軽減！

2016/05/31(火) 10:11:05.50

8bit画像を高bit化について追記

ノイズ除去や拡大する前に、ディープラーニングを使った高bit化(8→16bit化)が必要なのかも。
※単なるデータだけ16bitにしました、ではなく！

2016/05/31(火) 12:33:31.37

>>64を訂正

元画像でディープラーニングを使った高bit化(8→16bit化)ではなく、waifu2xで内部的に確か使っているニアレストネイバーで拡大した画像をディープラーニングを使った高bit化(8→16bit化)のほうがいいのか？

2016/05/31(火) 12:35:45.44

いや、それなら拡大後の画像にディープラーニングを使った高bit化(8→16bit化)を適用すればいいのか？
手元で試せるわけじゃないからわからんな・・・

2016/05/31(火) 12:57:25.17

そもそも原点に戻るべきなんだろうか？

waifu2xが出た当初、今よりも輪郭が溶けやすかったので、NNEDI3で拡大後にwaifu2xでノイズ除去のみ適用というのをやったことがあったけど、
waifu2xが改良されてからNNEDI3を使う方法は全く試してなかったんだよねぇ。

NNEDI3と最新版のノイズ除去との組み合わせ、あるいは以前に書いたような輪郭成分と認識される部分だけに適用されるような新型ノイズ除去？との組み合わせならばどうなるのだろうとふつふつ・・・

そのうち時間が取れたら試すか。

2016/05/31(火) 13:14:26.12

手元に以前にNNEDIS3にて2倍、4倍、8倍に拡大した画像があったので改めて見てみたのだが、確かに眠い画像ではあるんだけど輪郭とかは自然なんだよね。
NNEDI3で拡大して、画像の面成分(＝「Imager::AnimeFace」にて輪郭と認識されないところ)のみwaifu2xにて超解像効果を適用・・・

それができるのならば、テレビなどでよくある解像度の変換はなしで、解像感だけアップする手段にも使えるのか？

2016/05/31(火) 13:20:06.61

ダラダラとうぜえ・・・

2016/05/31(火) 16:10:01.21

「私はプログラミングのことはよくわかりませんが」って奴が、よくまあ長々と愚にもつかない事を語れるもんだ
マジでどういう神経してるのかと

2016/05/31(火) 16:19:05.88

大手サイトで紹介されたのは初めて？
http://www.itmedia.co.jp/news/articles/1605/31/news119.html
以前話題になってた自動カラー化の

2016/05/31(火) 18:17:18.12

>>70
まあアドバイスをするぐらい良いじゃない
作者も嫌なら無視すればいいだけなんだし

2016/05/31(火) 19:23:41.36

>>61
結構苦労されてるみたいですね…
個人的に処理速度より精度を気にしてるので期待しています（特に輪郭線）

2016/06/02(木) 10:13:34.24

今日のGoogleは影絵作家の生誕記念バージョンになっているけれど、新バージョンは影絵とかも不得意かもと思ったところでひとつ気になったことがあったので調べてみた。

・Convolutional Neural Networkとは何なのか
http://qiita.com/icoxfog417/items/5fd55fad152231d706c2

気になったのは
「CNNの進化
年が経るにつれ精度が上がってきているCNNですが、近年の構成では以下のような特徴がみられます。
フィルタを小さくし、階層を深くする
PoolingやFCのレイヤをなくす
以下の図では、年々精度が上がるにつれレイヤが深くなっているのがわかります。」
の部分。

つまり、フィルターというか参照範囲そのものを増やすよりもレイヤー(考え得るパターンの分岐？)を深く(＝パターンを増やす)するほうが得策っぽい件なのだが、
そうであるならば、参照範囲は現行程度に留めて、フィルターの形を複数用意してそれぞれの絵柄に応じて一番しっくりくるフィルターの情報を基に畳みこみした方が
いいんではなかろうかとふと思ったのですが、ダメですかね？

フィルターをあらかじめ、正方形、長方形、△(向き四方向各々)菱形、8角形、とか用意しておいて、全部実行して一番いいのを選択。

TTLモードで回転による8パターンをやる時間があるならば、この方がいい結果が出るような気もするんですが。

2016/06/02(木) 10:30:41.45

すでにやっている人はいたようです。

・Deep Learning Advent Calendar 2015
http://vaaaaaanquish.hatenablog.com/entry/2015/12/25/005523
「sliding windowのスケールの違いによって入力も違うため, 誤認識が発生するという問題もありました.
そこで, Exhaustive Searchのスケールによる誤認識を減らすための画像処理手法や計算量を減らす手法*4, 物体検出に対して効率的な手法*5が出てきたり,
CNN以外でもsliding windowの欠点を補うようなRandom Forest的手法*6が出てきたりしました.」

で、さらにDeep Q-Network(DQN)などというものも出ているようで(名前がなw)
深い・・・

2016/06/02(木) 10:37:26.83

もう悪くなりそうなパターンを調べてそういうパターンを自動生成して学習データに加えることで無理やり対応した
例: http://ccsaku.moe.hm/gyazo/data/0b76b99850d7cc5eac0e4857da451890.png
こういうパターンを良くするのと引き換えにイラストの平均的なスコアは少し下がると思うけど
最悪な場合のスコアはかなり上がっているはずなのでいいやろという感じ

イラスト90枚のセットで，縮小に平均画素法を使ったときの平均PSNRが
既存: 36.74, 新: 37.07
縮小にLanczosを使った時が
既存: 36.76, 新: 37.25
で平均も既存よりは良くなっている
処理速度も2.4倍くらい速い
対応方法はこれでいいと思うので，
あとちょっと調節するのとノイズ除去付きも試してみてよければ追加で
ウェブの方は新モデルで置き換えることはほぼ決まりです

2016/06/02(木) 10:53:32.12

>>74
レイヤというのはwaifu2xでいうと畳み込み+ReLUを行うの回数のことで
>フィルタを小さくし、階層を深くする
これはVGG Netなどの3x3畳み込みを何度も繰り返すネットワークで
waifu2xは元からこれをベースにしています．
また1x1畳み込み以外だとレイヤを増やすと参照範囲も広がります．
フィルタの型は係数によって変わると考えていいと思うのでこれも最適化されているはず

2016/06/02(木) 10:56:14.63

>>76
お疲れ様です。
悪いパターンを自動生成して学習ですか。
それはよさそうですね。
確かにこういうコントラスト比の高く境界面の差が大きい画像を集中的に取り込んでおくのはいいと思います。
(そういう意味では影絵もいいのか？)
期待しております。

2016/06/02(木) 11:00:59.96

>>77
入れ違った・・・
解説ありがとうございます。

＞レイヤというのはwaifu2xでいうと畳み込み+ReLUを行うの回数
ということは、演算回数を利用者が任意に変更できるようになると、
・回数を減らして時間短縮(精度は落ちる)
・回数を増やして精度向上(時間はかかるが、1日でも2日でもバッチコーイならば・・・)
とかできるといいかもしれないなと思いました。

＞フィルタの型は係数によって変わると考えていいと思うのでこれも最適化されているはず
それは素晴らしい。

結果を楽しみにしておきます。

2016/06/02(木) 20:21:59.49

>>76
おお！
お疲れ様です
上で出てたアニメの輪郭線などは改善されそうですか？

2016/06/02(木) 23:11:39.30

今の感じだとアニメは拡大後の理想される線の質がイラストと違うので
イラストで学習しているとダメだと思います
写真モデルを使えば無難な結果になると思うけど

2016/06/03(金) 07:56:07.56

やっぱり輪郭線は直らないのか…
そこ期待してたのにだけにちょっと残念だ

2016/06/03(金) 08:07:32.57

写真モデルで試してと書かれていると思いますが…
写真モデル+TTL+新バージョンの組合せで、どれだけ改善されるか次第かと。

2016/06/04(土) 10:43:26.24

本家、もしかしてもう新バージョンに変わった？

2016/06/05(日) 00:04:39.84

いいえ

2016/06/06(月) 21:11:13.67

モノクロ写真をアップすると……？　「人工知能で白黒写真をカラーに」を試せるWebサービス
ディープラーニングを応用し、白黒写真を自然な色味に彩色する手法をブラウザ上で実行できるWebサービスが公開された。
http://www.itmedia.co.jp/news/articles/1606/06/news131.html

2016/06/07(火) 01:06:02.01

>>86
へー、これもローカルで動くやつ誰か作らないかな（他力本願

2016/06/07(火) 09:35:28.02

>>86
学習データが偏っているんだろうけど、黄色あたりが不自然なんだよな、これ。
もっと学習データ増やさないと。
ディープラーニング関係の資料を見ていて思うのは、学習データがキモであるにも関わらず、学習するのに時間がかかるせいか妙に学習データの数が少ないなと思うケースがしばしばあるように思う。
ある程度の正確性を求めたければ少なくとも10000以上は学習しないと話にならないのに。

2016/06/07(火) 10:08:31.94

例えばこういう植物とかは緑になる
https://sociorocketnews.files.wordpress.com/2013/11/24142124124.jpg
http://blog-imgs-57.fc2.com/c/h/a/chariome/20131112223957f20.jpg
http://www.fmsaga.co.jp/blog/uploads/NCM_2635.JPG
http://www.fmsaga.co.jp/blog/uploads/NCM_2636.JPG

2016/06/07(火) 15:34:59.10

ぼっさん

2016/06/11(土) 15:38:17.09

いよいよ作者氏が本気出す時が来たようだ。
https://twitter.com/ultraistter/status/741488649884164096?lang=ja

ところで、GTX 1080 1枚 VS RX480 2枚で話題になった例の件、waifu2xの場合はやはりGTX 1080 1枚のほうがいいんだよね？

2016/06/11(土) 19:45:42.62

新モデル+GTX 1080だと640x480->1024x768のノイズ除去+2xが560msくらいでできています
あとGPUの違いなのかcuDNN v5+CUDA 8.0か分からないけど
以前試したら異常に遅かったWinogradという3x3畳み込みを速くするアルゴリズムが
速くなってて，現verも950msくらいで処理できています．
（以前は，新モデルのほうが3倍くらい速かったので差がかなり縮んだ）
AWS EC2のGPU+現verだと3700msくらいで，このGPUはGTX 760と同じくらいの性能です．

2016/06/11(土) 19:59:19.46

>640x480->1024x768
640x480->1280x960に訂正

2016/06/11(土) 20:27:45.11

ベンチマークというか単純に自PCのショボさを比較したいのですが
皆で共通に使える適当な画像(画像群)ってどこかにあったりしますか？

R18にならない程度の２次で（ココ重要

2016/06/11(土) 20:45:50.92

>>92
お疲れ様です。
GTX 1080導入、おめでとうございます。
アルゴリズムによって速度が変わるとのことですが、画質が変わったりはしないのでしょうか？
遅いけど高画質なアルゴリズムとかあるのかなと。
あと、二段階超解像ってできないかなと思ったりしてるのですが。
つまり、
1回目：今まで通りの超解像による拡大
2回目：1回目でできた拡大画像と元の画像を比較して、再度超解像効果を手直し
みたいな。
元画像と拡大画像を見比べて、「もっとここ手直しできる」というところを再調整とでもいうのか。
この2回目だけの処理だけ活用すると、元画像を拡大せずに解像感や輪郭まわりの再現性向上にも使えますだとなおうれしいんですが。

2016/06/11(土) 21:06:09.55

>>94
速度についてなら画像のサイズとチャンネル数(RGBか透過を持っているか)だけ合わせれば
画像の内容はほとんど関係ないと思います
>>95
変わりません
やりません
ただすごく変になった時/ところを検出できると便利とは思います

2016/06/11(土) 21:22:18.30

>>96
アルゴリズムによる画質の変化はないんですね。
すごく変になったところを検出→フィードバック→再調整
ができればいいですね。

94 (ﾜｯﾁｮｲ 839d-7xHu) · 2016/06/11(土) 22:26:00.73

>>96
なるほど、てっきり線が多様でノイズの多い複雑だけど低画質なものが
加速度的に必要時間が増えていくものだと思ってました

開発、陰ながら応援しています

2016/06/11(土) 23:05:53.70

560msって早すぎやろ！
waifu2xで動画エンコしてるけどかなり短縮されそうでワクワクだわ
俺もPascal買おうかなぁ

2016/06/12(日) 11:32:13.03

新モデルが待ち遠しいな…
完成までまだ時間掛かりそうですか？

2016/06/12(日) 12:56:41.65

ノイズ除去付き拡大もうまくいっているので
たぶんもう学習処理回すだけです
イラストは明日には全部学習終わります
あと写真、Yモデルの再学習に4日つづくくらいかかる
ちなみに現在のモデルも使えるようにしているので追加という形になります
ウェブ版はGPUメモリの関係で全部のモデル読めないので置き換えますが
ベンチマーク的には結構スコアが上がっているけど
パッと見でわかるほどの違いはないと思います

2016/06/12(日) 13:07:19.18

>>101
思ったより完成が早いですね、お疲れ様です！
新バージョンは処理は早いけど精度（輪郭線や境界線等）はあまり変わらないということでしょうか？

2016/06/12(日) 13:19:55.61

ノイズ除去がYからRGBになったときはサンプルの画像挙げて変化を説明してたはず
画像出さずにPSNRの数値だけ出すのは人間の目から見てそう変化がないからだろう多分

2016/06/12(日) 13:25:17.47

サンプル出してたの別の人だったかも、うろ覚え（汗

2016/06/12(日) 14:42:39.03

>>103
2枚重ねてみると、ところどころ違いがあるは分かりますけど
黙って置き換えても誰も気づかないのではないかという不安はあります
なんとなく違和感が減った気はするけどプラシーボかもしれない
PSNR的には結構良くなっているので、よくなっているのは確かだと思いますが説得力はないです
明日か明後日くらいにウェブの方イラストだけ置き換えようと思うので
気になる画像を持っている方はそのときに試してみてください

2016/06/12(日) 15:47:23.38

やっぱ置き換えではなくてお試し用サーバー1台用意します。
もともと今のウェブ版はそういうものだけど、
もう普通のウェブサービスになってしまっていて置き換えるのに勇気がいるので。
それならTTAも使えるようにできます。（遅いのは仕方がないねということで）

2016/06/12(日) 16:01:03.81

>>105
写真モデルを用いても>>39のような輪郭線を綺麗にするのは難しいでしょうか？

2016/06/12(日) 17:23:59.21

>>101
いよいよですね。
期待してます。
>>106
サーバーを別途確保されるんですか？
…
お試し機能以外、サーバーでのサービスは、そろそろ有料化されたほうがいいんじゃないでしょうか？
ネットサービスは無料が当たり前という風潮がいまだにありますが、当たり前じゃないんだということを理解させることも大事だと思います。
(お試し機能も1人が専有し続けないような制限を設けたほうがいいと思います。)

別件で、かねてからの「溶ける」件、対処療法ではあるのですが、対策になりそうな方法を発見しました。
1週間ほど時間が取れないので、それ以降に検証してみる予定です。

2016/06/13(月) 00:47:21.31

>>107
元画像があれば見ておきますが。
写真はまだやっていないので分からないですが
イラストはそれほど変わっていないのであまり期待できないと思います。
ちなみにこれはイラストでノイズ除去2してますよね...?

2016/06/13(月) 01:59:20.36

>>109
>>39の画像上げた者です
画像のは704*396→1920*1080に拡大ノイズ除去2したものです
残念ながら今は元画像がないです…

2016/06/13(月) 18:17:31.84

http://waifu2x-dev.udp.jp/
で新モデル試せるようにしています
拡大とノイズ除去+拡大が変わっています．ノイズ除去のみは同じです．
自分で見た感じだと，拡大はそれほど違いはないし問題もないように思うけど
ノイズ除去が入ると，強弱が以前よりはっきり出ていて
いい時はいいけど，ノイズが強い時に線の太さが不安定になっているように思います．
なにか思うことがあれば書いていただくと対応できるかもしれません．
ベンチマーク結果は
https://github.com/nagadomi/waifu2x/blob/upconv/appendix/vgg_7_vs_upconv_7_art.md
にあります．ベンチマーク的には全部良くなっています．

2016/06/13(月) 18:21:32.55

やっぱりYUV 420のJPEGでやったほうがいいのかなと思い始めました．
現実のJPEGはほとんどがYUV 420で学習時にYUV 444しか見ていないので．
今は色が変わるのでやっていないのですが，選択できるようにするかもしれません．

2016/06/14(火) 02:01:47.66

新バージョン、凄く速度が上がってますね
でも、輪郭線は正直微妙かなぁ
良くなってるところもあるけど、悪くなってるところも結構あったりする
こればっかりはしょうがないですね

2016/06/14(火) 02:19:04.81

あ、間違えて旧版の写真モデルと比較してた
イラスト同士で見比べてみたけど、違いが全然わからんｗ
ただ、処理速度は格段に早くなってる

2016/06/14(火) 10:39:33.36

YUV420/YUV444半分づつで学習したら
入力YUV444時のスコアほとんど下げずに
入力YUV420時のスコアがっつり上げれる感じだったので
もうノイズ除去もこれに置き換えようと思います．
もともとJPEGの色のノイズ等も消しているし，色以前に細部が消えたりしているので
色がちょっと変わるリスクなんていまさらだよね...?
平均的には良くなるし，いくらか試すと線の境界などで色が濁ってるが結構直ってる．

2016/06/14(火) 11:21:07.53

>>111
お疲れ様です。
早速試させていただきました。
イラストモデルのみではありますが試したところ、以前に比べて少し溶けにくくはなったような気もします(特に4倍以上にした場合)
なお、>>108にて書いた対処療法をすこし時間があったのでやってみました。
(結果は下記にてダウンロード可。明日の23時59分までの限定です。解説はテキストファイルに書いてあります。)
http://www1.axfc.net/u/3679593
写真モデルでやるとどうなるか、あるいはもうすこし小細工するかも含めて検討中です。

>>112
YUV 420モデル(イラスト・写真それぞれ)があれば、一種の色超解像的効果が期待できるので、圧縮画像には特に効用が見込めると思います。
期待しております。

2016/06/14(火) 12:09:55.28

>>116の画像を若干手直ししました。
http://www1.axfc.net/u/3679606
この方がいいかも。

2016/06/14(火) 12:26:29.32

あらかじめNNEDI3で拡大する前に、GIMPでアンシャープマスクを+0.10程度かけておいてからNNEDI3で拡大→縮小→waifu2x→再度GIMPにてコントラストとアンシャープで微調整のほうが細部の情報が残りやすいみたい。
アップする時間がなくなったので今日はここまで。

2016/06/14(火) 18:07:05.51

移動中に報告
NNEDI3を使って、圧縮画像によく見受けられる輪郭周りのノイズを除去して溶ける症状を抑える件、もっと手間を少なくかつNNEDI3を使うことによる副作用である
ボケる点を克服できそうな方法を見つけたかも。
古いソフトウェアなのだが「ノイズクリーナー2」というソフトをカスタマイズ設定にして極々微量のノイズ除去を行ってからwaifu2xで拡大するといくぶん溶けにくい。
ただし、設定の落としどころが難しい。

2016/06/14(火) 22:53:23.00

imagemagickのコマンド、7になってから変わったの今初めて気づいた...

2016/06/15(水) 01:45:09.31

アンシャープマスクよりボケずに済む方法を試してみました。
(テキストファイルに開設あり)
http://www1.axfc.net/u/3679934

寝ます

2016/06/15(水) 12:07:14.79

NNIDI3による前処理などいろいろ試した結果、

1．waifu2xは拡大する前に輪郭に作用しやすいノイズフィルターをあらかじめ適用しておくと、拡大した画像が溶けにくい。
2．NNEDI3は輪郭線に強く作用するフィルターのため、縮小後の画像にもその作用が強く残り、結果として輪郭ノイズ低減フィルターのような作用をもたらしている。
3．ただし、NNEDI3は面などの細かい情報もそぎ落としてしまいやすく、全体的にボケやすいため、そのままでは使いにくい。
4．面部分には作用せず、輪郭にのみ作用するフィルターがあれば理想的。waifu2xのノイズ除去(中)も試してみたが、waifu2xのノイズ除去は中でも強すぎるためこれも使いにくい。
(元画像とwaifu2xでノイズ除去した画像を合成してノイズ除去の強度を調整することはできるかもしれないが、合成度合をコントロールしながら合成できるような都合のいいソフトがあるのかどうか・・・)

もうあとは、この輪郭のノイズを制圧できさえすれば完成すると思われるだけに、何かいい方法があればと思うのだけど。

2016/06/15(水) 12:46:21.17

単純にTotalVariationで分離してから掛けろよ

2016/06/15(水) 14:57:07.20

>>123
これのこと？
http://convexbrain.osdn.jp/cgi-bin/wifky.pl?p=TV-Denoising
ものすごく画像が甘くなってるんだが・・・
waifu2xの比じゃないよ、これ。

2016/06/15(水) 15:01:46.27

俺はエッジレベル調整使ってる

2016/06/15(水) 15:25:03.46

>>125
エッジレベル調整は輪郭のコントラストを無理やり強調しているだけだから、ノイズそのものは残っている状態なわけで、根本的な解決にならないかと。
こんなんだし。
http://aviutl.info/sharp/

2016/06/15(水) 16:31:22.20

アニメの輪郭線に入っているノイズがイラストでは見ないパターンでうまくいかないので
そのあたりをイラストっぽい方に寄せることができればマシになるということだと思います．

古いアニメにある輪郭線まわりのノイズがソフトウェアで再現できるなら対応もできるのですが
どこで入ってくる何のノイズなんでしょうか．

2016/06/15(水) 17:00:29.10

>>127
たぶん圧縮画像特有のノイズだと思います。
圧縮画像は目につきにくい暗い部分の階調表現を大胆に間引いてしまいがちですので(攻殻機動隊のエンコードを担当した人が、かつてDVDの時代にとても苦労されていることを語られていましたし)、
暗部の多い圧縮画像を集中的にとりこんでモデルデータを作られるといいのかもしれません。
あるいは暗部の多い圧縮画像の割合の多いモデルデータを暗部ノイズ対策専用の前処理専用モデルとして用意して、事前に弱く(ここ重要!!)適用できるようにされるといいかもしれません。
ついでに現行のノイズ除去の強度ももっと弱いタイプを二段階ほど(最弱は中の1/3以下の強度！)用意して頂きたいとも思います。
(モデルデータを変えずに参照範囲を狭めるとかでの対応でも結構ですので)

2016/06/15(水) 17:20:59.49

>>128
圧縮画像というのは具合的にどんな圧縮なんでしょうか．
TV用の当時のエンコーダがあってその癖なんでしょうか．
現在のJPEGノイズ除去の弱いバージョンはすぐ作れますが
動画を対象とするなら，動画用のエンコーダを使って
正しいデータセットを作るほうがいいと考えています．
ソフトウェアで再現が難しいなら，HDリマスタとその前のバージョンDVD?を買ってきて
フレームの位置合わせができるなら，そこから変換の対応関係を作るでもいいと思っています．
エンコの設定？とかできるならそれが一番いいですが．

2016/06/15(水) 17:48:43.36

今考えている動画の対応は，
- イラストに窓をつけて適当な速度で平行移動・回転したりをフレームとして切り出す
- 動画にエンコ（同時に1/2に縮小）
- エンコ後からまたフレームに分割して元画像への変換を学習する
ということです．
変換先がイラストになるのでアニメとはちょっと違う質感になるかもしれませんが
アニメの"元画像"って手に入らないと思うのと，
これだと作るのは簡単なので妥協点としていいのではと思っています．
他にはMMDから動画を作るとかですけど，これもシェーダーのクセを再現してしまうと思うので
たぶんイラストのほうがバリエーションが多くてよいです．

今すぐにやるという話ではなく，今やっている対応が終ったら
いまのところCNN超解像として改良できる部分はすべて終わるので
動画について色々言われるならそこでもやろうかなというレベルの話ですが．

2016/06/15(水) 18:09:19.82

>>130
何のこっちゃよくわかりませんが、凄く期待してます

2016/06/15(水) 18:10:55.45

圧縮画像のノイズの件、夜になりますがコメントします。
(今時間がないので)

2016/06/15(水) 22:19:16.48

いわゆるHDリマスターは解像度やエンコードだけでなく映像自体も違うことがあるから
比較対象としてはBDとDVDが同時発売のものじゃないかな
海外版との比較だと同解像度のビットレート違いなんてのもあるかも

アニメと一口に言っても輪郭の特徴がそんなに多くの作品に共通してるかは疑問だけど

2016/06/16(木) 02:12:13.44

やっと帰宅できた・・
すみません、気力が持たないので昼以降に改めてコメントします。
限界

2016/06/16(木) 04:06:54.85

体壊さない程度にがんばってくれ

2016/06/16(木) 17:17:40.41

今日初めて写真の拡大に利用させてもらいましたが凄い技術ですね。
応援しています！頑張ってください！

2016/06/16(木) 18:24:55.57

>>129
昨日疲れすぎてコメントできなかった圧縮ノイズについてですがコメントしておきます。
まず下記サイトを参照ください。
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/jpeg.html

このサイトの一番下部の画像を見るとわかりやすいかと思いますが、建物の輪郭周りに本来であれば存在しない種々のノイズがまとわりついているのがお分かりいただけると思いますが、
こういったノイズが輪郭周りに細かくまとわりついている画像をwaifu2xにて拡大すると、輪郭などが溶けやすくなっています。
NNEID3によってあらかじめこのような輪郭にまとわりつきやすいノイズを滑らかにしておくと、waifu2xにて拡大時に溶けにくくなっているのは先日実証した通りです。

このため、もしこのようなノイズ専用の対策フィルターを作るのであれば、JPEGなどの非可逆圧縮をしていない画像を複数用意し、その画像をJPEGにて高圧縮し、わざと輪郭などにノイズが出ている画像(画像サイズは等倍でよい)を作成し、
圧縮前と圧縮後の画像をディープラーニングによって学習させれば、圧縮ノイズ対策にはなるでしょうけれど、それは結局現行のノイズ除去と考えとしてはそう大差ないかなとも思います。

とするならば、やはり前回にお伝えした通り、今よりもっとノイズ除去強度の弱いフィルターをまずは用意すること、そしてその先の展開としては、その弱いフィルターを輪郭と認識される部分のみに適用できるようなオプションを用意できればなお良いかと思います。
(オプションを有効にすると輪郭のみに適用、無効にすると画像全体に適用、ノイズ除去強度は、「最弱(中の1/3か1/4程度の強度)、弱(中の1/2程度の強度)、中、強、最強」の5段階あたり？)
輪郭の認識手法については、AviUtlなどのフィルターである「エッジレベル調整MT」の輪郭検出手法あたりでよいのかなと思います。

2016/06/16(木) 18:25:35.35

続き
エッジレベル調整MTの参考
http://aviutl.info/sharp/
http://aviutl.info/wp-content/uploads/20160220-020557-553.jpg

あるいは別の考え方としてですが、NNEDI3の輪郭に作用する部分だけをインスパイアした輪郭ノイズ除去フィルターを作れるならば作ってほしいという考え方もありますが・・・
参考
https://github.com/MaverickTse/AviUtlInstaller/blob/master/deinterlace_plugin/nnedi3/jp/nnedi3.txt
(それが可能であるならば、AviUtlを通さずに済むため、RGB→YUV→RGBの変換ロスを気にしなくて済むのと、16bit画像なども直接扱えるようになるので大変ありがたいのですが)

昨日お話ししていた圧縮画像の暗部の階調情報の大幅な簡略化をわかりやすく示す画像が探した範囲でなかったのですが、これは大面積部については通常のwaifu2xのノイズ除去でも対応できる範疇かと思いますので、ひとまず置いておきましょう。

ちなみに上記の件より、今のところ動画用に別途のノイズ対策(一つの画像に小さな窓を設定してスライドなど含む)は今のところしなくても大丈夫かと思います。
(動画の圧縮率の高い状況で輪郭周りに一番除去しにくいノイズがあるのはH.264で圧縮した画像ではありますが)

2016/06/16(木) 18:44:15.78

上記のことを書いてから気づいたのですが、ひょっとすると拡大前にGIMPの「選択的ガウスぼかし」を超絶的に最弱で適用してから拡大すればいけるかも・・・

2016/06/16(木) 19:52:56.77

「選択的ガウスぼかし」でいけたかもしんまい・・・
試しにアップしてみた
http://www1.axfc.net/u/3680573

いや、この延長で行くならばバイラテラルフィルターを極微量適用のほうがよりダメージは少ないかも？

2016/06/16(木) 20:52:17.87

NL-MeansやBilateral等のエッジ保存ノイズフィルタをかけたのが骨格成分
それと原画との差分がテクスチャ成分で多くの種類のノイズ含む微小変化分
高性能に分離するのがTotal Variationフィルタ

骨格だけwaifu2xでテクスチャ成分はLanczos3で後で適量を合成すればいい
暗部はガンマ補正して暗部の輝度差を広げたのを処理して逆ガンマで戻して
通常ガンマの画像と合成
こんなんでどうだ？

2016/06/17(金) 10:45:07.16

YUV420 JPEGで学習すると線もきれいになった気がするので
JPEG画像についてはJPEGノイズの種類が適切でなかったのもあるかもしれないです．
印象も色の濁りが減って良くなったように思うんですが
それはつまり色が変わっていることなんですが...
来週くらいに-devのほうはYUV420対応に置き換えます．
現verのノイズ除去も同じ教師データで学習したものに置き換えようと考えています．
（拡大時だけノイズ除去のかかり方が違うと混乱を生むと思うので）

2016/06/17(金) 12:24:23.88

エッジ周りのノイズを取るのは，バイラテラルとは逆の重みだと思うんですけど"周り"だとそうなんでしょうか．
エッジ用の重みのマスクを作って合成するのが簡単じゃないかと思います．
自分としては，データセットを泥臭くいじったりはあっても
データを用意したあとは最適化問題としてやるのがいいと思っているのと
手でごちゃごちゃってもさまざまなパターン（さまざま例外を含む）を考えると
平均的な精度で機械学習に勝つことはできないと思っているので前処理や後処理をやる気はないです．
弱いノイズ除去は用意できます．

2016/06/17(金) 12:25:21.08

>>142
お疲れ様です。
420、やはり効果ありましたか。
となると、やはり元が非可逆圧縮している画像→420モデル、元が可逆圧縮か非圧縮画像(444の状態)であれば444モデルと選択できるといいのかもしれないですね。

こちらでも非線形フィルターなど含めいろいろテストしてみたのですが、ある程度のところまではいくものの、やはり根本的にはイラスト用モデルで試していることの限界もあり、これで文句なしというところまではいかなかったので。
420モデルの写真用が使えるようになるとおそらく前処理に関しては非線形フィルターでもなんとかなるかなとは思うのですが。
(もちろんwaifu2xのノイズ除去に最弱があればその方がいいと思いますが)

2016/06/17(金) 12:29:24.44

>>143
入れ違った。
私も合成するよりはディープラーニングの判断に任せる方がいいとおもいます。
最弱フィルター、お待ちしております。

2016/06/17(金) 12:34:06.52

人はエッジ周りが変になっていることに敏感なので
損失関数でエッジ周りの重みを上げるとかは全然いいのかなと思ったけど
もうやっているんですよね. .
そういうことも考えるともうほとんど手動調節やなという気もする

2016/06/17(金) 13:01:39.74

>>146
損失関数でエッヂ周りの重みをとはどういうことなんでしょうか？
私はとりあえずGIMPとAviUtlのフィルターを複数試している程度なので、上記の件がどのフィルターの作用なのかよくわからないですが(滝汗…)

いずれにしても、もう一息のところまでは来ているかなと思います。

2016/06/18(土) 12:14:20.27

caffeの作者さんにファイル名についてお願い、と言うか要望があるのですが、例えば元ファイル名が
　img.jpg
のものをRGBモデル、ノイズ除去レベル1、拡大倍率x2.000000、で処理した場合
　img(RGB)(noise_scale)(Level1)(x2.000000).png
のようになるかと思いますが、これを例えば
　img-RGB_nsLv1_x2.0.png
のようになるべく短いファイル名になるようにしたいのです
リネームソフトの手間もなくなりますし
簡潔に言うと、RGB・Photoなどのモデル、レベル、倍率にそれぞれ自分好みのネーム設定ができたらいいなと

2016/06/19(日) 12:44:00.16

それもまたきりのない話だな
そのうち小数点以下何桁までで丸め方のルールは～とか設定したくなるかもしれない

2016/06/19(日) 14:27:28.71

出力ファイル名を
{ORIGINAL_FILENAME}_{NOISE_LEVEL}_{SEQUENCE_NO;%06d}.png
みたいなフォーマットで指定できればいい話ではあると思うけど

2016/06/19(日) 18:26:21.66

下手な実装するとバッフオーバーフローの脆弱性持ちそうだな

2016/06/20(月) 01:51:15.15

各項目対象に文字数制限は必要ね

2016/06/20(月) 18:24:37.59

http://waifu2x-dev.udp.jp/ のノイズ除去をYUV420 JPEG対応に置き換えています。
試していないですが、ノイズ除去だけはソフト版にも持っていけると思います。
https://github.com/nagadomi/waifu2x/tree/upconv/models/vgg_7/art

2016/06/20(月) 19:50:44.69

>>153
お疲れ様です。
ノイズ除去更新、了解です。
ところでノイズ除去の最弱と弱は、まだ時間かかりそうでしょうか？

2016/06/20(月) 21:10:41.84

>>154
写真の学習を先にやっててこれが1週間くらいかかると思うのでその後になります

今ノイズレベル1〜3なので、0に追加しようと思っています。
ノイズ1でも対象とするJPEGの品質65〜85で確かに強いかなと思うので。
80〜95くらいのやつを入れます。

2016/06/20(月) 21:47:03.21

>>155
よろしくお願いします。

2016/06/24(金) 00:16:13.19

w2xcは対応してくれないのかな
caffeでエンコとかやったことないから困る

2016/06/24(金) 05:19:48.84

>>157
https://github.com/HomeOfVapourSynthEvolution/VapourSynth-Waifu2x-caffe

caffeでエンコードするこういうのもあるみたい。導入がちょっと面倒くさいが。

2016/06/26(日) 12:28:20.99

写真だとノイズ除去がイマイチなんで、waifuで拡大だけやって
Neat Imageでノイズ除去するという使い方させてもらってます
最新のV8は白ボケをどう直したらいいのか分からないので古いV7.6使ってる

2016/06/26(日) 21:25:04.12

ディープラーニングについて、NHK-Eテレにて今夜23時30分よりサイエンスZEROにて放送

2016/06/28(火) 23:31:12.36

サイトが見れない？

2016/06/29(水) 00:50:43.91

私もサイトが表示されないですね…。(´・ω・｀)

2016/06/29(水) 02:23:18.17

waifu2xって画像縮小できないの？

2016/06/29(水) 02:26:53.26

こーひーできるだろ

2016/06/29(水) 05:58:30.93

つかえないんやが

2016/06/29(水) 14:07:06.67

お、サイト繋がった！良かった

2016/06/29(水) 17:54:31.19

落ちてるぞ、ウチ32Bit環境やから困るわ

2016/06/29(水) 18:30:58.55

俺も繋がらない

2016/06/29(水) 22:10:41.75

NHK クロ現でノイズ除去やってる

2016/06/30(木) 12:16:44.06

ワイフ生き返った

2016/07/01(金) 02:09:40.55

超解像って単に拡大してシャープフィルタかけたのとは違うよね…？

2016/07/01(金) 09:40:15.03

全く違います

2016/07/01(金) 10:10:53.84

コンピュータが2種類の拡大結果を提案してユーザーがキレイだと思ったほうを選んでいく。その結果を蓄積してく。みたいにやったらだんだん画像はキレイになってくの？

2016/07/01(金) 10:29:17.86

>>171 >>173
「元画像」と「元画像にノイズを添加したもの」、もしくは「元画像」と「元画像を1/2に縮小したもの」に対し、
後者から前者を作成できるように機械学習させたのがwaifu2x

2016/07/01(金) 16:33:57.22

Neat Imageのコミュニティに入った
http://i.imgur.com/ZlmZtHz.jpg

2016/07/01(金) 16:58:14.36

>>174
その変換をどういうフィルタをかければよくできるかをデータから決めてる感じですね。
シャープ

2016/07/01(金) 16:59:01.87

>>174
その変換をどういうフィルタをかければよくできるかをデータから決めてる感じですね。
シャープすぎることがあるのは、1/2縮小時にボケることの副作用の気がしていて
もっとよい縮小アルゴリズムが求められている。
>Neat Image
写真はJPEGノイズよりもカメラの高感度ノイズのほうが一般向けに需要がありそうなんですよね。
自分も写真のデータセットを作るときにセンサに由来すると思われるノイズが取れなくて結局縮小してしまったし。

2016/07/01(金) 17:39:27.23

つい最近ソフトの存在を知ったのだが、作者は何者?

**175** (ﾜｲﾓﾏｰ MMcd-R7o+) · 2016/07/01(金) 17:41:57.50

>>177
アナログをスキャナで取り込む時も同じではないでしょうか
とりあえずサンプル貼っときますね、撮影は1989年頃
http://i.imgur.com/WIFzEKU.jpg
http://i.imgur.com/d65jMq4.jpg

2016/07/01(金) 19:59:48.62

これ比較する時って、補完無しで同率拡大した画像とで比べたほうが判りやすいよね多分

2016/07/01(金) 23:08:12.50

フル画面表示した時の画質の違いでおｋ

2016/07/02(土) 01:42:19.02

それだとドでかい画像の場合縮小表示しちゃうんじゃね

2016/07/02(土) 20:17:17.05

Olympus viewerの様なデジカメや一眼レフカメラに付属しているソフトとwaifu2x-caffeと比べたら細かい部分を拡大する時どちらが優れていますか？

2016/07/02(土) 20:28:02.40

市販のやつが一番

**183** (ｱｳｱｳ Sa6a-s3GQ) · 2016/07/02(土) 23:41:57.11

>>184
ありがとうございます。

2016/07/03(日) 23:32:02.98

waifu2x-caffe ver 1.1.4
https://github.com/lltcggie/waifu2x-caffe/releases/tag/1.1.4

upconvモデルに対応
変換に使用するGPUデバイスを指定できるようにした
コマンドライン版の出力ファイル名自動生成の規則をGUI版と揃えた
かなり中身を書き直した関係でメモリ不足対策が無効になった

2016/07/04(月) 00:53:04.84

1.1.4
今まで問題のなかった batch_size 指定で
waifu2x-caffe-cui.exe -b 4 -i kore.jpg
や
waifu2x-caffe-cui.exe --batch_size 4 -i kore.jpg
だとエラー吐いて失敗するようになった

waifu2x-caffe-cui.exe -b=4 -i kore.jpg
や
waifu2x-caffe-cui.exe --batch_size=4 -i kore.jpg
のように = で指定するとエラーにならず変換は問題ないっぽいけど
-c asdf だとusage表示、 -c=asdf や -b=qwer とかで変換は成功するので
= でつなぐと batch_size 指定が無視されてるだけ？

エラーメッセージは下のような感じ
Could not create log file: File exists
COULD NOT CREATE LOGFILE '20160704-004037.8712'!
F0704 00:40:37.079417 6000 math_functions.cpp:92] Check failed: error == cudaSuccess (11 vs. 0) invalid argument
*** Check failure stack trace: ***

2016/07/04(月) 10:40:14.99

好きな写真をいろんなタッチに自動で加工してくれる「deepart.io」
http://gigazine.net/news/20160703-deepart-io/

どんな写真が作れるのかは以下のページを見ると分かります。
Selected latest deeparts
https://deepart.io/latest/
http://i.gzn.jp/img/2016/07/03/deepart-io/snap.png

2016/07/04(月) 18:22:16.94

>>186
更新お疲れ様です
本家のdev版では写真のほうも追加されてますが
もしかしてそちらの更新も追加されているんでしょうか

2016/07/04(月) 23:32:53.22

>>186
upconvは文字の潰れが少なくて良いです

**186** (ﾜｯﾁｮｲ 3a39-xKxK) · 2016/07/04(月) 23:40:18.55

紛らわしいかもしれないけど自分は更新情報を書き込んでるだけで作者じゃないよ

2016/07/05(火) 00:02:07.39

waifu2x-caffe upconvの速度はどんな感じです？
caffeはDeconvolutionがcuDNN対応していないのと
cuDNNもforward algorithmの自動選択が微妙で
Torch版ほどの差は出ていないのではと思うので気になっています。

2016/07/05(火) 02:47:19.53

>>186
公開ありがとうございます
ver.1132までは問題なく使えておりましたが、今回verでは実行ボタンを押すと同時に落ちます
win7pro 64bitのノートでCPU動作です
対策あれば教えてください

以下エラーログです
Log line format: [IWEF]mmdd hh:mm:ss.uuuuuu threadid file:line] msg
E0705 02:40:25.573511 5904 common.cpp:119] Cannot create Cublas handle. Cublas won't be available.
E0705 02:40:25.575511 5904 common.cpp:126] Cannot create Curand generator. Curand won't be available.

2016/07/05(火) 03:08:52.96

CUDAのライブラリがないと言っているので
CPU選択時にGPU使おうとしているのかな

2016/07/05(火) 23:56:36.64

caffe ver1.1.4で「?かなり中身を書き直した関係でメモリ不足対策が無効になった」ってあるけど
メモリ不足したらどうなんの？
他にも色々不安要素バリバリで更新しないほうがいいのかな

2016/07/07(木) 04:36:12.87

waifu2x-caffe ver 1.1.5
https://github.com/lltcggie/waifu2x-caffe/releases/tag/1.1.5

2016/07/07(木) 06:15:46.59

ver1132からver115へ
実行押して1秒ぐらいで終わるって
早すぎませんかね？
後、画質の差はわからないです
マジお疲れ様です

2016/07/07(木) 08:46:47.16

3DCGでIrayなどの物理レンダラーとかだと、ピクセル当たりの
サンプリンが少ないとノイズが残ります。

もしこれを学習させて綺麗に除去出来るなら、レンダリング
演算量の削減が出来るのでCG業界でも需要があるかも？

とりあえずDaz stuzio作成した、95%と100％でサンプリングした
画像を置いておきます。

http://fast-uploader.com/file/7023403027370/
http://fast-uploader.com/file/7023403077217/

waifu 2x でnoise_scale Level1 x2.0 イラスト実行
http://fast-uploader.com/file/7023403811009/

学習用サンプル画像も、無料で物理レンダラーが使えるdaz studio,
blenderなどでGPU使って作成出来るので、余裕が有ればmodelに
3dcgの低サンプリング画像の高画質化modelが欲しいです。

写真の低ISOノイズに近い物があるので、難しいかな？
ノイズ除去フィルタの領域になるか。

2016/07/07(木) 09:05:03.41

>>198
先日、ペアの教師データを用意すれば何でも学習できる機能(Universal filter!!)を入れたので
入力画像と理想的な出力画像のペアを用意できるなら試すことはできます。
githubで3DCGで解像度を変えたレンダリング結果を学習して拡大できないかという話がでているのと
自分もBlenderのCyclesレンダーを使っていて、これがサンプリングが少ないとめちゃくちゃノイズが出る上に
GPUを有効にしてもめちゃくちゃ遅くて困っているので試して見るかもしれません。
（ただ学習データ生成に使うレンダリングエンジンのくせに依存する気がする。
　レンダリングエンジンにあまり詳しくないので勘ですが）

写真の低ISOノイズ除去ができないのは、この現象が物理的なもので
コンピュータ上でシミュレートするのが難しく教師データが自動生成できないからで
データさえ用意できれば多分できます。

2016/07/07(木) 09:09:21.80

あと以前AMDのGPU使ってたので、AMDのGPUでも動くとより嬉しい。

AMD、GPGPU向けの取り組み「ボルツマンイニシアチブ」を発表。CUDAとの互換性も提供
http://srad.jp/story/15/11/18/0657225/

> Heterogenous Compute Compiler（HCC）と名付けられた新しいコンパイラはLLVM Clang
> ベースでC++11/14や/C11、OpenMP4.0、そしてC++17で採用予定のParallel STLに対応。
> 1つのコンパイラでCPUとGPUのどちらにも使える。そのためGPU用のカーネルを別のソースに
> 記述する必要はなく、ラムダ式でSTL互換のアルゴリズムに述語引数として渡せばよい。

> Heterogeneous-compute Interface for Portability（HIP）はHCCで利用できるCUDA風のAPI。
> HIPで書かれたソースコードはHCCだけでなく、ヘッダーファイルを加えることでNVIDIAのCUDA向けコンパイラであるNVCCでもコンパイル可能となる。
> 従来のCUDAコードをHIPコードに変換するためのツールも用意されており、これによってHSA環境はソースコードレベルでCUDAとの互換性を有することになる。

使ったことはないけど、CUDAコードをAMD環境用のバイナリにするコンパイラとヘッダが
公開されているので、リコンパイルだけでAMD対応も可能かも知れません。