画像を人工知能(Neural Network)を利用して拡大、あるいはノイズ除去するソフトウェアの話題を総合的に扱うスレです。
本来の用途は静止画が対象ですが動画のアプコン処理に関する話題もOKです。
ただし動画編集ソフトの使い方の部分の話は各ソフトのスレに行って下さい。
--主なソフト--
・waifu2x
本家Webサービス
http://waifu2x.udp.jp/
・waifu2x概要:二次元画像を拡大したいと思ったことはありませんか? (waifu2x作者氏のブログ)
http://ultraist.hatenablog.com/entry/2015/05/17/183436
・waifu2xとその派生ソフト一覧
※リンクがNGワードに!
・waifu2xのベンチマーク結果まとめ - Togetter
http://togetter.com/li/831437
・無料で二次元画像を人工知能が補完してハイクオリティで1.6倍/2倍に拡大できる「waifu2x」 (gigazinの記事)
http://gigazine.net/news/20150519-waifu2x/
・Otaku ワールドへようこそ![212]嫁を拡大する人工知能/GrowHair (日刊デジタルクリエイターズの記事)
※従来の拡大手法とwaifu2x、SRCNNの違いについての丁寧な解説記事
http://blog.dgcr.com/mt/dgcr/archives/20150605140100.html
・NeuronDoubler
人工知能超解像プログラム NeuronDoubler
http://loggialogic.blogspot.jp/2012/06/neurondoubler.html
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
【超解像】画像拡大ソフト総合スレ2【waifu2x】 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
1名無しさん@お腹いっぱい。 転載ダメ©2ch.net (アウアウ Sa2a-NyIq)
2016/05/10(火) 11:28:05.20ID:h2o6wyXCa41名無しさん@お腹いっぱい。 (ワッチョイ bcd2-SHNT)
2016/05/19(木) 11:54:46.91ID:p48VMaQS0 現状が出力1px出すのにその周りの7x7pxがどうなっているかで出力を決めているので
その範囲でそれが線か点か平面かみたいなところは判定できていると思います
新モデルはこれが12x12に広がるのでもう少し複雑なパターンも分かるのではと思うけど
フィルタが大きくなるとそれだけ無関係なピクセルから影響を受けやすくもなるので
アーティファクトも出やすくなってしまう
その範囲でそれが線か点か平面かみたいなところは判定できていると思います
新モデルはこれが12x12に広がるのでもう少し複雑なパターンも分かるのではと思うけど
フィルタが大きくなるとそれだけ無関係なピクセルから影響を受けやすくもなるので
アーティファクトも出やすくなってしまう
42名無しさん@お腹いっぱい。 (アウアウ Sa89-di3r)
2016/05/19(木) 12:34:06.20ID:snBFEXtFa43名無しさん@お腹いっぱい。 (アウアウ Sa89-di3r)
2016/05/19(木) 12:42:22.08ID:snBFEXtFa 作者様のTwitterを見たところ、「Imager::AnimeFace」なる輪郭検出に必要になりそうなソフトウェアをすでに作られていたご様子。
このソフトの技術で認識した輪郭部だけに適用する「輪郭ノイズ除去フィルター」なんて組み込めないものですかね?
このソフトの技術で認識した輪郭部だけに適用する「輪郭ノイズ除去フィルター」なんて組み込めないものですかね?
44名無しさん@お腹いっぱい。 (アウアウ Sa89-di3r)
2016/05/19(木) 12:44:38.11ID:snBFEXtFa45名無しさん@お腹いっぱい。 (アウアウ Sa89-di3r)
2016/05/19(木) 12:49:58.03ID:snBFEXtFa 人のいるところでは開かないほうがいいページだけれども、参考にはなりそうなところ。
Googleで「輪郭ノイズ除去フィルター」で検索すると、「プロカメラマンのPhotoshop女性写真補正術」なるところが表示されますのでそこに出てきます。
人前では見るなよ!見るなよ!
Googleで「輪郭ノイズ除去フィルター」で検索すると、「プロカメラマンのPhotoshop女性写真補正術」なるところが表示されますのでそこに出てきます。
人前では見るなよ!見るなよ!
46名無しさん@お腹いっぱい。 (スプー Sd78-lZ/E)
2016/05/19(木) 12:51:00.20ID:Jy9TZu3Bd >>40
分かりやすい説明ありがとう
やっぱりみんなもそこ気になってるんだね
輪郭線も気になるけど、画像みたいな色が違う境界線も新バージョンで改善されると嬉しいな
要望ばかりで申し訳ないが、作者様頑張って下さい
分かりやすい説明ありがとう
やっぱりみんなもそこ気になってるんだね
輪郭線も気になるけど、画像みたいな色が違う境界線も新バージョンで改善されると嬉しいな
要望ばかりで申し訳ないが、作者様頑張って下さい
47名無しさん@お腹いっぱい。 (ブーイモ MM28-MTTD)
2016/05/19(木) 12:57:20.90ID:0HndFo6fM アニメって原寸でも少しボケ気味だから拡大前に若干縮小するか、シャープかけてからの方が良い結果になることが多い
48名無しさん@お腹いっぱい。 (ワッチョイ c991-MYRu)
2016/05/24(火) 01:06:43.33ID:pHT3p8L20 waifu2x-c/c with Batchfile and HTA-GUI作者です、ご無沙汰してます
>>20
ありがとうございます。私もこのレスを見て始めて脆弱性のことを知りました...
>>21
申し訳ないです。。。もしよければバッチファイルだけでもご利用ください。
重いのに使ってくださる方がいて嬉しい限りです。
リアルが多忙ですが、tanakmura氏版がLv3に対応した後ぐらいの時期に次版をリリースしようと考えています。
次版は少々軽くなっているはずです。
また、近いうちに選択肢が簡単な(コマンドライン準拠でない)バージョンも用意したいと考えています。
個体差でエラー&起動しない問題の解決にも取り組みたいところです。
>>20
ありがとうございます。私もこのレスを見て始めて脆弱性のことを知りました...
>>21
申し訳ないです。。。もしよければバッチファイルだけでもご利用ください。
重いのに使ってくださる方がいて嬉しい限りです。
リアルが多忙ですが、tanakmura氏版がLv3に対応した後ぐらいの時期に次版をリリースしようと考えています。
次版は少々軽くなっているはずです。
また、近いうちに選択肢が簡単な(コマンドライン準拠でない)バージョンも用意したいと考えています。
個体差でエラー&起動しない問題の解決にも取り組みたいところです。
49名無しさん@お腹いっぱい。 (アウアウ Sa89-di3r)
2016/05/24(火) 09:35:22.04ID:gUvghq74a50名無しさん@お腹いっぱい。 (アウアウ Sa89-di3r)
2016/05/24(火) 10:00:09.81ID:gUvghq74a ひょっとして8bit→16bitをImageMagickで変換するには
convert input.png -depth 16 output.png
だけでよかった?
convert input.png -depth 16 output.png
だけでよかった?
51名無しさん@お腹いっぱい。 (アウアウ Sa89-di3r)
2016/05/24(火) 10:13:01.51ID:gUvghq74a そんなわけはなかった・・・
引き続き調査。
引き続き調査。
52名無しさん@お腹いっぱい。 (ワッチョイ 2136-xKv1)
2016/05/24(火) 17:42:11.99ID:wmnqMgZB0 倍速バージョンがcaffeに採用される日はまだ遠いのでしょうか?
53名無しさん@お腹いっぱい。 (ワッチョイ 96e1-G0cz)
2016/05/24(火) 18:13:16.41ID:MHUmioZy0 各16bitにしてもグラボやモニタが対応してないと確認できないよーな
54名無しさん@お腹いっぱい。 (アウアウ Sa22-ZXL4)
2016/05/24(火) 19:22:40.86ID:65AxGBFja 16bitは編集前提だから
まぁ、Radeonの次期モデルから10bit出力対応になるし、モニターも対応モデルが増えていくから無駄にはならん
まぁ、Radeonの次期モデルから10bit出力対応になるし、モニターも対応モデルが増えていくから無駄にはならん
55名無しさん@お腹いっぱい。 (ワッチョイ c66d-2dQw)
2016/05/24(火) 20:29:37.48ID:8l5f+VfM0 >>39
これ学習時に縮小するときにジッタ成分としてランダムにサンプリング位置を僅かにずらしたのを学習させれば
ノイズとして巧いこと処理できるようにならないかな
縮小したのをWarpsharpとかランダムシフトでずらして凸凹を再現してもいいけど
これ学習時に縮小するときにジッタ成分としてランダムにサンプリング位置を僅かにずらしたのを学習させれば
ノイズとして巧いこと処理できるようにならないかな
縮小したのをWarpsharpとかランダムシフトでずらして凸凹を再現してもいいけど
56名無しさん@お腹いっぱい。 (ワッチョイ 96e1-G0cz)
2016/05/24(火) 20:41:22.46ID:MHUmioZy057名無しさん@お腹いっぱい。 (ワッチョイ c66d-2dQw)
2016/05/24(火) 20:59:08.32ID:8l5f+VfM0 ビット拡張は暗部階調に意味があるんだからガンマカーブやトーンカーブいじって明るくしてやれば確認は出来るでしょ
10bit出力だってDirectXやOpenGLのフルスクリーンで相当昔から出来るがDeepColorのTVでもそのままじゃわからん
Blu-Ray再生でRGBのまま再生したいときにロスが減るという意味がある程度かもしれん
10bit出力だってDirectXやOpenGLのフルスクリーンで相当昔から出来るがDeepColorのTVでもそのままじゃわからん
Blu-Ray再生でRGBのまま再生したいときにロスが減るという意味がある程度かもしれん
58名無しさん@お腹いっぱい。 (ワッチョイW 574d-q9La)
2016/05/28(土) 18:13:12.85ID:VJDl+RrJ0 新バージョンはいつ頃になりそうですか?
59名無しさん@お腹いっぱい。 (ワッチョイ 3f39-I3Qh)
2016/05/29(日) 03:27:38.86ID:s6BvNCI80 rigayaの日記兼メモ帳 技研公開 2016
http://rigaya34589.blog135.fc2.com/blog-entry-788.html
NHKの方でも縮小して拡大、PSNR算出みたいな事するのね
http://rigaya34589.blog135.fc2.com/blog-entry-788.html
NHKの方でも縮小して拡大、PSNR算出みたいな事するのね
60名無しさん@お腹いっぱい。 (ワッチョイ 3f39-I3Qh)
2016/05/29(日) 03:40:46.10ID:s6BvNCI80 ムッ、ブログ記事の画像URLのGiken2016_10s.jpgをGiken2016_10.jpgにすると読みやすいのが出るな
61名無しさん@お腹いっぱい。 (ワッチョイ d7d2-AZVN)
2016/05/31(火) 00:49:27.83ID:oZ5ZU4SC0 >>58
平均的にはいいんだけど,現在のモデルよりすごく悪くなる例がいくつかあってどうしてもよくならないので苦悩しています
(ウェブの方を置換するので現在より悪い例はできるだけ無くしたい)
あと2倍といっていたけど,モデルのロード時間も測ってしまっていて
測りなおしたら4倍近く速かったので,もう少し遅くなっていいのでよくできないかなと考えています
平均的にはいいんだけど,現在のモデルよりすごく悪くなる例がいくつかあってどうしてもよくならないので苦悩しています
(ウェブの方を置換するので現在より悪い例はできるだけ無くしたい)
あと2倍といっていたけど,モデルのロード時間も測ってしまっていて
測りなおしたら4倍近く速かったので,もう少し遅くなっていいのでよくできないかなと考えています
62名無しさん@お腹いっぱい。 (アウアウ Sa7f-yuEZ)
2016/05/31(火) 10:03:28.13ID:C22Vvmqga >>61
お疲れ様です。
すごく悪くなる例というのは、以前おっしゃられていたピクセルアートなどの場合でしょうか?
私はプログラミングのことはよくわかりませんが、悪くなる原因というのは現行方式にくらべて新方式が速く処理できる以上、
何か重要な処理が省かれてしまっている、もしくは簡略化されてしまっている、という可能性はないのでしょうか?
逆に言うと、省かれたか簡略化された処理がかねてより問題の輪郭線などが溶けてしまう要素とも関係していたりはしないのでしょうか?
もしそうであるならばですが、拡大処理などをする前にまず画像全体をチェックして、新方式で問題ないと判断される場所は新方式で高速処理し、
問題が出そうと判断される場所は現行方式、あるいはさらに改良した方式をあてがうなど、処理を切り替える必要性があるのではないでしょうか?
それと3年ほど前の記事ですが、こんな記述も参考になるかも
・東芝「REGZA Z8X」開発陣に聞く、「本格的4K時代」 4Kだから差が出る画質。地デジを高画質化の秘密
http://av.watch.impress.co.jp/docs/series/rt/20130809_610976.html
「ではなにが実物感に繋がっているのかというと、グラデーションの美しさであったり、自然なエッジの持つ「柔らかいが細かい」という感覚です。
映像エンジンとしては、階調性や微小な振幅が失われないよう、いかに内部のバス幅を広くとるか、ということを意識して開発しています。
最後まで12bitで伝送するといったことにこだわらないと、4Kらしい実物感が出てこないのです。」
→つまり、前回お話ししていた8bit画像を高bit化する際の処理方法とその後の情報精度維持が効く!
お疲れ様です。
すごく悪くなる例というのは、以前おっしゃられていたピクセルアートなどの場合でしょうか?
私はプログラミングのことはよくわかりませんが、悪くなる原因というのは現行方式にくらべて新方式が速く処理できる以上、
何か重要な処理が省かれてしまっている、もしくは簡略化されてしまっている、という可能性はないのでしょうか?
逆に言うと、省かれたか簡略化された処理がかねてより問題の輪郭線などが溶けてしまう要素とも関係していたりはしないのでしょうか?
もしそうであるならばですが、拡大処理などをする前にまず画像全体をチェックして、新方式で問題ないと判断される場所は新方式で高速処理し、
問題が出そうと判断される場所は現行方式、あるいはさらに改良した方式をあてがうなど、処理を切り替える必要性があるのではないでしょうか?
それと3年ほど前の記事ですが、こんな記述も参考になるかも
・東芝「REGZA Z8X」開発陣に聞く、「本格的4K時代」 4Kだから差が出る画質。地デジを高画質化の秘密
http://av.watch.impress.co.jp/docs/series/rt/20130809_610976.html
「ではなにが実物感に繋がっているのかというと、グラデーションの美しさであったり、自然なエッジの持つ「柔らかいが細かい」という感覚です。
映像エンジンとしては、階調性や微小な振幅が失われないよう、いかに内部のバス幅を広くとるか、ということを意識して開発しています。
最後まで12bitで伝送するといったことにこだわらないと、4Kらしい実物感が出てこないのです。」
→つまり、前回お話ししていた8bit画像を高bit化する際の処理方法とその後の情報精度維持が効く!
63名無しさん@お腹いっぱい。 (アウアウ Sa7f-yuEZ)
2016/05/31(火) 10:04:09.16ID:C22Vvmqga ・微細テクスチャー復元
http://av.watch.impress.co.jp/img/avw/docs/610/976/html/ppt05.jpg.html
「2Kの段と4Kの段をしっかりわけて処理しないと、そうした「リアリティ」が出ない
そんなにゲインをかけてはいないです。微小なところしかかけていないんですが、それを入れるか入れないかで、4Kになってしまうと大きくかわってきます。」
→微小な階調差の領域とそうでないところを同じ処理(=強調)をしてはいけない!
※協調具合は逆ガンマ特性であてがうといいのかも
・絵柄構造適応型MPEG-NR
http://www.toshiba.co.jp/regza/lineup/z700x/quality_03.html#psa
→絵柄の相関性に基づいてフィルターの形状を適正化の部分を取り込むことで、参照範囲を拡張することによるアーティファクトの問題を軽減!
http://av.watch.impress.co.jp/img/avw/docs/610/976/html/ppt05.jpg.html
「2Kの段と4Kの段をしっかりわけて処理しないと、そうした「リアリティ」が出ない
そんなにゲインをかけてはいないです。微小なところしかかけていないんですが、それを入れるか入れないかで、4Kになってしまうと大きくかわってきます。」
→微小な階調差の領域とそうでないところを同じ処理(=強調)をしてはいけない!
※協調具合は逆ガンマ特性であてがうといいのかも
・絵柄構造適応型MPEG-NR
http://www.toshiba.co.jp/regza/lineup/z700x/quality_03.html#psa
→絵柄の相関性に基づいてフィルターの形状を適正化の部分を取り込むことで、参照範囲を拡張することによるアーティファクトの問題を軽減!
64名無しさん@お腹いっぱい。 (アウアウ Sa7f-yuEZ)
2016/05/31(火) 10:11:05.50ID:C22Vvmqga 8bit画像を高bit化について追記
ノイズ除去や拡大する前に、ディープラーニングを使った高bit化(8→16bit化)が必要なのかも。
※単なるデータだけ16bitにしました、ではなく!
ノイズ除去や拡大する前に、ディープラーニングを使った高bit化(8→16bit化)が必要なのかも。
※単なるデータだけ16bitにしました、ではなく!
65名無しさん@お腹いっぱい。 (アウアウ Sa7f-yuEZ)
2016/05/31(火) 12:33:31.37ID:C22Vvmqga >>64を訂正
元画像でディープラーニングを使った高bit化(8→16bit化)ではなく、waifu2xで内部的に確か使っているニアレストネイバーで拡大した画像をディープラーニングを使った高bit化(8→16bit化)のほうがいいのか?
元画像でディープラーニングを使った高bit化(8→16bit化)ではなく、waifu2xで内部的に確か使っているニアレストネイバーで拡大した画像をディープラーニングを使った高bit化(8→16bit化)のほうがいいのか?
66名無しさん@お腹いっぱい。 (アウアウ Sa7f-yuEZ)
2016/05/31(火) 12:35:45.44ID:C22Vvmqga いや、それなら拡大後の画像にディープラーニングを使った高bit化(8→16bit化)を適用すればいいのか?
手元で試せるわけじゃないからわからんな・・・
手元で試せるわけじゃないからわからんな・・・
67名無しさん@お腹いっぱい。 (アウアウ Sa7f-yuEZ)
2016/05/31(火) 12:57:25.17ID:C22Vvmqga そもそも原点に戻るべきなんだろうか?
waifu2xが出た当初、今よりも輪郭が溶けやすかったので、NNEDI3で拡大後にwaifu2xでノイズ除去のみ適用というのをやったことがあったけど、
waifu2xが改良されてからNNEDI3を使う方法は全く試してなかったんだよねぇ。
NNEDI3と最新版のノイズ除去との組み合わせ、あるいは以前に書いたような輪郭成分と認識される部分だけに適用されるような新型ノイズ除去?との組み合わせならばどうなるのだろうとふつふつ・・・
そのうち時間が取れたら試すか。
waifu2xが出た当初、今よりも輪郭が溶けやすかったので、NNEDI3で拡大後にwaifu2xでノイズ除去のみ適用というのをやったことがあったけど、
waifu2xが改良されてからNNEDI3を使う方法は全く試してなかったんだよねぇ。
NNEDI3と最新版のノイズ除去との組み合わせ、あるいは以前に書いたような輪郭成分と認識される部分だけに適用されるような新型ノイズ除去?との組み合わせならばどうなるのだろうとふつふつ・・・
そのうち時間が取れたら試すか。
68名無しさん@お腹いっぱい。 (アウアウ Sa7f-yuEZ)
2016/05/31(火) 13:14:26.12ID:C22Vvmqga 手元に以前にNNEDIS3にて2倍、4倍、8倍に拡大した画像があったので改めて見てみたのだが、確かに眠い画像ではあるんだけど輪郭とかは自然なんだよね。
NNEDI3で拡大して、画像の面成分(=「Imager::AnimeFace」にて輪郭と認識されないところ)のみwaifu2xにて超解像効果を適用・・・
それができるのならば、テレビなどでよくある解像度の変換はなしで、解像感だけアップする手段にも使えるのか?
NNEDI3で拡大して、画像の面成分(=「Imager::AnimeFace」にて輪郭と認識されないところ)のみwaifu2xにて超解像効果を適用・・・
それができるのならば、テレビなどでよくある解像度の変換はなしで、解像感だけアップする手段にも使えるのか?
69名無しさん@お腹いっぱい。 (ワッチョイ 7b0f-dYmh)
2016/05/31(火) 13:20:06.61ID:7tY1vICr0 ダラダラとうぜえ・・・
70名無しさん@お腹いっぱい。 (ワッチョイ e7e2-FhuW)
2016/05/31(火) 16:10:01.21ID:nKVf7NYn0 「私はプログラミングのことはよくわかりませんが」って奴が、よくまあ長々と愚にもつかない事を語れるもんだ
マジでどういう神経してるのかと
マジでどういう神経してるのかと
71名無しさん@お腹いっぱい。 (ワッチョイ e39d-kHkB)
2016/05/31(火) 16:19:05.88ID:IXSgPgWR072名無しさん@お腹いっぱい。 (スプー Sdff-q9La)
2016/05/31(火) 18:17:18.12ID:G7S0Hj3Td73名無しさん@お腹いっぱい。 (ワッチョイW 576c-q9La)
2016/05/31(火) 19:23:41.36ID:DPKFBz19074名無しさん@お腹いっぱい。 (アウアウ Sae5-YSaM)
2016/06/02(木) 10:13:34.24ID:8dS/92/Ma 今日のGoogleは影絵作家の生誕記念バージョンになっているけれど、新バージョンは影絵とかも不得意かもと思ったところでひとつ気になったことがあったので調べてみた。
・Convolutional Neural Networkとは何なのか
http://qiita.com/icoxfog417/items/5fd55fad152231d706c2
気になったのは
「CNNの進化
年が経るにつれ精度が上がってきているCNNですが、近年の構成では以下のような特徴がみられます。
フィルタを小さくし、階層を深くする
PoolingやFCのレイヤをなくす
以下の図では、年々精度が上がるにつれレイヤが深くなっているのがわかります。」
の部分。
つまり、フィルターというか参照範囲そのものを増やすよりもレイヤー(考え得るパターンの分岐?)を深く(=パターンを増やす)するほうが得策っぽい件なのだが、
そうであるならば、参照範囲は現行程度に留めて、フィルターの形を複数用意してそれぞれの絵柄に応じて一番しっくりくるフィルターの情報を基に畳みこみした方が
いいんではなかろうかとふと思ったのですが、ダメですかね?
フィルターをあらかじめ、正方形、長方形、△(向き四方向各々)菱形、8角形、とか用意しておいて、全部実行して一番いいのを選択。
TTLモードで回転による8パターンをやる時間があるならば、この方がいい結果が出るような気もするんですが。
・Convolutional Neural Networkとは何なのか
http://qiita.com/icoxfog417/items/5fd55fad152231d706c2
気になったのは
「CNNの進化
年が経るにつれ精度が上がってきているCNNですが、近年の構成では以下のような特徴がみられます。
フィルタを小さくし、階層を深くする
PoolingやFCのレイヤをなくす
以下の図では、年々精度が上がるにつれレイヤが深くなっているのがわかります。」
の部分。
つまり、フィルターというか参照範囲そのものを増やすよりもレイヤー(考え得るパターンの分岐?)を深く(=パターンを増やす)するほうが得策っぽい件なのだが、
そうであるならば、参照範囲は現行程度に留めて、フィルターの形を複数用意してそれぞれの絵柄に応じて一番しっくりくるフィルターの情報を基に畳みこみした方が
いいんではなかろうかとふと思ったのですが、ダメですかね?
フィルターをあらかじめ、正方形、長方形、△(向き四方向各々)菱形、8角形、とか用意しておいて、全部実行して一番いいのを選択。
TTLモードで回転による8パターンをやる時間があるならば、この方がいい結果が出るような気もするんですが。
75名無しさん@お腹いっぱい。 (アウアウ Sae5-YSaM)
2016/06/02(木) 10:30:41.45ID:8dS/92/Ma すでにやっている人はいたようです。
・Deep Learning Advent Calendar 2015
http://vaaaaaanquish.hatenablog.com/entry/2015/12/25/005523
「sliding windowのスケールの違いによって入力も違うため, 誤認識が発生するという問題もありました.
そこで, Exhaustive Searchのスケールによる誤認識を減らすための画像処理手法や計算量を減らす手法*4, 物体検出に対して効率的な手法*5が出てきたり,
CNN以外でもsliding windowの欠点を補うようなRandom Forest的手法*6が出てきたりしました.」
で、さらにDeep Q-Network(DQN)などというものも出ているようで(名前がなw)
深い・・・
・Deep Learning Advent Calendar 2015
http://vaaaaaanquish.hatenablog.com/entry/2015/12/25/005523
「sliding windowのスケールの違いによって入力も違うため, 誤認識が発生するという問題もありました.
そこで, Exhaustive Searchのスケールによる誤認識を減らすための画像処理手法や計算量を減らす手法*4, 物体検出に対して効率的な手法*5が出てきたり,
CNN以外でもsliding windowの欠点を補うようなRandom Forest的手法*6が出てきたりしました.」
で、さらにDeep Q-Network(DQN)などというものも出ているようで(名前がなw)
深い・・・
76名無しさん@お腹いっぱい。 (ワッチョイ 95d2-wHOq)
2016/06/02(木) 10:37:26.83ID:oNKZhMTS0 もう悪くなりそうなパターンを調べてそういうパターンを自動生成して学習データに加えることで無理やり対応した
例: http://ccsaku.moe.hm/gyazo/data/0b76b99850d7cc5eac0e4857da451890.png
こういうパターンを良くするのと引き換えにイラストの平均的なスコアは少し下がると思うけど
最悪な場合のスコアはかなり上がっているはずなのでいいやろという感じ
イラスト90枚のセットで,縮小に平均画素法を使ったときの平均PSNRが
既存: 36.74, 新: 37.07
縮小にLanczosを使った時が
既存: 36.76, 新: 37.25
で平均も既存よりは良くなっている
処理速度も2.4倍くらい速い
対応方法はこれでいいと思うので,
あとちょっと調節するのとノイズ除去付きも試してみてよければ追加で
ウェブの方は新モデルで置き換えることはほぼ決まりです
例: http://ccsaku.moe.hm/gyazo/data/0b76b99850d7cc5eac0e4857da451890.png
こういうパターンを良くするのと引き換えにイラストの平均的なスコアは少し下がると思うけど
最悪な場合のスコアはかなり上がっているはずなのでいいやろという感じ
イラスト90枚のセットで,縮小に平均画素法を使ったときの平均PSNRが
既存: 36.74, 新: 37.07
縮小にLanczosを使った時が
既存: 36.76, 新: 37.25
で平均も既存よりは良くなっている
処理速度も2.4倍くらい速い
対応方法はこれでいいと思うので,
あとちょっと調節するのとノイズ除去付きも試してみてよければ追加で
ウェブの方は新モデルで置き換えることはほぼ決まりです
77名無しさん@お腹いっぱい。 (ワッチョイ 95d2-wHOq)
2016/06/02(木) 10:53:32.12ID:oNKZhMTS0 >>74
レイヤというのはwaifu2xでいうと畳み込み+ReLUを行うの回数のことで
>フィルタを小さくし、階層を深くする
これはVGG Netなどの3x3畳み込みを何度も繰り返すネットワークで
waifu2xは元からこれをベースにしています.
また1x1畳み込み以外だとレイヤを増やすと参照範囲も広がります.
フィルタの型は係数によって変わると考えていいと思うのでこれも最適化されているはず
レイヤというのはwaifu2xでいうと畳み込み+ReLUを行うの回数のことで
>フィルタを小さくし、階層を深くする
これはVGG Netなどの3x3畳み込みを何度も繰り返すネットワークで
waifu2xは元からこれをベースにしています.
また1x1畳み込み以外だとレイヤを増やすと参照範囲も広がります.
フィルタの型は係数によって変わると考えていいと思うのでこれも最適化されているはず
78名無しさん@お腹いっぱい。 (アウアウ Sae5-YSaM)
2016/06/02(木) 10:56:14.63ID:8dS/92/Ma >>76
お疲れ様です。
悪いパターンを自動生成して学習ですか。
それはよさそうですね。
確かにこういうコントラスト比の高く境界面の差が大きい画像を集中的に取り込んでおくのはいいと思います。
(そういう意味では影絵もいいのか?)
期待しております。
お疲れ様です。
悪いパターンを自動生成して学習ですか。
それはよさそうですね。
確かにこういうコントラスト比の高く境界面の差が大きい画像を集中的に取り込んでおくのはいいと思います。
(そういう意味では影絵もいいのか?)
期待しております。
79名無しさん@お腹いっぱい。 (アウアウ Sae5-YSaM)
2016/06/02(木) 11:00:59.96ID:8dS/92/Ma >>77
入れ違った・・・
解説ありがとうございます。
>レイヤというのはwaifu2xでいうと畳み込み+ReLUを行うの回数
ということは、演算回数を利用者が任意に変更できるようになると、
・回数を減らして時間短縮(精度は落ちる)
・回数を増やして精度向上(時間はかかるが、1日でも2日でもバッチコーイならば・・・)
とかできるといいかもしれないなと思いました。
>フィルタの型は係数によって変わると考えていいと思うのでこれも最適化されているはず
それは素晴らしい。
結果を楽しみにしておきます。
入れ違った・・・
解説ありがとうございます。
>レイヤというのはwaifu2xでいうと畳み込み+ReLUを行うの回数
ということは、演算回数を利用者が任意に変更できるようになると、
・回数を減らして時間短縮(精度は落ちる)
・回数を増やして精度向上(時間はかかるが、1日でも2日でもバッチコーイならば・・・)
とかできるといいかもしれないなと思いました。
>フィルタの型は係数によって変わると考えていいと思うのでこれも最適化されているはず
それは素晴らしい。
結果を楽しみにしておきます。
80名無しさん@お腹いっぱい。 (ワッチョイW fc6c-1HXA)
2016/06/02(木) 20:21:59.49ID:pnTBbeI4081名無しさん@お腹いっぱい。 (ワッチョイ 95d2-wHOq)
2016/06/02(木) 23:11:39.30ID:oNKZhMTS0 今の感じだとアニメは拡大後の理想される線の質がイラストと違うので
イラストで学習しているとダメだと思います
写真モデルを使えば無難な結果になると思うけど
イラストで学習しているとダメだと思います
写真モデルを使えば無難な結果になると思うけど
82名無しさん@お腹いっぱい。 (スプー Sdb8-1HXA)
2016/06/03(金) 07:56:07.56ID:wf71obz2d やっぱり輪郭線は直らないのか…
そこ期待してたのにだけにちょっと残念だ
そこ期待してたのにだけにちょっと残念だ
83名無しさん@お腹いっぱい。 (アウアウ Sae5-qzWR)
2016/06/03(金) 08:07:32.57ID:W5n/SZaca 写真モデルで試してと書かれていると思いますが…
写真モデル+TTL+新バージョンの組合せで、どれだけ改善されるか次第かと。
写真モデル+TTL+新バージョンの組合せで、どれだけ改善されるか次第かと。
84名無しさん@お腹いっぱい。 (ワッチョイW fc6c-1HXA)
2016/06/04(土) 10:43:26.24ID:LR9p0GeB0 本家、もしかしてもう新バージョンに変わった?
85名無しさん@お腹いっぱい。 (ワッチョイ 95d2-wHOq)
2016/06/05(日) 00:04:39.84ID:Tj8OObVD0 いいえ
86名無しさん@お腹いっぱい。 (テトリス fc41-ChPp)
2016/06/06(月) 21:11:13.67ID:mne5Rlul00606 モノクロ写真をアップすると……? 「人工知能で白黒写真をカラーに」を試せるWebサービス
ディープラーニングを応用し、白黒写真を自然な色味に彩色する手法をブラウザ上で実行できるWebサービスが公開された。
http://www.itmedia.co.jp/news/articles/1606/06/news131.html
ディープラーニングを応用し、白黒写真を自然な色味に彩色する手法をブラウザ上で実行できるWebサービスが公開された。
http://www.itmedia.co.jp/news/articles/1606/06/news131.html
87名無しさん@お腹いっぱい。 (ワッチョイ 59d1-ChPp)
2016/06/07(火) 01:06:02.01ID:TrYKmBlx0 >>86
へー、これもローカルで動くやつ誰か作らないかな(他力本願
へー、これもローカルで動くやつ誰か作らないかな(他力本願
88名無しさん@お腹いっぱい。 (アウアウ Sae5-8R5K)
2016/06/07(火) 09:35:28.02ID:AUEYrNINa >>86
学習データが偏っているんだろうけど、黄色あたりが不自然なんだよな、これ。
もっと学習データ増やさないと。
ディープラーニング関係の資料を見ていて思うのは、学習データがキモであるにも関わらず、学習するのに時間がかかるせいか妙に学習データの数が少ないなと思うケースがしばしばあるように思う。
ある程度の正確性を求めたければ少なくとも10000以上は学習しないと話にならないのに。
学習データが偏っているんだろうけど、黄色あたりが不自然なんだよな、これ。
もっと学習データ増やさないと。
ディープラーニング関係の資料を見ていて思うのは、学習データがキモであるにも関わらず、学習するのに時間がかかるせいか妙に学習データの数が少ないなと思うケースがしばしばあるように思う。
ある程度の正確性を求めたければ少なくとも10000以上は学習しないと話にならないのに。
89名無しさん@お腹いっぱい。 (ワッチョイ fc41-ChPp)
2016/06/07(火) 10:08:31.94ID:nWqCN514090名無しさん@お腹いっぱい。 (ササクッテロ Sp89-H1tZ)
2016/06/07(火) 15:34:59.10ID:pCuPD5oYp ぼっさん
91名無しさん@お腹いっぱい。 (アウアウ Sab7-wy7a)
2016/06/11(土) 15:38:17.09ID:rLStxyFWa いよいよ作者氏が本気出す時が来たようだ。
https://twitter.com/ultraistter/status/741488649884164096?lang=ja
ところで、GTX 1080 1枚 VS RX480 2枚で話題になった例の件、waifu2xの場合はやはりGTX 1080 1枚のほうがいいんだよね?
https://twitter.com/ultraistter/status/741488649884164096?lang=ja
ところで、GTX 1080 1枚 VS RX480 2枚で話題になった例の件、waifu2xの場合はやはりGTX 1080 1枚のほうがいいんだよね?
92名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/11(土) 19:45:42.62ID:3Rvur7wT0 新モデル+GTX 1080だと640x480->1024x768のノイズ除去+2xが560msくらいでできています
あとGPUの違いなのかcuDNN v5+CUDA 8.0か分からないけど
以前試したら異常に遅かったWinogradという3x3畳み込みを速くするアルゴリズムが
速くなってて,現verも950msくらいで処理できています.
(以前は,新モデルのほうが3倍くらい速かったので差がかなり縮んだ)
AWS EC2のGPU+現verだと3700msくらいで,このGPUはGTX 760と同じくらいの性能です.
あとGPUの違いなのかcuDNN v5+CUDA 8.0か分からないけど
以前試したら異常に遅かったWinogradという3x3畳み込みを速くするアルゴリズムが
速くなってて,現verも950msくらいで処理できています.
(以前は,新モデルのほうが3倍くらい速かったので差がかなり縮んだ)
AWS EC2のGPU+現verだと3700msくらいで,このGPUはGTX 760と同じくらいの性能です.
93名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/11(土) 19:59:19.46ID:3Rvur7wT0 >640x480->1024x768
640x480->1280x960に訂正
640x480->1280x960に訂正
94名無しさん@お腹いっぱい。 (ワッチョイ bb9d-7xHu)
2016/06/11(土) 20:27:45.11ID:qniHE9xy0 ベンチマークというか単純に自PCのショボさを比較したいのですが
皆で共通に使える適当な画像(画像群)ってどこかにあったりしますか?
R18にならない程度の2次で(ココ重要
皆で共通に使える適当な画像(画像群)ってどこかにあったりしますか?
R18にならない程度の2次で(ココ重要
95名無しさん@お腹いっぱい。 (アウアウ Sab7-Hfww)
2016/06/11(土) 20:45:50.92ID:rLStxyFWa >>92
お疲れ様です。
GTX 1080導入、おめでとうございます。
アルゴリズムによって速度が変わるとのことですが、画質が変わったりはしないのでしょうか?
遅いけど高画質なアルゴリズムとかあるのかなと。
あと、二段階超解像ってできないかなと思ったりしてるのですが。
つまり、
1回目:今まで通りの超解像による拡大
2回目:1回目でできた拡大画像と元の画像を比較して、再度超解像効果を手直し
みたいな。
元画像と拡大画像を見比べて、「もっとここ手直しできる」というところを再調整とでもいうのか。
この2回目だけの処理だけ活用すると、元画像を拡大せずに解像感や輪郭まわりの再現性向上にも使えますだとなおうれしいんですが。
お疲れ様です。
GTX 1080導入、おめでとうございます。
アルゴリズムによって速度が変わるとのことですが、画質が変わったりはしないのでしょうか?
遅いけど高画質なアルゴリズムとかあるのかなと。
あと、二段階超解像ってできないかなと思ったりしてるのですが。
つまり、
1回目:今まで通りの超解像による拡大
2回目:1回目でできた拡大画像と元の画像を比較して、再度超解像効果を手直し
みたいな。
元画像と拡大画像を見比べて、「もっとここ手直しできる」というところを再調整とでもいうのか。
この2回目だけの処理だけ活用すると、元画像を拡大せずに解像感や輪郭まわりの再現性向上にも使えますだとなおうれしいんですが。
96名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/11(土) 21:06:09.55ID:3Rvur7wT097名無しさん@お腹いっぱい。 (アウアウ Sab7-Hfww)
2016/06/11(土) 21:22:18.30ID:rLStxyFWa9894 (ワッチョイ 839d-7xHu)
2016/06/11(土) 22:26:00.73ID:+7f02WYI099名無しさん@お腹いっぱい。 (スプー Sd4f-jNGR)
2016/06/11(土) 23:05:53.70ID:nlOtB76kd 560msって早すぎやろ!
waifu2xで動画エンコしてるけどかなり短縮されそうでワクワクだわ
俺もPascal買おうかなぁ
waifu2xで動画エンコしてるけどかなり短縮されそうでワクワクだわ
俺もPascal買おうかなぁ
100名無しさん@お腹いっぱい。 (ワッチョイW 076c-jNGR)
2016/06/12(日) 11:32:13.03ID:068lTRES0 新モデルが待ち遠しいな…
完成までまだ時間掛かりそうですか?
完成までまだ時間掛かりそうですか?
101名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/12(日) 12:56:41.65ID:KlXasCVu0 ノイズ除去付き拡大もうまくいっているので
たぶんもう学習処理回すだけです
イラストは明日には全部学習終わります
あと写真、Yモデルの再学習に4日つづくくらいかかる
ちなみに現在のモデルも使えるようにしているので追加という形になります
ウェブ版はGPUメモリの関係で全部のモデル読めないので置き換えますが
ベンチマーク的には結構スコアが上がっているけど
パッと見でわかるほどの違いはないと思います
たぶんもう学習処理回すだけです
イラストは明日には全部学習終わります
あと写真、Yモデルの再学習に4日つづくくらいかかる
ちなみに現在のモデルも使えるようにしているので追加という形になります
ウェブ版はGPUメモリの関係で全部のモデル読めないので置き換えますが
ベンチマーク的には結構スコアが上がっているけど
パッと見でわかるほどの違いはないと思います
102名無しさん@お腹いっぱい。 (ワッチョイW 076c-jNGR)
2016/06/12(日) 13:07:19.18ID:068lTRES0103名無しさん@お腹いっぱい。 (ワッチョイ 9f39-pgBS)
2016/06/12(日) 13:19:55.61ID:b/8HpM7e0 ノイズ除去がYからRGBになったときはサンプルの画像挙げて変化を説明してたはず
画像出さずにPSNRの数値だけ出すのは人間の目から見てそう変化がないからだろう多分
画像出さずにPSNRの数値だけ出すのは人間の目から見てそう変化がないからだろう多分
104名無しさん@お腹いっぱい。 (ワッチョイ 9f39-pgBS)
2016/06/12(日) 13:25:17.47ID:b/8HpM7e0 サンプル出してたの別の人だったかも、うろ覚え(汗
105名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/12(日) 14:42:39.03ID:KlXasCVu0 >>103
2枚重ねてみると、ところどころ違いがあるは分かりますけど
黙って置き換えても誰も気づかないのではないかという不安はあります
なんとなく違和感が減った気はするけどプラシーボかもしれない
PSNR的には結構良くなっているので、よくなっているのは確かだと思いますが説得力はないです
明日か明後日くらいにウェブの方イラストだけ置き換えようと思うので
気になる画像を持っている方はそのときに試してみてください
2枚重ねてみると、ところどころ違いがあるは分かりますけど
黙って置き換えても誰も気づかないのではないかという不安はあります
なんとなく違和感が減った気はするけどプラシーボかもしれない
PSNR的には結構良くなっているので、よくなっているのは確かだと思いますが説得力はないです
明日か明後日くらいにウェブの方イラストだけ置き換えようと思うので
気になる画像を持っている方はそのときに試してみてください
106名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/12(日) 15:47:23.38ID:KlXasCVu0 やっぱ置き換えではなくてお試し用サーバー1台用意します。
もともと今のウェブ版はそういうものだけど、
もう普通のウェブサービスになってしまっていて置き換えるのに勇気がいるので。
それならTTAも使えるようにできます。(遅いのは仕方がないねということで)
もともと今のウェブ版はそういうものだけど、
もう普通のウェブサービスになってしまっていて置き換えるのに勇気がいるので。
それならTTAも使えるようにできます。(遅いのは仕方がないねということで)
107名無しさん@お腹いっぱい。 (ワッチョイW 076c-jNGR)
2016/06/12(日) 16:01:03.81ID:068lTRES0108名無しさん@お腹いっぱい。 (アウアウ Sab7-Hfww)
2016/06/12(日) 17:23:59.21ID:sb1XFNmOa109名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/13(月) 00:47:21.31ID:X831nMGS0 >>107
元画像があれば見ておきますが。
写真はまだやっていないので分からないですが
イラストはそれほど変わっていないのであまり期待できないと思います。
ちなみにこれはイラストでノイズ除去2してますよね...?
元画像があれば見ておきますが。
写真はまだやっていないので分からないですが
イラストはそれほど変わっていないのであまり期待できないと思います。
ちなみにこれはイラストでノイズ除去2してますよね...?
110名無しさん@お腹いっぱい。 (スプー Sd4f-jNGR)
2016/06/13(月) 01:59:20.36ID:grDqBPChd111名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/13(月) 18:17:31.84ID:X831nMGS0 http://waifu2x-dev.udp.jp/
で新モデル試せるようにしています
拡大とノイズ除去+拡大が変わっています.ノイズ除去のみは同じです.
自分で見た感じだと,拡大はそれほど違いはないし問題もないように思うけど
ノイズ除去が入ると,強弱が以前よりはっきり出ていて
いい時はいいけど,ノイズが強い時に線の太さが不安定になっているように思います.
なにか思うことがあれば書いていただくと対応できるかもしれません.
ベンチマーク結果は
https://github.com/nagadomi/waifu2x/blob/upconv/appendix/vgg_7_vs_upconv_7_art.md
にあります.ベンチマーク的には全部良くなっています.
で新モデル試せるようにしています
拡大とノイズ除去+拡大が変わっています.ノイズ除去のみは同じです.
自分で見た感じだと,拡大はそれほど違いはないし問題もないように思うけど
ノイズ除去が入ると,強弱が以前よりはっきり出ていて
いい時はいいけど,ノイズが強い時に線の太さが不安定になっているように思います.
なにか思うことがあれば書いていただくと対応できるかもしれません.
ベンチマーク結果は
https://github.com/nagadomi/waifu2x/blob/upconv/appendix/vgg_7_vs_upconv_7_art.md
にあります.ベンチマーク的には全部良くなっています.
112名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/13(月) 18:21:32.55ID:X831nMGS0 やっぱりYUV 420のJPEGでやったほうがいいのかなと思い始めました.
現実のJPEGはほとんどがYUV 420で学習時にYUV 444しか見ていないので.
今は色が変わるのでやっていないのですが,選択できるようにするかもしれません.
現実のJPEGはほとんどがYUV 420で学習時にYUV 444しか見ていないので.
今は色が変わるのでやっていないのですが,選択できるようにするかもしれません.
113名無しさん@お腹いっぱい。 (スプー Sdcf-jNGR)
2016/06/14(火) 02:01:47.66ID:LX3lI3W3d 新バージョン、凄く速度が上がってますね
でも、輪郭線は正直微妙かなぁ
良くなってるところもあるけど、悪くなってるところも結構あったりする
こればっかりはしょうがないですね
でも、輪郭線は正直微妙かなぁ
良くなってるところもあるけど、悪くなってるところも結構あったりする
こればっかりはしょうがないですね
114名無しさん@お腹いっぱい。 (スプー Sdcf-jNGR)
2016/06/14(火) 02:19:04.81ID:LX3lI3W3d あ、間違えて旧版の写真モデルと比較してた
イラスト同士で見比べてみたけど、違いが全然わからんw
ただ、処理速度は格段に早くなってる
イラスト同士で見比べてみたけど、違いが全然わからんw
ただ、処理速度は格段に早くなってる
115名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/14(火) 10:39:33.36ID:FTpBbaqf0 YUV420/YUV444半分づつで学習したら
入力YUV444時のスコアほとんど下げずに
入力YUV420時のスコアがっつり上げれる感じだったので
もうノイズ除去もこれに置き換えようと思います.
もともとJPEGの色のノイズ等も消しているし,色以前に細部が消えたりしているので
色がちょっと変わるリスクなんていまさらだよね...?
平均的には良くなるし,いくらか試すと線の境界などで色が濁ってるが結構直ってる.
入力YUV444時のスコアほとんど下げずに
入力YUV420時のスコアがっつり上げれる感じだったので
もうノイズ除去もこれに置き換えようと思います.
もともとJPEGの色のノイズ等も消しているし,色以前に細部が消えたりしているので
色がちょっと変わるリスクなんていまさらだよね...?
平均的には良くなるし,いくらか試すと線の境界などで色が濁ってるが結構直ってる.
116名無しさん@お腹いっぱい。 (アウアウ Sab7-wy7a)
2016/06/14(火) 11:21:07.53ID:cuCffqFAa >>111
お疲れ様です。
早速試させていただきました。
イラストモデルのみではありますが試したところ、以前に比べて少し溶けにくくはなったような気もします(特に4倍以上にした場合)
なお、>>108にて書いた対処療法をすこし時間があったのでやってみました。
(結果は下記にてダウンロード可。明日の23時59分までの限定です。解説はテキストファイルに書いてあります。)
http://www1.axfc.net/u/3679593
写真モデルでやるとどうなるか、あるいはもうすこし小細工するかも含めて検討中です。
>>112
YUV 420モデル(イラスト・写真それぞれ)があれば、一種の色超解像的効果が期待できるので、圧縮画像には特に効用が見込めると思います。
期待しております。
お疲れ様です。
早速試させていただきました。
イラストモデルのみではありますが試したところ、以前に比べて少し溶けにくくはなったような気もします(特に4倍以上にした場合)
なお、>>108にて書いた対処療法をすこし時間があったのでやってみました。
(結果は下記にてダウンロード可。明日の23時59分までの限定です。解説はテキストファイルに書いてあります。)
http://www1.axfc.net/u/3679593
写真モデルでやるとどうなるか、あるいはもうすこし小細工するかも含めて検討中です。
>>112
YUV 420モデル(イラスト・写真それぞれ)があれば、一種の色超解像的効果が期待できるので、圧縮画像には特に効用が見込めると思います。
期待しております。
117名無しさん@お腹いっぱい。 (アウアウ Sab7-wy7a)
2016/06/14(火) 12:09:55.28ID:cuCffqFAa118名無しさん@お腹いっぱい。 (アウアウ Sab7-wy7a)
2016/06/14(火) 12:26:29.32ID:cuCffqFAa あらかじめNNEDI3で拡大する前に、GIMPでアンシャープマスクを+0.10程度かけておいてからNNEDI3で拡大→縮小→waifu2x→再度GIMPにてコントラストとアンシャープで微調整のほうが細部の情報が残りやすいみたい。
アップする時間がなくなったので今日はここまで。
アップする時間がなくなったので今日はここまで。
119名無しさん@お腹いっぱい。 (アウアウ Sab7-wy7a)
2016/06/14(火) 18:07:05.51ID:cuCffqFAa 移動中に報告
NNEDI3を使って、圧縮画像によく見受けられる輪郭周りのノイズを除去して溶ける症状を抑える件、もっと手間を少なくかつNNEDI3を使うことによる副作用である
ボケる点を克服できそうな方法を見つけたかも。
古いソフトウェアなのだが「ノイズクリーナー2」というソフトをカスタマイズ設定にして極々微量のノイズ除去を行ってからwaifu2xで拡大するといくぶん溶けにくい。
ただし、設定の落としどころが難しい。
NNEDI3を使って、圧縮画像によく見受けられる輪郭周りのノイズを除去して溶ける症状を抑える件、もっと手間を少なくかつNNEDI3を使うことによる副作用である
ボケる点を克服できそうな方法を見つけたかも。
古いソフトウェアなのだが「ノイズクリーナー2」というソフトをカスタマイズ設定にして極々微量のノイズ除去を行ってからwaifu2xで拡大するといくぶん溶けにくい。
ただし、設定の落としどころが難しい。
120名無しさん@お腹いっぱい。 (ワッチョイ 9b91-yUSa)
2016/06/14(火) 22:53:23.00ID:12Iwj2O80 imagemagickのコマンド、7になってから変わったの今初めて気づいた...
121名無しさん@お腹いっぱい。 (ワッチョイ 837c-wy7a)
2016/06/15(水) 01:45:09.31ID:aj7H3zSR0122名無しさん@お腹いっぱい。 (アウアウ Sab7-wy7a)
2016/06/15(水) 12:07:14.79ID:6gcbBuvXa NNIDI3による前処理などいろいろ試した結果、
1.waifu2xは拡大する前に輪郭に作用しやすいノイズフィルターをあらかじめ適用しておくと、拡大した画像が溶けにくい。
2.NNEDI3は輪郭線に強く作用するフィルターのため、縮小後の画像にもその作用が強く残り、結果として輪郭ノイズ低減フィルターのような作用をもたらしている。
3.ただし、NNEDI3は面などの細かい情報もそぎ落としてしまいやすく、全体的にボケやすいため、そのままでは使いにくい。
4.面部分には作用せず、輪郭にのみ作用するフィルターがあれば理想的。waifu2xのノイズ除去(中)も試してみたが、waifu2xのノイズ除去は中でも強すぎるためこれも使いにくい。
(元画像とwaifu2xでノイズ除去した画像を合成してノイズ除去の強度を調整することはできるかもしれないが、合成度合をコントロールしながら合成できるような都合のいいソフトがあるのかどうか・・・)
もうあとは、この輪郭のノイズを制圧できさえすれば完成すると思われるだけに、何かいい方法があればと思うのだけど。
1.waifu2xは拡大する前に輪郭に作用しやすいノイズフィルターをあらかじめ適用しておくと、拡大した画像が溶けにくい。
2.NNEDI3は輪郭線に強く作用するフィルターのため、縮小後の画像にもその作用が強く残り、結果として輪郭ノイズ低減フィルターのような作用をもたらしている。
3.ただし、NNEDI3は面などの細かい情報もそぎ落としてしまいやすく、全体的にボケやすいため、そのままでは使いにくい。
4.面部分には作用せず、輪郭にのみ作用するフィルターがあれば理想的。waifu2xのノイズ除去(中)も試してみたが、waifu2xのノイズ除去は中でも強すぎるためこれも使いにくい。
(元画像とwaifu2xでノイズ除去した画像を合成してノイズ除去の強度を調整することはできるかもしれないが、合成度合をコントロールしながら合成できるような都合のいいソフトがあるのかどうか・・・)
もうあとは、この輪郭のノイズを制圧できさえすれば完成すると思われるだけに、何かいい方法があればと思うのだけど。
123名無しさん@お腹いっぱい。 (ワッチョイ 6f6d-cn0R)
2016/06/15(水) 12:46:21.17ID:p6o2+4CV0 単純にTotalVariationで分離してから掛けろよ
124名無しさん@お腹いっぱい。 (アウアウ Sab7-wy7a)
2016/06/15(水) 14:57:07.20ID:6gcbBuvXa >>123
これのこと?
http://convexbrain.osdn.jp/cgi-bin/wifky.pl?p=TV-Denoising
ものすごく画像が甘くなってるんだが・・・
waifu2xの比じゃないよ、これ。
これのこと?
http://convexbrain.osdn.jp/cgi-bin/wifky.pl?p=TV-Denoising
ものすごく画像が甘くなってるんだが・・・
waifu2xの比じゃないよ、これ。
125名無しさん@お腹いっぱい。 (スプー Sd4f-jNGR)
2016/06/15(水) 15:01:46.27ID:6WWfghFId 俺はエッジレベル調整使ってる
126名無しさん@お腹いっぱい。 (アウアウ Sab7-wy7a)
2016/06/15(水) 15:25:03.46ID:6gcbBuvXa >>125
エッジレベル調整は輪郭のコントラストを無理やり強調しているだけだから、ノイズそのものは残っている状態なわけで、根本的な解決にならないかと。
こんなんだし。
http://aviutl.info/sharp/
エッジレベル調整は輪郭のコントラストを無理やり強調しているだけだから、ノイズそのものは残っている状態なわけで、根本的な解決にならないかと。
こんなんだし。
http://aviutl.info/sharp/
127名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/15(水) 16:31:22.20ID:JEuKL93L0 アニメの輪郭線に入っているノイズがイラストでは見ないパターンでうまくいかないので
そのあたりをイラストっぽい方に寄せることができればマシになるということだと思います.
古いアニメにある輪郭線まわりのノイズがソフトウェアで再現できるなら対応もできるのですが
どこで入ってくる何のノイズなんでしょうか.
そのあたりをイラストっぽい方に寄せることができればマシになるということだと思います.
古いアニメにある輪郭線まわりのノイズがソフトウェアで再現できるなら対応もできるのですが
どこで入ってくる何のノイズなんでしょうか.
128名無しさん@お腹いっぱい。 (アウアウ Sab7-Hfww)
2016/06/15(水) 17:00:29.10ID:6gcbBuvXa >>127
たぶん圧縮画像特有のノイズだと思います。
圧縮画像は目につきにくい暗い部分の階調表現を大胆に間引いてしまいがちですので(攻殻機動隊のエンコードを担当した人が、かつてDVDの時代にとても苦労されていることを語られていましたし)、
暗部の多い圧縮画像を集中的にとりこんでモデルデータを作られるといいのかもしれません。
あるいは暗部の多い圧縮画像の割合の多いモデルデータを暗部ノイズ対策専用の前処理専用モデルとして用意して、事前に弱く(ここ重要!!)適用できるようにされるといいかもしれません。
ついでに現行のノイズ除去の強度ももっと弱いタイプを二段階ほど(最弱は中の1/3以下の強度!)用意して頂きたいとも思います。
(モデルデータを変えずに参照範囲を狭めるとかでの対応でも結構ですので)
たぶん圧縮画像特有のノイズだと思います。
圧縮画像は目につきにくい暗い部分の階調表現を大胆に間引いてしまいがちですので(攻殻機動隊のエンコードを担当した人が、かつてDVDの時代にとても苦労されていることを語られていましたし)、
暗部の多い圧縮画像を集中的にとりこんでモデルデータを作られるといいのかもしれません。
あるいは暗部の多い圧縮画像の割合の多いモデルデータを暗部ノイズ対策専用の前処理専用モデルとして用意して、事前に弱く(ここ重要!!)適用できるようにされるといいかもしれません。
ついでに現行のノイズ除去の強度ももっと弱いタイプを二段階ほど(最弱は中の1/3以下の強度!)用意して頂きたいとも思います。
(モデルデータを変えずに参照範囲を狭めるとかでの対応でも結構ですので)
129名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/15(水) 17:20:59.49ID:JEuKL93L0 >>128
圧縮画像というのは具合的にどんな圧縮なんでしょうか.
TV用の当時のエンコーダがあってその癖なんでしょうか.
現在のJPEGノイズ除去の弱いバージョンはすぐ作れますが
動画を対象とするなら,動画用のエンコーダを使って
正しいデータセットを作るほうがいいと考えています.
ソフトウェアで再現が難しいなら,HDリマスタとその前のバージョンDVD?を買ってきて
フレームの位置合わせができるなら,そこから変換の対応関係を作るでもいいと思っています.
エンコの設定?とかできるならそれが一番いいですが.
圧縮画像というのは具合的にどんな圧縮なんでしょうか.
TV用の当時のエンコーダがあってその癖なんでしょうか.
現在のJPEGノイズ除去の弱いバージョンはすぐ作れますが
動画を対象とするなら,動画用のエンコーダを使って
正しいデータセットを作るほうがいいと考えています.
ソフトウェアで再現が難しいなら,HDリマスタとその前のバージョンDVD?を買ってきて
フレームの位置合わせができるなら,そこから変換の対応関係を作るでもいいと思っています.
エンコの設定?とかできるならそれが一番いいですが.
130名無しさん@お腹いっぱい。 (ワッチョイ 1bd2-qOwk)
2016/06/15(水) 17:48:43.36ID:JEuKL93L0 今考えている動画の対応は,
- イラストに窓をつけて適当な速度で平行移動・回転したりをフレームとして切り出す
- 動画にエンコ(同時に1/2に縮小)
- エンコ後からまたフレームに分割して元画像への変換を学習する
ということです.
変換先がイラストになるのでアニメとはちょっと違う質感になるかもしれませんが
アニメの"元画像"って手に入らないと思うのと,
これだと作るのは簡単なので妥協点としていいのではと思っています.
他にはMMDから動画を作るとかですけど,これもシェーダーのクセを再現してしまうと思うので
たぶんイラストのほうがバリエーションが多くてよいです.
今すぐにやるという話ではなく,今やっている対応が終ったら
いまのところCNN超解像として改良できる部分はすべて終わるので
動画について色々言われるならそこでもやろうかなというレベルの話ですが.
- イラストに窓をつけて適当な速度で平行移動・回転したりをフレームとして切り出す
- 動画にエンコ(同時に1/2に縮小)
- エンコ後からまたフレームに分割して元画像への変換を学習する
ということです.
変換先がイラストになるのでアニメとはちょっと違う質感になるかもしれませんが
アニメの"元画像"って手に入らないと思うのと,
これだと作るのは簡単なので妥協点としていいのではと思っています.
他にはMMDから動画を作るとかですけど,これもシェーダーのクセを再現してしまうと思うので
たぶんイラストのほうがバリエーションが多くてよいです.
今すぐにやるという話ではなく,今やっている対応が終ったら
いまのところCNN超解像として改良できる部分はすべて終わるので
動画について色々言われるならそこでもやろうかなというレベルの話ですが.
131名無しさん@お腹いっぱい。 (スプー Sd4f-jNGR)
2016/06/15(水) 18:09:19.82ID:6WWfghFId >>130
何のこっちゃよくわかりませんが、凄く期待してます
何のこっちゃよくわかりませんが、凄く期待してます
132名無しさん@お腹いっぱい。 (アウアウ Sab7-Hfww)
2016/06/15(水) 18:10:55.45ID:6gcbBuvXa 圧縮画像のノイズの件、夜になりますがコメントします。
(今時間がないので)
(今時間がないので)
133名無しさん@お腹いっぱい。 (ワッチョイ ebd2-zRkg)
2016/06/15(水) 22:19:16.48ID:iLIvxjAw0 いわゆるHDリマスターは解像度やエンコードだけでなく映像自体も違うことがあるから
比較対象としてはBDとDVDが同時発売のものじゃないかな
海外版との比較だと同解像度のビットレート違いなんてのもあるかも
アニメと一口に言っても輪郭の特徴がそんなに多くの作品に共通してるかは疑問だけど
比較対象としてはBDとDVDが同時発売のものじゃないかな
海外版との比較だと同解像度のビットレート違いなんてのもあるかも
アニメと一口に言っても輪郭の特徴がそんなに多くの作品に共通してるかは疑問だけど
134名無しさん@お腹いっぱい。 (ワッチョイ c37c-oJ6o)
2016/06/16(木) 02:12:13.44ID:8MOB+ifY0 やっと帰宅できた・・
すみません、気力が持たないので昼以降に改めてコメントします。
限界
すみません、気力が持たないので昼以降に改めてコメントします。
限界
135名無しさん@お腹いっぱい。 (ワッチョイ 76e2-ege2)
2016/06/16(木) 04:06:54.85ID:10TNdGfw0 体壊さない程度にがんばってくれ
136名無しさん@お腹いっぱい。 (アウアウT Sa3e-4fuR)
2016/06/16(木) 17:17:40.41ID:dOR2VLG8a 今日初めて写真の拡大に利用させてもらいましたが凄い技術ですね。
応援しています!頑張ってください!
応援しています!頑張ってください!
137名無しさん@お腹いっぱい。 (アウアウ Sad9-1v19)
2016/06/16(木) 18:24:55.57ID:ipCAAVq1a >>129
昨日疲れすぎてコメントできなかった圧縮ノイズについてですがコメントしておきます。
まず下記サイトを参照ください。
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/jpeg.html
このサイトの一番下部の画像を見るとわかりやすいかと思いますが、建物の輪郭周りに本来であれば存在しない種々のノイズがまとわりついているのがお分かりいただけると思いますが、
こういったノイズが輪郭周りに細かくまとわりついている画像をwaifu2xにて拡大すると、輪郭などが溶けやすくなっています。
NNEID3によってあらかじめこのような輪郭にまとわりつきやすいノイズを滑らかにしておくと、waifu2xにて拡大時に溶けにくくなっているのは先日実証した通りです。
このため、もしこのようなノイズ専用の対策フィルターを作るのであれば、JPEGなどの非可逆圧縮をしていない画像を複数用意し、その画像をJPEGにて高圧縮し、わざと輪郭などにノイズが出ている画像(画像サイズは等倍でよい)を作成し、
圧縮前と圧縮後の画像をディープラーニングによって学習させれば、圧縮ノイズ対策にはなるでしょうけれど、それは結局現行のノイズ除去と考えとしてはそう大差ないかなとも思います。
とするならば、やはり前回にお伝えした通り、今よりもっとノイズ除去強度の弱いフィルターをまずは用意すること、そしてその先の展開としては、その弱いフィルターを輪郭と認識される部分のみに適用できるようなオプションを用意できればなお良いかと思います。
(オプションを有効にすると輪郭のみに適用、無効にすると画像全体に適用、ノイズ除去強度は、「最弱(中の1/3か1/4程度の強度)、弱(中の1/2程度の強度)、中、強、最強」の5段階あたり?)
輪郭の認識手法については、AviUtlなどのフィルターである「エッジレベル調整MT」の輪郭検出手法あたりでよいのかなと思います。
昨日疲れすぎてコメントできなかった圧縮ノイズについてですがコメントしておきます。
まず下記サイトを参照ください。
http://www.asahi-net.or.jp/~ax2s-kmtn/ref/jpeg.html
このサイトの一番下部の画像を見るとわかりやすいかと思いますが、建物の輪郭周りに本来であれば存在しない種々のノイズがまとわりついているのがお分かりいただけると思いますが、
こういったノイズが輪郭周りに細かくまとわりついている画像をwaifu2xにて拡大すると、輪郭などが溶けやすくなっています。
NNEID3によってあらかじめこのような輪郭にまとわりつきやすいノイズを滑らかにしておくと、waifu2xにて拡大時に溶けにくくなっているのは先日実証した通りです。
このため、もしこのようなノイズ専用の対策フィルターを作るのであれば、JPEGなどの非可逆圧縮をしていない画像を複数用意し、その画像をJPEGにて高圧縮し、わざと輪郭などにノイズが出ている画像(画像サイズは等倍でよい)を作成し、
圧縮前と圧縮後の画像をディープラーニングによって学習させれば、圧縮ノイズ対策にはなるでしょうけれど、それは結局現行のノイズ除去と考えとしてはそう大差ないかなとも思います。
とするならば、やはり前回にお伝えした通り、今よりもっとノイズ除去強度の弱いフィルターをまずは用意すること、そしてその先の展開としては、その弱いフィルターを輪郭と認識される部分のみに適用できるようなオプションを用意できればなお良いかと思います。
(オプションを有効にすると輪郭のみに適用、無効にすると画像全体に適用、ノイズ除去強度は、「最弱(中の1/3か1/4程度の強度)、弱(中の1/2程度の強度)、中、強、最強」の5段階あたり?)
輪郭の認識手法については、AviUtlなどのフィルターである「エッジレベル調整MT」の輪郭検出手法あたりでよいのかなと思います。
138名無しさん@お腹いっぱい。 (アウアウ Sad9-1v19)
2016/06/16(木) 18:25:35.35ID:ipCAAVq1a 続き
エッジレベル調整MTの参考
http://aviutl.info/sharp/
http://aviutl.info/wp-content/uploads/20160220-020557-553.jpg
あるいは別の考え方としてですが、NNEDI3の輪郭に作用する部分だけをインスパイアした輪郭ノイズ除去フィルターを作れるならば作ってほしいという考え方もありますが・・・
参考
https://github.com/MaverickTse/AviUtlInstaller/blob/master/deinterlace_plugin/nnedi3/jp/nnedi3.txt
(それが可能であるならば、AviUtlを通さずに済むため、RGB→YUV→RGBの変換ロスを気にしなくて済むのと、16bit画像なども直接扱えるようになるので大変ありがたいのですが)
昨日お話ししていた圧縮画像の暗部の階調情報の大幅な簡略化をわかりやすく示す画像が探した範囲でなかったのですが、これは大面積部については通常のwaifu2xのノイズ除去でも対応できる範疇かと思いますので、ひとまず置いておきましょう。
ちなみに上記の件より、今のところ動画用に別途のノイズ対策(一つの画像に小さな窓を設定してスライドなど含む)は今のところしなくても大丈夫かと思います。
(動画の圧縮率の高い状況で輪郭周りに一番除去しにくいノイズがあるのはH.264で圧縮した画像ではありますが)
エッジレベル調整MTの参考
http://aviutl.info/sharp/
http://aviutl.info/wp-content/uploads/20160220-020557-553.jpg
あるいは別の考え方としてですが、NNEDI3の輪郭に作用する部分だけをインスパイアした輪郭ノイズ除去フィルターを作れるならば作ってほしいという考え方もありますが・・・
参考
https://github.com/MaverickTse/AviUtlInstaller/blob/master/deinterlace_plugin/nnedi3/jp/nnedi3.txt
(それが可能であるならば、AviUtlを通さずに済むため、RGB→YUV→RGBの変換ロスを気にしなくて済むのと、16bit画像なども直接扱えるようになるので大変ありがたいのですが)
昨日お話ししていた圧縮画像の暗部の階調情報の大幅な簡略化をわかりやすく示す画像が探した範囲でなかったのですが、これは大面積部については通常のwaifu2xのノイズ除去でも対応できる範疇かと思いますので、ひとまず置いておきましょう。
ちなみに上記の件より、今のところ動画用に別途のノイズ対策(一つの画像に小さな窓を設定してスライドなど含む)は今のところしなくても大丈夫かと思います。
(動画の圧縮率の高い状況で輪郭周りに一番除去しにくいノイズがあるのはH.264で圧縮した画像ではありますが)
139名無しさん@お腹いっぱい。 (アウアウ Sad9-1v19)
2016/06/16(木) 18:44:15.78ID:DV2OC3cTa 上記のことを書いてから気づいたのですが、ひょっとすると拡大前にGIMPの「選択的ガウスぼかし」を超絶的に最弱で適用してから拡大すればいけるかも・・・
140名無しさん@お腹いっぱい。 (アウアウ Sad9-1v19)
2016/06/16(木) 19:52:56.77ID:DV2OC3cTa 「選択的ガウスぼかし」でいけたかもしんまい・・・
試しにアップしてみた
http://www1.axfc.net/u/3680573
いや、この延長で行くならばバイラテラルフィルターを極微量適用のほうがよりダメージは少ないかも?
試しにアップしてみた
http://www1.axfc.net/u/3680573
いや、この延長で行くならばバイラテラルフィルターを極微量適用のほうがよりダメージは少ないかも?
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 高市内閣の支持率72%、高い水準維持…読売世論調査 [どどん★]
- 【発信国情報】X、プロフィール上に「VPN使用の有無」も表示か… [BFU★]
- 【外交】オーストラリア市民党全国委員長「高市首相の発言は極めて破壊的」 [1ゲットロボ★]
- 高市首相の台湾有事答弁「問題ない」50% 「問題があったと思う」25%を大きく上回る 毎日新聞世論調査 ★3 [尺アジ★]
- 香港、日本側と交流停止 首相発言受け中国に追従 [蚤の市★]
- 【芸能】「普通のホテルが12万て…どうなってんの」 嵐のラストツアー、幕開けの札幌で早くもホテル高騰 ファンから相次ぐ悲鳴★2 [冬月記者★]
- 【日本一決定戦】大阪府民ちょっと来いkskすっぞ【ミャクミャク様が大屋根リングでお休みやでええ】
- 政府高官「かなりのスピードで各国と関係を強化している。高市総理ならではだ」と言い始める [256556981]
- 眼鏡ってずり落ちて来るのがクソだよな
- 「ドリームキャスト 最高傑作」 👈これwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww [316257979]
- 【日本一決定戦】愛知県民ちょっと来やぁ!kskしてって【三河も来い】
- 【📛専】とうふさんすこすこ😊👎スレッド【とうふゲームズ🏡】
