【超解像】画像拡大ソフト総合スレ2【waifu2x】 [無断転載禁止]©2ch.net

2016/05/10(火) 11:28:05.20

画像を人工知能(Neural Network)を利用して拡大、あるいはノイズ除去するソフトウェアの話題を総合的に扱うスレです。
本来の用途は静止画が対象ですが動画のアプコン処理に関する話題もOKです。
ただし動画編集ソフトの使い方の部分の話は各ソフトのスレに行って下さい。

--主なソフト--
・waifu2x
本家Webサービス
http://waifu2x.udp.jp/

・waifu2x概要：二次元画像を拡大したいと思ったことはありませんか？ (waifu2x作者氏のブログ)
http://ultraist.hatenablog.com/entry/2015/05/17/183436

・waifu2xとその派生ソフト一覧
※リンクがNGワードに！

・waifu2xのベンチマーク結果まとめ - Togetter
http://togetter.com/li/831437

・無料で二次元画像を人工知能が補完してハイクオリティで1.6倍/2倍に拡大できる「waifu2x」 (gigazinの記事)
http://gigazine.net/news/20150519-waifu2x/

・Otaku ワールドへようこそ！［212］嫁を拡大する人工知能／GrowHair (日刊デジタルクリエイターズの記事)
※従来の拡大手法とwaifu2x、SRCNNの違いについての丁寧な解説記事
http://blog.dgcr.com/mt/dgcr/archives/20150605140100.html

・NeuronDoubler
人工知能超解像プログラム NeuronDoubler
http://loggialogic.blogspot.jp/2012/06/neurondoubler.html

VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured

2016/12/18(日) 12:18:17.73

音は後から直すのが良いんじゃね。

2016/12/18(日) 15:45:47.64

動画は可変フレームレートとか色々あるから音ズレしやすいんだよねえ……
一部のWMVも可変フレームレートだから普通にFFmpegで変換すると音ズレする。

>>507
コメント欄に「このソフトで変換すると音声がずれる動画がyoutubeなどにあったらurlを教えてください。」って書いてあるからサンプル提供するかMediainfoで調べた情報送ればいいんじゃないかな。

2016/12/19(月) 00:02:19.88

普通にw2xcでエンコするのじゃ駄目なの？

2016/12/19(月) 12:40:53.53

caffeの最新と同等の動画用があるといいんだけどな

2016/12/19(月) 19:11:26.22

まあそれが理想だなぁ
w2xcも更新が止まっちゃったし

2016/12/19(月) 19:46:10.94

>>488のやつは内部にwaifu2x-caffe使ってる
導入も簡単だし、音ズレ対策やその他諸々の機能追加されたら使い勝手良くなるから頑張って欲しい

2016/12/19(月) 20:12:37.28

モデルを入れ替えたらええのか

2016/12/20(火) 11:37:38.14

caffe使ったvapoursynthのプラグインがあるだろ

2016/12/20(火) 18:15:15.96

導入することさえ出来ればVapourSynth-Waifu2x-caffeが品質も処理速度も最高だと思うけど導入難易度高いね。

2016/12/22(木) 17:08:38.15

初心者新参なんだが、どれがおすすめ？

Windows10 Pro 32bit Core i5
メモリ4G

2016/12/22(木) 19:56:30.72

>>517
32bitのWindowsだとtanakamura氏のwaifu2x-converter-cppかな。
64bitのWindowsなら今でも更新が続いているwaifu2x-caffeがいいんだけどね。
今だとcaffe版にしか付いてない機能も多いし

2016/12/23(金) 09:29:37.03

>>518
ありがとうございます！
トライしてみます！！

2016/12/23(金) 13:04:02.41

NeuralStyler 2.0
http://neuralstyler.com/index.html

2016/12/23(金) 19:29:05.72

Sharper Scaling
http://a-sharper-scaling.com/

Bicubic interpolation
http://a-sharper-scaling.com/2b.jpg

Photoshop Preserve Details
http://a-sharper-scaling.com/2pd.jpg

A Sharper Scaling
http://a-sharper-scaling.com/2ass.jpg 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)

2016/12/23(金) 20:14:40.66

今使ってるグラボがGTX670なんだけど、1060や1050にしたら処理早くなりますかね？
80枚のイラストを3.0倍、ノイズ除去1　jpgでやると20分位掛かっちゃうんです

2016/12/23(金) 20:29:03.16

>>522
http://akiba-pc.watch.impress.co.jp/img/ah/docs/747/222/html/mdosv1604_b51.jpg.html
多分早くなる

2016/12/23(金) 20:38:32.67

>>522
早くなると思います。
gtx1060＠6gbならばvramを最大限活用すれば間違いなく体感できる差を得られるでしょう。

2016/12/23(金) 20:40:47.34

ごめんグラボよく分からないから523は無しでｗ

2016/12/23(金) 20:52:17.48

>>524
ありがとうございます

2016/12/23(金) 21:04:41.82

>>526
ttaの有無、分割サイズ、変換する画像の大まかなサイズなど詳しく教えていただければ自分のpcで走らせてみますがどうでしょう？
多少なりとも参考になると思います。

2016/12/23(金) 23:22:19.50

AMDから今度出るGPUが深層学習向けらしいけど
このソフトでも早くなるのかな

**488** (ﾜｯﾁｮｲW 1289-W3gD) · 2016/12/23(金) 23:46:46.15

>>509
さっき覗いたら更新来てた
音ズレ検証してみたけど解消してるわ
これはいいで

2016/12/24(土) 15:31:26.95

処理速度をベンチマークするbat書いたよ
動くかどうか分からないけど奇特な人はチャレンジしてみて。

https://www.dropbox.com/s/5p9lnl62qnlk69v/waifu2x_benchmark_v1.zip?dl=0

2016/12/28(水) 17:41:29.27

オンボのノートPCじゃこのソフト使えないんでしょうか？
1280×800の画像１枚を２倍にしたいだけなんですが実行ボタン押しても残り時間：不明って出てフリーズします。
ウェブ版は普通に使えます

2016/12/28(水) 17:49:55.63

waifu2x-caffeなら時間かかるが動くんじゃね

2016/12/28(水) 17:51:02.58

とにかくColorProfile対応してくれることを望みます
ちょっとライトエフェクトとかある差分画像とか全体が全く違う色になって困り果ててしまうわ
これで動画のエンコなんてしたらもう…

2016/12/28(水) 18:09:49.29

>>532
ありがとうございます。ソフト名を書くのを忘れていました。
そのwaifu2x-caffeでフリーズしてしまうのです。

2016/12/28(水) 18:13:18.56

>>534
じゃあ明日まで待つ

2016/12/28(水) 18:14:43.22

>>534
残り時間不明のまま一見なにも起きない（裏でちゃんとうごいてる）
のは仕様だと思いますが。CPU使用率を見てれば動いてるかどうか
分かるよ

2016/12/28(水) 18:39:45.55

>>533
大人しくmadvrのNGU使え

2016/12/28(水) 18:40:08.51

初期設定だとCUDAで変換するようになってるけど環境がCUDAに対応しているかチェックする時に躓いているのかな
動作設定で使用プロセッサーをCPUにすれば動くと思うけど

2016/12/28(水) 19:59:06.13

>>538
動作設定はCPUにしております。CPU使用率は80%以上でございます。Braswellでは非力すぎて動かないのかな

2016/12/28(水) 20:51:23.97

>>539
時間がかかるだけで変換出来ないって事はないと思うんだけどね
あと気をつけないといけないと思うのは分割サイズを大きくしすぎるとメモリを食ってOSごとフリーズする事くらいかな

2016/12/28(水) 23:07:48.09

なんだ、終わるまで待てない人だったかｗ

2016/12/28(水) 23:12:10.69

進捗バーが動くものだと思ってるんだろうな

2016/12/28(水) 23:49:47.12

あの進捗、ファイル数なんだよなぁ(´･ω･`) 大漁のファイル掘り込めばバー動くけど
オンボろノートで1280×800を2倍拡大だと数分掛かるんじゃね？

2016/12/28(水) 23:53:04.70

重たい処理したいときはこのあたりのソフト使うと良いよ

【優先度】CPU最適化スレ　3CPU【自動変更】
http://potato.2ch.net/test/read.cgi/software/1327059116/

**531** (ﾜｯﾁｮｲW b2e1-EzRd) · 2016/12/30(金) 14:31:11.67

辛抱強く待ってたら一応完了したのですが出力先を見たら何もできていませんでした‥.

モデルのUpPhotoとphotoの違いは何でしょうか？

2016/12/30(金) 14:40:02.55

出力先指定してあるの？違う所見てない？それか上書になってない？

無印は標準モデル
Up印は速度優先モデル(と言っても倍程度。出来上がりに大差はないけど物によっては気になるかもしれない)

2016/12/30(金) 17:02:37.88

1060が届いたので試してみました
･･････････あまり変わっていない？
分割サイズを128から240にしたけど、う～ん

後cuDNNってなんぞ？

2016/12/30(金) 18:12:22.39

cuDNNはNVIDIAが別で配布しているライブラリ
ディープラーニング用のAPIが入ってる

waifu2xはほとんどの処理時間は
コンボリューションで、cuDNNに
含まれるAPIなので恐らく速くなるはず

caffeeの自前実装のコンボリューションが
鬼のように最適化されてたら変わらんかも
しれんが比較したことないので知らん

2016/12/30(金) 18:20:53.02

>>548
ここに各種条件でのベンチマーク結果が書いてあるよ
https://github.com/lltcggie/waifu2x-caffe

2016/12/30(金) 18:21:04.13

cuDNN RGBモデル

| 分割サイズ | 処理時間 | VRAM使用量(MB) |
|:-----------|:-------------|:-------------------|
| 100 | 00:00:03.170 | 278 |
| 125 | 00:00:02.745 | 279 |
| 200 | 00:00:02.253 | 365 |
| 250 | 00:00:02.147 | 446 |
| 500 | 00:00:01.982 | 1110 |

CUDA RGBモデル

| 分割サイズ | 処理時間 | VRAM使用量(MB) |
|:-----------|:-------------|:-------------------|
| 100 | 00:00:06.192 | 724 |
| 125 | 00:00:05.504 | 724 |
| 200 | 00:00:04.642 | 1556 |
| 250 | 00:00:04.436 | 2345 |
| 500 | 計測不能 | 計測不能(6144以上) |

2016/12/30(金) 18:34:48.69

>>548
英文書いて登録とか俺には無理だわ
単にチェック入れるだけならな

2016/12/30(金) 18:46:40.90

CUDAとcuDNN、処理時間倍違うのかよ。
さらにup系で倍、ファファファノファー

2016/12/31(土) 00:37:50.29

Upは速度優先ではなくて速度精度ともに無印より上だよ

**名無しさん＠お腹いっぱい。** (JP 0Hde-Sa8B) · 2016/12/31(土) 00:39:48.58

Up使うとほとんど無印よりきたねー結果になるんだがなんでた？

2016/12/31(土) 00:50:31.70

>>554
アーティファクトが出やすい問題がある>>41 >>274
最新の二次元モデルでは出にくくなってはいるけど

2016/12/31(土) 00:55:45.82

あ、あとcaffeでノイズ除去のみする場合はRGBのほうがいい

2016/12/31(土) 08:15:58.58

>>553
ほんとにそうなら無印いらなくない？
>>555の問題があるからだから残ってるんでしょ？
だからそういうのは精度上とは言わないもんじゃない？

2016/12/31(土) 08:28:57.23

cuDNNだけどっかに落ちてねーの？

2016/12/31(土) 08:40:38.66

>>557
数百枚に対するベンチマーク(PSNR)では数値的に上

2016/12/31(土) 22:34:22.56

cuDNN64.5.dll見っけた
探せばあるもんだなぁ
早速導入
おほっ滅茶早ｗｗ

2016/12/31(土) 23:03:42.96

分轄サイズを384にすると5GB以上使って4～5分だったものが1分掛からずに終了
メモリ使用量は1GB程度に減ってた
cuDNN凄いな

2016/12/31(土) 23:51:10.10

うｐしようとしてたけどやめて良かった

2017/01/01(日) 06:27:46.76

nvidiaに登録すればDLできるし、探すほどのものでもないべ

2017/01/01(日) 08:15:07.66

この凄さは良い1060のおかげもメモリ量もあって半分くらいはあるのかな？
あってくれ、でないと￥27,000が泣く

2017/01/01(日) 11:52:36.53

ウィルス付だったり変な改変受けてたりするのも有るし
そんなに難しくないから適当に登録した方が安心

2017/01/04(水) 13:37:33.40

Kaby Lake-S「Core i7-7700K」基礎検証レポート。注目すべきは絶対性能ではなく，電力対性能比だ - 4Gamer.net
http://www.4gamer.net/games/344/G034458/20170102001/

waifu2xでベンチマークしてて笑う

2017/01/04(水) 19:59:44.27

>>566
ディープラーニングの推定工程ベンチマークとして便利かもしれないな

2017/01/04(水) 20:11:49.14

笑うとか意味不でｷﾑﾁﾜﾙ

2017/01/04(水) 22:02:39.62

というかしょっぱすぎる性能だな
Ryzen頑張ってくれよ本当に…

2017/01/07(土) 23:25:48.14

中の人Pixivだったのか納得した

2017/01/08(日) 19:04:40.17

waifu2xのことなら、中の人の定義によるけど
開発している人（俺）はpixivではないよ
サーバーはpixivの方が運営しているけど

2017/01/14(土) 04:19:51.80

このスレを見ている人間にとっては大嫌いなレガシー不可逆画像コーデックJPEGに新たなエンコーダが
ttp://gigazine.net/news/20170113-google-guetzli/
人間の目に最適化した極低速高圧縮JPEGエンコーダGuetzli

SSIM：　　　　　　　　　　　　　libjpeg比 14％悪化
PSNRHVS-M：　　　　　　　　libjpeg比 14％悪化
butteraugli：　　　　　　　　　libjpeg比 30％良化
エンコード速度：　　　　　　　libjpeg比 10000％+悪化
同等画質サイズ：　　　　　　　libjpeg比 35％良化
同等画質転送レート：　　　　libjpeg比 35％良化
ttps://translate.google.co.jp/translate?sl=en&tl=ja&u=http%3A%2F%2Fencode.ru%2Fthreads%2F2628
ttp://encode.ru/threads/2628

長すぎるエンコード時間（消費エネルギー）という元手・投資を取り返すには何回その画像ダウンロードされないといけないんだろうな
性能はたしかに良いからお試しあれ

2017/01/14(土) 10:43:46.82

よくわからんが、電算機関連の話では
性能って普通は速度(時間)のことを言うんじゃないのか

2017/01/14(土) 11:55:01.52

GuetzliよりGuetzliの性能を評価したbutteraugliってやつのほうが気になる。
SSIMやPSNRより人間の主観に近い画質指標なのかな。

2017/01/14(土) 12:31:07.66

butteraugliでwaifu2xと他の拡大アルゴリズムの比較されたら、どんな結果が出るのだろうな

2017/01/14(土) 13:15:34.86

リファレンスのpngをq89ぐらいにすると、
似たサイズになるんだけど、確かに通常より綺麗だな。
waifuで拡大したほうが超綺麗になったけど、そういう問題じゃないからね。

2017/01/14(土) 16:10:52.71

>>575
自分もそう思ったんだけどbutteraugliのビルド方法がよく分からなくて断念したよ。
Googleがバイナリを配布してくれればいいんだけどね。

というかほぼGoogleしか使ってない指標でGoogleのエンコーダを評価されても性能が良く分からないよなと思う。

2017/01/14(土) 18:56:54.13

>>577
https://github.com/google/guetzli/releases

2017/01/15(日) 09:56:09.63

waifu2xの後追いして遊んでるんだけど
作者氏、GAN使うの嫌がってるんだよね

とりあえずGAN、ResNet、PixelSuffle
実装してみたけど見た目SRCNN臭さは
だいぶとれるけどたくさん評価
してないので微妙

俺の本丸は計算量削減なんだけど
理論上計算量3割のはずなのに
3割しか早くならない

chainer、推論遅くないか

2017/01/15(日) 12:05:43.60

サンプル画像すら出さないで何を言わんや…

2017/01/15(日) 12:31:47.79

評価中なので待ってください
一回回すのに10時間かかるので
何日かかかります

2017/01/15(日) 13:36:32.29

スクール水着の凹凸を判断してテカテカのラバーコーティングの水着にできる？

2017/01/15(日) 13:52:26.00

いいなそれ

2017/01/15(日) 15:35:17.21

>>579
GANはPSNRをあまり下げずに使えるならいいですが
(ロス関数の重みの調節で出来ると思いますがトレードオフがあるのでGAN使う意味がなくなってきそう)
PSNRがBicubic以下になると
変換結果に不安があるため現在BicubcやLanczosが使われる領域での置き換えには使えないと思って避けています。
もちろんいくつかモデル作って選択できるようにすればいいだけですが
面倒なのでやっていない状態です。ResNetはdevブランチには入ってます。

2017/01/15(日) 15:46:09.89

＞584
GANについては混合比率下げると
全くなしと見分けがつかないので
PSNRは必ず犠牲になる印象です

3dB近く悪くなるので受容できないで
しょうね

GANは学習すごく遅くなるので
つらいです

GANは学習回数多くしないとだめ
なのでもしかしたら今足りてない
可能性があるので後でしつこく
やってみます

作者さんも自分で実験するのが
めんどいと思うので結果はアップして
共有します

2017/01/15(日) 15:59:53.33

butteraugli というので本当に見た目の印象が定量評価できるならそれもあり思いますね。
僕が見た目の評価嫌う理由は、たいして見る目がない人がリンギングでまってくる画像を
くっきりしているからよいとか判定してしまうところにあるので。

2017/01/15(日) 18:17:37.15

butteraugjiはためしてみたけど
値が小さい方がいいっぽいね

画像ができたら数字比較してみるわ

2017/01/15(日) 19:31:48.53

butteraugliでエポックごとの
評価みたけど学習打ち切った時点で
まだあがってた

評価がサチるまで回しますが、
たぶんすごい時間かかります

二乗誤差じゃわからん

2017/01/15(日) 20:38:29.02

SRGANはやろうとした人を何人も見ましたが
みんなうまくいっていないので
写真のモデルでcheckboard artifactを出さずに
論文の結果と似たような画像を生成できればそれだけで価値があると思いますよ

2017/01/15(日) 21:26:01.39

SRGANはチャレンジですね。がんばってみます。
うまくいったら挑戦します。

butteraugli初耳だったんですが、スレ観たらビルドの仕方が
わからない人がいる模様。Linuxの開発したことのある人少ないんですかね。

Windows10のコマンドプロンプト開いて以下のコマンドで実行、

$ bash

コンパイラとライブラリインストール(zlibはpngと一緒に入る)、

$ sudo apt-get install gcc g++ make libjpeg-dev libpng-de

ソースコードのMakefileのあるディレクトリで

$ make

で実行ファイル作られます。bash上か他のLinuxマシンのみで動きます。

プログラマじゃない人も色々遊んでみてください。

2017/01/15(日) 21:27:08.93

$ sudo apt-get install gcc g++ make libjpeg-dev libpng-dev

です。すんません。

2017/01/15(日) 21:29:00.78

waifu2x、再び!!
Stay tune!

**577** (ﾜｯﾁｮｲ 1339-5BG0) · 2017/01/15(日) 22:37:39.20

>>590
ありがとうございます。
ビルドできました。

2017/01/18(水) 15:23:24.52

Google、機械学習で低解像度画像をシャープに見せる「RAISR」をサービスで実用化
http://www.itmedia.co.jp/news/articles/1701/17/news067.html

2017/01/18(水) 15:27:07.14

>>594
これyoutube動画でもやってくれないかな。
あと動画上の物体の形や位置を認識してサラウンド感を与えるとか。

2017/01/18(水) 15:39:56.54

やりたいことはYoutubeがすでやっている動画の再エンコと一緒じゃないかな
画質を改善するというより、苦情の少ない範囲で圧縮したいなので
運営としては通信量が減って嬉しいけどユーザーとしては以前よりも画質が悪くなるので
携帯事業者がやっていた「通信の最適化」と同じ考えだと思う

2017/01/18(水) 20:37:05.06

でもそれで同じ容量で解像度が例えば1.5倍になれば話が変わる
色空間やインターレースしかり悪いばかりのトレードオフでは無いと思う

2017/01/23(月) 19:31:01.14

waifu2x-cafeeをXeonとQuadro両方積んだPCで実行するときってどっちのほうが効率的なんだ？
ちなみにXeonは12コア3.30GHz、Quadroは2000。

2017/01/24(火) 00:16:40.73

>>598
Quadroの方が速いんじゃないですかねぇ？

↓の画像でXeon 16Core 3.6GHzで2分40秒ぐらい
CPU使用率は20%ほど XPx64環境で無理矢理実行したからちょっとアテにならないかもしれないけど
http://www.dotup.org/uploda/www.dotup.org1133523.jpg　変換元画像
http://www.dotup.org/uploda/www.dotup.org1133524.png　設定

2017/01/24(火) 08:27:54.07

>>599
ハイエンドなマシンで動かしてらっしゃるようなので
NeuronDoubler v5.00だとどれぐらいかかるか検証して頂いてもいいですか?
http://loggialogic.blogspot.jp/2015/09/neurondoubler-v500.html?m=1

**599** (ﾜｯﾁｮｲW cf63-gIHQ) · 2017/01/24(火) 23:23:52.69

>>600
sampleのlogo.pngを2倍で16s、4倍で66s
sampleのphoto.pngを2倍で44s、4倍で200s
といった感じです

32倍をlogo.pngでやってみたら1876sとかかかったので、photo.pngの方は試してないですｗ

2017/01/25(水) 09:31:13.38

>>601
ありがとうございます
手持ちのMacbook Pro late 2012では
960×540のpng(写真)を変換したところ1600s
ぐらいでした
16コアもあると動画用にNeuronDoublerを使えそうで羨ましいです

2017/01/25(水) 21:02:31.59

waifu2x研究家なんですけど
GANのPSNR問題解消しそうなので
週末画像出します

waifu2xと同じupモデルをこっちで
再現したものとの比較しますが
時間がかかるのでそれ以外との
比較は難しいです

何個かネタがあってそのマイルストーンです

3月に資料作るのでそのとき
リンク張ります

2017/01/26(木) 00:25:26.80

単純にはMSEとGANの出力を適当な割合で合成すればいいように思うけど
重くなるので学習の枠内でやれればいいですね

あとneural-enhanceの人も最近waifu2x的なやつをやろうとしているみたいです
https://twitter.com/madebyollin/status/823652970440986624
これは別の人の結果だけど、たしかに線はくっきりしているけど余計なことをしすぎているように見える

2017/01/26(木) 06:13:14.86

＞604
適当な割合で合成すればいいんですけどふたつ問題があって

1. 適切な混合比率がタスクによって違う
2. 結果が不安定でうまくいってるエポックとそうでないエポックのばらつきが大きい

なので、前者については二乗誤差に対して何%GANを反映するのかって
コントロールを入れています。

GANが余計なことをするのは誤差のGANの項が正解データとの比較を
しないからじゃないかってことで正解データと比較するGANをは
考えてみました。

GANなしに比べてSSIM、PSNRは同等、butteraugliはかなり良くなってます。
正解データと比較する時点でGANの解釈がかなり変わるんですが
(評価中なので正確な値は週末出します)

2017/01/26(木) 06:33:06.18

わかる人がまわりにいないので、ここに書いてあれなんですけど、

従来のGAN)
Discriminatorで本物らしさを判定して誤差に反映

自分の手法)
本物らしさを学習したDiscriminatorの中間層の出力を
本物と生成データで比較、となります。

Discriminatorの中間層は通常の二乗誤差で比較するのと比べて
大幅に大きい情報量で比較するのと、Discriminator自体が
誤差関数になるので普通の二乗誤差と比べると複雑、高度な比較になります。

Twitterが出してる論文は物体認識を学習させたモデルで中間層の出力で
比較しろ、と書いてあって、これがコンテンツロスなんですが、
コンテンツロスの適用部分はGANに対してやった方がいいのでは
というのが自分の意見です。

2017/01/26(木) 08:44:57.33

こういうやつに税金投入するべき