【超解像】画像拡大ソフト総合スレ2【waifu2x】 [無断転載禁止]©2ch.net

2016/05/10(火) 11:28:05.20

画像を人工知能(Neural Network)を利用して拡大、あるいはノイズ除去するソフトウェアの話題を総合的に扱うスレです。
本来の用途は静止画が対象ですが動画のアプコン処理に関する話題もOKです。
ただし動画編集ソフトの使い方の部分の話は各ソフトのスレに行って下さい。

--主なソフト--
・waifu2x
本家Webサービス
http://waifu2x.udp.jp/

・waifu2x概要：二次元画像を拡大したいと思ったことはありませんか？ (waifu2x作者氏のブログ)
http://ultraist.hatenablog.com/entry/2015/05/17/183436

・waifu2xとその派生ソフト一覧
※リンクがNGワードに！

・waifu2xのベンチマーク結果まとめ - Togetter
http://togetter.com/li/831437

・無料で二次元画像を人工知能が補完してハイクオリティで1.6倍/2倍に拡大できる「waifu2x」 (gigazinの記事)
http://gigazine.net/news/20150519-waifu2x/

・Otaku ワールドへようこそ！［212］嫁を拡大する人工知能／GrowHair (日刊デジタルクリエイターズの記事)
※従来の拡大手法とwaifu2x、SRCNNの違いについての丁寧な解説記事
http://blog.dgcr.com/mt/dgcr/archives/20150605140100.html

・NeuronDoubler
人工知能超解像プログラム NeuronDoubler
http://loggialogic.blogspot.jp/2012/06/neurondoubler.html

VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured

2016/12/12(月) 07:57:55.52

>>492
その先生にせもんじゃね？

2016/12/12(月) 09:36:41.73

>>492
ノートン先生は落としたファイルの利用者が少ないとなんでもかんでも有害認定する池沼だぞ

2016/12/12(月) 11:05:25.67

ノートン先生は引退して画商になった。今のノートン先生はレプタリアンが化けてる。

2016/12/12(月) 15:32:46.27

うちのノートン先生は利用者が少ないファイルでウイルスの疑いがないならそういう風に注意だけ出してくれるけど違う先生なの？

2016/12/12(月) 18:03:31.51

madvrのNGUのベンチが思った以上に凄いから動画に関してはそっちで充分かな
waifu2xだと溶けるのがやっぱり残念なのと、動画のパンでは、境界線でジャギーみたいなのが発生するのも凄く気になる
あと結局は、エンコに凄く時間がかかるのがネックだなぁ
静止画でのベンチは素晴らしいんだけどね

2016/12/12(月) 22:48:32.93

NGUがどう進化するか次第だと思う。
waifu2xのいいところと、NGUのいいところが、うまくミックスできると最強なんだろうけど。

2016/12/13(火) 12:11:33.58

光と闇が合わさって最強に見える

2016/12/13(火) 13:09:33.02

500 Internal Server Error

2016/12/13(火) 17:56:43.54

madVRスレでも言われていたけどNGUはジャギーが稀に出る事があるのでそこが改善されると嬉しい。
ちなみにwaifu2xで拡大すると綺麗に拡大されるのでやはり優秀だなあと思う。

2016/12/17(土) 23:32:04.49

前々から思ってたんだけどノイズ除去の「最高」を精度とか品質が最高だと思ってどんな画像も最高で変換している人がいるような気がする。
例えばこの記事も元のjpgの品質が98くらいあるのに最高で変換している。

フルHDから4Kへ！ Webのちからでプリキュアの壁紙を超高解像度化する｜ギズモード・ジャパン
http://www.gizmodo.jp/2016/12/4k-precure-wall-paper.html

2016/12/18(日) 00:11:40.73

よりアニメ調を強くしたい時に強くする

2016/12/18(日) 01:33:48.95

ノイズ除去強めるとのっぺりしないかなぁ

**502** (ﾜｯﾁｮｲ dc39-sOSw) · 2016/12/18(日) 02:02:20.19

>>504
実際のっぺりするね
http://i.imgur.com/G6m1ltP.png

2016/12/18(日) 02:57:40.65

>>488
この作者普通にできる人だったのか

**488** (ﾜｯﾁｮｲW 8289-SvdB) · 2016/12/18(日) 11:56:30.17

>>505
必要ないならあえて強く掛けない方がいい気がするよな…上の画像なんて元からJPEG品質高いっぽいし

>>506
これなぁ
俺の環境では動画と音声の長さが合わなくて、音ズレしまくったんだよな
更新も止まってるっぽいし…

2016/12/18(日) 12:18:17.73

音は後から直すのが良いんじゃね。

2016/12/18(日) 15:45:47.64

動画は可変フレームレートとか色々あるから音ズレしやすいんだよねえ……
一部のWMVも可変フレームレートだから普通にFFmpegで変換すると音ズレする。

>>507
コメント欄に「このソフトで変換すると音声がずれる動画がyoutubeなどにあったらurlを教えてください。」って書いてあるからサンプル提供するかMediainfoで調べた情報送ればいいんじゃないかな。

2016/12/19(月) 00:02:19.88

普通にw2xcでエンコするのじゃ駄目なの？

2016/12/19(月) 12:40:53.53

caffeの最新と同等の動画用があるといいんだけどな

2016/12/19(月) 19:11:26.22

まあそれが理想だなぁ
w2xcも更新が止まっちゃったし

2016/12/19(月) 19:46:10.94

>>488のやつは内部にwaifu2x-caffe使ってる
導入も簡単だし、音ズレ対策やその他諸々の機能追加されたら使い勝手良くなるから頑張って欲しい

2016/12/19(月) 20:12:37.28

モデルを入れ替えたらええのか

2016/12/20(火) 11:37:38.14

caffe使ったvapoursynthのプラグインがあるだろ

2016/12/20(火) 18:15:15.96

導入することさえ出来ればVapourSynth-Waifu2x-caffeが品質も処理速度も最高だと思うけど導入難易度高いね。

2016/12/22(木) 17:08:38.15

初心者新参なんだが、どれがおすすめ？

Windows10 Pro 32bit Core i5
メモリ4G

2016/12/22(木) 19:56:30.72

>>517
32bitのWindowsだとtanakamura氏のwaifu2x-converter-cppかな。
64bitのWindowsなら今でも更新が続いているwaifu2x-caffeがいいんだけどね。
今だとcaffe版にしか付いてない機能も多いし

2016/12/23(金) 09:29:37.03

>>518
ありがとうございます！
トライしてみます！！

2016/12/23(金) 13:04:02.41

NeuralStyler 2.0
http://neuralstyler.com/index.html

2016/12/23(金) 19:29:05.72

Sharper Scaling
http://a-sharper-scaling.com/

Bicubic interpolation
http://a-sharper-scaling.com/2b.jpg

Photoshop Preserve Details
http://a-sharper-scaling.com/2pd.jpg

A Sharper Scaling
http://a-sharper-scaling.com/2ass.jpg 👀
Rock54: Caution(BBR-MD5:0be15ced7fbdb9fdb4d0ce1929c1b82f)

2016/12/23(金) 20:14:40.66

今使ってるグラボがGTX670なんだけど、1060や1050にしたら処理早くなりますかね？
80枚のイラストを3.0倍、ノイズ除去1　jpgでやると20分位掛かっちゃうんです

2016/12/23(金) 20:29:03.16

>>522
http://akiba-pc.watch.impress.co.jp/img/ah/docs/747/222/html/mdosv1604_b51.jpg.html
多分早くなる

2016/12/23(金) 20:38:32.67

>>522
早くなると思います。
gtx1060＠6gbならばvramを最大限活用すれば間違いなく体感できる差を得られるでしょう。

2016/12/23(金) 20:40:47.34

ごめんグラボよく分からないから523は無しでｗ

2016/12/23(金) 20:52:17.48

>>524
ありがとうございます

2016/12/23(金) 21:04:41.82

>>526
ttaの有無、分割サイズ、変換する画像の大まかなサイズなど詳しく教えていただければ自分のpcで走らせてみますがどうでしょう？
多少なりとも参考になると思います。

2016/12/23(金) 23:22:19.50

AMDから今度出るGPUが深層学習向けらしいけど
このソフトでも早くなるのかな

**488** (ﾜｯﾁｮｲW 1289-W3gD) · 2016/12/23(金) 23:46:46.15

>>509
さっき覗いたら更新来てた
音ズレ検証してみたけど解消してるわ
これはいいで

2016/12/24(土) 15:31:26.95

処理速度をベンチマークするbat書いたよ
動くかどうか分からないけど奇特な人はチャレンジしてみて。

https://www.dropbox.com/s/5p9lnl62qnlk69v/waifu2x_benchmark_v1.zip?dl=0

2016/12/28(水) 17:41:29.27

オンボのノートPCじゃこのソフト使えないんでしょうか？
1280×800の画像１枚を２倍にしたいだけなんですが実行ボタン押しても残り時間：不明って出てフリーズします。
ウェブ版は普通に使えます

2016/12/28(水) 17:49:55.63

waifu2x-caffeなら時間かかるが動くんじゃね

2016/12/28(水) 17:51:02.58

とにかくColorProfile対応してくれることを望みます
ちょっとライトエフェクトとかある差分画像とか全体が全く違う色になって困り果ててしまうわ
これで動画のエンコなんてしたらもう…

2016/12/28(水) 18:09:49.29

>>532
ありがとうございます。ソフト名を書くのを忘れていました。
そのwaifu2x-caffeでフリーズしてしまうのです。

2016/12/28(水) 18:13:18.56

>>534
じゃあ明日まで待つ

2016/12/28(水) 18:14:43.22

>>534
残り時間不明のまま一見なにも起きない（裏でちゃんとうごいてる）
のは仕様だと思いますが。CPU使用率を見てれば動いてるかどうか
分かるよ

2016/12/28(水) 18:39:45.55

>>533
大人しくmadvrのNGU使え

2016/12/28(水) 18:40:08.51

初期設定だとCUDAで変換するようになってるけど環境がCUDAに対応しているかチェックする時に躓いているのかな
動作設定で使用プロセッサーをCPUにすれば動くと思うけど

2016/12/28(水) 19:59:06.13

>>538
動作設定はCPUにしております。CPU使用率は80%以上でございます。Braswellでは非力すぎて動かないのかな

2016/12/28(水) 20:51:23.97

>>539
時間がかかるだけで変換出来ないって事はないと思うんだけどね
あと気をつけないといけないと思うのは分割サイズを大きくしすぎるとメモリを食ってOSごとフリーズする事くらいかな

2016/12/28(水) 23:07:48.09

なんだ、終わるまで待てない人だったかｗ

2016/12/28(水) 23:12:10.69

進捗バーが動くものだと思ってるんだろうな

2016/12/28(水) 23:49:47.12

あの進捗、ファイル数なんだよなぁ(´･ω･`) 大漁のファイル掘り込めばバー動くけど
オンボろノートで1280×800を2倍拡大だと数分掛かるんじゃね？

2016/12/28(水) 23:53:04.70

重たい処理したいときはこのあたりのソフト使うと良いよ

【優先度】CPU最適化スレ　3CPU【自動変更】
http://potato.2ch.net/test/read.cgi/software/1327059116/

**531** (ﾜｯﾁｮｲW b2e1-EzRd) · 2016/12/30(金) 14:31:11.67

辛抱強く待ってたら一応完了したのですが出力先を見たら何もできていませんでした‥.

モデルのUpPhotoとphotoの違いは何でしょうか？

2016/12/30(金) 14:40:02.55

出力先指定してあるの？違う所見てない？それか上書になってない？

無印は標準モデル
Up印は速度優先モデル(と言っても倍程度。出来上がりに大差はないけど物によっては気になるかもしれない)

2016/12/30(金) 17:02:37.88

1060が届いたので試してみました
･･････････あまり変わっていない？
分割サイズを128から240にしたけど、う～ん

後cuDNNってなんぞ？

2016/12/30(金) 18:12:22.39

cuDNNはNVIDIAが別で配布しているライブラリ
ディープラーニング用のAPIが入ってる

waifu2xはほとんどの処理時間は
コンボリューションで、cuDNNに
含まれるAPIなので恐らく速くなるはず

caffeeの自前実装のコンボリューションが
鬼のように最適化されてたら変わらんかも
しれんが比較したことないので知らん

2016/12/30(金) 18:20:53.02

>>548
ここに各種条件でのベンチマーク結果が書いてあるよ
https://github.com/lltcggie/waifu2x-caffe

2016/12/30(金) 18:21:04.13

cuDNN RGBモデル

| 分割サイズ | 処理時間 | VRAM使用量(MB) |
|:-----------|:-------------|:-------------------|
| 100 | 00:00:03.170 | 278 |
| 125 | 00:00:02.745 | 279 |
| 200 | 00:00:02.253 | 365 |
| 250 | 00:00:02.147 | 446 |
| 500 | 00:00:01.982 | 1110 |

CUDA RGBモデル

| 分割サイズ | 処理時間 | VRAM使用量(MB) |
|:-----------|:-------------|:-------------------|
| 100 | 00:00:06.192 | 724 |
| 125 | 00:00:05.504 | 724 |
| 200 | 00:00:04.642 | 1556 |
| 250 | 00:00:04.436 | 2345 |
| 500 | 計測不能 | 計測不能(6144以上) |

2016/12/30(金) 18:34:48.69

>>548
英文書いて登録とか俺には無理だわ
単にチェック入れるだけならな

2016/12/30(金) 18:46:40.90

CUDAとcuDNN、処理時間倍違うのかよ。
さらにup系で倍、ファファファノファー

2016/12/31(土) 00:37:50.29

Upは速度優先ではなくて速度精度ともに無印より上だよ

**名無しさん＠お腹いっぱい。** (JP 0Hde-Sa8B) · 2016/12/31(土) 00:39:48.58

Up使うとほとんど無印よりきたねー結果になるんだがなんでた？

2016/12/31(土) 00:50:31.70

>>554
アーティファクトが出やすい問題がある>>41 >>274
最新の二次元モデルでは出にくくなってはいるけど

2016/12/31(土) 00:55:45.82

あ、あとcaffeでノイズ除去のみする場合はRGBのほうがいい

2016/12/31(土) 08:15:58.58

>>553
ほんとにそうなら無印いらなくない？
>>555の問題があるからだから残ってるんでしょ？
だからそういうのは精度上とは言わないもんじゃない？

2016/12/31(土) 08:28:57.23

cuDNNだけどっかに落ちてねーの？

2016/12/31(土) 08:40:38.66

>>557
数百枚に対するベンチマーク(PSNR)では数値的に上

2016/12/31(土) 22:34:22.56

cuDNN64.5.dll見っけた
探せばあるもんだなぁ
早速導入
おほっ滅茶早ｗｗ

2016/12/31(土) 23:03:42.96

分轄サイズを384にすると5GB以上使って4～5分だったものが1分掛からずに終了
メモリ使用量は1GB程度に減ってた
cuDNN凄いな

2016/12/31(土) 23:51:10.10

うｐしようとしてたけどやめて良かった

2017/01/01(日) 06:27:46.76

nvidiaに登録すればDLできるし、探すほどのものでもないべ

2017/01/01(日) 08:15:07.66

この凄さは良い1060のおかげもメモリ量もあって半分くらいはあるのかな？
あってくれ、でないと￥27,000が泣く

2017/01/01(日) 11:52:36.53

ウィルス付だったり変な改変受けてたりするのも有るし
そんなに難しくないから適当に登録した方が安心

2017/01/04(水) 13:37:33.40

Kaby Lake-S「Core i7-7700K」基礎検証レポート。注目すべきは絶対性能ではなく，電力対性能比だ - 4Gamer.net
http://www.4gamer.net/games/344/G034458/20170102001/

waifu2xでベンチマークしてて笑う

2017/01/04(水) 19:59:44.27

>>566
ディープラーニングの推定工程ベンチマークとして便利かもしれないな

2017/01/04(水) 20:11:49.14

笑うとか意味不でｷﾑﾁﾜﾙ

2017/01/04(水) 22:02:39.62

というかしょっぱすぎる性能だな
Ryzen頑張ってくれよ本当に…

2017/01/07(土) 23:25:48.14

中の人Pixivだったのか納得した

2017/01/08(日) 19:04:40.17

waifu2xのことなら、中の人の定義によるけど
開発している人（俺）はpixivではないよ
サーバーはpixivの方が運営しているけど

2017/01/14(土) 04:19:51.80

このスレを見ている人間にとっては大嫌いなレガシー不可逆画像コーデックJPEGに新たなエンコーダが
ttp://gigazine.net/news/20170113-google-guetzli/
人間の目に最適化した極低速高圧縮JPEGエンコーダGuetzli

SSIM：　　　　　　　　　　　　　libjpeg比 14％悪化
PSNRHVS-M：　　　　　　　　libjpeg比 14％悪化
butteraugli：　　　　　　　　　libjpeg比 30％良化
エンコード速度：　　　　　　　libjpeg比 10000％+悪化
同等画質サイズ：　　　　　　　libjpeg比 35％良化
同等画質転送レート：　　　　libjpeg比 35％良化
ttps://translate.google.co.jp/translate?sl=en&tl=ja&u=http%3A%2F%2Fencode.ru%2Fthreads%2F2628
ttp://encode.ru/threads/2628

長すぎるエンコード時間（消費エネルギー）という元手・投資を取り返すには何回その画像ダウンロードされないといけないんだろうな
性能はたしかに良いからお試しあれ

2017/01/14(土) 10:43:46.82

よくわからんが、電算機関連の話では
性能って普通は速度(時間)のことを言うんじゃないのか

2017/01/14(土) 11:55:01.52

GuetzliよりGuetzliの性能を評価したbutteraugliってやつのほうが気になる。
SSIMやPSNRより人間の主観に近い画質指標なのかな。

2017/01/14(土) 12:31:07.66

butteraugliでwaifu2xと他の拡大アルゴリズムの比較されたら、どんな結果が出るのだろうな

2017/01/14(土) 13:15:34.86

リファレンスのpngをq89ぐらいにすると、
似たサイズになるんだけど、確かに通常より綺麗だな。
waifuで拡大したほうが超綺麗になったけど、そういう問題じゃないからね。

2017/01/14(土) 16:10:52.71

>>575
自分もそう思ったんだけどbutteraugliのビルド方法がよく分からなくて断念したよ。
Googleがバイナリを配布してくれればいいんだけどね。

というかほぼGoogleしか使ってない指標でGoogleのエンコーダを評価されても性能が良く分からないよなと思う。

2017/01/14(土) 18:56:54.13

>>577
https://github.com/google/guetzli/releases

2017/01/15(日) 09:56:09.63

waifu2xの後追いして遊んでるんだけど
作者氏、GAN使うの嫌がってるんだよね

とりあえずGAN、ResNet、PixelSuffle
実装してみたけど見た目SRCNN臭さは
だいぶとれるけどたくさん評価
してないので微妙

俺の本丸は計算量削減なんだけど
理論上計算量3割のはずなのに
3割しか早くならない

chainer、推論遅くないか

2017/01/15(日) 12:05:43.60

サンプル画像すら出さないで何を言わんや…

2017/01/15(日) 12:31:47.79

評価中なので待ってください
一回回すのに10時間かかるので
何日かかかります

2017/01/15(日) 13:36:32.29

スクール水着の凹凸を判断してテカテカのラバーコーティングの水着にできる？

2017/01/15(日) 13:52:26.00

いいなそれ

2017/01/15(日) 15:35:17.21

>>579
GANはPSNRをあまり下げずに使えるならいいですが
(ロス関数の重みの調節で出来ると思いますがトレードオフがあるのでGAN使う意味がなくなってきそう)
PSNRがBicubic以下になると
変換結果に不安があるため現在BicubcやLanczosが使われる領域での置き換えには使えないと思って避けています。
もちろんいくつかモデル作って選択できるようにすればいいだけですが
面倒なのでやっていない状態です。ResNetはdevブランチには入ってます。

2017/01/15(日) 15:46:09.89

＞584
GANについては混合比率下げると
全くなしと見分けがつかないので
PSNRは必ず犠牲になる印象です

3dB近く悪くなるので受容できないで
しょうね

GANは学習すごく遅くなるので
つらいです

GANは学習回数多くしないとだめ
なのでもしかしたら今足りてない
可能性があるので後でしつこく
やってみます

作者さんも自分で実験するのが
めんどいと思うので結果はアップして
共有します

2017/01/15(日) 15:59:53.33

butteraugli というので本当に見た目の印象が定量評価できるならそれもあり思いますね。
僕が見た目の評価嫌う理由は、たいして見る目がない人がリンギングでまってくる画像を
くっきりしているからよいとか判定してしまうところにあるので。

2017/01/15(日) 18:17:37.15

butteraugjiはためしてみたけど
値が小さい方がいいっぽいね

画像ができたら数字比較してみるわ

2017/01/15(日) 19:31:48.53

butteraugliでエポックごとの
評価みたけど学習打ち切った時点で
まだあがってた

評価がサチるまで回しますが、
たぶんすごい時間かかります

二乗誤差じゃわからん

2017/01/15(日) 20:38:29.02

SRGANはやろうとした人を何人も見ましたが
みんなうまくいっていないので
写真のモデルでcheckboard artifactを出さずに
論文の結果と似たような画像を生成できればそれだけで価値があると思いますよ

2017/01/15(日) 21:26:01.39

SRGANはチャレンジですね。がんばってみます。
うまくいったら挑戦します。

butteraugli初耳だったんですが、スレ観たらビルドの仕方が
わからない人がいる模様。Linuxの開発したことのある人少ないんですかね。

Windows10のコマンドプロンプト開いて以下のコマンドで実行、

$ bash

コンパイラとライブラリインストール(zlibはpngと一緒に入る)、

$ sudo apt-get install gcc g++ make libjpeg-dev libpng-de

ソースコードのMakefileのあるディレクトリで

$ make

で実行ファイル作られます。bash上か他のLinuxマシンのみで動きます。

プログラマじゃない人も色々遊んでみてください。

2017/01/15(日) 21:27:08.93

$ sudo apt-get install gcc g++ make libjpeg-dev libpng-dev

です。すんません。

2017/01/15(日) 21:29:00.78

waifu2x、再び!!
Stay tune!