X



【超解像】画像拡大ソフト総合スレ2【waifu2x】 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
0001名無しさん@お腹いっぱい。 転載ダメ©2ch.net (アウアウ Sa2a-NyIq)
垢版 |
2016/05/10(火) 11:28:05.20ID:h2o6wyXCa
画像を人工知能(Neural Network)を利用して拡大、あるいはノイズ除去するソフトウェアの話題を総合的に扱うスレです。
本来の用途は静止画が対象ですが動画のアプコン処理に関する話題もOKです。
ただし動画編集ソフトの使い方の部分の話は各ソフトのスレに行って下さい。

--主なソフト--
・waifu2x
本家Webサービス
http://waifu2x.udp.jp/

・waifu2x概要:二次元画像を拡大したいと思ったことはありませんか? (waifu2x作者氏のブログ)
http://ultraist.hatenablog.com/entry/2015/05/17/183436

・waifu2xとその派生ソフト一覧
※リンクがNGワードに!

・waifu2xのベンチマーク結果まとめ - Togetter
http://togetter.com/li/831437

・無料で二次元画像を人工知能が補完してハイクオリティで1.6倍/2倍に拡大できる「waifu2x」 (gigazinの記事)
http://gigazine.net/news/20150519-waifu2x/

・Otaku ワールドへようこそ![212]嫁を拡大する人工知能/GrowHair (日刊デジタルクリエイターズの記事)
※従来の拡大手法とwaifu2x、SRCNNの違いについての丁寧な解説記事
http://blog.dgcr.com/mt/dgcr/archives/20150605140100.html

・NeuronDoubler
人工知能超解像プログラム NeuronDoubler
http://loggialogic.blogspot.jp/2012/06/neurondoubler.html
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
0234名無しさん@お腹いっぱい。 (ワッチョイ 839d-Bfmi)
垢版 |
2016/07/11(月) 04:03:13.80ID:3xx0SzsG0
>>233
おお、ついにノイズレベル0が!

cui版で -n 0 のように noise_level 0 を指定すると

PARSE ERROR: Argument: -n (--noise_level)
Value '0' does not meet constraint: 1|2|3
(Brief USAGE 略)

って怒られてエラーになっちゃいます
GUI版で変換した noise_level 0 の画像と比較すると、noise_level 無指定の場合には
きちんとデフォルトの noise_level 0 になるようです(UpRGB)

ついでに --help を出しても noise_level に関しては 0 の無い 1.1.5 以前のままです
0235名無しさん@お腹いっぱい。 (ワッチョイ d325-Bfmi)
垢版 |
2016/07/11(月) 13:40:38.41ID:PaECKmpe0
拡大するとアニメ塗りの塗り壁になってしまう
人工知能のわりに頭が悪いな。本当に
人間より優れたシンギラなるんかと疑問点。

3次画像を拡大する専用の
Youjo2seXを早く出せよ、おい!
0243名無しさん@お腹いっぱい。 (ワッチョイ 69d2-ewdN)
垢版 |
2016/07/14(木) 09:38:42.50ID:kfj6dhpi0
スポットインスタンスは月単位で見ると安いのですが
たまに異常に価格が上がることがあるのでそういうことが起こるたびに落ちます.
今は1台あたりの鯖代が1時間$6.5まで価格が上がったので落ちました.
1時間$6.5で3台動かしていると1日放置で5万円くらいかかるので落ちてくれないと困る感じです.
許容範囲のところがあればそこで復活します.
0245名無しさん@お腹いっぱい。 (ワッチョイ 49a9-/weA)
垢版 |
2016/07/14(木) 13:39:09.41ID:FgL37a7K0
たぶん,誰か考えたと思うんですけれども,
例えば,元画像を4倍に拡大したいとして,

A.そのまま4倍に拡大する
B.半分に縮小した後,8倍に拡大する

を組み合わせた学習モデルって作れないですか?

解像度が低い画像を拡大しようとした時に,
Bだと近くのものは綺麗に拡大されるのですが,遠くのものが潰れてしまいます.
一方で,Aは全体的に綺麗なのですが,Bほど近くのものは綺麗にならない.

複雑で潰れそうな部分はAで,大雑把な部分はBのモデルを適用できれば,
画質がかなり改善されそうな気がするのですがいかがですか?
0246名無しさん@お腹いっぱい。 (ワッチョイ 3d25-8xJT)
垢版 |
2016/07/14(木) 13:51:27.47ID:AKBc/xAg0
これって輪郭検出のち内部を塗りつぶすソフト?ですか?
のぺ〜っと、、細かな情報が消えてしまう。
クスコ、 じゃねえランチョで拡大、のちw2でノイズ消しの
ほうがシャアぷに仕上がるようです少佐
0248名無しさん@お腹いっぱい。 (ワッチョイ bcd2-GuGR)
垢版 |
2016/07/14(木) 20:02:13.83ID:x6vqi83V0
>>245見てこれを思い出した
http://www.slideshare.net/nikuque/ss-52190439/1
これで画像のサイズや圧縮率、動画のビットレートの最適化ができたらいいな

最近思ってるのは画像に関して機械学習でノイズ除去や高解像度化ができるなら
音声に関してもできないかなと。個人的には画像よりこっちの方が興味ある。
0249名無しさん@お腹いっぱい。 (ワッチョイ 69d2-ewdN)
垢版 |
2016/07/15(金) 01:22:46.25ID:2zYLl84L0
>>248
音はいろんな人が言っているけど
音声(自然言語)って厳格だからちょっとミスって変になったらものすごく気になるように思う.
画像(絵)はちょっと変でもまあ仕方ないかで済むけど.
想像で言ってますが.
0253名無しさん@お腹いっぱい。 (ワッチョイ bcd2-GuGR)
垢版 |
2016/07/15(金) 14:43:45.51ID:lsrfj+NR0
>>249
音声っていっても声より音楽、オーディオデータ全般が目当てなんだよな
サンプリング周波数やビット深度が細かかったらこんな倍音が乗っていたはずだ(可聴域外でも)とか
クリップした波形の修復(これは機械学習以前からいろいろ研究されてる)とか
もしかしたらエフェクトの新しい概念が生まれるかもしれないし

画像でも綺麗にするだけじゃなくて積極的な加工に使える可能性はあると思う
やたら重いわりに得られるものが何だか分からなくてダメかもしれないけど
0257名無しさん@お腹いっぱい。 (ワッチョイ bb0f-L3Fl)
垢版 |
2016/07/16(土) 02:11:45.11ID:S43VbK8v0
         ,,ィニニヽ彡彡彡彡ミニ三ミ、
        ,ィミシ彡ミミ、゛彡彡彡三ミ、彡イ三;ヽ
       {彡y彡彡y彡ミ 彡彡三三彡Y彡三ミ}
       {ツ彡シィイイ彡ミ 彡三ミミシシヾミ三シ
       (彡彡イ/////ノ〃〃ハ;ヾヾミ三彡Y 三)
       {彡y///イ/     ミヾヾミ三彡Yシイ
        Y((( /       `ミミ三三彡イミ、
         !、,,,_     _,,,..---   ゛ミ,ィイi }ミ三;シ
          }T゛'tゝ .:´ ィ弋カ'-    Y/5 /i川イ
         !  ̄ .i :.   ̄ ...    ーノミト、シ
         ',:.:. ,' ::.    .:.:.:.:    iイミ三ソ
         ',  ヽ ー        !::ミミ三リ
          ヽ. ゛'三‐‐‐'`     ノ :::iーーー'
           `、      , '  : :',
             ` ー-┬‐ '     : :ヽ
                  |        : : \
              ___....l:: ::  __ , ---.ヽ

         シンディ・ルー (1984- インド )
0259名無しさん@お腹いっぱい。 (ワッチョイ 323f-EqXU)
垢版 |
2016/07/16(土) 14:03:31.11ID:E/RHyF4m0
ここに書いておいたら読んでもらえるかな
caffe版の1.1.6を使用しています
変換も早くなり、レベル0も実装されて気に入っていますが
ちょっとした不具合を見つけましたので連絡です

・「ノイズ除去と拡大」または「ノイズ除去」モードでノイズ除去レベルを
1以上から0にした時、ファイル名がLevel0にならない
変換モードを変えてから元のモードに戻るとファイル名がLevel0になるので、
レベル0ラジオボタンのクリック時にファイル名変更処理が抜けているのかも

・ノイズ除去の自動判別が効いていない?
元々選択されていた除去レベルで処理している感じ
0260名無しさん@お腹いっぱい。 (ワッチョイ ca89-8xJT)
垢版 |
2016/07/16(土) 18:09:29.57ID:hnFQHF9f0
>>259
『ノイズ除去(自動判別)と拡大』って readme によれば
『拡大を行います。入力がJPEG画像の場合のみノイズ除去も行います』
だから、もともと jpeg と png など混在した対象をまとめて変換する時用の
「”ノイズ除去適用対象を自動判別”と拡大」であって
「”ノイズ除去レベルを自動的に選択”と拡大」するという意図は
含まれていないような(実際そういう動作だし)

以前『自動判別』ってなにをどう? と思って readme 読んだ時にそう理解した
0261名無しさん@お腹いっぱい。 (ワッチョイ 3239-eb7y)
垢版 |
2016/07/16(土) 23:30:51.94ID:W/gd8pMi0
waifu2x-caffe ver 1.1.6.1
https://github.com/lltcggie/waifu2x-caffe/releases/tag/1.1.6.1

コマンドラインオプションでノイズ除去レベル0が指定できなかったバグを修正
GUI版でノイズ除去レベル0ラジオボタンを押した時に出力ファイル名サフィックスが変化しないバグを修正
中国語(簡体字)訳が正しく表示されなかったバグを修正
0264名無しさん@お腹いっぱい。 (ワッチョイ e6c4-BKa+)
垢版 |
2016/07/17(日) 16:28:14.30ID:5LD6v75S0
waifu2x-c-c-with-bat使ってみたけど
変換しようとするとidentifyがコマンドとして認識されていませんとかで動かない
そもそもhtaアイコンや起動後のGUIにD&Dも出来ない、なんか使い方が間違ってるのか?
0270名無しさん@お腹いっぱい。 (ワッチョイ 96a2-PsRz)
垢版 |
2016/07/20(水) 10:14:04.74ID:Cc0UAxz90
落ちてる?
[web.lua] Error in RequestHandler, thread: 0x40336bf0 is dead.
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
/home/ubuntu/torch/install/share/lua/5.1/md5.lua:0: attempt to index a nil value
stack traceback:
.../ubuntu/torch/install/share/lua/5.1/turbo/httpserver.lua:278: in function <.../ubuntu/torch/install/share/lua/5.1/turbo/httpserver.lua:255>
[C]: in function 'xpcall'
/home/ubuntu/torch/install/share/lua/5.1/turbo/iostream.lua:553: in function </home/ubuntu/torch/install/share/lua/5.1/turbo/iostream.lua:544>
[C]: in function 'xpcall'
/home/ubuntu/torch/install/share/lua/5.1/turbo/ioloop.lua:568: in function </home/ubuntu/torch/install/share/lua/5.1/turbo/ioloop.lua:567>
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲
0271名無しさん@お腹いっぱい。 (ワッチョイ 69d2-ewdN)
垢版 |
2016/07/20(水) 12:16:35.37ID:Mmd6XeiM0
夜中にサーバーの1台がそのエラー出し続けていたけど今は直っているし謎です.
APIに使っているHTTP Serverがわりと怪しいのでメモリをぶっ壊して変になったあと落ちてupstartが再起動したのかもしれない.
0273名無しさん@お腹いっぱい。 (ワッチョイ 0325-iqWO)
垢版 |
2016/07/21(木) 13:55:35.59ID:9F1XqsII0
うちのPCじゃうごかないなあ
ヌーロンダブもどうなっとるんじゃ
0274名無しさん@お腹いっぱい。 (ワッチョイ ff39-0GON)
垢版 |
2016/07/25(月) 02:56:16.34ID:rCMzi4GJ0
githubで外国人の人も言ってたけど4倍拡大以上だとアーティファクトが出ることがあるね。
「4x and 8x are not fully supported because this is waifu2x」らしいからしょうがないけど。

元画像
http://www.pixiv.net/member_illust.php?mode=medium&;illust_id=57922779

UpRGB old 4倍
http://i.imgur.com/Hx51mML.png
UpRGB new 4倍
http://i.imgur.com/34szjiL.png
RGB 4倍
http://i.imgur.com/2u8aM7q.png
0276名無しさん@お腹いっぱい。 (アウアウ Sacf-GUDH)
垢版 |
2016/07/25(月) 14:52:40.14ID:ANO+1WFAa
忙しくて久しく見れてなかったけど更新されたようですね。
>>274の問題は、継続ですか。
こうなるとやはりディープラーニング+αが必要なように思えますね。
ディープラーニングは優秀だけど完璧というわけではないので、なんらかの補助手段は必要なように思います。
こちらでも時間のあるときに新バージョンのテストはしてみますが、はてさて。
0290名無しさん@お腹いっぱい。 (ワッチョイ 9cd2-okXX)
垢版 |
2016/07/30(土) 05:41:04.97ID:0EvlKLvb0
upconv_7の2xモデル更新しています。
>>274
とgithubで上げられている例はアーティファクトでなくなっています。(2倍においては)
まだ出るパターンはあるかもしれませんが、出にくくはなってると思います。

PSNRが高いほうが出てたりするので1/2にしたときに潰れてしまうメッシュ状の模様を
書き込んで復元しようとしていて、判断をミスった時にそういうアーティファクトとして出ているのだと思います。
ミスることがあっても平均的にはやったほうが良くなるみたいですが
平均より最悪が重要だと思うので、アーティファクトが出にくいパラメータを最終的に選ぶようにしました。
0292名無しさん@お腹いっぱい。 (ワッチョイ 9cd2-OJXh)
垢版 |
2016/07/30(土) 12:44:32.29ID:Jy30OL100
2倍や4倍のような拡大は実際めったにしないんだよなあ
様々な半端なサイズの元画像を、画面解像度の縦や横
(またはその2倍4倍など)を意識したサイズに拡大することがほとんど

waifu2xは学習モデルでの2倍拡大(場合によっては複数回処理)と
既存アルゴリズムでの拡大縮小を組み合わせてるんだっけ?
0299名無しさん@お腹いっぱい。 (ワッチョイ 9cd2-okXX)
垢版 |
2016/07/30(土) 19:15:15.90ID:0EvlKLvb0
新モデル(upconv_7)は構造上2の倍数にしか拡大できない。
最初のモデル(vgg_7)は任意サイズにBicubic等で拡大した結果を
CNNで修正するという形にすれば可変倍率にも対応できるけど
倍率固定して学習した時に精度で勝てないので、なら2倍にして縮小でいいのではと思ってる。
ただ縮小も気をつけないと縮小時にモアレやリンギングが出たりがある(これは一般的な話ではあるけど)。
0305名無しさん@お腹いっぱい。 (ワッチョイ 7925-oK17)
垢版 |
2016/08/01(月) 14:14:51.51ID:s/CT/hUD0
AIやシンギュラがこれだけ進歩したんだから画像処理も
単なる塗りつぶしじゃなくてもっと賢い方法が出ないかな。
昔の映画やレコード音源の修正でも同じ、劣化逸失した情報を
量子演算で取り戻すような、根本的なところでの革新が必要。
やぱり人間の脳みその性能上限に縛られてる?だろ
そういや水着の布地て体積の半分以上はすきまの空間であり
そこを通り抜けてくる光線は多量に存在するはず。
その軌跡を光学補正して美少女の素肌映像を再現する
すきま光線解析ソフトが出ないかな?
あの光線が再利用されず無駄に散逸してるのは残念
0312名無しさん@お腹いっぱい。 (ワッチョイ 9cd2-okXX)
垢版 |
2016/08/03(水) 10:29:08.49ID:muLCaGi+0
UpRGBはノイズ除去だけした時に一度拡大してから縮小していると聞きましたが
デフォルトにしまうとそこに不安がある気がします。
拡大縮小は結構劣化を生むと思うので、構造上難しいならいっそUpRGBでノイズ除去のみはエラーに倒してもいいように思っています。
一応JSON側にarch_name: upconv_7/vgg_7を入れてますが。
0313名無しさん@お腹いっぱい。 (ワッチョイW 6b1a-d+5h)
垢版 |
2016/08/06(土) 17:25:26.75ID:sO6XeMu60
最近になってcafeとmultiがあることに気づいたんだけど
これってどちらも性能は同じなのかな?
multiのほうが画像単体で複数変換できるから便利な気もしないでもないけど
どなたか細かな仕様の違いご存知でしょうか
0314名無しさん@お腹いっぱい。 (ワッチョイ 67d2-CqAC)
垢版 |
2016/08/06(土) 21:11:33.14ID:Yf7P2RxD0
waifu2x-caffe(最新版)はウェブ版(waifu2x.udp.jp)とほとんど同じはずです。
逆にそれ以外は使っているモデルが古いなどで細かく性能を測るとスコアは低いと思います。
https://triple-underscore.github.io/css-images/pixel-art-small.png
この画像をノイズ除去なし2倍で変換してみて
良し悪しに関わらず出てくる画像がウェブ版と異なる場合は
使っているwaifu2xのバージョンが古いです。
この画像はバージョンによって異なるアーティファクト(ノイズ)が出てくる呪いの画像なので
バージョンを調べるのに便利です。
0320名無しさん@お腹いっぱい。 (ワッチョイ 6f04-MLGp)
垢版 |
2016/08/08(月) 02:22:38.85ID:Ex+ktA6y0
今の限界の3倍くらいの大きさの画像も処理できるようになると嬉しいわ
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況