【超解像】画像拡大ソフト総合スレ2【waifu2x】 [無断転載禁止]©2ch.net
■ このスレッドは過去ログ倉庫に格納されています
画像を人工知能(Neural Network)を利用して拡大、あるいはノイズ除去するソフトウェアの話題を総合的に扱うスレです。
本来の用途は静止画が対象ですが動画のアプコン処理に関する話題もOKです。
ただし動画編集ソフトの使い方の部分の話は各ソフトのスレに行って下さい。
--主なソフト--
・waifu2x
本家Webサービス
http://waifu2x.udp.jp/
・waifu2x概要:二次元画像を拡大したいと思ったことはありませんか? (waifu2x作者氏のブログ)
http://ultraist.hatenablog.com/entry/2015/05/17/183436
・waifu2xとその派生ソフト一覧
※リンクがNGワードに!
・waifu2xのベンチマーク結果まとめ - Togetter
http://togetter.com/li/831437
・無料で二次元画像を人工知能が補完してハイクオリティで1.6倍/2倍に拡大できる「waifu2x」 (gigazinの記事)
http://gigazine.net/news/20150519-waifu2x/
・Otaku ワールドへようこそ![212]嫁を拡大する人工知能/GrowHair (日刊デジタルクリエイターズの記事)
※従来の拡大手法とwaifu2x、SRCNNの違いについての丁寧な解説記事
http://blog.dgcr.com/mt/dgcr/archives/20150605140100.html
・NeuronDoubler
人工知能超解像プログラム NeuronDoubler
http://loggialogic.blogspot.jp/2012/06/neurondoubler.html
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured ネットじゃモザイクを解除できると思ってる奴多くてワロタ
モザイクの処理はドット混ぜてたり位置換えてたりするから無理po 全層畳込みニューラルネットワークによるラフスケッチの自動線画化
http://hi.cs.waseda.ac.jp:8081/
使い方
1 「ファイルを選択」ボタンを押し、線画化したい画像を選択してください。
2 線画の簡略度を設定してください。
3 「線画化!」ボタンを押すと、線画化した結果が下の方に表示されます。
★システムの改善にご協力ください!★
現在のシステムはまだまだ発展途上であり、みなさんのラフスケッチをAIに学習させることでさらに精度が上がっていきます。ぜひシステムの改善にご協力ください。 >>371
ラフが線画になる時代が来たのか……
クソのようなカラー版じゃなくて、
矢吹絵を石恵塗りで色付き生成するのもきっと時間の問題だな、胸熱すぎる ラフっていうかアタリ程度だとまともな絵にはならないね
そりゃそうか HUNTER×HUNTERやBastardの雑誌版がコミックス版に! ラフというかわりと完成した鉛筆画ならそれなりにいけそうな気がするねぇ
学校で描いた落書きとか突っ込んでみれば てか富樫のラフ画をもとに処理して見せればいかにすごいかわかるんじゃね waifu2x-caffe ver 1.1.7.1
https://github.com/lltcggie/waifu2x-caffe/releases/tag/1.1.7.1
GUI版にアイコン追加
crop_wとcrop_hが違う値の時にTTAモードを使うと出力がおかしくなるバグを修正 >>379
ついに自作のコーヒーカップ・アイコンとお別れの日が来たか・・・ waifu2x caffeでjpegをpngにした場合
waifu側でRGBに補完してpngで吐き出してくれるのですか?
それともYUVで処理した後単純なRGB変換をしてるのですか? >>381
画像を読み込んだ時点でRGBになってwaifu2xで処理して結果をPNGで保存
ノイズ除去ありだとYUV4:2:0のクロマサブサンプリングもwaifu2x側である程度修復される フォトモデルがYUV処理なんだと思ってた
(´・ω・`)違うのか・・ This website is hosted by the server of pixiv Inc
いつの間にやら 今のところwaifu2x.udp.jpの接続先をEC2からピクシブ様が提供されている環境に切り替えた以上の意味はないです。
githubのwebブランチからデプロイするようにして頂いています。(広告等は追加されるかもしれません)
サーバー代とたまに落ちる問題は解決したんじゃないかと思います。
回線やハードウェアも以前よりいいと思います。 multiっていちいちimgurにうpしてんのか?消せないの? >>390
ファイルのURLを持ってるのは確かだけど、imgurにうpしているようには見えないけど
どうしてそう思いました? >>393
クリックしたらi .imgur〜から始まるURLが見えた E8400で使ってみたら 1ページ辺り3分近くかかるな
i5-6600辺りに換装したら実用的になるかな? GPUか AMD買う予定だったけどGeforceにしようかな GeForceをディープラーニング目的で買うなら最低でも8xx世代、できれば9xx世代を買うべし vega買う予定だけど、このソフトにはあまり向かないのかな… Caffeがamdで動くようになるって話があったような気がするけど進捗はどうなのかな experimentalって書いてるしまだ先の話かね >>399
8xxはノーパソ用だろ?
vramは多いけど処理性能は7xxより劣るのがな…。 AMDならwaifu2x-converter-cppがある
まあ更新が止まってるけど >>405
これはマジでいいな
最初文字も出ないし変換してるかわからんほどやたら時間かかるから疑ったけど
最初だけで次回がスムーズで驚いたよ
使えるソフトだし更新してほしいな waifu2x-caffe ver 1.1.8
https://github.com/lltcggie/waifu2x-caffe/releases/tag/1.1.8
CUDA Toolkitを8.0.44に更新(同梱しているdllも更新)
cuDNN v5.1に対応
アルファチャンネルが単色の場合、cv::INTER_NEARESTで拡大することで高速化 意図せず無意味なアルファチャンネル情報が付いている画像の変換が早くなった模樣
ただtwitter形式で上げられてるpngは単色じゃないから変わらないねえ CUDA使えなくなった
このバージョンの推奨ドライバって何になる? 使えなくて一瞬焦った
推奨ドライバは知らないけどnVidiaのドライバを
368.81 → 373.06 にupdateして使えるようになって一安心 tanakamura版使ってるんだけどCUDAで処理させようとするとこんなエラーが出るんだけど俺環?
Iteration #6(128->128)...(94.5009[ms], 310.326[GFLOPS], 1.07752[GB/s])
Iteration #7(128->3)...(10.8175[ms], 63.5389[GFLOPS], 4.81689[GB/s])
total : 0.218784[sec], 263.632[GFLOPS]
OpenCV Error: Unspecified error (could not find a writer for the specified extension) in imwrite_, file C:/OpenCV/sources/modules/imgcodecs/src/loadsave.cpp,
line 439
terminate called after throwing an instance of 'cv::Exception'
what(): C:/OpenCV/sources/modules/imgcodecs/src/loadsave.cpp:439: error: (-2) could not find a writer for the specified extension in function imwrite_
This application has requested the Runtime to terminate it in an unusual way.
Please contact the application's support team for more information. 原因はわからんが対処法はわかった
-o hogeはダメで-o hoge.pngは問題ない 拡張子指定しないとどの形式で出力したらいいのかわからないじゃん そういう問題なんです?
普通に全部pngで出てくるのかと思った waifu2x-converter-cpp
AMD版の更新おねがいしまつ! かなり久しぶりにみたら色々アップデートしててちょっと困惑してるんだが
bmpで出力する場合、以前は24bitだったが今のバージョンだと32bitになってるよね
これ前みたいに24bitのbmpで出力する方法ある? ごめん
>>417はwaifu2x-caffeの話ね >>417
もともとの画像が32bitとかではなくて?
こっちで24bitの画像を処理しても24bitになったよ あ、いや24bitのbmpを処理したら32bitになるっぽい? >>419-420
こっちで確認した結果はbmp入力→bmp出力だとほぼ確実に32bitになる
「ほぼ」というのはそうならないパターンもあったので
最初にjpg入力→bmp出力をやると24bitのbmpで出て
そのあと続けてbmp入力->bmp出力すると24bitのまま出た
最初からbmp入力→bmp出力だと32bitになる
分けわからん
あ、一応全部GUIでのwaifu2x-caffe使用によるもので、設定は以下の通り
出力拡張子「.bmp」
変換モード「ノイズ除去」
ノイズ除去レベル「レベル0」
モデル「2次元イラスト(RGBモデル)」
分割サイズ「128」 >>419は
入力24bit png
出力 bmp
結果24bit bmp
>>420は
入力24bit bmp
出力 bmp
結果32bit bmp
この動作は仕様なのかな? ふむ、仕様かバグかしらんけどBMP→BMPでの24bit出力は無理そうかな
なんかコマンドラインからならオプションでできる、とかあったら知りたかったけどパッと見なさそうだし
大人しく出力後に別ソフトで変換するわ そういやwaifu2x、派生版もMITやBSDライセンスが多いけれど
コレ使ったスマホアプリを有料や無料+広告で出しても大丈夫なんだろか
実用速度にするならPrismaのように外部専用鯖が必要になるから動画広告でも付けたいんだよね Prismaは最近オフラインでも動作するようになった。 >>424
それはもう、このスレに書き込むとかいう奥ゆかしいコミュニケーションじゃなくて作者に連絡取ったほうがいいんじゃないか >>424
全く問題ない
さらに言えばフォークしてそれ自体を売りに出しても構わない(要求された場合無料でなくてもいいがソースを出す必要があるが) >427
GPL汚染されてないのにソース出す必要あるの? >>428
すまん、GPLの場合はそうだったね
BSDとかMITならいらない 黒字の間しか鯖動かしてないんじゃなかったっけ
トータルではどうなのか知らんが Reshadeってどうなの?
写真の拡大には良さそうだが >>436
ポスターみたいに大きく印刷したいときかな。 http://www.itmedia.co.jp/news/articles/1611/07/news119.html
「わしが育てた」なやり方が取れるのか
組織だって重点的に応募すれば好みのタッチに近付くのかな? 弾かれるのかな?
どっちにしても楽しそう 白黒写真の着色技術をイラストにも応用するのかな。某嫁2倍みたいだ。 GIGAZINEにも先日モノクロ写真を自然なカラー写真にしてくれる研究のってたな
こりゃ2020年までには女性の水着写真を入力→その人の全裸画像出力まで行くと思った
DMMのAVパッケージからの顔写真やFBの顔写真の検索サービス売ってる人もいたしな
倫理的にこれやっていいのかって画像処理、
データ処理、データベース化が出てくるだろうね
今のビッグデータでさえプライバシー倫理的にどうなのって話でもあるが
倫理的にアウトなやつはコードで配布って形になる予感 今まで通り個人の範疇で何をしようがそりゃ個人の自由よww
メーカー側が売ることが出来るかできないかはそりゃコマーシャル方法によるだろうなw
「水着の女を裸にできます」なんてコマーシャルじゃ確実にアウトwww Googleが低解像度画像を爆速で高画質化する機械学習を使った技術「RAISR」を発表 - GIGAZINE
http://gigazine.net/news/20161115-google-resarch-raisr/ 超解像は、リアルタイムで進行している。
ピッドーン、ピッドーン… 論文読んだかんじPSNRやSSIMはSRCNNより落ちるけど処理速度は圧倒的に早いな
SRCNNが数秒かかるところを0.1秒以下で出来てるっぽい(グラフ見間違えてなければ) ワイフは2次元特化しかこの先生きのこる術はないのか 今後はデコードでなく、補間に適した方法で圧縮した小サイズの画像を転送して
モバイル端末側で拡大処理をするようなサービスも出てくるかもね
バッテリー持ちと帯域とのトレードオフになるだろうけどw >>447
「高圧縮率だが展開に負荷がかかる新しい圧縮フォーマット」と何が違うのか >>446
その2次元絵もアプコンでは境界線が溶けてて使い物にならないんだけどな
RAISRのベンチ次第では本格的にいらない子になるわ >>448
画像(動画)であれば全て対応可能な点と
マシンラーニング結果で精度の向上が見込める点か 処理速度が発表通りなら確かに動画のアプコンも現実的な範疇かな これweb版はpixivのサーバーで動いてるんだな >>443
どこかでテストできるサイトはないのかな?
あるいはwaifu2xに「同じ写真のアップサンプリング版と高解像度版」のセットを学習に使用するの部分だけでも組み込んで、速度はともかく画質向上ができればとも思うけど 2030年、日本人がモザイクを無修正にする技術を発明する >>453
Set5,14の結果が論文に載っているけどwaifu2xの写真モデルよりだいぶ低いです。
Bicubicよりマシな結果で速度に特化している感じだと思う。 写真で言えば、現状木の葉の重なりとか
同系色の小石及や砂漠の処理が難しいな
サンプル食わせても、思ったように描画してくれない みんな論文読んだ?
読んだ範囲だと選択的に
デシタルフィルタで輪郭強調してるだけっぽいけど
表現力とかreceptive fieidはかなり
waifu2xの方が大きい
ただ家電組み込みとかは有利そう 昔からよくある超解像のエッジ強調でボケ低減重視した結果
テクスチャ成分が消えて油絵見たいになる奴だな
今までは反復で処理してたのを1回?なんで速度が速いみたいな
あとで元画像の高周波成分に応じたディザ加えると視覚上はそれっぽく見えるようなの あぁwaifuより溶けてねーかと思ったのはあながち間違ってなかったのか >>457
論文のままやるのではなく、waifu2x流に 「同じ写真のアップサンプリング版」と「(今までのモデルデータと同じ)高解像度版」の2パターンのモデルデータを作成して、
それぞれで超解像処理したあとに部分ごとにいいとこ取りするとかではダメなの? koroshellのコンバータをcppに変えたら速くなった!
気がする ■ このスレッドは過去ログ倉庫に格納されています