【AIコラ】fakeapp その13【革命】
レス数が1000を超えています。これ以上書き込みはできません。
deepfakesの技術交換スレです。
前スレ
【AIコラ】fakeapp その12【革命】
https://phoebe.bbspink.com/test/read.cgi/ascii/1580015540/
テンプレに書いてない質問はok
VIPQ2_EXTDAT: checked:vvvvv:1000:512:: EXT was configured deepfakesなソフト
◎DeepFaceLab(以下、DFL)
◎deepfakes/faceswap(以下、FS)
●fakeapp
●openfaceswap(以下、OFS)
●myfakeapp
deepfakesとは?
AutoEncoderで顔を再生成できるようにAとBそれぞれの特徴量を学習し、decoderを入れ替えることにより、AとBの顔を交換する手法。
・質問や情報交換について
日進月歩、モデルやオプションが多様化しているにもかかわらず、局所的な意見が散見されます。
必要に応じて自分の使ってるソフトやモデル、パラメータ等の詳細も書きましょう。 ・エラーについて
エラーが出て解決できない場合は、なるべく詳細な情報(環境やどうしてそうなったか)を書きましょう。
特にエラー文は1番のヒントです。ググれば解決することも多いです。自分で解決できない場合はログを全文コピペしましょう。 ◎よくある質問
・違法じゃないの?
deepfakes自体に違法性はない。
ただし権利者に許可を得ていないコンテンツの二次利用は著作権法に違反。
また、所謂フェイクポルノを不特定多数が見れる場所に公開すれば名誉毀損(侮辱罪)に該当。
有名人の顔を使用して経済的利益を得ればパブリシティ権の侵害になる。
・ソフトはどれ使えばいい?
利用者が多く情報が多いのはDFL。FSも英語圏では情報が得やすい。他は更新していない。
・必要スペックは?
VRAM容量6GB〜が推奨スペック。GPU性能は高い程いい。
・RTXシリーズでも動くの?
FS、DFL共に動く。CUDA10以降を選ぶこと。
5 名前:/名無しさん[1-30].jpg[sage] 投稿日:2020/01/26(日) 14:39:36.12 ID:l6qr1y1gH
・作るのにどれくらいかかる?
パラメータやスペックにより異なるがはじめは2日から1週間程度学習させる必要がある。
2回目からはmodelの再利用により学習時間を大幅に短縮できる。但しmodelの再利用については賛否両論あり。
・lossについて
A→A'、B→B'の学習具合の目安にできるが、データセットやtrainer、パラメータに左右されるので具体的な数値目標を設けるのは間違い。学習具合はプレビューで判断する。 なんで>>1は前スレでここ建てた時からID消してんの? まあとりあえずスレ立ておつ
1がID消してるよりも必死にしたらばに誘導してるやつのほうが謎だわ liaech悪くないかも。ゼロから始めて2日ちょっとでこのぐらいまで学習進んだ。
https://www.axfc.net/u/4021465
非エロだけどすぐ消すよ。 悪くない
まさにそんな感じかも
HDじゃない分軽くて、バッチ数とかかなり上げられるけど詳細感には限界を感じる
riae系ということでやはりきつめの角度には強いがsrcに寄せられる度はDFHDには負ける
あと目線が逃げがちという点も変わらずある
riaeと比較出来てないから何とも言えないけど、それ比でsrc寄りになるという文句通りなら価値は結構ある
悪くない >>15
映像的にはよく出来てたけど誰を誰に変えてるのか分かんなかったごめん
学習速いなら試してみようかな 顔抽出が512になったけど今まで256基準で映像集めてたからキツイな
拡大して荒くなったのエンハンスするとノイズも強調されちゃうし もちろん相性によって変わるのは分かるんだけど
SAEHDのres256で作ってたらerodeとblurはどれぐらいを目安に設定してる? >>20
色の合い方によっても全然違うのであんまり参考になるような数値は出てこないんじゃないか?
プレビュー見ながら調節。 >>20
力技で合わせるとか以外の通常に限って言えば
erode0 blur70くらいを標準と見て調整するかな >>18
mainscriptフォルダの中のExtractor.pyの690行目の
image_size 512
ってなってるのを256にしたらいいよ
あと512に変更された時に同時に変わった264行目のjpegクオリティの設定値90を100に戻せば以前と同じになる
今の所whole faceで使う以外に更新された形跡はないからデメリットもゼロのはず whole faceってどうなんだろうね
試した人はいるのだろうか 512でtrain厳しいからwhole_faceはパスだなー
>>23
旧ver残してるからそっちでやってるけど書き換えたら戻せるのかなるほどありがとう リリースはされてないけどliaech消されたな
liae比でも非常に軽い点、
src前髪未処理の時でも他と比べて上手くこなす点等
それなりに可能性を感じたんだが
fansegトレーニングも次のリリースに入るはずだけどこれは嬉しいね liaechは試しに3時間ぐらい回してみたけどloss5台でずっと砂嵐だった >>30
俺も同じ症状遭遇した
最新のモジュールでExtractしなおしたら(dst,src共に)、最初からきれいにトレーニングできた。 アップ正面メイン笛用にres256 dims352 48 48 16モデル作ったけどres192dims512と比べて目に見えて解像度上がりました
ただし髪型とか目線の細かい追従力も落ちるから一長一短 resはresolutionで解像度って意味だから数値上げればそりゃあがるよ
プレビューの画像も大きくなってたでしょ >>33
おれもメインは192 dims512でやってるけど、256って何かスカスカな感じにならんかね
おれ環でもやはりdimsは256くらいまで落とさないと動かないので似たような境遇だと思うが 0315版来たね
whole face向けのfansegのようなものも実装
面倒そうではあるけどなんだか凄そう あれ、はげかけたオッサンはいいけど
前髪ある女性はどうなるのか興味はある 綺麗に顔が入れ替わっても、似ないなあ。
髪型があってないとだめなのか。 mergeする段階でのface scaleの数値がかなり大事な気がする
これが本人とかけ離れてるとパーツがほぼ完ぺきに学習できてても似ない 皆dst探しの旅に出てる。
スレ分離した、ワッチョイ付きで荒しが減った(NGできる)、目新しい技術的な話題がない
といったところかね。
かくいう自分もwhole_faceやXSegに興味はあるものの試せてないから
話題提供もできない。 これある程度トレーニングさせたら動画にして
中途半端に本人っぽくできあがったやつをdstに交換してさらにトレーニング
ってやった方が早く本人に近付かない??
ダメなのそれじゃ 完成までの時短をしたいという意味では手間が膨大な割に効果はどうなのかと思うけど
完成品を更にもう一度deepfakeしてsrcに近付けるという意味の試みなら面白いかも 予想だけどそれすると顔色が目にみえて合わなくなる予感 dfuhdとliaeuhdというarchiが追加されてるね
これはコード少し見たところ、UltraHDというわけでもなく、非HDのdfやliaeとほぼ同じものだった
効率化の部分で少し違いがあるような感じ
詳細出るまで急いで試す必要もなさそう 全力笑顔で上の歯全部出てるようなsrc素材は削除してよさそうだな >>48
サンキュー実験的なモデルかね。
削除されたけどliaech個人的に気に入って使ってるわ。
chagelog(readme?)に書いてる通りliaeをよりsrc寄りにしたって説明のまんま。 == 24.03.2020 ==
SAEHD:「dfuhd」と「liaeuhd」を追加しましたarchi
uhdバージョンは「HD」よりも軽量ですが、通常バージョンよりも重いです。
liaeuhdは、より「srcに似た」結果
比較を提供します 。
liae:
https://i.imgur.com/JEICFwI.jpg
liaeuhd:
https://i.imgur.com/ymU7t5E.jpg
新しいXSegEditorを追加しました!
リリースあったのね
非HDと大差ないと考えてたけど
これもsrcに寄せるということなら試していきたいな liaechはおれもいいなと思った
他とコード構造も全く違うものだったし、差別化に可能性を感じた
消された時はコードは選択部分だけの削除だったから比較的簡単に自分で書き戻せたけど、今回のarchiの追加で骨組み部分がバッサリ消されてしまった
ちなみに今回の「u」版はliaechの流用というわけでは全く無くて、既に書いた通り非HDをほんの少し変更したものだね 的外れなら申し訳ないんだが、DFとLIAEのアーキテクチャの違いって識別モデルか生成モデルかの違い?
LIAEの方が色んな角度に対応できるのって入力データから分布推定して自分で訓練データ生成してるから?
合ってても間違ってても教えてくれると助かる 識別か生成かはよく分からないけど
LIAEは外観と表情を明示的に分けて中間層を作るモデル構造を採ってるために
モーフィング的なスワップが上手くいくということだと思う >>55
ありがとう
外観(輪郭のこと?)を表現する中間層を用意することで外観ごと似せられるようになるってことなのかな
IAEをImplicit AutoEncoderの略だと勝手に解釈をして>>54みたいなことを考えてたけど、それは関係ないみたいね ImprovementAEだね
元はfsの関係者が「速度や解像度の面で優れたAEを作ったよ」と出して来たものを
dflの作者が調整してliaeになった
なのでオーソドックスタイプに比して角度に強いとかいう特徴が残ったのは結果論であって元々意図したものではない気がする
オーソドックスタイプもdfl独自の改良を経てDFとして進化をして来たけど、liaeはその特徴があるために並行して残されてるんだろうなと liaeはdfにおけるtfの様なお手軽にsrcに寄せるパラメータが無いのが最大の欠点だから
作者も今そこを克服させるために試行錯誤して出してきてるのがliaechだったりliaeuhdなんだろうね >>57
improvementか、具体的に何か機能を意識した言葉ではなかったのねサンクス >>24
今さらながらwhole faceを試した
輪郭・前髪ごとガッツリ入れ替えることができてる気がする
髪の色が同じであれば前髪を消すより前髪ごと入れ替えた方が本人感が出る
ただXseg editorでマスクする範囲を手動指定しないといけないのはまあまあしんどい
輪郭・前髪が似てなくても何が何でもsrcに似せたいという気概がある時に使うと良いのかなと思った >>60
adobeのaftereffectを使わなくてもXseg editorでマスクすればいいんだよね?
前髪のマスクはかなり面倒だろうなあ
話は変わるけどLiaeuhdはrandom warpでloss値が0.4で頭打ちになる
数値の基準がこれまでと違うのかな >>61
xseg editorでマスクしてxseg merge.batでマージすればxseg trainを動かせた
ほんで前髪の生え際からがっつり入れ替えられた
もう一つ思ったのは
dst中にがっつり下を向く角度がある時に前髪ごと入れ替えちゃうと、dstの頭頂部とsrcの前髪の継ぎ目が気になる
(正面だと継ぎ目があんまり見えないから目立たなくて綺麗に入れ替わって見える)
まだ試してないけど、頭頂部を含んで入れ替え可能ならより自然になるかもしれない whole faceで前髪ごと全部入れ替えるってのは面白い
日本ならではの試みかも
前髪がっつりある場合ってそうやって使わないと利点が出てこないもんね
つべに上がってたfullとwholeの比較では
同じ解像度だと当然wholeの方が解像感不足が見て取れた 前髪の挙動はどうなんのよ
srcの前髪が揺れを再現したりするの? イメージわかない >>63
外出中だからID変わってると思うが
機会があればやってみて
whole faceの使用報告が少なくて、使ったらどうなったっていう事例は自分も知りたい >>64
dstの前髪の動きまで再現するかについては正直まだわかってない
自分のデータで見えてる現象は、convert後の動画に前髪の動きはほとんどない
ただ自分のデータはsrcの顔もdstの顔も、もともと前髪の動きがない
だから今のデータだと>>64の疑問は確認できない気がする whole faceでの前髪交換については↓が気になってる
@srcに複数の前髪形状(右流し、左流し、ぱっつん、デコ出し)の顔を設定した場合、convert後にどの前髪が再現されるのか
Adstの前髪形状に依存してconvert後の前髪が生成されるのか、dstの前髪形状とは関係なく生成されるされるのか
自分でも機会があれば試すつもりだけど、もし分かった人がいたら教えてほしい 顔に立体感が出ない時はGANとかで詳細を学習させればいいのかね?
merge後の顔がどうものっぺりというか平面的というか人間味がないんだよな
陰影とか部位ごとの細かな色の違いがない気がするんだよな trainが動かない時、バッチ数を下げると動きだすが、GANもそういう事があるようだ
GAN 1.0で動き出さないから0.5にしてみたら動いた >>69
大幅に変わるものでもないけど
GANで少しは改善するかも 口の動きを細かく追従させようと思ったらインタビュー映像とかを高fpsで切り取らないとだめ?
喋るシーンで腹話術状態に陥ってるんだけど 「オナニーは毎日してます」とか言ってるdstなら分からんでもないw 5fpsぐらいである程度入れておけばなんとかなるよ
dstとの相性もあるのかもしれないが 最近始めたんだけど、DFはデータの水増しとかできるのか疑問です。 俺はこう、ギリギリあり得そうなリアリティのある部分の方が脳が本人だと錯覚するタイプなんだw
後は会話シーン再現できたら感動しそうだなとw >>76
サンキュー
目安5fpsぐらいでsrcの会話シーンを連続的にextractしてみる xsegが拡張されて、fanseg削除になったみたいだけど
実際試してみないと使い勝手が分かんないな == 2020年3月30日==
新しいスクリプト:
5.XSeg) data_dst/src mask for XSeg trainer - fetch.bat
XSegポリゴンを含む面を、aligned_xseg \ dirにコピーします。
ラベルの付いた顔を収集して他の偽物で再利用する場合にのみ役立ちます。
これで、SAEHDトレーニングプロセスでトレーニング済みのXSegマスクを使用できます。
これは、ランドマークから取得されたデフォルトの「full_face」マスクが、トレーニングされたXSegモデルから取得されたマスクで置き換えられることを意味します。
使用する
5.XSeg.optional)data_dst / data_srcのトレーニング済みマスク-apply.bat
5.XSeg.optional)data_dst / data_srcのトレーニング済みマスク-remove.bat
通常は必要ありません。障害物で 'face_style'と 'bg_style'を使用したい場合は、これを使用できます。
XSegトレーナー:顔のタイプを選択できるようになりました
XSegトレーナー:「オーバーライド設定」でトレーニングを再開できるようになりました
合併:XSeg- *モードをすべてのタイプの面で使用できるようになりました。
したがって、古いMaskEditor、FANSEGモデル、およびFAN-xモードは削除されました。
新しいXSegソリューションの方が優れており、シンプルで便利です。通常のディープフェイクの手動マスキングは1時間だけです。 新しいソリューションとか望んでないんだよね
顔切り出しの精度を上げるとか
フェラとかキスの舌を認識するとか
基本をレベルアップさせてくれないと 言えてる、オレも顔認識の精度はもっと上げられると思う
前後のコマで認識してて、なんでこのコマを取りこぼすかな?とかあるもんね マスクの精度上げるだけで質上がるからね
現状キツい角度は手動でもちゃんとランドマークしてくれないことが多い そうだね、キツい角度と言っても人が見ればすぐ判別つくようなものでも、手動でうまく決まらなくてイライラする 途中で書き込んじゃった
前後のコマから判別するとかのアルゴリズムは入ってないのかな?と思うわ mask editorをもっと手軽に行えるパッチがほしいわ 現状1コマ1コマ手動とか非現実的すぎる マスクエディタはちんぷんかんぷんだな
元々フェラは全然作ってないけど、作ろうと思ったら大変そうだった
結局、以前書かれてたdst同士でtrainして下準備するって方法に落ち着いた
https://i.imgur.com/qw7Bsn9.jpg whole faceやってみたいけど、
liaechを使いたいがために03.07.2020バージョンで止まってて手が出ねえ 0330版でwhole_faceである必要がなくなったけど
XSeg trainでface typeがwfになってしまうので以下
Model_XSegのmodel.py 25行目のwfをfに変更
\workspace\modelにXSeg_default_options.datがある場合は削除 >>93
ほんとだバグってんね
ナイス情報
fanseg消えてしまうってんでなかなか試せずにいたけど
並行環境で試してみたら結構良いねこれ
マスクエディターは変な重さは無くなって比較的扱いやすい
dstもsrcもそれぞれ公式にxsegトレーニングが簡単に出来るのもいい
後はこのトレーニングしたモデルがどの程度汎用性あるのかだな
一度一通り学習出来たものがあれば、dst変えても以前のfansegレベルに機能するのかどうか
この辺を試していきたい 試していきたいって黙ってやればいいだろ
いちいち表明するんじゃねえ ワッチョイの7e-がガイジなんだからNGするだけだろ 今週の日記
ワッチョイW 037e-p0ll
ワッチョイ 55ac-/I61 mask editorだけどマウス右クリでカットしたあとeでセーブ推して次のフレームいってそこからrとe交互にずっと最後まで押してるけどもっとスピードアップできないものか xsegはfansegでチラつくような場面でも上手く機能して精度はいい感じ
ただやっぱり汎用性はそんなに高くなくてdstが変わる毎にマスクしてトレーニングをしなければならない
fansegのお手軽さが無くなるので、この点はかなりきついと思う
あと旧環境で前髪を通常マスクしたsrcでtf・GANをかけるとマスクが変になったり、マージ後の色味が安定しなかったり変なことになった
原因はまだはっきりとは分からないんで要検証かと
という訳で、完全移行はあまりお勧め出来ない状況なので既存環境と並列して試すのがいいと思う whole faceすごくいいな
そろそろ前髪問題を解決するアップデートして欲しいけど外人で前髪ある人って稀だからなぁ
日本人が製作者なら真っ先に解決するとこだろうな 最新の落としたらFANSEG無くなってて使えない
フルフェイス切り捨てるなよ liaeuhdってliaehdと比較してsrcに似せる能力段違いに低くない?
他にliaeuhd使った人居たら感想を聞きたい whole faceの例、男性短髪、正面、背景シンプというやりやすい条件。
女性長髪、横顔、複雑な背景でうまくいくんだったら画期的だけど、どうなん。 >>101
またバージョンアップしたの?
ついていけない 過去にうん時間かけて手動マスクしたのが使えないアプデは勘弁して マスク時間かけてるやつって1枚1枚指1本からやってそうだよな(´・ω・`) full face なくなったのは衝撃だな
whole face ってそんなにええん? srcをマスクする方法ないですか。
srcの前髪を消したい RTX3000がでたら買い換えようと思ってたけどコロナで遅れそうだよなあ
wholefaceがメジャーになったら1070じゃ厳しいな 2.0のFULLのSRCで何万回か学習させたモデルを別のSRCに使いまわしできますか? FULLFACEで30マンくらいまわしたけど、尺八がうまくできない、口があきすらしないんだけどどうしたらいいんだ?
どうゆう設定で回したらいいでしょうか? wholeみたいな頭部自体の挿げ替えは髪短い女性か男性ぐらいしか適用出来そうにない印象あるわ
まあ一応同素材同設定でfとwfでdfhd回してみたけど、fは割と目線反映したのに対してwfはやたら寄り目気味が多くなった 2.0でマージしたときにsrcの顔枠がくっきりするんだが、どの設定をいじればいいいんだ?
単純に学習不足? gifコラ作ること考えたら超お手軽ツールだよね(´・ω・`) DFLcolabで任意のver使えるようにならないかな merged to mov lossless からダヴィンチリゾルブで調整やっている人いる? 2.0はまだ模索段階だから今すぐ飛びつかなくていいって感じかな 色の水増し機能があったのはどのバージョンだったかわかる人いる?
どうしても顔色が合わないので水増し試してみたいと思う。 日テレでフェイク動画講座やってたよ
GANって結構最先端な機能だったのね もうDFLスレは死んだよ
目新しい技術もないし、議論もない fanseg無くなってから新しいバージョンに移行できないな
今のバージョンで満足行くもの作れてるから問題ないし 何事も扱う側のレベルが低いと正しい評価はされない
なんであれをこうしないんだとかおれもよく思ったもんだけど
作者の方がよく考えてるって気付かされる マシンスペックが足りなくてなあ
RTX30xxも控えてるから今買いかえるわけにもっていう 乃木専の僕的には眉間V字カットが一番の技術革新ポイントや! 乃木じゃなくても眉間っていらないよね
俺もだいぶ前から切ってるけど特に問題ない LandmarksProcessor.pyを弄ってV字カットしたdebug作れたし、convert時にmask_modeをdstにすればそのdebugでmergeできるんだけど、
未カットsrc、dst、modelでそれをやる方法ってない?今あるのをextractしなおす以外に方法ない?
最近復活して、今更V字カットを知ったんだけど、今までのをまたextractするのはきつい… >>134
iperovの案件とソース読めってノリだから一般人には厳しかったけど
Ver2チュートリアル板で疑問はほぼ解説されてる。
結局オーバレイかよって思ったけど 坂道系ほぼ前髪固定で3800kだけど眉間も消えるようになったしどうゆう原理か常に隠れてる側の眉毛もある程度反映されるようになった すまぬ
一度編集したdstのマスクを全部リセットするのってどうやってやるのですか(´・ω・`)? >>147
5.XSeg) data_dst mask for XSeg trainer - remove.bat
以外でってこと? 2ヶ月ぶりぐらいにソフト更新したらなんかtrain速くなってるな もしかして1660Tiの6GBってdfl2.0環境では全くスペック足りてない?
1.0だとSAEHDで動いてたのに2.0のSAEHDではバッチ2、ほか最低限動作するレベルまで落としてもメモリエラーで始まりもしない
おとなしく前のに戻るか、Quickとやらがどんなもんなのか試してみるか… 同じグラボ持ってないから分からないけどアーキテクチャ次第では動くかもしれない
dfhd選んでるようだったらdfとか他のにするといいかな
既にそうだったら無理かも
Quickはお試し用だからそれなら1.0使っておいたほうがいい Xsagって、自分でマスク指定しないといけないの? このところのレベル低下すげえな。github読んでから来いよ… さあここからレベルの高い書き込みのオンパレードだぞー! 情報欲しいのは商売してる業者と糖質と素人だろ
こいつらにやる情報はねえから絶対書かねえからな っと言いつつ気になって仕方が無いチョン共
いちいちこっち見んなってw xsegめんどくさそうだから0307でやってるけど何一つ不満ないわ ぶっかけものって作れないのでしょうか?
作ろうとしたけど顔にかかると精子だけ消える、学習不足?
外人が作った動画見たことあるから作れると思うんだけど
誰か教えて 濃い目のところをひたすらxsegでマスクして作ったことある。そこそこの出来だったけど労力半端なかった。 face style power を入れれば再現されたりしないのかな?
自分は十分学習が進んだ段階でface style power入れて回したらモデル崩壊したんで、実験する気にもならんけど >>162
自己レス
すまんモデル崩壊したのは、true face powerを入れた時だった 過去スレ見たけど
明暗閾値以下をRGB0.0.0に変更これどうゆうことですか?
白いとこ以外を黒くするの?
誰か教えてください 自分のやり方は例のアルファPng吐き+Aviutlマージだから
Dstの残したい汁部分にマスク乗せるだけなんで、汁もゲロも普通に作ってる。 dstのフェイスセットをコピーしてsrc側に放り込んである程度trainしてから
本来のsrcに入れ替えるんじゃなかったっけ 例のアルファPng吐きどうゆうことですか?
かけこら作るのが一番簡単かな? しょうがないな。教えてやるか。
まず、自分が大量の精液をグリーンスクリーンにぶっかける。
その映像を録画しsrcとコラージュする。
まさに自分が〇〇の顔に大量写生している動画の完成だ!
ただ、ポイントは一人で大量の精液を写生できるかだ。
俺は自信があるが。 dstでいいもん見つけたんだけど
えらがすごいんよ。(笑ったらアンパ〇マン)
何とかならん? 動画編集とか透明化調べてたけど
168の方法でよかったのか SAEHDあたりから更新してないんだが
何が凄いんだい? xsegで違和感なくキレイに作れるようになるけどfansegより似るわけでもない 解説サイトの写真にあるDFとDFHDの違いが判らん。
特に精細になっている感じもしない。
解像度が上がるわけではないのこれ? SAEHDでhdが廃止されて、uhdは名前が-uに変更されたとか、この辺のネーミングついて行けない
-udで速度が倍速になるというのは気になる 最新のグラボに付いてるTensor Coreってアプリで未対応?
ディープラーニング専用っぽいから期待してるんだけど。 0627が出てた
extractの顔の最大数を指定できるようになったのは良いな そう
今までメイン以外の背景とかひな壇とかワイプとかの人も全部拾って遅くなってたけど
これがちょっと早くなる それはいいね 本命が01でミスが00とかだとデバッグも面倒だったし 0628使ってみた src抽出のみ↑が使えるみたい。なぜdstは省くのか
liaechメインなので、0307のextractorと交換したものの動かず… dstもsrcも同じ機能を使ってるから、バッチファイルいじればdstでも動くと思うよ >>188
d
py弄ってダメそうだったから諦めてたが、5)extract dstを右クリ編集で開いて「--max-faces-from-image 0 ^」の行を消したらイケた
src作る時もdebugの使い易さからextract dstしか使って無かったので非常に助かる ディズニーはこれで何をしようとしてるんだ(´・ω・`)? ディズニーはメリット大きいでしょ。
ゴーストライターならぬゴースト俳優みたいな事も出来るし、
過去の俳優を映画に使ったりもできるし。
古い話だけど、ロボコップみたいなのなら、顔以外はCGでもいい。
ディズニーランドのアトラクションで「自分の家族が捕まった」とか、
配信動画(ゲーム?)の登場人物に視聴者を混ぜるとかも簡単。 愛・地球博かなんかのときにアトラクションに入場した人の顔をCG化して映像の中に登場させるみたいなやつあったな 0628のextractでmax1でやったら、男優の顔の枚数が60%位になってmanual祭りになった… 別に有能になったわけじゃないしな
maxは2ぐらいでいいと思う 前も書いたけど乃木坂やっててぬいぐるみの犬がextractされたときはほっこりしたお DFL2.0でmergeするときにinteractive mergerを選択すると、
キーボード配列が表示されたMergerのウィンドウは立ち上がるものの、
プレビューウィンドウのようなものは表示されず、キーも何を押しても効かないのですが、
解決方法がわかる方はいらっしゃいますでしょうか。 >>197
キーボードの画面がアクティブの時にtabを押すってインターネッツで見た >198
マジ天才。
この度は誠にありがとうございます。 最近地上波のバラエティ番組とかでもdeepfakeを使った企画とかやってるね
あんまり世の中に浸透させるような技術じゃないと思うけど GOOGLEが提供してるTPUってやつもDFLに応用できるんだよね。
異次元の推論能力試してみたい。
だれか使えるようにしてくれ。 モザイク除去でいいの知ってる人いる?
ネットで検索したら
https://twitter.com/Ohsaworks
これしか出てこなかった
画像見たけどこれフェイクに見えるし
いいの知ってる人いたら教えて
https://twitter.com/5chan_nel (5ch newer account) extractって昔のバージョンだと完全手動じゃなかったっけ。今触ったらマニュアルでも半自動なんだな。
完全手動出よかったのに。 >>207
いや悪気もなくそのままなんだけど、冗談きついぜ。 本気で言っててアドバイスになってると思ってるのならアホ
だたおちょくろうと思って書いてたらやっぱりアホ >>209
まあ、普通に公開されているのに見つけられもしないアホよりアホという。英語で検索せーよ。 そもそも256のmodelって書き方だけじゃどーにもならんよ 画質向上という意味なら 4.2) data_src util faceset enhanceでenhanceしたらいいんじゃない? >205~214
でもまぁ英語ってことは外人ばっかりってことだよねぇ >>219
いや、英語でええやん。普通に教育受けていれば、なんも問題ないで。 モザイクとちんこまんこを顔認証同様してくれる機能ができれば
あとは学習するだけで余裕でモザイク破壊できるのに(実際には架空の物に入れ替え)
日本だと超需要だけど、開発するあちら側の人はモザイク問題抱えてないのがな 過去スレではお世話になりました
笛動画ばかり作ってましたが結局口元だけ
dst側を透過させるのがクオリティ高くなりますね
本人度は下がるけどベロのリアルさ優先 ぼくはヘラチオ用に下唇だけランドマーク外してextractするようにしたよ!
アゴから下唇が台形にマスクされるんだ!
まだ1回しか試してないけど、src-dstの組み合わせが悪かったのか全然似なかったが^^; 適当にFanzaのスクリーンショットとかでフェラの画像集めてきてX-segの手動て設定 したのを集めたフォルダとdstフォルダを参照してX-segまわせばいいと思うけど
失敗したやつは手動で指定してFanzaの方のフォルダに混ぜて次のdst用に流用
モザイクも四角に合わせて手動マスクすれば綺麗に処理できるし、ぶっかけとかもある程度の濃さがまでは問題ない
今のところ手動の方の枚数が200枚くらいになって150万回くらい回したX-Segモデル使ってるけど新しく手動でマスクすることはほぼ無くなった >>226
alignedから該当ファイル削除すれば?
モノが無けりゃ学習も合成もしようがないし
必要性がわかんないけど検出自体なかったことにしたいならaligned_debugからも消してから手動検出起動してスペースキーでスキップすればランドマークなしの_debugファイルが出力されるでしょ >>228
LandmarksProcessor.pyをカスタムして書き換えれば
landmarkを外せると思います
68ランドマークの番号のどこからどこまでが下唇相当か調べるとかして
それやってみたけど、大きくMaskを外す感じで、肌色が合わなかったりしました 眉間V字カットver.を前にここでもらったので、それとオリジナルのlandmark processorファイルを比較して差分を調べ、同じ要領で下唇以下のlandmark番号を消してみた(外出先なのでファイル内のどの箇所かは今わからん、スマソ)
10枚くらいでextractしてdebugフォルダのmaskの形を見ながらどのlandmarkを外すか調整した
landmarkとmaskの関係が独特な動きなので最初わけわかんなかったけど何回も試して習得した
プログラムひとつも書けないけどエロのために頑張ってやってみたよ! 下唇はたしか48-65?か68?とかだった気が
顔にlandmark番号を振ってある画像があるので、それ見ながらやれば、landmarkの位置と番号の照合は大変ではない >>234
眉間V字カットverって、すごく使えそうですね
よろしければ上げていただけないでしょうか? 舌は全maskしても反映されない事けっこうあるからな… ワッチョイ無しの方は日記が単発で荒らすから地獄になってんな 今荒らしてるのは日記じゃなくて、何書いても日記日記と連呼するやつだな
そのせいで誰も書かなくなった 眉間カットはLandmarkProcessorの
parts = [r_jaw, l_jaw, r_cheek, l_cheek, nose_ridge, r_eye, l_eye, nose]
からnose_ridge消して再extractすればいけるんじゃない >>225
古いの使ってたから知らなかった
dst側のチ◯コと口とベロを自動でマスクするように
学習させるとか…凄ぇなこれ 初心者すぎる質問で申し訳ない
自分で作りたいと思ったんだけど何からすればいいのか分からない
とりあえずテンプレにのってるDeepfakeLabを入れればいいのかな?
使い方とかあれば見てみたいんだけど英語のサイトで完璧に理解出来る気がしないから日本語版あったら教えて欲しい 話題無いねdstがメガネの場合
X-segでメガネをマスクdst×dstで目線を学習
dst×srcに入れ替えで上手く出来ました ワッチョイ無しのスレに変なの沸いてて困った件。寝起きなのに、自作自演と言われるし。日記野郎なのかなあ。 rtx 3090使おうがゴミやからな
もっと、精度高くて現実と見違えるレベルになるには何倍の性能が必要なんや?
つか、顔スワップは元の体型との兼ね合いもあるから微妙
fakenudeで服剥ぎ取ったやつの方がいいのか? ハードだけ進化してもソフトが進化しないと無意味だよね >>252
論文を追いかけて自分で俺様仕様に改造するこったな deep learningの学習速度ってグラボスペックのどこを見ればいいの?
CUDAコア数?
メモリクロック? 0802バージョンでGAN回してると変に崩れていかないか?
0704に戻してみた。 google colab使ってみたが、むっちゃ遅いぞこれ
T4が割り当てられたがこんなもんなんかな
課金もしてみたが変わらんかった trainのdimensionsの値っていじるとどういう変化が出るんですか?
配布されてるmodelはデフォルトと違うみたいなんですが、解説サイトみるといじる必要ないって書かれているので 「ディープフェイク職人」逮捕 AVの顔すり替えた容疑
アダルトビデオ(AV)の出演者の顔を芸能人とすり替えた動画をインターネット上にアップしたなどとして、
警視庁と千葉県警は、男2人を名誉毀損(きそん)と著作権法違反の疑いで逮捕し、2日発表した。
こうした動画は「ディープフェイク」といわれ、ネット上にあふれているが、未然に防ぐ手立てがないのが実情だ。
立件は全国初という。
これどこでなにしたら逮捕されるの? 全部自分で書いてるじゃん
アホなの?
アダルトビデオ(AV)の出演者の顔を芸能人とすり替えた動画をインターネット上にアップしたなど
名誉毀損(きそん)と著作権法違反 >>262
有料公開を優先的に逮捕してるっぽいじゃん
無料公開とか無料でも広告付いてるとかいろいろあるからさー
やってるやついっぱいいるから見せしめ逮捕なんだろけど このスレの住民の大多数は自己満足して終わりだろうし心配ないでしょ
ネット公開したら著作権でまず引っかかるだろうしそのついでに見せしめとかじゃないの? だれか3080か3090のレビューしてくれんかのう
2080の倍速くらいになるんかねぇ DFLつこてみようかと思って学習バッチ起動したけど、setenv.batがねーんだけど、最初から入ってないんだけどもこれは自分でつくらなあかんの? >267
回答さんきゅ
どうやらDLに失敗してたのか最新の物には入ってないのかよくわからんのだけど、一個前の奴落したら入っておりもうした!
あんがとね! 先週くらいからはじめました
初歩的な質問だけど
srcは1人固定、ソースも手持ち以上は増えないという俺の場合は
dstをコロコロ変えても同じモデル(src)でずっとtrain回してていいんよね?
dstが新しくてもsrcの学習が進んでればそんなに回さなくてもいい、
という理解で合ってますか? src供給元としてインスタライブはなかなかいいですね >>270
質問スレなんてどこにあるの?
素材は知ってる deepfake作れるPC組みたいんだけど、
RYZENとRADEONは向いてない?
coreシリーズとGeforceの方が良いかな? DFL2.0はRADEONサポートしてないからグラボはGeForceの方がいいんじゃないかな
CPUはどっちでも大丈夫 >>273
vram普通に6G以上使うから
8G以上のGeForceがお薦め。 1060の6GBとかもう古本くらいの値段で売ってるからその辺から始めてはどうかと思う
そこから欲をかくほどコスパ悪くなるから職人レベルに行くかどうかを自分で判断するわけだ >>274
>>275
教えてくれてありがとう!
参考にして新しいPC作ります。
本当にありがとう。 extract とかmergeのデフォルト設定って変えられないですか?
GPUの選択とか必要ないしマスクもXsegしか使わないんで、毎回変更するのが
面倒で >>280
俺はソースを書き換えて使ってるけど、多少知識がないと難しいかもね DFLが対応してるGPUで最高性能なのってどれだろう お試し程度でやってみたい場合、1番安いのは今でも1060の6gでOK? これやりたい放題やん。
超絶低画質でもリアルタイム高画質&角度変更できる。
同僚の低画質Zoomとっとかないと。
ttps://www.youtube.com/watch?v=NqmMnjJ6GEg&feature=emb_logo >>286
OK
ただしかなり画質面で妥協が必要
ちょっと欲張ると学習をスタートすらしない そうなのね。やはりマトモに動かそうとすると8GB必要?そうなると急に高くなるよね 6で 何なら別に4でも動くけどそれはもともと持ってる人が試すっていう感じ
今から買うなら8〜 自分2060の6Gだけど前に試した時は始まりすらしなかった
最近更新されたソフトなら動くんかな 似てるか似てないかは集めた素材でほぼきまる
そして素材の良しあしは128ピクセルの4バッチ
で十分確認できる。
6gもあればたぶん動くはず・・・ 個人的には、素材作りにエンコードを多用するから多コアCPUがあった方がいいと思う ていうか基本的な操作がわからん上にわかりやすく解説してもくれないサイトばかり 3080、旧のopenCL対応版なら動くんだけど2.0のCudaのほうが速いのかな?
自分じゃ2.0動くグラボ無いんでわからん… 参考になるかわからんが2.0で2080ti使うと
res128×4bacthでtrainすると0.3〜0.4msで回る 160×12で0.6〜0.7msくらい
192まであげると設定次第だけど10バッチで0.8前後
それ以上バッチあげると始まらない まだよく分からないんでとりあえず1.0のh126でtrain、バッチ4(Vram消費9G)にした以外はデフォのままで0.28msぐらいだったかな
挙げてもらった設定がh126と比較してどうなのかはわからないけど
openCLだからめっちゃ遅くなるってわけでもなさそうなのかな?
Cuda11対応版とかでるんだろうか… 3000シリーズは対応版が新しく作られないと使えないな。
3090でやってみたけど、30分放置してもtrain始まらなかった。 >>295
3080しか持ってないってこと?
いずれにしても教えてくれてありがとう
2.0+1070tiと旧CL+3080どっちが早いか比較してみる これやっぱり玄人は正面DFで横顔はLIAEで、とか分けてtrainして動画にする時に統合とかやってんのかね そこまでするほどLIAEの正面は下手じゃないと思う 因みに、OpenCLってのは構造的にCUDAの4.5倍ほど遅い。
中間ソースの随時コンパイルが発生するから。
但しこれはDFL1.0での比較で、2.0ではOpenCL考慮不要になったことで、もっと速い。
尚、DFL1.0でも最終版は素のH/DF/lea(しか試してない)だと、コンバータでブレが発生するんで、
抽出は1.0最終版(精度が高いが遅い)、Trainとコンバートは12月版がオススメ。
あと初心者でRadeあるんなら、数千円のRX470だとめっちゃ遅いが8GB+メインメモリ全部使えるんで
128系だとBatch32以上で走る。きっちり整理した素材(SRC/DST共に3000枚程度)なら
一晩で0.1まで下がるんで、充分実用になるよ。
今7万枚のをコンバート中なんで、ちょっと書いてみました。 >>304
暇そうだからdflのバージョンとcpuとグラボのスペック、コンバートの1フレームあたりにかかる時間教えてくれさい 初挑戦でいきなりVR動画やってみたけど普通に立体視差ある動画になるんですね
当然と言えば当然だけど >304
1.0の最終版はダウンロードできましたが、12月版はありませんでした。
まだ落とせる場所があるのなら教えてもらえませんか? どなたか基本的な使い方教えてくれませんか?
インストールと起動は無事できました
Coreの移し替えもできました GoogleDriveの歴代Ver一覧だけリンク残ってるけど、ダウンロード始まらないなぁ。
自分の場合めっちゃ昔の抽出素材混じってるからコンバート時にブレるんかも。
一番問題起きないのは20191107だけど、ExtractやAI高画質化(enhance)は最終版必須だし
手でソースイジって直す様な細かいパラ(画像圧縮等)は、1.0が全て最適設定になってるので
イチから通しで作る新規参入組は、1.0最終版でも良いと思うよ。 今から始めたいのですが
DeepFaceLab_NVIDIA_build_05_06_2020
ソフトはこれで始められますか? >>304
そもそもDFL1.0って何?
DeepFaceLab_NVIDIA_build_05_06_2020
とは違うの? >>314
1.0は昔のバージョン
nvidia1000番台以降のグラボなら2.0でやる >>315
RTX2060 6GBです
2.0から始めて大丈夫ですか?
あと参考になるサイトとかあります? >>317
ありがとう
リンク先の一番下
DeepFaceLab_NVIDIA_build_05_06_2020.exe
が安定版ですか? >>318
安定版とか無い
最新は08_02のやつ スムーズに顔交換できるのはどんな動画がいいですか?
交換する側もされる側も知りたいです エロいの前提で話すなら痴女ものの手コキのシーンが一番楽
dstの顔が基本正面で動きが少なくて表情も笑顔寄り
srcも正面で笑顔のなら集めやすい
AI側も顔認識しやすい >>320
DeepFaceLab 2.0のダウンロード
https://drive.google.com/drive/folders/1UU910EHpGTexhU0dR2Ya2TCcnPGWpdT-
DeepFaceLab_NVIDIA_build_05_06_2020.exe
リンク先のグーグルドライブには「05_06_2020」とあるけど
最新は08_02のやつはどこにあるの? >>323
なんでも動くからとりあえず今のでやってみなよ。
そんな調子で聞いてたらスレが埋まっちまうよ。
309のサイトを一通り読んでからまた来な。 >>321
双方とも、デコ出し触覚無しだとExtractのミスもほぼ無くて学習もコンバートも速い。
あと色合わせも苦労しない。SRCは時代劇がオススメ。
DSTで合うのを見つけるのは熟練工でも結構むずいんで、とりあえず小顔でデコ発達してる奴。
基本芸能人は顔が極端に小さくデコが発達してる。っでこれがAV女優では稀。
っま慣れたらイラマやら難しいのにチャレンジしたり、声変換に走ったり、エロの事なんか忘れるけどな。 ググって最初にでてくるgithubとかに行って
Windowsと書いてる所に行けばある 0820ver 1050tiでチマチマ頑張ってきたがもう無理か
colab >322 >325
ありがとうございます
ちなみにdeepfacelabにログインできないのですが、今バグ起きてますか? >>329
そんなので頑張れるんだ。
俺の1050でも作れるのか? >>327
ありがとう!ありました
どうせやるなら最新版の方がいいですよね ver2.0でsrcの素材を解像度で4倍、数で3倍くらいに増やしたらトレインをスタートはするものの数十分するとリタイヤします。
やはりsrcが重くなったせいでしょうか? 少数でいいから解像度下げたsrcを用意して動くか試してみればいいんじゃないの
そもそもtrainで設定する解像度以上のものを用意しても意味がない 試行錯誤しながら1週間程faceswapやってみたんだが行き詰った。
train時に変換元の顔画像300枚程でチマチマやっててプレビュー画像にどうも違和感があるから
4000枚に増やしたらCPU100%に張り付いて、GPUが5%も行かない状態になってしまった。
その状態で300枚に戻そうが、全く別の画像(変換元/変換先ともに)に差し替えようが
再インストールしようが、バッチ数下げようが、ずっとCPU100%のままでtrainの反復が10分以上になってしまった。。
DFLで1からやり直し中。
faceswapはググっても記事少ないね。 1080から3080に変えてみた。
train550msくらいだったのが240msくらいになったむっちゃ速い! いや、
ちょうど今日、有志の方が30シリーズで動くもの、暫定的に公開してくれたみたい 現行は対応してないはず
開発スレに対応版らしきものが上がってるけど
もしかしてそれ? >>340
やっぱそうか。
俺も試してみる。
DFLのためだけに3080買ってタンスの肥やしになってたから助かるよ。 CudaとCUDNNってやつの開発者向けライブラリ、インストールしないとダメだった >>343
クレクレですまんが
リンクとか貼ってもらえないかな?
インストールできるかわからんけど・・ というか3080とか一般人がそんなポンポン買うものなの?
コスパ悪いしゲームするにもオーバースペックだろ やっぱ普通にインストールexeとかあるわけじゃなさそうね・・・
>>345
ゲームやってるより楽しいし、
機械学習的にはコスパいいんじゃないの。
本命は3090になるだろうが。 有志の方の公開はこの掲示板の下の方に、配布してるMEGAのリンクあるね
https://github.com/iperov/DeepFaceLab/issues/906
Cudaのインストーラは普段NvidiaグラボのドライバーをDLしてるページの直ぐ横のタブ[開発者]→[cuda]から入手可能
CUDNNは検索したら直ぐでてきたけど以下から
https://developer.nvidia.com/cudnn
バージョンは最新の11.1でWindos x86のものを。
途中でアカウントの作成を促されたけど、ゲーム向けのやつでログインできた
CUDNNはzip解凍でライブラリ類だけ
Cudaをインストールした際に作られたフォルダの同じ階層にライブラリ類をコピーしたらDFL、無事起動できた コスパ考えたらそもそも機械学習が……
いずれゲームも3080クラス必要になるだろうし、
電気代と自分の時間を節約出来ると考えれば
10万出す人もいるってこった。 >>347
これからやってみるけど、まじでサンキュー すみません、DFL対応で最速GPUって結局どれですか>_< colabはTeslaP100で回るらしいけど個人でスパコン組めばV100×4とかで回せるんか >>347
なんかエラーでるなぁ
Cudaをインストールした時に作られるフォルダって
C:\Users\xxxx\AppData\Local\Temp\CUDA であってるよねぇ
CUDAフォルダの下にcuda フォルダを入れるんだよね。 >>354
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1
の方ですね >>355
動いた!ありがとう!
速度はこんな感じ。まぁまぁ。満足
1070ti 3080
256*4bacth 610ms 330ms
192*8bacth 630ms 340ms
どちらも1.85倍だけどそれ以上に目鼻立ちの生成が早い気がするが
それは気のせいだろうか・・? >>356
おめでとう
自分はまだ、スクラッチから本格的にtrainしてないので違いはわからないけど
3090にしたので今まで以上に高batchで動かせるので目線合わせ優先オプションとかで早く効果がでるかとか期待してます
そのほかNvidiaライブライブ側の改良で高効率化の可能性もあるかもしれないですね 3090クッソ速くて草
タスクマネージャー読みでVRAM20GB使うような学習でこの速度はすごい
https://i.imgur.com/8aRfjAG.jpg ヴォースゲー
使用率は100%近くに張り付いたまま?それとも余力ある感じ? すげぇなあ
こんなけ早かったら学習見てるのも楽しそうだ いいなあRTX3090
しかし、やっぱり昔より要求されるVRAMが高くなってるっぽいな
解像度160のバッチ8でも20GBかよ いや、VRAMに余裕があるので先行して余分にメモリ確保されているような動きでは?
もう少しbatchを上げても20GBから変わらないはず
あと、最新の-ud付きのarchiなら少メモリ・高性能になるんじゃないかな?
それともdimsを上げてるからいっぱいいっぱい? 3080の10Gじゃ足りん・・・
どうせ夜中にまわすからメインメモリ使わせようかな
OCメモリとか使ったら速くなるのかな >>366
俺も感じてる。
場合によっては元々使ってた
1070ti*2 16MBの方が使い勝手良い。
あと、顔抽出がめっちゃ遅い。
CPUが使われてる? Gefoの人、メインメモリ流用したらどれぐらい遅くなりますか?
うちradeの8Gなんで買い換えようと思ってるんですが、メインメモリ13G程度流用して
現状256でバッチ8、128でバッチ32で回るんで、あんま不自由なくて躊躇してます。
ちな、上で張ってくれてる3090が160バッチ8で400msっての
当然ぶっちぎりでウチの16倍ぐらい速度出て羨ましい限りですが、
逆に4千円のRXと23万の3090でもその程度の差なのかっとも感じてます。 >>367
テスト程度でしか触ってないんでうろ覚えだけど顔抽出時全スレッド100%で動いてたから
3000対応版はCPU動作になってるのかも。3000非対応のほうもGPU指定してもCPUになってた気がする
メインメモリ利用時もこれまたうろ覚えだけどVramより3〜4倍かかってたような? 少し前に3080のメモリだけ増やしたバージョンが出るかもって記事みたけど。あれはデマだったんだろうか。すごくメモリがほしいがさすがに3090はなぁ。 >>368
6400msとか俺は絶対無理だわ・・・
1.0から2.0にするだけでもかなり早くなるから
安物のgefo買った方がいいと思うが。 >>370
メインメモリ流用はCudaの速度の利点がスポイルされるんで、Gefoではイマイチですね。
RadeはOpenCLの遅さのせいで、VRAM8Gでバッチ16と
メインメモリ共用のバッチ32では1.8倍遅い程度なんで、並行学習数も相まって効果的なんですが。
>>372
1学習6秒前半ってのは最速時で、調子悪いと7秒掛かりますwっが、元々CPUで試してたモンで。
っま、おかげでデータ整理の技が磨かれて、24時間も回せばLoss0.1切りまで下げられるほどに。
因みにちょっと調べたんですが、ディープラーニング界隈でのイテレーションってのは
データセット一巡で1Iterって表現になるらしく、データ数 / (1学習×Batch数) = 1イテレーション、
例えば3200データ/バッチ32=100よって、1イテレーション=100Iter(学習)ってことらしいっす。
しらんけど。 >>373
データ数増やしてもイテレーション時間
は変わんないから違うんじゃないかなぁ・・・
1学習7秒なら1か月くらいかかりそうだが、
それが24時間で終わるってのは不思議だな。
実際できるなら確かに買い替えは不要だ。 >>374
ちょっとわかりにくい書き方になってたので補足を。
Train中のCMD画面やプレビュー画面に出てくる「Iter」ってのは、あくまでも1データの学習✕バッチ数で
これを所謂「1イテレーション」と言うべきじゃ無いのでは?って話です。
あと24時間でギンギンになる件、1.0のDF128でバッチ数32以上だと素でかなり仕上がり速いのと
髪の毛・障害物・ブレ・ズレ・連続性欠如が学習遅くなるので、学習データ収集とランドマーク修正を徹底します。
まぁ普通の事だけど、昔は2週間回してもボケてたのに、同じ元ネタを再整理・エンハンスして回したら
1日で0.092になってたんで、やっぱデータ整理が最重要ですね。
っまムダな努力と時間の浪費だし、ランドマークで腱鞘炎になったんで買い替えますが、
まだテンソルコア未対応なんですよね・・ >>375
なるほど。
どっちにしろ金に困ってないなら
買うた方がええね。 今は良くても夏場はどうする気なんだろ
100%フル稼働なんだろ? 3000対応版、train始めて数分したら落ちるなぁ
さらには1.のopenCL版もエラーでるようになってしまった >>360
この学習のmerge画面だけど、mergeもめっちゃ早くなってる。13it/sとか初めて見たわ マージはそんなにGPU使ってなかった気もするけど
使用率はどんなもんなんだろう? GPUもCPUもトレインは全力なのに,、マージは余力たっぷりでサボってるよな
最後まで気を抜かないで仕事をしてほしい 久々に先週から、石○ゆ○子と仲○由○恵と赤○珠○とホ○ン○秋
作ってたら、なんか急激に飽きてきた・・今、熟女系にハマってるんですが
最近気付いたんだけど、モデルデータ流用時にData.datは新規にして、
エンコーダとデコーダだけ流用するほうが学習が速いですよね。
何故なのか理由分かる人います? dstデータのdebugフォルダを確認した時に、顔の認識がおかしな事になっている部分ってそのまま学習させて行っても顔を正しく認識するようにはならないですか?
髪の毛や顔の角度のせいで顔と認識出来なかったり、手とか背景のせいで顔ではない部分が口とかとして認識されてしまっていたりする部分です。 >>386
debugフォルダ内の認識していない画像を削除して、
「5) data_dst faceset MANUAL RE-EXTRACT DELETED ALIGNED_DEBUG.bat」を実行。手動で抽出。
そういうことじゃなくて? ttps://gazlog.hatenablog.jp/entry/20gbrtx308016gbrtx3070cancelled
メモリ倍増モデル発売延期。
これショック。 >>387
ありがとうございます!
手動で認識し直しできました。
まだ障害物の多いシーンや顔半分隠れてたりすると認識させれなかったりしますが誤認に関してはある程度対応できそうです。 3080で使うにはgithubの3000対応版とcudatoolkit11.1、11.1用のcuDNNだけでいいのかな?
python入れたり、そこからなにかインストールとかいらないんだろか result.mp4まで作れた後、追加の遊び方としてこれはどうだろう?
1. data_dst\aligned内の正方形jpgを連結してdata_dst.mp4(2)を作る。抜けてる番号のは真っ黒なjpgで代用する
2. data_dst.mp4(2)から顔抽出してdata_dst\aligned(2)を準備する
3. 既に学習済みのmodelを使って(2)をmergeしresult.mp4(2)を作る
4. 常に顔どアップな(2)をそのまま楽しむのもいいが、普通に16:9で作った(1)の右上にワイプとして(2)に埋め込む (要動画編集ソフト) >>391
要らない、ホントにかいてることだけでいけた。 >>392
いまいち状況がわかってないが、resultから顔抽出して動画にするのと何か違うん? >>394
mergeするときのdata_dst\alinged\のjpg群は
同じく
mergeするときのdata_dst\の母体画像から抽出したものでないと上手くmergeできないですよね
jpg側に母体画像のどこの座標から切り取ったかの情報が埋め込まれているはず
なので1回目の成果物から顔アップのFAKE動画を作ろうとなると上のようになるかと
まだ構想段階なので間違ってるかもですが >>394
ごめんなさい
再mergeすらいらないんじゃない?
という意味では、ある意味そうですが、
例えばRes448で学習させたものを、1回目のmergeで大き過ぎたり小さ過ぎたりな顔で出力したresult.mp4の映像を再利用するよりかは
512x512で均等な顔の大きさで作ったdata_dst.mp4(2)から2回目のmergeをした方が、高品質な顔アップFAKE動画が作れるかな、という期待です >>396
成果物としてはDSの脳トレにでてくる
顔だけのオッサンみたいなものかい?
そもそもFAKEになってるのかそれはw
一回作って揚げてみせてくれと言いたいところだが
共有できんのが痛いな。 >>397
そうですね
アルファマスクを活用すればその脳トレおじさん風にもできそうですね
共有はできないですが上手くワイプ化できれば見栄えは良くなりそうです そういえばだれか教えてほしいけど。
fake動画の題材にしてもいい人っているんかな?
(もちろんヌードなし真面目な内容で)
トランプとかプーチンとかが何の遠慮もなく使われてるけど
あれも大丈夫なんかな。 ちなみに、
脳トレおじさん状態にして、音声を著作権フリーにしたFAKE動画は法に問われるか?
が興味深いw 既に鬼籍に入った人を題材にした場合はどうなるの?家族とかに訴えられる? ソースコードいじれる方でしたら
通常のmerge処理のついでに、顔アップ版のmerge画像を出力させること、難しくは無さそうですね >>393
ありがとー。でもやってみたけどtrain始めてしばらくしたらsysnc errorみたいなの吐いて落ちる。
環境かなぁ 1.0のopenCLなら問題ないからこっちで頑張るか… >>404
train自体は始まるけど暫くしたら落ちる感じ?
設定を軽量にしても落ちるなら原因わからんね。
そもそも始まらないならインストールの手順がおかしいかもと思うけど。 >>405
Quick96もSHADEも始まるものの数分で止まりますね。Vramも余裕あるけど
エラー吐いて止まるっていう。やっぱ環境すかねぇ…
1.0使いながら正式対応版期待してまっときますw 同僚とか近くのコンビニの店員で作りたいけど写真手に入れるハードルが高すぎる
ばれたらえらいことやから盗撮は出来んし‥ 顔認証システムのAIを作ってるエンジニアです
1万円支払うので協力願えませんか?
色んな角度から動画撮影を行いますが他では使いません! 一万で手に入るなら払うけど怪しすぎるわwww
snsとかやってたら簡単に手に入るんだろうけどなぁ
あと10年もしたら卒アルから作れるようになったりしてな
法律が進んでディープフェイク作成ソフトの公開が違法になるかもしらんが 10万回以上回したモデル流用して、正面に限るけどね
正面だけならほぼ問題ないぞ 友達の結婚式のコメントを集めてるけど
友達が少ないから友達のフリをしてコメント動画を撮らせて下さい
お願いしますっ!!┏〇
台本考えて3パターンくらい撮らせてもらえば尺もクリア 自分用でシーン集められるなら別に正面だけでもいいしな 前出のRadeの者ですが、2.0でお聞きしたい事がもう一点あります。
コンバート時の色合わせって、現バージョンでは何か進展してますか?
1.0のクローズまで色々オプションパラが追加されたけど、どれも使いもんにならず、
結局は初代のOverlay&rctが一番マシって状況が続いてました。
(idtだと一番マシなOverlayでも、極端なダイナミックレンジで白飛び・黒飛びが出るし、
HistmachやSeamlessを使用すると、erodeやBlurで範囲拡張する場合、周辺の色が交じる上
障害物があるとFan-X使っても混じってしまい完全に破綻するし、常に色が暴れる)
Overlay&rctではカラーレンジが狭く、逆光や片側光源では陰影が一致せず、
アルファ吐きで動画編集ソフト上にて手動補正でなんとか色・陰影合わせするしか無いけど
一番仕上がりがマトモって状況が続いてました。
均一光源のDst使えば良いんですが、そういう映像だからFake動画がつまらん絵になるワケで
美しい印影の動画で作ると、かなりエロい高級なのが出来るんです。
っつーワケで、最新版での色・陰影合わせ・色ブレ対策はどんな感じになってます? >>417
してる、ただメモリが倍になるだけで
trainが早くはならないので注意。
(でもface extractは倍速になるので
結構気に入ってる) >>398
普通にmergeする時にmodeをraw-predictにすれば近いものは作れますね
train時のプレビューが出力されるみたいでdstの背景は反映されませんけど >>420
ありがとうございます
実はソースをいじり始めいて、確かにrawモードってやつだと背景をmergeせずに、学習した顔だけ出力しているようでした
Pythonは未経験でしたが、前後のソースを参考にmergeのコア処理後の顔アップ画像が保存できるようになり、ワイプ化(ここは動画編集ソフトで)できました ちなみに
この手法で顔アップ動画をつくると、現状の顔抽出ツールの不連続さから、かなり動きがカクツクのですが、連結した後の動画を手ブレ補正系の変換を強く効かせたところ、かなり滑らかなものにできました 質問です
dstの輪郭や目鼻口の位置を無視してsrcをそのまま被せる
もしくはそれに近い設定ってありますか? GAN上げてみたらどうかな
ただやる前にmodelのバックアップはしておいた方がいい >>423
mergeでrawを選択したらいんじゃないのかね
trainのプレビュー画面の枠全体が置き換わるはず
ただしtrainをしっかりしないと枠内の背景がモヤッとしちゃうが
的外れだったらごめんよ >>424
ありがとう
GANて解像度が上がるものだと思ってるけど。
それで顔の形変わったりしますか?
>>425
ありがとう、それもやってみます PCI-E x16スロットがグラボを認識しなくなって、
代わりにx4にさしてるんだけど
これボトルネックになるかな?
特に遅くなってる感じがしないけど。 ~pack.batみたいに無圧縮でファイルを纏められて、高速で展開できるツールってなんかないですか?
数千、数万のファイルを操作するのが地味に手間なんで >>428
.tar形式なら無圧縮なのでそこそこ早いし、フリーツールも沢山あるけど
固めたままでの中身参照はできないんじゃないかな?
自分はSSD→HDDへバックアップ保存や別PCへの転送時に使ってる >>429
ありがとうございます
試してみます
中身の参照は特に考えてなかったので問題ないです グラボのメモリが重要なのはわかったけど、2080tiと3080だとどっちのほうがいいの?
メモリとかグラボの性能での違いって時間だけで仕上がりのクオリティには影響ないの?
あとグラボ以外のスペックはどんくらいあったらいいんだろ? >>431
少なくともDFLが完全に対応したら3080のが上だと思う。
train速度はあくまでCUDAコア数に比例するからメモリ増加で直接的に早くはならない。メモリ倍なら最大バッチ数も倍になるけど、倍速には程遠いというのが所感。バッチ数はクオリティに影響するらしいけど俺は違いわからん。どっちかっていうと高解像度にしたい時にメモリがネックになるから欲しい。 >>431
CPUは6コア6スレッドの9400Fで常に100%。
RYZEN3700xで8コア16スレッドで50%くらい
6コア12スレッドくらいがちょうどいいのでは。 Google ColabのPro版契約でいつでもVRAM16GBが使えるから、trainはそっちに任せて、CPUはmergeの高速化優先でより多コアなものを、っていう選択肢もあるかな >>432サンクス
CPUは10世代i7で十分そうか
グラボが悩むなぁ‥3080tiも一部で聞くけど公式発表じゃないもんね
radeonに対応してくれたらいいのにね i9-9900kだけどtrainは25%〜30%くらい
ただmerge to mp4の時は100%に張り付いて爆音爆熱で簡易水冷でも98℃まであがるわ
RTX3000シリーズは現状コスパで3080かなあ
3070はCUDAはいいけどvRAMが足りなさそう >>436
〜.bat の中からffmpegに動画エンコードのコーディック指定するところで
コーディック名をNvidiaグラボのハードウェアエンコードを示すものに書き換えると、CPUの負荷、かなり減るはず
ビデオレートに充分余裕がある場合は仕上がりの品質に差はないんじゃないかな >>437
おおありがとうやってみます
こんなん絶対過負荷やろと思いながらやってたから助かる >>436
空冷9900KF
mergeで100%にはなるけど90度は超えない
51以上でOCしてるならmerge中はやめたほうがいいような
50で十分だし36でも対して変わりないよ
今からなら金あって待てるなら100% 3070よりは3080だね 温度上がりすぎるときって部屋はエアコンガンガンなん?真冬に窓開けててもそんな熱なったりする? >>434
colabは課金して試して見たが、V100でもめちゃ遅だったよ。すぐ切れるし使い物にならなかった。 >>441真夏にエアコンかけず1日放ったらかしでも何とかなったよ。もちろんいる間はエアコンかける。 >>442
Pro版ならうちは最低半日は連続train、可能だけどなぁ
なしかしらのPCブラウザ、立ち上げて接続を維持させておかないと切られる仕様である点はクリアしないといけないけど
夏場、外に出かける時は低電圧のタブレットPCを画面OFFの起動しっぱでColabにたんまり働いてもらった
確かにtrain速度だけなら自宅PCでやる方が速い DFLで作成しようと思い、素材等準備したんですが、最初からエラーで躓いてます
お力添えよろしくお願いします
【使用ソフト】DFL CUDA9.2SSE
【使用モデル】GeForce GTX 1060 6GB
【スペック】
【内容】' internal\setenv.bat'は内部コマンドまたは
外部コマンド操作可能なプログラムまたはバッチファイルとして
認識されていません
続行するには何かキーを押してください
というエラーが出ます
よろしくお願いします まずは同じフォルダ内にinternalってフォルダが有るかどうか確認
なければ解凍に失敗してる >>448
internalというフォルダはあります。
その中にsetenv.batは見当たりません。
とりあえずいったん全部入れなおしてみます 再インストールしたら>>447のエラーは出なくなりましたが、
input_file not found.
Done.
というエラーが出ました。
dstとscrに素材の動画放り込んでるんですが、何がいけないのでしょうか。
お力添えよろしくお願いします。 >>451
ありがとうございます
ずっとそれを見て画像も見比べながらやってるんですが・・・
Operating System: Windows 10 Home 64-bit
Card name: NVIDIA GeForce GTX 1060 6GB
Manufacturer: NVIDIA
Chip type: GeForce GTX 1060 6GB
これであればDeepFaceLabCUDA9.2SSEで合ってますよね? >>450
dstとsrcフォルダにいれるのは静止画。
動画はworkspace内にdata_dst、data_srcにリネームして入れる。
バッチファイルを実行したら自動的にフォルダが作成されて動画が静止画に分割されて保存される。
そこからさらにバッチファイル実行して顔抽出。
かなり端折って説明したから詳しい操作はググってね。 >>453
それは理解してます。
書き方が悪かったですね。正しくはdstとscr「の」素材の動画
必要なツールすべてDLして、あとはバッチを実行すれば動画から静止画を抽出
してくれてalignedに入るはず・・・なんですが実行しても
input_file not found.
Done.
で終わってしまいます
拡張子は.mp4を入れています。 素材のファイル名をちゃんと書き直してないか
extract imagesを実行してないか、かな 最初のsrcのextractをやってるとしたら、エラーの意味は
workspaceフォルダ内のdata_src.*(拡張子は何でも良い)が存在しない、という意味 ありそう
✕data_scr.mp4
○data_src.mp4
それかファイルの場所がworkspace直下じゃないか
workspaceフォルダ内のスクショ貼ってくれれば原因わかると思う 動かす前からこんな感じじゃ動いたあととんでもない質問してきそうだな ちゃんと「JUST DO IT !!」のチュートリアルからやってみようd( ̄  ̄) そろそろ荒らしか正義マンに転生する頃だ。
ところで「エラ張りAV女優」を教えて欲しい。
有益な情報をくれたらベストマッチ情報をお返しします。 どの程度のエラがいいか分からんけど
吉川あいみ
巨乳エラ 1070から3080に変えたけど明らかにはやくなったわ
部屋もあったまって丁度いい >>642
吉川あいみの若い頃ってすげぇ可愛いよねー素でそこらのタレントをぶっちぎってる。
ヒンニュー教徒の俺でも、唯一好きな巨乳ですわ。
・・っが、今回は真○よ○子とか深○絵○等の「貧乳エラ」用を探してます。 3090.300.80.30バッチ6で回し始めた
もっと上げた方が良いかな?
正直この辺の数値良く分からないんだよね スレストと突然の過去ログ化
>>470
3090ってRTX3000シリーズ?CUDA11
Tensorflowがまだ未サポートなのでは? 過去スレにあったdst x dstの学習で前髪、舌、笛マスク不要になりそう
liae-ud res:128
Xsegマスクした方が速いかも >>472
自分もdst x dstでやってみて
その後modelを使い回して同じsrc、別のdstでmergeまで
またmodelを使い回して同じsrc、別のdstでmergeまで
と繰り返してると、最初の方はいいけど、そのうち
mergeしても全然dstに似なくなってくる
dst x dstしてるから、当たり前だけど RTX_3000_buildが問題なく動くようなら俺もそろそろGTX1080ti卒業するか… Mega.nzに普通に上っていましたね
来年第一四半期にVRAM 48GBでるのでは?なので
BTO PCで80万以内とかだったら買ってもいいな
RTX2000シリーズより安いですよね >>472
dstを同一人物の範囲でやってみたらどうかな?やってみます dstA × dstA → srcX x dstA の手法は 作品Aの演出、質感を如何に高品質でFAKEとして再現できるか?を目的としていて
これで作ったmodelを更にdstBに流用して似る/似ないの議論は違うんじゃないかな?
もともと過去スレでは、BUKKAKE系の再現方法として紹介されてたはず
海外のBUKKAKEのFAKE動画はホント凄い 海外のあれはそうやって作ってたのか、汁っぽさがあそこまで再現できてるの凄いとは思ってた
dst×dstはsrcが戻ってくるまでけっこう時間がかかるんだよね
でも角度と微妙な表情がよく出るし目線(白目や斜視)もそれで改善されるからわりと必須かもしれない 元々srcごとのモデルはほぼ完成しているような気がして、
dst×dstも0から学習するより速いだろうと言う事で、srcのモデルからdst×dstを学習
また別dstにする場合は、srcのモデルからdst×dstを学習し、
dst×dstを学習したmodelは使い回さないつもりでしたが dst×dstでLRD trueまで回してから本src入れたら表情出る?
どうしても高画質な悲哀系の表情集まらなくて真顔っぽいのが直るならやってみようかな そんな。。似ないdstは諦めて、1人似たdstで違うsrcでやっていますし
src 18人までいますし。分かりません
srcの表情は中立顔と笑顔のみですかね
泣き顔dstなんてありませんし dstxdstで十分に回した後、srcxdstでGAN0.1、batch10で500回程度で眉や口角反映させたまま似せられるね
ただやっぱりsrcに変えてから数回せないのでそもそも似てる人物じゃないと難しいのが難点 顔が似たav嬢とかの真顔、笑顔以外を集めてこの方法でsrc用の表情を稼ぐとかもできそう 3090だとRTX_3000_buildでも顔抽出の途中で「3090が応答しなくなり、止めました」的なエラーが表示されて必ずエラーになる >>484
顔抽出だけでなく、マージでもエラーになるから3090だと修正版が出るまで何もできないわ 3000シリーズはまだできる環境できない環境あるみたいやな うちも3090だけどtrainでGAN power使うと異常終了した
有志さんの暫定対応版なら問題ない なんでRTX3000に対応できるのですかね?
Tensorflow未サポート、Bazel未サポートとか見ましたが
新しい版にならないと未対応の気が
CUDA11、Cudnn、Tensorflow、Bazelとかの対応表は見かけませんが とりあえず、
抽出はtest版でできる
ほかは11/3版でできる
ほぼ普通に動かすのに1ヶ月くらいは最低かかるっぽいね RTX3000に対応する気満々で、買っておいても損は無い訳ですかね
しばらく待つつもりですが
CUDAコア多いみたいで速いのかな?RTX2000より安くてありがたい気が 俺の3080はtest版、正式(?)版どっちでも動くんだがtest版の方が早いよねこれ?
正式版はそのうち早くなると期待していいのかな。
test版で問題ないからしばらくはこれでやるけど。
>>490
vram増量版がでるかもしれないし、ラインナップされるまで待ってもいいのでは?_ >>491
来年第一四半期にでも、AMDへの対抗として、VRAM増量版が出るのでは?
とか噂はあるみたいですね
3080とか2080TiよりCUDAコアが増えていますが、DFLが速かったりしますかね? 箱の外にいる人間がダメになるくらい発熱するならCPUの方が先に逝くよねと独り言 debugではランドマーク合ってるのにyawやpitchでソートすると並び方が滅茶苦茶なのは何なの? そんな難癖つけんなよ
これでも破格なレベルなんだぞ
俺の苦労知らねえだろお前 >>496
パーツ的には特に問題ないので、マニュアル読めるように電子辞書買おう STORMとか聞いた事ないショップだな
大丈夫なのか?ここ 女優とかだと上向いてる素材を集めるのが鬼門だな
根気よくドラマとか漁るしかないか >>437
これどうやるか教えてほしい
コーディックをlibx264からh264_nvencに変更するのはわかったけどどこで書き換えるのかがわからない
merge to mp4.bat開くと結局main.py呼んでるっぽかったからそこ開いても見当たらず
ffmpeg自体の設定を変えなきゃいけないんですかね 似た顔のAV女優の上向き画像入れとけばなんとかなるよ
liaeならきれいに整えてくれる
どうせ上向きなんて、誰だかわからん顔になるし >>504
DFLに任せないで、BATファイル内にffmpegを直に書くんだと思う >>504
colabでやってるけど、たぶんいっしょ
_internal\DeepFaceLab\mainscripts\VideoEd.py
の中の"libx264"(3つのうち後ろ2つ)を置き換えればいいんじゃね? >>506
>>508
ありがとうコード書く知識ないから508の方法やってみたけど上手く出来ました
エンコード爆速になったしcpu負荷も50%くらいで済むようになりました
多少品質下がるらしいけど全く気にならない(というかわからない) バージョンあがってるみたいなんで凄い久しぶりに最新版で一つ作ってみたんだけど、merge後の画像(動画)に不定期に
貼付け部分だけでなく全域に以下のような横方向の黒いノイズ(赤矢印の部分)がぽつぽつ出るようになったのですが、回避方法ありますか?
https://i.imgur.com/66s5LPT.png
modelはnew-saehd
merge設定はoverlay,FAN-prdFAN-dst ,mask modifier50,rct,gaussian他は全部デフォ値です どのverからどのverにしたか分からんけどもし使いまわしてるならmodelが古くて対応してないとか?
とりあえず自分の環境で見たことは無い >>514
modelはどっかで拾った奴pretrain済みの奴、archiはよく見てみたら df-udだった。
既存のSAEHDの奴も試してみたが同じ結果。環境はcolab。
>>515
置き換え関係ないFace以外の部分もノイズ出てるんだから
慣れとかTrain不足とかそういう問題じゃないのは普通わかるんじゃない? >>516
他のmodel、画像でもなるならcolabにインストールされるverのバグなんじゃない?
直接関係ないけどcolabでmergeまでやるのはやめといたほうがいい
googleはエロいのban対象だから >>500
win10 home
ストレージは外付けハードディスクで対応刷る おいおい、情報ビッシリの画像二枚にレスこれだけ?
ここにいても無駄かな だってそれ総合で見たし何聞きたいかよく分からんし無駄なんじゃない DF始めるのにpcスペック情報なんてほとんどどうでもいいものだし
勝手に始めたらええやん あの画像で気になるところなんてスマホ充電しろ以外に何があると言うのか もういいよ
批判しか能がない生産性ゼロの消費者共は黙ってなさい 向こうにもあったけどGPUがAMD製でなければあとはどんな構成でもとりあえず動くからな
なんならGPU無しでもいいわけだし
ちょっと情報が古いけど解説サイト見れば誰でも作れるし、見てもなんにも分からんなら頭のスペックが足りないとしか… amd ryzen って文字列が読めないの?
だから質問してんだよ >>528
Ryzenでも問題ないって言われただろ
レス読まないなら質問ですらないだろ
スペック自慢したいだけなんじゃないの もしかしてRyzenとRadeonの区別がつかないのか? 自分も数年前に自作面倒になってストームで作ったけど、名無しパーツが軒並み定評ある一流品なんだよね。
なんで書かないのか不明だけど、企業向けメインだから余ってるの使うんかなぁ。
クーラー・電源等、高いヤツ乗っててめっちゃ安かった、愛想が皆無だけど配線綺麗だったね。
>>517
だよねー。Googleは通報義務があって、メンドクサイからAI監視で所管国の法治機関に自動通報だから
ポリが動くかどうかだけ。DeepFake検挙の圧が高まってる今は特に。
実際ドライブに自分の娘(赤ちゃん)のお風呂写真2枚アゲたオッサンがいきなり逮捕されてたし >>504
お返事遅くなりましたが、508さんのコメントのとおりであってます
ちなみに、h.265を使うのであれば “hevc_nvenc” に書き換えます いやAMDじゃDFL最新版使えねえだろうが
だからソフトどうすればという話 いや上にRyzen3700で動くって人いるし俺も古いけどRyzen1700使ってるんだけど
お前のPCはCPUはAMDのRyzen3700でGPUはGeforceのRTX3070なんじゃないの
勘違い?
何度も言われてるけど、CPUは何でもいいし、GPUはAMDのRadeonじゃなきゃ(Geforceなら)何度もいいって話なんだけど
ただ上にあるとおりRTX3000シリーズで動くかは賭け
そのうち対応版は出るだろうけど >>532
437さんかな?わざわざどうもありがとう
hevcも試してみます >>537
HWだけじゃなく全ての要素を総合的に見たらID:fPNAn+OG0は動作させられないと思う。 人工知能の前に、先ずは自分の知脳障害をナントカしろよってのが
定期的に湧くのは、エロ故の成すべき技なんだろーか?
ガイジの思考と健常者の思考をデコーダ化して、エンコーダで入れ替える
ディープガイジを開発すれば、意思疎通が可能になるのに。 散々動くって言われてんのに暴れてるあたりマジモンのアレな奴なんだろうってのがひしひしと伝わってくるw なんでもええから賭けとか無しで普通によく使えるやつ教えてくれ言うとんねん
なんでここまで言わんとわからんのや 自分で使い方すら調べられない奴を相手にしても時間が無駄だわ
英語どころか日本語も読めないだろ ソフトに学習させる前に自分の脳に20万回学習させた方が良いってか 文章からだんだん余裕無くなっていくの草
まあせめてソフトのダウンロードぐらいは自分で出来ないと厳しいな PCの構成見せられて「どう?」としか聞かれてないし
とりあえず解説サイト見ていっぺん作ってみろとしか答えられないよな
作る上で詰まった点について聞くんならまだしも 普通によく使えるやつってなんだよ
構成の話かソフトの話かもわからん
構成ならCPUは別にRyzenでも動くけどなんか気にしてるからi9買ってグラボは2080tiにすれば間違いない
Ryzenと3070のPCもう発注かけたんならとりあえずopenCLの1.0で遊びながら2.0の正規版が3000台に対応するの待てば?
Faceswapとかは知らん って事はDFL一択ってくらい歴然たる差があるの?
ぶっちゃけ多すぎてわからんのよなこの界隈 どうやら似ない原因の一つはrandom flipをオンにしてるとダメだね
顔を反転させて足りない角度を作る機能だが
顔を半分に切って繋げてる様だ 顔が歪んでるO彩佳や歪な表情をする吉高・柴咲・綾瀬等以外はあんま関係無いけどね。
それ以前に素材マッチングが9割以上を占める。姿形は兎も角、表情モーションで決まるな。
それよりも、ランダムフリップはDSTもフリップフリップゥー!で無駄に
学習時間倍増するし、正常存在データにも反転学習で収束阻害起こすから
足らん画角は事前に反転MP4仕込んでホクロだけレタッチしてOFFが鉄板でしょ。
これらの積み重ねで、ヘボいGPUでもすげぇSLIを超える仕上がり速度が得られる。 >>555
素材マッチングのために2000人分の女優写真集使おうとしてる。サイトから巡回ソフトで落として、全部で10万枚ある。角度の悪い写真を取り除く作業の途中だが全然終わらない。 >>556
マッチングに使うアルゴリズムは決まってるのん? マージするとdstの面影が強く残るようになってしまった
今までそんなことなかったし、train中のプレビューも良かったんだけどなぁ >>557
アルゴリズムなんて使わない
単に2000人分一気にtrain→margeして似てる女優特定するだけw
似てるかどうかは俺判断。闇雲に探すよりいいと思う。 train中のプレビューのまま動画にしてほしいと思うことは多々ある
ちょっと聞きたいんですけどresultまで済ませた後extractしたsrcとdstの画像って保存してる?
自分はsrcは放置で次のsrcで上書き
dstは使い回せそうな感じならdstフォルダからmergeとmaskは消してあと残してます >>562
基本両方残してるけど
srcはalignedだけ、dstはextract結果に満足すれば切り出したフレームとalignedだけ、それぞれpack.batでまとめてる
というか上書きって毎回srcのextractからやり直してるってこと?それとも同じsrcで作ることがないの? やる気無い時に、過去のSRCとDST組み合わせてテキトーに回してるなぁ。死ぬまで働けー!って感じで。
だからSRCのチョイス分alignedとDSTの全alignedはパックして全部残してる。
DSTのフレームPngは嵩張るんで元ネタのmp4だけ。
っで絶対合わなさそうなネタが頻繁にマッチするから、もう何が合う要因なのかわかりません・・
あと、2年熟成を続けたエンコーダとデコーダ、かなりヤバくなってる。
バッチ32でiter8000も回せば、どんな素材(メガネ以外)もビンビンになるわ。 輪郭・パーツ配置が明らかに違うのにマッチする奴見て気付いたことは、やっぱ表情や仕草の遷移で
(例えばホランは動作の直前に思考フリーズみたいのが一瞬入って、制止状態から別ポーズへのキレが鋭い、
絶対に優しげな表情をせず、バカにしてるような眼差し・微笑みしかしない)
静止画で容姿が似てる事より、モーション命ってことは分かったんだけど、
だからってどう探せばいいんだろう・・ 愛嬌は表情と動作が作る
美しさは骨と皮膚が作る
エロさは脂肪が作る 似せるクオリティだけを求めるならdstからsrcを選ぶほうが近道なんだろな
たまーに雰囲気が似てるなってのがあるからそれに併せればいい
なんとなく似てる「激似」シリーズで作った事ある人っていないのかな 対応グラボもってないので、とりあえずやり方だけでも覚えるために
google colabで試してるのですが、colabでx-segを読み込むことはできるようですが
colabでx-segのエディタは使えないのでしょうか。 関係ないけどGeForceのドライバーってどれくらいの頻度で更新してる?
余りにも頻繁にアプデ来るから毎回面倒過ぎるんだが・・・ >>569
対応ゲームやらバグやら思い当たるものがあったら更新してる
けどDFLだけなら手持ちのグラボが動いてるなら更新不要では?
なんならスタジオドライバにしちゃうのもありかと
基本的に同等以上に動くし
もちろん環境次第だけど >>568
colabでx-segのエディタを使ったことはないけど、まずはGUIを
使えるようにしないといけないと思う
↓これとか手間掛かりそう
ttps://internet-of-tomohiro.netlify.app/google_colab/vnc.ja.html >>563
毎回同じmodelの新鮮な動画からsrc取りしてます
ただiter100万くらいまではいい感じだったけど
200万過ぎた辺りからなんとなく違和感出てくるようになってきた
1回辺り2000くらい枚数用意して20-30万くらい回したら次のsrcみたいな使い方してます >>567
似てるって言われてる人って目元とかパーツは似てても輪郭はそこまでってことが多い
だからdstとしては微妙なこともあるよね
輪郭と眉目口鼻の位置が似てる人が真に相応しいと思うんだけど、簡単に探せないものかね 最近は完全デコ出しのsrc使ってXseg-prdでerode0〜-25ぐらいをとって出力するのを試してる
dstによって生え際の違和感はあるけど顔はほぼほぼまんまのが出来るから自分用ならいいかなって たとえ似なくてもsrc本人よりかわいくなるならいいんだがなあ 久しぶりに最新版落としてやってみたらいろいろ変わってて笛がうまくできない。
最新版のMargerのオプションはどれにすればいいんだ?
前みたいにfan-prd+fan-dstとかでお気楽に作れないのかな? 5800xと3080で作ろうと思ってたけど3080tiのうわさも出てるし中々買えんな
2080tiと3070だと2080tiのほうがいいのかな? >>576
フォーラムにXsegマスク済の顔画像があるので、
それを利用してXseg Trainしている(顔はWFが多いけど、Fで)
(9)の最後のやつでMergeしている
srcのモデルに対し、dst×dstでTrain、笛、舌、前髪などがはっきりとプレビューで見える様になるまでTrain
顔の部分にかかった物のみが見えればいいと思います
srcとdstを混ぜて、yaw、pitchでsortして
srcにはあるが、dstには無い、上向き過ぎ、俯き過ぎ、右/左横顔過ぎの顔画像を退避
srcが減って学習が速くなると思います(liae-ud)
dstにあってsrcに無い角度が出てきたら、素材不足なのでsrcをつべから足しています
素材が足りたら、srcを類似でsortして、コピーしたdstを削除して通常srcとdstでtrain DST探し疲れたら、とりあえず吉良りん使ってみ。
かなり汎用性高いから。
>>572
最近のバージョンって過学習防止とリソース有効活用で、片側トレインオフ付いたんじゃ無いの?
因みに、浮くリソース分って丸々片方のトレインに割り振れるんだろーか? 基本的な質問ですみませんがsrcは複数の動画から作るより一つの動画から作る方が似やすいんですか? >>580
あまり関係ない
dst動画の顔の角度や表情に合った顔がsrc動画にあれば良い。複数の動画から抽出すれば素材が取れやすくなるかもって話 >>568
今は亡きTwitter界隈の投稿者達の作品見返してたら肌の粒状感?とか目尻の細かいシワまで表現できてるのとかあるけど、GANとかTrueFaceとかでやってんのかね
それともそもそも素材と学習の解像度が高いのか head悪くないな
髪色と長さが合えばまんま本人を作れることもある 皆学習何万回くらい回してるの?
↓くらいの前提だとして
・モデルはpretrain済み
・バッチ数は4〜6程度
・動画は3分程度
・resは256
正直自分は1日以上待てないから、10万回くらいで止めてしまうんだけども >>585
回数じゃなくてloss値が0.2切るまでやってる >>586
返信サンキュー
lossってresを上げるほど下がりにくくなってくと思うけど、res256とかでも0.2まで待ってる? >>578
そんな早口で言ったって伝わらないだろ
dstとdstでtrainみたいな邪道を誰もがやる作業みたいに書くのは、なんか違うと思う
普通にXSegで出来るから、ちゃんとXSeg育てるのが基本 >>587
うん、待つよ。
こないだ作ったやつはres388で1.8くらいまで学習させてたよ。大体一日半くらいかかったかな >>589
ちゃんと時間かけて待ってんだなあ
てかres388が1日半で0.18までいくのか、グラボは自分のより速そうだ
どうも自分がせっかちなだけなんだな >>589
ついでに聞きたいんだけど、random warpってどこで切ってる?
大体「lossが下がらなくなったら」てどこでも言われてるけど、下がらなくなるの基準が人によって違いそうだなと >>590
まぁスリッパ3960xとRTX3090だからね(笑)
コア数も多分速度に関係してるんだと思う。
random warpは触ったことないんだわ。
loss値が前回の保存ポイントの値より高く保存されたときが3,4回続いたら一回止めて、GAN1.0で再学習してる。
それでしばらくほっといたら2.0切ってるからこの辺で終わるか〜って感じ >>592
RTX3000台か、それは速いはずだね
自分は2080tiだからさすがにそれよりは時間がかかる
なるほど、ほんとにlossが横ばいになるまで待ってからGANに移ってるんだね
参考になったわ、サンクス 別にGANも必須じゃないし
むしろ設定してない人の方が多そう 結局どの程度のもの作ってるかもお互いわからない状況での議論には無理があるよね。 >>576 >>588
XsegはFANSegと違って、作者が作成したモデルは無いからTrainが必要
で、フォーラムにXsegマスク済の顔画像があるから、それをありがたく使わせてもらって、Train
それで、笛、手などは結構いけるかな。舌出しが少ないかも知れない
dstのXsegマスクも、明らかに顔の角度とかが違うコマ数枚程度Maskしてもいいらしい
dstの向かって左側の眉に、前髪とかがかかっていれば、srcの前髪Maskも兼ねるので、なお良い
で、1000回程度Xseg Trainして、モデルにアプライ
それでMergeして見て、うまくいかなかったコマとかの代表をXsegマスクして、またXseg Train 山口偽草レベルで作りたいのですがどうやれば出来ますか? >>576
Xseg Trainは、(FANSeg Trainと同じく)プレビューを見ると、Random Flipしてるっぽいので、少し左/右横顔どちらでもいけるのでは?
舌出し、前髪ありdstとか優先的にMaskすれば、笛もあるでしょうし
dst×dstの学習は、顔ぶっかけとかやりたい時に、海外勢はそれで作成していたらしい 自分も res256でやってるけど、
loss値 0.2以下はすごいなあ 50万回以上やってもせいぜい 0.4台です
0.4台で十分精細になっていて満足いくレベルなので、res256だとこんなもんかと
思っていました masked_trainingやlr_dropoutのオンオフでloss値は変わるんだし
どんな設定でTrainしてるのか明記せずにloss値だけ書かれても
その数値が良いとも悪いとも言えないし参考にもできないのでは… >>601
顔の前に障害物があり、Maskしていないとか?前髪、笛、舌、手等
dimsは?
最新版とかはmasked_trainingオンのみのはず 最新版とか、HDアーキが無くなった代わりに、-udとかで
R/W ON→R/W OFF→lr_dropoutオンにしてくれ
それで似るとか、Loss値が下がるとか
lr_dropoutオンにできない設定だとまずいでしょう >>605
たぶん、srcの枚数が多いからだと自分では思っています 2万枚ほどあるから
そのせいかなと。
設定は df-ud wf res256 dimsは 320-96-96-22 pretrain済で
もちろんrw off ir-dropout on マスクtrain はoff(xseg-dst で十分なので)
障害物はないです。 Srcに素材追加したい場合って最初からやり直す他方法ってない感じですか? 残したいsrcのalignedのファイル名を変えるか他に移しておいて
新しいの作ったらそこに足せばいいんじゃないの >>607
srcは最大でも15,000枚程度とかあったような。。
BestでSortしてはどうでしょうか?もちろんバックアップしてから
自分はsrcのフォルダにdstをコピーして
srcにはあるが、dstには無い、上向き過ぎ、俯き過ぎ、右/左横顔過ぎの顔画像を退避
srcが減って学習が速くなると思います
学習効率を上げる仮説
【初期学習】src画像/dstは適当に1枚
randomwarp/learningmask/lrdropout/trueface等はOFFにして処理速度を上げる
ある程度(数万回?)trainする
【本番】dst画像を作りたいものにして通常trainする
これをsrcごとに行ってそれぞれの学習を進めていく >>607
wfと言う事は、Xseg Train必須とかありましたね
srcの前髪、おでこのMaskが少なくて、XsegモデルのTrain不足とか?
Xsegモデルを5.XSeg) data_src trained mask - apply.batするとか? >>610,611
ありがとうございます。
srcはなにもソートせず、順番考えず、そのまま使っているので(もちろん、障害物や、
ぼけているやつや、ミスっている不要なのは削除済)
確かにそのせいかもしれませんね。整理してやってみます。
xsegモデルはこのスレで何度かあがっている完成したモデルをそのまま
流用するやりかたをしているので結果としては十分にマスクできているのですが、
今のdstモデルではトレーニングしてないことになるので確かにそれもあるかも
しれないなあ。 >>612
ぬぬ。。
SAEHD_default_options.dat→XSeg_default_options.dat
SAEHD_data.dat→XSeg_data.dat
SAEHD_src_dst_opt→XSeg_256_opt.npy
SAEHD_inter_AB.npy→XSeg_256.npyまたは
SAEHD_decoder_dst.npy→XSeg_256.npy
って事? masked_trainingがoffだとプレビュー画面で見えてる四角内の全部(顔+背景)が学習対象になって、loss値の評価も四角内全部になるから絶対値が大きくでる、っていうことじゃないかな?
自分も経験してるけど、間違ってたらごめんなさい Dstマニュアル顔抽出で2つの顔指定することってできない?vrで片方の顔だけ自動抽出できなかった時に手動で治したいだが片方しか選択できない masked_trainingがoff/on切り替えられる昔の版で、Onにしておかないと
最新版とかではmasked_trainingがOnにならない(モデル流用時)
新規モデル作成とかだと、無条件でOnになるはず
masked_trainingがOffのままだとまずいのでは?
旧版持っていないですか? 昔、dfhdとかでやっていたので、df-ud、liae-udで無条件に新規Trainしましたね DFL RTX 3000 Testが動かんくなった
Readyドライバー入れたくらいだけど原因それかな?
戻しても全然始まらんようなった 最新版でもwfとheadはmasked_training好きにオンオフ設定できるよ。
自分はdstの顔の輪郭内に収める時は最後までmasked_trainingオンで回して
輪郭も修正したい時は学習が進んだ最後の方でオフにしてる。 >>612
aligned_xsegフォルダを、dst、srcフォルダの下に置いておけばいいのかな?
> xsegモデルはこのスレで何度かあがっている完成したモデルをそのまま
> 流用するやりかた
どゆこと? whole faceとfull faceとheadって出来にどういう変化が出るんですか?
とりあえずwhole faceでOK? >>621
自分の体感だとheadがやっぱり一番違和感なく顔作れると思う。前髪ありdstでもけっこう自然にsrcに入れ替えられてる >>613
>>620
フォーラムにある 完成されたxsegモデル
(xsegから始まる5つのファイル)をmodel フォルダに置いてすこしxsegトレーニングする
mergeのときに maskを xseg-dst にすれば
自分の所感だが、十分に満足できるレベルにあうよ。お手軽でおすすめ。
この見本のedit画面みたけど、境界線の引き方とかすごく丁寧で感動したよ。 日本人モデル向けに眉下で設定したX-segテンプレートほすぃ modelもそうだけどxsegがeditされたaligend画像が欲しいわ
フォーラム見たけどそれだけまとまってるのは見当たらなかった
翻訳しながらだから見つけられてないだけかもしれないけど すまん、説明がわるかったかもしれません。
xsegモデルの件だけど、まさにそのeditされたaligned画像があったはず
2.1 [SFW] [NSFW] [GUIDE] [SHARING] - DFL 2.0 XSEG MODEL GUIDE AND SHARING THREAD
にあると思うんだけど。 素材スレがスレストされてるな
サポートセンターみたいな真似してると此処もやばいんじゃね
更新や動作環境の話までに留めておけよ 芸能人や女優の名前を書いてただけでアウトだから内容はあんま関係ないな
おそらくdeepfakeってスレタイで消すか決めてる 全く問題ないんだけどもう少し目立たないスレタイにしろって事かもな 【AIコラ】fakeappはまずいと思う
DFLとか略語では?
Google検索にひっかかるけど、上位は関係無いものばかり Deepfake総合はスレストだけど新スレ立てたな 最初に停められたのは半角の技術スレな
コラの普及に5chを使われるのが嫌なんだろうから
此処で解説や相談はしない方がいい 目立つとかそういうことではなくて、10月から施行された改正著作権法でリーチサイト問題が発生したから、問題あるサイトへのリンクを貼りまくる所が閉鎖されてると聞いてるが…
(書いた本人ではなくて、サイトが罰則を受ける)
半角はそういうサイトへのリンクを貼りまくってる所だから、板ごと閉鎖。スレの問題では無いでしょ。
「成果物」や「素材です」とか言って著作権違反物にリンクを貼ったらアウトだと思うよ。 まだFansegバージョンのままでXsegに移行してないのですが
Xsegって、他の人がtrainしたXsegモデルをもらってコピペすれば使い回しできるようですが
そのXsegモデルが顔前の障害物を十分trainされたものなら、再tranせずにdstにいきなりapplyするだけで
それなりのマスクが適用されるのでしょうか?
またsrc・dstをすでに f でtrainしている場合に、wf のXsegモデルって使えるのでしょうか?
よろしくお願いします mercury.bbspink.comだと大丈夫とか? >>638 >>626
フォーラムにあるXsegマスク済の顔(WFが多い?)をFull FaceでXseg Trainしたら
それなりのFull FaceのXsegモデルができました。Batch数も多くできるし、学習は速いです
笛、手などは上手くいくが、舌、前髪などは、自分でXsegマスクが必要かも 学習させてて、人間の目から見たら目立つとこが超最後の方でしか学習されないことあるよね
全体の肌の質感は面積が広いから学習遅くても仕方ないとして、まつ毛と唇の光沢の学習の遅さが毎回気になる
特に唇の光沢が弱いとのっぺりするから優先的に学習してもらいたい 単にピクセル誤差を埋めるように学習するんじゃなくて、人間の目から見て重要なとこを
優先して学習するような仕組みをDFLにも取り込んでほしい それも大事だけど目鼻口の相対位置を反映させる機能があれば革命的に良くなるのになぁ。 今までフェイスタイプをfullで利用しておりWHOLEに挑戦してみようと思いまして。
6) train SAEHDの設定画面でフェイスタイプをfullからWHOLEに変更するにはどうしたらしたらいいんでしょうか?
ちなみにDSTとSRCはWHOLE用に細工はしています
一度FULLでやったら変えれないんでしょうか? facetypeってmodel毎に持ってて初回しか設定出来なくない?
もし変えたかったら新規で作るしかないのかな まずはwhole feceでextractし直さなきゃ
srcもdstも両方とも
modelも新規に作成してfece typeを選択
pretrain済みのものを拾ってきて利用してもいいけど whole faceは日本人には意味ないって言われて、やったこと無いな 何時間もCPU&GPU100%で放っておくとすぐPCぶっ壊れそうで怖いな 確か、fullでやっとけばそれより狭い範囲は共用できたでしょ。つまり全部fullでやっとけってこと。 範囲で言えば
head > whole > full
だぞ >>649
この時期で壊れるなら熱排気が駄目すぎだろ RTXは3000のbuildあるけど、RX6800XTも対応したbuild出ないと使えないんかな
あの値段でVRAM16GMは魅力だから欲しいんだが >>653
OPENCL版が過去はあったけど、今はcudaだけ
あきらめろん もうAI系のソフトにRADEONは使えないだろうなぁ
Video enhance AIもRTXの方が速いし アイドルも被害「ディープフェイク」まとめサイト管理人を逮捕。芸能団体は「違法なまとめ行為」を批判
https://news.yahoo.co.jp/articles/84edf77306b0e6385ed1819b60b1ca5a4262c839?page=1
まとめサイトにリンクを載せてた管理人が逮捕だって。
損害賠償金もアダルト業界+芸能事務所から来る可能性あるから金額えぐいだろうね。 >>656
これがダメなら袋とじで紹介してた男性誌はどうなるんだよ CPUの多コア化が加速してるし、またopenCL対応しないかな >捜査幹部は「作ることも拡散することも許されない。摘発を続けて被害を防ぎたい」としている。
ttps://www.asahi.com/articles/ASNCM3RKRNCKUTIL059.html?iref=com_latestnews_01
作るのもだめだってさ 国家の無知っぷりがやばいな
こんなもん誰が見てもフェイクバレバレなのに
「違和感なし」とか「本人そのもの」とかAVの売り文句みたいなのだけ聴いて
悪用されたらめっちゃやべえ技術じゃんとかジジイ達は本気で思ってるんだろうな >>654
やっぱりそうか…ありがとう
RTXは3080でもVRAM足りないし3090は高すぎるし
噂されてるVRAM20GBの3080Tiを待つしかないな… むしろ国は利用する方なのにな、証拠捏造で誰でも有罪にできる 1080tiを2000系とか3000系に替えたとして現状のDFLでパフォーマンス差ってどのくらいなんだろう。 >>664
参考までに、
2080ti→3090に替えたら、解像度倍にして学習時間は半分でできてるよ >>664
1080ti→2080tiはそんなに変わらないと思う
TENSORコア使わないからCUDAコアで比較してコスパ悪い まあ寝ている間に学習させているから、倍といっても二十万だす気にはならんなあ
しばらく2080tiでいこうかな >>666
参考情報ありがとう
買い替えたくなるなぁ これはいけると思っても微妙に似てない
マッチング難しい・・・ ところで、3000シリーズの3Dベンチマークスコアだと
メモリクロックも重要になるって話を聞いたけど(VRAMじゃない普通のメモリね)
DFLも影響するかな。
わかる人いる? 3000シリーズの性能高いから安いメモリだと足引っ張るかもと思った。根拠はない。 繋がり眉毛問題だけどsrcの前髪が眉にかかってる画像だけxsegで髪のかからない部分をマスクしてtrainすれば解消する? dst×dstの学習で有効なのはliae-hdとかみたい
df-hdだと前髪の残骸の黒い物が。。 いつもres192liae-hdでやってて初めてliae-uhd使ってみたんだけど全然loss値下がらん
時間も0.7msec/Iterくらいでいつもの倍くらいかかる
300kくらい回してやっと落ち着いてきたから一旦LRD trueにしてみたらbatch size2でもtrainスタート出来ず
DDR4 2666 32GB,i9-9900k,2080tiだけどGPUがボトルネックっぽい
どんな環境ならliae-uhd使いこなせるんですかね 色々要求するとVRAMが足らないよなliae系はかなり食うし 素材スレのうなってもうた…
貞松大輔に対するグチやsrcに合う話題はどこですれば なんか新しいアルゴリズムのアイデアないのかね
今のアルゴリズムでマシンパワーでごり押しするしかないのか ゆうてCPU大事だし、fullHDならres192batch8で十分 それ以上はオーバースペック 5600x RTX3070で顔抽出が2.0 it/s程度しか出ないけどこんなもん?
image sizeが768なのがダメなのかなぁ?
768→256程度に落とせば 速度は上がる気がするけど間違ってる?
設定入れるときに適当にENTER連打してたから768になってるけど
出来上がりに大して差がないなら256ぐらいに落としてもう一度回した方が良いのかな? 始めたばっかりの頃に持ってたGPUは微妙だったので、設定を解像度128、バッチ8、DFでやってたんだけど、
その後もうちょっといいGPUに変えて、解像度が夢の256でできるようになったのでもっと高画質でいけるだろうと思っていたが、
(バッチは4、DF)、解像度128のを最後のマージでスーパーレゾリューション?って数字をあげれば最終的に高解像度の顔になるから、
あんまり最初の解像度って関係ないんかなとおもったけど、どうなんでしょう?
解像度、バッチ、アーキテクチャーってのは、動く範囲内で取捨選択しないといけないけど、どれ優先が一番いいんでしょうね?
ちなみに、最近つくったモデルは、解像度128、バッチ4、liaeで、なんかこれが一番いいのではないかと思っていますが。
この設定は途中で替えれないから、最初にどれが最適か決めなきゃいけないから皆さんの意見が聞きたいです。 2070super8G、Re256、B9、Liae-udで安定
使いまわしModelを48時間まわして0.2くらい res160-liae-dims512-batch8
RWtrueで0.5切ったらfalse→0.2切ったらLRDtrue→0.1切るまでtrain
mergeする時はbmmだけ150でcolorはrctかlct
maskはlearned-prd*learned-dst*Xseg-prd*Xseg-dst
これでなんとなくうまくいってる
所々怪しいけど誰に見せるでもないし必要十分かな df-ud wholeface res386 batch3 VRAM8G
で満足してるのは少数派なのか。 32で割り切れる数字じゃなきゃダメだと聞いたが、そんな適当な数字でも動くんだね
ちゃんと動いてるのかどうかは知らんけど PCオール換装ついでにDFL入れて試してみたけど要求するスペック、時間、負荷
どれも他のエロ技術とは格段に違い過ぎて悪い意味でハードル高いわ
PC購入費は除外したとして、自分の5600x RTX3070の構成だと20万回回すのにおよそ24時間
画像の吸出し+選別作業含めると+6時間はかかる
およそ3分程度の動画ですら 作成に30時間
モザイク破壊なら3000シリーズ動かないけど、2080なら2時間作品で6時間もあれば完成
高画質化なら2時間作品で24時間もあればいける
加えてSSDへのダメージ量もぶっちぎりでDFLが食うし
上記の1作品2時間にした場合の電気代はDFL9,600円 破壊なら60円、高画質化なら240円ぐらいになるの考えると
本当にコイツじゃないとダメなんだと思うぐらい入れ込んでる顔がないと、かなりやり続けるにはハードル高いわ
なれた人なら自分の1/10ぐらいにそれぞれの負荷減らせるもんなのかなぁ? コスト考えてるようじゃダメだよ
ディープフェイクはプライスレス >>693
ほんそれ
新しい技術ってことではじめは楽しかったけど
割に合わないよなあ colabとか言うまた凄い技術があるんだなぁ
これならノートの低電力PCで動かせるし
結構なハイスペ割り当てられるから良さそうだが
どのGPU割り当てられるかによって動かすコード変わりそうなのと
コード少しはかけるレベルと米国居住の関門も突破する必要有るのが難易度高いわ
それクリアできる人なら電気代の観点や
騒音と廃熱、機器損傷の問題もクリア出来るし
自分のメインをゲームなり他のエンコにまわせるのもメリットデカイ どこぞのメンバー全員とか変に欲張ったりしなけりゃそんなtrainに時間取られたりしないでしょ colabは遅い
そもそもリソース限られてるんだから話してるやつは自分の首閉めてるのわからん? >>691
間違った訂正すんな
16の倍数(-dアーキは32の倍数)であってる NY州の郵便番号調べて適当に入力したら契約できちゃったよ、Pro版(笑) dstもsrcも自分で選べて本人にしか見えない物が作れるんだから、マシン費用、train時間、電気代etc気にならない
いい時代になったもんだ ミスターディープフェイクの動画がDLできんのだが・・・
ワシさんのダウンローダー使ってたら今までは出来たんだけど
間違って拡張機能から削除しちゃったら
再インストールする時にもう拡張機能ストアにはないって出てきて困ってる
暗号化された分割動画ファイルが落とせるアドオン他にない?
それか昔のバージョンのワシのダウンローダー置いてあるところない?
お願いします 初めてやってみたけど化け物しか産まれなかったわ
26万回しても0.40を下回ること無かったってことはsrc側が悪いのかdstをほぼ取捨選択しなかったらからなのか
変換されてない表情もあったりした
20万回以降は0.4以降全く下がらなかった
srcは一応ブレてる画像は取り除いたつもりで抽出15000→7000枚程度にした
しかしマスク等は一切編集しておらず、前髪が少し被ってるのとかは除外しなかった
dstに関してはあまり取捨選択しなかったがぱっと見で分かるブレ画像のみ取り除いた
これで結局化け物しか産まれなかった
dst側は取り除いた部分があることについて逆に顔が変換されない時間帯があるのでは?と感じた
0.1や0.2に切るくらいに持っていける人は徹底的にマスク処理してるのかな?? >>705
削除したdstはmergeするときに元に戻してないとその部分だけ顔変換されないよ。
顔抽出に失敗したdstならその部分だけ手動でやり直す。
dstの顔の角度がsrcにないとクリーチャーになりやすいね。 faceset extractってwfよりfの方が抽出上手だね
いつからか抽出率悪くなったと思ったらwfになってたわ 26万回して0.4ってのは
pretrainをしてないか甘いんじゃないかな
好きなsrcを入れるのはその後 >>706
>>707
なるほどそうなのね
参考にさせてもらったサイトだとdst側もブレ画像取り除くってあったからてっきり削除するんだと思ったけど
これでどうやって画像変換するのかと思ったらそういう事だったのか
と言う事はsrc側はクッキリ顔がわかる画像のみ使う(髪の毛が少しでもかかってる写真も除外する)
dst側は抽出した画像で完全に顔じゃない部分のみ取り除く
この2点を守れば大分改善されるって事かな?
一枚一枚気合入れてマスク処理はとても出来る気がしない
それでもsrc枚数を相当減らしたとしても、一枚ずつのクオリティをあげた方が結果的に綺麗に仕上がるのかな? 十秒のdstでいいから、一度manualでextractしてみればいいよ
つーか過去スレ全く見てないだろ >>693
知り合いで作った時の破壊力は凄まじいぞ まず知り合いに似てるAV女優や好きな顔したグラビアアイドル探すんだよ
それが見つかればあとは根気次第で素敵なオカズが作り放題だ、まあそんな顔した人間見つけるって前提が難しいが ある程度iterの伸びたDF系modelを流用すれば写真数枚でも結構出来るぞ
素材が豊富ならliae系だと髪型や輪郭の齟齬も巧い事trainで馴染ませてくれる DFL の XsegEditor の使い方で教えてください
右上から「緑」(HotKey[2]) を選んで顔を囲うことでマスクが出来ているようなのですが、「赤」「青」は何のためにあるのでしょう?
まさか、RGB の色ごとにマスク作ることなんてしないですよね?
「緑」で顔を囲うのではなく、障害物の方を囲んで自動的に避けるよう train することは出来ないのでしょうか? 色は関係ないから好きなのどうぞ
左上の実践のがマスクで、その下の点線が障害物 >>724
ありがと!(やっぱり赤緑青は区別ないのか。。。
左の点線の使い方がわかってなかたのですが、そうか、これが障害物マスクなんですね。助かります
早速やってみよう >>716
枚数少ないときはliaeの方がいいって過去スレで見たんだがdfのほうがいいのか? >>713
一緒に飲み食いできる仲ならみんなの様子を撮ってるフリをしてスマホで撮れば済む話だ
食事中なら今でもマスクはしてないしな 似てるとかは何も考えず5人別の顔で同じアングルの動画を5秒ずつ切り取ってtrainしたら
輪郭もパーツも全然違うのによく似る人と輪郭とかが近しいのに全然別人ってのが出て来た
ほんとに合わせてみないと分からんねこれ・・・ いろんなオプションがあるけど
それらを試行錯誤するより実際に一番効果的なのは素材選び
でも、元々の目的は好きな顔と映像をくっつけたいってことなんだから
素材選びで縛れられるのだったら本末転倒だよね 俺もこさかなちゃんのVRDFにチンコ入れっぱなし
VRは見つめあえるから良いね 仕上がりは別として、みんな、最大でどれくらいのイタレーション数回したことがあるんだろ? 初めてDFL使ってるんだけど最後の静止画を動画に戻す工程だけができない。
↓のエラーが出るんだけどこれってどういう意味だろう?
Error initializing output stream 0:0 -- Error while opening encoder for output stream #0:0 - maybe incorrect parameters such as bit_rate, rate, width or height 元動画のパラメータがおかしいって書いてるな
ビットレートかレートか縦横の画像サイズ
他のソフトでmerge後の画像を連結して動画にしたほうが早そう >>736
最近始めたからわからないけどそうじゃない?
前はもっとあったの? ついでに聞きたいんだけど、色味を合わせるためにはマージの設定変えたらいいのかな?
素材選びの段階で決まっちゃう? trainでも寄せられるけどpreview見てもいまいち分からんから
自分はtrainの段階ではnoneでmergeでしか合わせてない
よっぽどかけ離れた色じゃなければ問題ないんじゃないかな
ただ背景の色に引っ張られるときはあるね みんなは抽出した画像が逆さまになってる時どうしてる?
反転で戻すのか削除するのか なるほどー
始めたてだからいろいろ悩みながらやってみるわ。 >>740
alignedのファイルは画像ファイルに見えるけどいろんなデータも入ってるから、いじるのはNG
マニュアルでRE-EXTRACTしないとだめ 顔画像抽出の時って似たような画像が何十枚もできるけど
これ全部あったほうがいいの? srcは削ってもいいけどdstはぱっと見同じでも各フレームに対応してる
消すとそのフレームは元のままになるのでdstは残しましょう >>744
ありがとう!
dstは各フレームに対応していたのか!
消したのでやってみたらなんかおかしいと思ったら・・・ srcを500枚でやってみたけどほぼ正面の動画に限れば意外と納得行く形になるな。 自分で作って自分で見るなら正面だけでもいいもんなあ
シーン選びがめんどくさくはなるが 変顔集みたいなsrc継ぎ足したら表情の追従が劇的に改善した
行為中の顔は変顔だった? 枚数も大事なんだろうけどワンパターンじゃだめってことか。
変顔探すのって実は大変じゃないか。。。 >>751
有吉ゼミの激辛料理食いに出てくれたら解決するんだが
難点は字幕が顔にかぶりやすいことだな face type hの範囲外であれば5%程度までの数の障害物有り画像(唇下までのマイク等)も収束に影響ない
ってmrでiperovが書いた、と過去スレに書いた気がする 本人じゃなくても雰囲気の似てる子を先に覚えさせてそれをベースにすれば
100枚くらいの写真でも主観ものならいい感じに出来る RTX3090期待してたんだけど、顔抽出がwf-512-100の設定で
1.4s/it でめっちゃ遅い。なにか間違っているんだろうか。バッチ数は
同じモデルで確かに2倍まで上げれたんだが。 結局128とかに画像を縮小してるからgpuでの推論にかかる時間自体はそんなにかからなくて他はcpuでの処理だからな
ssdの書き込み速度も大事 学習結果を再利用するときってmodelフォルダの中のデータをどれかコピペすればいいのかな?
みんな再利用してるのかな? 目を閉じてるシーンにtrainすると殆ど薄目開けた状態になるんだけどこれって目を閉じたsrc不足?単純にtrain不足? >>693モザイク破壊と高画質化ってどうやってやるの?? >>759
目を閉じてる画像は瞬きしてる場面から抽出できる >>756
RTX3090なら顔抽出、4多重くらいで起動できるはず
多重数上げて早く終わらせることは可能(CPUコア数にもよるけど) <<764
756ですが4多重とはdflを4つ立ち上げてdstを4分割にして顔抽出するということでしょうか? >>765
そうですね
DFLの解凍フォルダを4つコピーしてdstなりsrcなりのフレーム毎ファイル群を4分配して
各作業フォルダ内の目的の.batを実行します
自分は3多重まで試しましたがVRAMの余り具合から4多重はいけそうでした src画像が多かったから瞬きしてる前後を中心に選んだところ、イメージより目の細い子に仕上がった
対応力も求められるが、好きな顔を多く残すのって大事 そうね
自分の脳味噌が本人と認識している画像を多く残した方がよい srcの名前と画像を隅っこに乗っけると脳みそがより補正しやすい説あるな 半目、白目、ギョロ目はsrcの質と言うよりDFLのaiがバカって部分が大きいと思う
dst×dstで馴染むまでtrainすると補正されやすい srcのインタビュー映像でも隣に表示しながら見ればいいんじゃないか >>766
なるほど、それは確かに速そうだ。ありがとうございます。 wikiで前回のtrainを参考にするってあるけどalignedフォルダの中身を入れ替えれば
前回の学習を引き継いでやってくれるのかな? それでいい
けど使いまわす前のプレーンなmodelデータのバックアップは取っておいた方がいい deepfake関連スレがここにしかないから聞く
質問なんだけど、trainって何時間使うのが良いの? 質問まとめてきた
1
例えばウインクしてるDSTだとしたら、DFLは目を閉じてるSRCと目を開いてるSRCから合成してウインクさせることはできる?
要は感じてる時のしかめっ面がSRCになければ、DSTには応用して使えないの?
イメージとしては、使える部分だけを切り取って貼っていく
2
似てる似てないの結果はどの要素が一番になる?
骨格や歯並びなど 何日かtrainしてるけど全然似ないな
グラフが交差したらOkなのん? 試しにmergeしてみれば?
意外と似てたりするぞ >>783
上級者さんかい?
たまたまやり始めの人たちが揃ったんだろうよ。
そんな事言わずに仲良くするなり、もっとレベルの高い話をするなりしようよ。 先月グラボ買ってやり始めたんで色々参考になります… ここで親切マン待つよりガイド観て試行錯誤するのが近道
いやマジで >>787
ウインクは寄せはしてくれる片目開け片目瞑り〜薄目みたいな
完全再現するにはウインクしてるsrcあれば可能
要は〜以降は何言いたいかわからんけどRWtrueでsrcに無い表情を生成しようとする
似る要素は輪郭とパーツの配置が大きいと個人的には思う 髪型も同じじゃないとダメくない?
額を出してるdstと眉まで前髪なsrcでやると、眉の上に変なちょんまげが生えてるresultが出来上がる(涙 xsegつけて0.01くらいまでtrainして通常train中もある程度loss値落ち着いたところでlearnmasktrue
mergeのmask選択をlearned-prd*learned-dst*Xseg-prd*Xseg-dstにすれば前髪問題両津眉問題は回避できる
それでも駄目ならfacetypeの設定がおかしいwfとかでやってないか? >>779
1.出来るだけ色んな表情と角度がある方が良いよ!そっちの方がリアルに近づく
2.相性次第
骨格というか輪郭ね
アイドル作成するなら髪型も結構重要だよ
女優なら色んな髪型するけどアイドルは髪型固定が多いから
歯並びは関係ない >>791-792
わかってないのでよければ教えて。。。
今、色々と設定変えながら試している段階なんだけど、XSegでのマスクは、障害物がないsrc(眉まで前髪)ではやってなくて、
障害物が顔の前に入り込むdst(おでこ出し)のみでやってます。XSegのtrainは62万itr・0.02台まで。
その後本train中。face_typeはf(XSseg、本trainともに)。
本trainで30万itrくらい、ロス値はsrc 0.55・dst 0.25ってところなんだけど、プレビュー見る限り、うまく行きそうなところもあるけれど、
おでこに突如前髪登場、というのもある。
前に試したときはXSegせずで、おでこに前髪がたくさん、でした。
やり方間違ってるかな。。。? 狭い方の範囲に合わせて反対もmask処理してみて
今の場合dstが眉まで前髪かかってるならsrcも眉下で線引き
mergeの時interactive merger使ってる?画像確認しながらmask選択すれば問題ないはず
あとはV押してmask範囲見ながらblur mask modifierを100-150くらいあげれば大抵馴染む ガイドって言われても英語表記、英語音声だしなあ
まともな解説サイトが無いってのも駄目だわ 俺も質問まとめて来た
1、SRCが髪、手で隠れていてもそれは残したほうがいいのか
残すなら顔の隠れている割合の条件も教えてほしい
2,DSTで顔に髪がかかっているものは採用対象にしないべきか
3、SRCで上下逆さまになっているものがたまに見かける
これはなにもしなくていいの?
4、workが多すぎるんだが、使うおすすめを教えてほしい
5,顔を学習させるのって、あくまでもパッチワークみたいな切り取って貼っていく感じではなく、マシンに顔を記憶させて応用も効かせるっていう考え方であってるよね?
ってことは2つの動画の明度が違っててもいける? 1.消せ
2.消せ
3.消せ
4.?
5.白人→黒人みたいなのは違和感しかないだろうけどある程度はいける >>797
1 ちゃんと顔が見えてないのは削除
2 dstの髪はxsegとかで大体何とかなるけど邪魔なものはないほうがふさわしい
3 失敗してるので絶対に削除
4の意味はわからない
5 明度の違いぐらいは問題なくやってくれてるけど、仕組みはわからない 1.学習の邪魔になるので削除
2.xsegでマスクして学習させてみる、もしくは違うフォルダに退避させてマージ時に戻してみて上手くいくか探る
3.顔と誤認識してるので削除。横顔の場合角度つきすぎてたら何かおかしいので削除
4.?
5.差が酷すぎなければだいたいいける
自分はこんな認識 ちょっとひどすぎんな
教師気取りのやつは別に場所作ってそこでやれよ
お前等が構うから他がスルーしてても意味ねえじゃん いやもうこういうスレなんだよ
日記が来てからかつてのスレは死んだんだ諦めろ >>802
総合でここでやれって言われてるからな
しかも先月グラボ買った輩が教えてるから教師気取りにも程がある どうでもいいわ
こちとら文字の書き方を知らんっていうほどの未熟者なんだからシャーペン買う場所教えてくれるだけでも普通に有り難い
あんたら不満だけの奴らは一生レスしないでくれ 逆に昔はどうだったのか知りたい。
結局こういう質問・回答だったんじゃないだろうか?
まさか作品上げあってたなんてないだろうし・・・ 5chに質問書いて返ってくるかわからん返事を待つより
その前に過去スレ読んだり"DeepFaceLab"で検索した方が役に立つのに >>784
上級者っていうかググったりgithubの説明から理解したらこうはならんやろ >>779
1可能、元ネタ次第。例えば過去スレに説明があるとおり、dst同士で学習して、srcに入れ替えたら楽。少し品質は落ちるけどな。
2表情のパターンと眉かな、そのキャラクターがしない表情は似たところで違和感がある、その次に輪郭。 >>802
酷いのは調べもしないお前だ。過去スレを順番に読むだけでいいんだぜ。馬鹿でもわかる。 普通にGit調べりゃ基本的なことは書いてるし、youtubeにもあるし
まずそこ見てくれ、後は自分で試す
そんなこともできないようじゃ無理 言ってることはよく分かるが、このスレ質問しか書かれないじゃん
過疎スレで自治してても楽しくないよ 過去スレすら読め無い奴はスルーでいい
そもそも教えてやる義理も無い
そんな事より更新来てるぞ 1.「パソコンのいろは」「ファイル操作入門」の知識すら無いのに、タメで書き込んでるヤツをガイジという。
2.「画像形式と情報保持構造」「動画形式・編集入門」「CMDコマンドとCMD画面」の知識が無い者をパソコン初心者、
3.「DeepLearningの画像認識」「このAIパッケージを利用したDeepFakeの仕組み」の知識が無い者をAI初心者、
4.これらが揃っててDeepFakeを始めるモノをDFL初心者、すなわちこのスレでの初心者と言う。
ぶっちゃけDFLって即使える筈なんだけど、PCの基礎知識が足らんからトンチンカンな質問になるんでしょ。
因みに自分の場合、元々3DCGアニメ屋なのでDSTは自作してる。
マスクオブジェとその影は別レイヤーレンダで後乗せだから学習速いし、画角も好きに出来るし、
CG顔は学習異様に速いし、触手とかハラボコとかケツ口貫通とかめっちゃヤバイっす。
自作DSTの公開は無問題だろーから需要あるなら提供しようかとここ来たんだけど、もうね・・・ というかソフト触る前に質問するからトンチンカンな内容になるのよ
一切触ってないような人には教えるのも難しいし 更新きてるこのRTX_build_12_09って
RTX系統じゃなきゃだめよ(GTXはだめよ)なの? いや、割と阿呆な質問が多いから、まじでこの国の教養大丈夫って思うわ。 2080tiだと12_09のdst faceset extract不安定
100くらい見つけたとこで止まる
08_02に戻す rtx3000シリーズでも同じ症状だった
顔抽出で止まる っていうかあんたら上級者がなにもせず還元しないのが駄目なんでしょ
wikiだの、このスレのテンプレすら英語版のマニュアルをポンと貼っただけでテンプレ貼りをドヤ顔で仕事した気になってんだから世話ねえわな
こんだけ質問来る意味、少しは考えたことあるかい?
ないわな パッチファイルが多すぎるんだが、いくつか消してる人っていない?
残すやつ教えてほしい アフィブログ作って解説したら儲かるかな
別にグラビア雑誌にアイドルの顔張り付けるのと一緒だよな?
なんかの幇助とか言われて国家権力に捕まらないかちと心配 マジな話「wikiみたりweb検索する前に、まず5chで質問」←これが意味わからん >>825
パッチファイルに手を入れられる知識があるならRTXでまともに動くようにしてくれ 質問に答えてくれてる人に対して感謝の言葉すら一言も無く文句だけは上級者
まじで死んだ方がいい 更新なったやつ消えとる・・・
まあ、俺は解凍時にエラー吐いてたし、trainも開始できんかった。 >>826
家族の面白動画の作り方とかならいいんじゃね バッチはカスタムするし、不要な処理はコメントアウトしたり普通にいじる。 3000版顔抽出開始するのに3分いじょうかかるな
とうぶんの間Test版と併用だな
あとtrain optionにadabeliefが追加されている 今気付いたんだが、例えば1.1に複数のバッチファイルあるやつってそのうちのどれか一つ選んで実行ってこと?
番号順に一つずつやる、コンマ以下あるやつは好みで使用、使わなくても良いっていうのでいいのか? >>844
そうだよ。
番号順に実行していって、コンマついてるやつはオプションだから、使いたいやつだけ選択して実行すれば良い [n] Use AdaBelief optimizer? ( y/n ?:help ) : ?
Experimental AdaBelief optimizer.
It requires more VRAM, but the accuracy of the model is higher,
and lr_dropout is not needed. 富岳用に最適化して走らせたらどれぐらい快適になるんだろかとか妄想しちゃう 個人で楽しむ分には結構満足できるようになってきた。
でもdstが腕と被るところは難しいね。
一つずつマスクすればいいんだろうけど手間すぎる・・・ ちなみにwikiはガイジがスレを適当に転載した、情報も古い上に未検証な物なので注意 AdaBelief optimizerのドロップアウトが要らないってことは
仕上げでやってたドロップアウトなしで最後までTRAINできる感じかな。
だったら便利だなぁ。 始めて1週間もたってない初心者にも届いていないレベルだが、
難しいこと頑張るよりもまずは正面向きのdst,srcを用意して短い動画で色々と試すほうが色々とよくわかることがわかった。
次はmaskとかも試してみたい。 ボーナス突っ込んで3090に買い替えたんだけど、学習開始時にエラー吐いて使い物にならんな
爆熱で補助電源8pin×3の電気代とか今のところ後悔しかないわ DFL頻繁に更新来てるから最新の入れた方が良いよ、あとCudaを11.1に変えるとか?
なぜかGPUでのXSegはできないけど他は3090でも動いてる 3000版はtenser使って圧縮してdataをvramに送るんだけど結構失敗してエラーでる
失敗しても24G以内に収まりそうなんだけどな
自分はタスクマネージャーでgpuメモリ使用量を見ている
失敗するとgpuメモリ使用量が増えたあとすぐに減るからわかる
そうなったらtrainバッチやりなおしている 圧縮って量子化して8bitとかして演算してるのかな >>856
コロナ禍でボーナス満額出たのか?
凄いな タスクマネージャーのgpu使用率はあてにならんぞ
よく調べた方がいい ドラッグストアは化粧品とかヒゲソリとかの売り上げ減ったべ 今年の8月からアップデートしていないのですが、した方がいいですか?改良されてますか? 賞与の満額っていうのがよく分からん
業績により変動で決まるんじゃないのか?満額って何ヵ月?3ヶ月?
うちは去年夏 3.5 冬 3.7がコロナのせいで夏3.0 冬 2.5という大打撃受けたから
賞与だけで年収60万以上下がってしまったわ久しぶりに額面3桁切ってしまった batファイルの末尾に<~.txtと書いて、予め設定を書いておくっていうやり方をここで教えてもらってずっと助かってるんだけど、
これの仕様についてどうやれば勉強できるか誰か教えてくれない?
自分で調べてみようと思ったんだけど、検索ワードが分からなくてヒットしない… >>873
上級国民かな?
でもそれならこんなアプリに嵌る筈ないだろうし >>875
上級国民でもなんでもない
ただの変態おっさん庶民
東京じゃないけど都市部で30半ばにもなればこの程度普通におる
休日出勤が結構多かったから税率23をギリギリ維持してしまっただけ
上級国民なら年収1500万は少なくとも越えてないと
寝取られ趣味だけど嫁にそんなこと頼めないからコッソリお気に入りの体と入れ換えて妄想楽しむしかないただの変態よ デフレの前は年収600万が普通だったけど、今は年収400万が普通だそうだぞ
年収600万は高収入の部類
自分も年収600万は結構残業の結構中年でようやくだった様な
昔でも残業しても年収800万は無理くさいぞ
地方都市。IT企業 大学生、無職、SE、都市部一流企業社員、地方都市IT企業
よし、全員いるな 都内の男性正社員平均年収が695万なのに何故そんなに嘘扱いされるのか良くわからない
地方都市といっても全国トップ5に入る都市だからってのもある
給与明細は会社バレるからこれでも良いかな?
年収=収入が合わないのは贈与税かからない範囲で毎年親が送ってきて、相続税無くすためと株の配当金があるから
後12月の給与30万後半足してこの手取りから税率計算すれば年収700万も賞与の月数も嘘じゃないと分かって貰えるかな?
決して上級国民でもなんでもない
ただの庶民だし平均レベル
http://s.kota2.net/1608189932.jpg スレチなことに気づかない程度の頭の持ち主だからじゃない? そもそも平日の昼間に何言ってんんだコイツ
いいからハロワ行け ここの住人からしたら旧石器時代の話かもしれないが
DFL1系から2系にアップデートしたら、一見同じパラメータなんだが
化け物が生成されるようになった
srcもdstも全部同じで新規に学習しても
2系だと特定画角、それが困ったことに正面であることが多い、が化け物化する
個々のinterationのスピードは上がってるから、何かを犠牲にしてるんだろうな
結局、今でも1系動かしてるわ megaからRTXバージョン消えたね
まだまだ時間かかりそうだし気長に待つしかないか じゃあ今の20201216バージョンって3000シリーズ非対応なのか
また更新されたと思って喜んでたのだが。 >>886
初期設定の数値の割り当てが悪いとかじゃないか? 新しく始める時はフォーラムにあるpretrain済みのモデルデータを使えば
設定もされてるし失敗しないと思うんだけど
気に入らなければ他のを使ってみればいいし 更新入れたらliae-udがデフォルトになってるんだけどこっちが主流になったのかね?
今後のことも考えると早めに切り替えておくべきか 08_02_2020だけど、liae-udだと似ないと言うかdstのままの物があるのだが
df-udだと似るやつも
dst×dstの学習はliae-udの時のみ有効な様な。df-udだとMaskしてくれない様な >>881
何で給与がそんなに少ないのに一時所得が多いの?
株の配当金も譲渡所得とかでは無いの? 初めてこのスレ見つけました。よろしくお願いします。
自分は3090使っていますが、対応されて問題なく出来ましたよ。 おお、ついに3090で動くようになったか 帰ったら試してみよう 3090*2でSLIして見たいですが、電源が。。。 だめだうちの3090では最新版でもやはり、顔抽出途中で止まった。また待ちます。 >>899
3090でXseg trainが途中で止まってたけど
ドライバ最新にしてWin10の設定でGPUスケジューリングを有効にしたら正常に動作するようになったよ >>900
アドバイスありがとうございます。gpuスケジュールonで止まらなくなりました。
しかし速度は激遅ですね。次のbuildに期待します。 たしかにXsegでは止まってしまいますね。。確認不足でした。すみません。どうやらTensorflowの問題らしいです。 3090だとエラー出るのかな?
最新ver試してないけど3070なら一か月ぐらいにmegaにあった3000buildだとエラーなく最後まで出来たんだけど
顔の抽出が凄い遅かったのはあったが
>>894
マネーフォワードがデフォ設定だと賞与が一時金扱いに分類される
手取り150万の年間賞与だと額面200万くらい
給与が330万手取りなので額面だと約400ちょっと
会社で財形貯蓄や会社主体の保険入ってると天引きされるから実際はもう少し多いと予想
確かに700万前後あるだろうけど、ここで披露したからどうだと言う話
あと必死に乏してる奴等はそれ以上に惨めだが どうでもいいがMFは手入力できるから自分の好きな金額にできるぞ 3090動いてる人うらやま
うちの環境じゃ相変わらずエラー吐いて学習始まらないんだよなぁ
[Place models and optimizer on GPU]切ると、vram50%ぐらい使用しながら一応動くけど
CPU使用率半端無いし遅いしで使いものにならないし そんな事より素材スレか合成レシピを書き込むページを誰か作って >>903
源泉徴収票とか個人情報消してうpでもすればいいでしょ
今年のはまだか 俺の1080じゃ更新無理かなと思ってたけど一応build_12_16_2020落として使ってみた
liae-udのres192だけど、今の所モデルそのまんまで速度も変わらず使えてる
lr_dropoutが無くなったので代わりにAdaBeliefを使うのが変わった点だろうか 3月の下旬にリリースされたバージョンでずっとやってるんですが、今時のバージョンは、顔の抽出精度も向上していますか?
今使ってるバージョンだと、連続シーンなのに、顔が抽出されないコマがあったりするので、向上しているなら久しぶりにバージョンを上げようかと思うのですが。 私の場合は3000buildの12月のバージョンが出ていたのでダウンロードして使っています。XSegのトレーニング以外はきちんと動いています。ただ顔の抽出がたまにおかしくなりますね。 まだやってないけど顔の抽出は俺が使い始めた去年の春ぐらいから基本何も変化がない 顔抽出の精度とかはDFLの範疇じゃないでしょ
別の人の研究のS3FDとかのモデルの顔のバリエーション、Train具合次第では? >>914
ありがとうございます
やはりそうなんですね >>915
S3FDがdflの作者と違うのは知ってたんですが、そろそろバージョンアップされてないかな〜と思いまして
S3FDの精度が高くなれば、ずっと作業が楽になるのに…というかmodelが鍛えられてしまえば、debug作業しか時間は取られないわけで 質問
初めて動画作成まで行ったんだが、完成した動画の顔がボヤケててそもそもSRCの顔が適用されてない気がする
trainは12時間やったんだがこれって何が原因? train何時間とかじゃなくてpreviewの顔とloss値見ろ
ついでに言うとpretrain済だとしても12時間じゃ足りない >>918
trainは時間じゃなくloss値を見よう。
loss値が0.2を切るくらいでやっとまともに見れるかなって仕上がりになるから lossが分からないのは草
そのレベルだったらもう無理だわ >>918
最初はそんなもん
何回かやればAIが学習する pretrainってのはトレーニングの再利用ってことだよな? 何回かやれば、ってその何回もやるのが無駄すぎでしょ
たかだか2分の動画でなんで100時間かけないとあかんねん
これがAIの最先端って?笑わせんな まともな社会人でできるやついねえよこんなもん
aviutlと同時起動で双方の効率終わるし使えるのは寝てる時だけ
そうなると電気代が終わる まあそれはそれとして
1220出た
lr_dropoutまた使えるようになった
目と口が優先できるオプションになった >>927
同じ動画を何回やっても学習しないぞ
人物を変えて5回やれ2回目からは1時間でいい >>927
百時間掛かるとしたら、お前の環境がしょぼいか、やり方が下手なだけだわ
つうかDFLの内容は最先端ではない。例えば、最先端の論文検証を民生用のグラボ一枚でやろうとしたら試算上で一年とかざらだぞ、アホらしくてやらないけども。 >>930
その辺りが興味あって知りたかったんだけど、
別素材(dst、srcとも)で回してもAI自体はどんどん学習していくの? だれかグラボ3枚で顔抽出やった人いる?
適当なグラボ2枚で動くのは確認した。
(今のところ3080で顔抽出が一番遅いからなんとかしたい) 人物変えて、のくだりがよくわからん
それってフォルダーにdstの名前のやつ入れてtrain削除して〜、っていうのを繰り返すのか?
だとしたら、よくわからん不出来な素材で試してた結果、経験積ませたと思ってたが実際はできてなかったとかあるんじゃないの? dstじゃなくてSRCだったわ
あと、その過程はworkにある1234567の全部をやっていかなくちゃだめなの?
できることならtrainは最小限でやりたいんだが わざわざ答えるやつがいるからこういう流れになるんだよ 試験的な実装をしているとか、それこそ少し上でも出たような「一部のアルゴリズムを最近のものに変更しました」みたいなforkってあったりするの?
見てみようと思ったら、forkの数が5.1kとかあって見る気が失せた。 Eyes priority is replaced with Eyes and mouth priority,
Helps to fix eye problems during training like "alien eyes" and wrong eyes direction.
Also makes the detail of the teeth higher.
New default values with new model:
Archi : ‘liae-ud’
AdaBelief : enabled 試行錯誤もせず自分の不勉強を棚に上げて勝手にキレ始めるやつにはそもそも向いてない
諦めろ 訓練って、そもそもどうやるのかわからんのだがチュートリアルとか今ないのか?
違う人物5人でやるにしても1人何時間やるのか、どのデータを消してどれを残すのか、どういう動画をやるのかとか重要な点がない 久々に復帰したけどDeepFaceLab_NVIDIAってやつエラーで動かんわ
前使ってたDeepFaceLab_CUDA_9.2_SSEは動いたけど、最新版に乗り換える意味ってある? >>943
youtubeに外人が山ほどチュートリアル動画上げてるけど
自動翻訳で字幕も出せるしそれ見てこいよ
わからない単語はググってください
界隈特有の単語や意味はありません
DFなんて自己満足の極みだから君がほしい何を何回、何時間とかの正解なんてある訳ないんだよ >>943
wikiもマニュアルもあるからまず電子辞書買ってこい どんなにAIの最先端であっても使い手がこれじゃね
豚に真珠 このスレって一体なんの為にあるのかわからんよな
俺も初心者の頃なんの利益にもならなかったよ >>945
youtubeで検索、再生順の上から3つ見たけど日本語字幕なんて1つもできない
エアプは黙っててくれないかせめて maskの修正するときにtrainされたmaskの形から修正できたらいいのにってすごく思う。 すごく初心者的質問になるかもしれないが、ぶっちゃけ、学習してモデルをつくるという仕組みをよく理解できていない。
いろんな角度の画像を覚えこまして、新しいはめ込む動画のもとの顔がこういう角度でこういう表情だから、data_srcのか中に顔の中で一番いいやつを探してきて、これをコラするよ(場合によっては目はこの画像で、口はこれがいいなとかパーツごとに判断して)、
ということなのか、それとも、いろんな角度の画像を勉強して、この顔のいろんな方向からの顔のデータを作って、この方向でこういう表現をしているdstの顔に、学習してできた顔のデータを再生するよということなんか。
どっちなんでしょう。
前者であれば、あくまでも張り付けるパーツの画像が必要なので、それがきれいでなければいくら学習してもうまくいかないが、後者なら、いったん顔のデータ作れさえすれば、あとはきれいな画像を作り上げてくれるということになる。
ゴミをいくら張り付けてもゴミのままになる。
そういう意味で、最初の素材選びは、いい勉強をしてらうというより、いいパーツを集めることにも影響するから最重要ということなるよね。
どっちなんでしょう? >>954
俺も最近やり始めながら同じことを悩んでたわ。
どちらかというと前者なのかなと思ってる。
だから素材選びは大事なのかなーと。。。
loss値が小さくなるってのがAIさんが今ある素材で限界までがんばりました。
ってことか思ってる。
あってるんでしょうか?こういうことはマニュアルにも書いてないから気になる。
教えて!詳しい人! 前者。瞬きしてない src ばかり集めたら瞬きしない result しか出来ない
モデルというのはモデリングしたもの、ではない >>956
例えば、笑顔のdstなのに泣き顔のsrcしかない場合って
能面になったりするの? AdaBelief結構すごいな
ちょっとアルゴリズムが変わっただけかと思ったら、学習かなり速いんだね 後者だよ。
ただ3Dとかパーツごとの意味を分かって描いてる訳じゃない。絵として判断してsrcっぽい絵を生成してる。
ずっと笑顔なら笑顔=srcっぽい絵なんだからそうなる。
src側の出力はsrcの画像だけ学習してるから、srcに無いものは生成出来ない。pretrainしてたりモデル引き継げばそれ参照できるから結果再現度あがる。 >>954
どっちにしても素材選びが最重要なのは間違いないよ。
なんか悩む要素ある? こんなくそ知識のところで聞いても意味ないよ
初心者馬鹿にしてるやつがそもそも初心者なんだから
dstxdstもモデルの引き継ぎもディベロッパー全員否定してる
信頼できるのはdflのgithub, telegram(ロシア語)、faceswapのdiscord, 公式くらいでmrも怪しい
翻訳のやり方から勉強しな >>961
modelフォルダ丸ごと残して、あとやり直せばいいだけ。
同じdst,src使うなら、そっちも残しておけばいい。
転移学習は限られた環境でやるなら否定されることではないよ。 転移学習とmodelの使いまわしの違いがわかってないから言ってんだよ
間違った知識を広めてるという自覚を持ってね だから自分で調べろって書いてんのにそれを否定してんのがこの質問者なんだよ >>963
ってことはDSTって名前の動画が何個もあって良いってこと? data_dst
data_dst_A01
data_dst_A02 触ってみてから質問すればいいのに触りすらしないから理解もできない 質問に誰も答えれてない時点で自分以下のバカしか居ないんだからここで聞くだけ無駄 >>962
dstxdstはXseg Maskさぼった時に、liae-udでは有効だったけど
df-udでは無効
モデルの引き継ぎが無効とは、モデル使いまわしが無効だとでも?
いちいち新規から学習なのか?
フォーラムに上がっているTrain済のモデルの意味合いは?
Pretrainも無効なんでしょ 間違った知識は訂正しても他人が賢くなるだけだからそのまま放置するのが基本 作りたいのが一人だとしてもそのsrcだけじゃなく色んな表情や画角を学習させないと自然な仕上がりにならない
アイドルだけ作ってるやつは全部笑顔か無表情になる >>974
そうなんですよね。1人の顔でもいろんな表情で、光の当たり方、角度を混ぜたデータセットを作らないと綺麗なのは出来ないですね。しかもデータセットが大きすぎても結果は悪くなるので綺麗な画像をちゃんと選ぶのがコツかと。 大半が>>972みたいな馬鹿だからなんの議論にも発展しない
事前学習、転移学習、ファインチューニングとモデルの使い回しは違う
おま環であーだこーだ言ってるだけのクソスレ
匿名でやってても誰が正しいかもわからないでしょ?下手くそ量産するだけだし、初心者にも害悪だからこんなスレやめた方がいいよ 何か聞きたいならTwitterの職人で優しそうな奴に聞けってそれ一番言われてるから このスレ無くせ、とかいうくせ、ちゃっかり定期的に見に来るんだぞ
すまんが議論はよそでやれな?
ここは討論会じゃねえよ >>954
素材がいいに越したことはない
これはまさしくその通りなんだけど、srcを一つの動画ファイルから作るだけでいいのか、できるだけいろんなものから作ればいいのか、
抜き出しのfpsは30で全フレーム出したほうがいいのか、よくないのか。
あるいは顔を動かしてぶれているような画像は、画像としては微妙だけど、動きのコマとして有用なのか。
そもそも学習させる元のファイルは多ければ多いほどいいのか。
ほぼ重複しているような画像は必要か、不要だとしたらどれぐらいの違いがあるか。
とか、色々最近悩んでいて、一通りモデル作ってみたんで、量産に入りたいなあと思い、
そのためには、モデルの作り方の最適解を探したいなあと思っとるんです。
限られたパワーで、モデルの解像度に振り分けるのか、liaeモデルを使うほうがいいのか、バッチサイズを優先してあげたほうがいいのかなど、色々むずかしいですなあ。 そのためにも、ある程度構造を理解しないといけないなあということになって、ぶっちゃけ今更ながらよく理解せずにつくっているなあと。 十分素材が充実(表情、角度的な意味で)してるなら一続きの動画で構わないけど実際問題難しい、ドラマの主演で1シーズン分素材があるとかなら話は別だけど
抜き出しは30fpsも要らない、10以下で抽出してさらにボヤけてるものとかを間引けばok
ボヤけてるsrcは不要、dstがボヤけてればmergeで勝手にボヤける
正面付近のシーンをメインで作るならdf、側面などもしっかり作りたいならliae YouTubeで海外非エロdeepfakeを作ってるShamookって人は、映画3作くらいから顔を抽出してるらしいです。srcは大体8000枚(ぼやけてるやつ、同じような物は間引いて)で、トレーニングしてて、300万回くらいiterしてましたよ。参考になるか分かりませんが。。 DVDとか変えたら髪型、化粧変わってもはや別人なのにこれでもデータは多いほうが良いのか、それとも似てるやつだけを取捨選択したほうがいいの? どれだけ集められるかにもよるけど可能なら自分の思ってるイメージに近いメイクだけにしておいた方が無難。明るさとか色合い表情画角は多彩にな。5fpsで似た画像は削除してる。目閉じてるの足りないこと多いからそこも忘れずに。
どうせ議論厨に間違ってるって言われるんだろうけどなw >>984
髪型は関係ないと思います。ただ化粧は影響してくると思います。なるべく同じような化粧で、違うアングルや表情、ライティングを集めた方が無難かと。ただ違う化粧(ギャルvs清楚)見たいなデータでトレーニングしてないのでなんとも言えないですが。。 もし、Pythonが使えるならPySceneDetectお勧めです。これで映画をシーンごとに分割してくれるから、やり易くなりますよ。 >>982
fps低いと目をつぶってるシーンがうまく抽出できないから
フルで抽出してから減らすほうが良いと思うよ 映画とかで使えそうなシーンをカット編集しても10分〜多くて20分程度にしかならないから
コマ送りして一枚ずつpng出力してるわ
ピンボケもすぐ分かるし瞬きの瞬間は細かくとか動きのないシーンは飛ばしてとか
直感的に操作しやすいから取りこぼしも少なくなるし
分割した数万枚の画像とにらめっこするより作業が雑になりにくく少ない枚数で質のいい素材を集められる
まあどうやるかは好みだけど みんなすごいなあ
誰に見せるでもないから適当に拾った5分くらいの動画を30fpsでバラして
顔抽出出来てるのは全部使ってそれで作ってるわ
なんならdstも正面中心で編集して面倒そうなシーンは端から切ってる
さっきTBSでやってた山里の眼鏡ごとsrcにするのとかめっちゃ面倒そうやな これもう次スレ要らないぞ
更新速報や3000番の報告なんかは有用だったけど
他はもう何回目だよって同じ話しかしてない ここでキレて喚いてる無能者の問題点は、門外漢の無知無能が
いきなり裸でポークビッツ握りしめて正座してるってとこなの。
猿や金魚の刷り込みみたいに覚えたトコロで、ロクなモンは出来ないし
RTX3090がどうこうってのはヘタコの手抜きに貢献するだけ。
ワカランうちは、遅いGPUで速く学習出来るデータセット作成の腕を磨く方が身のため。
ぶっちゃけ、適切な画像とランドマークのデータセットなら
1.0のCPUでもDF128なら数日でモノになる。
1.0終盤に追加されたコンバート時のGAN系の高精細オプションは
通常の倍程度のコンバート負荷のみで抜群の性能を発揮するから、
FHD中サイズでも128でカバー出来る精細さを実現してるし。
加えて、他の動画編集ソフトを使いこなせる知識と各種フォーマット知識も無いと
どれだけ良いマージ画像が出来ても、色合わせや輪郭合わせが上手く出来ない。
この知識があると、単純にオーバーレイの各種マスク処理を使わずにLeraned輪郭でマージデータ出力が
出来るから、マスク準備不要且つトレイン・マージデータ出力が異様に速く済む。
アルファマスク出力指定で、動画編集ソフト側で色合わせ・マスク・輪郭ぼかしをやると
多少の異常フレームもキレイに直せるし、
そもそも元データのDst作成時に顔のみの部分出力と不要な他人等をマスク消去して
必要フレームのみ出力出来るから、Extractでの誤認識もほぼ解消出来る。
要は初心者をバカにしているのでは無く、そういった総合的なPC映像知識がAI以前に必要なんだよ。 このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 289日 20時間 11分 49秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。