Stable Diffusion

■ このスレッドは過去ログ倉庫に格納されています
2022/08/27(土) 11:48:52.94ID:ObII5skl0
GitHub - CompVis/stable-diffusion
https://github.com/CompVis/stable-diffusion

Stable Diffusion - a Hugging Face Space by stabilityai
https://huggingface.co/spaces/stabilityai/stable-diffusion
2023/04/21(金) 20:12:28.07ID:4MfI1luo0
呪文だけじゃなかなか思い通りのポーズにならないな
棒もなんか違和感出るし
今んとこネットで好きな画像拾ってきてキャニーするのが一番らしくなる
244名無しさん@お腹いっぱい。
垢版 |
2023/04/21(金) 21:31:13.34ID:JabvAZGq0
なるほど、、、>>242
AIにも聞いてみたけどテンソルデータが入ってると
意味わからんからテンソルって何か小学生にも分かるように言うてくれや
と言ったけど小学生には難しいかもしれませんといわれた
そこまで言われると少しは勉強したくなりました
2023/04/22(土) 09:43:02.19ID:iIBwHpeM0
テンソルはベクトルのもうちょい高度なものと考えればいいよ
2023/04/22(土) 11:02:44.46ID:PAZL9Eed0
普通の画像だってデジタルなら1と0の連なりであって実体としての画像があるわけじゃないよね
それとどう違うんだ?
2023/04/22(土) 11:08:40.89ID:gdjAq4x20
>>241
中身見れるユーティリティあったような気がするが
2023/04/22(土) 21:17:44.56ID:HLDWdz0i0
AI未経験だけどloraってやつでキャラクターを学習させてイラスト生成をやってみたいんだけどプログラミングとかの知識はいらない感じ?
2023/04/23(日) 05:41:12.46ID:TbCEwpcF0
>>248
プログラミングとかは一切必要ない
2023/04/23(日) 09:28:54.59ID:o3yNw0Y50
>>249
ありがとう
昨日から調べはじめたけどちゃんと一式インストールすればある程度はつくれそうね
2023/04/23(日) 18:01:32.19ID:mm5/uaLx0
ポストの情報とシードとかモデルのハッシュまで同じにしてるのに出力違うのはなんでだろう?
あとはVAEの違いくらいしか無さそうなんだけど、それも違ってるのかどうか
グラボとかハードの違いに依存したりする?
2023/04/23(日) 18:54:52.45ID:TbCEwpcF0
>>251
同じのを作りたければコピーをすれば良い
2023/04/23(日) 19:04:08.79ID:3GpYAG050
>>251
pink板かどっかで同じような話みたけど、A1111の設定のどこかのチェックボックスのON/OFFとかでも
出力変わったりするらしい
2023/04/23(日) 23:44:51.52ID:LQkq8bKD0
clipskip数値でも全然違うのでてくるしな
civitaiとかの同じ絵生成できることあんまないわ
2023/04/24(月) 01:56:21.87ID:XTwE7abO0
生成データをちゃんとインポートできてないだけじゃね?
わざわざ手で数値入力したりしてない?
2023/04/24(月) 02:33:30.91ID:NjsCvDPj0
>>251
あれが生成情報の全てではないから
起動オプションでも絵柄変わる物があるし
additional network経由だと使ったloraが残らない
ただのネガティブプロンプトの文言に見えるものが実はTlとかもある
2023/04/24(月) 14:51:12.25ID:9h9fYy/o0
googlecolabとWebUI両方試したけど、WebUIだとサイズ700×700くらいですぐ固まっちゃう
コラボだと1000くらいでも割りといけるのに
こんなもん?
2023/04/24(月) 15:03:39.10ID:XTwE7abO0
VRAMが6~8GBならそんなもん
2023/04/24(月) 15:19:39.01ID:7cHdR7DM0
顔修復の重み設定って0が最大で1が最小だということに今気づいた
道理で効果ねえわけだ
ずっと1で使ってたわw
2023/04/24(月) 16:42:28.87ID:I1f2DiId0
>>259
詳しく
2023/04/24(月) 17:40:21.90ID:7cHdR7DM0
詳しくも何も使ってればわかるだろ
262名無しさん@お腹いっぱい。
垢版 |
2023/04/24(月) 18:59:05.22ID:pvm4aIOz0
https://twitter.com/pink_engineer_/status/1650098289679949826
これってほんとにAI画像?
https://twitter.com/5chan_nel (5ch newer account)
2023/04/24(月) 19:16:00.46ID:ph0B+SkU0
>>259
顔修復を詳しく
2023/04/24(月) 19:39:10.20ID:7cHdR7DM0
そんなことよりさ、誰かこういう拡張機能作ってくれ

任意のサンプリングステップ範囲(例えば30~50とか)と任意のCFGスケール範囲(例えば4~7とか)の全組み合わせ、つまりこの場合だと21x7で147通りを自動で生成するの

手動だとめんどくさすぎるわ
2023/04/24(月) 19:46:06.03ID:14mgPl2W0
デジケット
とらのあなで
実写風ロリ
2023/04/24(月) 19:47:15.90ID:WFx/kFkM0
>>264
ステーブル ディフュージョン WEB UI のことだったら
WEB UI なんで Web プログラミングすれば良い
267名無しさん@お腹いっぱい。
垢版 |
2023/04/24(月) 20:21:47.49ID:hZj81C6j0
>>264
xyz plotじゃあかんの
268名無しさん@お腹いっぱい。
垢版 |
2023/04/24(月) 20:24:22.98ID:sHtIecOn0
実写用の衣装loraってどう作りゃあいいの?
chilloutをベースにして作ってるけど、着せようとしたらどうしても顔が北斗のモヒカンみたいにボコボコになる
2023/04/24(月) 20:27:59.28ID:RMSy1yOS0
faceなんとかめぬーあるでそ
2023/04/24(月) 20:29:00.09ID:7cHdR7DM0
>>267
すまん、知らんかった
ちょっと使ってみるわ
271名無しさん@お腹いっぱい。
垢版 |
2023/04/24(月) 20:29:23.35ID:sHtIecOn0
restore faceとかネガティブプロンプト当ててもだめだった
2023/04/24(月) 21:07:57.69ID:7cHdR7DM0
xyz plotやってみてるんだけど、もしかしてこれって全画像が1枚につながって出力されるわけ?
2023/04/24(月) 21:12:39.79ID:7cHdR7DM0
縮小されて出てくんの?
等倍じゃ巨大になって無理だよねえ
2023/04/24(月) 21:17:59.55ID:7cHdR7DM0
ちゃんとバラで生成されてるわ、よかったよかった
最後に縮小版をまとめたのが出力されるのかな
あと数時間かかりそうなんで明日起きたら見ようw
2023/04/24(月) 23:13:25.17ID:t8SN+pa/0
>>262
肩の紐が時々消える。
2023/04/24(月) 23:30:28.74ID:c2CMe3Qf0
>>262
この動画を見た多くの人が「踊ってる女の子」って打ち込んだらこの動画が出て来ると勘違いしてそうで恐ろしい
2023/04/25(火) 06:02:24.51ID:5V8i37TL0
>>275
スローで見たけど、手で隠れてるだけに見えるぞ
278名無しさん@お腹いっぱい。
垢版 |
2023/04/25(火) 06:31:56.85ID:2v4oPIGF0
不自然といえば膝の辺りだけど、実写にちょっと加工施せばAI動画みたいになるじゃんと同時に思う
279名無しさん@お腹いっぱい。
垢版 |
2023/04/25(火) 17:10:30.74ID:QMZsen4Q0
同じ描画の口開いてるverと閉じてるver作る場合、シード値固定してハイレゾ0.2〜0.3とかが良いのかな?要は立ち絵欲しいんだけど他に良いやり方ある?
carryは無理で困り中、アドバイス求む
2023/04/25(火) 17:22:49.40ID:x3YObphL0
ちょっと何言ってるか分からない
2023/04/25(火) 23:17:33.34ID:TvMuo6fE0
chatGPTに
「StableDiffusionに詳しい人を困惑させるようなイミフな質問考えて」
って頼むと出てきそう。
2023/04/26(水) 06:00:47.36ID:VRsJUCaP0
>>279
StableDiffusionに詳しくないので
いい方法かどうかわからないけど
口の部分を隠した画像を読ませてガチャるという方法がある
2023/04/26(水) 10:38:45.92ID:5hQtPUMA0
>>279
口を閉じた画像ができたらそれをinpaintへ送り、口だけマスクして

「masked content(マスクされたコンテンツ)」は「fill(埋める)」
「inpaint area(inpaintを行う領域)」は「whole picture(画像全体)」
プロンプトは「閉じた口」を「開いた口」に変える

これでいけました

https://files.catbox.moe/rqlf04.jpg (txt2imgで生成)
https://files.catbox.moe/63kelq.jpg (img2imgのinpaintで生成)
画像はメタデータ入りなのでPNG Infoに直接ドラッグ&ドロップすればパラメータが読み込まれます

質問はこっちのほうが人が多いですよ

【StableDiffusion】画像生成AI質問スレ9
https://mevius.5ch.net/test/read.cgi/cg/1682213108/
284名無しさん@お腹いっぱい。
垢版 |
2023/04/26(水) 12:08:05.71ID:IC5JnQom0
>>283
おぉぉ!凄い!これを知りたかった
今日早速挑戦してみます
あざす
2023/04/26(水) 13:31:30.10ID:mTUCUwes0
通りすがりだけど、おかげでインペイントの使い方がわかったわ
286名無しさん@お腹いっぱい。
垢版 |
2023/04/26(水) 13:56:36.16ID:7crcaYPE0
>>283
助かるンゴ
2023/04/26(水) 16:40:23.36ID:LtcaSxQE0
メタデータ保持させるとなんか悔しいからjpgにしてるンゴ
2023/04/27(木) 01:33:13.62ID:fw+0MYZw0
ツイでタグ検索したらAIグラビアばっか出てきて萎えるわ
みんな同じ様な顔で乳デカくしとけば良いって画像ばっかりで見飽きた
2023/04/27(木) 21:08:33.86ID:snXpRt8y0
そういう垢はバンバンブロックしてる
290名無しさん@お腹いっぱい。
垢版 |
2023/04/28(金) 14:40:28.07ID:izfVYyq00
キリッ
2023/04/28(金) 20:42:29.88ID:4oxTlZYN0
レイッ
2023/04/29(土) 07:56:44.26ID:Q/ZGZfjE0
チャクセキ
2023/04/29(土) 09:06:48.99ID:xzQvbZXr0
>>290-292
wwww
2023/04/29(土) 12:08:53.05ID:VGY++ERw0
は?
2023/04/29(土) 18:20:31.78ID:fVGc7Qvz0
ガッキー作ってたらエビちゃんができた
なんでや畜生
296名無しさん@お腹いっぱい。
垢版 |
2023/05/02(火) 04:43:03.71ID:A0wVfU/g0
グラボによって、全く同じ設定でも吐き出す絵が違うって以前どっかで見たんだけどマジ?
2023/05/02(火) 07:21:33.78ID:5kl3Nqeh0
>>296
ゆらぎがある
2023/05/02(火) 07:33:08.10ID:WO2rFsAL0
インペイントの件
マスクのみでも画像全体でも変わらない気がするんだけど
2023/05/02(火) 07:47:53.09ID:G7JBLLui0
>>296
メモリマッピングの違いで異なる場合はある
xformersやmedvram設定などはその影響を受けている
丸め誤差の収束方法で違いが出ることがある
サンプリングの「_a」付きはその影響を受けるものであるという意味らしい

完全バニラな理想状態では理論上異なることはない
(アーキテクチャ自身は内部で捻出した乱数を使っていない)
2023/05/02(火) 08:29:35.11ID:WO2rFsAL0
高収入のバニラですね知ってます

って書き込むついでにちょっとググったら、アレのプラモなんてあんのな
終わってるわこの国
2023/05/02(火) 09:48:45.13ID:PfQXRPkv0
>>300
https://pbs.twimg.com/media/E7X-R5SVgAE-sKH.jpg
2023/05/02(火) 14:58:23.71ID:/SoI7ZxI0
>>298
https://www.reddit.com/r/StableDiffusion/comments/11kme9m/basic_guide_8_inpainting_how_to_fix_bad_hands_in/jb9an5b/?context=8&depth=9

んにゃぴ・・・
2023/05/02(火) 21:04:34.53ID:NhwkhojS0
初歩的な質問で申し訳ない
Sampling stepsによる違いを調べたいのだけど
X/Y Plot使って調べる時にたとえば5ずつ40まで調べるとすると
1つの画像生成について5ずつステップ刻んだ時点でのスナップショットみたいなものを出力してくれるのか
それとも5,10,20,...と8枚の別々の画像を作成するのか(つまり、ステップ数の合計は5+10+15+...+40=180になる)、どちらなの?
304名無しさん@お腹いっぱい。
垢版 |
2023/05/03(水) 06:17:08.68ID:qIU6fD6g0
お気に入りの顔が出てきたけど、LORAで学習させるには、20枚とか必要みたいで、ガチャで同じ顔を出しまくるまでやるしかないですか?
2023/05/03(水) 11:01:15.15ID:ATeUXNAX0
>>304
pnginfoで希望する画像の情報をt2iに転送
seedを固定(t2i転送の時点でそうなってる)して、右にあるExtraをチェックオン
Variation seedを-1に、Variation strengthをお好みの数値に

これで学習させたい枚数の4倍程度出力させたら希望に沿える状態になる?
一度お試しください
306名無しさん@お腹いっぱい。
垢版 |
2023/05/03(水) 14:54:49.09ID:qIU6fD6g0
>>305
ありがとうございます
やってみます!
307名無しさん@お腹いっぱい。
垢版 |
2023/05/03(水) 15:02:47.38ID:EJJBi9Gz0
>>305
ほー、勉強になりました
308名無しさん@お腹いっぱい。
垢版 |
2023/05/03(水) 16:59:20.29ID:2gD3VEf30
masterpieceが完成するまでにmasturbationに至ってしまうんだが世の作家もこんな気持ちなんだろうか
309名無しさん@お腹いっぱい。
垢版 |
2023/05/03(水) 18:11:21.90ID:srKuSHXp0
Loraのトリガーとか、あれはおまじない程度と思っといていいのかな。
覚えきれないわ…。
2023/05/03(水) 18:18:27.91ID:aSbIiEAR0
ものによっては指定しないと全然でない
2023/05/03(水) 18:25:51.82ID:DIa6toyq0
埃被ってたゲーミングPCに入れてみたけどすげえなこれ。100枚くらい生成するまで本当に生成してるの信じられんかったわ。
2023/05/03(水) 18:33:55.51ID:Fkmt2P/x0
特定の人物の顔とかだったら必須
トリガーじゃなくて普通にloraポチーで強さ決めてやってるけど普通に使えてるから覚えなくていいんじゃね
名前だけじゃ分かんなかったら、代表的特徴がでてる生成物とかを同じlora名.pngで同じフォルダに保存すれば画像で分かって便利
313名無しさん@お腹いっぱい。
垢版 |
2023/05/03(水) 19:35:11.22ID:BErl1LLh0
トリガー、使ったほうがいいとは思いつつ、単純に覚えられない。
メインのトリガーだけならまだしもアクセサリー類のトリガー付きで一つのLoraで5個以上も設定されてるとしんどい。
毎回Loraのページ見て入れてはいるけど。
2023/05/03(水) 20:39:49.14ID:ATeUXNAX0
>>313
その手間をやってるんだったら、もうひと手間

LoRAファイルと同名のtxtファイルを作成し、そこにトリガーワードを記述
作ったtxtファイルをLoRAファイルと同じフォルダに移動

こうすれば、花札の画面で一目瞭然になる
txtはそのまま表示されるので、注釈を書いておいてもいいし、サイトの説明文を書いておいてもいい
2023/05/03(水) 20:42:00.30ID:ATeUXNAX0
>>313
追加
花札画面に表示されたテキストをドラッグで選択できるので、コピー(CTRL+C)でOK
2023/05/03(水) 22:57:42.95ID:YQvnn5FR0
こういうAI絵描きってフリー素材絵を生成できるの?
317名無しさん@お腹いっぱい。
垢版 |
2023/05/03(水) 23:50:15.05ID:IAPJzN+w0
>>315
テキストファイル作っとくと、サムネの下にひょうじされるんだね。
これでだいぶ便利。有難う!
2023/05/03(水) 23:54:09.97ID:DIa6toyq0
たまに明らかにAVのパッケージ画像を学習したやつ出てくるな
319名無しさん@お腹いっぱい。
垢版 |
2023/05/04(木) 01:26:51.58ID:nOkbBOVu0
導入した時より、パフォーマンスが落ちるのが早くなってきてる気がする。
モデルやLoraとか拡張機能を入れ過ぎると重くなる?
2023/05/04(木) 04:30:08.15ID:KZ/vhpHH0
>>316
できる
2023/05/04(木) 07:24:47.50ID:Hg+Y1aF90
>>316
逆に言うとフリー素材しか出ないぞ
2023/05/04(木) 07:35:13.36ID:+l//nnt80
浅学が想像でテキトーなこと言いなさんな
使うモデルのライセンス次第だから
2023/05/04(木) 09:00:19.28ID:Hg+Y1aF90
ああごめん、そういう議論はもう面倒いからいいです
2023/05/04(木) 09:12:07.72ID:jWz3KMAk0
キミの間違いを諌められているだけであって、議論なんて誰もしていない

知らないことを背伸びして語るクセは社会に出る前に直した方がいい
自分も周りも苦労することになる
325名無しさん@お腹いっぱい。
垢版 |
2023/05/04(木) 14:27:19.15ID:RL7U2/ak0
初心者なんだが
デプスマップライブラリを導入後にモデルvaeプロンプトseed値その他設定項目を同じにしてるのに導入前と生成結果が変わったんだが同じ現象が起きた人いる?
326名無しさん@お腹いっぱい。
垢版 |
2023/05/04(木) 16:28:33.28ID:MSQcP05L0
>>325
ワイも初心者だけど、xformers導入してると変わるって聞いたことある
seedはあくまで最初のノイズ生成に関わる値ってどこかで見た
2023/05/04(木) 17:28:38.69ID:KZ/vhpHH0
>>322
そんなこと言い出したら
日本語の書き方から説明しなくちゃいけないのか
328名無しさん@お腹いっぱい。
垢版 |
2023/05/04(木) 22:35:48.66ID:RL7U2/ak0
自己解決した
導入後再起動したはずだが改めて再起動したら治ったわ
>>326
サンクスxformersは導入してる
最初のノイズが一緒でその後の除去過程が同じつまりvaeとプロンプトその他設定がもろもろ同じなら生成結果に大きな影響はでないはずだよ
2023/05/04(木) 22:57:29.99ID:gtZE/ya90
久しぶりに更新来てたけど拡張が使えなくなったとかそういう話はあるのかしら
2023/05/07(日) 09:16:13.28ID:LHNd9Lw90
WEBUIの初回起動時
フリーズするんだが(´・ω・`)
2023/05/07(日) 09:25:55.60ID:l5X867v90
それは悲しいね(´・ω・ω・`)
2023/05/07(日) 10:12:46.61ID:vePTAYmY0
>>330
再起動してくれ\(^o^)/
2023/05/07(日) 14:05:42.26ID:LHNd9Lw90
自己解決した
webui初回起動時1時間近くフリーズしてたけど
放置してれば進んだ(´・ω・`)
2023/05/07(日) 14:33:25.57ID:bTOQkf0v0
Python 最新版3.11でインストールしたらERRORでた
3.10.6じゃないとあかんぞ
2023/05/07(日) 14:59:46.70ID:KpPkaXEl0
3.10.9でも動いてるけどなんかダメなんかこのバージョン
これでエラー吐く拡張機能とかあったら入れ直そうかなと思ってたけど今のところ特に問題ないし
2023/05/07(日) 16:02:18.75ID:bTOQkf0v0
動くんならええ
公式のテスト環境が3.10.6 なら確実だよって教えてくれただけや
337名無しさん@お腹いっぱい。
垢版 |
2023/05/07(日) 20:05:58.45ID:x3YFh0IL0
>>333
そうそう、インストール時は止まって見える時間がけっこうあるんだよ
でも1時間は長いね
うちのRyzen 5 3600/32GBで10分かからないくらい
338名無しさん@お腹いっぱい。
垢版 |
2023/05/07(日) 22:23:17.10ID:PyZitM0r0
Twitterでbrav5とかいうのがめっちゃ評価高かったから使ってみたけど、ちょっと使いづらいなこれ。クセが強い。
アニメ系ののLoraは原型全然分かんないし、リアル系も個性とかは完全に潰される感じ。
2023/05/07(日) 23:49:17.59ID:PDR6o3Y50
LoRaで特定人物の顔を学習させてるんですが、サンプルで表示される画像がピカソみたいなのばっかりです(まだ2万回ぐらいしか回ってない)
これって何か間違っているのでしょうか?
顔アップのソース画像は512x512の10枚
embeddingでやっています
2023/05/08(月) 00:02:31.13ID:UTxABBsb0
>>339
ツッコミどころ満載すぎて
何を2万回やったのか
512×512を10枚って何をやってるのか
2023/05/08(月) 01:07:38.95ID:8RmSTBO80
>>340
Trainを2万ステップ(今は3万を越えてる)回した状態という事です
512x512は、縦横512ピクセルの顔画像で、それを10枚ソースフォルダに入れてTrainしているという意味です
2023/05/08(月) 01:23:51.96ID:UTxABBsb0
>>341
それはただの科学臭では?
■ このスレッドは過去ログ倉庫に格納されています
大学生アイラと影の怪物と戦うリョウが、深夜3時3分の静止した世界で交錯する超常スリラーの概要

ニューススポーツなんでも実況