【超解像】Lada part3
151名無しさん@お腹いっぱい。
2026/01/18(日) 00:00:47.24ID:eOvC2H2q0 8KVR破壊でGPUやCPUをまともに使ってくれないんだけど解決方法ある?
2026/01/18(日) 00:27:23.78ID:Nmvg66CX0
メインメモリが足りてないんじゃね
153名無しさん@お腹いっぱい。
2026/01/18(日) 01:09:07.56ID:K+IOK/vU0 CPUやGPUの使用率を100%付近まで使いたいということなら現状では方法はないと思うよ。
今より少しでも使用率を上げたいとか速くしたいの一点狙いならより高速なメモリと高速なエンコーダ積んだGPUに交換かな。
デコードは影響小さいみたい。
linuxだがHWデコードできるよう俺環依存でffmpegコンパイルし直したりutiliy内のコード変更してたりしたけど変わらんかった。
今より少しでも使用率を上げたいとか速くしたいの一点狙いならより高速なメモリと高速なエンコーダ積んだGPUに交換かな。
デコードは影響小さいみたい。
linuxだがHWデコードできるよう俺環依存でffmpegコンパイルし直したりutiliy内のコード変更してたりしたけど変わらんかった。
154名無しさん@お腹いっぱい。
2026/01/18(日) 01:38:41.58ID:cteUxRnb0 そもそもGPU、CPUをまともに使ってないって思う根拠はなんなんだろうな
20コアCPUの全部のコアのload が100%に張り付いて無いと不満なのか?
20コアCPUの全部のコアのload が100%に張り付いて無いと不満なのか?
155名無しさん@お腹いっぱい。
2026/01/18(日) 04:34:48.03ID:3Z5xFHvW0 WinでGPUの使用率を100%近くに持ってはいけるよね。
複数走らせればなるし。
一本の動画だけで100%は無理やけど、、、
複数走らせればなるし。
一本の動画だけで100%は無理やけど、、、
156名無しさん@お腹いっぱい。
2026/01/18(日) 08:28:06.23ID:eOvC2H2q0 151だけど構成は9900x、5080、ram96で
2DならGPUCPUは普通に使ってくれる
8KVRだとzelefanとundergate版両方試しても
GPU使用率10%CPU20%ぐらいしか使ってくれず7fpsぐらいしかでないから困ってる
2DならGPUCPUは普通に使ってくれる
8KVRだとzelefanとundergate版両方試しても
GPU使用率10%CPU20%ぐらいしか使ってくれず7fpsぐらいしかでないから困ってる
157名無しさん@お腹いっぱい。
2026/01/18(日) 09:09:56.86ID:K+IOK/vU0 それなら正常でしょ。i9-14900k+5080+96GBで単純にffmpegで再エンコードだけしても9fps位しか出ない。
ffmpeg使ってるladaでそれを超えることはあり得ないし。
ffmpeg使ってるladaでそれを超えることはあり得ないし。
158名無しさん@お腹いっぱい。
2026/01/18(日) 09:23:16.22ID:jMLRwqt20 解答サンクスzelefanに期待してたけどffmpegの限界みたいね8KVR破壊が実用的になるのは残念だけどladaでは無理なのかも
159名無しさん@お腹いっぱい。
2026/01/18(日) 12:49:22.49ID:cteUxRnb0 そもそも扱ってるデータが時系列のシーケンシャル構造をもつものなんだから潜在的な並列処理可能性はそんなに高くはないってのは分かるか?
basicvsrってのは一枚の絵ではなく複数フレームにまたがるモザイクの時系列的な変化を考慮して計算してるんだからな
basicvsrってのは一枚の絵ではなく複数フレームにまたがるモザイクの時系列的な変化を考慮して計算してるんだからな
160名無しさん@お腹いっぱい。
2026/01/18(日) 12:52:38.15ID:cteUxRnb0 複数の動画を並列に実行する場合は潜在的な並列処理可能性は関係なくなるが今度はデータ転送がボトルネックになる
4kでデータサイズが多くくなっても同じことが起きる
ffmpeg でCPUを使おうがGPUを使おうがそれは同じ
4kでデータサイズが多くくなっても同じことが起きる
ffmpeg でCPUを使おうがGPUを使おうがそれは同じ
161名無しさん@お腹いっぱい。
2026/01/18(日) 13:00:19.87ID:QRood4J40 mac版の並列処理しているものは少し変更すればwindowsで動くよ
gpu使用率が上がり20-50%高速化する
速さを求めるならこれがおすすめ
gpu使用率が上がり20-50%高速化する
速さを求めるならこれがおすすめ
162名無しさん@お腹いっぱい。
2026/01/18(日) 14:14:47.64ID:K+IOK/vU0 長時間の処理だけに速さも大切だが熱も抑えたいので結果的に現状はちょうど良いのかもしれん。
163名無しさん@お腹いっぱい。
2026/01/18(日) 14:56:43.12ID:LyCYBw6u0 グラボ新調したいけどAI需要のせいで民生品に半導体回ってこなくて価格暴騰してて買えない
てか品物すら無い
てか品物すら無い
164名無しさん@お腹いっぱい。
2026/01/18(日) 15:19:42.11ID:fgGxg+Ii0 今まで面倒だったのでやっていなかったが146のUbuntu実行結果を見てこんだけ早くなるならと思い、俺もUbuntu Native環境作ってみた
マジで倍近く速くなるのな。一方、WSL2はダメだった。Windowsそのままより4割くらい遅くなる
バッチ処理するならUbuntu Native環境が良いな
<環境>
Ryzen 9700X+DDR5 64GB+RTX 5060Ti 16GB
lada-cli 0.10.1-dev
v4-fast/fp16/hevc-nvidia-gpu-hq
<入力ファイル>
FHD 17:31
<結果>
Windows 660秒
Ubuntu (Native) 354秒 (x 1.86倍)
Ubuntu (wsl2) 1,031秒 (x 0.64倍)
マジで倍近く速くなるのな。一方、WSL2はダメだった。Windowsそのままより4割くらい遅くなる
バッチ処理するならUbuntu Native環境が良いな
<環境>
Ryzen 9700X+DDR5 64GB+RTX 5060Ti 16GB
lada-cli 0.10.1-dev
v4-fast/fp16/hevc-nvidia-gpu-hq
<入力ファイル>
FHD 17:31
<結果>
Windows 660秒
Ubuntu (Native) 354秒 (x 1.86倍)
Ubuntu (wsl2) 1,031秒 (x 0.64倍)
165名無しさん@お腹いっぱい。
2026/01/18(日) 15:40:44.84ID:KPRKEizl0 Ubuntu nativeはめっちゃ速くなるよね
あとnvidiaのmpsも実行してlada回したら複数処理も安定するようになった
あとnvidiaのmpsも実行してlada回したら複数処理も安定するようになった
166名無しさん@お腹いっぱい。
2026/01/18(日) 18:15:22.10ID:C2jX1aaM0 >>163
今買えるとこで買わないともっと酷くなるぞ
今買えるとこで買わないともっと酷くなるぞ
167名無しさん@お腹いっぱい。
2026/01/18(日) 19:42:31.11ID:QTFoY0950 16gb のグラボは 5080 優先で 60 ti 16gb と 70 ti は減産してるらしい
168名無しさん@お腹いっぱい。
2026/01/18(日) 19:44:04.28ID:fgGxg+Ii0 >>165
情報ありがとうございます
Linuxの場合、複数ファイル同時処理や分割並列処理スクリプト使う際はnvidia-cuda-mps-controlが必須なのね
複数ファイル同時処理は最初これ動かさずにスクリプト実行したらworker数を増やしても処理時間が短縮されずにおかしいな?と思ってた
mps動かした後だとworker数に応じて処理時間が減っていった
Windows単体cliの2.6倍、Ubuntu単体cli実行より40%高速化とか、捗る
<MPSなし>
Worker数2:383秒
Worker数3:373秒
Worker数4:367秒
<MPSあり>
Worker数2:320秒
Worker数3:275秒
Worker数4:261秒
Worker数5:251秒
情報ありがとうございます
Linuxの場合、複数ファイル同時処理や分割並列処理スクリプト使う際はnvidia-cuda-mps-controlが必須なのね
複数ファイル同時処理は最初これ動かさずにスクリプト実行したらworker数を増やしても処理時間が短縮されずにおかしいな?と思ってた
mps動かした後だとworker数に応じて処理時間が減っていった
Windows単体cliの2.6倍、Ubuntu単体cli実行より40%高速化とか、捗る
<MPSなし>
Worker数2:383秒
Worker数3:373秒
Worker数4:367秒
<MPSあり>
Worker数2:320秒
Worker数3:275秒
Worker数4:261秒
Worker数5:251秒
169名無しさん@お腹いっぱい。
2026/01/19(月) 00:36:32.90ID:hF98T7pa0 LinuxとWindowsでそんなに違うのか...( ゚Д゚)
Stable Diffusionも含めてそうなん?ってChatGPTに訊いてみたら、SDは倍速にはならんけど全般20〜30%は速くなるとか。
え〜今からUbutuだのLinuxゼロスタートとかどんだけ〜〜( ´Д`)
Stable Diffusionも含めてそうなん?ってChatGPTに訊いてみたら、SDは倍速にはならんけど全般20〜30%は速くなるとか。
え〜今からUbutuだのLinuxゼロスタートとかどんだけ〜〜( ´Д`)
170名無しさん@お腹いっぱい。
2026/01/19(月) 00:42:28.78ID:hF98T7pa0 >>163
中古はダメなん?
ワシ、何日か前にヤフーフリマで16万弱の4080ultra買ったで。まだ動かしてないけど。
中古相場は 4080系が17万、5080系が20万、xx90系はお大尽過ぎて手が出ん。( ´Д`)
中古はダメなん?
ワシ、何日か前にヤフーフリマで16万弱の4080ultra買ったで。まだ動かしてないけど。
中古相場は 4080系が17万、5080系が20万、xx90系はお大尽過ぎて手が出ん。( ´Д`)
171名無しさん@お腹いっぱい。
2026/01/19(月) 00:57:39.84ID:VMr/iVCV0 linuxとやらも分からんし、linuxでlada動かし方も分からん。難しいんでしょ?
172名無しさん@お腹いっぱい。
2026/01/19(月) 01:11:34.47ID:6ifiJeOf0 全く知らんでも今ならAIに聞けば手取り足取り教えてくれるからな
昔と違って敷居は全然低い
昔と違って敷居は全然低い
2026/01/19(月) 01:59:45.18ID:oZfid/980
そんなに速度求めて何したいの
業者か?
業者か?
2026/01/19(月) 02:58:49.41ID:/aFAN8vK0
今のLADAでも十分早いんだし、変換するシーンを厳選すりゃええのよ
1本丸々は時間と金の無駄だしな
1本丸々は時間と金の無駄だしな
レスを投稿する
