試圖

WAN 2.2 SVI 512x768 10s 16fps gen time ~9X秒
[video]https://upload.hkgolden.media/comment/l4orz3tx.wej54v2pihz.bdgreijw4cz.ivl.webm?id=1156334[/video]
Upscaled with LTX 2.3 (Final Pass) 1024x1536 10s 16fps (3 steps) gen time ~5X-8X秒 唔改prompt / ~9X-11X秒 有改prompt的話
[video]https://upload.hkgolden.media/comment/k2fagvl5.qir245woy1g.5lttx1e1p0k.adq.webm?id=1156335[/video]
WAN 2.2 SVI 960x1440 10s 16fps gen time ~41X秒 (我平時gen開的size)
[video]https://upload.hkgolden.media/comment/ec3d3jzu.vgwpuow0lvc.jc5lgghjfeg.1dp.webm?id=1156339[/video]
好處
1. WAN 2.2 Lowres生成速度快,可以當成係preview,結果好既先掉去LTX 2.3 upscale
2. 寫Prompt難度降低,WAN 2.2只需要簡單指示,就可以做到合理正常既動作,而且NSFW支援度高,現成loras豐富
3. 有聲!
4. 整體gen快左成倍
壞處
1. 可能出現唔應該出現既details (呢樣就算native LTX 2.3都有機會有,係佢upscale生details問題)
2. 原片如果gen得太勁(例如眼),upscale會有較嚴重既問題
3. 手指比native WAN2.2/LTX 2.3都差左
4. resolution雖然係仲高左,但畫汁係比native WAN2.2 SVI差
因為今次試圖係直圖show 3/4身,所以較容易有隻眼pixel太少導致變朦問題
我平時都係gen橫圖show半身多,眼佔既pixel會多好多
所以眼朦問題應該冇今次試圖咁明顯
之後先再試
例如睇下lowres如果再gen大小小又會唔會好的咁
同埋好似有少少郁得快就會變朦
