25/07/29 Wan画像生成でVACEを使って画像をコントロールする

この前Wanの画像生成について書いた。↓

Wanの画像生成はFluxよりもクオリティ高い事は分かったが、どうせならDepthやOpenPoseでコントロールネットを使いたくなってくる。

そこで今回はVACEを使ってWanの画像生成をDepthやOpenPoseでコントロールする事をやってみる。

今回使ったワークフローはこちら。

Vaceで画像生成すると言ってもどうやれば行けるのか全然分からなかったが、色々試してみたところ、1フレームだけの生成だと上手く行かないが、5フレーム生成すればいい感じにVACEが反映されるようだと分かった。入力するコントロールビデオについては普通に画像からOpenPose化したものを「画像バッチを繰り替えす」ノードで5枚に増やしてinput_framesに入力すればいい。

5フレームになっても生成時間はそこまでは増えないが、10ステップで75秒くらいかかる。

生成結果はまったく同じ画像が５枚出てくる感じになるので、適当に１枚抜き出して保存すればいい。

てなわけで早速色々試していく。例えば以下のような画像を入力して、Depthに変換してからそれぞれ「The girl is sitting.」「The girl is standing on stair.」「The girl is holding a smartphone at left hand.」というプロンプトで生成してみる↓

するとこうなる↓

元画像のDepthにかなり忠実な画像が生成できてると分かる。VACEを使うと若干白く焼けたような色合いになるのはちょっと気になるが。