QwenImageが出ていたが触れずにいた。すごい性能が高いらしく、テキストがちゃんと書けるらしいが日本語はサポートしてないとか、画像編集機能がすごいらしいがまだ出てない別モデルの話らしいとかでスルー気味だった。
そうこうしてる内にその画像編集機能を搭載したQwenImageEditモデルが登場してしまったので、とりまQwenImageよりも先に試してみる事にする。
さっそくComfyUI公式がサンプルワークフローを提供している↓
Qwen-Image-Edit ComfyUI Native Workflow Example - ComfyUI
必要なモデル類をDLしてそれぞれのフォルダに入れれば動くようになる↓
とりまテストするにはサンプルワークフローにサンプル画像を入力する↓
で、実行すると100秒で以下のような画像が出てくる。
プロンプトの指示通り、入力画像からテキストやらUI類が全て消されている。いいね。
ところで、最近QwenImage用の4stepLoRAが出ており、これを使えば20ステップから4ステップ生成に高速化できる。4stepLoRAに切り替えるにはバイパスされてるLoRA読み込みを復活させて、CFGを2.5→1.0に、stepsを20→4に変更すればよい。
たったの4stepでも元の20stepと遜色ない画像が生成されてる事が確認できる。しかも、生成時間も100秒から17秒に圧倒的に短縮される。↓