FB 建議貼文

選取貼文複製成功(包含文章連結)!

如何在DGX Spark系統執行Stable Diffusion圖像生成 | GIGABYTE AI TOP ATOM系列之5

如何在DGX Spark系統執行Stable Diffusion圖像生成 | GIGABYTE AI TOP ATOM系列之5

ADVERTISEMENT

在完成安裝Comfy UI之後,我們接著補足Stable Diffusion模型與缺少的運算節點,就可以開始進行圖像生成了。

補足模型與節點

Comfy UI的特色是能夠透過拖曳各種的節點(Node)並連接彼此,來打造功能各異的工作流程(Workflow),並且能將工作流程匯出保存或分享。

延伸閱讀:
Stable Diffusion AI算圖使用手冊(1-1):這是什麼黑魔術?
Stable Diffusion AI算圖使用手冊(4-1):透過LoRA小模型收束角色特性
Stable Diffusion AI算圖使用手冊(6-3):Pony Diffusion安裝與使用技巧

筆者準備了簡單的工作流程,能夠載入SDXL或Pony Diffusion系列的Checkpoint基礎模型,並搭配LoRA小模型控制圖像的內容與風格,最後還可利用升頻功能將放大生成圖像的解析度。

筆者建議讀者先閱讀先前的Stable Diffusion AI算圖使用手冊系列文章,以理解其運作的基本原理與操作技巧。若不想看完全部文章,也建議至少閱讀設定區欄位說明

(理解各項參數功能)、LoRA概念生成圖像升頻概念SDXL操作技巧Pony Diffusion操作技巧等章節,以掌握基本使用概念。

接著我們先跟著下列圖文說明,以筆者提供的工作流程作為範例,並補足所需模型與節點。 

範例檔案下載位置:
MeichiDarkMix_Reload(Checkpoint基礎模型)
zs_TakemiXL.safetensors(LoRA小模型,控制角色):(該模型已被下架,建議可以改用其他角色LoRA)
Finger gun (Pointing at Viewer) | Concept / Pose LoRA XL(LoRA小模型,控制動作)
RealESRGAN_x4(圖像升頻模型,適合用於真實照片圖像風格)
RealESRGAN_x4_Plus_Anime_6b(圖像升頻模型,適合用於插畫圖像風格)
範例工作流程

首先我們將Checkpoint基礎模型下載至ComfyUI/models資料夾中的checkpoints資料夾,LoRA小模型下載至loras資料夾,圖像升頻模型則下載至upscale_models資料夾。

直接將模型儲存於對應的資料夾即可。

接下來參考前篇教學的步驟啟動Comfy UI程式以及網頁介面,接著從左上角功能表找到「文件->打開」,並開啟筆者準備的範例工作流程。

載入工作流程之後,系統應該會顯示缺乏節點的錯誤訊息。

這時候先點擊右上角的「Manager」按鍵,並在跳出的視窗點擊「Install Missing Custom Nodes」。

接著勾選所有節點並點擊「Install」,以下載缺乏的節點。在下載完成後關閉Comfy UI程式,並重新啟動。

輸入咒語生成圖片

如果讀者熟悉Stable Diffusion以及Stable Diffusion WebUI的操作,應該能夠掌握Comfy UI以及範例工作流程的設定要點。

如果不熟悉的話,可以參考下方的圖文操作說明,瞭解各節點的功能之後,就能自行調整節點編排以及各項設定值,更確實控制圖像的內容與風格。

筆者會在範例中套用2組LoRA,並將圖像解析度設定為1280 x 720,再透過Ultimate SD Upscale的升頻功能將圖像放大至2560 x 1440,取得更加清晰的圖像。

參考提示詞

正面提示詞:
((masterpiece)), (top quality), (best quality), (official art, beautiful and aesthetic:1.2), extreme detailed,colorful,
score_9, score_8_up, score_7_up,
source_animate,
((solo)), (((1girl))),
indoors, clinic,
office desk, computers,
takemip5, short hair, bob cut, black hair, blue hair,
labcoat, black dress, belt, choker, necklace, cleavage, black pantyhose,
platform high heels, gladiator sandals,
(small breast), (smokey eyes),
seductive smile, assertive female,
(finger gun), pointing at viewer,
one eye closed,

負面提示詞:
(worst quality, low quality:1.4),
(deformed, distorted, disfigured:1.3), missing fingers, extra digit, fewer digits, cropped, bad anatomy, wrong anatomy,
text, signature, watermark, username, artist name, blurry, out of frame,
score_6, score_5, score_4,

重新啟動Comfy UI程式後,再次載入範例工作流程,整個流程會從左方開始,跟著各條連線依序往下按步驟執行。

首先我們看到左側,先在「SDXL Base Model方塊」選擇Checkpoint模型,並在「加載LoRA方塊」選擇LoRA模型與強度權重。

接著在綠色的「CLIP文本編碼方塊」輸入正面提示詞,並在紅色方塊輸入負面提示詞。

「空Latent圖像方塊」輸入生成圖像之解析度,以及批次生成圖像的數量。「K取樣器方塊」建議將步數設為25,cfg設為6~8,採樣器為euler_ancestral。並將生成後控制設為randomize,以產生隨機種子。

接下來的「Ultimate SD Upscale方塊」為升頻功能的設定,建議將upscale_by設為2,旁邊的「Checkpoint加載器方塊」設定與先前「SDXL Base Model方塊」的設定值相同,「加載放大模型方塊」設為RealESRGAN_x4(真實照片圖像風格)或RealESRGAN_x4_Plus_Anime_6b(插畫圖像風格)。

設定完成後點擊右上叫的運行,即可開始進行AI推論運算,完成後會在最右方的方塊顯示生成圖片。

在生成圖片上點擊滑鼠右鍵可以儲存圖片。

成品圖片範例。

既然我們已經在DGX Spark系統上安裝Comfy UI了,不妨也來試試Z-Image等更多模型,看看它的效果如何。更多相關報導請讀者參考系列文章目錄繼續閱讀。

回到系列全文目錄

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則