Stability AI發表SDXL 1.0正式版Stable Diffusion AI算圖模型,還有線上免安裝快速體驗版

Stability AI發表SDXL 1.0正式版Stable Diffusion AI算圖模型,還有線上免安裝快速體驗版

ADVERTISEMENT

原本預計於2023年7月中發表的SDXL 1.0模型,幾經延宕後終於趕在7月結束之前正式推出,能夠帶來更細膩的AI生成圖像。

SDXL報到!

Stability AI開發團隊表示這次推出的SDXL 1.0是Stable Diffusion AI算圖所使用的文字到圖像生成模型(Text-to-Image Generation Model)的一大革新,並自豪地表示是世界上最好的開源圖像生成模型。根據開發團隊在Discord討論區進行的民意調查,SDXL 1.0搭配細化器(Refiner)所產生的能夠獲得26.2%投票者的青睞,不但高於先前SDXL 0.9測試版或是沒有使用細化器的情況,也遠高於現今較為普級的SD 1.5所獲得的4.63%支持度。

根據官方的說明,SDXL由35億組參數的基礎模型和66億組參數的細化器所構成,針對寫實風格的圖像進行最佳化,但也能夠勝任各種風格的高品質圖像,同時也改善先前手部與複雜構圖(例如,背景中的女人在前景中追逐狗)的缺陷,並針對鮮豔而準確的色彩進行了精心調校,能夠帶來更出色的對比、照明和陰影表現,並可以原生輸出解析度達1024 x 1024的圖像。

此外SDXL也強化對提示詞的理解能力,比方它可以分辨「The Red Square」(俄羅斯的紅場)與「a red square」(紅色方塊)的差異,同時使用者不再需要編寫「masterpiece」這類提示詞,就能生成高品質的圖像。

開發團隊也表示在SDXL 1.0的基礎上訓練Checkpoint與LoRA等模型都將比現在更容易,同時也在開發下一代ControlNet以提供更多元的控制選項,這些功能目前處於測試預覽階段,並將持續更新改善。

根據開發團隊在Discord討論區進行的民意調查,SDXL 1.0搭配細化器(Refiner)所產生的能夠獲得26.2%投票者的青睞。

SDXL 1.0能夠生成更正確的手部骨架以及複雜構圖。

SDXL 1.0也能夠生成奇幻風格的圖像。

多種不同藝術風格的圖像也都難不倒SDXL 1.0。

未來使用者也能透過ControlNet等工具來進一步控制生成圖像。

SDXL 1.0動手玩

開發團隊說明SDXL 1.0的運作流程可以分為2大步驟,系統會在第1步透過基礎模型生成帶有噪訊的潛在資訊(latents),並在第2步使用細化器降噪及進一步精製圖像。而這種2步驟架構有助於在不影響效能的前提下兼顧圖像生成的穩定性,並且推測應該可以在僅有8GB顯示記憶體的顯示卡完成工作。

目前Stable Diffusion WebUI 1.5以上版本已經能夠支援SDXL 1.0,讀者可以更新Stable Diffusion WebUI主程式並自行安裝SDXL 1.0模型。

如果讀者只是想要簡單嘗鮮,也可以到Clipdrop網站進行體驗,只需在網頁輸入提示詞就能生成圖像。

SDXL 1.0線上版體驗網頁:https://clipdrop.co/stable-diffusion

SDXL 1.0會將圖像生成分成2階段處理。第1階段會先產生基礎圖像,接著在第2階段利用細化器進行最佳化。

Clipdrop網站可以快速體驗SDXL 1.0的效果,進入網站後在這邊輸入提示詞。

接著可以在系統詢問是否訂閱專業版服務時點選跳過。

排隊等待前方圖像完成,就可以看到自己的圖像。

SDXL 1.0生成的圖像在色彩、細節、正確度上都有明顯提升。

SDXL 1.0生成圖像範例(1/4)。

SDXL 1.0生成圖像範例(2/4)。

SDXL 1.0生成圖像範例(3/4)。

SDXL 1.0生成圖像範例(4/4)。

SDXL 1.0生成圖像範例(One More Thing)。筆者在沒有使用LoRA的前提下指定生成圖像中的角色,感覺像不像、三分樣,大家看得出是誰嗎?

筆者預計之後也會持續更新Stable Diffusion AI算圖教學系列文章,並加入SDXL 1.0的教學,請有興趣的讀者保持關注。

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則