除了做梗圖還有什麼功用?AI圖片產生器Dall-E Mini入門教學

除了做梗圖還有什麼功用?AI圖片產生器Dall-E Mini入門教學

最近在Twitter和Reddit上出現了很多由九宮格圖片組成的網路迷因,像是「戴著墨西哥帽的倉鼠哥吉拉襲擊東京的行車記錄器畫面」,或是「在脫衣舞廳的最後的晚餐」等內含瘋狂想法的梗圖。

戴著墨西哥帽的倉鼠哥吉拉襲擊東京的行車記錄器畫面

在脫衣舞廳的最後的晚餐

電子顯微鏡下的米老鼠

查抄哈比人之家的特種部隊

但這些主題包羅萬象的圖片究竟是哪位靈感取之不盡的藝術家製作的呢?事實上,這些五花八門的圖片全都來自於AI圖片產生器——Dall-E Mini。

DALL·E是什麼?

DALL·E是一種利用AI人工智慧生成圖像的圖片產生器,並在命名上參考了超現實藝術家薩爾瓦多·達利(Salvador Dalí)和皮克斯(Pixar)動畫人物瓦力(WALL·E)。

2021年 1月,非營利的人工智慧研究組織OpenAI發布「DALL-E」,此人工智慧程式擁有120億參數的GPT-3自迴歸語言模型,可理解用自然語言(natural language)表達的文字描述,並生成圖片。而在2022年4月,OpenAI更是發表了「DALL-E 2」。相較於初代的DALL-E,DALL-E 2除了再度強調「能從文本描述中產生原創且逼真的圖像藝術」,也展現了更為出色的製圖和作畫功力。不僅生成的圖片更細緻,甚至還能改編畫作的風格。

DALL-E 1、DALL-E 2比較丨截圖自https://openai.com/dall-e-2/

OpenAI目前已將DALL-E 2開放給上千名開發者試用,但並未對外公開開放使用,只有少部份擁有權限者才能使用或進行相關研究。於是,Boris Dayma等多位工程師在Github結合「CompVis」圖像資料庫開發了「Dall-E Mini」,免費釋出給大眾使用。

Dall-E Mini是以開源模型 DELL-E為基礎加工,如同其他的機器學習模型,DALL-E從網路上瀏覽了成千上萬張的圖片資料庫,才學會如何按照文字敘述來繪製圖片。不過,Dall-E Mini作為簡易版「DALL-E」,所產生的圖片細緻度和品質較差,但合成出來的圖像仍大致可以辨識。

如何使用Dall-E Mini?

使用Dall-E Mini並沒有設備上的要求,任何人都能從瀏覽器上免費使用DALL-E Mini,只要在產生器網頁上,以英文輸入圖片描述詞,並點擊「Run」,AI就會自動幫你生成圖片。最後,點擊下方的「Screenshot」即可儲存一張含關鍵詞輸入框的截圖。

前往Dall-E Mini:https://huggingface.co/spaces/dalle-mini/dalle-mini

除了做梗圖還有什麼功用?AI圖片產生器Dall-E Mini入門教學

雖然網路上有許多利用Dall-E Mini製作的梗圖,Dall-E Mini也成為拿來突破次元壁的利器之一。但除此之外,Dall-E Mini還能畫出什麼?

Dall-E Mini製圖情況簡介

雖然根據使用的文本不同,每個人的Dall-E Mini體驗歷程會有些許差異,但下列兩點基本可概括Dall-E Mini的製圖情況:

  • 生成時間

Dall-E Mini生成圖片的時間與描述詞的複雜程度基本成正比,如果使用了較長的文本,就需要多等一陣子才能獲得圖片,但只輸入一句描述詞的情況下,大多只需50-60秒就能完成一張圖片。

以下使用了同為AI圖片產生器的Disco Diffusion所提供的示例描述詞「A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and Thomas kinkade, Trending on artstation.」來實測圖片的生成時長,約需60秒。

Disco Diffusion官方示例描述詞產生圖丨源自Dall-E Mini

  • 運行結果

由於是利用AI自動演算圖片,所以就算輸入兩次相同的描述詞,Dall-E Mini的運行結果也不盡相同。如果對生成的結果不甚滿意,可先保留當前結果,再多嘗試幾遍,說不定可以得到較合心意的成果。此外,Dall-E Mini生成的臉部五官大多較模糊,所以如果沒有特殊需求,在使用Dall-E Mini時,比起生物更建議輸入和「景物」相關的詞彙。

描述詞撰寫注意事項

在填寫圖片描述詞時,其實不用很介意文法是否正確,或輸入的是否為連貫的語句,只要有清晰的描繪主體,再利用逗號隔開下列幾項關鍵短語,就能把生成結果導向特定方向。

  • 參考的畫家:by+畫家名稱(不限一人)

在關鍵詞中包含畫家的英文名是能夠簡單影響畫風的方式之一,但同時也會大幅降低作品的原創性。因此,為了避免畫風抄襲的嫌疑,添加了此類關鍵詞的圖片基本上不太建議商用。

梵谷畫風的公園景色丨源自Dall-E Mini

莫內畫風的公園景色丨源自Dall-E Mini

  • 圖片的主色調:顏色+color scheme

若將主色調訂定為紅色或橙色,並多嘗試幾次,可能會演算出增加了晚霞效果或秋季感的圖片。

主色調為紅色或橙色時可增添圖片的晚霞效果丨源自Dall-E Mini

主色調為紅色或橙色時可增添圖片的秋季感丨源自Dall-E Mini

  • 清晰度:high detailed, 8k , intricate , elaborate

若想輸出較為清晰的圖片,可嘗試在描述詞中加入以上短語,但根據嘗試結果基本上使用「high detailed」的效果最穩定,較不容易影響圖片的內容或主題。

分別增加high detailed關鍵字(左)和8k關鍵字(右)的梵谷畫風公園景色。可以看出Dall-E Mini在輸入8K時,融入了更多梵谷名作《星夜》的元素丨源自Dall-E Mini

分別增加intricate關鍵字(左)和elaborate關鍵字(右)的梵谷畫風公園景色丨源自Dall-E Mini

不再只是梗圖生成器

雖然相較DALL-E,Dall-E Mini的製圖效果與清晰度並不是那麼專業,但若拋開「直接使用Dall-E Mini進行創作」的想法,只是將它作為協助創作的工具,或許在達成下列成效後,Dall-E Mini也能具備有效節省創作前置作業時間的功用,成為各位創者們工作時的免費工具之一。

  • 快速總結參考畫家的畫作特徵,減少搜索資料的時間

  • 生成方便用來比較不同畫風的圖片,以便篩選出自己更喜歡的風格

  • 提供部分的構圖或用色參考

  • 協助製作影片腳本者生成簡略分鏡圖

羅子茜
作者

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則