
就在Google的Gemini 2.5 flash Image(Nano Banana)因為他的多模態輸入功能橫掃生圖模型之際,現在中國的字節跳動也推出了對應的產品,正式發表最新一代圖像生成模型 Seedream 4.0。
Seedream 4.0主打更靈活的多模態創作能力,支援圖文混合輸入,可用於文生圖、圖生圖、圖像編輯與組圖生成等應用。此次更新不僅讓玩法更豐富,也大幅強化生成品質與推理能力,甚至將最高解析度提升至4K。
多模態玩法更自由,創作方式大幅升級
根據官方說法,Seedream 4.0 支援高度彈性的圖文結合輸入模式,創作者可透過文字生成圖像,也能對圖片進行編輯,甚至一次處理多張圖片、或讓圖片彼此結合進行創作。
此外,在風格化方面也顯著進化,從傳統的巴洛克藝術,到現代賽博龐克風格,都能靈活切換,甚至混搭出嶄新的藝術視覺效果。
更會「想」的AI,具備推理與故事理解能力
Seedream 4.0 最大的亮點之一,是其在邏輯理解與推理方面的能力提升。透過結合世界知識與上下文判斷,AI 在處理如解謎題、續寫漫畫、時間與物理限制等任務時,能夠先「思考」再「繪圖」,大幅強化創作的合理性與敘事性。
圖像生成速度飆升、最高可達4K解析度
在生成效能方面,Seedream 4.0 採用全新架構設計與優化的蒸餾技術,讓DiT模型的圖像生成速度比前代快上10倍以上。輸出的畫質也從過去的2K提升至支援4K超高解析度,同時開放自訂圖片尺寸,讓專業創作者更具彈性。
不只是模型,更是一個「多模態創意引擎」
官方強調,Seedream 4.0 並非單純圖像模型,而是整合各種生成與推理能力的「創意平台」,針對創作、專業應用與推理場景,提出八大應用範疇,未來可望延伸至更多領域,包括商業設計、視覺敘事、甚至教育與研究使用。
- 延伸閱讀:Google AI 修圖神器「Nano Banana」爆紅,Google工程師自曝Gemini 伺服器差點被撐爆
- 延伸閱讀:Google Gemini最強圖像編輯模型「Nano banana」上線,人物一致性以及多圖合圖功能更提升
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!