FB 建議貼文

選取貼文複製成功(包含文章連結)!

AI 影片大戰!中國憑「短影音數據庫」稱霸,Sora 停擺、美國模型卡關,創作者該怎麼選?

AI 影片大戰!中國憑「短影音數據庫」稱霸,Sora 停擺、美國模型卡關,創作者該怎麼選?

生成式人工智能(Generative AI)的火線,正在從文字與程式碼開發,全面蔓延至商機無限的影片生成領域。根據英國《金融時報》(Financial Times)的深度專題報導,中國 AI 企業在影片生成工具的開發上,已實質領先於美國競爭對手。

作為廣告、電子商務與娛樂影視的核心戰場,影片生成技術正以極快的速度改寫產業規則。目前,字節跳動(ByteDance)與快手正憑藉旗下龐大且專有的短影音庫訓練其模型,讓它們在與美國同行的正面交鋒中取得顯著優勢。儘管 OpenAI、Google 與 Anthropic 在 LLM 領域仍具主導權,但其影片生成工具在品質與易用性上,已被中國廠商反超。

Kling、Seedance 2.0 及海螺在實際體驗中領先

在獨立評測平台 Arena 的最佳影片模型排行榜(由用戶投票產生,被認為比廠商自行優化的基準測試更具真實參考價值)中,快手開發的「可靈(Kling)」、字節跳動的「Seedance 2.0」以及阿里巴巴的「HappyHorse 1.0」均獲得了極高評分。

AI 內容創業公司 Director AI 的創辦人Ben Chiang透露,他們公司專門製作 AI 動畫與短劇,在嘗試過大多數美國模型後,發現它們在影片生成的逼真度與提示詞執行力上都不盡理想。目前,Director AI 主要使用「可靈」作為主力工具,並在字節跳動的 Seedance 2.0 與 MiniMax 開發的「海螺」工具之間,根據具體任務和成本彈性切換。

他強調,近期這些中國模型在「音畫同步」與「語音穩定性」上改善明顯,使用體驗極為流暢。

AI 影片大戰!中國憑「短影音數據庫」稱霸,Sora 停擺、美國模型卡關,創作者該怎麼選?

對於一線影像創作者而言,這些進步正直接重塑工作流程。

在喬治亞第比利斯運作的獨立 AI 電影製作人兼剪輯師George Won直言:「Seedance 2.0 極大釋放了我的創作自由。」他指出,該模型能夠完美處理非常激進的鏡頭角度與高速運動畫面,且完全不會丟失角色的面部特徵或破壞光影對比。

相較之下,絕大多數美國 AI 模型在面對快速運動時,畫面都會出現嚴重的抖動或主體偏移。此外,許多開發者指出,美國影片生成工具的審查限制過於繁瑣嚴苛,經常無預警「不斷報錯」卻不給予任何具體錯誤原因,反觀中國模型較為寬鬆的審查制度,使得實際操作更為流暢方便。

商模角力與高昂算力:Sora 停服背後的商業化兩極分化

在商業模式上,中美雙方的定價策略也呈現兩極化。對於個人創作者,中國平台通常更便宜、靈活,提供訂閱制或按量付費(Pay-as-you-go)模式,便於用戶快速進行創意實驗。

然而,這也導致了資源排隊現象,自今年二月以來,由於 Seedance 2.0 需求過於旺盛,部分用戶已面臨使用受限與漫長的等待。而在企業端,字節跳動則採取高門檻策略。據知情人士透露,對於部分美國企業客戶,字節跳動要求繳納大額預付款 ── 客戶必須支付約 200 萬美元(約合新台幣 6400 萬元)的預付金,才能獲得模型訪問權限與額度分配。這促使部分中小企業轉向如 BeHooked 等第三方封裝平台,以更多樣化的二次包裝方案繞過這一高昂門檻。

AI 影片大戰!中國憑「短影音數據庫」稱霸,Sora 停擺、美國模型卡關,創作者該怎麼選?

由於影片生成所需的 Token 數量遠超文字或音訊,其大規模部署的算力成本極為驚人。今年三月,OpenAI 便因部分受到算力成本過高的拖累,暫停了旗下 Sora 影片生成模型的服務。

然而,這並未阻礙影像技術在電商領域的快速變現。為電商網站提供影音基礎設施的 Fireworks 公司執行長Vincent Yang表示,過去 AI 生成的影片生硬、尷尬,根本達不到品牌方的播出標準,但現在已經到了「難以分辨是 AI 生成還是真人拍攝」的成熟階段。

他透露,曾有零售商客戶一口氣要求為其商品頁面製作 10 萬支短影片,如果使用傳統實拍,其成本將是無法承受的天價,但現在透過 AI,每件商品都可以擁有專屬影片,甚至能針對不同客戶生成多個客製化版本。

版權灰色地帶與算力封鎖,中國 AI 影音狂飆的隱形天花板

這些中國影音生成工具之所以能在實際體驗上超車美國,核心優勢在於字節跳動與快手掌控了全球最龐大的短影音專有資料庫。由於影像不像文字那樣容易被大規模抓取,這種「專有數據壁壘」構成了不可複製的競爭護城河。快手近日甚至宣布正在探索將「可靈」業務拆分並尋求獨立上市,足見其商業野心之大。

相比之下,Google 的 Veo 3 模型雖然能獲取 YouTube 影片進行訓練,但其高度保守的內容安全保護與繁複的使用限制,在實際應用中反而綁手綁腳,這再次印證了在商用落地階段,「易用性與創作自由度」往往是決定使用者黏著度的關鍵因素。

然而,這場狂飆背後並非沒有隱憂。首先是版權糾紛的「未爆彈」,字節跳動先前就因涉嫌允許用戶在未經授權的情況下,利用漫威(Marvel)電影以及《南方四賤客》(South Park)等知名 IP 角色生成影片,而面臨版權侵權的法律起訴威脅,這迫使其承諾加強版權保護。

其次,是更具毀滅性的地緣政治算力瓶頸。隨著美國持續收緊對中高階 GPU 的出口限制,中國 AI 企業未來在訓練下一代更大規模的端到端影片模型時,將面臨極其嚴峻的算力硬體赤字。這些影音模型能否在現有的「數據紅利」消耗殆盡前,克服版權出海與硬體封鎖的雙重夾擊,將決定這場影音領先地位是曇花一現,還是技術格局的徹底重組。

 

 

cnBeta
作者

cnBeta.COM(被網友簡稱為CB、cβ),官方自我定位「中文業界資訊站」,是一個提供IT相關新聞資訊、技術文章和評論的中文網站。其主要特色為遊客的匿名評論及線上互動,形成獨特的社群文化。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則