FB 建議貼文

選取貼文複製成功(包含文章連結)!

全球最快端側音訊生成模型登場!Stable Audio Open Small 手機 8 秒內生出 11 秒立體聲音效

全球最快端側音訊生成模型登場!Stable Audio Open Small 手機 8 秒內生出 11 秒立體聲音效

AI 新創公司 Stability AI 近日推出全新音訊生成模型 Stable Audio Open Small,號稱是目前速度最快、可於智慧型手機上本地運行的 AI 音訊生成工具,8 秒內即可離線製作 11 秒立體聲音效,在業界引起廣泛關注。

根據 TechCrunch 報導,與當前熱門的 Suno、Udio 等雲端音樂 AI 工具不同,Stable Audio Open Small 最大的亮點是:完全不依賴雲端伺服器,能直接在手機端進行生成與運算。

適合製作鼓點與樂器片段

此模型專為快速生成節奏類、背景音效設計,適合用於以下應用場景:

  • 節奏鼓點

  • 合成器 loop

  • 簡易旋律素材

  • 遊戲/短影音音效設計

目前生成長度最長為 11 秒立體聲音頻,且反應時間僅需 8 秒以內,非常適合即時原型開發與創作工作流程中使用。

手機上也能跑 與 Arm 合作特別優化

為了讓模型真正實現「端側運行」(即本地處理),Stability AI 與晶片大廠 Arm 合作開發與最佳化模型架構,讓其能順利在搭載 Arm CPU 的智慧型手機與裝置上運作,不必倚賴高速網路與雲端運算資源。

與部分競品(如 Udio、Suno)遭質疑使用商業音樂數據訓練不同,Stable Audio Open Small 僅使用合法授權且免版稅的開源資料來源,包括:

  • Free Music Archive(FMA)

  • Freesound 音效資料庫

此舉也讓模型具備更明確的使用安全邊界,適合用於教育、創作、商業原型設計等場景。

限制與條件:目前僅支援英文提示、不適合生成人聲歌曲

需要注意的是:

  • 模型目前 僅支援英文提示語

  • 無法生成自然語音或高品質歌聲

  • 音樂風格偏西方,對非西方音樂類型(如中式、日式音階)支援尚不成熟

KKJ
作者

快科技成立於1998年,是驅動之家旗下科技媒體業務,中國極具影響力的泛科技領域媒體平台之一。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則