
AI 新創公司 Stability AI 近日推出全新音訊生成模型 Stable Audio Open Small,號稱是目前速度最快、可於智慧型手機上本地運行的 AI 音訊生成工具,8 秒內即可離線製作 11 秒立體聲音效,在業界引起廣泛關注。
根據 TechCrunch 報導,與當前熱門的 Suno、Udio 等雲端音樂 AI 工具不同,Stable Audio Open Small 最大的亮點是:完全不依賴雲端伺服器,能直接在手機端進行生成與運算。
適合製作鼓點與樂器片段
此模型專為快速生成節奏類、背景音效設計,適合用於以下應用場景:
-
節奏鼓點
-
合成器 loop
-
簡易旋律素材
-
遊戲/短影音音效設計
目前生成長度最長為 11 秒立體聲音頻,且反應時間僅需 8 秒以內,非常適合即時原型開發與創作工作流程中使用。
手機上也能跑 與 Arm 合作特別優化
為了讓模型真正實現「端側運行」(即本地處理),Stability AI 與晶片大廠 Arm 合作開發與最佳化模型架構,讓其能順利在搭載 Arm CPU 的智慧型手機與裝置上運作,不必倚賴高速網路與雲端運算資源。
與部分競品(如 Udio、Suno)遭質疑使用商業音樂數據訓練不同,Stable Audio Open Small 僅使用合法授權且免版稅的開源資料來源,包括:
-
Free Music Archive(FMA)
-
Freesound 音效資料庫
此舉也讓模型具備更明確的使用安全邊界,適合用於教育、創作、商業原型設計等場景。
限制與條件:目前僅支援英文提示、不適合生成人聲歌曲
需要注意的是:
-
模型目前 僅支援英文提示語
-
無法生成自然語音或高品質歌聲
-
音樂風格偏西方,對非西方音樂類型(如中式、日式音階)支援尚不成熟
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!