全球最快端側音訊生成模型登場！Stable Audio Open Small 手機 8 秒內生出 11 秒立體聲音效 | T客邦

半導體/電子產業 5G/網路 AI/大數據電動車/交通

加密貨幣/區塊鏈遊戲/電競雲端/資訊安全商業/金融

尖端科技 3C新品趨勢

抽獎/得獎公告體驗試玩活動課程講座

全球最快端側音訊生成模型登場！Stable Audio Open Small 手機 8 秒內生出 11 秒立體聲音效

AI 新創公司 Stability AI 近日推出全新音訊生成模型 Stable Audio Open Small，號稱是目前速度最快、可於智慧型手機上本地運行的 AI 音訊生成工具，8 秒內即可離線製作 11 秒立體聲音效，在業界引起廣泛關注。

根據 TechCrunch 報導，與當前熱門的 Suno、Udio 等雲端音樂 AI 工具不同，Stable Audio Open Small 最大的亮點是：完全不依賴雲端伺服器，能直接在手機端進行生成與運算。

適合製作鼓點與樂器片段

此模型專為快速生成節奏類、背景音效設計，適合用於以下應用場景：

節奏鼓點
合成器 loop
簡易旋律素材
遊戲/短影音音效設計

目前生成長度最長為 11 秒立體聲音頻，且反應時間僅需 8 秒以內，非常適合即時原型開發與創作工作流程中使用。

手機上也能跑　與 Arm 合作特別優化

為了讓模型真正實現「端側運行」（即本地處理），Stability AI 與晶片大廠 Arm 合作開發與最佳化模型架構，讓其能順利在搭載 Arm CPU 的智慧型手機與裝置上運作，不必倚賴高速網路與雲端運算資源。

與部分競品（如 Udio、Suno）遭質疑使用商業音樂數據訓練不同，Stable Audio Open Small 僅使用合法授權且免版稅的開源資料來源，包括：

Free Music Archive（FMA）
Freesound 音效資料庫

此舉也讓模型具備更明確的使用安全邊界，適合用於教育、創作、商業原型設計等場景。

限制與條件：目前僅支援英文提示、不適合生成人聲歌曲

需要注意的是：

模型目前 僅支援英文提示語
無法生成自然語音或高品質歌聲
音樂風格偏西方，對非西方音樂類型（如中式、日式音階）支援尚不成熟

#手機 #智慧型手機 #音樂 #音效 #開源 #離線 #人工智慧 #ai #模型 #音訊生成 #原型設計

送【10個ChatGPT的好工具】電子書 Line brand icon

謹慎發言，尊重彼此。按此展開留言規則