Seedance 2.0 AI 竟光憑一張臉就能產生複製真人聲音，遭質疑盜用抖音資料訓練模型

這聽起來簡直像是科幻恐怖片的劇情。字節跳動旗下的 AI 影片生成大模型 Seedance 2.0 最近引發熱議，知名科技影音創作者「影視颶風」創始人 Tim在實測中赫然發現，這款 AI 竟然在未經授權的情況下，光憑一張面部圖像，就能生成與本人高度匹配的聲音特徵。

光看臉就知道你怎麼說話？創作者直呼「太恐怖」

根據 Tim 的說法，他在測試時完全沒有提供任何聲音文件、關鍵字或提示資訊，僅僅上傳了自己的照片，AI 竟然就直接「認出」這張臉並配上正確的聲音。Tim 表示自己從未給過官方授權，更沒有收過相關費用，這種「看臉識聲」的能力讓他感到相當恐懼。

Seedance 2.0 與抖音同屬於字節跳動，原本的設計初衷是生成具有同步音訊、動作流暢的 1080p 電影級影片，並專注於連貫的多鏡頭敘事。然而，這種強大的聲音克隆技術也引發了法律與倫理的疑慮。不少網友質疑，字節跳動是否利用抖音（TikTok）上龐大的使用者資料作為訓練集，才能讓 AI 如此精準地掌握公眾人物的聲紋與面貌。