這聽起來簡直像是科幻恐怖片的劇情。字節跳動旗下的 AI 影片生成大模型 Seedance 2.0 最近引發熱議,知名科技影音創作者「影視颶風」創始人 Tim在實測中赫然發現,這款 AI 竟然在未經授權的情況下,光憑一張面部圖像,就能生成與本人高度匹配的聲音特徵 。
光看臉就知道你怎麼說話?創作者直呼「太恐怖」
根據 Tim 的說法,他在測試時完全沒有提供任何聲音文件、關鍵字或提示資訊,僅僅上傳了自己的照片,AI 竟然就直接「認出」這張臉並配上正確的聲音 。Tim 表示自己從未給過官方授權,更沒有收過相關費用,這種「看臉識聲」的能力讓他感到相當恐懼 。
Seedance 2.0 與抖音同屬於字節跳動,原本的設計初衷是生成具有同步音訊、動作流暢的 1080p 電影級影片,並專注於連貫的多鏡頭敘事 。然而,這種強大的聲音克隆技術也引發了法律與倫理的疑慮。不少網友質疑,字節跳動是否利用抖音(TikTok)上龐大的使用者資料作為訓練集,才能讓 AI 如此精準地掌握公眾人物的聲紋與面貌 。
官方緊急滅火:暫時禁用真人素材
隨著事件持續發酵,字節跳動旗下的「即夢」平台緊急發布公告,宣布 Seedance 2.0 暫停真人素材的參考能力 。官方解釋,為了保障健康的創作環境,目前正在進行緊急優化,調整期間暫不支持輸入真人影像作為主體參考 。他們也強調「創意的邊界是尊重」,並對造成的不便致歉,期待未來以更完善的面貌正式上線 。
- 延伸閱讀:字節跳動推出 Seedream 4.0 多模態圖像創作模型:對決Nano Banana、生成速度飆升十倍、支援4K畫質
- 延伸閱讀:被字節跳動提告索賠800萬人民幣的實習生,還沒開審卻先拿下NeurIPS 2024最佳論文
- 延伸閱讀:AI模型遭實習生篡改程式碼並惡意攻擊,字節跳動提告北京博士生求償800萬元人民幣!
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!