上传照片能模仿本人声音中国AI模型引侵权争议

AI生成技术快速发展，几乎到了以假乱真的地步。示意图。（大纪元制图）

人气: 2757

【字号】大中小

更新: 2026-02-13 1:59 AM 标签: 2.0, 中国, 字节跳动, AI

【大纪元2026年02月12日讯】（大纪元记者吴旻洲台湾台北报导）中国科技巨头字节跳动近日推出人工智慧（AI）影片生成模型Seedance 2.0，引发热议。知名中国影音创作者“影视飓风”创办人潘天鸿实测发现，这款AI竟然在未经授权的情况下，光凭一张面部图像，就能生成与本人高度匹配的声音特征。

于2月低调上线的Seedance 2.0可同步生成影片与声音，只需输入指令或上传参考图，就能在60秒内产出带完整原生音轨的多镜头影片，功能强大引发讨论。

Seedance 2.0被爆2大恐怖

然而，中国科技自媒体“影视飓风”在YouTube上传一支影片表示，试用Seedance 2.0后所发现的“恐怖”之处。

首先，潘天鸿表示，他把自己的照片上传到Seedance 2.0后，生成的影片就自动为这张脸配上他的声音，“这个AI它会自动用我的声音说话”。但他没有提供声音文件，指令中也没有透露他的身份资讯，甚至没有告诉系统，照片对应的人是谁，“但AI竟然知道这张脸的声音是我的这个声音”。

再来，潘天鸿还发现，他上传一张带有公司部分场景的全身照，但Seedance 2.0生成的影片，竟能以人物为中心进行运镜，转向大楼的另一面，而且与现实场景几乎一模一样。

“这不恐怖吗？它（指AI）知道我背后的东西是什么，即便我没有告诉它。”潘天鸿认为，Seedance 2.0大量使用他们公司的影片进行训练，但却没有对相关素材申请授权，也没有字节跳动的工作人员联系他进行版权申请。

潘天鸿也提醒，当一个人上传到网络的资讯进入AI数据集，并且AI能百分之百模拟出一个人的任何形态以及声音，“那请问这样的内容，你的家人分得出真假吗？”

影片下方网友留言表示，“现在除了比谁钱多买晶片，就是比谁道德底线更低、盗用更多东西训练模型。”“AI最终不是技术问题，而是道德和侵权问题。”

面对相关争议，中国媒体《中国经营报》称，字节跳动已于9日暂停支持用户上传真人图片或影片作为主体参考，并限制仅在完成活体认证后方可生成真人形象影片，同时对名人、知名IP的影片生成进行严格审核。

阳明交大资工系终身讲座教授林一平接受大纪元采访时坦言，这类技术真的非常厉害，是多种AI能力整合的结果，包括语音合成、声纹辨识、少样本学习、影像辨识与场景推测等。只要网络上已有公开影片与声音资料，系统便可透过爬虫抓取并建立声音模型，再输入任意文字生成近似本人语音。

“如果是网红，公开影片本来就很多，AI学习并不困难。”林一平表示，这与人类模仿他人声音的原理类似，只是机器模仿的精准度远高于人类。

至于照片生成全景的技术，林一平说，AI可透过影像辨识公司标志、建筑特征，甚至读取照片内的GPS定位资讯（EXIF资料），再比对公开资料库进行场景补完。“这不是偷到机密，而是利用公开资讯拼凑重建。”

然而，技术突破也让法律面临挑战。林一平表示，目前最大问题在于“法律定义已落后于技术能力”。他解释，AI学的是公开资料，如果没有明确法律禁止，就很难说它违法，真正构成违法的往往不是模仿本身，而是用途，例如涉及诽谤、诈骗、深伪不雅影像等。

更令人忧心的是，这类技术可能被用于认知作战与政治操作。林一平表示，以目前技术水准，完全可以制作逼真的假候选人影片或录音，在选举期间散布假讯息，“这已不是单纯科技问题，而是国安问题”。

林一平表示，若AI资料库设于境外、甚至敌对国家，则风险更为复杂，包括：声纹资料大量搜集、个资整合分析、精准诈骗、认知战操作、选举干扰等，“技术上做得到，至于会不会发生，取决于政治与法律防线是否跟得上”。

至于该如何防范个资遭AI盗用？林一平表示，政府除了要加速制定主权AI、资安防治、订定专法之外，他建议民众尽量不要把个资放到网络上。即便只是上传一张照片，都会附带GPS的定位资讯。以当前科技无所不在的环境，若真想完全杜绝，可能只有回归传统，用纸本印刷的方式才行。

责任编辑：吕美琪#