site logo: www.epochtimes.com

上传照片能模仿本人声音 中国AI模型引侵权争议

AI生成技术快速发展,几乎到了以假乱真的地步。示意图。(大纪元制图)
人气: 2757
【字号】    
   标签: tags: , , ,

【大纪元2026年02月12日讯】(大纪元记者吴旻洲台湾台北报导)中国科技巨头字节跳动近日推出人工智慧(AI)影片生成模型Seedance 2.0,引发热议。知名中国影音创作者“影视飓风”创办人潘天鸿实测发现,这款AI竟然在未经授权的情况下,光凭一张面部图像,就能生成与本人高度匹配的声音特征。

于2月低调上线的Seedance 2.0可同步生成影片与声音,只需输入指令或上传参考图,就能在60秒内产出带完整原生音轨的多镜头影片,功能强大引发讨论。

Seedance 2.0被爆2大恐怖

然而,中国科技自媒体“影视飓风”在YouTube上传一支影片表示,试用Seedance 2.0后所发现的“恐怖”之处。

首先,潘天鸿表示,他把自己的照片上传到Seedance 2.0后,生成的影片就自动为这张脸配上他的声音,“这个AI它会自动用我的声音说话”。但他没有提供声音文件,指令中也没有透露他的身份资讯,甚至没有告诉系统,照片对应的人是谁,“但AI竟然知道这张脸的声音是我的这个声音”。

再来,潘天鸿还发现,他上传一张带有公司部分场景的全身照,但Seedance 2.0生成的影片,竟能以人物为中心进行运镜,转向大楼的另一面,而且与现实场景几乎一模一样。

“这不恐怖吗?它(指AI)知道我背后的东西是什么,即便我没有告诉它。”潘天鸿认为,Seedance 2.0大量使用他们公司的影片进行训练,但却没有对相关素材申请授权,也没有字节跳动的工作人员联系他进行版权申请。

AI生成技术快速发展,几乎到了以假乱真的地步。示意图。(Shutterstock)

字节跳动急限制生成真人功能

潘天鸿也提醒,当一个人上传到网络的资讯进入AI数据集,并且AI能百分之百模拟出一个人的任何形态以及声音,“那请问这样的内容,你的家人分得出真假吗?”

影片下方网友留言表示,“现在除了比谁钱多买晶片,就是比谁道德底线更低、盗用更多东西训练模型。”“AI最终不是技术问题,而是道德和侵权问题。”

面对相关争议,中国媒体《中国经营报》称,字节跳动已于9日暂停支持用户上传真人图片或影片作为主体参考,并限制仅在完成活体认证后方可生成真人形象影片,同时对名人、知名IP的影片生成进行严格审核。

专家:立法速度远落后科技

阳明交大资工系终身讲座教授林一平接受大纪元采访时坦言,这类技术真的非常厉害,是多种AI能力整合的结果,包括语音合成、声纹辨识、少样本学习、影像辨识与场景推测等。只要网络上已有公开影片与声音资料,系统便可透过爬虫抓取并建立声音模型,再输入任意文字生成近似本人语音。

“如果是网红,公开影片本来就很多,AI学习并不困难。”林一平表示,这与人类模仿他人声音的原理类似,只是机器模仿的精准度远高于人类。

至于照片生成全景的技术,林一平说,AI可透过影像辨识公司标志、建筑特征,甚至读取照片内的GPS定位资讯(EXIF资料),再比对公开资料库进行场景补完。“这不是偷到机密,而是利用公开资讯拼凑重建。”

然而,技术突破也让法律面临挑战。林一平表示,目前最大问题在于“法律定义已落后于技术能力”。他解释,AI学的是公开资料,如果没有明确法律禁止,就很难说它违法,真正构成违法的往往不是模仿本身,而是用途,例如涉及诽谤、诈骗、深伪不雅影像等。

AI生成技术快速发展,几乎到了以假乱真的地步。示意图。(123RF)

AI深伪恐成选举干扰工具

更令人忧心的是,这类技术可能被用于认知作战与政治操作。林一平表示,以目前技术水准,完全可以制作逼真的假候选人影片或录音,在选举期间散布假讯息,“这已不是单纯科技问题,而是国安问题”。

林一平表示,若AI资料库设于境外、甚至敌对国家,则风险更为复杂,包括:声纹资料大量搜集、个资整合分析、精准诈骗、认知战操作、选举干扰等,“技术上做得到,至于会不会发生,取决于政治与法律防线是否跟得上”。

防AI盗用 个资尽量别传网络

至于该如何防范个资遭AI盗用?林一平表示,政府除了要加速制定主权AI、资安防治、订定专法之外,他建议民众尽量不要把个资放到网络上。即便只是上传一张照片,都会附带GPS的定位资讯。以当前科技无所不在的环境,若真想完全杜绝,可能只有回归传统,用纸本印刷的方式才行。

责任编辑:吕美琪#

评论