数智说|如何认识深度合成的风险,并找到治理之道?

作者 | 财经E法 樊瑞 编辑 | 鲁伟  

2022年07月28日 19:43  

本文3268字,约5分钟

深度合成提升了生产力,但也模糊了真假界限,它会带来什么样的风险,又该如何加以治理,值得思考和探讨。

作为算法的一种重要表现形式,深度合成在当下的多个场景均有普及。以兼具图像、视频合成和语言功能的虚拟数字人为代表的深度合成应用在近期更是成为业界焦点。不过,深度技术应用越来越普遍的同时,也应看到这一技术可能存在的风险问题,应对其进行多维度规制。

7月21日,由对外经济贸易大学数字经济与法律创新研究中心和《财经》商业治理研究院共同主办的“数智说”第一期研讨会召开,议题为“深度合成如何转‘危’为‘机’”。来自学术界、实务界的专家学者共议深度合成这一前沿话题。

对外经济贸易大学法学院院长梅夏英介绍了“数智说”研讨会出炉的背景和意义,在数字经济加速发展的背景下,“数智说”关注国内外最新发展动向,围绕数字经济和人工智能发展和治理的热点、难点问题确定议题,为完善数字经济和人工智能治理路径提供思想启迪和理论借鉴。

在协同参与、多元共治、互助互联、共建共享创新理念的引领下,“数智说”旨在以前瞻视野和探索精神,跨学科、多维度地研究与数字经济、人工智能相关的法律创新,凝聚各界共识,推动制度变革,从而为中国数字经济和人工智能业态的健康发展贡献智识和力量。

据梅夏英介绍,“数智说”未来几期将聚焦平台自我优待、反垄断法修改亮点、网络暴力治理等前沿话题展开讨论。

深度合成应用普遍

何为深度合成?

2022年1月28日,国家网信办公布《互联网信息服务深度合成管理规定(征求意见稿)》(下称《征求意见稿》),对深度合成做了定义。《征求意见稿》指出,深度合成技术,是指利用以深度学习、虚拟现实为代表的生成合成类算法制作文本、图像、音频、视频、虚拟场景等信息的技术,具体包括但不限于对文本内容、语音内容、非语音内容、人脸等生物特征、非生物特征以及三维重建等对虚拟场景进行生成或者编辑等。

中国人民大学未来法治研究院执行院长张吉豫在“数智说”研讨中指出,关于深度合成,此前业界更多关注利用机器学习产生的具有较高自然度的音视频内容,但在《征求意见稿》中,对文本内容的管理也纳入其中,“在这样的界定下,意味着深度合成不同类型的应用场景,其实对应不同的风险,应对其进行相应的规制”。

中国社会科学院大学互联网法治研究中心执行主任刘晓春表示,《征求意见稿》侧重的是对于网络安全和网络内容的治理,此外,《征求意见稿》是法律专家和技术专家共同推进的结果,“不管是对深度合成的分类,还是相关规制规定,用语都很技术化,可以看出技术专家起到了非常核心的作用。”她指出,这是中国网络治理领域立法中普遍存在的特点,跟此前出台的算法治理规定一脉相承。

其实,深度合成并非新事物,只是在技术催化下,深度合成的方式更加多元和普遍。讯飞数码AI研究院院长方四安指出,早在人工操作时代,就存在对原始素材的加工、编辑;再到模拟时代,出现录音带、录像带、胶片冲印、声音模仿、笔迹模仿;在当下的数字时代,对录音、图片、视频的数字化文件的编辑、加工、修改更加普遍,同时对图像的滤镜、形变扭曲、变声软件也频频出现。

方四安还指出,中国深度合成技术和国外基本处于同一梯队水平,尤其在语音和视频领域,尚无明显技术代差。

深度合成的“机”与“危”

深度合成应用的发展,背后是技术进步的推动。

腾讯研究院高级研究员曹建峰表示,在人工智能领域,过去十年是深度学习的“黄金十年”,人工智能在语音、视觉等感知领域日益超过人类,相关技术得到突飞猛进的发展,“在下一个十年,什么技术会得到很好的发展?我认为很有可能就是深度合成,人工智能有望实现从感知到生成的跃迁”。

据曹建峰介绍,深度合成的三大技术方向主要包括AI大模型、AI数字人和AI合成数据。其中,数字人融合计算机视觉,语音、歌声合成和转换,兼具图像、视频合成和迁移自然语言理解等多模态AI能力与技术,生成逼真的可交互内容,目前已成为AI领域的新风口。

当下,以虚拟数字人为代表的深度合成技术应用成为业界关注的焦点,并在传媒、金融、文娱等领域得到广泛应用,被普遍认为是未来元宇宙的交互入口。

方四安则以实践为例,介绍了通过语音图像驱动的人物视频合成技术及应用。他指出,利用人工智能深度合成技术合成多媒体虚假信息,通过语音驱动人脸表情、口型、动作,即可实现实时及离线视频合成的目的,“我们只需要一张人脸图像,即可实现视频(图像)换脸”。

深度合成提升了生产力,但也模糊了真假界限,其带来的风险成为研讨会上专家热议的话题。与会专家提醒,深度合成技术存在着诸多风险,一些深度合成被恶意应用于传播虚假信息。此外,深度合成可能被用于生成点头、眨眼等动态视频,从而攻击人脸识别系统。通过技术合成的内容,人已经难辨真假。伪造和鉴伪是持续攻防的过程,未来对检测技术的需求越来越大。

曹建峰提到,深度合成带来知识产权、安全和伦理三大挑战。具体而言,在知识产权方面,深度合成背后的AI大模型的开发训练使用他人享有权利的数据,可能存在侵权问题,同时存在生成内容知识产权不清的问题;在安全方面,深度合成可能带来更加难以辨别真伪的虚假信息,借助AI技术实施的诈骗、色情、诽谤、假冒身份等新型违法犯罪活动,以及侵犯用户隐私和身份信息安全的恶意行为;深度合成还可能存在算法歧视、用户对数字人产生情感依赖等伦理挑战。

如何治理?

目前,各国都在重视对深度合成和深度伪造的治理,并加大立法力度。

全球范围内,除了直接出台深度合成、深度伪造相关的法律法规,部分国家和地区还利用已有的数据保护、虚假信息传播等法律加以规制。中国总体上呈现出审慎监管的态度,致力于平衡好创新发展和有效治理,在一些已经出台的法律法规中,对于深度合成皆有所规制。

国家网信办、文化和旅游部、广电总局在2019年11月联合发布《网络音视频信息服务管理规定》,要求对非真实音视频信息,应当以显著方式予以标识;服务提供者应当部署非真实音视频鉴别技术;鼓励行业自律。

2020年5月通过的民法典,在其人格权编也有相应规定:禁止利用信息技术手段伪造等方式侵害他人的肖像权和声音。

2022年1月,国家网信办、工信部、公安部、市场监督总局联合发布《互联网信息服务算法推荐管理规定》,要求服务提供者应当加强信息安全管理,发现未作显著标识的算法生成合成信息的,应当作出显著标识后,方可继续传输;服务提供者不得生成合成虚假新闻信息。

张吉豫指出,目前中国已经建立规制深度合成不良行为的保障体制,包括公民权益的保障和一些对应的刑事犯罪罪名,以及行政管理规定。她思考的问题是,“应该如何更好的通过对整个流程的监管,以保证对深度合成的有效规制?”

张吉豫建议,应加强对社会主体的普及教育和宣传;对基于深度合成技术提供网络音音视频信息服务的提供者,可明确其对首页首屏、热搜、精选等重点环节内容进行必要的鉴别的注意义务;对于一般社会主体,可明确规定禁止破坏或规避鉴别深度合成内容的技术措施、禁止故意删除深度合成标识。此外,要加强对科研行为的规范,对开源社区做一定规范,加强相关国际合作,提升对开源代码的相应鉴定技术。

在《征求意见稿》第十三条中规定,深度合成服务提供者对使用其服务所制作的深度合成信息内容,应当通过有效技术措施在信息内容中添加不影响用户使用的标识,依法保存日志信息,使发布、传播的深度合成信息内容可被自身识别、追溯。

刘晓春对此指出,深度伪造技术本质上是信息造假,利用的是信息不对称,规制的根本路径在于消除信息不对称。她表示,在不影响用户体验的情况下,增加可溯源的标识符,可加大信息披露力度。

刘晓春还建议,对于利用深度合成技术发布虚假广告和信息,进行误导、诈骗的行为,应加大治理力度。