服务政府、服务社会、服务会员

珠海市公共安全技术防范协会

初探人脸对抗、深度伪造样本检测技术,面临哪些挑战,有哪些潜在研究方向?

时间:2023年10月20日


人脸检测算法是计算机视觉领域的重要应用之一,它在人工智能、安防、人脸识别等领域扮演着关键角色。大到智慧城市建设,小到手机端应用登录,人脸识别已经渗透到社会生活的方方面面。

但是人脸识别运用也是一把双刃剑,基于人工智能生成对抗网络(GAN)和自编码器(Auto-Encoder)等算法的对抗、深度伪造技术,通过生成虚假数字内容来攻击人工智能系统,给日常生活和社会稳定带来巨大隐患,引起了大家的广泛关注。

1.人脸识别发展之路

人脸识别技术包括人脸特征提取和分类器设计等,是生物特征识别领域中的重点研究项目。人脸识别系统的研究始于20世纪60年代,80年代以后随着计算机技术和光学成像技术的发展得到提高,于90年代后期进入初级应用阶段。与其他身份验证技术相比,人脸识别具有无需用户专门配合、接触等独特优势,使远距离身份验证成为可能,例如,通过监控摄像头进行个人身份验证。人脸识别系统将捕获到的图像数据上传到执行人脸检测和面部人脸识别的服务器,数据处理的负载主要集中在服务器上。

2014年前后,随着大数据和深度学习的发展,神经网络备受瞩目,深度学习的出现使人脸识别技术取得了突破性进展。深度学习是机器学习的一种,其概念源于人工神经网络的研究,通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。区别于传统的浅层学习,深度学习的不同在于一方面通常有5层以上的多层隐层节点,模型结构深度大;另一方面利用大数据来学习特征,明确了特征学习的重要性。随着深度卷积神经网络和大规模数据集的最新发展,深度人脸识别取得了显著进展,基于深度学习的人脸识别技术可以通过网络自动学习人脸面部特征,从而提高人脸检测效率。

从人脸表达模型来看,可细分为2D人脸识别和3D人脸识别。基于2D的人脸识别通过2D摄像头拍摄平面成像,研究时间相对较长,在多个领域都有使用,但由于2D信息存在深度数据丢失的局限性,收集的信息有限,安全级别不够高,在实际应用中存在不足。早在2019年,就有小学生手举照片“攻破”了快递柜的人脸识别系统。基于3D的人脸识别系统通过3D摄像头立体成像,由两个摄像头、一个红外线补光探头和一个可见光探头相互配合形成3D图像,能够准确分辨出照片、视频、面具等逼真的攻击手段。

人脸与人体的其他生物特征(如指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提。随着大数据和深度学习的不断发展,人脸识别效率显著提升,为远程办理业务的身份认证环节提供了可靠保障。但与此同时,人脸信息保护、隐私安全等问题也应引起重视。随着《个人信息保护法》《数据安全法》及相关司法解释的出台,国家相关部门以及各种机构对个人信息安全问题的重视,有利于引导人脸识别技术的发展方向,为促进行业高质量发展、创造高品质数字生活提供有力支撑。

2.人脸对抗样本生成与检测

2.1.人脸对抗样本生成技术

人脸对抗样本生成技术是指通过特殊的算法和模型,以一种欺骗性的方式生成人脸图片,使得这些图片可以骗过计算机视觉系统。对抗样本是通过对原始数据进行微小修改或添加扰动的方式,使得计算机视觉系统对这些数据的分类结果产生错误。人脸对抗样本生成技术可以生成一些看起来与真实人脸非常相似的图片,但是这些图片经过一定的修改和扰动后,可以被计算机视觉系统误判为其他类别的图片,例如将一个人的面部图像误判为其他人的面部图像,或者将一个正常的面部图像误判为病态的面部图像。

人脸对抗样本生成技术的应用场景包括对人脸识别系统的攻击和测试,以及对计算机视觉系统的安全性进行评估。此外,人脸对抗样本生成技术也可以应用于虚拟现实、人机交互和艺术创作等领域。

人脸对抗样本生成技术的实现方式主要有以下几种:

(1)基于生成对抗网络 (GAN)的方法:这个方法使用一对相互竞争的神经网络,一个生成器和一个判别器,经过多次迭代训练,得到具有欺骗性的对抗样本。生成器生成假的人脸图像,判别器则尝试区分真实图像和生成图像,生成器通过学习判别器的反馈来不断改进生成图像的质量,以达到更好的欺骗效果。

(2)基于迁移学习的方法:这种方法使用训练好的深度神经网络,如VGG、Inception等在原有模型的基础上添加对抗性损失函数,并对图像进行微小修改,逐步迭代优化生成对抗样本。

人脸对抗样本生成技术也存在一些问题和挑战,如生成的对抗样本存在视觉差异,容易被人眼识别出来,同时也可能存在无法生成对抗样本的情况。此外,对抗样本攻击可能会导致人脸识别系统的误判率大幅提高,对系统的安全性带来威胁。因此,如何应对对抗样本攻击提高人脸识别系统的鲁棒性,是未来研究的重点之一。

2.2.人脸对抗样本检测技术

由于人脸对抗样本生成技术的存在,可能会对人脸识别系统的鲁棒性和安全性造成威胁。因此。研究人员和安全专家们也在致力于开发相应的对抗样本检测方法来应对此类攻击。

人脸对抗样本的检测方法主要可以分为以下几类:

(1)基于特征的检测方法:这种方法主要通过分析样本的特征来检测对抗样本。例如,利用模型中的中间层特征进行分析,探测出对抗样本与真实样本之间的差异。然后将这些特征用于训练一个分类器,通过分类器来判断输入的样本是否是对抗样本。

(2)基于可解释性的检测方法:这种方法利用对抗样本的生成过程,通过对生成过程的解释,来检测对抗样本。例如,可以通过分析生成器的梯度信息,或者探测生成器的噪音输入来识别对抗样本。

(3)基于统计的检测方法:这种方法通过对样本集合进行统计分析,来判断是否存在对抗样本。例如,通过计算样本集的均值、方差等统计量,检测是否存在离群点,以此判断是否存在对抗样本。

(4)基于敌对训练的检测方法:这种方法是在训练阶段使用对抗样本进行训练,以提高模型的鲁棒性。在测试阶段,对使用敌对训练的模型进行评估,以判断是否存在对抗样本。

3.人脸深度伪造生成与检测

3.1.人脸深度伪造生成技术

人脸深度伪造技术[3]可以实现包含人脸替换(Face Swap)和面部重演(Face Reenactment)等多种功能。人脸替换是当前流行的视觉深度伪造方法之一,可以通过将视频中目标人物的脸替换成另一个人的脸来生成假视频,这种技术被广泛应用于深度伪造工具中。面部重演技术可以根据源人脸图像的身份信息和驱动信息(如嘴型、表情和姿态)来合成新的说话人图像或视频[4]。深度伪造人脸表情的操作攻击是指攻击者使用面部重演技术,操纵受害者的表情或嘴型,来伪造受害者在真实场景下的虚假面部表情。例如,通过改变奥巴马的表情和动作,攻击者可以制作虚假演讲视频。目前,Face2Face等技术是比较流行的深度伪造人脸表情修改方法,可以实现不同情绪和表情的修改。

3.2.人脸深度伪造检测技术

深度伪造表情操作攻击检测技术主要包括数据预处理、算法模型设计、模型训练等步骤。首先需要将待检测的图像或视频数据进行预处理[6],并根据先验知识或图像处理的手段进行进一步设计。然后设计相应算法提取出鉴别真假的特征,并构建与检测目标相匹配的深度神经网络模型[7]。最后将待检测的视频或图像输入到训练好的算法模型中进行性能测试,进而验证所设计的深度伪造检测模型的有效性。在此过程中,决定检测性能的关键是如何选择有效区分真假表情的相关特征[8]。

3.2.1.基于数据驱动的深度伪造表情攻击检测技术

优秀的网络设计能更加有效地提取真伪表情之间的细微特征和差异信息[9]。部分技术手段没有把重点聚焦于某一个特殊的伪造算法上,而是把神经网络训练成通用的分类器[10],如图3所示,该技术让神经网络来决定聚焦于输入数据的哪些特性,从而判断真伪。

3.2.2.基于信息不一致的深度伪造表情攻击检测技术

研究发现不同人在说话时,面部表情和头部运动存在明显的模式差异。而在目前现有的伪造方式中都对这种模式造成了破坏,即视频中的人脸区域发生了篡改,导致人物说话时面部表情和头部运动的模式与人物身份不相符。可以通过基于听觉和视觉情感特征不一致的检测方法,即同时从音频和视频中提取情感特征,以此来检测输入视频真伪。

3.2.3.基于GAN图像特征的深度伪造表情攻击检测技术

研究发现GAN生成技术改变了图像的像素和色度空间统计特征,可以通过学习特征共生矩阵来区分生成图像的差异。Wang (2019) 等人提出FakeSpotter[11],利用神经元监控的方法来进行分类,基于神经元监控的图像真伪分类方法,通过覆盖神经元并观察真伪图像经过人脸识别器中的神经元激活变化情况,利用SVM学习神经元激活的差异,从而区分真伪图像。在假的人脸或表情中,神经元覆盖的行为表现出相似性。

最后

人脸识别技术从最初的基于几何特征的方法,到后来的基于表象特征和纹理特征的方法,再到现在的基于深度学习的方法,经历了不断的发展和进步。随着技术的不断创新和应用的不断拓展,人脸识别技术还有着更广阔的前景和更大的挑战。

总的来说,人脸对抗、深度伪造样本的检测方法还处于不断发展和完善中,未来需要结合多种方法,不断提高对抗样本检测的准确性和鲁棒性,通过对大量数据集以及服务器资源进行训练,来获得更加高效的数据驱动算法。

文章来源:智慧城市网 ,人民邮电报,走进历史中


版权所有:珠海市公共安全技术防范协会  网站建设:中企动力  珠海 SEO

版权所有:珠海市公共安全技术防范协会 

网站建设:中企动力  珠海 SEO

营业执照