谭艳萍 罗永 张俊
摘 要:隐写术的不断发展使得隐写分析术面临的挑战越来越大。近年来,有不少学者围绕深度学习网络强大的图像特征表达学习能力进行隐写分析术研究,从而避开人工设计分类特征,减少人的参与度,用数据和算法驱动机器去实现数字图像是否含密的判定。本文将从数字图像的全局和局部统计分布特性这两个方面出发,梳理传统的和基于深度学习的隐写与隐写分析术在空域和JPEG域上的研究进展,并对数字图像隐写和隐写分析术未来发展方向做简要讨论。
关键词:深度学习;隐写术;隐写分析术;统计分布特性;数字图像
中图分类号:TP391.4;TP183 文献标识码:A文章编号:2096-4706(2021)13-0068-05
Study Overview of Digital Image Steganography and Steganalysis Based on
Deep Learning
TAN Yanping, LUO Yong, ZHANG Jun
(Guizhou University of Commerce, Guiyang 550014, China)
Abstract: With the continuous development of steganography, steganalysis is facing more and more challenges. In recent years, many scholars have carried out steganalysis research around the powerful image feature expression learning ability of deep learning network, so as to avoid manually designing classification features, reduce peoples participation, and drive the machine with data and algorithm to determine whether the digital image contains secret. Starting from the global and local statistical distribution characteristics of digital images, this paper combs the research progress of traditional and deep learning based steganography and steganalysisg in spatial domain and JPEG domain, and briefly discusses the future development direction of digital image steganography and steganalysis.
Keywords: deep learning; steganography; steganalysis; statistical distribution characteristics; digital image
0 引 言
现代信息隐藏技术来源于古代一门有趣而又安全的传递秘密信息的隐写术。随着21世纪信息技术的发展和现代化进程的加快,古代隐写术成为当今的研究热点之一。崭新的隐写术在数理统计、多媒体处理技术和认知心里学等理论的基础上应运而生。首先是对保护多媒体产品版权的数字水印研究的急剧升温,公开发表的论文数量逐年递增,有不少开发数字水印产品的公司如雨后春笋般涌现[1],且数字水印在现实生活中应用极其广泛。现代信息隐藏技术的另一重要领域即数字隐写术的研究也紧随其后,很早就出现了一些简单的数字隐写术[2],例如LSB替换[3]。数字隐写术利用人类感官对细微变化的不敏感性和载体信息在时间和空间等方面的冗余性,将秘密信息嵌入载体(如:文本、图像、音频、视频等)比较复杂且难以建模分析的区域之中,这样隐藏的数据既不会改变原始载体信号的视(听)觉效果,也不会改变其固有的统计分布特征,从而实现某种意义上的“不可视”的隐蔽通信[4]。数字隐写术与传统密码通信技术不同的是,隐藏了“正在进行通信”这一事实本身,而且在数字隐写的过程中,数据在嵌入载体前可以通过提前加密来进一步提高秘密通信的安全性。
数字隐写术的发展,在带来一种新的隐蔽通信方法的同时也带来了网络信息安全的威胁,在全球互联的时代,每个人都能够从互联网上任意下载多媒体数据以及可以很方便地通过网络获取和使用相关隐写工具,且近年来关于不法分子利用数字隐写术开展非法活动的报道已经见诸报端,因此研究反隐写技术具有非常重要的理论意义与实用价值。反隐写技术即数字隐写分析术,是一种与隐写术相对抗的逆向分析技术,主要根据载体的统计分布特征来判断其中是否含有秘密信息。根据研究目标的不同,可将数字隐写分析术分为三个层次,第一层次就是检测秘密信息的存在性,鉴于对数字隐写术进行有效分析要远比实现隐写安全通信困难,因此现阶段的研究基本上都还是停留在该层次。第二层次是要识别所用的隐写工具、估计密钥[5]、估计嵌入的秘密信息量[6]等,第三层次是要能截获或提取隐蔽信息等,最高层次意味着难度最大但也最有实际意义。然而由于隐写算法的层出不穷,尤其是时下最热门的基于深度学习的数字隐写术的出现以及海量的多媒体信息等,要从中搜寻隐蔽信息犹如大海捞针[7]。面对日渐严峻、层出不穷的信息安全问题,在信息隐藏领域中,研究数字隐写分析术不仅可以通过检测可疑信息的存在来阻止敌对势力双方的通信,还有益于整顿整个网络的安全通信。当前关于数字隐写和隐写分析术的研究绝大部分集中在数字图像领域,数字图像隐写及隐写分析模型如图1所示。
深度学习的概念,最早由杰弗里·辛顿于2006年提出。这是一门用于学习和利用“深度”人工神经网络的机器学习技术,目前,深度学习已得到广泛应用。如在博弈领域,AlphaGo通过深度学习,以4∶1的比分战胜韩国棋手李世石,成为第一个击败人类职业围棋选手的电脑程序,引起了业界的轰动;在图像处理中,最通用的技术是计算机视觉,如图像风格迁移、图像修复、图像上色、人脸图像编辑以及视频生成等;在数字图像隐写与隐写分析术领域,深度学习带来了活力与创新,借由深度学习网络强大的特征表达学习能力,学者们发现通过对深度学习网络结构进行相应的改进之后,就可以将深度学习与数字图像隐写和隐写分析术相结合来提升该领域的算法设计及分类效果等,且取得了不少创造性的成果[8]。
本文从数字图像全局和局部统计分布特性这两方面出发,首先对传统的数字图像隐写术做一个归纳性介绍,然后对基于深度学习的数字图像隐写术研究情况做简要总结。对于数字图像隐写分析术主要介绍传统的专用和通用隐写分析术以及新式通用隐写分析术即基于深度学习的数字图像隐写分析术的研究进展,最后对其还存在的问题做一个简要讨论。
1 数字图像隐写术
1.1 传统数字图像隐写术
从数字图像全局和局部统计分布特性出发,可以将传统数字图像隐写术分为两大类,一类是非自适应数字图像隐写术,图像中的所有像素值或者变换域系数拥有同等的概率被嵌入秘密信息,即秘密信息可以嵌入整张图像中的任意位置;一类是自适应数字图像隐写术,一张图像会被划分为不同的区域,只有那些非平滑区域或者边缘部分才有较大概率嵌入秘密信息,即一般依据算法将秘密信息嵌入图像纹理较为复杂的局部区域。
非自适应数字图像隐写术即从图像的全局统计分布特性出发,将图像看作一个整体来进行秘密信息的嵌入,根据数字图像隐写术嵌入域的不同,可以将其分为空域及变换域。在空域图像中的典型隐写术有:LSB(Least Significant Bit)[3]、LSBM(LSB Matching)、LSBMR(LSB Matching Revisited)、±K与随机调制隐写、EAMR等。数字图像变换域隐写术中最常见的隐写方法是基于JPEG域的,后续关于变换域的介绍均以JPEG域代替。基于JPEG域的隐写术是将秘密信息嵌入到JPEG压缩过程中量化后的DCT系数。常见的基于JPEG域的隐写术有Jsteg、Outguess、F5、Fridrich等人基于湿纸码提出了一种扰动量化隐写术nsF5等。这些隐写术在嵌入秘密信息时操作简单,但缺点是抗隐写分析能力弱,易被发现。
自适应数字图像隐写术即从图像的布局统计分布特性出发,将图像中复杂度高的局部区域作为秘密信息嵌入的优先载体,通过设计合理的嵌入失真函数并使其最小化为依据来选择嵌入点,这样就使得同一幅图像中的每个像素值或者变换域系数被嵌入秘密信息的概率有大有小,成为局部式而非全局式嵌入秘密信息。根据自适应数字图像隐写术的嵌入域不同,可以分为空域图像和JPEG域。在空域图像中典型的自适应隐写术有:基于LSB算法的各种数字图像自适应隐写术[9-11]、HUGO、WOW、S-UNIWARD、HILL等,均将秘密信息嵌入空域图像纹理复杂或边缘等难以建模的区域。基于JPEG域的自适应隐写术有:Huang等人提出的一种高安全性的基于JPEG域格式的隐写术[12]块熵Wang等人[13]基于量化的DCT系数的块熵和STC(Syndrome-Trellis Coding)矩阵编码提出的一种高安全性的JPEG隐写术、J-UNIWARD等。这些自适应隐写术嵌入过程相较于非自适应隐写术更为复杂,但是从躲避拦截等方面来看,其抗隐写分析能力强,安全性更高,更有利于秘密信息的传送。为了更形象地展示出自适应数字图像隐写术嵌入秘密信息的特点,本文采用WOW隐写术在空域图像上分别演示这四种嵌入率0.1 bpp、0.2 bpp、0.3 bpp、0.4 bpp下图像的载密情况,如图2、图3、图4、图5、图6所示。从图中可以清晰看出数字图像自适应隐写术可以完美地将秘密信息嵌入图像纹理较为复杂的区域。
1.2 新式数字图像隐写术
为了区别于传统数字图像隐写术,本文将基于深度学习的数字图像隐写术称为新式数字图像隐写术,其大致可以分为采用生成对抗网络和借鉴对抗样本思想这两类来生成载密图像。基于生成对抗网络的数字图像隐写术一般集中于空域图像,主要是从载体或隐写失真代价方面“被动”地增强自身对隐写分析的抵御能力[8],典型的隐写模型有:SGAN(Steganographic GAN)、SSGAN(Secure SteganographyBased on GAN)、HayesGAN、HiDDeN(Hiding Data With Deep Networks)等。而借鉴对抗样本思想的数字图像隐写术一般通过“主动”干扰隐写分析采用的机器学习模型来提高隐写安全性[8],主要有:Zhang等人[14]、Tang等人[15]、Ma等人[16]提出的数字图像隐写术。若从数字图像全局和局部统计分布特性角度来看,SGAN、SSGAN及Stego-WGAN这三个数字图像隐写方法主要是基于图像全局嵌入秘密信息,Tang等人[15]提出的ASDL-GAN和Yang等人[17]提出的UT-SCA-GAN通过在对抗训练中利用生成网络得到每个像素的嵌入改变概率得到像素修改图[18],主要从图像局部嵌入秘密信息。新式数字图像隐写术依赖于网络自主学习和数据驱动,与传统数字图像隐写术最大的不同在于避开了由人工设计秘密信息嵌入算法,不再依赖于人的先验知识和相关经验,且在抗隐写分析的能力上也变得更强。SGAN、SSGAN、Stego-WGAN、ASDL-GAN、UT-SCA-GAN在0.4bpp嵌入率下抗隐写分析能力对比如表1所示。表中的数据均来源于提出该隐写方法时的参考文献,隐写分析准确率越高代表该隐写分析方法安全性越差,综合比较之下,Stego-WGAN和UT-SCA-GAN性能较优。
2 数字图像隐写分析术
本节将从基于数字图像全局和局部统计分布特性的角度出发,阐述近年来数字图像隐写分析术研究进展情况。
2.1 基于数字图像全局统计分布特性的隐写分析术
基于数字图像全局统计分布特性的隐写分析术将载体图像或载密图像作为一个整体,无差别对待图像中的每一个像素或者每一个变换域系数。从应用范围来看,基于数字图像全局统计分布特性的隐写分析术可分为两大类,一类是针对特定隐写术的检测即专用隐写分析术,一类是不针对任何隐写术的通用检测即通用隐写分析术,而且还可以从空域和JPEG域来划分专用隐写分析术和通用隐写分析术。针对空域图像的专用隐写分析术主要有:卡方检验方法、RS方法、SPA方法等,针对JPEG域特定隐写术检测的专用隐写分析术主要有:卡方检验方法、定量隐写分析检测、基于直方图的检测等。这些方法均是专为某些特定的数字图像隐写术而设计的,具有较好的检测效果,但是现实中往往很难提前获知数字图像采用的是哪一种隐写术,因此其实用性及适用性均不强。而通用隐写分析术则不受数字图像所选隐写术的限制,更具实际应用价值。在空域图像通用隐写分析术中,一般将嵌入的秘密信息视为高频扰动信号,那么会先利用高通滤波器得出残差图像,以减少图像内容本身所带来的分类效果的负面影响而凸显出秘密信息的存在,然后在残差图像的基础上再使用各种统计模型来提取分类特征。从数字图像全局统计分布特性出发,根据是否由人工参与设计分类特征,可以分为传统数字图像通用隐写分析术和基于深度学习的新式数字图像通用隐写分析术:
(1)传统数字图像通用隐写分析术。传统数字图像通用隐写分析术主要分为特征构造和分类训练这两个阶段,重点在于由人工设计分类特征,所以非常依赖设计者的先验知识及分类器的判别能力。在空域图像上,典型的通用隐写分析术有:SPAM、SRM、PSRM、TLBP等,其中SRM在各类隐写术的检测中表现均不错,赢得最多认可与关注。在JPEG域上,典型的通用隐写分析术有:PEV、JRM、DCTR、PHARM、GFR等。无论是空域还是JPEG域,以上这些传统的数字图像隐写分析术均是从数字图像的全局分布提取有效特征。
(2)新式数字图像通用隐写分析术。在这里用新式数字图像通用隐写分析术指代基于深度学习的数字图像通用隐写分析术,主要用来区分人工设计分类特征的传统数字图像通用隐写分析术。基于深度学习的数字图像通用隐写分析术根据预处理层内部权重参数是否参与反向传播可分为半学习隐写分析和全学习隐写分析[19]。
基于空域图像的半学习隐写分析模型主要有:Qian等人提出的GNCNN网络、Xu等人提出的Xu-Net网络、Yedroudj等人提出的Yedroudj-Net网络、Li等人提出的ReST-Net网络等;基于JPEG域的半学习隐写分析模型主要有:Xu在原有Xu-Net基础上提出的Xu-Net-JPEG网络、Chen等人在Xu-Net的基础上提出的VNet与PNet网络、Zeng等人提出的Zengs model频域分析模型等。这些空域半学习隐写分析模型在嵌入率为0.4bpp,隐写术为S-UNIWARD时隐写分析准确率对比如表2所示,隐写分析准确率越高,代表该隐写分析模型性能越好,从表2中可以看出,ReST-Net网络具有最高的检测准确率。
基于空域图像的全学习隐写分析模型主要有:Tan等人首次将隐写分析与深度学习相结合而提出的TanNet网络、Ye等人提出的Ye-Net网络、Boroumand等人提出的SRNet网络(且SRNet网络也可应用于JPEG域),Zhu等人提出的Zhu-Net网络等。基于深度学习的数字图像通用隐写分析术就是利用深度学习网络强大的特征表达学习能力从图像全局统计分布特性出发将特征构造与分类训练融于一体,避免人工设计特征,利用数据驱动和计算机算力来实现隐写分析。从实验结果来看,全学习隐写分析模型相对于传统数字图像通用隐写分析术与新式数字图像通用隐写分析术的半学习模型具有更高的检测精度,但是其所需要的训练时间更长,也更容易出现过拟合情况等[19]。
2.2 基于数字图像局部统计分布特性的隐写分析术
基于数字图像局部统计分布特性的隐写分析术可根据载体图像或载密图像的局部纹理复杂度高、边缘部分变化程度剧烈的区域来提取分类特征,一般先用高通滤波器得到图像的高频残差图像,然后在残差图像上进行直方图或共生矩阵统计特征的构建,这样操作就是为了最大化载密信息在分类中的作用。
对于空域图像,根据图像局部统计分布特性进行隐写分析的方法从某种意义上可称为自适应隐写分析术,主要有:maxSRM、tSRM、σSRM、黄思远等人[20]提出的基于显著性检测的图像隐写分析方法、Tang等人[21]提出的利用选择信道信息的自适应隐写分析等。对于JPEG域,其自适应隐写分析术主要有SCA、李德维等人[22]提出的基于噪声感知残差网络的JPEG隐写分析方法等。基于数字图像局部统计分布特性的隐写分析术强调的是自适应选择图像较复杂区域进行特征提取,尽可能将秘密信息的嵌入扰动量最大化,将图像内容本身对于隐写分析准确率的影响最小化。
3 结 论
本文从数字图像的全局和局部统计分布特性这两方面出发,梳理了数字图像隐写和隐写分析术在空域和JPEG域的发展情况,重点在于近年来开展的如火如荼的基于深度学习的数字图像隐写和隐写分析术。深度学习确实给这个领域带来了不一样的关于载密图像生成和判别的思路,但是现阶段的研究大部分还是停留在对深度学习网络结构的改造上,且还存在以下几个方面的问题:
(1)基于深度学习的隐写术生成的含密图像一般视觉质量不佳。
(2)基于深度学习的数字图像隐写分析术在面对隐写算法比较复杂和秘密信息低嵌入率的情况中表现不佳,有待进一步寻求新的突破口。
(3)还未实现完全端到端的学习模式,依赖人工干预。
(4)基于深度学习的数字图像隐写分析术训练效率较低,拟合度速度较慢。
(5)基于深度学习的数字图像隐写分析术通用性不够,跟不上隐写术的发展脚步,等等。在今后的研究过程中,将围绕这些问题进行探索。
参考文献:
[1] 王朔中,张新鹏,张卫明.以数字图像为载体的隐写分析研究进展 [J].计算机学报,2009,32(7):1247-1263.
[2] JOHNSON N F,JAJODIA S. Exploring Steganography:Seeing the Unseen [J].Computer,1998,31(2):26-34.
[3] PETITCOLAS AP F,ANDERSON J R,KUHN G M. Information hiding-a survey [J].Proceedings of the IEEE,1999,87(7):1062-1078.
[4] 周翠红,秦姣华,左伟明,等.空域图像隐藏信息检测技术研究 [J]. 湖南城市学院学报(自然科学版),2010,19(2):55-60.
[5] TRIVEDI S,CHANDRAMOULI R. Secret key estimation in sequential steganography [J]. IEEE Transactions on Signal Processing,2005,53(2):746-757.
[6] TRIVEDI S,CHANDRAMOULI R. Active steganalysis of sequential steganography [C]//Conference on Security and Watermarking of Multimedia Contents V Jan 21-24.Santa Clara CA:Proceedings of SPIE - The International Society for Optical,2003.
[7] 茹炳晟.JPEG图像隐写信息盲检测系统的设计与开发 [D].上海:上海交通大学,2008.
[8] 翟黎明,嘉炬,任魏翔,等.深度学习在图像隐写术与隐写分析领域中的研究进展 [J].信息安全学报,2018,3(6):2-12.
[9] YANG C H,WENG C Y,WANG S J,et al. Adaptive Data Hiding in Edge Areas ofImages With Spatial LSB Domain Systems [J].IEEE Transactions on Information Forensics and Security,2008,3(3):488-497.
[10] HUANG W,ZHAO Y,NI R R. Block-Based Adaptive Image Steganography Using LSB Matching Revisited [J]. Journal of Electronic Science and Technology,2011(4):291-296.
[11] LIU G J,LIU W W,DAI Y W,et al. Adaptive steganography based on block complexity and matrix embedding [J]. Multimedia Systems,2014,20(2):227-238.
[12] HUANG F J,HUANG J W,SHI Y Q. New channel selection rule for JPEG steganography [J].IEEE Transactions on Information Forensics and Security,2012,7(4):1181-1191.
[13] WANG C,NI J Q. An efficient JPEG steganographic scheme based on the block entropy of DCT coefficients[C]//2012 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP).Kyoto:IEEE,2012.
[14] ZHANG Y W,ZHANG W M,CHEN K J,et al. Adversarial Examples Against Deep Neural Network based Steganalysis[C]//Proceedings of the 6th ACM Workshop on Information Hiding and Multimedia Security. ACM,2018:67-72.
[15] TANG W X,LI B,TAN S Q,et al. CNN Based Adversarial Embedding with Minimum Alteration for Image Steganography [J].IEEE Transactions on Information Forensics and Security,2018.
[16] MA S,GUAN Q X,ZHAO X F,et al. Weakening the Detecting Capability of CNN-based Steganalysis [EB/OL].(2018-03-29).https://www.researchgate.net/publication/324104295_Weakening_the_Detecting_Capability_of_CNN-based_Steganalysis/fulltext/5abdb18daca27222c755994b/324104295_Weakening_the_Detecting_Capability_of_CNN-based_Steganalysis.pdf?origin=publication_detail.
[17] Yang J,Liu K,Kang X,et al. Spatial image steganography based on generative adversarial network [EB/OL].(2018-04-21).https://arxiv.org/abs/1804.07939v1.
[18] 付章杰,李恩露,程旭,等.基于深度学习的图像隐写研究进展 [J].计算机研究与发展,2021,58(3):548-568.
[19] 陈君夫,付章杰,张卫明,等.基于深度学习的图像隐写分析综述 [J].软件学报,2021,32(2):551-578.
[20] 黄思远,张敏情,柯彦,等.基于显著性检测的图像隐写分析方法 [J].计算机应用,2021,41(2):441-448.
[21] Tang W,Li H,Luo W,et al. Adaptive steganalysis against WOW embedding algorithm[C]//Proceedings of the 2nd ACM workshop on Information hiding and multimedia security.2014:91-96.
[22] 李德维,任魏翔,王丽娜,等.基于噪声感知残差网络的JPEG隐写分析方法 [J].计算机应用研究,2021,38(10):3148-3152+3165.
作者简介:谭艳萍(1990—),女,汉族,湖南邵阳人,讲师,硕士研究生,研究方向:数字图像隐写与隐写分析;罗永(1991—),男,汉族,贵州毕节人,讲师,硕士研究生,研究方向:物联网技术应用;张俊(1987—),男,汉族,河南信阳人,副教授,博士,研究方向:物联网技术应用。