段宇平 Gouenou Coatrieux 舒华忠
(1东南大学影像科学与技术实验室, 南京 210096)(2布列塔尼国立高等电信学校, 法国布雷斯特 29238)
基于原始传感器模式噪声的CT图像来源检测算法
段宇平1,2Gouenou Coatrieux2舒华忠1
(1东南大学影像科学与技术实验室, 南京 210096)(2布列塔尼国立高等电信学校, 法国布雷斯特 29238)
为了实现无先验信息情况下的CT图像来源检测,提出了一种基于CT扫描仪原始传感器模式噪声的来源检测算法.首先,采用由5种不同滤波器构建出的滤波器组,从CT图像中获取5种不同类型的传感器模式噪声;然后,对每一种噪声分别进行CT三维重建反变换,得到原始传感器模式噪声;最后,根据原始传感器模式噪声的统计特征向量,并结合支持向量机分类器进行分类,从而实现来源检测.实验结果表明,针对4个厂家的15种不同型号CT扫描仪,采用所提算法获得了较基于模式噪声的来源检测算法更高的识别精度,其平均分类精度可达94.12%.
图像来源检测; 计算机断层扫描; 原始传感器模式噪声; 支持向量机
随着医疗行业信息化建设的不断进步,电子病历 (EPR) 系统和图像存储及通信系统 (PACS) 被广泛运用于医疗服务中.医学图像数字化的普及和发展极大地提高了医疗服务的效率,但随之而来的医学信息安全问题也引起了人们的广泛关注[1].
在数以万计的医学成像设备中,DICOM是部署最为广泛的医疗信息标准之一,其定义了质量能满足临床需要的可用于数据交换的医学图像格式.符合该标准的医学图像中包含一个存储了图像信息的头文件[2],借助于一些医学图像处理软件(如ImageJ2x和ezDicom等),可以轻易地对头文件中的内容进行恶意或非恶意的篡改.另外,医学图像的头文件也可能会丢失,从而造成图像的可信度降低.为了对图像进行保护,可以使用数字签名或者嵌入数字水印[3],但是这些主动方法必须在图像获取时进行实时操作,在实际应用中受限.因此,有必要仅利用待检测的医学图像,对其来源进行判定(即盲取证).
现有的图像盲取证方法主要针对日常设备,如数码相机和扫描仪等[4].根据盲取证方法的特征选取策略,可将其分为两大类:① 通过分析成像过程中不同处理环节在图像中留下的痕迹(如CFA插值算法[5]、去马赛克算法[6]和白平衡算法[7]等在像素点之间留下的不同相关性),对图像的来源进行判别.这类方法的缺点在于,难以区分同一型号的不同成像设备以及共用同一后处理算法的设备.② 利用成像设备元器件缺陷引入的特征(如镜头色差[8]、传感器缺陷像素[9]等信息),进行图像来源取证.这些内在缺陷具有偶然性和唯一性,同一型号的不同设备也不尽相同,因此可将这些缺陷视为图像的指纹信息进行来源检测.Lukas等[10]采用了第2类盲取证方法,利用传感器模式噪声(SPN)对图像来源进行判定.Kharboutly等[11]采用对数码相机图像来源取证的思想,将SPN应用到医学图像中.Duan等[12]针对X线摄影图像进行了来源取证实验,获得了较高的识别效率.
为了提高CT图像来源检测的效率,本文通过分析CT的成像原理,提出了一种基于CT成像设备原始模式噪声的图像来源检测算法.
CT成像基本原理如图1所示.一束散射的X光束穿过病人到达探测阵列并环绕一周,得到投影数据,将其输入计算机进行三维重建,从而得到最终的数字化CT图像,并可用于诊断、存储以及传输[13].
CT图像三维重建的基本原理是将每个投影角度下的投影数据看作该投影角度下所有像素值之和,整个重建即为解线性方程的过程.传统滤波反投影(FBP)算法作为主要的重建算法,一直被各大公司广泛使用.另外,CT设备的硬件技术也提升迅速,最新的螺旋CT探测阵列最高已达256层[14].
图1 CT成像基本原理示意图
通过分析CT成像原理可知,CT设备的原始模式噪声并未直接映射到最终图像中,而是经历了重建过程.因此,参考X线摄影图像的噪声模型[12],可建立如下的CT噪声模型:
Pj=Ej+KEj+Q
(1)
式中,Ej为投影角度j下进入成像系统的X线强度值;Pj为投影角度j下X光探测阵列接收到的X线强度值(见图2);K为原始模式噪声的产生因子;KEj为原始模式噪声,由CT扫描仪的缺陷引起并遗留在最终生成的图像中;Q为系统加性噪声.
图2 投影数据的形成
所有CT成像设备都具有FBP重建过程,在对原始信号重建的同时也对OSPN进行重建.为了实现CT图像来源检测算法,需提取OSPN的统计特征作为CT图像指纹.指纹提取的具体步骤如下:
① 利用滤波器组从原始CT图像Y中提取5种传感器模式噪声Ni,即
Ni=Y-Fi(Y)i=1,2,…,5
(2)
式中,F1(·)为中值滤波;F2(·)为窗口大小3×3的维纳滤波;F3(·)为窗口大小5×5的维纳滤波;F4(·)为小波变换滤波;F5(·)为BM3D滤波.不同的滤波算法有助于获得不同类型的传感器模式噪声,选取这5种滤波算法组合可以对模式噪声进行准确估计.每一种滤波算法都是独立作用于原始图像的.
③ 各投影角度下的投影噪声均值为
(3)
为了验证所提算法的性能,选取了4个厂家15台不同型号的CT扫描仪(见表1).从每台仪器选取200幅CT图像,将这3 000幅图像作为实验所用的数据集.图3为测试集中的4个图像样例.为了保证实验的客观性,所有测试图像均采自不同病人的不同身体部位,且均为未经压缩的RAW格式.
本实验中,利用SVM分类器来区分不同CT扫描仪的指纹信息.当分类器训练完成后,将待检测图像的指纹信息输入SVM以判定其来源.为给出较准确的实验结果,共进行了5次实验,取其均值.每次实验均从每台设备的图像集中随机选取30幅图像作为训练集,然后随机选取100幅其他图像作为测试集.CT图像来源分类结果见表2.表中,位于第m行第n列的数据表示图像来源于第m行CT扫描仪被判定为属于第n列CT扫描仪的概率.由表可知,15台设备的平均分类精度为94.12%.5次实验分类准确率的均值和标准差见表1.
表1 CT数据库及分类准确率
(a) 样例1
(b) 样例2
(c) 样例3
(d) 样例4
根据本文算法与文献[11]中基于模式噪声的来源检测算法得到的受试者工作特征(receiver operating characteristic,ROC)曲线如图4所示.由图可知,本文算法获得了更高的识别精度.
图4 基于本文算法和文献[11]算法得到的ROC曲线
本文针对CT图像的来源检测问题,提出了一种基于原始传感器模式噪声的来源检测算法.首先,利用滤波器组提取不同类型的CT扫描仪模式噪声;然后,对CT三维重建过程进行反投影变换,得到原始模式噪声,并提取其统计特征量;最后,利用基于向量机的学习分类器进行来源识别.实验结果表明:与基于模式噪声的来源检测算法相比,所提算法的识别精度更高.下一步的研究工作将集中于扩大实验的数据库和寻找更有效的模式噪声提取算法等.
References)
[1]Coatrieux G, Huang H, Shu H, et al. A watermarking-based medical image integrity control system and an image moment signature for tampering characterization [J].IEEEJournalofBiomedicalandHealthInformatics, 2013, 17(6): 1057-1067. DOI:10.1109/JBHI.2013.2263533.
[2]Bidgood W D, Horii S C, Prior F W, et al. Understanding and using DICOM, the data interchange standard for biomedical imaging[J].JournaloftheAmericanMedicalInformaticsAssociation, 1997, 4(3): 199-212. DOI: 10.1136/jamia. 1997. 0040199.
[3]Ouyang J, Coatrieux G, Shu H. Robust hashing for image authentication using quaternion discrete Fourier transform and log-polar transform[J].DigitalSignalProcessing, 2015, 41: 98-109. DOI:10.1016/j.dsp.2015.03.006.
[4]Warbhe A D, Dharaskar R V, Thakare V M. Computationally efficient digital image forensic method for image authentication[J].ProcediaComputerScience, 2016, 78: 464-470. DOI:10.1016/j.procs.2016.02.089.
[5]Zhou Z P, Hu C Y, Zhou C J. Mobile camera source identification based on CFA Interpolation and large components of sensor pattern noise[C]//ProceedingsoftheInternationalConferenceonControl,MechatronicsandAutomationTechnology(ICCMAT2014). Beijing, 2015: 236-239.
[6]Swaminathan A, Wu M, Liu K J R. Nonintrusive component forensics of visual sensors using output images [J].IEEETransactionsonInformationForensicsandSecurity, 2007, 2(1): 91-106.
[7]Deng Z, Gijsenij A, Zhang J. Source camera identification using auto-white balance approximation [C]//IEEEInternationalConferenceonComputerVision. Barcelona,Spain,2011: 57-64.
[8]Gerules G, Bhatia S K, Jackson D E. A survey of image processing techniques and statistics for ballistic specimens in forensic science [J].Science&Justice, 2013, 53(2): 236-250. DOI:10.1016/j.scijus.2012.07.002.
[9]Choi K S, Lam E Y, Wong K K. Automatic source camera identification using the intrinsic lens radial distortion[J].OptExpress, 2006, 14(24): 11551-11565. DOI:10.1364/oe.14.011551.
[10]Lukas J, Fridrich J, Goljan M. Digital Camera identification from sensor pattern noise[J].IEEETransactionsonInformationForensicsandSecurity, 2006, 1(2): 205-214. DOI:10.1109/tifs.2006.873602.
[11]Kharboutly A, Puech W, Subsol G, et al. CT-scanner identification based on sensor noise analysis [C]//2014IEEEEuropeanWorkshoponVisualInformationProcessing(EUVIP). Paris,France,2014: 1-5. DOI:10.1109/euvip.2014.7018385.
[12]Duan Y, Coatrieux G, Shu H. Identification of digital radiography image source based on digital radiography pattern noise recognition [C]//2014IEEEInternationalConferenceonImageProcessing(ICIP). Paris,France,2014: 5372-5376. DOI:10.1109/icip.2014.7026087.
[13]Seeram E.Computedtomography:Physicalprinciples,clinicalapplications,andqualitycontrol[M]. New York: Elsevier Health Sciences, 2015: 232-272.
[14]Hsieh J, Nett B, Yu Z, et al. Recent advances in CT image reconstruction [J].CurrentRadiologyReports, 2013, 1(1): 39-51.DOI:10.1007/s40134-012-0003-7.
CT image origin identification algorithm based on original sensor pattern noise
Duan Yuping1,2Gouenou Coatrieux2Shu Huazhong1
(1Laboratory of Image Science and Technology, Southeast University, Nanjing 210096, China)(2TELECOM Bretagne, Brest 29238, France)
To detect the origin of a computed tomography (CT) image without prior knowledge, an origin identification algorithm based on the original sensor pattern noise of the CT scanner is proposed. First, 5 different sensor pattern noises are extracted from CT images by a filterbank constituted of 5 distinct filters. Then, the original sensor pattern noises are obtained by the inverse transform of three dimensional CT reconstruction for each type of noise. Finally, the statistic feature vectors of the original sensor pattern noises and the support vector machine (SVM) based classifier are combined to tackle origin identification. The experimental results show that as for 15 different CT scanners from 4 manufacturers, the proposed origin identification algorithm obtains higher identification precision compared with other existing origin identification algorithms based on pattern noises, and the average classification accuracy can reach 94.12%.
image origin identification; computed tomography; original sensor pattern noise; support vector machine
10.3969/j.issn.1001-0505.2016.06.002
2016-05-26. 作者简介: 段宇平(1985—),女,博士生; 舒华忠(联系人),男,博士,教授,博士生导师,shu.list@seu.edu.cn.
国家自然科学基金资助项目(61073138,61201344, 61271312, 61401085, 81101104).
段宇平, Gouenou Coatrieux, 舒华忠.基于原始传感器模式噪声的CT图像来源检测算法[J].东南大学学报(自然科学版),2016,46(6):1122-1125.
10.3969/j.issn.1001-0505.2016.06.002.
TP391
A
1001-0505(2016)06-1122-04