中药材及炮制品的近红外指纹图谱模式识别快速鉴别方法

2014-04-02 08:12杨天鸣付海燕黄国贞
化学与生物工程 2014年9期
关键词:马氏菖蒲赤芍

杨天鸣,吴 燕,苏 蕊,付海燕,杨 琛,张 璐,黄国贞

(中南民族大学药学院,湖北 武汉 430074)

中药的真伪优劣鉴别自古以来为医家所重视。中药材紧缺,价格较贵,受利益所驱,出现了不少伪品和混淆品。中药材的伪品和混淆品不仅直接影响了中药的质量,而且造成入药混乱。中药炮制是为了适应中医临床辨证用药的需要而发展起来的一项传统制药技术,而炮制方法工艺中由于不规范或误传误用极大影响了炮制品的功效。因此,建立鉴别中药材品种和炮制品的快速分析方法迫在眉睫。

由于中药材绝大部分为植物中药,因此植物学家鉴别植物种群的理论与方法被沿用于植物中药的品种鉴别分析中。然而,市面流通的中药材通常为植物的干燥组织或以饮片形式出现,常常需要有经验的专家对样品进行显微鉴别和薄层分析判别,但仅靠上述判别方法难以满足要求并且常常出现错判。为保证中药材鉴定的客观性、准确性与可靠性,现代分析检测技术被用于中药材品种鉴别[1-5],如色谱指纹图谱、DNA分子遗传标记法、激光拉曼光谱法、荧光光谱、电子鼻等。近红外光谱(near-infrared,NIR) 技术以其光谱稳定性好和信息量丰富等特点,近年已被逐步引入到中药药材整体质量控制中,并显示出无损、快速、绿色的技术优势,但近红外光谱中隐含的大量化学信息,需要借助化学计量学方法提取解析[6-16]。因此,化学模式识别方法成为近红外光谱用于中药材的真伪、产地以及炮制前后药材的鉴别的关键技术[6-16]。

作者利用近红外漫反射光谱技术,通过多元散射校正(MSC)光谱预处理方法结合主成分-马氏距离判别分析方法,建立了一种快速无损鉴别中药材及炮制品的方法。

1 实验

1.1 材料

选择7种中药材为研究对象,菖蒲、赤芍、川穹、丹参、生甘草、开口箭、炮制品炙甘草,分别编号为A、B、C、D、E、F、G,除开口箭来自湖北宜昌外,其余药材均来自武汉德仁堂大药房。所有样品洗净、去泥沙,晒干。

实验所用药材均经中南民族大学药学院万定荣教授鉴定。

1.2 主要仪器

AntarisⅡ型傅立叶变换近红外光谱仪(配有积分球漫反射采样系统、InGaAs检测器以及石英样品杯,Result软件用于光谱的采集,TQ 8.0软件用于分析数据处理),美国Thermo Nicolet公司;FW-100型高速万能粉碎机,天津泰斯特仪器有限公司;200 目标准检验筛(孔径0.074 mm),浙江上虞五四纱筛厂;DZF-6021型真空干燥箱,上海索谱仪器有限公司。

1.3 方法

1.3.1样品的制备

全部中药材用中药粉碎机粉碎后过200目筛,制成细粉,然后在60 ℃下真空干燥24 h,干燥细粉储存在干燥器内,备用。

1.3.2近红外指纹图谱的采集

将处理后的样品分别盛入样品池内,采用近红外光谱仪的积分球漫反射附件采集近红外光谱图。采集条件:光谱范围为10 000~4 000 cm-1,扫描次数为32次,分辨率为8 cm-1。光源采用empty门衰减,增益为2倍;以金箔为参比进行扫描;温度为(25±1) ℃,湿度为(45±2)%。每种药材测定10次,7种药材共得到70个样品光谱。分别以样品测定顺序按01~70进行编号,并划分训练集与预测集。样品编号见表1。

表1样品编号对照表

Tab.1Adetaileddatasetlistofallsamples

编号药材训练集预测集A菖蒲01~0708~10B赤芍11~1718~20C川穹21~2728~30D丹参31~3738~40E生甘草41~4748~50F开口箭51~5758~60G炙甘草61~6768~70

1.3.3光谱数据处理

所采集的光谱数据通过多元散射校正(MSC)进行光谱数据预处理。所得校正光谱由主成分分析确定其最佳主成分数,再通过马氏距离对其进行建模分析。

2 结果与讨论

2.1 近红外光谱指纹图谱分析

由于红外原始光谱中常存在因量测样品颗粒不匀、散射和各种噪声及物理扰动等因素,致使对不同波长点量测光谱存在不同程度的差异和影响。因此,需要通过对药材近红外原始光谱进行多元散射校正以克服光谱散射所导致的差异。7种中药材的近红外(NIR)原始光谱、多元散射校正光谱如图1所示。

由图1可以看出,不同品种中药材的近红外光谱存在一定的差异,但部分样品光谱差异较小,且重叠严重,通过肉眼不易分辨。经过MSC处理后的光谱曲线相对平滑,信噪比得到改善,光谱基线得到校正。

2.2 基于模式识别的7种中药材全息红外指纹图谱的判别分析

2.2.1基于主成分-马氏距离的判别分析模型

主成分-马氏距离判别分析方法[17-18]是通过对原始光谱变量进行转换,用降维后的新变量进行线性组合,最大限度表征原始光谱信息特征。再将表征不同样本原始光谱信息的特征新变量进行马氏距离计算[18]表示数据的协方差,根据距离度量值进行判别分析。马氏距离计算原理:设X是从均值为μ、协方差为v的母体G中抽取的样本,记:

D2(X,μ)=(X -μ)′v-1(X -μ)

若定义X与母体G的距离D2(X,G)为X与均值μ的距离D2(X,μ),则D2(X,μ)即为马氏距离。

马氏距离具有3个性质:平移不变性、旋转不变性和仿射不变性,在多目标识别和多传感器融合理论中有较多的应用。

对7种不同中药材和炮制品的70个样品近红外光谱的多元散射校正指纹信息建立主成分-马氏距离判别分析模型,其中每种药材的7个样品光谱作为训练集,3个样品光谱作为预测集。通过主成分分析(PCA)对光谱特征进行提取,前9个主成分的变量贡献率达到96.6%,故利用主成分为9的累计方差足以解释总方差,从而实现样品近红外多元散射校正指纹信息数据的降维,再基于马氏距离方法计算每两个样本之间的相似度,以距离度量值对7种不同中药材和炮制品进行类别划分。表2为7种中药材间训练集和预测集样品的相互马氏距离的平均值及预测分类归属结果。

表27种中药材间相互平均马氏距离及预测分类归属

Tab.2MeanMahalanobisdistancebetweensevenkindsofchineseherbsanditsclassificationpredictionresult

实际分类ABCDEFG预测分类归属预测识别率/%A152138573677560511479131059881A100B13877077118569894698426456934B100C36751188109034338227108606721C100D563098903415074668091745144D100E11496698682056690047258151739E100F131202648108319174581204255753F100G989769316699515417385752082G100

从表2可以看出,7种中药材的马氏距离平均值明显不同,表明7种中药材的近红外漫反射光谱具有较为明显的差异,通过计算相互间的马氏距离,能够对不同种类的中药材进行明确的区分,且对7种中药材的预测分类归属均与实际分类相符,其预测分类正确识别率均达到100%。

为了直观分析其预测分类归属的识别结果,可任选取到两种药材的距离为度量。表3和表4列出了以到A类样品菖蒲的距离和到B类样品赤芍的距离为度量时,7种中药材各10个样品对菖蒲和赤芍的马氏距离。

表37种中药材各10个样品对菖蒲(A)的马氏距离

Tab.3MahalanobisdistancebetweentensamplesfromsevenkindsofChineseherbsandAcorusgramineussamples

ABCDEFG11701384936515617114911312799322158138963637564211520131349905318713879364856301148713118991041491386536835611114831311799065128138793748562111494131239880612313883374355861150613119986371711387837025632114901312398858118138893656567011497131099909912213870365056241148513117988810193138813630566111511131159892

表47种中药材各10个样品对赤芍(B)的马氏距离

Tab.4MahalanobisdistancebetweentensamplesfromsevenkindsofChineseherbsandRadixpaeoniaerubrasamples

ABCDEFG1138071031188598626983263769592138741751193698376961262669273138370811189398806963268369184138480811183998976969264069365139510541180899327036263369296139420671178699266993262369227138710771183899076986267369548138550401193198796974266469489138170421195398826957266568951013765047119419898704126406926

从表3 和表4可见,每种药材的各10个样品间的距离基本一致,说明各类样本自身特征性质的稳定性很好。且每种药材间的距离有明显的差别,可进行各类样本间相似度的评价。

表3中以各药材到菖蒲的距离为度量时,B类样品赤芍与A类样品菖蒲的距离最远,表明化学成分等差异最大,其余按距离由大到小依次为:F类样品开口箭,E类样品生甘草,G类样品炙甘草,D类样品丹参,C类样品川穹。

表4中以各药材到赤芍的距离为度量时,A类样品菖蒲最远,其余按距离由大到小依次为:C类样品川穹,D类样品丹参,G类样品炙甘草,E类样品生甘草和F类样品开口箭。

为了直观判别分析各种药材间的分类情况和相似度,将表3和表4的马氏距离值投影在二维平面坐标上,即7种中药材分别到菖蒲的距离和赤芍的距离的二维空间中的距离度量值的判别分析图如图2所示。

图2 7种中药材马氏距离判别分析图

从图2可以看出,基于多元散射校正预处理技术,结合主成分-马氏距离判别分析方法对7种中药材和炮制品进行判别时均能正确分类归属,无类别混淆的情况发生。说明模型具有较高的可靠性。同时,在以A样品菖蒲与B样品赤芍建立的二维空间内,B样品赤芍与A样品菖蒲的距离最远,表明这两种药材的化学成分等差异最大。B类样品赤芍和F类样品开口箭距离较小,说明这两种药材的化学成分和药性差异较小。C类样品川芎和D类丹参距离也相近,说明这两种药材的化学成分差异较小,故两种药材均用于活血行瘀止痛,具有较为相同或相似的化学成分和性质。E类样品生甘草和G类炮制品炙甘草距离非常相近,说明该炮制品炙甘草与生甘草之间化学成分差异较小、性质变化不大。

3 结论

采用多元散射校正预处理的主成分-马氏距离判别分析模式识别法,结合近红外光谱漫反射技术对外观相近、容易混淆的不同中药材和炮制品进行鉴别,建立了一种适用于中药材和炮制品分类的快速识别和谱性相似度评价的模型方法,分类归属正确识别率均为100%。该方法具有快速、准确、无损、绿色的优点,为中药材的用药安全和相近药材的真伪判别提供了一种有实际应用价值的检测手段。

参考文献:

[1]李彩君,林巧玲,谢培山,等.高良姜中黄酮类成分薄层色谱指纹图谱鉴别[J].中药新药与临床药理,2001,12(3):183-187.

[2]曾金祥,魏娟,毕莹,等.吴茱萸指纹图谱及化学模式识别研究[J].中国实验方剂学杂志,2013,19(24):143-147.

[3]孙涛,滕少娜,孔德英,等.DNA 条形码技术应用于人参鉴定[J].中国生物工程杂志,2013,33(4):143-148.

[4]姚杰,魏永巨,孙体健.三维荧光指纹图谱用于鉴别真伪厚朴的研究[J].中国药物与临床,2013,13(12):1521-1522.

[5]刘红秀,骆德汉,李卫东,等.基于电子鼻的中药材鉴别新方法研究[J].辽宁中医药大学学报,2011,13(10):32-35.

[6]FU H Y,HUAN S Y,XU L,et al.Moving window partial least-squares discriminant analysis for identification of different kinds of bezoar samples by near infrared spectroscopy and comparison of different pattern recognition method[J].Journal of Near Infrared Spectroscopy,2007,15(5):291-297.

[7]LEE M J,SEO D Y,LEE H E,et al.In line NIR quantification of film thickness on pharmaceutical pellets during a fluid bed coating process[J].International Journal of Pharma and Bio Sciences,2011,403(1-2):66-72.

[8]LI B X,WEI Y H,DUAN H G,et al.Discrimination of the geographical origin ofCodonopsispilosulausing near infrared diffuse reflection spectroscopy coupled with random forests and k-nearest neighbor methods[J].Vibrational Spectroscopy,2012,62:17-22.

[9]XIN N,GU X F,WU H,et al.Discrimination of raw and processedDipsacusasperoidesby near infrared spectroscopy combined with least squares-support vector machine and random forests[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2012,89:18-24.

[10]STORDRANGE L,LIBNAU F L,MALTHE-SORENSSEN D,et al.Feasibility study of NIR for surveillance of a pharmaceutical process,including a study of different preprocessing techniques[J].Journal of Chemometrics,2002,16(8-10):529-541.

[11]CHEN Q S,ZHAO J W,LIN H.Study on discrimination of roast green tea (CamelliasinensisL.) according to geographical origin by FT-NIR spectroscopy and supervised pattern recognition[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2009,72(4):845-850.

[12]FU H Y,HUANG D C,YANG T M,et al.Rapid recognition of Chinese herbal pieces ofArecacatechuby different concocted processes using Fourier transform mid-infrared and near-infrared spectroscopy combined with partial least-squares discriminant analysis[J].Chinese Chemical Letters,2013,24(7):639-642.

[13]刘沐华,张学工,周群,等.模式识别和红外光谱法相结合鉴别中药材产地[J].光谱学与光谱分析,2005,25(6):878-881.

[14]许长华,周群,孙素琴,等.二维相关红外光谱法与阿胶的真伪鉴别[J].分析化学,2005,33(2):221-224.

[15]LI Y M,SUN S Q,ZHOU Q,et al.Study of traditional Chinese animal drugs using FT-IR and 2D-IR correlation spectroscopy[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2006,63(3):565-573.

[16]WANG C Y,XIANG B R,ZHANG W.Application of two-dimensional near-infrared (2D-NIR) correlation spectroscopy to the discrimination of three species ofDendrobium[J].Journal of Chemometrics,2009,23(9):463-470.

[17]KIM H,KIM D,BANG S Y.Extensions of LDA by PCA mixture model and class-wise features[J].Pattern Recognition,2003,36(5):1095-1105.

[18]李玉榕,项国波.一种基于马氏距离的线性判别分析分类算法[J].计算机仿真,2006,23(8):86-88.

猜你喜欢
马氏菖蒲赤芍
基于网络药理学和分子对接技术研究黄芪-赤芍治疗COPD的作用机制
一类时间变换的强马氏过程
有环的可逆马氏链的统计确认
端午节令,明辨菖蒲
用菖蒲水洗头(环球360)
关于树指标非齐次马氏链的广义熵遍历定理
大黄、赤芍对肝衰竭大鼠血清NO合成和分泌影响研究
室雅菖蒲清
一致可数可加马氏链不变测度的存在性
养菖蒲