近红外光谱结合PLSDA鉴别不同产地的川续断

2011-10-22 07:23付海燕杨天鸣
三峡大学学报(自然科学版) 2011年4期
关键词:产地类别图谱

张 敏 杨 进 付海燕 邹 坤 杨天鸣

(1.天然产物开发与利用湖北省重点实验室(三峡大学),湖北 宜昌 4430022.中南民族大学药学院,武汉 430074)

川续断Dipsacus Asperoides C.Y.Cheng et T.M.Ai来源于川续断科Dipsae[1],又名川断.广泛分布于四川、湖北等地.川续断是传统中药,具有补肝肾,强筋骨,续折伤,止崩漏的功效,临床上主要用于腰膝酸软,风湿麻痹,跌扑损伤等[2].为了有效控制续断中药材的质量,本实验采用近红外漫反射光谱的方法对不同产地的川续断进行了鉴别.

1 仪器和材料

1.1 材料

2009年7~8月份在湖北长阳、千佛山、云南丽江等地收集川续断药材4种,经艾铁民教授鉴定为川续断Dipsacus Asperoides C.Y.Cheng et T.M.Ai,具体见表1.

1.2 仪器及设备

AntarisⅡ傅立叶变换近红外光谱仪(美国Thermo Nicolet公司),配有积分球漫反射采样系统、InGaAs检测器和石英样品杯,Result软件用于光谱的采集.所有算法的编写和数据处理均在Matlab环境.

DFF-100手提式高速中药粉碎机(温岭市林大机械有限公司),200目标准检验筛(筛孔200目,孔径0.074,浙江上虞市五四纱筛厂),DZF-6021真空干燥箱(上海一恒科技仪器有限公司),DHS20-1多功能红外水分仪(上海天平仪器厂).

表1 样品信息表

2 实验条件与方法

测定方式:积分球漫反射;扫描次数:50次;扫描范围:10000~4000cm-1,全部样品经去泥沙、清洗干净,在60℃下真空干燥24 h,用中药粉碎机粉碎后过200目筛,取约1g置测量杯中,以金箔为参比,按实验条件进行扫描,每个样品重复50次,求平均光谱.共收集了200个样品.所有平均光谱均以每个样品采集顺序进行标记.

3 结 果

3.1 川续断药材的NIR图谱

川续断药材的 NIR原图谱、多元散射校正(MSC)图谱、二阶导数(SD)图谱如图1所示.

图1 川续断药物的NIR原图谱、多元散射校正(MSC)图谱、二阶导数(SD)图谱

从原始谱图可以看出,4种不同产地的原始近红外光谱有相似的吸收模式,各样品的特征信息很难从峰位、峰强、峰形方面直观鉴别,其主要差别在于相对强度不同.这是由于样品因产地的不同,主要化合物的种类及含量会有差异.但是,由于光谱的相似性和相关性,必须依靠化学模式识别方法从光谱数据中提取相关化学信息,才能实现其鉴别.另外原始图谱中还存在一定的基线漂移和倾斜,这可能测量样品时因样品及样品颗粒不均、散射和各种噪声及物理扰动等使光谱之间产生差异,且可能在不同波长点处存在对光谱不同程度的影响.因此,在建立模式识别分类模型前,对川续断样品原始光谱进行了MSC以克服测量光的波长及样品颗粒的大小和折射率等物理性质使光谱散射所导致的差异,通过SD光谱消除基线漂移的影响和基线倾斜所造成的误差,从图1(c)中可见光谱分辨峰能得到改善.

3.2 偏最小二乘判别分析(PLSDA)模型的建立

在建立PLSDA训练模型之前,将数据进行均值中心化.将4种不同产地的川续断药物通过随机划分为训练集和预测集,具体数量见表1.

PLSDA模型用第j个元素为1,其余元素均为0的矢量fj编码样品类别,第 j类样品用fj编码.训练集样本的类别矢量构成类别矩阵.其中,每一行为一个样品的类别矢量,并用每一列对光谱矩阵进行PLSA回归,由所得到的回归矩阵与未知样品的光谱矩阵即可计算获得预测样品类别矩阵,然后根据估计的类别矩阵中的最大元素出现在类别矢量的位置判定未知样品的类别.因此对于200个4种川续断样品,采用PLSDA模型可将4种分别编码为f1(1,0,0,0);f2(0,1,0,0);f3(0,0,1,0);f4(0,0,0,1),对于每个样品的产地,PLSDA使用以上虚拟码关联整个光谱变量,可获得与被测组分或性质相关的特征数据矩阵.对原始光谱数据以及经过MSC和SD预处理过的光谱数据分别进行PLSDA建模,每个PLSDA模型取隐变量为6时能获得最小的模型学习和预测错判数.

图2分别显示了选择隐变量为6时,PLSDA模型基于原始光谱数据的4种川续断样品训练结果和预测结果.模型对样品的训练和预测正确率达到100%,结果较为满意.

图3分别为选择隐变量为6时,PLSDA模型基于经过MSC光谱处理的4类川续断样品训练结果和预测结果.从训练集样本和预测集样本的各自虚拟编码值,可以看到,对于每类的来自不同产地的续断植物样品其特征区分与对原始光谱数据建模的结果类似,但是对于相同产地的川续断样品间的训练和预测结果均得以改善,训练和预测结果均完全正确.

图3 4种川续断样品PLSDA模型MSC光谱虚拟编码归属样品类别图

当选择隐变量为6时,PLSDA模型基于经过二阶导数光谱处理的4类川续断样品训练结果和预测结果显示在图4.训练和预测结果训练和预测结果正确率都达到100%.

对于PLSDA模型在取隐变量为6时对原始光谱以及不同的光谱预处理方法所得模型的训练和预测的鉴别结果列于表2.

表2 PLSDA在不同光谱预处理条件下的训练和预测结果

综上结果证明经过多元散射校正(MSC)和二阶导数(SD)处理的近红外光谱的PLSDA模型能够完全准确判别以上不同产地的川续断,结果令人满意.为川续断的安全用药和规范中药材市场提供了一种有效的检测手段.

4 讨 论

本实验运用近红外漫反射技术获取了4种川续断样品在4000~10000 cm-1之间的近红外光谱信息,通过采用偏最小二乘判别分析方法,建立了不同产地川续断的鉴别模型.结果表明,利用MSC和SD处理近红外图谱后,PLSDA建立的模型预测准确率达到100%,实现了运用近红外光谱技术和化学模式识别方法相结合快速、准确地鉴别不同产地的川续断,为对川续断的用药安全,提供了一种新的有价值的检测手段.

[1]肖培根,李大鹏,杨世林.新编中药志[M].北京:化学工业出版社,2002:932.

[2]王一涛,王家葵,杨 奎,等.续断的药理学研究[J].中药药理与临床,1996,12(3):20-23.

猜你喜欢
产地类别图谱
绘一张成长图谱
警惕“洗产地”暗礁
食物离产地越远越好
测定不同产地宽筋藤中5种重金属
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
加强产地检疫实现以检促防
服务类别
论类别股东会
中医类别全科医师培养模式的探讨