张 敏 杨 进 付海燕 邹 坤 杨天鸣
(1.天然产物开发与利用湖北省重点实验室(三峡大学),湖北 宜昌 443002;2.中南民族大学 药学院,武汉430074)
川续断属植物Dipsacus来源于川续断科Dipsae[1],处于续断科第l类群——密聚花类群(Floresaggregati)5个属第2属的位置上.本属全世界约30种,主要分布在亚洲、欧洲及热带非洲.中国续断属共有18种,2变种,其中引种栽培2种[2].川续断DipsacusasperoidesC.Y.Cheng et T.M.Ai是传统中药,具有补肝肾,强筋骨,续折伤,止崩漏的功效,临床上主要用于腰膝酸软,风湿麻痹,跌扑损伤等[3].由于川续断的干燥根和续断属其他种植物的干燥根在外观上相近,所以市场上常有其他品种的续断充当川续断的现象,但即使是同属植物种间也存在着药理作用、药效和生物活性的差异.因此,亟需建立一种简单、可行的用于鉴别川续断和其他川续断属植物的方法,以保证市场上川续断的安全用药.我们已经成功利用近红外漫反射光谱法对不同产地的川续断通过建立PLSDA模型的方法进行了鉴别[4-5],因此继续利用PLSDA模型对部分川续断属的植物进行了鉴别研究,旨在寻找一种快速、有效鉴别川续断和川续断属其他植物的方法,为川续断的市场安全提供新思路和技术参考.
2009年7~8月份在湖北、北京、云南等地收集川续断属野生栽培品种6种,经艾铁民教授鉴定,分别为川续断,深紫续断,日本续断,大理续断,恩施续断,涪陵续断,具体见表1.
表1 样品信息表
AntarisⅡ傅立叶变换近红外光谱仪(美国Thermo Nicolet公司),配有积分球漫反射采样系统、InGaAs检测器和石英样品杯,Result软件用于光谱的采集.所有算法的编写和数据处理均在Matlab环境中.DFF-100手提式高速中药粉碎机(温岭市林大机械有限公司),200目标准检验筛(筛孔200目,孔径0.074,浙江上虞市五四纱筛厂),DZF-6021真空干燥箱(上海一恒科技仪器有限公司),DHS20-1多功能红外水分仪(上海天平仪器厂).
测定方式:积分球漫反射;扫描次数:50次;扫描范围:10 000~4 000cm-1,全部样品经去泥沙、清洗干净,在60℃下真空干燥24h,用中药粉碎机粉碎后过200目筛,取约1g置测量杯中,以金箔为参比,按实验条件进行扫描,每个样品重复50次,求平均光谱.共收集了550个不同种续断属植物样品,其中200个川续断样品,每个样品的平均光谱被标记为(001~200);50个深紫续断样品,每个样品的平均光谱标记为(201~250);100个日本续断样品,每个样品的平均光谱标记为(251~350);100个大理续断样品,每个样品的平均光谱标记为(351~450);50个恩施续断样品,每个样品的平均光谱标记为(451~500);50个涪陵续断样品,每个样品的平均光谱标记为(500~550).所有平均光谱均以每个样品采集顺序进行标记.
考察了NIR原谱及原谱的一、二阶导数光谱和多元散射校正(MSC)光谱,发现原谱的鉴别效果最差,二阶导数光谱和多元散射校正(MSC)图谱效果最佳.
图1 川续断及川续断属其它5种植物多元散射校正(MSC)图谱、二阶导数(SD)图谱
在建立PLSDA训练模型之前,将数据进行均值中心化.将川续断属6类植物通过随机划分各种类的训练集和预测集,其样品数分别如下:川续断训练和预测样品数分别为:130(1~130);70(1~70);深紫续断训练和预测样品数分别为:29(131~159);21(71~91);日本续断训练和预测样品数分别为:56(160~215);44(92~135);大理续断训练和预测样品数分别为:62(216~277);38(136~173);恩施续断训练和预测样品数分别为:27(278~304);23(174~196);涪陵续断训练和预测样品数分别为:36(305~340);14(197~210).
PLSDA模型用第j个元素为1,其余元素均为0的矢量fj编码样品类别,第j类样品用fj编码.对于550个6种续断属植物样品,采用PLSDA模型可将6种类分别编码为f1(1,0,0,0,0,0);f2(0,1,0,0,0,0);f3(0,0,1,0,0,0);f4(0,0,0,1,0,0);f5(0,0,0,0,1,0);f6(0,0,0,0,0,1).对原始光谱数据以及经过MSC和SD预处理过的光谱数据分别进行PLSDA建模,每个PLSDA模型取隐变量为6时能获得最小的模型学习和预测错判数.
图2分别显示了选择隐变量为6时,PLSDA模型基于原始光谱数据的川续断及川续断属其它5种植物样品训练结果和预测结果.如图所示,从建模所获的类别矢量值f1和f4可见,虽然川续断和大理续断同种不同产地样品的差距比较大,但是PLSDA模型对6种种间样品间几乎都能加以正确地训练和预测,PLSDA模型在学习时仅仅将本属于第一类川续断植物的第5号训练样本被错归为第三类日本续断;在预测时对预测样本属于第一类川续断植物的第13号预测样错误归为第三类日本续断植物.模型对于6种样品的训练和预测正确率分别达到99.71%和99.52%,结果较为满意.
图2 川续断及川续断属其它5种植物样品PLSDA模型原始光谱虚拟编码归属样品类别图
图3分别为选择隐变量为6时,PLSDA模型基于经过MSC光谱处理的川续断及川续断属其它5种植物样品训练结果和预测结果.
图3 川续断及川续断属其它5种植物样品PLSDA模型MSC光谱虚拟编码归属样品类别图
如图所示,从建模所获的类别矢量f1,f3和f4可见经过MSC处理后建立的PLSDA模型,虽然同种不同产地的样品仍有一定的区别,但是不同种的样品的预测正确率可以达到100%.
当选择隐变量为6时,PLSDA模型基于经过二阶导数光谱处理的川续断及川续断属其它5种植物样品训练结果和预测结果显示在图4.如图所示,经过SD处理后建立的PLSDA模型,同种不同产地的样品差距甚小,种间差距明显,种间样品预测成功率也达到了100%.
图4 川续断及川续断属其它5种植物样品PLSDA模型二阶导数光谱虚拟编码归属样品类别图
对于PLSDA模型在取隐变量为6时对原始光谱以及不同的光谱预处理方法所得模型的训练和预测的鉴别结果列于表2.
表2 PLSDA在不同光谱预处理条件下的训练和预测结果
(1)本实验建立了一种基于近红外漫反射技术的川续断和部分属内植物样品的快速鉴别方法.从图1可以看出,同属药材的NIR原图谱及一、二阶导数光谱极为相似,各样品的特征信息很难从峰位、峰强、峰形方面直观鉴别.但是这些细微的差异在经过数学处理,建立PLSDA模型(图2、图3和图4),准确地区分了6种属内植物.
(2)原图谱建立的PLSDA模型在对4种不同产地的川续断样品进行预测时有一个样品被错归类到第3类,但是经过MSC和SD处理后建立的PLSDA模型不论是对种间还是种内不同产地的样品都能100%预测.因此NIR图谱必须经过一些数学处理提取特征信息后,才能使NIRS技术应用于分类鉴别成为可能.
(3)近红外漫反射光谱技术可直接用于固体样品的测定,无需破坏样品及制样,操作简便、快速.通过川续断属内其他濒危种植物的补充,可进一步验证模型的代表性和专属性.
[1]肖培根,李大鹏,杨世林.新编中药志[M].北京:化学工业出版社,2002:932.
[2]艾铁民.中药续断原植物及续断属修订研究[J].中国医药学报,1992,7(2):22-24.
[3]王一涛,王家葵,杨 奎,等.续断的药理学研究[J].中药药理与临床,1996,12(3):20-23.
[4]张 敏,杨 进,付海燕,等.近红外光谱结合PLSDA鉴别不同产地的川续断[J].三峡大学学报:自然科学版,2011,33(4):81-84.
[5]宋发军,杨 芳,许德红,等.野木瓜藤茎部位总皂苷闪式提取工艺[J].中南民族大学学报:自然科学版,2010,29(3):29-32.