安淑静,王婷,牛豆,韩彬凯,毕淮龙,康杰芳
(陕西师范大学 教育部药用资源与天然药物化学重点实验室,西北濒危药材资源开发国家工程实验室,陕西 西安 710119)
山茱萸(CornusofficinalisSieb.et Zucc.)是山茱萸科(Cornaceae)山茱萸属(Cornus.Linn)多年生落叶小乔木或灌木,其干燥成熟果肉,始载于《神农本草经》[1],具有补益肝肾和内热消渴等疗效,是中医临床常用于治疗消渴症(糖尿病)的传统良药[2-3]。山茱萸的药用和食用价值已有1 500多年的历史,现代研究表明山茱萸具有抗氧化、抑制肿瘤、神经保护、抗炎和肝脏保护等作用,发挥作用的主要活性成分有獐牙菜苷、马钱苷、山茱萸新苷、原儿茶苷、莫诺苷、没食子酸和5-HMF等[4-7]。植物的次生代谢产物的品质与产地的地理因子是长期相互作用的结果,是一种连续的、动态的综合作用[8-9]。孙玲等[10]发现19批不同产地山茱萸中5种环烯醚萜苷类成分含量受地域影响,在山茱萸的质量评价时应当考虑产地因素。焦媛等[11]通过ICP-MS方法对5个产地山茱萸中无机元素的含量发现,河南西峡的Sr元素含量最高。采用HPLC方法测定不同产地山茱萸果核中莫诺苷、没食子酸、5-HMF和原儿茶酸,陕西宝鸡和汉中的化学成分含量较高[12]。山茱萸的三大主产区为浙江淳安、陕西佛坪和河南西峡,在四川、安徽、山西和甘肃等地也有分布[13],道地性药材的品质是中药现代化的基石。所以,对山茱萸进行产地溯源具有一定的必要性。传统中药材的鉴别主要依靠“辨状论质”“看货评级、分档议价”,这种传统的方法经验性强、活性成分与性状特征相关性研究困难[14-15]。因此,建立一种省时、科学的产地鉴别和质量评价体系意义重大。
中红外(mid-infrared reflectance,MIR)光谱反映的是分子中的原子的伸缩和变形振动运动,波数范围在4 000~400 cm-1之间[16]。中红外光谱结合化学计量学作为一种新兴技术手段,每一种化合物都有特定的吸收光谱,广泛应用于产地溯源、品质检测和真假鉴别等[17-19]。近年来,中红外结合化学计量学广泛应用于中药材产地鉴别与质量评价,为中药现代化提供新思路[20-22]。本研究采用MIR光谱结合LR、BP-ANN和SVM对29批山茱萸建立产地鉴别和药材活性成分含量测定模型,为山茱萸药材产地鉴别和有效成分含量的快速测定提供科学、便捷、准确的方法。
Nicolet IS50 傅立叶交换红外光谱仪(美国Thermo Fisher Scientific);LG-04C微型植物粉碎机(瑞安市百信药机器械厂);ISO9001电子天平(北京赛多利斯科学仪器有限公司);HY-12压片机(北京凯迪莱特仪器设备有限公司);U-3000高效液相色谱仪(美国Thermo Fisher Scientific);HY-12 压片机(北京凯迪莱特仪器设备有限公司)。
KBr光谱纯 (北京市津同乐泰化工产品有限公司);乙腈、甲醇、甲酸为色谱纯(天津益仁达化工有限公司);没食子酸对照品、5-HMF对照品、原儿茶酸对照品、莫诺苷对照品、獐牙菜苷对照品、马钱苷对照品、山茱萸新苷对照品(上海源叶生物科技有限公司)。
2018年10月—2018年12月采自7个省份(四川、甘肃、陕西、山西、河南、安徽、浙江)的29批次山茱萸药材,经陕西师范大学植物学教研室鉴定为山茱萸科植物山茱萸(CornusofficinalisSieb.et Zucc.),样本采集信息见表1。
表1 29批次山茱萸样品采集地点信息
1.4.1 样品处理
将不同产地的29批山茱萸样品在40 ℃下烘干至恒重,经微型植物粉碎机粉碎后过200目筛,备用。
1.4.2 中红外光谱采集
将KBr在烘干器中102 ℃干燥24 h后备用。实验时称取2 mg山茱萸样品粉末,按大约1∶60的质量比与干燥后的KBr晶体均匀混合于玛瑙研钵中,研磨充分后用压片机压制成薄片,立即置于Nicolet IS 50傅立叶交换红外光谱仪中进行测定。
仪器条件:扫描范围为4 000~400 cm-1,光谱分辨率为4 cm-1,扫描次数为64次,采集背景和样品光谱前排除水和二氧化碳的干扰。依次将制备好的样品薄片放于光谱仪中进行测定,采集数据。
1.4.3 方法学考察
精密度试验:取1号山茱萸样品,按照上述所示采集方法制成薄片进行光谱采集,将同一个薄片采集5次,采用SPSS软件计算其RSD值。
重现性试验:取1号山茱萸样品,按照上述所示采集方法制成薄片进行光谱采集,将同一个薄片采集5次,采用SPSS软件计算其RSD值。
稳定性试验:将1号山茱萸样品置于干燥器中保存,每隔0.5 h按上述所示采集方法制备并测定1次,共测定5次,得到2.5 h内同一山茱萸样品的多个红外光谱图,采用SPSS软件计算其 RSD值。
1.4.4 模型建立
采用Essential FTIR软件读取光谱数据,并将光谱数据转换为XLS格式,采用MATLAB 2014a软件对光谱数据进行归一化处理,归一化方法为:在-1到1之间归一,[y,PS]=map minmax(X,ymin,ymax)将X归一化到ymin到ymax范围,公式为:
其中,X是原始数据,y是归一化后的数据,xmax为X的最大值,xmin为X的最小值。
筛选出29批山茱萸中红外光谱的特征数据,分别采用LR、BP-ANN和SVM建立基于NIR光谱的山茱萸药材产地的鉴别模型。为了比较不同的分类模型的效果,首先按照3∶1的比例将光谱数据分成训练集和测试集,本研究将陕西和河南样品分别记为“1”类和“2”类对训练集和测试集的分类正确率分别用识别率表示。
筛选出29批山茱萸红外光谱的特征数据,设置训练集与验证集,利用LR、BP-ANN和SVM三种数学建模方法,建立基于MIR光谱的山茱萸中7种成分含量预测模型,计算各模型的相关系数(R2)、均方误差(MSE)和平均绝对误差(MAD)作为模型性能的指标。其中,R2表示可根据自变量的变异来解释因变量的变异部分,该值的绝对值越接近1,表示模型拟合度越高;MSE表示预测值与实际值之间的差异程度,该值越大,误差越大;MAD表示所有单个预测值与算数平均值的偏差的绝对值的平均,该值越大,误差越大。
由于实验仪器环境、操作等原因,原始光谱开始有噪声,最终保留4 000~500 cm-1之间的光谱数据。29批山茱萸样品光谱数据,见图1。
图1 29批次山茱萸药材中红外光谱
精密度试验:经计算,采集得到的5个光谱的最大共有峰波数的RSD值小于0.2%(置信区间95%),说明仪器精密度良好,所得数据真实可靠。
重现性试验:经计算,采集得到的5个光谱的最大共有峰波数的RSD值小于3%,说明实验重现性良好。
稳定性试验:经计算,在2.5 h内同一山茱萸样品的5个红外光谱图的最大共有峰波数的RSD值小于0.3%,说明处理后的山茱萸样品在2.5 h内基本稳定,实验所得结果可靠。
陕西省和河南省两个主产区的产地鉴别模型结果,见表2。结果表明,采用SVM结合MIR光谱建立的产地鉴别模型对产地的识别率最高,识别率为86.21%。
表2 基于MIR光谱的山茱萸药材产地鉴别模型
为了进一步验证各模型的预测效果,将29批次山茱萸MIR光谱数据导入采用LR、BP-ANN和SVM拟合的预测模型中,对陕西和河南的山茱萸药材进行产地预测,将得出的分类正确率均以识别率表示,见表3。结果表明,采用SVM结合MIR光谱建立的产地鉴别模型对陕西、河南两地山茱萸药材的识别率最高,分别为92.31%和87.50%。
表3 基于MIR光谱的山茱萸药材产地鉴别模型验证结果
筛选出29批山茱萸红外光谱的特征数据,利用LR、BP-ANN和SVM三种数学建模方法,建立基于中红外光谱的山茱萸药材中7种成分含量预测模型,计算各模型的决定系数(R2)、均方误差(MSE)和平均绝对误差(MAD)作为模型性能的指标。在表4所示模型评价结果中,除原儿茶酸外,山茱萸药材中其他6种成分用SVM法建立模型的R2均大于用LR和BP-ANN建立模型的R2,且用SVM法建立模型的MSE和MAD均大于用LR和BP-ANN建立模型的MSE和MAD,表明用SVM建立的模型所预测的山茱萸药材中6种成分的含量最接近其实际含量。
参照本课题组前期建立的山茱萸液相指纹图谱方法测定山茱萸药材中7种活性成分的含量[23],得到山茱萸中7种对照品HPLC峰值图,如图2。按照各标准品的线性关系及样品图谱中各成分相对保留时间的峰面积,求得29批山茱萸样品中7种活性成分的实际含量。为了进一步验证各模型的预测效果,将29批次山茱萸MIR光谱数据导入采用LR、BP-ANN和SVM拟合的预测模型中,对山茱萸中的7种化学成分进行含量预测,将预测含量与采用HPLC法测得的实际含量进行比较。HPLC通过表5和图3~9的结果发现,除原儿茶酸外,山茱萸药材中其他6种成分用SVM法建立模型的R2均大于用LR和BP-ANN建立模型的R2,说明SVM建立的模型拟合度更高,采用SVM法建立的基于MIR光谱的山茱萸药材含量预测模型更适合山茱萸药材中多种成分含量的同时测定。
表4 基于MIR光谱的山茱萸药材中7种成分含量预测模型
注:1.没食子酸,2.5-羟甲基糠醛,3.原儿茶酸,4.莫诺苷,5.獐牙菜苷,6.马钱苷,7.山茱萸新苷。图2 山茱萸中7种有效成分对照品HPLC图谱
表5 29批次山茱萸中7种成分实际值与基于MIR光谱预测值比较结果(n=29)
山茱萸为世界三大名贵木本药材之一[24],是我国40种用量较大的重点药材品种之一,是国家新增9种按照传统既是食品又是中药材物质之一(国卫食品函〔2019〕311号)。山茱萸在医药和保健品等方面应用的需求量巨大,在国内中药材市场上占据着举足轻重的地位。山茱萸种植范围广泛、种植基地环境差异大、采收加工工艺不统一,导致市场上山茱萸的质量参差不齐。本实验采用MIR结合SVM建立的产地鉴别模型识别率高,可用于山茱萸产地来源鉴别,进而控制山茱萸药材质量。山茱萸药材传统的定量方法通常采用高效液相色谱法(HPLC),在常用的含量测定方法中,HPLC法分析一个山茱萸药材样品需要 85 min,且对山茱萸药材提取液前处理过程复杂、耗时长、提取过程有损耗。而建立中红外光谱模型后,扫描一个样本约30 s,极大地缩短了分析时间,采用中红外光谱结合化学计量学方法对样品的预处理简单、破坏性小、省时,快捷。用MIR结合SVM建立含量预测模型能够快速对山茱萸药材中的活性成分进行批量检测,提高了检测效率和精确度。
本实验建立了一种简便、快速、准确的产地鉴别和质量评价的模型,并对该模型进行验证,结果表明该模型识别率和拟合度高,适用于山茱萸药材的产地鉴别和质量评价。