邱丽媛,梁泽华,吴鑫雨,潘颖洁,方剑文
·药剂与工艺·
基于模式识别和遗传神经网络算法的醋香附近红外光谱等级评价和含量预测模型研究
邱丽媛,梁泽华#*,吴鑫雨,潘颖洁,方剑文
浙江中医药大学药学院,浙江 杭州 311400
基于近红外光谱(near infrared spectrum,NIRS)技术建立一种能快速准确识别醋香附饮片等级并预测其挥发油中α-香附酮、香附烯酮含量的质量评价模型,为其他中药材或中药饮片的质量评价提供参考。采集醋香附的NIRS信息,并建立39批醋香附挥发油气相色谱-质谱联用(GC-MS)指纹图谱,对挥发油中的α-香附酮、香附烯酮进行定量,采用相似度分析、多元统计分析、主成分分析(principal component analysis,PCA)、聚类分析、偏最小二乘-判别分析(partial least squares-discriminant analysis,PLS-DA)、Logistic回归分析等方法处理数据,划分等级;利用遗传神经网络算法(GA-BPNN)将等级划分结果、α-香附酮含量、香附烯酮含量分别与NIRS信息进行拟合,建立等级预测模型和含量预测模型。根据主成分聚类分析法可以将醋香附划分为3个等级,其中一等品6批,二等品8批,三等品25批,PLS-DA分析结果与主成分聚类分析结果一致。采用多元Logistic回归分析建立了饮片等级分类经验公式一等=exp(1)/[1+exp(1)]、二等=exp(2)/[1+exp(2)]、三等=1-二等,等级预测结果和主成分聚类分析结果一致。利用GA-BPNN建立的醋香附饮片等级预测模型预测准确率达89.74%,模型准确性较好;α-香附酮、香附烯酮回归模型预测集决定系数分别为0.992 3、 0.969 7,能很好地预测醋香附挥发油中α-香附酮、香附烯酮含量。采用GA-BPNN所建立的基于近红外技术的醋香附饮片等级评价模型能快速准确地预测醋香附饮片等级,为醋香附及其他中药材或中药饮片质量标准的制定和等级评价模型的研究提供了参考。
醋香附;挥发油;等级评价;气相色谱-质谱联用;近红外光谱;模式识别;遗传神经网络算法;α-香附酮;香附烯酮;质量评价;相似度分析;多元统计分析;主成分分析;聚类分析;偏最小二乘-判别分析;Logistic回归分析
香附为莎草科植物莎草L.的干燥根茎,又称莎草、香附子、雷公头,味辛、微苦、微甘,性平,归肝、脾、三焦经,始载于《名医别录》[1],素有“气病之总司,女科之主帅”之誉。香附一般醋炙后入药,临床上常被用于治疗肝气郁滞所引起的胸胁胀闷疼痛、疝气腹痛,还可用于治疗月经不调、经行腹痛以及经前乳房胀痛等症[2],是理气开郁要药。香附的化学成分复杂,药理活性广泛,其主要有效成分是挥发油,另外还包括黄酮类、生物碱类、糖类、三萜类与甾醇类、蒽醌类等多种化合物[3]。香附主要产于长江、黄河中下游地区,以山东泰安为道地产区。由于各地的生态环境、栽培条件、采收加工方式、炮制工艺等的不同导致市场上醋香附饮片的质量差异较大。《中国药典》2020年版规定醋香附挥发油不得少于0.8%[2],仅根据挥发油含量单一指标无法全面、准确地反映醋香附饮片的质量等级和优劣,且目前尚无统一的等级评价标准,难以划分醋香附质量等级。因此,开展醋香附饮片等级评价标准研究,对规范醋香附的标准化生产和市场流通具有重要意义。
传统性状鉴别存在模糊性、不确定性等缺点,所以香附及其炮制品的现代质量评价多以总挥发油、总黄酮含量,有效成分α-香附酮、香附烯酮、圆柚酮、马兜铃酮、5-羟甲基糠醛(5-hydroxymethyl- furfural,5-HMF)含量等作为质量评价指标[4-9]。α-香附酮和香附烯酮是香附发挥抗炎镇痛作用的主要物质基础,且在香附中含量较高。香附醋炙后α-香附酮含量明显升高,这和醋炙后镇痛活性增强存在一定联系[10-11],且香附烯酮、α-香附酮和sugeonol三者之间具有明显的协同作用[12],推测香附烯酮和α-香附酮达到一定配比时其抗炎镇痛活性可能最佳,故本研究主要选取这2个成分进行定量分析。挥发油作为香附的主要有效成分,具有抗抑郁、促进胃肠动力、抗炎镇痛、抑制血小板凝集等多种作用[13-15],有较大的制剂研发前景和价值,如香附油滴丸[16]、挥发油β-环糊精包合物[17]等。所以本实验最终选择总挥发油含量、香附烯酮含量、α-香附酮含量作为主要含量指控指标进行研究。
近红外光谱(near infrared spectrum,NIRS)技术具有快速、准确、便捷、样品前处理简单等优点,目前已被广泛应用于食品、药品、石油、烟草等领域的质量检测中[18-20]。但NIRS数据变量多、噪声大,采用传统NIRS定性定量建模方法,如马氏距离、欧氏距离、偏最小二乘(partial least square method,PLS)、主成分回归(principal component regression,PCR)、逐步多元线性回归(stepwise multiple linear regression,LMR)等,有时建模结果并不理想[21-22]。
人工神经网络(artificial netural network,ANN)是一种模仿动物神经网络行为特征进行分布式并行信息处理的算法数学模型,具有强大的抗干扰、抗噪声能力。反向传播神经网络(back propagation netural network,BPNN)是一种按照误差逆向传播算法训练的多层前馈神经网络,具有任意复杂的模式分类能力和优良的非线性映射能力,是应用最广泛的神经网络算法之一,在工艺优化、中药药效预测、生物药剂学等方面有较多应用[23],但其算法易陷入局部极小值。
遗传算法(genetic algorithm,GA)是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化概率搜索算法,GA和BPNN神经网络的有效结合可以解决BPNN算法固有缺陷,如收敛速度慢、易陷入局部极小等。本研究主要利用GA优化BPNN神经网络的初始权重和偏置,采用化学计量学、遗传-神经网络算法(GA-BPNN)等数据分析方法,建立融合NIRS信息的醋香附等级快速评价模型及α-香附酮、香附烯酮含量预测模型,为醋香附饮片质量等级评价标准的制定和等级评价模型的研究提供了新的思路。
Agilent 7890B-5977A气相色谱-质谱联用仪,美国Agilent公司;XS105DU型十万分之一电子天平,瑞士梅特勒-托利多仪器有限公司;JA1003B型千分之一电子天平,上海越平科学仪器制造有限公司;150T型多功能粉碎机,永康市铂欧五金制品有限公司;ANTARISII型傅立叶变换近红外分析仪,美国Thermo scientific公司;Vent Filter MPK01纯水系统,美国Millipore公司。
高纯氦气(≥99.999%)、色谱级甲醇,美国天地公司;无水硫酸钠,批号Z17A10Y95555,上海源叶生物科技有限公司;α-香附酮对照品,质量分数98%,批号PS010758,成都普思生物科技股份有限公司;香附烯酮对照品,批号RFS-X06911803028,质量分数96%,成都瑞芬思生物科技有限公司;水为纯水。醋香附样品购于不同饮片生产厂家,基原植物经浙江中医药大学黄真教授鉴定为莎草科莎草属植物莎草L.的干燥根茎,具体样品信息见表1。
2.1.1 GC-MS定性条件 Agilent HPM-5柱(30 m×250 μm×0.25 μm),进样口温度250 ℃,分流比为20∶1,初始温度100 ℃,保持1 min,以 5 ℃/min速率升温至132.5 ℃,以0.1 ℃/min速率升温至132.8 ℃,保持2 min,以0.1 ℃/min速率升温至133.4 ℃,保持2 min,以0.2 ℃/min速率升温至134.3 ℃,保持5 min,以0.2 ℃/min速率升温至134.7 ℃,保持1 min,以20 ℃/min速率升温至260 ℃,保持10 min,载气为高纯氦气(≥99.999%),体积流量1.0 mL/min,进样量1 μL。质谱条件为EI源,轰击电压70 eV,正离子模式,离子源温度230 ℃,四级杆温度150 ℃,采用全扫描模式获得醋香附样品总离子流色谱图,见图1。色谱图经质谱检索标准库NIST14.L匹配,结果见表2。
表1 醋香附样品采集信息
2.1.2 GC-MS定量条件 色谱条件同“2.1.1”项下内容,质谱条件为EI源,轰击电压70 eV,正离子模式,离子源温度230 ℃,四级杆温度150 ℃,采用离子检测模式(SIM)定量,选择/:91.1、133.1、147.1、175.1、218.2;91.0、147.1、161.1、175.1、218.2分别为香附烯酮、α-香附酮的检测离子。
2.2.1 混合对照品储备液的制备 精密称取香附烯酮、α-香附酮对照品100、150 mg分别置于1.5 mL棕色进样瓶中,加500 μL甲醇溶解得对照品母液,质量浓度分别为200、300 mg/mL。再分别取对照品母液100、50 μL混合于10 mL量瓶,加甲醇定容,混匀,即得混合对照品溶液,香附烯酮、α-香附酮质量浓度分别为2、1.5 mg/mL。
图1 醋香附挥发油总离子流图(峰号与表2对应)
表2 醋香附挥发油GC-MS分析
2.2.2 供试品溶液的制备 精密称取醋香附样品粗粉100.000 g,置2000 mL圆底烧瓶中,加纯水1000 mL,按《中国药典》2020年版挥发油测定法(通则2204甲法)测定。持续提取5 h至挥发油不再增加时读取提取器刻度。得到的样品挥发油用无水硫酸钠干燥,静置过夜,精密量取干燥后的挥发油10 μL于10 mL量瓶中,甲醇定容,混匀,0.22 μm微孔滤膜滤过,即得供试品溶液。
2.3.1 精密度实验 取醋香附样品(XDB241)1份,按“2.2.2”项下方法制备供试品溶液,按“2.1.1”项下GC-MS定性条件进行分析,连续进样6次。以共有峰3(该峰响应高,稳定性较好)为对照峰(S),计算各共有峰的相对保留时间与相对峰面积,RSD均小于1.98%,所得图谱导入《中药色谱指纹图谱相似度评价系统》(2012版)软件,相似度均在0.998以上,表明仪器的精密度良好。
2.3.2 重复性实验 取同一批号(XDB241)醋香附样品6份,按“2.2.2”项下方法平行制备6份供试品溶液,并按“2.1.1”项下方法进行分析,以共有峰3为对照峰,计算各共有峰的相对保留时间与相对峰面积,RSD均小于2.72%,所得图谱导入《中药色谱指纹图谱相似度评价系统》(2012版)软件,相似度均在0.999以上,表明方法的重复性良好。
2.3.3 稳定性实验 取同一批号(XDB241)醋香附样品1份,按“2.2.2”项下方法制备供试品溶液,按“2.1.1”项下GC-MS定性条件,分别在0、2、4、8、12、24 h进样分析,以共有峰3为对照峰,计算各共有峰的相对保留时间与相对峰面积,RSD均小于3.12%,所得图谱导入《中药色谱指纹图谱相似度评价系统》(2012版)软件,相似度均在0.987以上,表明供试品溶液在24 h内稳定性良好。
2.3.4 醋香附挥发油指纹图谱的建立 分别将各批次醋香附挥发油GC-MS指纹图谱导入《中药色谱指纹图谱相似度评价系统》(2012版)软件进行分析,设置S1为参照图谱,采用中位数法,时间窗宽度为0.1 s,经多点校正和色谱峰匹配,生成了醋香附挥发油对照指纹图谱(R)及各批次药材叠加指纹图谱,见图2、3。计算各批次醋香附药材指纹图谱与对照指纹图谱的相似度,结果见表3。如表2所示,经NIST14.L标准谱库的匹配和相关文献研究,选择80%以上匹配度的成分进行指认归属,从醋香附挥发油中共鉴定出21种成分,主要为倍半萜类及其氧化物。指纹图谱共确定了8个共有峰,根据GC-MS定性分析结果,分别为(3a,4,7)-1,4,9, 9-tetramethyl-5,6,7,8-tetrahydro-4-3a,7-methanoazulene(1号峰);1,1,7,7a-tetramethyl-1a,2,6,7,7a,7b- hexahydro-1-cyclopropa[a]naphthalene(2号峰);3-3a,7-methanoazulene,2,4,5,6,7,8-hexahydro-1,4,9,9-tetramethyl-,(3a,4,7)-(3号峰);1,4,6-trimethyl- 1,2,3,3a,4,7,8,8a-octahydro-4,7-ethanoazulene(4号峰);isospathuleno(5号峰);isolongifolen-5-one(6号峰);longiverbenone(7号峰);(3a,4,7)-1,4, 9,9-tetramethyl-3,4,5,6,7,8-hexahydro-2-3a,7-methanoazulen-2-one(8号峰)。
图2 39批醋香附挥发油对照指纹图谱
2.3.5 指纹图谱相似度分析 以39批醋香附生成的共有模式作为对照指纹图谱进行相似度分析,结果39批醋香附相似度在0.694~0.990,除了S12样品的相似度为0.694外,其余批次相似度均在0.8以上,表明不同批次醋香附药材整体化学组分类似,样品质量稳定性较好。S12样品相似度较低可能和其炮制工艺、贮藏时间及采收加工中的人为因素有关。仅根据常用的指纹图谱相似度分析难以判别醋香附饮片质量,需要进一步结合模式识别的方法来判断醋香附饮片质量。
2.4.1 线性关系及检测限、定量限的考察 取混合对照品储备液1000、400、300、100、40、2 μL分别置于2 mL量瓶中,甲醇定容并混匀,即得系列混合对照品溶液。按“2.1”项下色谱条件进样1 μL。基于Agilent MS定量数据分析工作站,以溶液质量浓度为横坐标(),响应值为纵坐标(),进行线性回归,得线性回归方程分别为香附烯酮=407.816 694-9 015.871 699,2=0.999 15;α-香附酮=480.924 413-7 989.664 354,2=0.999 14。结果表明香附烯酮、α-香附酮的质量浓度分别在2~1000、1.5~750 μg/mL与峰面积呈良好的线性关系。以信噪比(S/N)为3时作为检测限,S/N为10时作为定量限,香附烯酮的检测限为1 μg/mL,定量限为1.5 μg/mL;α-香附酮的检测限为0.75 μg/mL,定量限为1.5 μg/mL。
图3 39批醋香附挥发油指纹图谱叠加图
2.4.2 精密度考察 取混合对照品溶液,按“2.1”项下定量分析方法连续进样6次,计算纯挥发油中香附烯酮、α-香附酮峰面积RSD分别为2.05%、0.90%,表明仪器精密度良好。
2.4.3 重复性考察 精密称取同一批号(XDB241)样品粗粉6份,按“2.2.2”项下方法平行制备供试品溶液6份,按“2.1.2”项下方法依次测定,计算纯挥发油中香附烯酮、α-香附酮的平均质量浓度分别为519.97、140.80 mg/mL,RSD分别为1.97%、1.74%,表明该方法重复性良好。
2.4.4 稳定性考察 取同一批号(XDB241)供试品溶液,按“2.1.2”项下方法分别在制备后0、2、4、8、12、24 h进样测定,计算纯挥发油中香附烯酮、α-香附酮峰面积RSD分别为1.99%、2.00%,表明供试品溶液在24 h内稳定。
2.4.5 加样回收率考察 精密称取同一批号(XDB241)样品粗粉100.000 g,分别加入适量香附烯酮、α-香附酮对照品,加入质量浓度为0.50、0.15 mg/mL,按“2.2.2”项下方法提取,每份取10 μL置10 mL量瓶中,样品中香附烯酮、α-香附酮质量浓度分别为0.50、0.14 mg/mL,甲醇定容,混匀过0.22 μm微孔滤膜,按“2.1.2”项下色谱条件进样分析,计算香附烯酮、α-香附酮平均加样回收率分别为98.58%、98.99%,RSD分别为1.76%、1.42%。结果表明该方法回收率良好,符合含量测定要求。
2.4.6 样品含量测定 取各批次醋香附挥发油,按“2.2.2”项下方法制备供试品溶液,再按“2.1.2”项下方法进样3次,分别计算香附烯酮、α-香附酮的含量,结果见表3。
取醋香附粉末(50~65目)约1.0 g,装样厚度为0.4 cm,装入石英杯,混匀,按以下条件进行扫描,采集光谱图。测样方式为积分球漫反射,分辨率设定16 cm−1,扫描数32次,扫描范围处于 12 000~4000 cm−1,温度25~30 ℃,相对湿度25%~35%。每个样品重复扫描3次,计算平均光谱,39批醋香附近红外平均光谱叠加图谱见图4。
表3 醋香附各指标原始数据
图4 39批醋香附样品近红外平均光谱叠加图
2.6.1 相关性分析 《中国药典》2020年版规定醋香附挥发油含量不得少于0.008 mL/g,故将其作为主要等级评价指标。将挥发油提取率、指纹图谱相似度、香附烯酮含量、α-香附酮含量及8个共有峰百分含量(峰面积归一化值),采用SPSS 25.0软件进行相关性分析,结果见表4,结果发现各指标之间相关性显著,可以作为醋香附品质评价指标。
2.6.2 主成分分析(principal component analysis,PCA) 将测得的12个指标经Z标准化处理后导入SIMCA 14.1软件进行PCA,得到各主成分的VIP值和方差贡献率见表5,PCA载荷因子图见图5。由表5可知前3个主成分特征值均大于1且累积方差贡献率为74.80%,表明前3个主成分对原始信息的解释率较高。由图5可知在第1主成分上C1~C6、α-香附酮含量这7个指标载荷较大,在第2主成分上C7、C8、相似度、香附烯酮含量这4个指标载荷较大。
2.6.3 聚类分析 提取前3个主成分,采用Ward法进行聚类分析。如图6所示,聚类分析结果可分为3类,即编号为S3、S12、S24、S29、S38、S39的样品聚为一类;编号为S4、S6、S11、S23、S26、S27、S30、S34的样品聚为一类;其余样品聚为一类。
表4 醋香附各指标相关性分析
C1~C8分别代表前面39批醋香附指纹图谱的8个共有峰的相对峰面积;在**<0.01级别,相关性极显著;在*<0.05级别,相关性显著
C1—C8 represent the relative peak areas of the eight common peaks of the fingerprint of the first 39 batches of;**indicated significant correlation at 0.01 level, and*indicated significant correlation at 0.05 level
表5 PCA特征值及方差贡献率
图5 PCA载荷图
图6 聚类分析图
图7 PLS-DA散点图
2.6.4 偏最小二乘判别分析(partial least squares- discriminant analysis,PLS-DA) 为了进一步验证聚类结果的可靠性,采用有监督模式的PLS-DA进行验证,如图7所示,PLS-DA分类结果和聚类分析结果一致。由聚类分析结果可知,浙江、山东产的样品聚为同一类,而其他产地的样品在不同类别中都有出现,说明浙江、山东这2个产地的醋香附样品质量相对稳定,其余产地醋香附样品质量差异较大,且同一类中样品的离散度较大,这可能与各地气候环境、土壤条件等自然因素及采收加工、炮制工艺等人为因素有关。
2.6.5 多元Logistic回归模型的建立 多元Logistic回归模型的建立是为了根据自变量预测因变量(经验等级)的概率分布。根据聚类结果,对一等、二等、三等不同等级代表样本分别赋予响应值1、2、3。采用Logistic算法建立12个指标与响应值(等级)之间的函数关系,通过SPSS 25.0软件实现Logistic模型参数的求解,得到模型表达式如下。
1=log[一等/三等]=398.401+1 460.4941+2 315.0812-153.6013+340.5324-89.3645+71.1436-90.6477+30.1348+10.3279-0.02810+0.02611-418.23212
2=log[二等/三等]=435.427+951.3121+3250.0202+43.7713-744.7564+634.8795+374.4566+43.7487+184.4718+25.8359-0.00810+0.07111-650.24512
3=0(对照)
一等=exp(1)/[1+exp(1)]
二等=exp(2)/[1+exp(2)]
三等=1-二等
1~12分别代表1~8号共有峰的相对百分含量、挥发油含量、香附烯酮含量、α-香附烯酮含量、指纹图谱相似度
将各指标实测值代入Logistic模型方程中即可计算样品属于各等级的概率,规定大于0.9即属于该等级,各批次醋香附等级判断结果见表6。Logistic回归模型对样品的分级结果与HCA分类果一致,说明该模型可以较好地反映醋香附饮片质量等级。其中一等品的平均α-香附酮含量最高,表面呈深褐色或棕褐色,微有焦斑,质地坚硬,断面无白心,从气味上也较其他等级样品具有更明显的醋香味。三等品中有较多批样品节上有未除净的棕色毛须和须根断痕,表面呈焦黄色或焦黑色,从外观性状上来说较一等品和二等品差。以上分析结果提示建立的Logistic等级预测经验公式其预测结果符合客观质量等级。
表6 醋香附饮片等级分类结果
基于“2.6.5”项的预测结果,建立近红外快速等级评价模型,将采集到的NIRS信息通过遗传神经网络算法构建等级分类模型。如图8所示,GA-BPNN神经网络通常由3层组成,即输入层,隐藏层和输出层,神经元之间的互连模式称为网络结构。将所有向量归一化至[0,1]以消除量纲影响。通过SPSS 25.0软件,采用PCA法对NIRS信息进行数据降维和特征提取,提取前4个主成分时累积方差贡献率达99.904%,将这4个主成分作为输入层数据。然后利用遗传算法(GA)来确定最佳权重和偏置,即ω和b,激活函数为Sigmoid和purelin,训练函数为trainlm,最后输出得到,即分类结果。在模型建立过程中首先采用二分类模型法对3个等级的样品进行分类训练,利用Matlab 2019b Neural Network training tool工具包优化神经网络权重,其中W1和B1代表输入层和隐藏层之间的权重和偏置,W2和B2代表隐藏层和输出层之间的权重和偏置,结果见表7。
图8 BP神经网络工作流程
如表8所示,采用准确度(accuracy)、精确率(precision)、特异性(specificity)、F1综合评价值、ROC曲线下面积(AUC)这5个指标来评估模型效果,综合比较5个模型性能指标最终确定最佳隐藏神经元分别为2、3、3。最后采用3分类模型法综合12、13、23模型对所有数据进行预测,如图9所示,得到3列预测值,根据少数服从多数的投票法决定最终输出,错误输出数有1+2+1=4个,模型预测准确率为89.74%。结果表明利用GA-BPNN法优化得到的醋香附饮片质量等级快速评价模型预测准确性较好。
表7 醋香附饮片GA-BPNN等级预测模型最佳隐藏神经元权重值
NaN是not a number的缩写,表示一些特殊数值(无穷与非数值),图9同
NaN is the abbreviation of not a number, which means some special numerical values (infinite and non-numerical), same as Fig. 9
表8 GA-BPNN二分类模型性能指标
图9 三分类模型预测结果图
GA-BPNN含量预测模型的工作流程同上,NIRS数据通过PCA可以达到降维的目的便于分析,同时采用GA遗传算法得到最优神经元训练下的权重值,可以降低NIRS原始数据中的基线漂移、杂峰、噪声等的影响,利用Matlab2019b Neural Network training tool工具包分别将样品挥发油中的香附烯酮和α-香附酮含量与NIRS信息中提取的4个主成分进行拟合,随机选取其中3个样品作为验证集,其余样品作为训练集。
由表9可知香附烯酮的最佳隐藏神经元是4个,α-香附酮的最佳隐藏神经元为5个。由表10可知,在最佳隐藏神经元个数的训练下α-香附酮、香附烯酮验证集决定系数分别为0.992 3、0.969 7,表明模型预测准确率较高。
如图10、11所示,基于GA-BPNN算法建立的醋香附挥发油中α-香附酮、香附烯酮含量近红外预测模型拟合效果较好,可以为醋香附有效成分α-香附酮和香附烯酮的含量预测提供一定的参考和应用价值。
表9 香附烯酮和α-香附酮GA-BPNN含量预测模型最佳隐藏神经元权重值
表10 隐藏神经元数量对训练数据和测试数据的最大绝对误差、决定系数和相关系数的影响
MAEtrain、MAEtest、2train、2test、train、test分别代表训练集和验证集的最大绝对误差、决定系数和相关系数
MAEtrain, MAEtest,2train,2test,trainandtestrepresent the maximum absolute error, determination coefficient and correlation coefficient of the training data and the testing data, respectively
本研究综合了GC-MS指纹图谱技术和NIRS技术2种全息指纹图谱,能全面地反映样品内在物质整体性变化,体现了醋香附饮片质量等级评价研究的全面性和整体性。基于挥发油GC-MS指纹图谱相似度、共有峰百分含量、香附烯酮含量、α-香附酮含量、挥发油含量等多个指标进行多元统计分析,可将39批醋香附饮片分为3类,并建立了Logistic等级预测回归模型,预测结果符合客观质量等级。为进一步提高模型的预测效率,采用遗传神经网络算法建立了近红外等级预测模型和含量预测模型,可以快速评价醋香附饮片质量,为醋香附饮片的质量监控及质量标准的建立提供参考。GA- BPNN等级预测模型最大的优势是融合了近红外技术和指纹图谱技术,明显提高了等级预测的准确性和可靠性,同时也加快了检测的速度。GA-BPNN算法可以反映数据之间复杂的非线性关系,相对于常用的近红外定性定量分析方法,如PLS、PCR、LMR等具有更强的学习率和自适应率,模型的稳定性和预测准确率更好。
图10 α-香附酮GA-BPNN含量预测模型
图11 香附烯酮GA-BPNN含量预测模型
现代中药饮片等级评价方法常用质量常数法和相对质量常数法,这2种方法一般适用于饮片外观性状较为规则的饮片,如党参[24]、丹参[25]、栀子[26]、厚朴[27]等,有时单位质量中药指标性成分含量越高不一定代表饮片质量越好或等级越高,这就需要寻找中药质量标志物(Q-Marker)[28]以反映药材整体质量。针对“Q-Marker-生物活性”的质量评价方法,目前已经建立了赤芍[29]、红花[30]、鸡血藤[31]等中药的等级评价模型。
本研究收集的39批不同产地的醋香附饮片,涵盖了市场上大部分中药饮片生产厂家,发现醋香附饮片一般切厚片或者碾碎成颗粒状,外观形状不规则,因此难以根据质量常数的方法来进行等级评价。醋香附挥发油成分复杂,已有研究表明α-香附酮、香附烯酮等成分是其发挥抗炎镇痛活性的物质基础之一[32],且这2个成分存在明显协同作用,即α-香附酮和香附烯酮达到一定配比时其抗炎镇痛活性可能最佳,所以将这2种化合物作为指标性成分进行定量分析。通过对挥发油成分的研究,发现香附子烯在醋香附挥发油中的相对含量最高,但因为缺乏对照品,难以对其准确定量,故只能以峰面积百分含量(相对含量)来代替。
为进一步优化和完善基于机器学习分析技术的醋香附饮片近红外快速等级评价模型,后期可扩大样本量,并进一步开展不同等级醋香附挥发油的抗炎镇痛药效试验,建立谱效关系,以推测其抗炎镇痛质量标志物。此外,在今后的研究中也可利用电子鼻、电子舌、电子眼等仿生技术将传统性状指标量化,建立基于近红外、电子眼、电子鼻、电子舌、质量标志物含量等多种非同源数据的融合质量评价模型,实现关联“性状-含量-活性”的全面整体的质量评价模型的构建。
利益冲突 所有作者均声明不存在利益冲突
[1] (梁) 陶弘景集尚志钧辑校. 名医别录 [M]. 北京: 人民卫生出版社, 1986: 154.
[2] 中国药典[S]. 一部. 2020: 270.
[3] 潘少斌, 孔娜, 李静, 等. 香附化学成分及药理作用研究进展 [J]. 中国现代中药, 2019, 21(10): 1429-1434.
[4] 袁芮, 张超, 苏彤, 等. 香附和醋香附HPLC特征图谱及多元统计分析 [J]. 中成药, 2019, 41(8): 1991-1994.
[5] 卢君蓉, 李文兵, 傅超美, 等.香附药材的质量控制方法的探讨 [J]. 中国医院药学杂志, 2015, 35(5): 389-392.
[6] 邓远辉, 刘瑜彬, 罗淑文, 等. α-香附酮的分离及其解热镇痛作用研究 [J]. 中药新药与临床药理, 2012, 23(6): 620-623.
[7] 位玉蝶, 李沁, 宋晨鸽,等. 基于多指标响应曲面法优选醋炙香附炮制工艺及炮制终点量化研究 [J]. 中草药, 2021, 52(4): 982-992.
[8] 李艳苹, 孟辉, 苏海潇, 等. 不同炮制方法对醋香附中主要成分含量的影响 [J]. 华西药学杂志, 2019, 34(4): 427-430.
[9] 许娜, 牟玉侦, 李文兵, 等. 基于HPLC法和多元统计分析的不同产地香附挥发油中4种成分含量的比较研究 [J]. 中国药房, 2020, 31(23): 2833-2840.
[10] 盛菲亚, 卢君蓉, 彭伟, 等. 香附炮制前后挥发油的GC-MS指纹图谱对比研究 [J]. 中草药, 2013, 44(23): 3321-3327.
[11] 刘忠全. 醋炙法炮制香附增强疗效的作用研究 [J]. 西部中医药, 2014, 27(9): 27-29.
[12] 胡律江, 许茜茜, 赵晓娟, 等.混料均匀设计优化四制香附活性成分配伍 [J]. 中国实验方剂学杂志, 2015, 21(14): 1-3.
[13] 张跃飞, 李鑫, 孟宪生,等. 香附挥发油的生物活性及其GC-MS分析 [J]. 中国实验方剂学杂志, 2015, 21(14): 32-35.
[14] 刘欢, 张孟历, 于猛,等. 醋制香附挥发油抗抑郁活性及化学成分分析 [J]. 药物评价研究, 2020, 43(3): 436-442.
[15] 陈志坚, 胡璇, 刘国道. 香附的化学成分及药理作用研究进展 [J]. 安徽农业科学, 2017, 45(36): 113-115.
[16] 丁平, 田友清, 陈国胜, 等. 香附油滴丸抗炎镇痛作用及其物质基础研究 [J]. 中国实验方剂学杂志, 2013, 19(20): 172-176.
[17] 席骏钻, 钱大玮, 刘培, 等. 香附四物汤挥发油β-环糊精包合物的药动学研究 [J]. 广州中医药大学学报, 2018, 35(6): 1088-1094.
[18] 曹庆玺, 贾灿潮, 黄柳芳, 等. 近红外光谱技术快速测定醋香附中α-香附酮的含量 [J]. 中国实验方剂学杂志, 2018, 24(7): 27-32.
[19] Kim D S, Choi M H, Shin H J. Estimation of starch hydrolysis in sweet potato () based on storage period using nondestructive near-infrared spectrometry [J]., 2021, 11(2): 135.
[20] 褚小立, 史云颖, 陈瀑, 等. 近五年我国近红外光谱分析技术研究与应用进展 [J]. 分析测试学报, 2019, 38(5): 603-611.
[21] 祝诗平. 人工神经网络NIR定量分析方法及其软件实现 [J]. 农业机械学报, 2007, 38(1): 108-111.
[22] 孔庆明. 神经网络在食用油质量近红外光谱分析中的应用研究 [D]. 哈尔滨:哈尔滨商业大学, 2012.
[23] 刘瑞新, 刘南岑, 史新元, 等. 基于遗传算法和BP网络的清开灵注射液增溶工艺优化研究 [J]. 中国中药杂志, 2009, 34(19): 2469-2472.
[24] 张芮铭, 张沙沙, 侯静, 等. 相对质量常数在党参饮片等级评价中的应用 [J]. 中国实验方剂学杂志, 2021, 27(1): 162-171.
[25] 倪凤燕, 吕慧芳, 毕霄鹤,等.基于相对质量常数的丹参饮片等级评价 [J]. 中国实验方剂学杂志, 2021, 27(5): 140-146.
[26] 石佳, 荆文光, 邓哲, 等.基于质量常数方法评价方法的栀子等级评价研究 [J]. 中国中药杂志, 2019, 44(17): 3732-3737.
[27] 荆文光, 程显隆, 刘安, 等. 基于“辨状论质”综合评价指数的厚朴饮片等级划分和优质优效研究 [J]. 中草药, 2021, 52(8): 2285-2293.
[28] 刘昌孝, 陈士林, 肖小河, 等. 中药质量标志物(Q-Marker): 中药产品质量控制的新概念 [J]. 中草药, 2016, 47(9): 1443-1457.
[29] 李晓红, 刘妍如, 唐志书, 等.基于“生物活性-质量标志物”关联的赤芍饮片等级评价方法研究 [J]. 中草药, 2020, 51(10): 2611-2617.
[30] 闫亚峰, 宋忠兴, 刘妍如, 等. 基于“生物活性-质量标志物”关联的红花等级评价研究 [J]. 中草药, 2019, 50(19): 4683-4690.
[31] 赵梦利, 刘妍如, 宋忠兴,等. 基于成分-抗氧化活性相关的鸡血藤饮片等级评价研究 [J]. 中草药, 2020, 51(4): 943-949.
[32] 郭慧玲, 董能峰, 胡律江, 等. 基于成分敲出策略辨识四制香附抗痛经的主要效应成分 [J]. 中国实验方剂学杂志, 2017, 23(10): 7-11.
Study on near infrared spectrum grade evaluation and content prediction model ofvinegar-processedbased on pattern recognition and GA-BPNN
QIU Li-yuan, LIANG Ze-hua, WU Xin-yu, PAN Ying-jie, FANG Jian-wen
School of Pharmacy, Zhejiang Chinese Medical University, Hangzhou 311400, China
A quality evaluation model was established based on near infrared spectroscopy (NIRS), which could quickly and accurately identify the grade ofprocessed with vinegar and predict the content of α-cyperone and cyperenone in its volatile oil, so as to provide reference for the quality evaluation of other Chinese medicinal materials or Chinese herbal pieces.The near infrared spectrum information of vinegar-processedwas collected, and the GC-MS fingerprint of 39 batches ofvolatile oil was established. The α-cyperone and cyperenone in the volatile oil were quantified. The data were processed by similarity analysis, multivariate statistical analysis, PCA, HCA, PLS-DA, logistic regression analysis and other methods, and the grades were classified. Genetic neural network algorithm (GA-BPNN) was used to fit the grade classification results, the content of α-cyperone and cyperenone with the near infrared spectral information, respectively, to establish the grade prediction model and the content prediction model.According to the principal component cluster analysis, vinegar-processedcan be divided into three grades, and the results of PLS-DA analysis were consistent with those of principal component cluster analysis. Multivariate logistic regression analysis was used to establish the empirical formula for the classification of decoction pieces. The results of grade prediction were consistent with those of principal component cluster analysis. The prediction accuracy of GA-BPNN model was 89.74%, and the model accuracy was good; The determination coefficients of α-cyperone and cyperenone regression model were 0.992 3 and 0.969 7, respectively, which could well predict the content of α-cyperone and cyperenone in volatile oil of vinegar-processed.The grade evaluation model of vinegar-processedbased on near infrared technology established by GA-BPNN can quickly and accurately predict the grade of vinegar-processed, which provides a reference for the establishment of quality standards of vinegar-processedand other Chinese medicinal materials and the research of grade evaluation model.
vinegar-processed; volatile oil; grade evaluation; GC-MS; NIR; pattern recognition; genetic neural network algorithm; α-cyperone; cyperenone; quality evaluation; similarity analysis; multivariate statistical analysis; principal component analysis; hierarchical cluster analysis; partial least squares-discriminant analysis; Logistic regression analysis
R283.6
A
0253 - 2670(2021)13 - 3818 - 13
10.7501/j.issn.0253-2670.2021.13.006
2021-03-09
国家重点研发计划——中药饮片质量识别关键技术研究(2018YFC1707001)
邱丽媛(1996—),硕士研究生,研究方向为中药炮制工艺及质量标准。Tel: 18806823685 E-mail: 2387841189@qq.com
梁泽华(1976—),副教授,从事中药炮制工艺及质量标准研究。Tel: 13858042221 E-mail: 1046698407@qq.com
#并列第一作者:梁泽华
[责任编辑 郑礼胜]