基于拉曼光谱的中药升降浮沉药性辨识方法研究

2023-10-17 03:46刘淑明梁浩程虹纪徐维晟王耘
中国中医药信息杂志 2023年10期
关键词:药性曼光谱拉曼

刘淑明 ,梁浩 ,程虹 ,纪徐维晟, ,王耘

1.北京中医药大学中药学院中药信息工程研究中心,北京 102488;2.北京中医药大学生命科学学院,北京 102488

升降浮沉是指药物对人体作用的不同趋向性[1]。作为中药药性特征之一,升降浮沉在指导临床用药与方剂配伍过程中具有重要作用。目前,升降浮沉理论相关研究主要集中在古籍溯源研究[1-3]、方剂内涵原理探讨[4-6]、药性考证或药效比较[7-9]。药理研究表明,中药升降浮沉药性对人体特定方向或病势的疾病起着显著或特殊的调节作用[10]。如药性“升”具有催吐、发汗、升阳、开窍、清头目、通鼻窍、聪耳明目、生津止渴的功效,药理作用表现为兴奋呕吐中枢、催吐、发汗、解热等[11]。

升与降、浮与沉对立统一,对具有相同作用趋势的中药进行共有特征探索与辨识研究,有望揭示升降浮沉的科学内涵。油雨忻等[12]提出“中药升降浮沉药性的物质基础是中药成分”假说,利用紫外指纹图谱表征中药成分,结合支持向量机(SVM)算法初步构建了中药升降浮沉判别模型,为中药药性物质基础与升降浮沉理论研究提供了新思路。然而,中药指纹图谱的优势体现在对已知化学成分的准确鉴定,无法整体表征中药这一复杂体系。样品制备的要求也增加了研究的复杂性。中药物质基础的复杂性使草本中药可看作由分子构成的整体集合体系,拉曼光谱为分子散射光谱,能够对中药进行直接检测分析,即可以在保留中药整体特性的情况下得到量化表征数据,进而开展后续研究。因此,本研究基于中医药整体观,以“升降浮沉”为研究对象,测定中药拉曼图谱,经特征筛选获取不同药性拉曼光谱特征,结合机器学习方法建立中药升降浮沉特性辨识模型并开展评价,以期得到基于拉曼光谱的升降浮沉药性量化表征精准数据和辨识模型,揭示中药升浮与沉降的科学内涵,促进升降浮沉理论的现代化发展。

1 仪器与试药

SEED型近红外拉曼光谱仪(Seabreeze Laser激光器,XS11639-B40090157光谱仪系统,上海如海光电公司),YP-2TS型压片机(天津中世沃克有限公司),RS-FS1801型中药材超微粉碎机(广州荣事达有限公司)。

白芷、薄荷、苍术、细辛、生姜、旋覆花、阿胶、枇杷叶、紫苏子、大黄等药材共239种(升浮药101种,沉降药138种),安国市桓荣中药材有限公司提供(送货号Q010246),经北京中医药大学中药学院王耘团队鉴定,所有药材均符合2020年版《中华人民共和国药典》[13]规定;超纯水(屈臣氏有限公司,货号hs6303)。

2 方法与结果

2.1 样品预处理

中药材用超纯水洗净,去除表面灰尘等杂质,置于真空干燥箱中,26 ℃恒温干燥1 h。用超微粉碎机打成粉末,过3号筛,利用小型不锈钢压片模具压片,即得待测样品。

2.2 检测条件

激光器类型为板载激光器;中心波长785 nm;功率120 mW;积分时间7 000 ms;平均采集3次;平均模式为硬件平均;拉曼位移200~3 200 cm-1;基线处理条件为lambda 10 000,order 2;平滑滤镜lambda 20,order 2。

2.3 数据采集

将待测药材粉末压片或器皿放置于样品台上,随机选取10个不同的部分依次进行检测,采用连续扫描收集、激光自动模式,共采集10次,以10次检测的平均拉曼谱图作为该药材最终表征谱图。

2.4 方法学考察

2.4.1 专属性考察

以枸杞子、山药、茯苓、刺五加、冰片5味药进行专属性考察,按上述条件进行检测。功率调至0 mW,采集特征拉曼位移(cm-1)及其所对应的峰强(I),得到空白谱图。结果见图1。表明不同中药因性质的差异表现出各异的拉曼谱图,峰形良好,无明显荧光干扰。

图1 中药材拉曼谱图专属性考察

2.4.2 精密度考察

以柏子仁、西洋参、苏合香、土木香、天花粉5味药进行仪器精密度考察。经样品预处理后,每味药分别制备6份待测样品,先后放置于样品台上进行拉曼光谱检测,记录中药拉曼谱图的特征拉曼位移及其所对应的峰强,并计算RSD。同时,对拉曼谱图进行逆峰位匹配检索,计算谱图相似度。结果RSD均小于4.12%,相似度均大于86.0%,表明仪器精密度良好。

2.4.3 重复性考察

以取自不同产地(山东、河北、宁夏、江苏、湖南)的当归、黄柏、山药3味药进行重复性考察。经样品预处理后,每味中药待测样品先后进行5次拉曼光谱检测,记录中药拉曼谱图的特征拉曼位移及其所对应的峰强,并计算RSD。同时进行逆峰位匹配检索,计算谱图相似度。结果RSD均小于3.62%,相似度均大于85.7%,表明重复性良好,且不同产地的同种中药拉曼谱图整体上基本一致。

2.5 数据处理及特征筛选

按“2.3”项下方法得到101味升浮药与138味沉降药的拉曼谱图数据,以1 cm-1为单位进行量化处理,每味药得到3 000个拉曼指标,建立239味中药的拉曼数据集。“升降浮沉”数据依据2020年版《中华人民共和国药典》[13]和《中药大辞典(第二版)》[14]的中药功效作用趋向结合判定标准分析:具有解表、透疹、祛风(湿)、升阳举陷、开窍、醒神、温阳补火、行气、解郁、涌吐等功效的中药,作用趋向为“升浮”,如薄荷、柴胡、升麻、苍术等;具有清热、泻下、利湿、安(养)神、止呕、抑肝阳、息风止痉、止咳、平喘、收敛固涩、止血等功效的中药,作用趋向为“沉降”,如白芍、葶苈子、苦杏仁、牡蛎等[2,15-16]。

本研究采用带有交叉验证的递归特征消除(RFECV)对拉曼谱图数据进行特征筛选。该方法分为两部分:递归特征消除(recursive feature elimination,RFE)[17]通过一个基模型进行模型训练,对3 000个拉曼波段进行特征重要性排序,删除重要性最低的特征,利用新特征集进行下一轮训练,循环往复直至达到所需的特征数量;再通过交叉验证(cross validation,CV)筛选出最优特征子集。本研究使用轻量级梯度提升机(LGBM)集成算法[18]作为RFE的基模型。以LGBM_RFE作为特征筛选算法筛选出与升降浮沉显著相关的拉曼波段,交叉验证次数为5,每次删除的特征个数为1,最终保留126个最优拉曼波段进行中药升降浮沉特性辨识模型的训练。

2.6 模型构建及评价

为得到良好的辨识模型,本研究基于特征筛选后的中药拉曼谱图数据结合SVM、随机森林(RF)、极度梯度提升(XGBoost)和自适应提升(AdaBoost)分类器建立中药升浮沉降辨识模型,将数据集按7∶3比例随机划分为训练集和测试集,使用不同模型进行训练与预测,并用曲线下面积(AUC)、准确率、精确度、召回率及F1值作为模型的评价指标。以上4种分类器均通过随机网格搜索十折交叉验证进行参数调试和优化,最优超参数设置见表1,模型比较见表2。

表1 4种分类器的最优超参数设置

表2 4种辨识模型评价指标比较(%)

4种辨识模型的AUC均达到80%以上,其中XGBoost模型AUC达90%以上,说明该模型的分类效果极佳。相较于其他模型,XGBoost模型的准确率更高,整体效果更好;精确度和召回率更高,说明对升浮中药和沉降中药的区分能力更强;F1值更高说明模型更加稳健。明显优于已报道模型(AUC为0.831 6,准确率为80.00%)[12]。综上,XGBoost模型表现最优,可以实现对升浮中药和沉降中药的准确辨识。

为深入了解126个最优拉曼波段与升降浮沉中药辨识结果之间的关系,选用SHAP(SHapley Additive exPlanations)方法[19]对基于XGBoost构建的升浮沉降辨识模型的识别结果进行解释,以此反映最优拉曼波段对药性识别结果的影响及其正负性,可视化部分结果见图2。模型中最重要的前10个拉曼波段分别位于I2289、I2105、I1066、I2343、I2415、I2425、I1140、I2591、I458、I2291。图中每个点代表1个样本,点的颜色代表拉曼波段强度。如波段I2105,红色点主要集中于横坐标正值,蓝色点主要集中于横坐标负值,表明此波段拉曼强度越高其药性辨识结果越趋于升浮,拉曼强度越低其药性辨识结果越趋于沉降;波段I1140,红色点主要集中于横坐标负值区域,表明此波段拉曼强度越高其药性辨识结果越趋于沉降。

图2 最优拉曼波段对模型预测的影响正负性

3 讨论

历代医书、历年版《中华人民共和国药典》及各版《中药学》教材对中药性、味、归经大多有明确记载,但均未从升降浮沉角度对单味中药性能进行明确论述。其原因之一是升降浮沉概念较为抽象,会根据医家个人经验发生改动。另一重要原因在于,中药的升降浮沉特性受性、味、归经、用药部位、药材质地、炮制、配伍等因素影响。从性味来看,性热、温,味甘、辛、淡属阳,多为升浮之性;性寒、凉,味酸、苦、咸属阴,多为沉降之性。若药物的性味阴阳属性不同,该药便具有升浮沉降双重特性。气味厚薄升降浮沉理论同样阐述了这一原理,气属阳、味属阴,中药气味阴阳共存,使一味中药存在升中有降、降中有升的可能。如从四气五味、气味厚薄、主治功效、方剂配伍四方面对桔梗药性进行考证,发现其不仅具有显著的升浮之性,亦有苦泄沉降之功[20]。大黄峻下,酒制后具备清上焦血分热毒功效。牛膝引血下行,配伍柴胡、桔梗后具有上升之力。一般来说,方剂的升降趋势取决于方剂中具有相同趋势的大部分药味[21]。因此,中药的升降浮沉特性受多种因素的影响并存在转化关系,这在一定程度上导致该理论发展缓慢。

由于升降浮沉特性的复杂性,探寻不同药性对应的物质基础与科学内涵尤为重要。中药是典型的复杂体系,药性中性、味、归经、升降浮沉、有毒无毒分别从不同维度对中药整体特点进行描述,每个维度必然对应着各自的物质基础。在探索各药性科学内涵的过程中,应秉持整体观思想。拉曼光谱属分子振动散射光谱,其形成与分子极化率和能级相关。本研究中,中药的检测过程保持了中药完整性,拉曼光谱从分子层面实现了中药的整体表征。

拉曼光谱检测中噪声较大,经常受到荧光效应的干扰[22-25]。为抑制荧光效应,本研究采取如下方法:①选定激发光中心波长785 nm。中药荧光检测激发光波长大多位于紫外-可见光区,如山药330 nm、沙苑子410 nm、熟地黄470 nm等[26],而中心波长785 nm的激发光为近红外激光(760~830 nm),可在一定程度上抑制样品的荧光效应;②采用屈臣氏超纯水、甲醇、甲醇水轻微冲洗药材,去除表面灰尘、沾染物等杂质,避免杂质荧光效应的干扰;③仪器采取连续扫描采集模式,延长照射时间,利用“光致漂白”效应以最大程度达到抑制荧光干扰的效果[27]。

LGBM集成算法具有训练速度快、高准确度、适用于高维度数据等优点,可以高效、准确的对拉曼波段进行重要性排名。RFE算法通过迭代运算来选择最重要的拉曼波段子集,从而减少特征数量,提高模型的准确度。两者联用的LGBM_RFE特征筛选算法可从3 000个拉曼波段中去除冗余数据,保留重要信息,筛选得到与升浮沉降相关性最强的拉曼波段子集。得到的126个最优拉曼波段是拉曼光谱在升降浮沉维度对中药的表征。拉曼位移主要集中在1 000~3 200 cm-1,此范围内升浮中药的拉曼强度普遍高于沉降中药。同时,采用SHAP方法对单味中药升降浮沉特征拉曼波段进行可视化,以此反映最优拉曼波段对升降浮沉药性识别结果的重要程度及正负向影响。拉曼谱图反映的不单是中药中的某一成分或某一元素,而是某一药性在中药本体的整体特征,是对药性进行科学内涵探索的必要选择。通过中药拉曼光谱图结合辨识模型,前期已经实现对中药寒热药性、平性、甘味的辨识[28-30]。

本研究基于大宗中药材进行拉曼光谱检测,以拉曼光谱整体表征中药升降浮沉药性,结合LGBM_RFE算法筛选得到126个拉曼波段,在此基础上建立升降浮沉辨识模型,阐释升降浮沉的科学内涵,为客观识别中药的“升浮”和“沉降”趋势提供一种新方法。

猜你喜欢
药性曼光谱拉曼
白萝卜与中药同食,会解掉药性吗?
基于单光子探测技术的拉曼光谱测量
基于相干反斯托克斯拉曼散射的二维温度场扫描测量
半夏的化学成分及其药性、毒性研究进展
不同炮制和煎煮时间对大黄沉降药性的影响研究
改进细菌群体趋药性算法在可用输电能力计算中的应用
BMSCs分化为NCs的拉曼光谱研究
便携式薄层色谱-拉曼光谱联用仪重大专项获批
苯的激光拉曼光谱研究
新型4H-3,1-苯并噁嗪类化合物的合成及拉曼光谱研究