近红外光谱技术在中药研究中的应用缺陷及对策

2023-10-12 01:40邓妍刘晓凤叶萌吴磊刘涛
关键词:近红外光谱通用性样本量

邓妍 刘晓凤 叶萌 吴磊 刘涛

摘 要:近红外光谱技术具有快速、无需样品制备及每次测量可同时确定多个成分的特点,但随着应用的增加,其存在的一些问题也逐渐显现.以近红外光谱技术在中药实际应用中遇到的问题为切入点,对相关问题如近红外光谱技术在中药样品处于水溶液体系难以分析、建模所需样本量大及模型通用性不强等进行了讨论,并提出了建议与展望,为近红外光谱技术在中药产业中的进一步应用提供参考.

关键词:近红外光谱;水光谱组学;通用性;模型转移;样本量

中图分类号:O657.33;R284

文献标志码:A

文章编号:1004-5422(2023)03-0225-05DOI:10.3969/j.issn.1004-5422.2023.03.001

0 引 言

近年来,近红外光谱(NIRS)技术发展迅速,被各行各业广泛应用.在中药方面,NIRS被用于中药制剂原料[1]的基源、产地[2-3]、优劣[4]与真伪的质量分析[5-6],液体制剂的提取[7]、纯化[8]、渗漉[9-10]与浓缩[11]等工序的过程分析,固体制剂的混合[12]、制粒[13]、干燥[14]与包衣[15]等工艺过程质量分析.但随着NIRS的不断应用,其自身存在的缺点也逐渐显现.例如,由于NIRS谱线宽,特征性不强,检测的灵敏度较低,再加上对水的强吸收,所采集的光谱会高度重叠且特异性不强,不适用于水溶液中的痕量分析;NIRS是一种间接的分析技术,光谱反映的是分子层面的信息,需要复杂的建模才能直观反映结果,因此,对化学成分的快速测定与不同物质的鉴别必须依赖已建成的定量或定性模型,但是所建成的模型在不同的NIRS仪器上并不能通用,模型的通用性不强[16];建模样本集要求数量足够多,泛化性强[17]且涵盖全部变异才能建立有效、稳定与性能好的模型,样本量不足时模型的性能和精确度极易被影响,因此,当样本量不足时,如何建模将有待进一步研究;建模过程中如何满足模型的“完备性”条件(而不是使模型仅在一定程度上满足);当样品处于溶液状态,采集样品前如何处理,以及光谱采集后如何进行光谱分析等,这些都是NIRS发展过程中遇到的普遍问题.

本文以ScienceDirect online和中国知网数据库的文献为基础,针对目前NIRS在中药研究过程中遇到的问题进行探讨,并就文献提出的解决办法进行讨论,拟为改善或解决NIRS带来的问题提供参考.

1 在水溶液中难以分析及对策

NIRS法对水的强吸收是其不可避免的缺陷,当被扫描的样本是水溶液或者处于水体系之中时,所采集的NIRS谱图会高度重叠,不会有明显的特征差异,极大地影响NIRS谱图分析.研究表明,现有的解决NIRS技术测量水溶液中有效组分的方法主要是通过化学或者物理手段使样品由有水体系变为无水体系,以及光谱分析时尽量避开水吸收力强的波段.封义玲等[18]运用NIRS技术对华盖散的浓缩终点进行判断时,先将浓缩液烘干再进行光谱采集.陈国权等[19]使用NIRS技术检测感冒灵提取工艺时,也是先将提取液烘干,采集除去水分后固含物的光谱.

为了避免水溶液的影响,常采用蒸干水分的办法以达到直接排除水分干扰的目的,但在中药的研究过程中,NIRS经常被用来在线分析,在建模初期,如果还要增加对样品复杂繁琐的处理,不利于NIRS对样品的在线监测,影响NIRS技术操作的方便性与实用性.不仅如此,水分蒸干的过程是未知的,中药的成分复杂,样品本身是否会出现理化性质的变化,有效成分是否会随着蒸干的过程进行降解或转化,从而影响测定结果也无法检测.近年来新兴的水光谱组学为解决水溶液样品强吸收的问题提供了新思路,水光谱组学能够将组分的任何变化反映在与其化学结构相关的吸收带和水分吸收带上[20].其利用水的吸收光谱特征来表征样品,以间接的方式收集有关化学成分和环境条件的信息.水光谱组学的引入为各种水系统的组分测量带来了新的可能性,并拓展了NIRS技术的应用.与现有的方法相比,水光谱组学和NIRS技术的结合使用可以直接跳过除去样品水分这一步骤,实现了对系统中水的非侵入式监测.NIRS技术检出限约为5 000 ppm,而水光谱组学的应用可以将检出限降低至NIRS的1/5.水的存在不仅不影响NIRS技术的检测,还能解决NIRS技术无法用于痕量分析这一缺点.因为水分子的体积小且数量多,在分子水平上,水中氢键[21]构成的四面体可以看成1个对内外部变化都能灵敏响应的传感器和能够放大外来的任何一个分子的放大器,放大溶液中微小浓度的影响,捕捉环境的变化.当溶质分子或其他化学成分与水分子相互作用时,水的光谱将代表1个高度响应的信号,反映水分子结构及其变化.例如,丹参中丹酚酸A含量较低,传统方法难以检测丹参提取过程中丹酚酸A的含量变化.Dong等[21]运用NIRS技术实时监测溶液中丹酚酸A的转化反应过程,并用光谱组学对其进行了分析,成功检测了丹酚酸A的转化过程.中药的提取过程[7]主要以水作为萃取溶剂,而使用NIRS在线监测提取过程时,会面临光谱中最有用的信息被强背景所覆盖的问题,Gao等[22]结合了水光谱组学,以水为探针,直观地显示了丹参提取过程水分子系统的动态变化.陈定芳等[23]将水光谱组学应用到中药归经理论,监测了中药成分作用于人体巨大水系统的复杂过程.

2 模型通用性不強及对策

NIRS和化学计量学组合建立的定量模型常运用于中药材有效成分的含量、中间体含量和中成药剂型含量的快速测定[24].然而,NIRS的通用性不强是NIRS技术在中药大生产和多成分含量测定中应用的一大难题,主要体现在2个方面.首先,NIRS与化学计量学结合开发的定量模型仅适用于与原始校准集具有相同特征且不超过校准集光谱范围的光谱[25],当样品来源不同或新采集的样品变异性大时,定量模型的预测性能会大幅下降,预测结果的精密度会严重降低;其次,当定量模型用于不同类型NIRS仪器采集的NIRS预测时,原定量模型的性能会被损坏,建立的模型将毫无意义.

为了提高模型的通用性[26],最常用的方法就是直接通过增大样品的变异性和差异性来随时更新NIRS模型,并结合更合适的化学计量方法来保持其预测性能,增加其泛化性.

为了解决模型与新光谱不匹配的问题,有的学者提出了“模型转移”的概念.“模型转移”指现有的研究都集中在仪器之间的模型转移,是将1台NIRS仪器上建立的模型转移到另1台NIRS仪器上,实现模型共享且转移的模型仍然有效.饲料领域[27]中,由于生产环境的变化,NIRS采集的在线与离线光谱差异较大,导致建立的NIRS模型离线光谱无法直接使用于在线检测,大大限制了NIRS技术在饲料生产上的利用.王红英等[27]基于光谱共享法的NIRS模型转移技术建立了光谱的共享模型,既能在线监测也能离线检测样品.李阳阳等[28]运用了3种模型转移算法,成功将复烤片烟常规化学成分的模型转移到不同品牌傅里叶变换NIRS仪器上使用,并确定了最优模型转移算法.王大锋等[29]以测量烟草化学成分为切入点,通过在经过特殊设计的NIRS仪器在线建立测量烟草化学成分的定量模型,建成的定量模型可以在多台NIRS仪器之间实现模型转移.这些应用实例都可以作为NIRS在中药应用过程中的借鉴.

除了“模型转移”外,Tan等[30]还提出了样本之间的转移,通过插入一种新的算法来矫正模型与样品光谱不匹配的问题,将校准模型优化问题转化为数学优化问题,并通过所提出特殊算法对模型问题进行处理,以解决NIRS模型样本间的迁移问题.

3 需求样本量大及对策

在模型的构建上,对NIRS模型数据处理的研究越来越受到研究者的重视,有些中药资源十分珍贵,或样本来源受限的情况下,拥有更多的样本来解决模型的问题是不切实际的,无法满足NIRS技术对于数量的要求,在样本量小的基础上建立的NIRS模型准确性和预测能力会大大降低,NIRS模型会因为样本量的太少而受影响.因此,解决需求样本量大的问题也是NIRS技术发展中的难题.已经有学者提出了集成学习的概念[31-35],把已有的为数不多的样本分为3个子集,即训练集、验证集和测试集[36],这3个子集在一定算法的运算下分别用于构建、优化和测试模型.汽油的辛烷值在量化汽油质量方面起着重要作用,传统检测汽油辛烷值的方法需要耗费大量的时间跟成本,样品的采集也是非常昂贵的,Noureddine等[37]应用了NIRS的集成模型在样本量不足的情况下准确预测汽油辛烷值的最佳增压.Yu等[38]提出一种基于功能数据分析的NIRS融合标定模型,把原本的离散型数据模型通过功能数据分析方法转换为函数问题,再根据函数对所有样本进行训练,解决了小样本问题.烟草行业的NIRS技术主要以离线分析为主[39],毕荣道等[40]为了解决烟草内在质量评价的问题,构建了一种以小样本数的在线NIRS建模的方法,通过采用不同抽样比例的算法最终确定抽样量,所建模精度良好,可以解决烟草生产中取样量少的问题,节约了成本.

4 结 语

NIRS技术是一种反映分子层面的技术,需要结合化学计量学才能把分子层面的信息直观地表达出来,其本质任务是通过测量样品变量,借助线性或者非线性变换来描述测定目标.然而在中药的实际应用中,提取与浓缩等过程离不开水的参与,就分子层面而言,NIRS对水的强吸收严重影响了NIRS的采集与分析;NIRS技术结合化学计量学建模时为了保证模型的性能与精确度需要大量的样本,而中药资源稀缺且珍贵,无法采集足够的样本数据;中药组分复杂,NIRS技术的定量模型用于测定中药有效成分的含量时,常常伴随着几个组分的同时测定,而定量模型通用性不强,只能针对单一组分进行检测.综上所述,解决和完善NIRS模型系统的缺陷与不足是NIRS技术广泛应用于中药研究的重点.

参考文献:

[1]杨培.流化床制粒过程小试水分近红外定量模型向中试传递方法研究[D].北京:北京中医药大学,2020.

[2]孙岚萍,顾志荣,马转霞,等.不同产地麦冬的近红外光谱鉴别分析[J].时珍国医国药,2020,31(11):2675-2677.

[3]陈璐,张惠,张丙春,等.基于近红外光谱技术快速鉴别不同产地金银花[J].农产品质量与安全,2019,17(4):41-44.

[4]張丹雁,曹曼,刘家水,等.近红外光谱技术鉴别南板蓝根药材的真伪优劣[J].时珍国医国药,2014,25(12):2933-2935.

[5]瞿海斌,杨海雷,程翼宇.近红外漫反射光谱法快速无损鉴别阿胶真伪[J].光谱学与光谱分析,2006,26(1):60-62.

[6]李文龙,邢丽红,薛东升,等.一种基于近红外光谱技术的熊胆粉鉴别方法[J].光谱学与光谱分析,2011,31(3):673-676.

[7]李青翰,楚刚辉.近红外光谱技术快速测定雪菊提取过程中的木犀草苷含量[J].新疆农业大学学报,2018,41(3):230-234.

[8]杨南林,程翼宇,瞿海斌.一种用于中药纯化过程的近红外光谱分析新方法[J].化学学报,2003,71(5):742-747.

[9]陈晨,李文龙,瞿海斌,等.近红外透反射光谱法用于复方苦参注射液渗漉过程在线检测[J].中草药,2013,44(1):47-51.

[10]陈晨,李文龙,瞿海斌,等.复方苦参注射液渗漉过程的近红外光谱在线检测方法[J].中国药学杂志,2012,47(21):1698-1702.

[11]瞿海斌,李斌,刘雪松,等.红参醇提液浓缩过程近红外光谱在线分析方法[J].中国药学杂志,2005,40(24):1897-1899.

[12]张正,干丽,刘远俊,等.基于近红外光谱技术的当归提取物混合工艺研究[J].今日药学,2020,30(3):172-175.

[13]刘荣华.基于近红外光谱分析技术的流化床制粒干燥过程在线监测研究[D].济南:山东大学,2018.

[14]全智慧,王洛临,张建军.近红外光谱技术在制川乌配方颗粒干燥工艺中的应用研究[J].按摩与康复医学,2015,6(9):89-91.

[15]Zhong Z J,Liu X H,Luo X R,et al.Evaluation of coating uniformity for the digestion-aid tablets by portable near-infrared spectroscopy[J].Int J Pharm,2022,622:121833-1-121833-8.

[16]薛莉沁.小型近紅外光谱仪的开发及在酿酒原料中的应用[D].镇江:江苏大学,2021.

[17]许瑞轩,张英俊,赵海明.青贮玉米近红外模型检测苜蓿玉米套作系统青贮饲料的可行性分析[J].中国奶牛,2022,40(7):1-5.

[18]封义玲,罗晓健,赖衍清,等.近红外光谱在线采集技术检测华盖散提取液浓缩过程中的相关指标[J].中国药房,2020,31(3):303-308.

[19]陈国权,潘红烨,刘雪松,等.感冒灵提取过程近红外光谱在线检测技术研究[J].中国中药杂志,2016,41(8):1383-1387.

[20]Zoltan K,Jelena M,Petya V,et al.Aquaphotomics for monitoring of groundwater using short-wavelength near-infrared spectroscopy[J].Spectrochim Acta A Mol Biomol Spectrosc,2022,279:121378-1-121378-9.

[21]Dong X X,Chen Z Q,Pan J Y,et al.A novel aquaphotomics based approach for understanding salvianolic acid A conversion reaction with near infrared spectroscopy[J].Spectrochim Acta A Mol Biomol Spectrosc,2022,275:121182-1-121182-11.

[22]Gao L L,Zhong L,Zhang J,et al.Water as a probe to understand the traditional Chinese medicine extraction process with near infrared spectroscopy:A case of Danshen (Salvia miltiorrhiza Bge.) extraction process[J].Spectrochim Acta A Mol Biomol Spectrosc,2021,244:118854-1-118854-8.

[23]陈定芳,吴月峰,桂卉,等.水光谱组学研究现状及对中药归经理论的特殊影响[J].湖南中医药大学学报,2021,41(12):1986-1992.

[24]李文龙,瞿海斌.近红外光谱应用于中药质量控制及生产过程监控的研究进展[J].浙江大学学报(医学版),2017,46(1):80-88.

[25]崔盈盈.奶牛四种饲料营养成分快速测定NIRS模型的优化与应用[D].新乡:河南科技学院,2022.

[26]李金林,许迟,何立荣,等.近红外光谱分析技术在饲料检测领域的应用研究[J].饲料研究,2017,40(5):10-12.

[27]王红英,常楚晨,金楠,等.近红外模型转移技术在饲料生产中的应用[J].饲料工业,2021,42(3):1-7.

[28]李阳阳,彭黔荣,刘娜,等.复烤片烟常规化学成分的傅里叶变换近红外光谱法的模型转移[J].理化检验(化学分册),2019,55(5):497-503.

[29]王大锋,何育萍,董海平,等.烟草化学成分AOTF-近红外在线模型转移研究[J].湖南文理学院学报(自然科学版),2013,25(1):78-81.

[30]Tan A L,Wang Y X,Zhao Y,et al.Near infrared spectroscopy quantification based on Bi-LSTM and transfer learning for new scenarios[J].Spectrochim Acta A Mol Biomol Spectrosc,2022,283:121759-1-121759-9.

[31]Wang K,Bian X H,Zheng M,et al.Rapid determination of hemoglobin concentration by a novel ensemble extreme learning machine method combined with near-infrared spectroscopy[J].Spectrochim Acta A Mol Biomol Spectrosc,2021,263:120138-1-120138-9.

[32]Song L,Chen E Z,Zheng T L,et al.Blended fabric with integrated neural network based on attention mechanism qualitative identification method of near infrared spectroscopy[J].Spectrochim Acta A Mol Biomol Spectrosc,2022,276:121214-1-121214-11.

[33]Chen H,Huang Q,Lin Z.Detection of adulterants in medicinal products by infrared spectroscopy and ensemble of window extreme learning machine[J].Microchem J,2022,173:107009-1-107009-8.

[34]Gerard D,Indra A.A stacked regression ensemble approach for the quantitative determination of biomass feedstock compositions using near infrared spectroscopy[J].Spectrochim Acta A Mol Biomol Spectrosc,2022,276:121231-1-121231-12.

[35]Cyrus S H,Ho Y L,Trevor W,et al.Improving the diagnostic accuracy for major depressive disorder using machine learning algorithms integrating clinical and near-infrared spectroscopy data[J].J Psychiatr Res,2022,147:194-202.

[36]Tan C,Chen H,Lin Z.Brand classification of detergent powder using near-infrared spectroscopy and extreme learning machines[J].Microchem J,2021,160:105691-1-105691-10.

[37]Noureddine G,Fouzi D,Walid G.Towards a NIR spectroscopy ensemble learning technique competing with the standard ASTM-CFR:An optimal boosting and bagging extreme learning machine algorithms for gasoline octane number prediction[J].Optik,2022,257:168813-1-168813-11.

[38]Yu S,Liu J.Ensemble calibration model of near-infrared spectroscopy based on functional data analysis[J].Spectrochim Acta A Mol Biomol Spectrosc,2022,280:121569-1-121569-11.

[39]張晰祥,李军华,郑健.近红外光谱仪对在线烟丝化学成分均质性运用[J].广州化工,2017,45(19):99-102.

[40]毕荣道,赵旻.基于PCA及霍特林T~2分布的在线近红外建模研究[J].电子技术与软件工程,2021,10(13):189-191.

(责任编辑:伍利华)

Abstract:Near-infrared spectroscopy owns the properties of high speed,needless sample preparation,and simultaneous determination of multiple components in each measurement.However,as it is widely used in application,some problems have been gradually discovered.In this paper,these problems encountered in the practical application of near-infrared spectroscopy in traditional Chinese medicine are taken as the research targets.The related problems such as the difficulty of analyzing the aqueous solution system of traditional Chinese medicine samples by near-infrared spectroscopy,the large sample size required for modeling,and the poor universality of the model are discussed.Suggestions and prospects are put forward to provide reference for the further application of near-infrared technology in the traditional Chinese medicine industry.

Key words:near infrared spectroscopy;water spectroomics;universality;model transfer;sample size

基金项目:2017年国家重点研发计划项目(2017YFC1701900);四川省2021—2023年高等教育人才培养质量和教学改革项目(JG2021-1106);成都大学2021—2023年研究生人才培养质量和教学改革立项项目(cdjgy2022004)

作者简介:邓 妍(2002—),女,从事中药新药开发及质量再评价研究.E-mail:3031458049@qq.com

通信作者:刘 涛(1976—),男,博士,研究员级高级工程师,从事中药再评价研究.E-mail:liutao0578@sina.com

猜你喜欢
近红外光谱通用性样本量
Improving polyp detection at colonoscopy: Non-technological techniques
医学研究中样本量的选择
航空装备测试性试验样本量确定方法
基于元模型的通用性列控仿真平台基础环境研究
Sample Size Calculations for Comparing Groups with Binary Outcomes
抛丸机吊具的通用性设计以及抛丸器的布置
基于近红外光谱法的藜麦脂肪含量快速检测
汉语教材编写的本土化特征——基于《汉语教科书(1954)》与通用性教材、“一本多版”的比较
自适应样本量调整中Fisher合并P值法和传统检验法的模拟比较