徐芳芳,杜 慧,张 欣,李执栋,徐 冰,朱文灯,吴 云,肖 伟*
1.江苏康缘药业股份有限公司,江苏 连云港 222001
2.中成药智能制造国家地方联合工程研究中心,江苏 连云港 222001
3.北京中医药大学,北京 100029
热毒宁注射液(Reduning Injection,RI)处方由青蒿、金银花和栀子组成,临床用于外感风热所致感冒、咳嗽,症见高热、微恶风寒、头痛身痛、咳嗽、痰黄;上呼吸道感染、急性支气管炎见上述证候者[1-2]。金银花和青蒿(金青)醇沉是热毒宁注射液生产过程的关键工序之一,是金银花和青蒿的水提浓缩液合并后加入乙醇从而除去蛋白质、鞣质、多糖等杂质[3]而达到纯化目的的过程。中药醇沉机制复杂,过程质量控制难度高,能否实现醇沉过程物料的快速分析对控制醇沉品质至关重要[4]。
光学分析技术属于无损、绿色检测技术,操作简单、快速,广泛应用于中药样品中成分含量的快速测定[5-10]。杜文俊等[3]曾尝试采用近红外光谱法测定金青醇沉过程中绿原酸和固形物的含量,但由于醇沉时易出现粒径不均的颗粒状或絮状样品,在透射测定模式下直接影响近红外定量预测的效果,该研究对象仅为醇沉上清液,近红外技术的应用是离线应用,未能实现醇沉过程的在线控制[11]。
本研究采用在线中红外光谱(mid-infrared spectrum,MIR)分析技术,采用衰减全反射设计,利用样品表面的反射信号获取样品有机成分的结构信息[12],且其产生的基频吸收强度大,灵敏度更高,更适用于混悬体系的样品检测。这不仅可以简化样品的制备过程,还扩大了红外光谱技术的应用范围,测定多种状态的样品,例如生物组织、浆液等。目前红外光谱技术在中药检测得到较为广泛的应用,如药材鉴别[13-15]、品种分类[16-17]、伪劣鉴别[18]等定性分析方面有较多的研究应用,而在中药含量测定报道较少,本实验利用衰减全反射-傅里叶变换MIR结合组合间隔偏最小二乘法(synergy interval partial least squares,SiPLS)[19-22]进行变量筛选,分别建立热毒宁注射液金银花与青蒿(金青)醇沉过程7种指标成分的偏最小二乘定量分析模型,实现新绿原酸、绿原酸、隐绿原酸、异绿原酸A、异绿原酸B、异绿原酸C和断氧化马钱子苷的快速测定。
9批次的金青醇沉过程样本,批号及数量见表1,由江苏康缘药业股份有限公司中药现代化数字化提取工厂提供。对照品绿原酸(批号110753-201805,质量分数96.2%)、栀子苷(批号110749-201806,质量分数97.5%),供含量测定用,中国食品药品检定研究院。
表1 金青醇沉样本信息Table 1 Information of Jinqing alcohol precipitation samples
Nicolet iS10红外光谱分析仪、赛默飞U5高效液相色谱仪,美国Thermo Fisher公司;BSA224SCW型万分之一电子天平,德国Sartorius公司;0.1 mL移液枪,德国Eppendorf公司;H1650型台式高速离心机,湖南湘仪实验室仪器开发有限公司。
Unscrambler 11,挪威Camo Analytics公司。
为实现MIR在线获取及样本自动采集,对醇沉设备取样口位置进行了适当改造。打开醇沉罐上部取样口,插入一根套管,并固定其位置,光纤及探头放于套管内,探头接触醇沉罐中药液;在套管内再放入一根软管,软管与蠕动泵相连,便于实时取样。光纤及探头信息:厂家Infrared Fiber Sensor,型号DiProbe,探头长度 28 cm,探头直径6 mm,光谱级卤化银光纤,光线长度2.5 m。醇沉过程中红外在线应用见图1。启动金青醇沉程序30 min后,每隔10 min取样1次,至醇沉结束。金青醇沉样品信息如表1所示,共计103个样品。
图1 醇沉过程在线中红外应用示意图Fig.1 Schematic diagram of online MIR applying for alcohol precipitation process
以空气为扫描背景;光谱扫描范围3400~700 cm−1;扫描次数16次;扫描间隔4 cm−1;根据样本取样时间推算样本光谱采集时间,1 min内连续的3张光谱的平均值,作为金青醇沉样本光谱数据。MIR扫描结果见图2。图2-A为103个样品的光谱,图2-B为Z181123批次中代表性样品的光谱图,取样时间为45、65、85、105、125 min。
图2 样品 (A) 和Z181123批次中代表性样品 (B) 的MIR光谱图Fig.2 Mid-infrared spectra of samples (A) and typical samples spectra of batch Z181123 (B)
光谱随着醇沉工艺的进行有变化,但是差异不明显。因中红外检测对象是醇沉上清液,上清液中溶剂是水和乙醇的混合液,溶剂浓度的变化及有效成分的含量变化未导致近红外峰形有很大差异。
依据企业内控质量标准,采用一测多评法[23],以绿原酸为参照,测定金青醇沉样品中新绿原酸、绿原酸、隐绿原酸、异绿原酸A、异绿原酸B、异绿原酸C的含量;以栀子苷为参照,测定金青醇沉样品中断氧化马钱子苷的含量。
色谱条件:色谱柱为Kromasil C18柱(250 mm×4.6 mm,5 μm);流动相为乙腈-0.1%磷酸水溶液,梯度洗脱:0~5 min,15%~18%乙腈;5~15 min,18%乙腈;15~38 min,18%~31%乙腈;38~38.5 min,31%~90%乙腈;38.5~40 min,90%乙腈;40~41 min,90%~15%乙腈;41~45 min,15%乙腈;体积流量1.0 mL/min;柱温20 ℃;检测波长为327、238 nm;进样体积10 μL。所有样本中7种指标成分的含量测定结果见表2。
表2 所有样品指标成分的含量Table 2 Statistics of content determination values of index components of all samples
本研究共收集9批数据,共计103个样品。其中93个样本用于MIR定量模型的建立,该部分样本以3∶1比例进行校正集与预测集的划分,校正集样本70个,预测集样本23个,剩余10个样作为外部验证集。
MIR不仅能反应样本的化学组成与浓度,同时也受样本的黏度、粒度、表面纹理、密度等物理性质[11]及杂散光、探头的材质、光的散射的影响。因此,为了建立价位准确的定量模型,应该用适当的光谱预处理方法来消除背景噪音及特定的物理因素的干扰,提高谱图与化学成分之间的相关性。常用的预处理方法有多元散射校正(multiplicative scatter correction,MSC)、标准正态变量变换(standard normal variate transformation,SNV)、Savitzky-Golay平滑(Savitzky-Golay smoothing,S-G平滑)、归一化、基线校正、光谱转换(spectroscopic transformation)、分位数归一化(quantile normalization)等。
为了降低噪声、提高信噪比,改善光谱数据,本实验选择上述光谱预处理方法对7种指标成分的光谱进行预处理,然后结合偏最小二乘法建立这7种指标成分的定量模型。根据模型评价指标优选光谱预处理方法,以预测相对偏差(relative standard error of prediction,RSEP)为主要评价指标,RSEP值越小越好,决定系数R2c与R2p越大越好,校正集误差均方根(root mean square error of calibration,RMSEC)与交叉验证集误差均方根(root mean square error of cross validation,RMSECV)越小越好。光谱预处理结果见表3。
表3 不同预处理方法的模型性能参数Table 3 Model performance parameters of different spectral pretreatment methods
续表3
从分析结果看,新绿原酸、绿原酸、隐绿原酸、异绿原酸A、异绿原酸B、异绿原酸C和断氧化马钱子苷分别以基线校正、无预处理、分位数归一化、无预处理、无预处理、无预处理、光谱转换进行光谱预处理时,RSEP值最小,R2c与R2p值较大,RMSEC与RMSECV值较小,因此采用上述方法进行光谱预处理。
选择最佳的光谱波段,是保证模型稳健、准确的关键,它可以剔除光谱数据中无用的信息,能够有效提高模型的准确性和有效性。SiPLS法主要用于偏最小二乘建模的波段筛选。将相关性较大的几个波段进行组合,以组合模型的RMSEC值作为判断模型精度的标准,得到最佳组合波段区间。其优点缩小了波段范围,减小了波段优选的工作量,避免中红外建模过程中波段筛选的盲目性。本实验使用SiPLS法选择波段区间。将整个光谱等分为20个等宽的子区间。最大潜变量因子20,组合数3。以RMSEC值大小作为选择最佳检测波段的标准,其中RMSEC值越小,意味所选波段最佳。光谱筛选结果见图3。
图3 光谱波段筛选结果Fig.3 Screening results of spectral bands
对于金青醇沉7种指标成分特征波段选择结果如下:新绿原酸组合区间为[13,16,19],即最佳波段区间为835~725、1224~1099、1598~1377 cm−1;绿原酸组合区间为[1,8,12],即最佳波段区间为3100~2975、2223~2098、1723~1599 cm−1;隐绿原酸组合区间为[8,15,18],即最佳波段区间为2223~2098、1348~1224、974~849 cm−1;异绿原酸A组合区间为[1,7,12],即最佳波段区间为3100~2975、2347~2223、1723~1599 cm−1;异绿原酸B组合区间为[15,16,19],即最佳波段区间为1348~1224、1224~1099、849~725 cm−1;异绿原酸C组合区间为[15,16,18],即最佳波段区间为1348~1224、1224~1099、973~849 cm−1;断氧化马钱子苷组合区间为[8,9,12],即最佳波段区间为2223~2098、2098~1973、1723~1599 cm−1。
7种指标成分的化学结构如图4所示,红外光谱的9个重要区段如表4所示,综合SiPLS筛选结果分析可知,新绿原酸和隐绿原酸的特征波段共有区段相似,它们的特征波段中都具有不饱和碳氢面外弯曲振动、C-O的伸缩振动及C-H、O-H的各种面内弯曲振动的光谱信息;绿原酸和异绿原酸A的特征波段共有区段相同,它们的光谱有效信息主要来自于不饱和碳氢、C=O、C=C的伸缩震动。异绿原酸B和异绿原酸C的特征波段共有区段相同,它们的光谱有效信息主要来自于不饱和碳氢面外弯曲振动、C-O的伸缩振动及C-H、O-H的各种面内弯曲振动。断氧化马钱子苷的光谱有效信息主要来自于C=O、C=C的伸缩震动。上述筛选结果说明,SiPLS法识别的指标成分的光谱信息具有代表性,是MIR定量模型建立过程的一种有效方法,筛选的特征波段与指标成分化学结构的官能团具有高度相关性。
图4 7种指标成分的化学结构Fig.4 Chemical structures of seven indicator components
表4 红外光谱的9个重要区段Table 4 Nine important segments of infrared spectrum
通过SiPLS法找到新绿原酸、绿原酸、隐绿原酸、异绿原酸A、异绿原酸B、异绿原酸C和断氧化马钱子苷这7种成分的特征波段,依据这7种成分的特征波段结合偏最小二乘法建立中红外的定量模型,7种指标成分建模结果表5所示。
表5 7种指标成分的模型性能参数Table 5 Model performance parameters of seven index components
从模型的预测结果可以看出,新绿原酸、绿原酸、隐绿原酸、异绿原酸A、异绿原酸B、异绿原酸C和断氧化马钱子苷的模型预测误差均小于10%。特征波段所建立的定量模型对热毒宁注射液金青醇沉阶段新绿原酸、绿原酸、隐绿原酸、异绿原酸A、异绿原酸B、异绿原酸C和断氧化马钱子苷的预测均有较好的效果。
模型预测的准确性需用外部验证集样本来验证。根据一测多评法所测各指标成分的实测值与样本预测值,计算相对误差。新绿原酸、绿原酸、隐绿原酸、异绿原酸A、异绿原酸B、异绿原酸C和断氧化马钱子苷模型预测值与样本实测值的绝对误差及相对误差见表6,结果显示这7种指标成分的平均相对误差均小于10%。
表6 验证集样本预测值与实测值的对比Table 6 Comparison of prediction values and measured values of model validation samples
本研究以热毒宁注射液醇沉过程中的新绿原酸、绿原酸、隐绿原酸、异绿原酸A、异绿原酸B、异绿原酸C和断氧化马钱子苷共7个成分为考察对象,采用SiPLS法筛选MIR,得到特征波段,并基于此建立了中红外定量模型。结果显示,所建立的中红外监测方法操作简便、快速、准确。
醇沉过程是中药生产过程的纯化除杂方法,目前我们对于醇沉工艺过程的认识不太深入,对于过程中各工艺参数对质控指标的影响的理解较为薄弱,采用常规技术难以理解过程工艺参数的波动对醇沉上清液质量的影响,造成醇沉上清液批次间的质量波动,存在质量控制风险。MIR技术可很好适应中药醇沉机理和混合体系工况复杂的情况,能实现醇沉过程物料的快速检测,为热毒宁注射液醇沉工序在线监控奠定基础,也为中药醇沉过程实现在线检测提供技术支持,拓展了中药生产在线质量控制手段。MIR技术应用于实际生产时,生产过程模型的稳定性和传递性,是应重点关注与维护的地方。后期需定期更新用于模型建立的样本集,结合化学计量学算法,不断提高该模型的稳健性。
利益冲突所有作者均声明不存在利益冲突