赵林松, 江美芳, 王丹丹, 韦亚芳, 高 崎*
(1.上海中医药大学中药学院,上海 201203;2.上海上药杏灵科技药业股份有限公司,上海 201703)
银杏酮酯为我国自主研发的一种新型银杏叶提取物,是银杏叶主要有效成分(银杏内酯和银杏黄酮)高度富集的提取物,具有扩张冠状动脉、抑制血小板聚集的作用,主要用于治疗血瘀诱发的胸痹及血瘀引起的眩晕,还对冠心病、心绞痛有一定疗效[1]。在工业生产中,需要利用柱层析技术来富集银杏叶提取液中药效成分,同时去除杂质和致敏成分(银杏酸)[2],这也是关键工段。
目前,药品质量控制仅依赖于对成品的检验,往往忽视了生产过程中有效成分的变化情况,但传统检测技术一般需要复杂的样品处理,并且耗时较长,难以满足洗脱过程的动态检测[3-4]。同时,在工厂中判断洗脱的结束主要来自工人主观经验,没有科学的数据支持,造成产品均一性较差、资源浪费等问题。
近红外光谱具有无需样品预处理、无损耗、检测速度快等特点,已作为一种成熟的快速分析技术广泛应用于食品、材料等领域[5-8]。因此,本实验采用该技术构建银杏酮酯生产工艺洗脱工段大孔树脂的洗脱1过程和聚酰胺树脂的洗脱2过程(图1)中总萜类内酯定量独立模型,并且在此基础上建立了这2个工段的通用模型,以期实现整体洗脱工段总萜类内酯的快速定量分析,提升检测效率[9],为银杏酮酯洗脱过程提供快速无损的检测方法,同时为洗脱终点判定提供数据支持,从而实现生产过程质量控制,保证产品质量[10]。
MPA-II近红外光谱仪(德国布鲁克光谱仪器公司),Waters Xevo G2-XS Q-TOF·ESI 液质联用仪(美国Waters公司);OPUS7.8、MATLAB R2017a化学计量学软件;Oringin2018绘图软件。洗脱液收集自上海上药杏灵科技药业股份有限公司提取车间的大孔树脂柱和聚酰胺柱,取样方式为洗脱开始前15 min每隔3 min取样1次,15 min后至洗脱60 min每隔5 min取样1次,最后每隔10 min取样1次直至洗脱结束,得7批大孔树脂柱洗脱1,批号分别为201012、201022、201104、201105、201118、201119、201128,共132份样品;7批聚酰胺柱洗脱2,批号分别为201012、201022、201104、201105、201118、201119、201128,共124份样品。
2.1 近红外光谱 空白背景为空气;分辨率8 cm-1;样品池为2 mm石英比色皿;每个样品图谱扫描32次;波数12 000~4 000 cm-1,原始光谱见图2。
2.2 UPLC-MS法测定总萜类内酯含量
2.2.1 分析条件
2.2.1.1 色谱 Waters Acquity UPLC/Xevo G2-XS Q-TOF超高效液相色谱质谱联用仪;Waters Acquity UPLC BEH C181.7 μm色谱柱 (100 mm×2.1 mm);流动相水(含0.1%甲酸)(A)-甲醇(B),梯度洗脱(0~5 min,10%~25%B;5~17 min,25%B;17~22 min,25%~35%B;22~35 min,35%~40%B;35~40 min,40%~65%B;40~50 min,65%~85%B;50~60 min,85%~98%B);体积流量0.2 mL/min;柱温45 ℃;进样量1 μL。
2.2.1.2 质谱 负离子模式,Sensitivity模式(分辨率30 000);毛细管电压-2.5 kV;样品锥孔电压40 V;源偏移电压80 V;源温120 ℃;脱溶剂温度450 ℃;锥孔气体积流量50 L/h;脱溶剂气体积流量800 L/h;雾化气压力6.0 bar(1 bar=100 kPa);m/z50~100 0;校正溶液0.5 mmol/L甲酸钠溶液,体积流量20 μL/min;实时校正lock spray为1 ng/μL亮氨酸脑啡肽溶液,m/z554.261 5。
2.2.2 对照品溶液制备 精密称取银杏内酯A、银杏内酯B、银杏内酯C、白果内酯对照品适量,二甲基亚砜制成各成分质量浓度约为1 mg/mL的溶液,50%乙醇稀释,即得。
2.2.3 供试品溶液制备 将每个批次收集的0~10、10~30、30 min至洗脱结束的样品分别用50%的乙醇稀释500、250、50倍,即得。
2.2.4 线性关系考察 精密吸取“2.2.2”项下对照品溶液适量,50%乙醇稀释成系列质量浓度,在“2.2.1”项条件下各进样1 μL测定。以对照品质量浓度为横坐标(X),峰面积为纵坐标 (Y)进行回归,结果见表1,可知各成分在各自范围内线性关系良好。
2.2.5 精密度试验 取对照品溶液适量,在“2.2.1”项条件下进样测定6次,测得各成分峰面积RSD均小于3%,表明仪器精密度良好。
2.2.6 重复性试验 取洗脱液适量,按“2.2.3”项下方法平行制备6份供试品溶液,在“2.2.1”项条件下进样测定,测得各成分峰面积RSD均小于3%,表明该方法重复性良好。
表1 各成分线性关系
2.2.7 稳定性试验 取洗脱液适量,按“2.2.3”项下方法平行制备6份供试品溶液,于0、3、6、9、12、24 h在“2.2.1”项条件下进样测定,测得各成分峰面积RSD均小于3%,表明溶液在24 h内稳定性良好。
2.2.8 加样回收率试验 精密吸取各成分含量已知的洗脱液1 ml,加入低、中、高质量浓度对照品溶液,按“2.2.3”项下方法制备供试品溶液,在“2.2.1”项条件下进样测定,计算回收率,结果见表2。
表2 各成分加样回收率试验结果(n=3)
2.3 近红外光谱模型建立 采用偏最小二乘回归(PLSR),通过留一交互验证法对光谱数据和实测化学值进行拟合建模。基于间隔偏最小二乘法(iPLS)、协同间隔偏最小二乘(SiPLS)、竞争自适应加权采样法(CARS)等变量筛选方法选择波段变量,以交互验证误差均方根(RMSECV)、相关系数(R)为评价指标确定最佳波段选择方法,以性能偏差比(RPD)、验证集预测误差均方根(RMSEP)、预测相对偏差(RSEP)为评价指标确定最佳光谱预处理方法。其中,R越接近1,表示模型预测值与标准对照方法分析值之间的相关性越好;RPD越大,表明模型性能越好,其数值>3时表明模型具有较高的预测精度[11];RMSEP与样品化学值相关,其数值越小,结果越准确;RSEP表示验证集的预测值与真实值之间整体误差,其数值越小,模型预测的准确度越高,但上述参数不能单独作为参考,需综合应用来考察模型性能。在中药研究体系中,当RPD>3、RSEP<15%时,模型性能和准确度能满足实际应用[12]。
3.1 样品划分 采用Kennard-Stone选择方法,将2种样本以7∶3的比例划分为校正集和验证集,验证集作为独立的样本,仅用于模型验证;通用模型的校正集则为两种洗脱液校正集的总和,验证集为两种洗脱液的验证集总和,结果见表3。由此可知,各模型验证集浓度范围均在校正集浓度范围内。
表3 样品划分结果
3.2 特征变量筛选
3.2.1 iPLS法 iPLS法是一种波段区间选择方法。本实验将整个光谱等分成10个等宽子区间,每个子区间上进行PLS回归,找出最小的RMSECV对应区间,再以其为中心单向或双向消减(或扩充)波段变量,得到最佳单个子区间[13]。
3.2.2 SiPLS法 SiPLS是基于iPLS算法发展而来的波段选择方法,将全波段划分为若干个区间,将不同波段区间个数的任意组合。本实验将整个光谱等分成10个等宽的子区间并任意组合,通过增加与去掉子区域来寻找到R最大、RMSECV最小的波段区间组合,作为最佳波段变量[14]。
3.2.3 CARS法 CARS是一种利用回归系数进行变量筛选的方法,基于“适者生存”原则,剔除无关变量,减少共线变量的影响。本实验通过自适应加权采样技术筛选出PLS模型中回归系数绝对值大的波段点,去掉权重较小者,利用交互验证选出模型的RMSECV至最低的子集[15],筛选过程见图3。
3.2.4 波段筛选 表4显示,洗脱1、洗脱2、通用模型的最佳波段选择方法分别为iPLS、SiPLS、SiPLS。图4显示,上述3种模型分别在6 100~5 772 cm-1,8 252~7 500、6 100~5 448 cm-1,9 400~7 500 cm-1波数处有最大R、RPD和最小的RMSECV。银杏内酯属于萜类化合物,在近红外光谱中最重要的吸收峰来自C-H和O-H,但洗脱液中溶剂主要为水和乙醇的混合物,故本实验波段避开了5 180、6 900 cm-1附近水(H2O)的干扰[16],主要来自6 020~5 550、8700~7 040 cm-1处的CH2、CH3倍频合频吸收,其中通用模型可最大程度保留有效波段区间,与成分结构之间具有较高的相关性,并且排除了近红外光谱冗余信息,尽量保留了有效变量。
表4 特征波段选择方法
3.3 光谱预处理 在波段筛选的基础上,本实验考察了二阶导数、减去1条直线、矢量归一化(SNV)、一阶导数及与多种预处理方法的联合应用,并以RMSEP、RPD、RSEP为参考值进行筛选,结果见表5。
表5 光谱预处理方法
由此可知,当洗脱1、洗脱2、通用模型的最佳光谱预处理方法分别为一阶导数结合减去1条直线、二阶导数、二阶导数时,各模型RPD、RMSEP、RSEP最理想。另外,经光谱预处理后波段所建立模型的性能和准确度都得到一定提升,可有效过滤近红外光谱中噪声信息,提高模型稳健性。
3.4 定量预测模型建立 模型见表6,预测值与实测值的相关性分析见图5。
表6 各模型参数
3.5 模型验证 将洗脱1、洗脱2、通用模型的实测值和预测值进行t检验,测得P值分别为0.867、0.943、0.823,表明两者之间无显著差异,并且三者R均大于0.95,RPD均大于3,RSEP均小于15%,表明其相关性良好,性能优异,准确性较高,可满足实际应用。洗脱1、2过程中总萜类内酯含量分别为0.021~2.952、0.084~4.102 mg/mL,表明上述2个过程中有一部分样本存在重叠,故通用模型具有更大的总萜内酯的浓度覆盖范围。
再计算通用模型中洗脱1、2验证集各自的RSEP,与独立模型进行比较,结果见表7。由此可知,在洗脱1过程中通用模型提高了预测准确度,而在洗脱2过程中预测准确度虽然略低,但整体上仍在可接受范围内。因此,基于相同成分的光谱变量所建立的通用模型能适用于2个洗脱过程,在增加样本量的同时扩大了模型应用范围,从而大幅度提高了模型对总萜类内酯的检测效率。
本实验收集银杏酮酯工业生产2个洗脱过程中的样品,采用LC-MS法检测洗脱液中萜类内酯含量,结合NIRs技术建立了洗脱1、洗脱2及2个过程的通用定量预测模型,发现三者均有较高的性能和准确性,能满足定量分析,可用于快速检测。
表7 独立模型与通用模型的比较
同时,2个独立的洗脱过程模型检测指标一致,但处于不同的过程,有一定差异,故通用模型扩大了建模样本的数量和浓度范围,增加了模型可靠性和鲁棒性,同时相比于洗脱1模型,它具有更好的性能和准确性;相比于独立模型,它可显著提高模型预测效率。
综上所述,本实验证明了通用模型在银杏内酯类成分洗脱过程定量分析中的可行性。今后,可通过模型传递将通用模型应用到近红外的在线设备上,同时在考察工厂产能的基础上确定洗脱终点的最佳范围,实现对洗脱过程的在线监控和自动化,最终达到中间品的快速放行和提升产品的均一性。