蒋程 夏仲尼 朱立 郑造乾 徐金波 李功华
随着人类生存环境的变化和生活习惯的改变,肿瘤的发病率逐年上升,严重威胁人类健康,并已成为当前常见的死亡原因之一。据统计,2010年全球肿瘤新发病例1 300万,死亡病例760万;预计到2030年,全球肿瘤新发病例将超过2 600万,死亡病例将跃至1 700万[1]。抗肿瘤药是治疗肿瘤的重要手段之一,其合理使用是保证化疗效果、延长患者生存期和提高患者生活质量的重要前提。因此,建立一种科学、高效的方法监测医院抗肿瘤药使用,为临床合理使用抗肿瘤药提供指导非常重要。然而,医院抗肿瘤药的品种较多,且已报道的文献多采用传统的单变量数据分析方法逐一分析不同抗肿瘤药在不同时间的用量[2-4],监测效率较低,故在传统方法的基础上,探索医院抗肿瘤药使用的多变量监测方法具有重要意义。主成分分析(principal component analysis,PCA)是一种常用的多变量数据分析算法,可从庞大的数据矩阵中提取重要信息[5],并已成功应用于疾病诊断[6]、药品质量控制[7-8]等医药数据分析。然而目前,将PCA算法应用于医院抗肿瘤药监测仍罕见文献报道。本研究以我院住院患者2010至2015年共24个季度抗肿瘤药的用量为例,通过建立PCA模型,探索医院抗肿瘤药使用的多变量监测方法,以期更加系统、全面地了解我院抗肿瘤药的临床应用情况和趋势,为医院抗肿瘤药监测提供新的方法。
1.1 数据获取 从医院病区药房系统提取2010至2015年共24个季度我院住院患者抗肿瘤药的用量数据(批准文号以“国药准字Z”开头的抗肿瘤中成药未纳入本次研究)。将同一品种同一规格抗肿瘤药的用量相加,计算该品种在此规格下的总用量(部分抗肿瘤药在某些季度未使用,将其用量值设为0)。剔除使用时间不超过2个季度的临时性用药,得到反映不同季度抗肿瘤药用量的多变量数据矩阵X(I×J,I代表季度数,J代表抗肿瘤药的品种数)。
1.2 数据分析 本研究采用PCA算法建立抗肿瘤药使用的多变量监测模型。首先,将矩阵X经中心化预处理后建立PCA模型。然后,通过构建主成分得分图,结合主成分载荷图,对抗肿瘤药的使用进行整体评价,筛选变化较显著的品种。若某一季度的得分统计值超出了Hotelling T295%控制限,通过构建得分贡献图进一步分析得分异常的原因。最后,采用传统的单变量数据分析方法逐一分析典型抗肿瘤药在不同季度的用量,对PCA结果进行验证。数据处理采用SIMCA-P+软件(版本12.0,瑞典Umetrics AB公司)。
2.1 抗肿瘤药使用整体评价 将同一品种同一规格的抗肿瘤药合并,并剔除使用时间不超过2个季度的临时性用药后,2010至2015年期间我院住院患者使用的抗肿瘤药共70种,包括细胞毒类52种,抗肿瘤激素11种,靶向治疗药物7种。经整理得到反映不同季度抗肿瘤药用量的多变量数据矩阵X(24×70)。对矩阵X进行中心化预处理后建立PCA模型。以主成分1的得分为横坐标,主成分2的得分为纵坐标,构建抗肿瘤药用量的主成分得分图,结果显示2010至2015年不同季度抗肿瘤药的主成分1得分整体呈增加趋势;样本23的主成分得分超出了Hotelling T295%控制限,见图1。
图1 抗肿瘤药用量的主成分得分图(“1”~“24”依次代表2010至2015年期间的24个季度)
2.2 筛选变化较显著的品种 根据图1,2010至2015年不同季度抗肿瘤药用量的主成分1得分整体呈增加趋势。以主成分1的载荷为横坐标,主成分2的载荷为纵坐标,构建主成分载荷图,分析得分变化的原因,筛选变化较显著的品种。抗肿瘤药用量的主成分载荷图见图2。如图所示,多数变量在主成分1上的载荷为正,表明多种抗肿瘤药的用量与主成分1的得分呈正相关,即其用量整体呈现出增长的趋势。其中,变量24、53、25、58等在主成分1上载荷的正值相对较大,表明与变量24、53、25、58相对应的卡培他滨片0.5g、甲地孕酮分散片160mg、替吉奥胶囊20mg、比卡鲁胺片50mg用量增长较显著。
图2 抗肿瘤药用量的主成分载荷图(每个点分别代表一个变量)
采用传统的单变量数据分析方法逐一分析4种典型抗肿瘤药的用量,对PCA结果进行验证。卡培他滨片0.5g(变量 24)、甲地孕酮分散片 160mg(变量 53)、替吉奥胶囊 20mg(变量 25)、比卡鲁胺片 50mg(变量 58)在不同季度的用量见图3。如图所示,2010至2015年期间卡培他滨片0.5g、甲地孕酮分散片160mg、替吉奥胶囊20mg、比卡鲁胺片50mg的用量整体呈增长趋势,与PCA结果一致。以上分析表明,采用PCA算法能有效分析抗肿瘤药用量的整体变化趋势,筛选出变化较显著的品种。
图3 典型抗肿瘤药在不同季度的用量(a:卡培他滨片0.5g,b:甲地孕酮分散片160mg,c:替吉奥胶囊20mg,d:比卡鲁胺片50mg)
2.3 分析得分异常的原因 根据图1,样本23的主成分得分超出了Hotelling T295%控制限,表明2015年第3季度抗肿瘤药的用量存在异常。以不同抗肿瘤药为横坐标,对应的得分贡献值为纵坐标,构建得分贡献图,分析得分异常的原因,见图4。如图所示,变量25、53、58、26等的贡献正值相对较大,表明与变量25、53、58、26相对应的替吉奥胶囊20mg、甲地孕酮分散片160mg、比卡鲁胺片50mg、羟基脲片0.5g在2015年第3季度的用量偏高是导致该季度得分异常的主要原因。另外,虽然变量24在主成分1上载荷的正值最大,但其在图4中的得分贡献值并非最大,表明卡培他滨片0.5g的用量虽然整体呈增长趋势,但在2015年第3季度有所回落。
图4 2015年第3季度抗肿瘤药用量的得分贡献图
以替吉奥胶囊20mg(变量25)、甲地孕酮分散片160mg(变量 53)、比卡鲁胺片 50mg(变量 58)、羟基脲片0.5g(变量 26)、卡培他滨片 0.5g(变量 24)为例,分析 5种抗肿瘤药在2015年第3季度的用量,验证PCA结果。替吉奥胶囊20mg、甲地孕酮分散片160mg、比卡鲁胺片50mg、卡培他滨片0.5g的用量见图3,羟基脲片0.5g的用量见图5。如图所示,2015年第3季度替吉奥胶囊20mg、甲地孕酮分散片160mg、比卡鲁胺片50mg、羟基脲片0.5g的用量与其它季度相比整体较高,卡培他滨片0.5g的用量较前几个相邻季度有所降低,与PCA结果一致。以上分析表明,采用PCA算法能有效监测不同季度抗肿瘤药的用量,筛选出用量异常的季度,并分析得分异常的原因。
图5 羟基脲片0.5g的用量
经统计,2010至2015年期间我院肿瘤患者住院人数每年以超过10%的速度逐年增加,至2015年已达到2010年的近3倍。随着住院人数的增加,我院多种抗肿瘤药的用量呈现出增长的趋势,其中卡培他滨片0.5g、甲地孕酮分散片160mg、替吉奥胶囊20mg、比卡鲁胺片50mg用量增长较显著。
本研究以我院住院患者2010至2015年共24个季度70种抗肿瘤药的用量为研究对象,通过建立PCA模型探索医院抗肿瘤药使用监测的新方法。结果表明,采用PCA算法能更加科学、高效的监测医院抗肿瘤药的使用,无需再对70种药物逐一进行分析,可为医院抗肿瘤药监测提供新的方法,具体应用价值在于:(1)通过建立PCA模型,对不同季度抗肿瘤药的用量进行降维处理和可视化研究,使复杂的数据简单化。(2)通过构建主成分得分图,监测不同季度抗肿瘤药用量的整体变化趋势,筛选出用量异常的季度。(3)通过构建主成分载荷图,具体分析不同品种抗肿瘤药的用量,筛选出变化较显著的品种。(4)对得分统计值超出控制限的季度,通过构建得分贡献图,分析该季度得分异常的主要原因。本研究结果可为医院抗肿瘤药实时监测系统的建立提供理论基础。