机器学习在调强放疗计划剂量验证中的作用

2023-03-06 10:09阎华伟张吉林志禧金献测韩策
温州医科大学学报 2023年2期
关键词:质量保证复杂度数值

阎华伟,张吉,林志禧,金献测,韩策

温州医科大学附属第一医院 放疗中心,浙江 温州 325015

先进的放射治疗技术,如调强放射治疗(intensity-modulated radiation therapy,IMRT)和容积调制弧形治疗(volumetric modulated arc therapy,VMAT)已有许多临床应用。然而,这些技术在计划和出束方面都非常复杂,必须在实施之前进行安全的保证[1]。基于患者特定的质量保证(quality assurance,QA)测量被用于确认剂量传递的准确性。该过程通常涉及使用伽马通过率(gamma pass rate,GPR)评估将计算的剂量分布与测量的剂量分布进行比较[2]。因此,针对调强计划的剂量验证是极其重要的环节。根据美国医学会物理学家协会(AAPM)TG218建议,对于该部分提出了相应的临床限值[3]。使用人工智能(artificial intelligence,AI)和机器学习(machine learning,ML)来帮助预测和进行决策已经在一系列学科中广泛应用,包括肿瘤放射治疗学和医学物理学,其中也有涉及到质量保证部分。因此,本研究拟提取VMAT放疗计划的复杂度参数,利用一种通用的机器学习方法,对3%/3 mm、3%/2 mm和2%/2 mm三种不同标准下的GPR分别进行数值跟分类预测。

1 资料和方法

1.1 一般资料 收集2019年3月至2020年8月在温州医科大学附属第一医院接受双弧VMAT治疗的141例患者,其中男56例(39.71%),女85例(60.28%),包括99例盆腔肿瘤患者(宫颈、子宫内膜、直肠、前列腺等部位)、42例头颈部肿瘤患者(鼻咽、口咽、喉咽等部位),分别占70.21%和29.79%。患者均采用仰卧位、热塑体模固定,CT模拟定位扫描层厚设定为3 mm。由肿瘤放射治疗副主任医师进行靶区及OAR勾画,盆腔患者的PTV处方剂量均为45 Gy/25次,1.8 Gy/次,头颈部的PTV处方剂量均为60 Gy/30次,2.0 Gy/次。所有计划均采用6 MV X射线束,Elekta Synergy直线加速器(瑞典Elekta公司),配备了80片多叶准直器(MLCi2TM,瑞典Elekta公司),由MONACO(Monaco 5.1.1,瑞典Elekta公司)治疗计划系统(treatment planning system,TPS)设计完成。优化过程中,剂量网格尺寸为3.0 mm,光滑度(smooth)设定为低。所有的VMAT调强放疗计划在主管医师审核通过后进行传统方式的模体验证。将3D二极管阵列的ArcCHECK(Model 1220)在直线加速器下模拟患者摆位,并调用调强治疗计划模拟患者治疗出束,然后采用SNC Patient(v.6.2.1,Sun Nuclear Corporation)软件进行双弧复合调强验证和分析。阈值设定为10%,计算3%/3 mm、3%/2 mm和2%/2 mm三种不同标准下的全局GPR。见表1。

表1 不同标准下的GPR测量值

1.2 实验设计 本研究设计路线见图1。

图1 研究设计路线图

1.3 特征提取 从放射TPS中导出放疗DICOM-RT文件中的信息,包括RTplan、RTStructure、RTDose、RTimage等,使用Matlab2016a(美国Mathwork公司)根据自己编写的软件代码进行读取和处理,从而得到13个调强放疗计划的复杂度参数,具体参考本课题组之前的研究结果[4],见表2。

表2 调强计划复杂度参数汇总

1.4 特征选择及模型建立 将患者病种、模体剂量验证不同条件下的GPR、调强计划的复杂度参数等信息进行一一对应并整合,在RStudio中进行进一步处理。数据按照7∶3的比例进行随机划分,70%作为模型的训练集,利用该部分对数据集建模,并调整权重参数;剩下的30%作为测试集,利用该部分来评估最终模型的泛化能力。本研究对于GPR预测分为数值预测跟分类预测两部分。在GPR数值预测方面,将计划复杂度参数与GPR之间进行Pearson相关分析;若P<0.05,分别筛选出3%/3 mm、3%/2 mm、2%/2 m三个标准下潜在的有意义的特征。在GPR分类预测方面,根据TG218分别设定3%/3 mm、3%/2 mm、2%/2 mm标准下95%、95%和90%作为临床界值,以判定调强计划是否可以执行,从而分为“通过”“失败”两类,采用LASSO以帮助选择不同条件下的关键特征。本研究构建基于支持向量机(support vector machines,SVM)的GPR预测模型,分别进行数值预测跟二元分类预测。在数值预测中,SVM的类型设定为“C-cllassification”,核函数设定为“radial”;在分类变量中,类型设定为“espregression”,核函数设定为“radial”。

1.5 模型评估 使用各种指标对模型的准确性进行评估。针对GPR数值准确性,平均值、标准差、均方根误差、平均绝对误差作为评价指标;对于GPR分类预测准确性,绘制受试者工作特征(receiver operating characteristic,ROC)曲线,使用曲线下面积(area under curve,AUC)进行评价。

1.6 统计学处理方法 采用Matlab 2016a(美国Mathwork公司)读取和处理计划复杂性特征;使用R软件(version 3.0.1,MathSoft)执行以下过程:通过使用“caret”包来实现Pearson相关分析作为GPR数值的特征筛选;通过使用“glmnet”包来实现LASSO回归作为GPR分类的特征筛选;分别使用“e1071”包和“pROC”包支持向量机模型和ROC曲线。P<0.05为差异有统计学意义。

2 结果

2.1 GPR数值预测 在3%/3 mm、3%/2 mm、2%/2 mm条件下,模型分别筛选出11、11、11个关键参数。不同标准下,伴随着分析条件越严格,预测的偏差越大,在训练集和测试集中均得到体现。见表3。

表3 不同标准下训练集与测试集中的GPR数值预测(%)

2.2 GPR分类预测 在3%/3 mm、3%/2 mm、2%/2 mm条件下,模型分别筛选出4、6、3个关键参数。在上述的条件下,训练集中的AUC分别0.82、0.91、0.79;测试集结果分别0.79、0.78、0.77。见表4和图2。

图2 不同条件下训练集和测试集的ROC曲线分析结果

表4 不同标准下训练集与测试集中的GPR分类预测

3 讨论

现阶段,针对患者的调强放疗计划的剂量验证需要专门在直线加速器下,在每个计划执行前,使用体模或其他验证设备对其模拟真实情况进行测量并分析。考虑到该过程质量保证的重要性及必要性,并给临床带来了沉重的工作负担。因此,如何更加方便、高效地完成是目前亟待解决的问题。一些研究已经证实,在质量保证中,调强计划的复杂性和GPR之间存在一定的关系[5-7]。已有研究表明,随着剂量分布适形度的增加,调强放疗计划的复杂度也随之增加,对计划的准确实施产生一定的影响[8-9]。

近几年,机器学习已逐渐被广泛应用于肿瘤调强放疗的质量保证,预测GPR的准确性已经发展成为一种比传统更有效的质量保证方法[10-11]。在本研究中,我们收集了盆腔、头颈部等多部位的调强放疗计划,并提取复杂性参数作为构建模型的输入端,通过机器学习-支持向量机的方法分别预测3%/3 mm、3%/2 mm和2%/2 mm三种不同条件下的GPR的数值与分类的准确性。

在GPR数值预测方面,构建支持向量机的机器学习方法模型显示,3%/3 mm条件下的测试集中预测误差为0.49%±2.19%,这与前人的一些研究成果相近。如ONO等[12]应用回归树分析(regression tree analysis,RTA)、多元线性回归分析和神经网络(neural networks,NNs)3种机器学习模型对GPR的预测误差分别为0.6%±2.4%、0.5%±2.4%和0.2%±2.1%。另外,3%/3 mm、3%/2 mm和2%/2 mm三种标准下,测试集中的平均绝对误差分别为1.56%、2.68%、3.67%,这与LI等[13]对VMAT计划采用泊松套索回归(poisson lasso,PL)模型验证集中的平均绝对误差相近,符合随着条件越严苛,预测偏差越大的结果。

对于GPR分类预测方面,三个标准下的,测试集的AUC结果都接近0.8。其中,在3%/2 mm条件下,测试集的AUC结果分别0.79,敏感度、特异度分别为1.00 和0.57。LI等[13]研究的验证集结果显示,PL模型的特异度和敏感度分别为1.00和0.33。

已有研究证明,2%/2 mm标准比3%/3 mm标准更能敏感地检测出临床相关误差[14]。因此,构建适用多条件下的GPR的预测模型是非常有必要的。此外,美国影像与放射肿瘤学中心(imaging and radiation oncology core,IROC)一项研究表明,治疗计划的复杂性不能预测来自多个机构的IROC拟人头颈部模体认证的效果[15]。这表明使用计划复杂性特征可能存在不稳定,结合其他特征或者选择其他更加稳定的特征进行预测,也是我们以后研究的方向。

综上所述,这项研究证明基于机器学习对调强放疗计划进行剂量验证具有一定的临床应用价值,为质量保证提供了一种新思路与新方法,可以提高直线加速器跟物理师的工作效率,缩短患者等待放疗的时间,更为肿瘤患者得到合理的综合治疗提供支持。

猜你喜欢
质量保证复杂度数值
田湾核电站运行阶段质量保证分级管理
焊接技能评定过程中的质量保证要求
数值大小比较“招招鲜”
关于如何做好水质环境监测的质量保证研究
一种低复杂度的惯性/GNSS矢量深组合方法
求图上广探树的时间复杂度
质量保证监查在AP1000依托项目中的应用
基于Fluent的GTAW数值模拟
某雷达导51 头中心控制软件圈复杂度分析与改进
基于MATLAB在流体力学中的数值分析