王明理,顾慧宽,胡江,高兴旺
1.中山大学肿瘤防治中心放疗科/华南肿瘤学国家重点实验室/肿瘤医学协同创新中心,广东广州510060;2.广东省人民医院/广东省医学科学院放疗科,广东广州510060
国际癌症研究机构调查显示宫颈癌在女性罹患恶性肿瘤中排名第4,2018年,全世界约有57万例宫颈癌新病例和约31.1万例死亡病例,严重威胁女性生命健康[1]。放射治疗是宫颈癌主要治疗手段之一,其中腔内近距离治疗结合体外照射是目前使用最普遍的放疗方法。随着技术的发展,容积旋转调强技术(Volumetric Modulated Arc Therapy,VMAT)由于具备固定野调强的剂量学优点,且可以大幅缩短治疗时间,提高治疗效率,已在宫颈癌体外照射中得到广泛应用[2-4]。但是,VMAT放疗计划设计较为复杂,技术要求高,难度较大。计划物理师需要依据经验,根据患者的解剖结构、放疗剂量处方和技术设备条件设立优化初始目标函数,并不断调整、反复优化以期获取满意的剂量分布。优化参数选择的“过松”或“过严”都不利于生成理想的剂量分布。因此,计划的质量在很大程度上依赖于计划设计者的经验水平以及设计治疗计划所花费的时间[5-6]。有研究显示,即便合格物理师设计的VMAT计划,亦有相当比例属于次优计划,会导致靶区周围的正常组织受到不同程度的过量照射[7-9]。而对无任何VMAT计划设计经验的见习物理师,如何设置合理的初始优化参数尤为重要,是物理师培训中的重点和难点。
本研究利用剂量体积直方图(Dose-Volume Histograms,DVH)预测模型,探索人工智能在物理师VMAT计划培训中应用的可行性和应用效果,为实习物理师计划设计培训提供一种高效的方法。
选取中山大学肿瘤防治中心2019年收治的经病理及影像学检查确诊为宫颈癌的20例患者用于见习物理师VMAT计划培训。患者年龄27~85岁,中位年龄53岁。临床分期按国际妇产科协会(International Federation of Gynecology and Obstetrics,FIGO)2018分期IB期1例,ⅡA期1例,ⅡB期4例,ⅢA期1例,ⅢB期7例,ⅣB期1例及术后5例。
所有入组患者均采用仰卧位,躯干以真空袋固定,使用大孔径螺旋CT进行定位扫描,扫描电压为140 kV,扫描层厚及层间距为3 mm,扫描范围为胸10椎体下缘至坐骨结节下缘4 cm。
根据国际组织相关指南和中山大学肿瘤防治中心有关放疗靶区勾画的规定,由主管医师在平扫CT影像上逐层勾画出肿瘤靶区和周围危及器官的轮廓。其中,大体肿瘤靶区(Gross Tumor Volume,GTV)一般包括肿瘤的原发灶、区域淋巴结、远处转移淋巴结等;临床靶区(Clinical Target Volume,CTV)一般包括膀胱后壁前方1 cm及直肠前壁1/3~1/2。计划靶区(Planning Target Volume,PTV)则分别基于GTV外扩5 mm形成PGTV,CTV前向外扩10 mm,其余方向外扩6 mm形成PCTV。邻近危及器官主要包括膀胱、直肠、双肾、两侧股骨头和脊髓。
本研究引入中山大学肿瘤防治中心宫颈癌DVH预测模型加强学员培训。该模型建立选用了120 例宫颈癌患者优质VMAT 计划数据。对从120 例优质VMAT计划中提取的肿瘤与危及器官结构、位置信息和剂量信息分别进行主成分分析去冗余后,采用逐步回归的方法,建立宫颈癌危及器官DVH预测模型,并通过模型精炼[10],进一步提升模型的预测能力。前期研究显示,该模型可以较好辅助物理师完成临床VMAT计划设计,提高总体计划设计水平[11]。
研究选用20 例宫颈癌病例,对3 名不同学历、不同工作经验的见习物理师进行两个阶段培训。第一阶段15 例病例用于基础训练,第二阶段5 例病例用于改进提高。所有病例均要求学员采用两种方法进行VMAT 计划设计:(1)人工计划(Manual Plan,MP):采用传统计划方法,人工设置各种优化函数,并用试错法不断调整参数以获取满意的剂量分布;(2)基于DVH 预测模型引导的自动计划(Knowledge-Based Plan, KBP):使用DVH 预测模型,根据靶区和危及器官之间的解剖关系,自动生成个体化初始优化函数,引导计划实现自动设计。在使用KBP 技术设计计划时,允许学员对KBP结果进行人工调整。
为便于比较,所有VMAT 计划均使用瓦里安加速器6 MV 射线,按照统一布野进行设计。两个全弧设置为:第一个弧机架逆时针方向旋转360°(179°~181°),准直器角度固定为15°;第二个弧机架顺时针方向旋转360°(181°~179°),准直器角度固定为345°。VMAT 处方剂量分别为PGTV:60 Gy/25 次,PCTV:45 Gy/25 次。靶区剂量学目标和危及器官限量参照相关国际指南和中山大学肿瘤防治中心规范[11-12]。
研究选取13 项基础剂量学指标作为培训评判标准。这些剂量指标涵盖了VMAT 计划设计对肿瘤靶区和周围危及器官的主要剂量学要求。包括靶区6项,分别为PGTV、PCTV的感兴趣的百分剂量体积及冷点(Dmin);危及器官7 项,分别为膀胱V45(%)、直肠V45(%)、双肾V18(%)、两侧股骨头V35(%)和脊髓Dmax(Gy)。其中,Vx(%)为器官受到某一剂量x(Gy)照射的百分体积,Dmin(Gy)为器官所受最小剂量,Dmax(Gy)为器官所受最大剂量。考虑到学员初学的实际情况,我们参照入组培训计划的临床剂量学要求,对上述评价指标的参考阈值适当放宽,具体数值详见表1。每个计划必须满足12 项(或以上)剂量学指标要求才被评定为培训合格计划。
表1 培训计划剂量学评价指标及其参考阈值Tab.1 Dosimetric indexes and their referencethresholds for training plan quality evaluation
研究中统计了3名学员不同阶段两种计划(MP和KBP)的相关剂量学数据,评估了学员计划的合格率;同时采用统计方法对两阶段、两种方法计划数据进行比较,以分析DVH预测模型在物理师VMAT计划培训中应用的可行性和使用效果。
使用SPSS 22.0软件(IBM)进行统计学分析。采用Shapiro-Wilk法对所有数据组进行正态分布检验,对相关样本,符合正态分布的数据采用配对t检验,对不符合正态分布的数据行非参数检验中的Wilcoxon秩和检验;对独立样本,符合正态分布的数据采用独立样本t检验,对不符合正态分布的数据行非参数检验中的Mann-WhitneyU检验。P<0.05为差异有统计学意义。
3名见习物理师第一阶段15例宫颈癌病例人工计划(MP-1)和自动计划(KBP-1)剂量学统计结果参见表2。3名学员人工计划质量普遍较差,合格率分别只有0.0%、33.3%和33.3%(表3)。主要差距体现在靶区高剂量覆盖不足,如学员A第一阶段MP-1计划PGTV处方剂量覆盖V60平均只有95.2%(图1);某些正常组织、器官(如直肠、膀胱)取舍不合理。与人工计划相比,自动计划在明显提高PGTV靶区V60覆盖(P<0.001),改善高剂量控制(V66)(P=0.027)的情况下,显著降低膀胱(P<0.001)、直肠(P<0.001)、左右肾(P=0.001和P<0.001)以及左右侧股骨头(P<0.001和P<0.001)等绝大部分正常组织器官的受照剂量。计划合格率亦有所提高,见表3。
图1 3名见习物理师两个培训阶段人工计划(MP)与自动计划(KBP)肿瘤靶区和主要危及器官剂量学对比图Fig.1 Dosimetric comparisons of tumor target area and some key organs-at-risk between manual plans and knowledge-based plans designed by 3 trainee physicists in 2 stages
与第一阶段相比,3名学员第二阶段人工计划(MP-2)较第一阶段MP-1有显著提高。PGTV高剂量覆盖体积V60由(97.96±2.91)%提高到(99.29±0.74)%,重要组织受照剂量如膀胱V45、直肠V45以及脊髓Dmax都有明显降低。3名学员第二阶段人工计划合格率分别为60.0%、80.0%和60.0%,亦较第一阶段人工计划合格率有大幅度提高。与第一阶段情况类似,第二阶段自动计划KBP-2质量仍然优于人工计划MP-2(表2)。在人工智能技术辅助下,3名学员自动计划KBP-2合格率均达到100.0%(表3),且MP-2计划在提高靶区PGTV、PCTV最小剂量、保护正常组织、降低膀胱和直肠剂量方面较MP-1也更具优势(表2)。
表2 3位见习物理师两个阶段人工计划(MP)与自动计划(KBP)剂量学比较Tab.2 Comparison of dosimetric results between manual plans and knowledge-based plans designed by 3 trainee physicists in 2 stages
表3 3名见习物理师两个阶段人工计划与自动计划合格率情况表[例(%)]Tab.3 Passing rates of two kinds of VMAT plans designed by 3 trainee physicists in 2 stages[cases(%)]
3名不同学历、不同工作经验见习物理师两个阶段培训人工计划和自动计划靶区和主要器官剂量学比较见图1。可以看到,3名学员间人工计划质量差异较大,尤以第一阶段最为明显。自动计划方法减小3人间计划质量差异,除第一阶段学员A由于布野错误导致其自动计划与B、C略有差异外,第一阶段B和C的自动计划,以及A改正错误后第二阶段A、B、C的自动计划在靶区与主要器官剂量学指标上均具有较高一致性。
VMAT计划设计对物理师技术水平要求较高。在设置优化参数时,过松的剂量限制条件不利于对正常组织加以保护,而过严的指标则可能导致肿瘤靶区高剂量覆盖不足。这一点在见习物理师培训中表现的尤为明显。由于欠缺VMAT计划设计经验,优化参数设置不尽合理,3名学员第一阶段人工计划质量均较差,计划合格率较低,学员A肿瘤靶区PGTV处方剂量覆盖体积V60只有95.2%。为了更直观教导学员如何选择优化参数,本研究尝试引入了人工智能技术。据文献报道,DVH预测模型可以根据靶区和周围器官之间的解剖关系,预测现有技术条件下可实现的最佳剂量分布,并以此自动生成个体化初始优化函数[13-15]。本研究的结果证实,以预测剂量为目标导向可以为物理师计划设计提供一个清晰的指引,有助于物理师,尤其是年轻物理师在短时间内设计出高水平的放疗计划。通过使用KBP技术,在一定程度上弥补了培训物理师设计经验的不足,使3名培训学员第一阶段KBP计划普遍优于其MP 计划,在明显提升PGTV 靶区V60剂量覆盖(P<0.001),改善高剂量控制(V66)(P=0.027)的情况下,显著降低了膀胱(P<0.001)、直肠(P<0.001)、左右肾(P=0.001 和P<0.001)以及左右侧股骨头(P<0.001 和P<0.001)等绝大部分正常组织器官的受照剂量。
以DVH预测模型生成的个体化优化参数作参考,通过第一阶段人工计划与KBP计划的对比,使培训学员对优化过程中参数的选取,特别是一些复杂情况下,诸如PCTV与直肠和膀胱交界如何处理有了初步的认识。在第二阶段5例计划的测试中,3名学员人工计划质量虽较KBP计划仍存在某些不足,但较第一阶段人工计划均有不同程度的提高。其中,见习物理师A第二阶段MP 计划考核指标达标数较第一阶段提高了约60.0%。由于较好地处理了靶区高剂量覆盖与周围正常组织保护之间的辩证关系,3名学员第二阶段人工计划在明显改善靶区剂量分布的前提下,正常组织受照剂量反而仍有一定程度下降。同时经过第一阶段培训,3名见习物理师积累了DVH预测模型使用经验,在第二阶段测试中,均能很好地利用DVH预测曲线来增设优化参数,并依据学习经验对自动计划结果进行微调。我们的测试结果显示,第二阶段KBP计划在靶区和危及器官的诸多剂量学参数上优于第一阶段KBP计划。
以往研究结果显示,使用KBP技术可以减小不同物理师计划设计的质量差异,提高整体质量[16-17]。本研究结果亦证实这一点。学员B和C拥有不同学历背景和工作经验,二者经过第一阶段培训,计划设计水平虽均有提高,但由于二者对不同危及器官取舍理解不同,导致第二阶段人工计划质量仍存在较大差异。DVH预测模型生成的个体化优化参数为B和C提供了一个参照基准,只需略微调整即可获取较为满意的剂量分布,从而在最大程度上缩小了二者间计划质量的差异。
目前国际上一些多中心研究中,常采用基于DVH预测模型的KBP技术作为一种质控手段,监督各个中心入组计划的质量情况[18-20]。我们在培训中也发现,利用模型预测剂量提供的参照标准,可以及时发现学员学习中存在的某些不良倾向。如在分析本次培训3名学员测评结果发现,见习物理师A第一阶段KBP计划均较B、C有较大差距,其KBP计划大部分指标相对较差,但双侧股骨头V35却明显优于B和C。针对这一异常情况,我们回过头仔细寻找原因,发现A错误沿用了既往三维计划设计经验,照射野为了避开股骨头,铅门X方向只开了10 cm左右,导致照射野在旋转过程中只有小部分角度可以覆盖全靶区,降低了VMAT优化设计的自由度,不利于生成良好的剂量分布。改正这一错误后,学员A第二阶段计划质量有了显著提高,KBP-2合格率达到100.0%。通过使用KBP技术,可以及时发现并纠正学员固有的错误观念,保证了培训的效果。
综上所述,DVH 预测模型有助于深化物理师对VMAT初始优化参数设置的理解,加快培训进度,提升VMAT计划设计水平。