陈思佳,石丽婉,林勤
厦门大学附属第一医院肿瘤放疗科,福建厦门361000
随着放射治疗技术的发展和对放射治疗精准度要求的不断提高,放疗工作者们对放疗计划的评判标准也提出了更高的要求。由于个体组织结构、评价标准和经验认知上的差异,物理师和医师对靶区和危及器官(Organ-at-Risk,OAR)的优化条件处理和最终计划的评判标准上有着不同的侧重点。而放疗计划在设计和评价环节中人的主观因素将会直接影响到最终放疗计划的质量。在对数家医院获取的各部位调强放疗计划的剂量学分析中不难发现,即便是符合临床治疗标准的计划,仍有63%的患者靶区接收到不足90%的给定剂量,而46%的患者接收到的剂量超过给定剂量的110%,也就是临床提到的“冷热点”。而冷热点的差异程度也随着靶区和危及器官的复杂程度逐渐增加[1]。目前针对如何提高放疗计划质量,传统的改进方法包括优化模型目标函数的改进和放疗参数优化等手段。近年来通过人工智能技术进行放疗优化的方式逐渐为人们所关注[2]。基于知识的放射治疗技术(Knowledge-Based Radiation Therapy,KBRT)为放疗计划设计的同质化提供了解决方案,在一定程度上弥补了因物理师和医师的主观因素造成的计划质量差异,为放疗计划设计自动优化条件提供了参照。同时KBRT 还缩短了放疗计划优化时长,为新计划提供可能的范围作为优化参考,提高了整体优化效率。诸多的优点使得对KBRT的研究在近年来逐步增加,不少研究者表示KBRT 或将成为下一代自动计划系统的重要突破口,而广泛地开展前瞻性方面的研究将会让这项技术得到更广阔的应用空间[3-4]。
在解决应用领域中较为复杂的问题时,除利用基本原理和常识之外通常还需要借助领域内专家的经验知识来支持人们做出正确的决策和行动。而在放疗计划设计的过程中也面临着类似的状况。当下通过人工设置条件进行反复迭代优化依旧是大部分计划系统采用的主要优化方式。该方法在优化期间会消耗物理师大量的时间与计划系统(Treatment Planning System,TPS)进行交互迭代,且物理师的经验和判断将显著地影响计划的结果和质量,经验丰富的物理师往往可以用更短的时间做出更符合临床需求的计划。如何将丰富的临床经验和实践运用到保障放疗计划质量,同时兼顾优化效率成为了研究者关注的重点问题。KBRT 选取了具有相同或相近特征(如病种、放疗技术、体位固定等)的一类临床放疗计划,由资深物理师进行审核或再优化后加入数据库中,通过生成特定规则以匹配数据库中的计划或训练生成的模型预测组织剂量范围,最终获得相应的约束条件以进行自动或者半自动计划设计。利用该项技术,一方面可以对尚未优化的放疗计划进行预测分析,估计危及器官和靶区可能的剂量-体积直方图(Dose-Volume Histogram,DVH)分布范围,为临床计划提供参考;另一方面可以结合计划系统的优化算法,在无人为干预的情况下根据模型提供的优化参数对计划进行初步的优化,提供满足临床要求的早期结果,提升计划优化过程的工作效率。
尽管KBRT 的理论在20 世纪80年代就已提出[5],但受限于当时的技术水平无法真正地实现对原计划的改进。而通过算法实现KBRT 出现在机器学习等人工智能相关概念兴起之后。利用先验知识和数据,通过一系列规则和算法赋予计算机学习模拟人类解决复杂问题能力的方法称为机器学习,它是人工智能研究的重要分支[6]。目前机器学习已在多模态图像融合、靶区勾画、放疗计划和质量控制等多个放疗领域取得了突出的进展[7-9]。研究者通过分析和提取病人的几何结构和剂量分布等相关信息,运用算法和规则建立特征与模型的联系进行比较分析并生成对应的统计模型。在有新的查询病例作为输入时,上述规则或模型可以挑选出合适的案例或形成可能的分布区间来预测新病人的剂量-体积直方图,并通过不断增加数据和训练的方式来完善这类模型。目前能够实现KBRT 技术的两类主要方法是特征检索法和机器学习。
1.2.1 KBRT 中的特征检索法在收集足够多高质量的临床放疗计划后,如何用这些数据有效地指导和进行新计划的优化,达到甚至超越经验丰富的物理师水平成为了KBRT最为核心的问题。
在研究中,高质量的计划通过预处理将特征形成索引目录。当输入新的查询计划时,通过一系列特征提取和相关性计算后与库中的信息进行检索或匹配,找出最适配的计划作为参考计划对原计划进行改进。由于解剖结构近似的计划在剂量分布上也常常比较接近,因而通过检索相似解剖结构的计划并对其射野进行形变调整的想法在早期的KBRT 被广泛使用[10-11]。这种形变为建立在计划中射束视野(Beam's Eye View,BEV)下的二维形变配准,这些二维光束的视线图像首先与方差配准对齐,然后使用互信息(Mutual Information, MI)度量计算相似度。找到最接近的匹配点后,将计算出的约束条件和变形后的通量图输入到治疗计划系统中,并使用匹配计划的约束条件生成新的治疗计划。这一过程也可以通过对PTV 的三维形变配准后进行,最终得到的剂量分布与二维形变结果相比较没有太大的差别[11]。
同样的,以重叠体积直方图(Overlap Volume Histogram, OVH)作为检索算子对数据库中的计划进行检索,寻找最优解的方式也被用于KBRT早期的研究之中。OVH被定义为PTV对应外扩的虚拟体积与OAR 的重叠体积在OAR 中的占比。在PTV 扩展距离增加时,PTV 与OAR 重叠接近100%。利用OVH 算子可以大致判断出PTV 与OAR 的简易三维形态关系,进而通过该关系对库中进行过OVH 预处理的计划进行检索,找出与目标相匹配的计划用于DVH预测或者计划的半自动优化[12-13]。
对于这类基于检索法为基础的KBRT,都是简单地利用了解剖结构、射野几何结构或者几何结构算子来快速查询到库中相配对的计划,进而将配对计划的优化条件等临床经验运用于查询的新计划之中。但在实际操作中,由于各个OAR与靶区之间的相对关系较为复杂,单一检索算子的分析筛选只能满足少部分简易的靶区结构,而在剂量方面只是在线束射野的二维平面下的通量改变。这在一定程度上对于KBRT在三维剂量分布的准确性上产生了影响。
1.2.2 KBRT 中的机器学习伴随着放疗技术的发展和对空间剂量分布的重视,人们更希望计划在满足DVH 的前提下提高空间剂量分布的准确性。但如果将患者体内的三维剂量分布与放射治疗中相关的几何结构等因素相关联进行预测分析,将会形成高维的数据集合,在提高系统精准度的同时带来巨大的计算量。而这些几何结构的因素往往又因为每个特定患者具有复杂的靶区结构,导致无法在不丢失重要数据的情况下有效地压缩信息量或减少数据的维度。然而,通过主成分分析法(Principal Component Analysis,PCA)提取最显著特征来表征,可以大大减少数据维度,使得数据集可以在结合三维剂量分布提升预测准确度的同时减少大量的计算量[14]。
研究者为每个OAR 创建了一个剂量-靶区直方图(Dose-to-Target Histogram, DTH),以便在PCA 计算过程中与PTV 和OAR 的DVH 共同使用。其中DTH 与OVH 的概念相同,即PTV 对应外扩的虚拟体积与OAR的重叠体积在OAR中的占比。
对库中m个计划中每个OAR 的DVH 和DTH 进行采样,生成特征点的m维分量向量。移动特征空间的原点使其表示平均特征值,并对这些特征点进行规范化处理。在这一坐标系中建立m×m协方差矩阵,并进行奇异值分解(Singular Value Decomposition, SVD)得到m个特征向量和特征值。由于DVH 和DTH 变化较大的成分将产生更重要的几何数据,因此被识别的主成分被用来进行模型训练。在m维数据中,这种特定挑选的特征可以显著减少计算消耗。
在回归型支持向量机(Support Vector Regression,SVR)建立的映射下,通过输入几何体中提取主成分,并将逆旋转和平移应用于该空间,进而还原到构建相关矩阵的原始特征空间,最终预测患者正常组织可能的DVH范围[15]。
Varian 公司研发的Rapidplan 功能运用机器学习的方法,并在上述基础上提出了GEDVH 的概念,详细规范了几何参数并进行主成分分析,通过几何参数的回归模型预测DVH。同时结合了其临床的TPS进行使用,通过模型训练的方式逐步提高放疗计划预测的准确率,现已成为可进行高质量放疗计划设计和质控的TPS工具。
随着KBRT 概念的提出和相关软件在放疗计划系统中的应用,人们开始逐渐关注到这一领域并对其进行了各种尝试和探索,并在研究的过程中重点关注KBRT 在临床方面的实践、KBRT 计划与常规放疗计划的对照研究、KBRT 与其他放疗技术的结合等几个方面。这些研究对于KBRT 在临床实践中的流程化和规范化使用给予了极大的帮助。
在已知的KBRT早期研究中,基于知识的放疗计划优化(Knowledge-Based Planning, KBP)的探索涵盖了绝大部分可以进行放射治疗的病种,如头颈部肿瘤[10,16]、乳腺肿瘤[17]、直肠肿瘤[18]和前列腺肿瘤[3,10,14]等。在这些研究中可以了解到,通过训练的KBP 模型所生成的计划可以初步满足临床的要求,在优化效率上也显著优于常规计划方式。因此,如何在满足临床要求的基础上提高剂量学的评判标准成为了研究的重点。
为了减小不同医疗机构间调强放疗计划的差异,减小冷热点的发生,Good等[18]采集了大型癌症放疗中心132 例无冷热点的前列腺癌病人调强放疗计划生成了KBRT模型,并利用该模型对其他医疗机构的前列腺癌调强放疗计划实施了射野形变配准和再计划。研究对比可以发现对于95%的案例而言,KBP 在均匀性和同质性方面并不逊于原计划。KBRT 能够成为具备丰富临床经验的医疗机构推广专业放疗技术的媒介。
较传统放疗计划而言,KBP 所生成的计划的优越性主要体现在面对多靶点和多OAR掺杂时所表现出的计划的一致性和适应度等特性。而针对这一点,Tol等[19]在对头颈部这类具有复杂靶区和OAR结构的计划进行剂量学比较和评估后也得到了相似的结论。目前而言,KBRT 基于DVH 的方法的关键限制是缺乏空间信息,物理师可能需要额外的工作来改善模型或者人工干预来处理OAR和靶区可能会出现的剂量分布不均和高剂量点等意外状况。
像Rapidplan 这类需要进行建模的KBRT 应用为使用者提供了建模过程会遇到的统计学参数,不同参数对应着不同的剂量和几何关系。在建模过程中,使用者需要进行多次的数据检查和筛选工作,以保证最终验证模型能够顺利地进行DVH预测。同时模型在每次训练后也会反馈回归参数和图表,供使用者对强影响点和离群值进行分析和处理。可以说一个模型的成功与否很大程度上取决于这些模型异常值的取舍上。
Sheng 等[20]在研究盆腔部KBRT 离群值对于模型整体影响时发现,针对几何和剂量离群值的细致分析可以提高模型的质量。由于离群值会对模型库初始数值的普通最小二乘回归线产生影响以满足回归线覆盖模型库中的所有数值,尤其是剂量离群值较几何离群值而言具有更明显的扰动效应,但在优先级上应优先处理几何离群值。Delaney 等[21]在对头颈部肿瘤模型离群值的进一步研究中提出了不同的观点,他认为对一个由大量连续数据组成的合适模型而言,花费时间进行反复的离群值剔除处理是不必要的。数据显示,去掉几何和剂量离群值对KBP 模型而言并不能从总体上提高计划的质量,因为回归曲线并未因离群值的大量去除而发生变化。而对于一个一致性较好的模型而言,模型预测的范围随着参杂的离群值数量的增加而变宽,并且显示出预测范围向着高剂量区偏移的特点,这可以有效地减少过拟合现象的出现。而越来越多的证据显示,模型通过大量的数据训练后可以减少异常点对于模型的影响,从而扩大今后模型的适用范围以应对可能会遇到的更多更复杂的靶区几何分布。
KBRT 技术的另一项优点是其出色的兼容性。在与传统和新兴放疗技术的结合中产生了诸多的创新。这其中不乏有出色的研究,它们在改变传统放疗计划流程的同时也提高了放疗的质量安全。
立体定向体部放疗(Stereotactic Body Radiation Therapy, SBRT)技术可为无法耐受手术治疗的早期肺癌患者提供相近的疗效,因而越来越受到人们的关注。但由于SBRT 技术相对于常规分割的放射治疗而言单次剂量更高,因而对于胸壁、肋骨和臂丛神经等正常组织产生的损伤会更严重。对于这类SBRT 计划而言,控制正常组织的受量可以减少一定的放疗并发症的发生。尽管尚未有直接证据证明SBRT 毒性和OAR 剂量分布存在直接联系,但利用KBP 鉴别人工优化的高风险肺部肿瘤SBRT 计划却可以有效地降低正常组织的剂量[22]。在对过往的计划进行回顾研究发现,与未产生毒性反应和严重并发症的计划相比,产生3 级毒性反应的临床计划在KBRT 模型优化后存在50%的改进潜力。KBRT 可以系统性地提高SBRT方案的质量和安全。
目前,运用KBRT 和多重标准优化(Multi-Criteria Optimization, MCO)算法相结合以提升计划设计和审核效率的方法受到研究者们的广泛关注[23-24]。MCO 算法利用KBRT 的优势生成满足帕累托最优(Pareto Optimal)平面的计划集合,这一集合中每个计划的靶区与正常组织之间形成了一个潜在的平衡关系。在这样的平衡关系中,任一优化目标都无法在其余优化条件当前最优状态不被损害的前提下获得进一步的提升。这就需要有足够多的计划才能将优化时的帕累托最优平面集合表示出来。而生成这样一个大量计划的数据集不仅需要算法,还需要类似图形处理单元(GPU)这样的硬件提供支持。当进行一次多目标优化后,物理师和医生之间可以通过权衡各组织间利弊的方式共同筛选出集合中最合适的一个计划作为最终的临床方案,而不是像传统的放疗计划方式在反复的沟通和优化中寻找最优解,从而大大提高整体放疗计划流程的效率。
除此之外,利用KBRT 中的VMAT 模型对IMRT计划进行优化,可以提高效率并减少正常组织的受量,在靶区覆盖率和均匀性相同的情况下改善OAR保护[25]。而KBRT 模型用于改善肺癌调强放疗的射束分布角度上,所生成的计划与常规计划质量相当,或有助于减少规划时间,促进自动化优化的实现[26]。
在取得诸多研究成果的同时,研究者们也发现了KBRT存在的一些问题和挑战。首先是缺少足够大的数据集,无法发挥出算法本身的优势。由于KBRT获取到的数据大多来源于临床,对于采集到的临床数据还需要额外的分组(如训练组和测试组),而用于训练的数据还需进行异常值的剔除。这一系列的研究环节都限制和影响了采集到的样本量,与通过深度学习进行图像分割的海量数据形成了鲜明的对比。而样本量不足将极大地影响模型和算法的预测准确性,其中最容易出现的就是过拟合[22]。此外,在收集数据的过程中如果忽视了数据管理,数据有效性和潜在的异常点将对预测出的结果产生偏差。
其次,目前KBRT 的功能实现都是以DVH 和OVH 为特征提取目标,对算子和算法的研究没有深化,而以DVH 作为特征提取就会导致在剂量空间分布的限制,需要人为操作来处理OAR 和靶区的异常值。因此除了基于DVH 的方法外,也出现了针对体素为特征的KBRT 预测模型的研究[27]。另外,KBRT研究切入点上较为单一,与新技术的开发和结合较少。KBRT 与MCO、GPU 加速等技术相结合后对于传统放疗技术的影响和变革也说明,发展KBRT还需要更多算法和硬件技术的融合来拓展和挖掘其本身的优势。
KBRT 通过人工智能方法来解决放射治疗技术中的临床问题,在解决问题的同时还需要与临床计划系统有更多的结合和衔接,真正的将研究成果转换为可以解决临床需要的产品。通过上述的问题和挑战,如何合理的去面对和解决这些难题能帮助我们对KBRT今后的研究方向做出合理的判断。
KBRT 的设立初衷就是希望通过此项技术减少物理师之间因为经验和主观因素等诸多因素造成的计划质量差异,提高放疗计划的整体质量和安全,让患者能够真正地从该项技术中获益。而要达到这个目的,至上而下的多中心合作和交流就显得尤为重要。如何开展多中心研究合作项目来丰富和优化KBRT 模型中的数据集和模型,制定出相关的标准,并通过云计算等方式将成果或产品在基层单位进行推广是KBRT后期工作开展的重要方向。目前,针对基于知识的自动调强质子治疗(IMPT)计划系统的国际多中心研究证实了多中心合作的可行性[28]。该解决方案可以帮助质子中心做出相一致且有效的放疗计划并为其临床和试验环境中的IMPT 计划提供质量保证。而随着人工智能算法复杂度不断提高,可以预见类似的多中心合作将随着技术的发展越来越被人们重视。
自适应放疗(Adaptive Radiotherapy, ART)是以图像引导放疗(Image-Guided Radiotherapy, IGRT)为基础,通过流程化处理,运用图像反馈的偏差信息对原治疗计划进行系统化调整以满足实际放疗要求的一项放疗技术。其中在线ART 更是要求优化流程、缩短时间以达到在当前分次下的计划修改和执行要求。目前的ART 研究中,通过形变配准后进行的正常组织自动勾画,靶区轮廓推衍以及图形处理单元运用于剂量计算等方面都取得了长足的发展[29-30],有效地提高了ART 流程的效率。这些进步都在支持和推动KBRT 成为安全有效的再计划与质控系统以满足在线ART 的要求。通过已建立的同类KBRT 模型,将ART 流程中产生的新图像和靶区结构导入系统,可以快速得到满足ART 要求的KBRT 计划。KBRT 亦可针对成熟的ART 产品所生成的计划进行计划评估和DVH 预警,保证ART 的安全。而Tseng等[31]更是进一步提出了将多模态图像(如CT/PET/MRI)和生物标记(基因组学、转录组学、蛋白质组学)等有益信息加入ART 的知识框架之中,摆脱依靠单一图像信息的固有模式,最终实现针对单个患者的分子特征进行个性化治疗。
近年来,人工智能理论和技术的革新不断深入到各行各业并取得了卓越的发展。KBRT 中涉及的机器学习等内容作为人工智能研究的重要分支,也同样为放疗自动计划的改进作出了重要的贡献。目前神经网络用于预测空间内剂量分布的研究已经可以在减少大量训练数据的情况下达到KBRT 传统建模的水平[32]。尤其是深层卷积神经网络(deep Conventional Neural Network, dCNN)这类在医学影像中广泛应用的技术为自动计划指明了新的方向[33]。面对常规MR 定位图像无法直接进行治疗计划优化的问题,通过dCNN 将定位MR 图像和定位CT 关联后生成的模型可将定位MR 转化为可以直接进行放疗计划的人造CT图像(Synthetic CT),并且生成的剂量与原计划基本无异[34]。人工智能算法正在逐渐融入传统放射治疗的图像分割、计划优化和计划执行等各个阶段之中[35-36]。随着生成对抗网络算法(GANs)、深度学习等新技术的不断涌现,结合了大数据和云计算的自动优化也将在智能决策、优化算法改进和质控安全等方面获得更多的关注。