吴静云, 米悦, 刘义, 马帅, 李作峰, 施雅慧, 李俊博, 魏娟, 王霄英
·腹部影像学·
泌尿系结石患者手术方式的选择:“临床信息+CT特征”的预测效能
吴静云, 米悦, 刘义, 马帅, 李作峰, 施雅慧, 李俊博, 魏娟, 王霄英
目的探讨泌尿系结石手术前的临床信息(症状、体征等)和CT报告与手术方式的相关性。方法选取因泌尿系结石住院治疗的患者的病例资料,导出有完整术前资料的患者文档,以自然语言处理(NLP)技术对文档进行分析,提取加工其中的关键信息,研究术前关键信息与手术方式的相关性。结果收集连续患者资料371例,行输尿镜碎石术(URL)患者190例,行经皮肾镜碎石取石术(PNL)患者142例,行输尿管软镜碎石术(RIRS)患者39例。利用NLP比较临床信息、CT报告与手术方式的相关性,单纯“CT报告”分类符合率为0.456,ROC曲线下面积为0.608;“CT报告+临床信息”分类符合率为0.461,ROC曲线下面积为0.618。增加临床信息后,NLP模型的分类符合率未见明显变化,但决策树路径变长,节点变多,规则复杂,不利于临床使用。结论对于拟行手术的泌尿系结石患者,手术前的CT报告与手术方式具有相关性,可为手术方式的临床决策提供直接有效的信息。增加症状和体征的临床信息,不能提高预测手术方式的符合率。
自然语言处理; 临床决策; 泌尿系统结石; 影像信息学
泌尿系结石是泌尿系统的常见病和多发病,在结石患者就诊过程中,通常在先有临床症状(以血尿、腹痛为主),有时可有查体的阳性发现,在此基础上行CT检查可做出结石的确定诊断,同时提供指导治疗的信息[1]。本研究按照泌尿系结石患者最终进行的手术方式进行分类,利用自然语言处理(natural language processing,NLP)决策树方法来探究患者的临床信息(症状、体征)和CT报告内容与手术方式的相关性,研究各种信息在临床医生决策过程中的价值。
材料与方法
1.研究对象
选取住院病例系统中诊断为“泌尿系结石”、并行手术治疗的连续病例,均有完整的症状、体征、CT报告资料。将上述资料导出为Excel文件,存储并汇总后进行NLP分析。
2.NLP分析
首先进行文档预处理,手工修正有错误、缺失信息的数据,对不能用于分析的文档删除,形成raw_text格式。
然后进行CT特征的提取和加工,分词、形成向量,统计词频、以高频词汇构建特征向量,进行语义分析,最终得到描述CT特征的关键词。
再进行临床信息的提取和加工,从出院小结中删除包含最终手术方案部分的描述,利用正则表达式识别“入院后”“行XX术”等关键词,将“出院小结”部分拆分成手术前临床信息描述部分和手术方案部分。手术方案部分的描述不进入词袋模型的构建过程。
patterns = [u'[^。;]*收入我[科室院]([^。;])', u'[^。;]*[/d-]+[^,。前。,]+术[^后]', u'[^。;]*入院后', u'[^。;]*完善.{,3}检查', u'[^。;]*检查基本完善', u'[^。;]*手术.{,5}顺利', u'[^。;]*行[^、,。]+术']
对上述拆分出的CT报告内容和临床信息构建ngram信息,用于决策树的构建与评价。
3.统计学方法
以十折交叉验证方法验证仅用“CT报告”、“CT报告+临床信息”时,NLP模型预测手术方案的分类符合率。
结果
371例患者的连续资料入组,其中行输尿镜碎石术(ureteroscopic lithotripsy,URL)190例,行经皮肾镜碎石取石术(percutaneous nephrolithotripsy,PNL)142例,行输尿管软镜碎石术(retrograde intrarenal surgery,RIRS)39例。
从“CT报告+临床信息”中提取的信息,构建决策树见图1。
比较“CT报告”、“CT+临床信息”NLP的验证结果(表1)。从表1所示的具体评价指标可以看出,仅用“CT报告”的模型对各个分类的识别性能与“CT报告+临床信息”相似。在已有CT报告的基础上,增加临床信息对于手术方案的决策并未提供更多的帮助,但此时的决策树路径更长,节点多,规则复杂。从实际工作的角度考虑,与“CT报告+临床信息”比较,仅使用“CT报告”中的内容对于决策提供的信息更加直接有效,相比之下决策树更小、决策路径更短。
表1 不同NLP模型决策树的验证结果
讨论
泌尿系结石的常见临床表现为:腰腹部绞痛、胀痛、血尿,偶伴恶心、睾丸疼痛、膀胱刺激症状[2]等,不仅影响患者生活质量,而且其引起的泌尿系梗阻可危害肾功能甚至继发严重感染。多排螺旋CT检查是泌尿系结石首选的影像检查方法,可清晰显示结石数量、位置、大小、CT值、与周围组织的关系及肾积水情况等,增强CT还可进一步评价肾脏功能。所以CT既有确诊结石的作用,又有指导结石治疗的价值[3-4]。目前结石治疗以微创腔内手术为主,临床医生选择手式方式时,需综合考虑患者的全身状况和结石具体情况[5]。
本研究利用NLP技术,探索使用基于决策树的数据挖掘技术是否可对临床手术决策起到提示作用。前期本团队已初步验证了NLP可提取CT报告中的关键特征,与专家提取的关键特征具有可比性。另外,NLP提取的特征,在经过优化后可模拟临床医生的决策,CT报告中结石、炎症和输尿管形态的描述与手术方式的选择有一定的相关性。在以上前期工作的基础上,本研究试图探索增加临床信息后,可否进一步提高NLP对手术方式的预测效能。但结果显示,增加临床信息不能提高对手术方式的预测符合率,考虑其原因,可能有以下两个方面:
①增加临床信息后,NLP的数据质量下降,降低了决策效能。本研究对比了“CT报告”、“CT报告+临床信息”对临床决策的价值,结果显示单纯使用“CT报告”决策符合率为0.456,使用“CT报告+临床信息”符合率为0.461。十折交叉验证结果显示,两种模型对各个分类的识别性能相近,只在数字上有细微的差异。从模型结构分析中可以看出,使用临床信息时的决策树决策路径更长,节点更多,规则更加复杂。将CT报告、临床信息两部分内容整合之后,由于报告内容的具体表述不完全一致,导致词频矩阵更加稀疏,使得模型的预测能力有所降低。因此,仅CT报告中的内容可为临床决策提供更加直接有效的信息,且决策树计算规则相对简化。
②临床信息的实际价值主要在入院选择和预后评估,而对手术方式的选择价值明显低于CT信息。在常规实际工作中,泌尿系结石治疗决策的制定需要考虑到患者的所有信息例如患者的基础疾病、目前的临床症状和体征等临床信息、泌尿系统的解剖结构、结石的影像征象、患者的诉求等复杂因素,最终由医患双方协商决定。但临床医生做出决策时,各部分信息的权重并不相同。本研究收集的病例均为住院手术的结石患者,这些患者术前已排除了手术禁忌症,例如全身感染、发热等,即已经决定选择手术治疗了。那么进一步确定手术方案时,则主要依靠CT征象。CT的诊断价值首先是除外非结石性的血尿病因,特别是肿瘤性病变[6];其次是描述结石的关键特征,大多数情况下这些关键特征是选择术式的主要依据[7]。本研究以NLP的客观数据,提出了术式选择过程以CT信息为主、增加临床信息不改变术式选择的推论,揭示了本疾病在日常临床工作决策过程中可能的规律,当然这一推论尚需大量实验反复验证。实际上,在疾病的诊治过程中,这种情况并不少见,如:疾病影像诊断明确,以微创术式为主,手术整体难度不大、手术对患者全身情况要求不高时,病灶的局部信息对术式的选择更重要[8]。需注意的是,手术方式的选择仅是结石患者诊治全过程中的一个环节,临床信息在其他环节的决策应有重要价值,今后应进一步研究。
图1 “CT+临床信息”的决策树。
“CT报告+临床信息”有望用于区分门诊与住院治疗。上尿路结石是泌尿外科常见疾病,治疗方案较多,常用治疗方案包括保守治疗、药物治疗、体外冲击波碎石、输尿管镜取石术、经皮肾镜取石术及开放手术。随着微创术式的普及,泌尿外科医师在结石治疗时面临多重选择。治疗前根据影像资料准确判断结石的相关信息,可以帮助临床医生制定更加详实可靠的治疗方案[9]。泌尿系CT报告可以提供结石的位置、大小、成分等信息,有利于临床优化现有的治疗方案,制定一个标准的诊断治疗流程。但CT报告中不能反映患者的病史、全身情况,而这些对选择治疗方案也是非常重要的[10]。最近人工研究的结果已显示,因急性肾绞痛就诊的患者,CT报告结石较大、密度较高、位于近端的,合并寒战、发热和白细胞升高的患者预测其行有创治疗的可能性较高[11]。所以,将来可使用大量数据,以NLP研究“CT报告+临床信息”对选择入院手术治疗的患者是否具有指导作用。
“CT报告+临床信息”有望用于评价结石的复发和预后。结石形成的危险因素主要有代谢异常、尿路梗阻、感染、异物等局部因素以及引起结石的药物因素。结石成因可以用于评估治疗方案及预后,它影响结石的复发几率[12]。泌尿系结石的常见成分为含钙结石、磷酸镁铵结石(鸟粪石)、尿酸结石及胱氨酸结石,通常是混合成分结石,双能量CT可分析结石成分[13]。所以,将来可以NLP研究“CT报告+临床信息+随访信息”,对患者的术后并发症、结石复发和预后做出评估[14]。目前已有研究已证明,影像资料对患者的预后有明确的提示作用[15],与临床资料结合,形成“影像组学 (radiomics)”、“影像基因组学(radiogenomics)”数据[16],是一种重要的影像信息学研究方法,用于预后评价的作用已经获得一些证据的支持,是影像与临床信息整合的重要价值之一。
本研究的结果虽然没有接受最初的研究假设,增加临床信息后未能提高CT对手术方式的预测效能,但其提示意义仍然非常重要:在影像信息学研究过程中,首先应定义明确的任务,其次应以高质量的数据进行研究,最后IT研究人员应与医务人员紧密合作,充分挖掘有效数据,才能为临床决策提供有力的帮助。更加重要的是,疾病的种类千差万别,即使是同一种疾病在不同的决策阶段,各类信息的辅助决策价值也是不同的。所以,临床医学中的信息化进程不可能一蹴而就,研究者必须有足够的耐心,细致地逐个解决问题,才有可能把信息学工具真正用于临床工作中。
[1] Pearle MS,Goldfarb DS,Assimos DG,et al.American urological assocation.Medical management of kidney stones:AUA guideline[J].J Urol,2014,192(2):316-324.
[2] Heller MT,Tublin ME.In search of a consensus:evaluation of the patient with hematuria in an era of cost containment[J].AJR,2014,202(6):1179-1186.
[3] Bosmans JML,Weyler JJ,De Schepper AM,et al.The radiology report as seen by radiologists and referring clinicians:results of the COVER and ROVER surveys[J].Radiology,2011,259(1):184-195.
[4] Nazim SM,Ather MH,Khan N.Measurement of ureteric stone diameter in different planes on multi-detector computed tomography:impact on the clinical decision making[J].Urology,2014,83(2):288-292.
[5] Cheng PM,Moin P,Dunn MD,et al.What the radiologist needs to know about urolithiasis:Part 2-CT findings,reporting,and treatment[J].AJR,2012,198(6):W548-W554.
[6] Moloney F,Murphy KP,Twomey M,et al.Haematuria:an imaging guide[J].Adv Urol,2014:1-9.doi:10.1155/2014/414125.
[7] Fulgham PF,Assimos DG,Pearle MS,et al.Clinical effectiveness protocols for imaging in the management of ureteral calculous disease:AUA technology assessment[J].J Urol,2013,189(4):1203-1213.
[8] Bultitude M,Rees J.Management of renal colic[J].BMJ,2012,345:e5499.doi:10.1136/bmj.e5499.
[9] Sahin C,Eryildirim B,Kafkasli A,et al.Predictive parameters for medical expulsive therapy in ureteral stones:a critical evaluation[J].Urolithiasis,2015,43(3):271-275.
[10] Choi T,Yoo KH,Choi SK,et al.Analysis of factors affecting spontaneous expulsion of ureteral stones that may predict unfavorable outcomes during watchful waiting periods:what is the influence of diabetes mellitus on the ureter[J].Korean J Urol,2015,56(6):455-460.
[11] Lotan E,Weissman O,Guranda L,et al.Can unenhanced CT findings predict interventional versus conservative treatment in acute renal colic[J].AJ R,2016,207(5):1016-1021.
[12] Scales CD Jr,Smith AC,Hanley JM,et al.Prevalence of kidney stones in the united states[J].Eur Urol,2012,62(1):160-165.
[13] 范兵,邱建星,王霄英,等.双能CT对离体泌尿系尿酸结石的诊断价值[J].放射学实践,2012,27(3):268-270.
[14] Tonolini M,Villa F,Ippolito S,et al.Cross-sectional imaging of iatrogenic complications after extracorporeal and endourological treatment of urolithiasis[J].Insights Into Imaging,2014,5(6):677-689.
[15] Huber J,Winkler A,Jakobi H,et al.Preoperative decision making for renal cell carcinoma:cystic morphology in cross-sectional imaging might predict lower malignant potential[J].Urol Oncol,2014,32(1):37.
[16] Lambin P,Rios-Velazquez E,Leijenaar R,et al.Radiomics:extracting more information from medical images using advanced feature analysis[J].Eur J Cancer,2012,48(4):441-446.
Correlationbetweenclinicalinformation,CTsignsandsurgicalproceduresofurinarycalculus:naturallanguageprocessingresearch
WU Jing-yun,MI Yue,LIU Yi,et al.
Department of Radiology,Peking University First Hospital,Beijing 100034,China
Objective:To explore the value of clinical information (symptom+sign) and CT findings of urinary calculus in clinical decision-making of surgical procedures.MethodsMedical recording documents were retrospectively archived from HIS for patients who had CT examination for urinary calculus and surgical procedures in the hospital.By using different types of NLP model,all the imaging and clinical data were extracted and processed for searching the descriptors of CT features,symptoms and signs.The correlation of the descriptors with surgical methods was studied.Results371 consecutive data were collected (142 percutaneous nephrolithotripsy,190 ureteroscopic lithotripsy,and 39 retrograde intrarenal surgery,respectively).The precision of quot;CT reportquot; was 0.456 (AUC 0.608).The precision of quot;CT report+clinical informationquot; was 0.464 (AUC 0.618).With additional information of clinical data,the classification accuracy of NLP was not improved,but leading to longer path of decision tree,more nodes and more complex rules.ConclusionThe content of CT report can provide direct and effective information for clinical decision-making of surgical procedure.
Natural language processing; Clinical decision-making; Urinary calculus; Imaging informatics
100034 北京,北京大学第一医院医学影像科(吴静云、刘义、马帅、王霄英),泌尿外科(米悦);200233 上海,飞利浦中国研究院(李作峰、施雅慧、李俊博、魏娟)
吴静云(1985-),女,广西桂林人,博士,主治医师,主要从事肾脏功能MR成像、对比剂研究及医学数据库研究。
王霄英,E-mail: cjr.wangxiaoying@vip.163.com
R814.42; R693.4
A
1000-0313(2017)11-1183-04
10.13609/j.cnki.1000-0313.2017.11.018
2016-11-10)