刘义, 吴静云, 马帅, 李作峰, 施雅慧, 李俊博, 魏娟, 王霄英
·腹部影像学·
泌尿系结石CT征象与手术方式的相关性:NLP研究
刘义, 吴静云, 马帅, 李作峰, 施雅慧, 李俊博, 魏娟, 王霄英
目的以自然语言处理(NLP)方法研究泌尿系结石CT报告征象与临床手术方式的相关性。方法回顾性选取HIS中因泌尿系结石行CT检查、并在本院行外科处理的住院患者资料,包括CT报告、出院小结中记录的诊疗经过,形成记录文档。使用不同NLP模型研究CT报告中结石的影像特征与手术方式的相关性。结果共纳入371例连续患者的资料用于分析,其中行经皮肾镜碎石取石术(PNL)142例,输尿镜碎石术(URL)190例,输尿管软镜碎石术(IRS)39例。NLP提取“结石”、“炎症”、“输尿管形态”为关键CT特征,十折交叉验证结果显示,经优化后的NLP对结石手术(URL和PNL)分类符合率为0.730,ROC曲线下面积为0.741。结论NLP用于CT结石特征分析是可行的,可为临床决策提供一定的帮助。
自然语言处理; 数据挖掘; 泌尿系结石; 影像信息学
随着信息技术的迅速发展,影像数据对临床决策的影响日益增大[1]。临床工作中,将医学影像信息应用于临床决策的过程基本依赖于专家经验,但随着影像数据量的大幅增长,仅凭专家个人经验对影像数据做出判读的缺陷逐渐突显,依赖数据挖掘、人工智能技术,帮助临床医生做出决策成为潜在的解决方案[2]。但常用的数据库管理系统的查询机制和统计学分析方法已经远不能满足影像学数据挖掘的需要,各种新技术应运而生[3]。但医学问题复杂度高、变异情况多,信息技术在医学领域的应用必须经过大量的验证才可能进入到实际工作中,而验证过程也常常是从简单、单一的应用场景过度到复杂、多样的应用场景。本文将自然语言处理(natural language processing,NLP)技术应用于泌尿系结石的CT图像特征分析,了解不同NLP提取CT图像特征与手术方式的相关性,来观察临床医生可能的决策过程。
材料与方法
1.研究对象
本研究经伦理委员批准。在本院HIS系统中回顾性选取2014年1月-2016年9月因泌尿系结石在本院行泌尿系统CT检查、手术治疗、资料完整的连续病例。
手术方式的收集过程:在HIS系统中检索出院诊断为“结石”的“泌尿外科住院”患者,查阅出院记录,若出院记录中显示“在本院行手术治疗”则入组,记录患者的手术方式。
CT报告的收集过程:在上述入组人群中查阅检查记录,如在住院期间或入院前在本院行CT检查,则在本院PACS/RIS系统中查阅影像科CT报告。设置高级查询条件:同时满足扫描设备为“CT”,且诊断为“肾结石”,最终筛选出满足要求的病例。
将上述数据库中收集的资料导出为Word/Excel格式的文件,汇总进行后续的NLP分析。
2.NLP分析
文档处理:将各单元格内容读出并组织成raw_text格式,输出到n_CT.txt文档中,对数据编号,形成可供NLP处理的文档。分析过程中遇到信息缺失的情况,通过手工修正。
基于ngrams决策树的构建:先将文本内容分词、生成相应的ngram(连续n个相邻词组成的小片段),从而将每个患者的CT报告内容表示为一个向量,含ngram的频数,筛选出带有完整语义的属性,用于后续的分析处理。
使用不同的算法,针对不同手术类型进行测试,对NLP进行优化。
3.统计分析
利用十折交叉验证方法,对CT报告中结石相关特征与手术方式的相关性进行分析。
结果
共入组371个连续病例,男244例,女127例,年龄15~93岁,平均49岁。以手术方式进行分组,行经皮肾镜碎石取石术(percutaneous nephrolithotripsy,PNL)142例,行输尿镜碎石术(ureteroscopic lithotripsy,URL)190例,行输尿管软镜碎石术(retrograde intrarenal surgery,RIRS)39例。
NLP分析所得手术方式关键决策信息为:“结石”、“炎症”、“输尿管形态”的相关描述。
J48算法的分类预测符合率为0.456、ROC曲线下面积为0.608(图1)。为简化模型,使用RPART算法,从上述决策树中摘取可信度较高的预测分支,总结提炼出修正的规则,分类预测符合率为0.434,ROC曲线下面积为0.596。在更进一步简化模型时,考虑到RIRS的病例数量较少,故删去对RIRS的分析,此时NLP对“PNL”和“URL”的分类预测符合率为0.730,ROC曲线下面积为0.741。
讨论
泌尿系结石发病率高,严重影响患者的生活质量[4]。临床多根据结石在输尿管的位置,停留时间的长短,结石的大小以及输尿管梗阻程度,选择不同的治疗方法[5]。随着腔镜技术的不断成熟,输尿管结石的治疗越来越倾向于微创技术,主要是碎石或取石治疗,常用方法分为URL、RIRS、PNL等[6]。即使是对巨大结石和复杂性肾结石,微创手术治疗也是金标准,必要时行双侧微创经皮肾镜也是安全有效的,还可减少患者进行二次手术的痛苦和治疗费用[7]。
多排螺旋CT对泌尿系结石的检查效果好,是“血尿待查”、“结石”临床检查的一线检查方法[8-9]。泌尿系结石在CT图像上多表现为管腔内圆形、类圆形高密度影;结石以上肾盂、肾盏、输尿管不同程度扩张、积水;输尿管壁水肿、增厚、毛躁;输尿管周围条索影;肾周水肿,由于急性结石梗阻时,输尿管及肾内压力增高,尿液渗出到肾周所致;肾脏体积可增大。CT报告应描结石的具体位置、大小、CT值,如有可能,应报告结石成分[10],以利于进一步决定治疗方式。
虽然有明确的共识和要求,且CT诊断的难度不大,但实际工作中泌尿外科医师对CT报告的解读常常感觉不满意,这与自由文本式报告的固有缺陷有关[11];也与影像信息较多时,进行综合判断信息权重不易把握有关[12]。NLP等信息学工具有望改进这一情况,从报告中自动提取与手术方式选择相关的特征信息,对临床医生做出决策提供支持。NLP处理影像报告时,能够自动识别和提取信息[13],将文本转化为结构化数据,进行数据挖掘[14]。它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。基于决策树的分类算法在数据挖掘中的应用非常广泛。与其它分类算法相比,决策树具有计算量相对较小、易于提取等优点,可以充分显示重要的决策属性,且分类准确性较高[15-16]。
本研究显示的NLP首先得到决策树,既而从算法、任务两方面进行了优化。首先,经过半自动化的属性筛选,得到的修剪决策树(pruned tree),提取出结石、炎症、输尿管形态等关键特征,与手术方式的选择有较强的关联。但决策树的决策层次较多、预测准确性仅0.456,决策的复杂性较高,且针对不同患者所采取的具体方案可能存在一定的个体差异。为进一步简化模型,使用了RPART算法,由于摘取了可信度较高的预测分支,减少了部分决策分支,决策效率有提高,但预测符合率稍有减低,仅为0.434。
分析本项目决策树庞杂、准确性欠佳的原因,可能有两个方面,一方面是输入信息的不规范,另一方面是决策任务的复杂性。CT报告中对结石的特征描述有很多不规范的报告用语,甚至诊断标准也不完全统一,由于输入信息的不规范,以致不能精确地建立起目标向量模型,将来以结构式报告替代文本式报告后[17-18],报告信息可做到规范、完整,就能解决这一问题。另外,由于一个提高预测符合率的方向就是对任务重新定义。从本研究NLP模型评价结果可以看出,相比于RIRS,模型对于PNL和URL有更好的预测符合率。
因此,本研究中对NLP的项目任务定义进行了修改,只保留PNL和URL两种手术方式并平衡样本权重后的决策树,其符合率有明确的提高,分类预测符合率为0.730。改变任务后NLP效能提高,可能是由于的RIRS的样本数较少,影响了模型分类性能。更重要的是,在实际工作中,RIRS常与PNL联合使用[6],这也部分解释了在模型中,部分采取RIRS方案的患者被误分类为PNL的原因。这两类患者在CT报告的描述上相似,具体的手术方案选取依赖于其他方面的因素和个体化的差异。为了验证这一推论,将这两类手术方案进一步细分,需要更大量样本、多样化的信息来源以及其专业知识的介入。
本研究收集了住院患者的信息,未包括门诊患者。由于本单位的实际临床流程中,泌尿系结石患者如拟用体外震波碎石方法治疗,则均在门诊进行,因此未能将体外震波碎石方法治疗的患者纳入实验研究,使得本研究对象收集不全面,是本研究的局限性之一。
总之,NLP用于CT结石特征分析是可行的,可为临床决策提供一定的帮助。本研究仅是初步探索,NLP对回顾性资料的分析显示有可能根据影像报告内容支持手术方式决策,这是本领域研究的热点[19]。当然这一技术的影像学应用仍然存在挑战,如数据挖掘算法符合率不高、统计模型的多样性等,需要IT技术改进及医学专业知识的提升来克服这些困难。
[1] Kaggal VC,Elayavilli RK,Mehrabi S,et al.Toward a learning health-care system-knowledge delivery at the point of care empowered by big data and NLP[J].Biomed Inform Insights,2016,8(Suppl 1):13-22.
[2] Jee K,Kim GH.Potentiality of big data in the medical sector:focus on how to reshape the healthcare system[J].Healthc Inform Res,2013,19(2):79-85.
[3] Li KC,Marcovici P,Phelps A,et al.Digitization of medicine:how radiology can take advantage of the digital revolution[J].Acad Radiol,2013,20(12):1479-1494.
[4] Kambadakone AR,Eisner BH,Catalano OA,et al.New and evolving concepts in the imaging and management of urolithiasis:urologists' perspective[J].Radiographics,2010,30(3):603-623.
[5] Eisner BH,McQuaid JW,Hyams E,et al.Nephrolithiasis:what surgeons need to know[J].AJR,2011,196(6):1274-1278.
[6] Ziemba JB,Matlaga BR.Guideline of guidelines:kidney stones[J].BJU,2015,116(2):184-189.
[7] Pearle MS,Goldfarb DS,Assimos DG,et al.Medical management of kidney stones:AUA guideline[J].J Urol,2014,192(2):316-324.
[8] Coursey CA,Casalino DD,Remer EM,et al.ACR appropriateness criteria? acute onset flank pain——suspicion of stone disease[J].Ultrasound Q,2012,28(3):227-233.
[9] Scales CD Jr,Bergman J,Carter S,et al.Quality of acute care for patients with urinary stones in the united states[J].Urology,2015,86(5):914-921.
[10] 范兵,邱建星,王霄英,等.双能CT对离体泌尿系尿酸结石的诊断价值[J].放射学实践,2012,27(3):268-270.
[11] Bosmans JML,Weyler JJ,De Schepper AM,et al.The radiology report as seen by radiologists and referring clinicians:results of the COVER and ROVER surveys[J].Radiology,2011,259(1):184-195.
[13] Jensen PB,Jensen LJ,Brunak S.Mining electronic health records:towards better research applications and clinical care[J].Nat Rev Genet,2012,13(6):395-405.
[14] Topaz M,Lai K,Dowding D,et al.Automated identification of wound information in clinical notes of patients with heart diseases:Developing and validating a natural language processing application[J].Int J Nurs Stud,2016,19(64):25-31.
[15] Cai T,Giannopoulos AA,Yu S,et al.Natural language processing technologies in radiology research and clinical applications[J].Radiographics,2016,36(1):176-191.
[16] Pons E,Braun LM,Hunink MG,et al.Natural language processing in radiology:a systematic review[J].Radiology,2016,279(2):329-343.
[17] 秦岫波,王蕊,高歌,等.前列腺多参数MRI报告进展:基于第2版前列腺影像报告和数据系统的结构式报告的构建[J].肿瘤影像学,2016,25(2):111-116.
[18] 王可,刘庆,郭小超,等.肝癌影像报告进展:基于LI-RADS的结构式报告[J].肝癌电子杂志,2016,3(1):26-31.
[19] Yadav K,Sarioglu E,Choi HA,et al.Automated outcome classification of computed tomography imaging reports for pediatric traumatic brain injury[J].Acad Emerg Med,2016,23(2):171-178.
CorrelationbetweenCTsignsandsurgicalproceduresofurinarycalculus:optimizationofnaturallanguageprocessingresearch
LIU Yi,WU Jing-yun,MA Shuai,et al.
Department of Radiology,Peking University First Hospital,Beijing 100034,China
Objective:To investigate the correlation between CT report signs and surgical procedures of urinary calculus by natural language processing (NLP) method.MethodsDocuments were retrospectively archived from HIS for the inpatients,who had CT examination for urinary calculus and ultimately underwent surgical procedures.NLP model was constructed and tested in the following steps:word segmentation,vector construction of word bags,word frequency construction and feature vector construction.Decision tree based on ngrams and RPART algorithm was used for correlation analysis between CT features and surgical methods.ResultsTotally 371 consecutive data of patients were recruited for NLP analysis,including cases of 142 percutaneous nephrolithotripsy (PNL),190 ureteroscopic lithotripsy (URL) and 39 retrograde intrarenal surgery (RIRS).According to NLP,there was correlation between the CT features of quot;calculusquot;,quot;inflammationquot;,and quot;morphology of ureterquot; to the choice of operation method.10-fold cross validation demonstrated that the precision for PNL and URL was 0.730,and area under ROC curve was 0.741.ConclusionIt is feasible to use the natural language processing in the decision-making of operation treatment for urinary calculus.
Natural language processing; Data mining; Urinary calculus; Imaging informatics
100034 北京,北京大学第一医院医学影像科(刘义、吴静云、马帅、王霄英);200233 上海,飞利浦中国研究院(李作峰、施雅慧、李俊博、魏娟)
刘义(1989-),女,河北石家庄人,博士研究生,主要从事影像诊断研究。
王霄英,E-mail: cjr.wangxiaoying@vip.163.com
R814.42; R691.4
A
1000-0313(2017)11-1179-04
10.13609/j.cnki.1000-0313.2017.11.017
2016-11-10)