赵 丹,吴宏宇,韩一平*,黄青山,李 强
(1.第二军医大学长海医院呼吸内科,上海 200433;2.复旦大学生命科学院,上海 200433)
肺癌是最常见的肿瘤性疾病,死亡率占各种恶性肿瘤之首[1],相关数据资源十分丰富。为了科学整理和收集临床病例资料,便于临床研究和及时总结临床医疗工作中的经验,建立肺癌病例数据库系统显得非常重要。当前国内已有多家医院建立肺癌病例数据库,如北京肿瘤医院采用SQL Servers建立底层关系型数据库,同时采用Visual C++6.0开发Windows窗口应用程序。这使得底层数据透明化,可以自如地操纵数据库[2]。中国中医科学院西苑医院设计晚期非小细胞肺癌临床病例分析数据库系统[3]。河北医科大学第四医院选用C#2008进行程序设计,后台数据库应用Access 2007设计和开发非小细胞肺癌患者数据库,利用该系统可以方便地进行信息录入,为统计分析提供完整准确的原始数据记录[4]。这些数据库系统大多使用的是Windows平台下数据库软件如SQL Server,Access,采用 C/S(客户机/服务器)模式开发。限制在Windows平台下使用的商业软件,存在平台依赖性。而且C/S模式开发的软件要求每个使用者都必须安装本地客户端程序,进行本地运行环境配置,增加了操作人员的工作量与复杂度,软件的维护与更新繁琐。最终此类数据库一般只能在小范围类使用,无法进行互联网共享操作。建立在线肺癌病例数据库系统可扩展其使用价值。
1.1 软件平台选择 为了建立在线数据库,必须采用B/S(浏览器/服务器)模式开发。综合考虑软件开发技术、经费与软件平台的可扩展性等因素后,最终选择WAMP(Windows+PHP+Apache+MySQL)平台作为数据库系统开发与运行平台。以配置有PHP(V5.2.13)和MySQL 数据库(V5.1.40)的 Apache 服务器(V2.2.14)为后台,前端使用PHP、HTML、JQuery和CSS技术实现。该系统占用系统资源少,效率高,访问权限安全灵活,可扩展性强。建成的在线肺癌病例数据库,可以实现任何人对病例数据库的查询,授权用户对病理数据的分析,汇总与数据管理。
肺癌病例数据库系统是建立在PHP+Apache+MySQL核心软件基础上的,PHP是服务器端的HTML内嵌式计算机脚本语言,Apache是Web服务器,Mysql是以SQL语言为基础的数据库。三者均为开放源代码,免费且能在Linux和Windows等各种操作系统下跨平台开发和运行的计算机软件,这使得适合用作研究用途[5,6]。共同构成典型的 B/W/D(浏览器/Web服务器/数据库服务器)三层体系结构模式。客户端通过浏览器提交信息给Web服务器,Web服务器再通过PHP脚本语言与MySQL数据库进行数据交换,由标准SQL语言对数据库进行数据操作,最后将处理完毕的数据通过PHP脚本语言返回给客户端,形成动态交互式 Web数据库管理系统[7](图1)。
图1 系统流程
1.2 需求分析与数据库设计 对本院肺癌病例数据资源进行开发,依据疾病诊断流程与系统使用者的功能诉求进行迭代的需求分析,将其转为系统需求,最终确立系统信息表。主要包括患者基本信息、入院诊断信息、检验信息、影像学信息、病理诊断信息、临床治疗信息、肿瘤组织及血液样本信息、临床评估信息、毒副反应、随访资料信息等,对表中的具体信息进行概括、定义,相关信息间建立关联,有多个数值的信息按时间顺序加以区别。
肺癌病例数据库的功能模式主要由一般临床资源表、临床评估资源表、血清数据模板和组织功能模板共同组成。一般临床资源表包括肺癌患者的基线资料和诊断资料,如年龄、性别、体重指数、吸烟史、职业史、家族史、临床特征,病理资料、影像学资料、实验室检验资料、分子遗传指标、肺癌TNM分期;临床评估资源表包括治疗方案、随访资料、疗效预后监测如近期疗效、远期疗效、毒副反应等;血清数据模板和组织功能模板,包括已收集编号存储于指定空间,并低温保存的组织标本、血清标本。
在这些种类繁多、数据形式复杂、技术性强、图文并茂、随时间动态变化的肺癌病例数据面前,通过上述的功能模式进行进一步的查询、分析,对散在的肺癌病例数据分类、关联、聚类、预测、评估,从而把数据的不确定性转化为精准的肺癌研究结论,实现肺癌病例的数据挖掘。
1.3 系统功能模块设计与实现 建立一个在线肺癌病例数据库用于辅助肺癌临床研究,对不同类型的系统使用者有不同的功能需求。一般医务人员最主要的功能需求是信息查询,以及初步信息分析,高层次的医务研究人员则在此基础上的数据分析功能以及数据导出功能,而系统管理人员则需要对数据进行录入,修改和删除功能。为此将系统划分为查询,分析,数据管理和系统维护四个模块。为每个模块设置不同的访问权限。数据管理模块是整个肺癌病例数据系统的核心,包括基本信息管理、检验诊断信息管理、病理诊断信息管理、影像诊断信息管理、临床治疗信息管理、肿瘤样本信息管理、临床评估信息管理。
1.3.1 基本信息管理 主要是住院号、年龄、性别、身高、体重、体表面积,其中还包含住院信息如吸烟史、诊断、症状、体征、家族史等,并采用最新的UICC 2009第7版肺癌国际分期标准为依据进行肺癌诊断的TNM分期。
1.3.2 检验诊断信息管理 包含血液检测,血液及体液的肿瘤标志物检测等,如有新增或删除的检测的项目,数据库也可进行有效管理。另外,兼有血液标本库的信息等。
1.3.3 病理诊断信息管理 包含有组织病理、细胞病理、免疫组化、靶标检测的相关信息,并详细定义病理类型、淋巴结转移、胸膜及周围组织侵犯等,尤其免疫组化的检测项目非常多,新增的病理分子随着医疗技术的进步逐渐运用于临床,数据库的管理解决这一问题。
1.3.4 影像诊断信息管理 包含胸部CT、头颅MRI、骨ECT、全身PET、超声及内窥镜检查信息等,尤其对于胸部CT的影像变化,在存储影像图片的同时亦结合本院的PACS系统进行专业的文字描述,如肿块部位、密度、大小等变化。
1.3.5 临床治疗信息管理 包含有手术治疗方案、化疗方案、放疗、介入治疗、生物靶向治疗等,可以按不同的治疗方案实现肺癌病例个体化、综合治疗的管理。
1.3.6 肿瘤样本信息管理 即肺癌组织标本库的相关信息,按癌组织、癌旁组织分别留存有新鲜组织标本为今后的实验研究提供标本信息。
1.3.7 临床评估信息管理 包括疗RECIST 1.1作为肺癌的疗效评价标准进行近期疗效的评估,WHO抗癌药物常见毒副反应分级标准评定不同治疗方案的毒副反应、癌症患者生活质量测定量表EORTC QLQ -C30来测定肺癌生存者的生命质量、评价肺癌的治疗标准,治疗结束后的随访资料按时间顺序管理随访数据。
2.1 建成肺癌病例数据库管理系统 建成后的肺癌病例数据库管理系统简洁流畅、易于操作、管理,人机界面友好、存储数据丰富。肺癌病例数据库主要包含数据查询,数据分析,数据管理和系统维护四大模块,除此之外还有首页与系统帮助页面,主要用于展示系统信息与辅助用户使用系统。肺癌病例数据库总体反应了肺癌病例在发病、诊断、疗效等全方位的功能作用,数据形式表现多样、随时间动态变化的各项肺癌信息以动态的网页页面形式呈现在访问者的面前,从基本信息管理、检验诊断信息管理、病理诊断信息管理、影像诊断信息管理、临床治疗信息管理、肿瘤样本信息管理、临床评估信息管理七个方面,综合归纳肺癌病例数据信息。注重统计不同暴露条件下疾病缓解率、疾病控制率、及抗癌药物的毒副反应的差异。在该数据库长期运行下,也能跟进中位生存时间、总生存期方面的测评。
2.2 肺癌病例数据库系统的扩展功能 通过PHP+Apache+MySQL核心软件设计建立的肺癌病例数据库系统能实现数据的导入和导出功能。包含有血清及组织标本库的综合性强的肺癌病例数据库系统。建成后的数据库在有良好的网络安全及访问权限的设置前提下,通过Web技术发布于网络,实现资源共享。
3.1 新技术的运用和肺癌数据库发展方向 信息技术的飞速发展使得海量的信息数据能安全存储、便于检索,通过对数据的统计分析有助于挖掘有利的信息资源。如著名的SEER数据库经常发布权威数据供医务人员及科研工作提供指导[8,9],目前我国也建成了不少肿瘤数据库[10,11,12],但对于肺癌单病种数据库的建设还显不足。将新一代的数据库技术运用于肺癌病例数据资源中,设计发布的肺癌病例数据库能安全地组织、存储肺癌病例数据,使得肺癌病例数据资料的研究处理更高效、准确、安全。在严密保护肺癌患者隐私情况下还可进一步通过网络技术实现数据共享,从而合理开发利用宝贵有限的数据资源。
3.2 数据信息及时更新合理应用 随着肺癌临床科研的进展,建成的肺癌病例数据库可以在计算机专业人员的帮助下简便地增减数据表中的项目。不仅仅局限于横向的肺癌发病、诊断、治疗等信息的比较,随时间动态变化的数据也记录在数据库中,这样使得医院的HIS病历系统中的信息资源更具有活力。此外,还兼有血液标本库及组织标本库的功能,在基础实验研究的同时与临床资料紧密结合,得出的研究结果意义更大、指导性更强。
3.3 网络安全 目前我国肿瘤数据库的建设尚在起步阶段、未能联网,尽管本肺癌病例数据库可以实现网络化,但由于网络安全及医疗信息保密性的问题,目前暂时未能将此项功能展开。随着系统的不断完善与资源条件的许可,将尽快将建成的肺癌病例数据库发布到Internet上,实现资源共享。同时随着研究深入、肺癌病例数据库影响面的扩大,将会完善其他的各项功能。
[1] Jemal A,Siegel R,Xu J,ect.Cancer Statistics[J].CA Cancer J Clin,2010,60(5):277 -300.
[2] 侯凤贞,尤渺宁,李纪虎.肺癌病例资料数据库系统的建立[J].现代医院,2008,8(2):141 -142.
[3] 刘 赟,杨宇飞.综合治疗晚期非小细胞肺癌数据库临床病例分析[J].医学研究杂志,2009,38(5):107-111.
[4] 靳 毅,刘 巍.非小细胞肺癌患者数据库的设计与建立[J].医学信息学杂志,2010,31(5):22-24.
[5] Roy S,Saha K.Development of Media Search Engine & its Optimization[J].Journal of Information and Computing Science,2011,6(4):255 -260.
[6] Laverty J P,Wood D,Turchek J.Implementing a Dynamic Database - Driven Course Using LAMP[J].Information Systems Education Journal,2011,9(7):33 -40.
[7] Jin P Y,Peng C.The Development of Online Examination System Based on B/S Structure [J].Key Engineering Materials,2011:474 -476,265 -270.
[8] Bhaskarla A,Tang PC,et al.Analysis of second primary lung cancer in the SEERdatabase[J]JSurg Res,2010,162(1):1 - 6.
[9] Martinez SR,Chen SL,Bilchik AJ.Treatment disparities in Hispanic rectal cancer patient cancer patient:aSEER database study[J]Am Surg.2006,72(10):906 -8.
[10]陈育德.中国肿瘤防治信息系统的建设和开发利用的思考[J].中国肿瘤,2002,11(4):212 -214.
[11]鲍萍萍,郑 萤,王春芳,等.上海市肿瘤病人数据库的建立和利用[J].中国肿瘤,2005,14(8):514-516.
[12]陈嘉宝,吴兆红.肺癌病例数据库系统的研究进展[J].国际医药卫生导报,2011,17(18):2220 -2223.