医学检验大数据应用的思考*

2017-03-07 08:16张国明顾兵沭阳县人民医院检验科江苏沭阳223600徐州医科大学医学技术学院江苏徐州22004徐州医科大学附属医院检验科江苏徐州22002美国普渡大学生物科学学院美国印第安纳州47907
临床检验杂志 2017年4期
关键词:检验科徐州区间

张国明,顾兵(.沭阳县人民医院检验科,江苏沭阳 223600;2.徐州医科大学医学技术学院,江苏徐州 22004;3.徐州医科大学附属医院检验科,江苏徐州 22002;4.美国普渡大学生物科学学院,美国印第安纳州 47907)

·专题笔谈·

医学检验大数据应用的思考*

张国明1,顾兵2,3,4
(1.沭阳县人民医院检验科,江苏沭阳 223600;2.徐州医科大学医学技术学院,江苏徐州 221004;3.徐州医科大学附属医院检验科,江苏徐州 221002;4.美国普渡大学生物科学学院,美国印第安纳州 47907)

21世纪是大数据时代,医学检验大数据(big data in laboratory medicine, BDLM)也越来越受到关注。然而,在医学检验工作中应用BDLM还存在不少问题。该文综述了应用BDLM的基础、BDLM对科研选题的要求、应用BDLM成功案例和对BDLM应用的展望,希望可以帮助医学检验同行了解BDLM,并进而推动BDLM的应用。

大数据;检验医学;实验医学

近年来,大数据(big data)在各个行业中的应用越来越多。医学检验科是其在医疗单位中具有大数据特征的科室之一。随着实验室信息管理系统(laboratory information system,LIS)的普及,医学检验科的检测数据每天增加百兆字节或几十千兆字节。近年来,全球检验医学专家更加关注医学检验大数据(big data in laboratory medicine,BDLM)[1]。然而,在实际工作中能够很好地应用BDLM仍然需要一定的基础,笔者在应用BDLM过程中进行了如下思考。

1 应用BDLM的前提

1.1 应用BDLM对信息系统的要求 根据临床医生开具的医学检验检查申请,医学检验科的仪器不断产生大量的检测数据。但是,利用BDLM最首要的问题是先按一定的条件检索并导出相关数据,然后才能进一步利用。医学检验科应该有强大的LIS,能够按一定条件和要求检索并导出电子表格类型数据,比如可以按年龄、性别、项目、科室、病种等条件检索,同时必需检索全符合条件的数据。当然,要想采集BDLM进行科学研究,还需要LIS与体检中心的体检健康信息管理系统或(和)医院电子病历信息系统(electronic medical record system, EMRS)相互兼容、读取数据的能力。

1.2 应用BDLM对科研选题的要求 医学检验人员应用BDLM的第二个重要的问题就是需要具备科研和临床应用的思维(idea)。idea的产生总的来说有两种方式可选:一是从文献资料和实验数据中寻找灵感;二是从实际临床问题出发去找数据[2]。在有了数据和idea的前提下,还需要有解决问题的方法。笔者认为统计学分析很重要,这样才可能完成BDLM的应用分析。

1.3 应用BDLM对生物信息学的要求 目前,二代测序技术的蓬勃发展大大加快了测序的速度,也大大降低了检测成本,从而使得在两三天内完成血液、体液等标本的全基因组序列成为可能。然而,面对全基因组序列的大数据,如何快速分析是一个难题。这需要医学专家、生物学专家、计算机专家和统计学专家等相关学科的跨学科交流,才有可能取得突破性进展。将来,如何进一步分析众多人群的全基因组测序数据,将更是一个巨大的挑战。

2 应用BDLM的案例

2.1 基于实验室数据建立参考区间 若LIS与体检人员健康管理系统相关联,可以研究医学检验项目的参考区间,制定出相应的纳入与排除标准后就可以进一步做相关研究。如笔者研究健康人群制定了老年人部分生化项目的参考区间[3],其参考人群来自体检中心最终报告判定为健康的个体,再通过问卷调查、心电图、血压和实验室检查排除血液系统疾病、变态反应性疾病、消化系统、呼吸系统疾病和泌尿系统等急、慢性病,弃除样本状态为黄疸、溶血和脂血等的数据,统计学按照美国临床和实验室标准协会《临床实验室建立、验证参考区间:批准指南(第3版)》C28-A3[4]文件处理并建立参考区间。应用同样的方法,我们建立了老年人全血细胞计数的参考区间[5]、2个非侵入性肝纤维化指标的参考区间[6-7]、甲胎蛋白(AFP)和癌胚抗原(CEA)的参考区间[8]。

2.2 基于实验室数据节约不必要的医学检验测试 随着人们生活水平的提高和国家医保政策的加大,健康体检和就诊意识增强,进行医学检验的测试量不断增加。然而,某些医学检验检查项目没必要同步检测或者说根本不需要检测。在评价肝功能时,当总胆红素和丙氨酸氨基转移酶(ALT)在参考区间以内或较低水平时,绝大多数直接胆红素和天门冬氨酸氨基转移酶(AST)水平也较低,反之亦然。因此,可以用总胆红素和ALT水平预测直接胆红素和AST水平异常与否[9-10]。同样,尿素和肌酐在评价肾功能时也具有上述现象[11]。这样的反馈测试不但节约了医学检验科工作量,而且减少了患者不必要的费用,从而降低医疗和社会成本。

2.3 LIS与EMRS相互兼容的益处 LIS和EMRS兼容可优化检查流程、减少信息核对次数和提高质量控制水平,使检验科工作人员可以快速查阅患者信息,以便更好地确定检查结果是否与临床相符,同时也为结果不符报告的原因查找提供重要信息。LIS与EMRS相互兼容后,明显改善样本周转时间(turnaround time, TAT)且具有可查性,提高了医学检验工作效率和临床满意度[12]。在LIS和EMRS兼容的基础上,可以开展相关项目的诊断性、预测病程和预后判断分析等临床研究[13-15]。

3 BDLM应用的展望

临床上的预测模型大多数是基于BDLM建立的,可以预测疾病风险或识别某种病症等,以便提高医疗服务水平。这可能会成为BDLM以后重点研究的一个方向。如Tayefi等[16]报道,仅应用血常规、血糖、血脂、尿酸和C反应蛋白等常规医学检验参数建立决策树参数与高血压的关系;Arvanitis等[17]报道利用血清视黄醇结合蛋白4预测模型识别甲状腺运载蛋白心脏淀粉样变。人工智能(artificial intelligence,AI)是建模的升级,是模拟人类学习行为以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。最具代表性的是近期来自谷歌、谷歌大脑与Verily公司的科学家们开发出了一款用来诊断乳腺癌的AI,当AI学习了数十万例不同肿瘤组织和正常组织病理切片后,诊断速度及准确率均已超过专业的病理学家的水平。

4 小结

国内外学者在医学检验大数据的应用上,已取得不少成功的案例,值得借鉴。数据除了来源于本单位外,还可以通过众筹、国外免费数据库(如MIMICII,https://www.physionet.org/mimic2/,PLoS One数据共享平台)和国家人口健康科学数据共享平台(http://www.ncmi.cn/66)等方式获得。BDLM的时代已经到来,医学检验人应以积极的心态去尝试、去思考、去探索BDLM在临床和科研上的应用。

[1]Tolan NV, Parnas ML, Baudhuin LM,etal. "Big data" in laboratory medicine[J]. Clin Chem, 2015, 61(12):1433-1440.

[2]章仲恒.大数据与临床科研[J].临床与病理杂志, 2014, 34(5): 492-497.

[3]Zhang GM, Xia YJ, Guo XX,etal. Reference intervals of total bilirubin, ALT, AST, and creatinine in healthy elderly Chinese[J]. Medical science monitor, 2014, 20: 20:1778-82.

[4]Clinical and Laboratory Standards Institute. Defining, establishing, and verifying reference intervals in the clinical laboratory; approved guideline-third edition[S]. CLSI document EP28-A3c. Wayne, PA: CLSI, 2008.

[5]Zhang GM, Xia YJ, Zhang GM,etal. Laboratory reference intervals of complete blood count for apparently healthy elderly people in Shuyang, China[J]. Clin Lab, 2014, 60: 2081-2087.

[6]Zhang GM, Guo XX, Zhu BL,etal. Establishing reference intervals of aspartate aminotransferase-to-platelet ratio index for apparently healthy elderly[J]. Clin Lab, 2016, 1(2): 135-140.

[7]Zhang GM, Xia YJ. Reference intervals of fibrosis index based on four indicators in healthy elderly Chinese[J]. J Clin Lab Anal, 2016, 30(5): 645-648.

[8]Zhang GM, Guo XX, Ma XB,etal. Reference intervals of alpha-fetoprotein and carcinoembryonic antigen in the apparently healthy population[J]. Medical science monitor, 2016, 22: 4875-4880.

[9]Zhang GM, Hu ZD. Conjugated bilirubin as a reflex test for increased total bilirubin in apparently healthy population[J]. J Clin Lab Anal, 2017, DOI: 10.1002/jcla.22233.

[10]Xu Q, Higgins T, Cembrowski GS. Limiting the testing of AST: a diagnostically nonspecific enzyme[J]. Am J ClinPathol, 2015, 144(3): 423-426.

[11]Zhang GM, Guo XX, Zhang GM. Limiting the testing of urea: urea along with every plasma creatinine test?[J]. J Clin Lab Anal, 2017, doi: 10.1002/jcla.22103.

[12]Petrides AK, Bixho I, Goonan EM,etal. The benefits and challenges of an interfaced electronic health record and laboratory information system: effects on laboratory processes[J]. Arch Pathol Lab Med, 2017, 141(3): 410-417.

[13]Zhang Z, Xu X, Ni H,etal. Urine output on ICU entry is associated with hospital mortality in unselected critically ill patients[J].J Nephrol, 2014, 27(1): 65-71.

[14]Zhang Z, Xu X, Ni H,etal. Predictive value of ionized calcium in critically ill patients: an analysis of a large clinical database MIMIC II[J]. PLoS One, 2014, 9(4): e95204.

[15]Huang YL, Han ZJ, Hu ZD. Red blood cell distribution width and neutrophil to lymphocyte ratio are associated with outcomes of adult subarachnoid haemorrhage patients admitted to intensive care unit. Ann Clin Biochem, 2017, 1: 4563216686623.

[16]Tayefi M, Esmaeili H, Saberi Karimian M,etal. The application of a decision tree to establish the parameters associated with hypertension[J]. Comput Methods Programs Biomed, 2017, 139: 83-91.

[17]Arvanitis M, Koch CM, Chan GG,etal. Identification of transthyretin cardiac amyloidosis using serum retinol-binding protein 4 and a clinical prediction model[J]. JAMA Cardiol, 2017, 2(3): 305-313.

(本文编辑:刘群)

江苏省“科教强卫”医学重点人才项目;江苏省“六大人才高峰”项目(WSN-135);江苏省“六个一”工程项目(LGY2016042)。

张国明,1980年生,男,主管技师,硕士研究生,主要从事临床检验工作。

顾兵,副研究员,副教授,E-mail:gb20031129@163.com。

10.13602/j.cnki.jcls.2017.04.19

R446

A

2017-02-20)

猜你喜欢
检验科徐州区间
你学会“区间测速”了吗
疫散待春回
爆笑三国 第三回 三让徐州
徐州过年纪实
苏翠2号梨在徐州的引种表现及配套栽培技术
浅析检验科常规生化检验的室内质量控制
全球经济将继续处于低速增长区间
区间对象族的可镇定性分析
强化检验科在医院感染管理中的作用
强化检验科在医院感染管理中的作用