陶圆,刘俊华,何倩,喻亚宇,许杨鹏,张超,田国祥,牛玉明,5
•循证理论与实践•
应用Empower Stats软件实现诊断准确性试验的Meta分析
陶圆1,2,刘俊华2,何倩1,3,喻亚宇1,3,许杨鹏1,3,张超1,田国祥4,牛玉明1,5
Empower Stats软件是一款基于R语言进行数据分析的统计软件。该软件具有快速实现分析思路、全面的分析功能、直观的数据、强大的数据预处理功能、快速分享分析结果等特点。无需编程,就能运用R程序进行数据管理、处理和分析,功能强大而操作简便,所以该软件广为科研统计者所青睐。但其缺陷在于对诊断准确性试验的Meta分析不能直接得出敏感度、特异度的似然比,本文将以实例的形式系统展示Empower Stats软件用于实现诊断准确性试验Meta分析的两项模块:随机(混合)效应模型Meta分析和根据敏感度特异度生成SROC曲线。
EmpowerStats软件;诊断准确性试验;Meta分析
易侕统计(Empower Stats)软件当前最新的版本创建日期为2016年1月20日,可以从官方网站http://www.empowerstats.com/cn/index.html(中文)或http://www.empowerstats.com/en/download. html(英文)下载中、英文新版本及其旧版本。
易侕统计软件是一款收费软件,安装成功并注册后,可获得一个月的试用期,若通过电子邮箱向好友推荐该软件,可延长试用期。该软件是基于R软件进行数据分析的,因此在安装该软件时会自动安装R软件。
易侕统计软件有以下特点:①快速实现分析思路;②全面的分析功能;③直观的数据,有助于深入理解数据规律;④强大的数据预处理功能;⑤完整归档、快速分享分析结果。
此外,与SAS和R软件相比,易侕统计软件具有四大优势:①使用易侕统计软件,不必编程,就能运用SAS和R程序进行数据管理、处理和分析;②易侕统计软件将统计结果自动制成可直接用于发表的图表,用户可以直接看到以图表方式展现的统计结果;③运用易侕统计软件处理与分析不再受限于编程能力,用户可以很方便地检验科研假设,快速实现分析思路,而且不需要编写程序;④易侕统计软件的“全自动流行病学分析”模块自动设计初步分析流程,给出系列图表结果。
易侕统计功能模块主要由以下部分组成:数据操作、变量操作、基本统计、数据分析和工具。其中工具项内包括以下部分:数据转换、文本文件操作、样本量与检验效率模拟、制作寿命表、统计工具箱(该项包括多组剂量资料比较分析、随机效应模型分析重复测量数据、直线回归与相关分析、2×2配对与非配对四格表、2×2四格表诊断试验结果分析、2×2四格表流行病学结果分析、r×c列联表、随机效应模型Meta分析和根据敏感度特异度生成SROC曲线)。
本文讲述的重点是该软件用于诊断准确性试验Meta分析[1,2]的两项模块:随机(混合)效应模型Meta分析和根据敏感度特异度生成SROC曲线[3,4]。
使用易侕统计时,需重新整理数据录入格式。示例数据整理后的数据格式如表1所示,包括计算出的各纳入研究的样本量(N)、敏感度(SEN)、特异度(SPE)数据格式。也就是说,需要先行计算出敏感度与特异度。
整理数据完成后,打开易侕统计软件并登陆运行后,选择“工具”项内的“统计工具”选项,并单击“根据敏感度特异度生成SROC曲线”(图1)。
然后,如图2所示,将表1中整理好的数据按照“N,SEN,SPE”的格式输入,每一项研究占据一行,然后选择“按样本量取权重”。
需要注意的是,这里“结果存到”项未进行填写,结果将自动保存到“我的文档-EmpowrStats-test”文件夹内。
数据输入完成后,单击开始分析,易侕统计软件将自动编写程序并运行,计算结果如图3所示;按Simpson法计算得出的平滑SROC曲线下面积[5,6](AUC)为0.979,得到平滑SROC曲线如图4所示。
3.1基本原理通过前文的讲述发现,易侕统计软件做诊断准确性试验的Meta分析时只能算出曲线下面积和得到平滑SROC曲线[7,8],而诊断准确性试验中还有“阳性似然比(positive likehood ratio,LR+)”、“阴性似然比(negative likehood ratio,LR-)”、“诊断比值比(diagnostic odds ratio,DOR)”等重要评价指标[9,10],因此,本处主要讲述如何利用易侕统计软件里的随机(混合)效应模型Meta分析来对诊断准确性试验的似然比(LR)和诊断比值比(DOR)作出分析汇总[11,12]。
表1 用于准备录入的数据格式
图1 调出绘制SROC曲线工具
图2 根据敏感度与特异度生成SROC曲线数据录入界面
图3 根据敏感度与特异度得到的计算结果
图4 平滑SROC曲线图
我们知道,流行病学试验的四格表[13]如表2所示。该表中,只需将“有无暴露”视为“诊断试验”、“有和无”视为“阳性和阴性”,那么该表就是一个典型的准确性试验四格表了,则a即为真阳性(TP)、b即为假阳性(FP)、c即为假阴性(FN)、d即为真阴性(TN)。
表2 流行病学试验的四格表
从计算公式⑴⑵⑶⑷⑸来看,DOR的计算公式在形式上与流行病学的比值比(OR)计算公式等同,LR的计算公式与相对危险度(RR)的计算公式相似。基于此可以理解为经传统二分类Meta分析后得到的OR、RR就分别对应于诊断准确性试验的DOR和LR,事实上计算之后结果也是一样的。
3.2实现分析首先需重新整理数据格式。由图5及图6可以看出,易侕统计软件对传统二分类Meta分析提供的有两种数据输入格式。本节选用ai、nli、ci、n2i格式(图5和图6),即试验组发生数、试验组总数、对照组发生数、对照组总数格式。
图5 随机(混合)效应模型Meta分析效应量选择界面
图6 随机(混合)效应模型Meta分析数据输入界面
在图6中,首先选择“输入该指标的原始数据”内的“ai,nli,ci,n2i or ai,bi,ci,di”项,然后在变量名内选择“ai,nli,ci,n2i”,然后分别输入数据。需要注意的是在计算LR+和LR-时要分别按照“TP、FN+TP、FP、TN+FP”和“FN、FN+TP、TN、FP+TN”格式输入。然后点击“开始分析”,即可得出如图7和图8所示的阳性似然比和阴性似然比的森林图。
图7 阳性似然比的森林图
图8 阴性似然比的森林图
易侕统计软件不能自由选择效应量,因此当前无法进行DOR结果的计算,即自动输出的选择RR为效应量,而非OR。那么,如何实现OR呢?在图5中可以看出,选择OR指标时,需要输入OR的方差及标准误,这需要借助R软件进行数据的计算,然后再行输入。因整个过程比较麻烦,故不做展示,有兴趣的读者可自行尝试。完成后的DOR值和Meta-Disc软件计算值是相似的。
易侕统计软件对数据处理分析全面,自动制成可用于发表的图表,快速实现分析思路而无需编程,功能强大而操作简便的特点广为科研统计者所青睐。随着版本的更新和方法学的逐步完善,我们相信其在诊断准确性试验Meta分析中的应用前景会更加广泛。
[1]Dimou NL,Adam M,Bagos PG. A multivariate method for metaanalysisand comparison of diagnostic tests[J]. Statist Med,2016.
[2]Gopalakrishna G,Mustafa RA,Davenport C,et al. Applying Grading of Recommendations Assessment, Development and Evaluation (GRADE)to diagnostic tests was challenging but doable[J]. J Clin Epidemiol,201 4,67(7):760-8.
[3]Doebler P,Holling H,Böhning D. A Mixed Model Approach to Meta-Analysis of Diagnostic Studies With Binary Test Outcome[J]. Psychol Methods,2012,17(3):418-36.
[4]Naaktgeboren CA,Ochodo EA,Van Enst WA,et al. Assessing variability in results in systematic reviews of diagnostic studies[J]. BMC Med Res Methodol,2016,16:6.
[5]Arevalo-Rodriguez I,Segura O,Solà I,et al. Diagnostic tools for alzheimer’s disease dementia and other dementias: an overview of diagnostic test accuracy (DTA) systematic reviews[J]. BMC Neurol,2014,14:183.
[6]Massanes F,Brankov JG. Full receiver operating characteristic curve estimation using two alternative forced choice studies[J]. J Med Imaging(Bellingham),2016,3(1):011010.
[7]Campbell JM,Klugar M,Ding S,et al. Diagnostic test accuracy: methods for systematic review and meta-analysis[J]. Int J Evid Based Healthc,2015,13(3):154-62.
[8]Sotiriadis A,Papatheodorou SI,Martins WP. Synthesizing Evidence from Diagnostic Accuracy TEsts:the SEDATE guideline[J]. Ultrasound Obstet Gynecol,2016,47(3):386-95.
[9]Enst WA,Naaktgeboren CA,Ochodo EA,et al. Small-study effects and time trends in diagnostic test accuracy meta-analyses: a metaepidemiological study[J]. Syst Rev,2015,4:66
[10]Lee J,Kim KW,Choi SH,et al. Systematic Review and Meta-Analysis of Studies Evaluating Diagnostic Test Accuracy: A Practical Review for Clinical Researchers-Part II. Statistical Methods of Meta-Analysis[J]. Korean J Radiol,2015,16(6): 1188-96.
[11]Chen Y,Hong C,Ning Y,et al. Meta-analysis of studies with bivariate binary outcomes: a marginal beta-binomial model approach[J]. Statist Med,2016,35(1):21-40.
[12]Yu J,Yang L,Vexler A,et al. Easy and accurate variance estimation of the nonparametric estimator of the partial area under the ROC curve and its application[J]. Statist Med,2016,35(13):2251-82.
[13]Setia MS. Methodology Series Module 2: Case-control Studies[J]. Indian J Dermatol,2016,61(2):146-51.
本文编辑:姚雪莉
Realization of Meta-analysis of diagnostic test accuracy (DTA) by using EmpowerStats software
TAO Yuan*,LIU Jun-hua, HE Qian, YU Ya-yu, XU Yang-peng, ZHANG Chao, TIAN Guo-xiang, NIU Yu-ming.*Center for Evidence-Based Medicine and Clinical Research, Taihe Hospital, Hubei University of Medicine, Shiyan 442000, China.
NIU Yu-ming, E-mail: niuyuming@yeah.net
Empower Stats software is a statistics software based on R language to realize data analysis.This software possesses the features of quickly accomplishing thinking of analysis, comprehensive function, intuitive data, powerful data preprocessing function and rapidly sharing the results.Without programming, R program can be used for data management, processing and analysis, and it is powerful and easy to operate, so the software is widely favored by scientific researchers.However, it doesn’t provide straightforward likelihood ratio of sensitivity and specificity in the Meta-analysis of diagnostic test accuracy (DTA).In the article, two modules of using EmpowerStats software to realize the Meta-analysis of DTA were systematically displayed with examples including random (mixed) effective model Meta-analysis and creating ROC curve according to sensitivity and specificity.
EmpowerStats software; Diagnostic test accuracy; Meta-analysis
R4
A
1674-4055(2016)08-0907-04
湖北省教育厅重点项目(D20142102)
1442000十堰,十堰市太和医院(附属湖北医药学院)循证医学中心;2442000十堰,十堰市太和医院(湖北医药学院附属医院)医务处;3442000十堰,湖北医药学院口腔医学院12级;4100700北京,陆军总医院干四科;5442000十堰,十堰市太和医院(附属湖北医药学院)口腔科
共同第一作者:刘俊华
牛玉明,E-mail:niuyuming@yeah.net
10.3969/j.issn.1674-4055.2016.08.04