张晓云,周兰姝
(第二军医大学 护理学院,上海 200433)
卫生与健康领域科学研究在不断的进步和深入,因此,对实验设计、数据质量、统计学方法及工具软件也提出了更高的要求。工具软件的应用对研究数据管理和数据分析具有重要的意义。现有的流行病学和统计软件可分为2类:商业性软件和开放源代码软件。商业性软件包括SPSS、SAS和STATA;开放源代码软件即免费软件,包括EpiData entry,EpiData analysis,Epiinfo和 Windows等[1]。其中,EpiData数据管理软件作为免费软件自2000年研发第1版以来,以其小巧实用、使用便捷、功能齐全和免费获取等特点,得到了越来越多公共卫生、医学、管理学等领域研究者的青睐。EpiData数据管理软件的功能有何优势?目前在国内外科学研究中的应用情况如何?应用领域有哪些?对我国护理科研工作者有何帮助和启示?本文将对以上问题做一综述。
1.1 研发背景 EpiData是由丹麦的非盈利组织EpiData Association组织开发的一个免费的数据录入和数据管理软件,该软件的最新版本为2006年发布的EpiData 3.1,并有成熟的汉化版,可直接从EpiData 网 站 (网 址:http://www.epidata.dk/download.php)免费下载安装。
1.2 功能组成 最新版的EpiData数据管理软件包括了EpiData entry和EpiData analysis两个模块[2]。EpiData entry模块的主要功能是建立数据库并进行质量控制。一个典型的EpiData数据库主要包含3个文件:调查表文件(QES文件)、数据库文件(REC文件)和核查文件(CHK文件),并依次用QES、REC、CHK代表其文件扩展名。数据库建立的基本步骤是:通过简单的文本来定义数据库结构(QES文件),然后将其转化为录入界面(REC文件),最后通过对录入设置严格的条件(CHK文件)来进行质量控制。软件对建立数据库的基本操作流程专设了流程栏引导,以方便用户使用。Analysis模块的统计分析功能有限,但对Entry模块在数据整理和数据核查方面的功能有较多补充。
1.3 软件特点
1.3.1 获取和运行便捷 EpiData数据管理软件的汉化版和汉化的帮助手册都可免费直接从EpiData网站下载。作为“绿色”软件,无需安装,不修改注册表,安装、运行不依赖系统文件夹中的任何文件,可以通过下载setup.exe在计算机中安装,也可以直接拷贝运行[3]。
1.3.2 数据录入直观 EpiData数据管理软件具有良好的资料录入界面和简捷的键盘操作系统,与调查表形式一致的可视数据录入界面可将书面形式的调查表计算机化,在一定程度上使数据录入更为方便,也有助于减少数据录入错误[4]。此外,EpiData数据管理软件可识别Word文档等形式的文本内容,因此,可直接将 Word编辑的文本内容拷贝使用,无需再次对调查表文本内容进行输入。
1.3.3 数据建库高效 数据核查文件EpiData.CHK具有独特的数据属性设置,通过对字段数据属性的定义,可有效提高录入的效率及减少最终数据库的修改与整理,尤其对变量较多、变量性质偏向于计量资料的大样本量资料,可极大地节省建库时间[5]。
1.3.4 数据核查功能强大 EpiData数据管理软件拥有数据双录入的实时检验及一致性检验,数据录入核查功能强大,可以在较大程度上有效减少数据录入错误。
1.3.5 数据库兼容性强 EpiData数据管理软件不仅可以多种格式输出文件,如:SPSS、SAS、Stata、dBase III、Excel以及文本格式等,还可以直接读入dBase、文本以及Stata等格式的数据文件,与其他软件具有较好的兼容性,可供多种数据管理和统计分析软件使用。
1.4 应用评价 EpiData数据管理软件以其强大的功能和简单的操作逐渐被重视,并应用于新药及疫苗临床试验、社会调查、疾病预防控制系统等卫生领域的数据管理工作[6]。Yu等[7]报道,EpiData数据管理软件目前已广泛应用于全世界的公共卫生部门,特别是在发展中国家,可降低数据管理的成本。Singh[1]也报道,EpiData entry和 EpiData analysis在低资金资助的研究项目和学生开展的科学研究中具有应用优势。EpiData数据管理软件也开始应用于政府研究项目中。我国卫生部2003年组织的第3次卫生服务调查后期的数据录入中,EpiData数据管理软件已得到了专家们的认可[8]。加拿大公共卫生署也应用EpiData数据管理软件开展了流行病学项目研究,并于2007年组织了对EpiData数据管理软件应用的评价和再开发[9]。但是,EpiData数据管理软件的应用也有一定的局限性。首先,其数据处理功能相对简单,尚不能实现对数据的复杂统计分析。Singh[1]报道,EpiData analysis只能对样本量小于5000的变量进行相关和回归分析。其次,对数据量较小(样本量<100,变量数<30)的数据资料,使用EpiData数据管理软件虽然能提高录入质量,但不一定能提高工作效率,此时可考虑使用EXCEL来录入数据[8]。此外,Gao等[10]提出,根据2005年WHO发表的《临床试验管理规范指南(GCP)》的要求,EpiData数据管理软件的系统安全性低,任何人可登入数据库,对数据修改没有记录,对确保数据的真实准确有影响。
2.1 EpiData数据管理软件在国外科研中的应用以EpiData为英文检索词,文献检索时间限定为2012年12月之前,检索Elsevier、Pubmed数据库,从文献计量的角度分析EpiData数据管理软件在国际范围内的应用和发展情况。经检索共获得期刊论文400篇,分析如下。
2.1.1 论文年代分布 与EpiData数据管理软件应用相关的理论研究和实证研究论文,按年代分布如表1所示。2011年来,与EpiData数据管理软件应用相关的研究文献数量一直处于上升态势,说明EpiData数据管理软件已越来越受到科研工作者的重视,其应用的探索面在不断扩大和深化。检索发现,最早的相关文献于2002年发表于《The Lancet》,由英国和爱尔兰学者应用于一项医学回顾性队列研究中,表明EpiData数据管理软件在问世后2年即得到了医学研究者和权威杂志的认可[11]。
2.1.2 论文期刊分布 发表EpiData数据管理软件相关文章5篇及以上的期刊有16种,共发表论文168篇,占总发表论文量的42%;期刊涉及学科领域包括热带医学、妇产科学、生物医学和环境科学、预防医学、公共卫生和流行病学、传染病学、社会科学等多领域;发表论文数最多的是《Transactions ofthe Royal Society of Tropical Medicine and Hygiene》,发表论文26篇;《The Lancet》发表论文11篇。具体见表2。对刊载期刊进行分析,发现Epi-Data数据管理软件应用于研究中的科学性已得到多学科多领域的权威认证,其应用学科研究领域也较广泛。分析《The Lancet》刊载的11篇相关论文,发现EpiData数据管理软件多被应用于调查性或实验性的多中心研究[12-15],从一定层面上说明其在多中心的合作性研究中具有应用优势,可能与其免费获取、简便易操作的特点有关,便于不同研究单位人员掌握和使用,以实现数据的统一。
表1 国外刊出EpiData应用研究论文的年代分布
表2 国外发表论文5篇及以上期刊分布
2.1.3 论文作者分布 对2012年发表的99篇EpiData数据管理软件应用的相关论文作者进行分析,发现其中35篇论文由中国作者完成,占刊载论文量的35.4%,研究学科领域涵盖公共卫生和流行病学、妇产科学、神经和精神病学、传染病学、药学,未见护理学科领域的相关论文发表。分析数据可知,EpiData数据管理软件的应用已受到我国医学科研工作者的重视,但相关应用在护理研究中尚未见报道。而中国作者发表的论文比重最高,也与Singh[1]的观点相符,证实EpiData数据管理软件在发展中国家或低资金资助研究项目中具有应用优势。
2.2 EpiData数据管理软件在国内科研中的应用以中文科技期刊数据库VIP为数据来源,对2012年12月以前收录的国内期刊公开发表文献,任意字段含“EpiData”为检索条件,定量分析其年代分布、应用研究领域等,分析EpiData数据管理软件在我国科研中的应用和发展情况,经检索共获得期刊论文713篇,排除图书出版信息和重复论文5篇,得到与EpiData数据管理软件应用相关论文708篇,分析如下。
2.2.1 论文年代分布 国内与EpiData数据管理软件应用相关的理论研究和实证研究论文,按年代分布如表3所示。与表1数据相比较,我国同期发表文献量均高于同年国外刊出相关文献量,进一步说明我国科研工作者对该软件的认识和应用水平。经文献资料分析,我国最早将EpiData应用于科研中的报道是由南京医科大学李春平等[16]开展的一项肿瘤防治的调查性研究。至2010年以后,EpiData相关文献刊出量已达到年均100篇以上。
2.2.2 应用学科领域分布 对2012年国内发表的102篇EpiData数据管理软件应用相关论文的应用学科领域进行分析,其中预防医学与卫生学59篇,中医学10篇,心理学6篇,药学5篇,其他学科还包括口腔医学、临床诊断学、内科学、外科学、妇产科学、儿科学、特种医学、教育学等;护理学发表相关论文仅1篇。分析数据可知,EpiData数据管理软件在我国预防医学和卫生学领域的研究应用非常广泛,特别是在流行病学、社会医学、卫生学和健康教育学范畴内的应用较多。EpiData数据管理软件开发的初衷是为流行病学调查而设计,因此其特点尤其适用于流行病学的观察性研究数据管理,但也有越来越多的临床医学研究者将其应用于临床实验性研究中。
表3 国内刊出EpiData应用研究论文的年代分布
2.2.3 在护理科研中的应用 以任意字段“EpiData+护理”进行检索,得到论文20篇,排除非护理学领域研究文献,得到论文14篇。对该14篇文献全文数据进行手工统计分析,结果显示,EpiData数据管理软件在我国护理研究中应用最早的文献报道是2005年由谢日华等[17]开展的产后抑郁症及其社会心理因素的调查性研究。2009年后相关论文发表10篇,表明EpiData数据管理软件在近年已得到一些护理研究者的认识与应用,但仍不为广大护理研究者所熟识。对论文作者进行分析,学历为硕士或职称为副主任护师及以上者9篇,占64.3%;8篇作者单位为高等院校,占57.1%;6篇论文的合著作者中有统计或公共卫生背景,占42.9%;以上数据说明,高等院校成为EpiData数据管理软件在护理研究领域中应用的开路先锋,与其研究环境和有力的统计或公共卫生背景支持有关。对刊载论文期刊进行分析,6篇论文发表于护理学科期刊,占42.9%,14篇论文中的2篇软件应用技术和经验介绍文章均发表于护理学期刊,说明护理学术期刊对新知识和新技术的应用有着较高的敏感性,在一定程度上起到了介绍和推广的作用[5,18]。对研究内容进行分析,14篇论文中,EpiData数据管理软件应用于调查性研究9篇,实验性研究3篇,软件应用经验介绍2篇;获省部级科研项目资金资助5篇;研究主题涵盖护理管理、社区护理、内科护理、健康教育、护理心理等领域,说明EpiData数据管理软件在护理研究中的应用范围较广,可为不同护理研究方法和研究领域所应用。
在商业数据管理和统计软件占垄断地位的今天,免费数据管理软件EpiData已得到了国内外多研究领域的广泛应用,满足了解决现实问题的需要。作为一款在数据录入方面极具优势的软件,EpiData数据管理软件针对性强,其方便的数据处理功能可以满足一般科研数据管理的需要。EpiData数据管理软件对护理学科科学研究的开展也极有裨益:首先,其免费获取的特点,解决了护理科研工作者由于科研经费不足无法购买正版统计软件而在研究成果发表过程中遭遇的版权尴尬;其次,其简便易上手且直观的特性,满足了不同层次不同教育背景和环境下的护理人员开展科研的需要,消除了其对研究数据处理的神秘感和畏难情绪;再次,其强大的数据核查功能,有助于提升护理科研数据管理的科学性和有效性,提高科研质量;最后,EpiData数据管理软件与SPSS、SAS等的高兼容性也方便护理科研工作者与统计或其他多学科研究者进行合作,实现研究的最优结果。可以相信,EpiData数据管理软件将得到更多的护理科研工作者的认识与应用,也将对我国护理科学研究的推进起到一定的帮助作用。
[1]Singh S.Review of epidata entry and analysis freewares[J].Indian J Community Med,2009,34(1):76-77.
[2]Epidata D K.Denmark,EpiData Association,2000-2013[EB/OL].[2013-01-23].http://www.epidata.dk/download/php.
[3]Kafatos G,Verlander N Q,Gelb D,et al.A comparison of public domain software for outbreak investigations:Epi Info and EpiData[J].Euro Surveill,2007,12(1):E070111.4.
[4]Bohigas P A,Lauritsen J L.EpiData:The natural heir to EpiInfo 6?[J].Gac Sanit,2007,21(3):264-266.
[5]孙路路,梁涛.如何利用中文版EpiData3.1软件高效建立数据库[J].中华护理教育,2010,7(11):522-524.
[6]郑文新,汪文新.EpiData数据管理软件在流行病学调查中建立数据库的应用[J].数理医药杂志,2005,18(5):487.
[7]Yu P,de Courten M,Pan E,et al.The development and evaluation of a PDA-based method for public health surveillance data collection in developing countries[J].Int J Med Inform,2009,78(8):532-542.
[8]郭海涛,吕长超,杨卓轶.Epi Info软件与EpiData数据管理软件的比较[J].软件导刊,2010,9(8):33-34.
[9]A Arthur,J Garay,B Guarda,et al.Redevelopment and evaluation of EpiData:A practical software tool for use in the public health field [J].Inter J Infec Dis,2010,14(Supplement 1):e428.
[10]Gao Q B,Kong Y,Fu Z,et al.EZ-Entry:Aclinical datamanagement system[J].Comput Biol Med,2008,38(9):1042-1044.
[11]Collins S,Sadler K.Outpatient care for severely malnourished children in emergency relief programmes:A retrospective cohort study[J].Lancet,2002,360(9348):1824-1830.
[12]Zhang L,Wang F,Wang L,et al.Prevalence of chronic kidney disease in China:A cross-sectional survey[J].Lancet,2012,379(9818):815-822.
[13]Priotto G,Kasparian S,Mutombo W,et al.Nifurtimoxeflornithine combination therapy for second-stage African Trypanosoma brucei gambiense trypanosomiasis:A multicentre,randomised,phase Ⅲ,non-inferiority trial[J].Lancet,2009,374(9683):56-64.
[14]Llibre Rodriguez J J,Ferri C P,Acosta D,et al.Prevalence of dementia in Latin America,India,and China:A population-based cross-sectional survey [J].Lancet,2008,372(9637):464-474.
[15]Young infants clinical signs study group.Clinical signs that predict severe illness in children under age 2 months:A multicentre study[J].Lancet,2008,371(9607):135-142.
[16]李春平,王玉邦,束云,等.肿瘤高发区人群肿瘤防治知识、态度及影响因素分析[J].南京医科大学学报:自然科学版,2004,24(5):529-531.
[17]谢日华,何国平,罗阳,等.产后抑郁症及其社会心理因素的相关性研究[J].解放军护理杂志,2005,22(11):25-28.
[18]冯怡,张燕敏,邵华芹,等.利用EpiData数据管理软件建立患者满意度调查数据库[J].护理与康复,2011,10(8):727-729.