环境因素与出生缺陷关系研究的文献计量分析

2017-07-05 11:03郭阳贾晓峰米鑫
中国医药导报 2017年15期
关键词:出生缺陷文献计量环境因素

郭阳 贾晓峰 米鑫

[摘要] 目的 采用文獻计量学方法,从宏观角度量化分析环境因素与出生缺陷关系领域的主要研究特点和热点研究主题。 方法 选用PubMed/Medline数据库,采用主题词检索法检索构建含4687条信息的“环境因素与出生缺陷关系研究”论文数据库。通过对题录信息的分析得到该领域的主要研究特点;通过采用词频标准化和线性回归方法,对高频主题词(MeSH词)分类分析得出该领域在环境因素、出生缺陷健康终点以及相关生物机制方面的热点研究主题及其趋势。 结果 环境因素与出生缺陷关系研究论文共4687篇,其中65.8%的研究集中在近20年(1997~2016年);人群研究占72.2%(3384篇);美国学者发表论文数量最多,占23.9%(1119篇),我国学者在该领域研究比较薄弱,仅占3.1%(144篇)。在热点研究主题方面,水化学污染物、烟草污染、噪声、内分泌干扰物等环境因素主题词平均标化频次分别为5.62%、3.38%、2.88%、1.33%;先天畸形、死胎、肿瘤、性发育紊乱、先天性基因病等出生缺陷健康终点主题词的平均标化频次为14.82%、4.32%、5.08%、2.47%和2.22%;相关生物机制方面染色体畸变、基因突变、母婴交换等主题词的平均标化频次为7.95%、3.92%和4.14%。 结论 本研究基于文献计量分析的量化依据,综合分析了出生缺陷与环境污染领域整体研究特点及其在环境因素、出生缺陷健康终点和生物机制的研究主题和变化趋势,可为今后研究提供参考。

[关键词] 环境因素;出生缺陷;文献计量

[中图分类号] R722.1 [文献标识码] A [文章编号] 1673-7210(2017)05(c)-0187-06

[Abstract] Objective To evaluate the characteristics and popular themes in the field of environmental pollution and congenital diseases by bibliometric analysis. Methods The database including all 4687 articles in the field of environmental pollution and congenital diseases was constructed by searching PubMed/Medline using MeSH terms. The bibliographic information was analyzed to summarize the overall research characteristics. MeSH terms were sorted by their normalized frequency (NF) and classified into three categories (environmental factors, congenital outcomes and biological mechanisms) and analyzed by regressive analysis to investigate the popular themes and their tendency. Results All 4687 articles were retrieved in this field. The 65.8% of the articles were published in recent 20 years (1997-2016), and 72.2% of the studies were conducted on the population (3384 articles). The researchers from the USA conducted 23.9% of the studies (1119 articles), only 3.1% of the studies were conducted by researchers from China (144 articles). For the popular themes of the environmental factors in this field, the NFs of chemical water pollutants, tobacco smoke pollution, noise, endocrine disruptor was 5.62%, 3.38%, 2.88%, 1.33% respectively. For the congenital outcomes, the NFs of congenital abnormalities, fetal death, neoplasm, disorders of sex development and inborn genetic disease were 14.82%, 4.32%, 5.08%, 2.47% and 2.22%. For the related biological mechanisms, the NFs of chromosome aberration, mutation and maternal-fetal exchange were 7.95%, 3.92% and 4.14%. Conclusion The study presents a data-based overview of the issues in field of environmental factors & congenital diseases, and concludes the popular themes in the environmental factors, the congenital outcomes, and the mechanisms, which can provide reference for future research.

[Key words] Environmental factor; Congenital disease; Bibliometric analysis

出生缺陷是指胎儿在出生时、出生前存在的或在出生后早期内出现的结构畸形、功能或代谢异常[1]。《中国出生缺陷防冶报告(2012)》统计数据显示,我国每年新增出生缺陷患儿数量大约是90万例,造成较为严重的经济负担和社会负担[2]。随着二孩政策的放开,高龄产妇比例将会大幅上升,预计我国出生缺陷患儿数量会进一步升高,出生缺陷相关研究已成为重要科研领域,在国内学界广泛关注[3]。越来越多的研究表明,出生缺陷的发生与较为复杂的环境因素暴露有关[4-6],但由于环境因素和出生缺陷的多样性以及其中较为复杂的多因素间协同作用和环境-基因间交互作用,至今仍未有研究较为全面地阐明该领域中主要环境危险因素、出生缺陷类型及其潜在生物学机制。既往环境因素与出生缺陷关系领域综合评述多基于专家智慧判断对其中的部分领域进行评述,较少有宏观的该领域综合分析,且传统综合评述受专家所阅读文献量和知识面的局限,未有定量的依据和判断[5,7-9],而基于文献计量学方法的计量分析可为复杂研究领域综合判断提供定量的依据和更为全面的综合视角[10]。本研究首次尝试采用文献计量学方法综合分析当前国际该领域的研究论文,综合量化分析环境因素与出生缺陷关系领域主要研究特点、热点研究领域和发展趋势,从计量学角度为该领域的重点主题和发展趋势的识别提供量化依据,为今后该领域研究提供重要参考。

1 资料与方法

1.1 论文数据库的构建

文献的检索与采集选自美国国家医学图书馆建立的PubMed/Medline数据库。PubMed数据库是国际生命科学和生物医学领域权威数据库,收录了全球最为广泛的同行评议论文的题录信息,并编制了较为完整的医学主题词表(MeSH)用于论文内容的标引的索引。

论文检索:采用主题词(MeSH词)检索法检索数据库中出生缺陷与环境污染领域研究论文(research article,检索时间2017/1/18)。检索策略=(检索字段Ⅰ)AND(检索字段Ⅱ);检索字段Ⅰ="Congenital, Hereditary, and Neonatal Diseases and Abnormalities"[Mesh]检索字段Ⅱ="Environmental Pollution"[Mesh] OR "Environmental Pollutants"[Mesh];限制字段(Filters)= Journal Article;English。首次检索共检索得到论文5341篇。

数据库构建及筛选:将首次检索得到的5341篇论文题录信息和MeSH主题词下载,采用Thomson Data Analyzer计量分析软件(TDA version 3.0,Thomson Reuters Co.,NY)导入并构建文献数据库。TDA软件可用于文献题录信息的批量管理和部分量化分析。

1.2 文献计量

文献库的去重和清洗:使用TDA软件对文献库中重复信息进行去重,并删除职业特殊环境标引的论文(以MeSH词“Occupational Exposure”“Occupational Diseases”“Air Pollutants,Occupational”“Occupations”“Occupational Medicine”标引,合计654篇),形成一个由4687篇研究论文题录信息和3771个MeSH主题词(排除词频为1的极低频主题词2757个)的文献数据库,用于本研究计量分析。

研究特点计量分析:环境因素与出生缺陷关系领域研究的总体特点主要通过对文献库论文的题录信息(出版年、期刊名、作者、地址/国家、地址/机构)进行定量分析获得。将MeSH词中反映研究对象和研究方法的主题词标引选出,用于该领域研究设计特点分析。

逐一解读词频≥10的主题词(共计820个,总计词频占所有主题词词频的82.8%),并将其分类至环境因素、出生缺陷健康终点、生物机制3类中。采用主题词频次标化法和单因素回归分析的方法进行热点主题识别和趋势分析。

1.3 统计学方法

将1962~2016年,55年间MeSH主题词进行词频标化(1961年前论文数仅为28篇,由于数量分散不纳入主题趋势研究)。标化方法为各主题词年度词频数(年度所有论文中以该主题词标注的总论文数)除以对应年度总论文数。标化词频(normalized frequency,NF)可有效反映该主题词在该时间段的相对重要性,从而排除由于论文基数量的增加导致的频数本身的增加。以主题词55年平均NF为反映其在该领域的重要(关注)程度的指标,用于热点主题的识别。量化计算采用Excel(Microsoft Co.,WA)软件。

研究主题趋势的分析方法為将1962~2016年划分为11个时间段(5年为1个时间段,共55年),用MeSH主题词5年平均NF与对应时间点做线性回归,通过计算回归系数(b)及回归方程显著性检验(F检验)的P值,以反映主题词研究热度的变化趋势;设定b > 0且P < 0.05的为显著升高趋势,b < 0且P < 0.05为显著降低趋势。回归分析采用SAS 9.1.3(SAS Institute Inc.,NC)软件。根据主题词的5年平均NF和既往55年间变化趋势,分别识别分析环境因素、出生缺陷健康终点和相关生物机制3类中的热点主题和变化趋势。

2 结果

2.1 总体研究特点

环境因素与出生缺陷关系领域相关研究论文共4687篇,发表时间分布如图1所示(图中时间段为1962~2016年,此外1946~1961年28篇),随时间整体呈上升趋势,研究活跃度逐渐升高,相关研究多集中于近20年(自1997年至今共有3085篇相关研究),占该领域研究总量的65.8%。

研究方法设计方面,72.2%的是人群研究(以human标注的文章共3384篇);其中有9.9%的研究为病例-对照研究(以case-control studies标注的文章共336篇),6.1%的研究为队列研究(以cohort study标注的文章共208篇),2.5%的研究为横断面研究(以cross-sectional studies标注的文章共86篇),回顾性研究(以retrospective studies标注)多于前瞻性研究(以prospective studies标注)设计(209比149篇)。该领域研究论文主要刊载在《环境健康展望杂志》(《Environmental Health Perspectives》)126篇,占比2.7%;《出生缺陷研究杂志》(临床和分子畸形)(《Birth Defects Res A Clin Mol Teratol》)96篇,占比2.0%;《生殖毒理学杂志》(《Reprod Toxicol》)95篇,占比2.0%;《畸形学杂志》(《Teratology》)73篇,占比1.6%。来自美国、英国、日本的学者分别发表论文1119、242、188篇,占总数的23.9%、5.2%、4.0%,中国研究者参与研究论文共144篇,占总研究论文3.1%,排名第4位,我国在该研究领域较薄弱(图2)。美国学者在該领域开展了大量的研究工作,其中托马斯杰斐逊大学Dr. Brent,RL;加利福尼亚大学Dr. Shaw,Gary M;爱荷华大学的Dr. Romitti,Paul A;北卡罗来纳大学Dr. Langlois,Peter H;斯坦福大学Dr. Carmichael,Suzan L等是该领域主要研究者,发表研究论文分别为27、27、20、20、19篇。

2.2 热点主题与趋势分析

环境因素与出生缺陷关系领域研究中主要关注的环境因素、出生缺陷健康终点和生物机制3方面的主题及其研究趋势,见表1~3。

2.2.1 与出生缺陷相关的主要环境因素 与出生缺陷相关的主要环境因素包括水污染、空气污染、物理因素、内分泌干扰物、化学药物、重金属、生物因素和其他有机物8类(按照主题词词频排序)。

水化学物污染(NF=5.62%)和以三卤甲烷(NF=0.18%)为代表的卤化消毒副产物是该领域最为关注的水污染物,且呈显著升高趋势(b > 0,P < 0.05)。空气污染方面,烟草(NF=3.38%)及尼古丁(NF=0.35%)、可铁宁(NF=0.27%)等烟草主要污染物相关研究是主要的研究主题,相关研究呈升高趋势(b > 0,P < 0.05)。普通空气污染物(NF=2.89%),主要包括灰尘(NF=0.69%)、二氧化硫(NF=0.59%),其他如颗粒物(NF=0.53%)、臭氧(NF=0.46%)、二氧化氮(NF=0.37%)与出生缺陷关系研究也呈升高趋势(b > 0,P < 0.05)。以噪音和电离辐射为代表的物理因素对出生缺陷的影响的相关研究呈逐渐下降趋势,但其中噪声(NF=2.88%)、X射线(NF=1.91%)、γ射线(NF=1.66%)、紫外线(NF=1.01%)等因素与出生缺陷相关性研究仍有较高的关注度,其中,放射性成像和放射性治疗是主要的辐射暴露途径。环境内分泌干扰物与出生缺陷的相关研究逐渐升高趋势,以多氯联苯、二英、有机农药类(杀虫剂、除草剂、DDT)、类固醇类(己烯雌酚、非甾体类雌激素、雌二醇、己烯雌二醇等)、酚类、金属化合物类(三丁基锡、有机锡类)、酸酯类(酞酸丁二酯)、氟碳化合物等为代表的环境雌激素样物质对生殖发育关系影响研究总体呈显著升高趋势(b > 0,P < 0.05)。化学药物暴露导致的出生缺陷相关研究是该领域重要的研究主题,其中最为关注的是抗肿瘤药和抗生素类药物(NF=1.55%、0.78%)。反应停导致的出生缺陷相关研究呈下降趋势(b < 0,P=0.05),而丙戊酸类药物和非甾体类抗炎药导致的出生缺陷相关性研究呈显著升高趋势,当引起关注(b > 0,P < 0.05)。以铅(NF=1.40%)、汞(NF=1.02%)、镉(NF=0.76%)、砷(NF=0.58%)为代表的重金属类与出生缺陷关系研究也保持一定程度的关注度,其中,汞与出生缺陷关系研究呈下降趋势(b < 0,P < 0.05)。生物因素相关研究也逐渐增多,其中过敏原、弓形虫相关研究呈显著升高趋势(b > 0,P < 0.05)。第8类为其他有机物质,主要包括乙醇和甲苯等有机溶剂类,其中饮酒、乙醇对出生缺陷影响相关研究呈逐渐升高趋势(b > 0,P < 0.05)。见表1。

2.2.2 主要出生缺陷健康终点 环境因素相关的出生缺陷主要包括先天畸形、不良妊娠结局、肿瘤、内分泌功能紊乱、先天性基因病、神经精神系统疾病、呼吸系统疾病、婴幼儿发育障碍、寄生虫疾病等10类主要健康终点。

先天畸形是环境因素导致的最为重要的出生缺陷类型,其中,先天性心脏缺陷(NF=2.67%)、腭裂(NF=2.46%)、多发性畸形(NF=1.93%)、神经管畸形(NF=1.69%)、唇裂(NF=1.36%)、小头畸形(NF=1.26%)等是较为重要的畸形类型,相关研究总体呈显著升高趋势(b > 0,P < 0.05)。环境因素与脊柱侧凸相关性研究呈逐渐下降趋势(NF=1.06%,b < 0,P < 0.05)。在不良妊娠结局方面,死胎、胎儿生长迟缓、自发性流产、低体重儿、早产儿与环境因素相关性研究最为关注,NF值分别为4.32%、3.36%、2.47%、1.66%和1.17%,且总体呈显著升高趋势(b > 0,P < 0.05)。此外,虽然极婴儿猝死、低体重儿和死产相关研究较少,但呈显著升高趋势(b > 0,P < 0.05),未来应重点关注。肿瘤是环境因素暴露相关的出生缺陷中重要疾病类型(NF=5.08%),其中,肾母细胞瘤、肾癌和白血病相关主题研究较多(NF=2.70%、1.65%、1.41%),但总体呈下降趋势(b < 0,P < 0.05)。内分泌系统功能紊乱是环境因素相关出生缺陷研究的重要话题,其中性发育混乱受关注程度最高,环境因素与隐睾症、性腺发育不全、生殖系统畸形等相关研究呈显著升高趋势(b > 0,P < 0.05)。环境因素暴露相关先天性基因病研究持续呈较高关注度,其中先天性代谢异常、着色性干皮症是该领域较为重要的研究话题(NF=0.89%、0.69%)。神经/精神系统疾病方面,唐氏综合征相关研究持续具有较高关注度(NF=2.03%),胎儿酒精综合征和新生儿戒断综合征相关研究呈升高趋势(b > 0,P < 0.05),智力障碍和脑部疾病相关研究呈下降趋势(b < 0,P < 0.05)。呼吸系统疾病方面,哮喘、支气管发育不良、过敏性鼻炎等相关主题研究呈升高趋势(b > 0,P < 0.05),其中,哮喘的关注度最高(NF=2.17%)。妊娠期暴露滞后效应的研究具有持续较高的关注度,且呈升高趋势(NF=6.75%,b > 0,P < 0.05),其中生长障碍和发育障碍是重要的研究主题(NF=0.57%、0.47%),发育障碍相关研究呈显著升高趋势(b > 0,P < 0.05)。寄生虫病方面,先天性弓形虫病是研究较多的领域(NF=0.51%)。环境因素相关其他出生缺陷类疾病还包括放射性损伤(NF=19.26%)、放射致畸(NF=13.01%)等重点主题。见表2。

2.2.3 环境因素与出生缺陷关系生物机制 环境因素所致出生缺陷相关生物机制主要包括4方面:第1類是遗传物质损伤与基因表达异常,研究最多的是染色体畸变和染色体异常,NF较高分别为7.95%、6.12%,其他主题词如基因突变、DNA损伤、DNA甲基化相关表观遗传学改变、基因表达调节等相关机制研究总体呈显著升高趋势(b > 0,P < 0.05)。第2类生物学机制是母婴交换,NF较高为4.14%。第3类机制是内分泌系统,其中下丘脑-垂体系统呈显著升高趋势(NF=0.15%,b > 0,P < 0.05)。凋亡、细胞死亡、炎症、氧化应激等普遍存在但非特异性生物机制为第4类,相关研究总体呈显著升高趋势(b > 0,P < 0.05)。见表3。

3 讨论

文献计量学是信息科学、情报学研究领域较为成熟的研究方法,采用定量和统计学方法分析特定领域既往研究论文的题录信息和内容信息(主题词、摘要、全文等),为宏观把握一个领域的热点和趋势提供重要的量化依据[10]。与传统系统综述的区别在于,传统系统综述主要依赖专家智慧、基于大量文献学习后的定性判断和总结,具有宏观定性的特点;文献计量学主要依赖量化计量结果、辅以专家定性判断对某一宏观领域研究热点和趋势进行判断,具有宏观定量的特点[11-13]。另一方面,与同属于计量分析的Meta分析的区别在于,Meta分析仅用于单一因果指标定量分析,而文献计量用于宏观领域的定量分析[14]。文献计量学分析主要为研究者提供基于定量分析的特定领域的宏观特点、热点主题及其主要发展趋势,并且已广泛用于多领域的分析,如生态学领域[15]、精神病学研究[16]、诊断学[17]、抗生素研究[18]、城市健康[14]等诸多领域。文献计量学主题分析基于如下理论,即某研究领域出现新的研究点或该研究点逐渐被成为研究热点或者被更多的人关注和研究,其对应的MeSH主题词的频数/占比就会相应升高,反之则对应的MeSH主题词的频数/占比就会相应降低。因此,采用主题词词频或词频占比分析和趋势分析的方法可研究某宏观领域中热点主题及其变化趋势。

本研究采用文献计量的方法,综合既往国际相关论文进行量化分析,较为全面、定量分析了环境因素与出生缺陷关系研究论文的录信息和主题词,并采用词频标化法和单因素回归的方法进行了热点主题词的识别和趋势性检验。

综合本研究结果,1946~2016年的71年中,环境因素与出生缺陷关系研究呈逐渐升高趋势,65.8%的研究集中于近20年,未来将成为热点研究领域,其中72.2%的研究为人群研究证据。本研究首次基于定量的分析,总结归纳了环境因素与出生缺陷关系领域的热点研究主题,主要包括水污染、空气污染、物理因素、内分泌干扰物、化学药物、重金属、生物因素等8类环境因素;先天畸形、不良妊娠结局、肿瘤、内分泌系统紊乱、先天性基因病等10类出生缺陷健康终点;以及包括遗传物质损伤与基因表达、母婴交换在内的4方面的相关生物机制。既往的相关研究都有不同的角度对本研究的结论予以佐证[6,19-20]。

本研究可能存在的局限性在于基于主题词的热点解读可能存才的片面性和不精确的问题,未来相关研究应聚焦主题词间关联度的研究以及基于高度关联主题词簇的热点识别相关研究。

[参考文献]

[1] Congenital,Hereditary,and Neonatal Diseases and Abnormalities. U.S. National Library of Medicine. Medical Subject Headings [EB/OL]. [2015/06/05]. https://meshb.nlm.nih.gov/#/record/ui?ui=D009358.

[2] 中华人民共和国卫生部.中国出生缺陷防治报告(2012)[R].北京:中华人民共和国卫生部,2012:1-7.

[3] 金莉萍,杨丽君,徐岩英,等.国家自然科学基金资助对中国出生缺陷相关研究发展的作用[J].中华妇产科杂志,2014,49(4):306-308.

[4] 吴金华,陈坤.出生缺陷的影响因素研究进展[J].疾病监测,2009,24(1):72-75.

[5] 郭孝涵.环境因素与出生缺陷[J].国际妇产科学杂志,2013,40(6):537-540.

[6] 王真娜,姜志荣.环境因素与出生缺陷关系的研究进展[J].中国优生优育,2009,15(1):8-11.

[7] Brender JD,Weyer PJ. Agricultural Compounds in Water and Birth Defects [J]. Curr Environ Health Rep,2016,3(2):144-152.

[8] 蒲滨.化学因素对出生缺陷影响关系的研究进展[J].医学信息,2014,27(7):664-665.

[9] 李颖,杨柳,杨文方.出生缺陷的相关因素[J].中国计划生育学杂志,2010,18(12):755-757.

[10] 邱均平.我国文献计量学发展的回顾与展望[J].科学学研究,2003,21(2):143-148.

[11] 贾晓峰,郭新彪.大气污染与生殖发育关系研究的文献计量分析[J].中华预防医学杂志,2014,48(6):521-526.

[12] Jia X,Guo X,Li H,et al. Characteristics and popular topics of latest researches into the effects of air particulate matter on cardiovascular system by bibliometric analysis [J]. Inhal Toxicol,2013,25(4):211-218.

[13] Wang F,Jia X,Wang X,et al. Particulate matter and atherosclerosis:a bibliometric analysis of original research articles published in 1973-2014 [J]. BMC Public Health,2016, 16(1):348.

[14] Jia X,Dai T,and Guo X. Comprehensive exploration of urban health by bibliometric analysis:35 years and 11,299 articles [J]. Scientometrics,2014,99(3):881-894.

[15] Neff MW,Corley EA. 35 years and 160,000 articles:A bibliometric exploration of the evolution of ecology [J]. Scientometrics,2009,80(3):657-682.

[16] Baldwin C,Hughes J,Hope T,et al. Ethics and dementia:mapping the literature by bibliometric analysis [J]. Int J Geriatr Psychiatry,2003,18(1):41-54.

[17] Ho DN,Choi KY,Lee SJ. Bibliometric Analysis of Theranostics:Two Years in the Making [J]. Theranostics,2013, 3(7):527-531.

[18] Sweileh WM,Shraim NY,Al-Jabi SW,et al. Bibliometric analysis of global scientific research on carbapenem resistance(1986-2015)[J]. Ann Clin Microbiol Antimicrob,2016,15(1):56.

[19] 杜克久,徐曉白.环境雌激素研究进展[J].科学通报,2000,45(21):2241-2251.

[20] 李剑,徐飞,李少旦,等.环境雌激素研究进展[J].现代预防医学,2006,33(8):1355-1359.

(收稿日期:2017-01-15 本文编辑:程 铭)

猜你喜欢
出生缺陷文献计量环境因素
论庭院花卉种植的环境因素
我国医学数字图书馆研究的文献计量分析
国内外智库研究态势知识图谱对比分析
国内外政府信息公开研究的脉络、流派与趋势
基于文献计量分析我国生物科学素养研究状况(2001~2016年)
可靠性工程之环境因素分析与控制*
4690例孕前优生健康检查情况分析
出生缺陷危险因素分析及干预研究
孕前优生健康教育对优生优育促进作用分析
免耕播种实践及其对小麦生产环境因素的影响