, ,
《美国医学信息学会杂志》(Journal of the American Medical Informatics Association,JAMIA)由美国医学信息学会主办,2015年的影响因子为3.428(数据来自2015版的JCR),双月刊,在医学信息学领域具有很大的影响力。通过对该刊近10年的载文进行文献计量分析,从侧面反映当前国外医学信息学的研究现状,为医学信息学相关研究人员提供参考。
数据来源于生物医学文献数据库MEDLINE,以《美国医学信息学会杂志》2006-2015年载文为研究样本,采用的检索策略为“J Am Med Inform Assoc”[Journal] AND (“2006/01/01”[PDAT] : “2015/12/31”[PDAT])。
以XML格式套录检索结果,运用书目共现分析系统BICOMB[1]统计并抽取文献记录中的主要主题词与副主题词,按照出现频次由高到低进行排序,选取频次≥22的主题词/副主题词作为高频词(表1)。
根据高频词在每篇文献记录中出现的情况,对高频主题词进行统计,形成高频词词篇矩阵。将词篇矩阵输入gCLUTO软件,采用系统聚类法对所得词篇矩阵进行聚类分析,聚类分析的结果可以反映出高频词之间的亲疏关系,根据高频主题词的聚类结果以及主题词之间的语义关系,总结出《美国医学信息学会杂志》的研究热点。
表1 《美国医学信息学会杂志》高频主题词/副主题词(频次≥22)
共得到1 644篇文献记录。聚类结果见图1,其中横轴代表文献,纵轴代表聚类的主题词/副主题词。两词聚集到一起的距离越短,关系越密切。
图1 《美国医学信息学会杂志》高频主题词聚类
首先,根据每一类高频词的含义以及这些主题词之间的语义关系,总结出每一类主题词所代表的研究热点,即《美国医学信息学会杂志》近10年的研究热点。如主题词Artificial Intelligence (人工智能)和Algorithms(算法)距离较近,关系密切,首先聚成一类;Population Surveillance / methods(人口监测/方法)再与前面两个词合成一类,依此类推。通过分析这些主题词的语义关系可得出它们所代表的类团含义标签,综合各个类别的类标签可以得出该刊的研究热点。其次,利用gCLUTO软件计算各类成员对聚类贡献率的指标(描述度Descriptive和区分度Descriminating),选择对每一类形成贡献最大的来源文献作为表示该类内容的类标签文献,通过文献内容进一步阐述该研究方向的具体内容[2](图2)。
图2 类成员对聚类贡献率指标
通过对2006-2015年《美国医学信息学会杂志》载文的高频主题词/副主题词进行共现聚类分析,可将该期刊的研究热点总结为3个方面、8个主题方向。
3.1.1 临床相关软件或平台开发设计的研究
为了提高管理效率和服务质量,为患者提供更好的医疗服务,与其相关的各种平台或软件不断被研发出来。该类所含的主题词有Information Storage and Retrieval、Computerized Medical Records System、User-Computer Interface、Software、Controlled Vocabulary,研究内容包括能够消除病人标识信息的软件设计[3]、可降低医疗费用的健康信息技术平台的设计[4]、前列腺癌预后评估软件的开发[5]、结构化临床文本术语接口的实现[6]等。
3.1.2 建立临床数据研究网络的研究
为提高临床数据的利用并实现其价值,临床数据研究网络不断涌现。该类所含的主题词有Electronic Health Records/organization& administration、Patient-Centered Care、Computer Communication Networks,研究内容如国家健康中心数据增值网络的实现[7]和促进电子健康数据有效利用的临床数据研究网络的构建[8-11]。
3.1.3 患者隐私的保护研究
网络技术在医疗卫生领域的应用推动了医疗信息共享的发展,复杂的网络环境为患者隐私的保护提出了新的挑战。该类所含的主题词有Computer Security、Confidentiality、Information Dissemination、Medical Record Linkage。研究内容包括在保护病人隐私的前提下,为促进临床数据研究共享,通过构造专家驱动算法来减少病人身份重复识别所带来风险的研究[12]、Bloom filter算法与密码学在保护病人隐私方面有效性的实证研究[13]、DNA测序数据中一种新型的隐私保护加密模式[14]和差别隐私的研究[15]等等。
3.1.4 基于网络的个人健康管理系统的相关研究
个人健康管理系统旨在实现个人健康信息的采集管理、个人健康状况的分析,并提供个性化的健康促进和干预方案,动态追踪个人健康状况,为用户提供健康管理服务,使医务工作者能够短时间掌握患者的情况,提高医疗效果。该类包含的主题词有Personal Health Records、Internet、Attitude to computers、Attitude to personnel,研究内容包括基于网络的个人健康管理系统在季节性流感疫苗接种以及初级保健服务利用中的效果评价[16]、基于网络的个人健康管理系统提高了年轻人性传播疾病筛查率的随机对照试验研究[17]等。
3.2.1 自然语言处理和数据挖掘的研究
主要包括电子病历的自然语言处理、信息抽取以及分类、聚类等方面的研究。该类包含的主题词有Support Vector Machine、Data Mining/methods、Electronic Health Records、Natural Language Processing,研究内容如临床记录医学概念中指代关系的自动解决方案研究[18]、通过对关键词特点的分类减少支持向量机对临床文本分析过程中大训练数据集的依赖[19]、在医学摘要分类中支持向量机与多项朴素贝叶斯算法的比较研究[20]。
3.2.2 临床决策支持系统和计算机辅助药物治疗
临床决策支持系统能够在诊疗过程中提供实时帮助,根据患者的病情生成各种可供选择的诊疗方法及用药参考,减少医疗差错的发生。涉及的主题词有Guideline Adherence、Clinical Decision Support Systems、Data Ming 、Electronic Health Records/standards、Electronic Prescribing、Medication Errors/prevention & control、Medical Order Entry Systems、Computer-Assisted Drug Therapy、Reminder Systems,研究内容包括临床决策支持系统在急诊病人轻度颅脑损伤CT诊断中的应用效果研究[21]、临床决策支持系统在肺结核与缺铁性贫血风险评估中的实证研究[22]、临床决策支持系统在哮喘评估与管理中的精准度研究[23]、决策支持在提高临床医生处方行为中的证据支持研究[24]、肾功能不全患者用药物剂量调整决策支持研究[25]、电子病历处方安全的长期随访评估显示临床决策支持系统能最大程度地保障处方安全[26]、临床决策支持系统能在很大程度上减少医疗差错[27]。
3.2.3 人群监测方法的相关研究
主要包括采用某些算法对传染病进行监测,包含的主题词有Diffusion of Innovation、Physicians′Practice Patterns、Electronic Health Records/utilizatio、Artificial Intelligence、Algorithms、Population Surveillance / methods,研究内容如基于秩次的空间聚类算法检测疫情的爆发[28]。
主要包括生物信息学领域相关概念、范式的研究,包含的主题词有Information Systems、Biomedical Research、Medical Informatics,研究内容涉及生物信息学研究的新范式[29]等。
通过对《美国医学信息学会杂志》近10年的载文进行分析,发现其研究热点主要集中于临床相关软件或平台开发设计、患者隐私的保护、自然语言处理与数据挖掘、临床决策支持系统等。伴随着计算机、网络和信息技术的快速发展,医学信息学的研究领域日趋广泛,数据挖掘与人工智能在临床诊疗中发挥的作用也与日俱增,自然语言处理与数据挖掘的应用将会更加深入,临床决策支持系统将更好地服务于诊疗过程。