赵天易 雒琳 何丽云 吕晓颖 宫嫚 李筠 李少红 李洪皎 刘佳 刘保延 艾艳珂
摘要 真实世界研究是目前中医临床研究的热点及主要研究趋势,真实世界数据的处理是关键的工作之一,在这之中多源异构数据整合是数据处理中的关键环节,但目前中医药真实世界研究领域尚未开展有关多源异构数据整合的系统研究。本文基于文献分析,总结了中医药真实世界数据的基本特征,多源异构数据整合的关键技术,梳理了多源异构的临床医学大数据整合后应用于真实世界研究的开展情况。并阐述了多源异构数据的整合技术及方法如何应用于中医药真实世界研究中,梳理了基于数据库研究的数据整合工作流程,展望如何利用该技术进一步突出中医药临床数据的特点,突破中医药真实世界研究瓶颈,改进相关问题,并论述其基础架构以及具体开展时面临的挑战。
关键词 数据整合;多源异构数据;中医药;真实世界研究;数据库研究;数据治理
Application and Prospect of Multi-source Heterogeneous Data Integration in Real-world Clinical Research in Chinese Medicine
ZHAO Tianyi1,LUO Lin1,HE Liyun1,LYU Xiaoying1,GONG Man2,LI Jun2,LI Shaohong1,LI Hongjiao1,LIU Jia1,LIU Baoyan3,AI Yanke1
( Institute of Basic Research in Clinical Medicine,China Academy of Chinese Medical Sciences,Beijing 100700,China; 2 Department of TCM,Senior Department of Hepatology,the Fifth Medical Center of Chinese PLA General Hospital,Beijing 100039,China; 3 China Academy of Chinese Medical Sciences,Beijing 100700,China)
Abstract Real-world research is the hot spot and the main trend of clinical research in Chinese medicine and the key to real-world research is the processing of real-world data.The top priority in data processing is the multi-source heterogeneous data integration.However,no systematic study on multi-source heterogeneous data integration in real-world research in Chinese medicine is available.Therefore,based on literature analysis,this paper summarized the basic characteristics of real-world data in Chinese medicine,the key techniques for multi-source heterogeneous data integration,and the application of integrated data to real-world research.Moreover,this paper described how the techniques and methods for multi-source heterogeneous data integration can be applied to real-world research in Chinese medicine,compared the workflow of data integration based on database research,foresaw how to use the technology to further highlight the characteristics of clinical data in Chinese medicine,break the bottleneck of real-world research in Chinese medicine,and resolve related problems,and discussed the challenges in both the infrastructure and implementation.
Keywords Data integration; Multi-source heterogeneous data; Chinese medicine; Real-world research; Database research; Data governance
中图分类号:R21文献标识码:Adoi:10.3969/j.issn.1673-7202.2022.05.004
随着医学信息化和大数据的不断发展,随机对照试验(Randomized Control Trial,RCT)等传统的临床实验面临着巨大的挑战,基于真实世界多样化证据的真实世界研究(Real World Study,RWS)应运而生。特别是在中医药领域,由于RCT的標准化研究设计并不完全适用于评价中医辨证论治的临床疗效,因此自2010年以来,中医学界对RWS持续探索,促进了中医药RWS的进程[1]。即使已经取得了一些成果,但RWS的整体研究水平还在起步阶段。一方面,中医药RWS数据的非结构化程度高、模糊性强、相关性强等问题是数据处理的难点[2],特别是面临整合来源不同、结构不同的数据时,目前尚无可行的操作标准或技术规范;另一方面,由于缺少理论研究作参考,研究人员往往无从下手或需要依照传统数据处理经验尝试多次或运用多个方法进行处理,增大了中医药RWS的难度,也影响数据分析的进程,难以获得高质量的研究结果。因此本文将阐述真实世界研究中多源异构数据的定义和特征,总结现有的整合方法,并基于本团队长期的工作经验,分析其在中医药领域中的应用方案,为今后开展相关工作提供参考。
真实世界数据的特征
1. 真实世界研究是中医药临床研究的重要模式
20世纪90年代,我国引入了“临床流行病学”和“循证医学”的概念,推动了医学领域的研究进程[3]。在循证医学中,最高证据水平的是高质量的RCT。但是,随着疾病谱的改变和医疗科技的进步,临床诊疗情况日益复杂,“理想”的RCT研究结果在临床实践中往往不能达到“理想”的效果[4]。其主要原因在于RCT的设计和实施过程与临床实践有诸多不同,导致其临床疗效评价结果具有较高的内部效度(Internal Validity),但其结果的外推性(External Validity)通常不高。RWS在真实的临床、社区或家庭环境下,获取多种数据,较为客观地评价某种干预措施或暴露因素对健康的影响[5-6],逐渐受到医疗工作者和研究人员的重视,成为医疗领域的研究热点。
中医药是我国最早引入并开展RWS实践的领域,RWS的研究方法符合中医的整体观念,注重综合效果的评估,但不忽略个性化治疗的特征,没有严格的纳入和排除标准,覆盖范围更广,并能根据患者的具体情况选择合适的治疗方案,中医药学的独特优势与RWS结合相得益彰[7]。因此,真实世界研究是开展中医临床研究的重要模式之一。
1.2 中医药真实世界数据的基本特征
RWS中非常关键也是最复杂的工作就是对真实世界数据的采集、处理和分析。目前普遍认为RWS的概念指来自现实临床环境,反映实际诊疗中患者健康情况和医生医疗服务过程的数据[8]。真实世界数据分为回顾性的常规医疗数据和根据研究目的主动收集的前瞻性研究数据。严格意义上来说,现实中的数据主要指的是日常采集的医疗信息,比如医院的电子病历,这也是最早提出可利用的真实世界数据。但是随着人们对数据的了解越来越多,这种常规采集的数据已经不能满足研究的要求,因此,必须根据实际情况积极地进行数据采集[9]。常规的健康医疗数据包括医院电子病历数据(Electronic Medical Record,EMR)、医保数据、体检数据、区域健康医疗数据、健康或安全监测数据(如药品不良反应自发报告数据、传染病监测数据、医院感染监测数据等)、死亡登记数据、可穿戴式设备数据及其他健康数据(如疫苗接种数据)等[9];此外还有一些大型的回顾性、公共数据库,如MIMIC-Ⅲ、SEER等。这些数据来源渠道多,存在数据结构性差、缺失多、标准不一致、数据库间外部接口不一致等问题,导致目前仍以基于单一数据来源的数据库或数据表单开展研究为主,如何整合多源异构数据,扩大数据体量和维度,是真实世界数据处理的瓶颈。
对于中医药真实世界数据来说,则更为复杂。张俊华等[10]曾分析,数据质量和数据分析是RWS的两大关键问题。目前RWS类型较为单一,主要是医院集中监测和注册登记的观察性研究,前者是对既往诊疗数据的回顾性研究,后者则是根据一定研究目的的前瞻性研究。虽然后者相对于前者能够提前建立研究型数据库,规范数据采集的格式和流程,能够更全面、标准地获取数据,但是二者都存在数据多源性的問题。影像学数据、信号数据、文本数据等结构化处理是目前研究的热点[11],特别是中医四诊客观化数据的采集和处理[12],处方数据的提取和分析[13],以及病症非结构化信息的提取和转换等中医临床数据的处理已经取得了一定成果[14]。但如何整合上述从不同来源和途径采集到的中医药临床数据,进一步与生物样本数据、临床流行病学研究数据以及临床试验数据整合,解决大数据存在的异质性,整合多种数据的优势,更好地建立、优化中医辨证论治的个体化诊疗体系,是亟须探索的问题。
2 多源异构数据的特征
2. 多源异构数据的概念
多源异构数据类似于多模态数据,但包含更多的数据类型[15]。在信息领域,模态可以理解为数据格式的存在,如文本格式、音频格式、图像格式、视频格式等格式。各种单模态信息的共生性或并发性,统称为多模态信息[16],且都是非结构化的。多源异构数据包含结构化、半结构化、无结构化等多种形式的数据,这就使得多源异构数据的融合变得非常困难。
2.2 中医真实世界研究中多源异构数据的特征
中医药临床真实世界数据主要包括临床医疗数据、研究数据及健康管理采集的数据。数据来源的多样化,混杂性较西医数据更为明显,且体量较大,关于一些变量定义存在模糊性[2]。此外,中医的整体理论,即人体局部与整体的统一,人与自然、社会的统一性、关联性和整体性的特征,形成了中医临床诊疗数据的多源异构特性。中医辨证论治的现代思维通过对症状的病机、病因分析,利用多样化的数据,综合分析后实现对个体的对症下药[17],其思维集中体现了数据的整体系统性和集成综合性。可见中医药临床数据的复杂性更高,存在更多的冗杂数据,而不同来源的数据可能对于同一中医含义有不同的表达,甚至对同一中医诊断或症状有不同的采集或记录方式,都提升了数据整合的难度。
3 多源异构数据整合方法
多源异构数据整合是一种多源的信息处理技术,能够根据所掌握的信息进行推理、判断,提高其可信度,增加可靠性,减少不确定性[18]。同一研究对象的不同数据源提供了不同方面的数据,因此多源异构数据可以弥补单个数据源数据不完整的不足,使所研究的数据更加充分,更加符合临床实践。通过消除异构数据之间的差异和各种数据源的融合进行相关分析,数据可以出现更有价值的新信息,实现“1+1>2”的效应[19-20]。
微软研究院的郑宇将异构数据整合方法分为3类[21]:1)基于阶段的数据整合方法;2)特征级数据整合方法;3)基于语义的数据整合方法。基于阶段的数据整合技术,整合数据产生过程中各个阶段产生的数据,从而达到对数据进行分析的目的[22]。然而,本方法在每个阶段,不同来源的异构数据之间都不存在交互作用,失去了异构数据之间的互补优势,导致不能跨越异构数据之间的语义差距来实现真正的内在数据整合。
基于特征的数据整合是在特征层整合的过程中,在数据处理的中间层次进行的。首先,提取各异构数据的特征,再分析和处理,形成多源异构数据的联合特征矩阵或向量[16]。基于特征的整合技术所抽取的特征和对不同类型的整合方式都会对其结果产生重要的作用。以往基于特征的整合方法较为粗糙,即直接将多源异构数据的特征串联起来,形成一个新的特征向量,然后用于聚类或因子分析。见图1。这样的特征整合方法忽略了多源异构数据特征之间的冗余性,相关性和整合效果并不理想[23]。总的来说,特征级数据整合方法各项性能居中,综合了其他2个方法的优点,没有特别突出的缺点。特别是近年来人工神经网络、深度机器学习、特征压缩聚类法、卡尔曼滤波、多假设法等多种方法的建立改善了多源异构数据的特征,在特征整合效果上有了很大的进步,这使得多源异构数据整合的研究向前迈进了一大步。
4 真实世界临床研究中的多源异构数据整合方法
目前,国内外学者在整合多源异构的真实世界数据时尚缺少详细的通用准则或者技术规范。目前仅在2021年4月由我国国家药品监督管理局印发的《真实世界证据支持药物研发与审评的指导原则(试行)》[6]中提到了多源异构数据的融合性,认为在处理多源异构数据时应先建立通用数据模型,再通过身份标识符将个体水平的数据集/库准确链接,但并未给出实际操作指导意见。
此外,真实世界临床研究中的多源异构数据整合的应用多见于对一个病症的描述或分析。如Dinov等[24]为研究帕金森病(Parkinson′s Disease,PD)风险与创伤、遗传学、环境、共病或生活方式之间的关系,收集了来自医院和社区的PD患者健康档案数据、脑影像、遗传学、临床和人口统计学数据;他们先按数据特征对单个源数据进行分类,再关联合并,利用广泛的分类方法来生成一个PD患者表型预测,再生成可重复的基于机器学习的分类,从而能够报告模型参数和基于新数据的诊断预测。某些学者则致力于临床数据和生物样本数据的整合,推动组学研究的开展,如高东平等[25]提出并设计了一套协同式的多中心临床样品生命组学信息收集、存储、检索和利用的协同网络体系,实现对不同类型数据库的一般数据采集、存储、检索和利用,实现多中心数据协同,有效地解决了多源异构、多时序临床样本数据与组学数据的整合问题,解决了临床样品生命组学大数据共享与利用服务问题,为建立疾病精准医学诊疗各类应用提供基础支撑。此外还有学者提出标准化是开展多源异构数据整合的关键问题,提出了标准体系构建的思路[26]。但是上述的多源数据主要是不同来源的医疗健康数据,涉及到的生物样本数据库可能是独立的基因组学或蛋白组学数据库,并非来自临床实际诊疗得到的检测结果。因此,如何整合不同类型来源的真实世界数据,是需要进一步讨论的问题。
5 多源异构数据整合在中医药真实世界临床研究中的应用
5. 多源异构数据整合应用的优势
《中医药信息化发展“十三五”规划》[27]指出,中医药信息化将进入实现“融入、整合、跨越”的關键时期,以国家级、省级数据中心为核心的中医药数据平台将不断收集并提供中医药大数据资源,如何将大规模病证结合中医药多源异构数据进行有效融合,是未来进行中医药大数据深层分析应用研究的关键基础问题之一。刘保延教授提出真实世界中医临床科研范式的核心是临床科研一体化,其鲜明的特征是以人为中心,以数据为导向,以问题为驱动,医疗实践与科学计算交替,从临床中来到临床中去[28]。中医药临床中的医生对所获取的诊疗数据处理就是多源、动态的,这是中医药的典型特点。中医师除了须通过望、闻、问、切收集患者的四诊信息,还可以结合中医辨证采集检查检验、穿戴设备、生存环境等多样化的数据以获得对患者病情的综合认识和全面研究[29]。在临床实践中,中医师应以人为本,以解决临床问题为目的,完成多源异构数据整合的工作,最终形成临床决策,这种模式也指导我们在开展真实世界研究时建立数据整合的方法和体系。
基于整合后多源异构数据库的中医药RWS具有以下优势:在数据完整性上,单一来源数据可能具有较强的偏倚性,比如现在多数中医院的电子病历数据,由于日常工作量大的原因,缺少详细的方剂/针灸处方,临证加减的细节整体缺失,中医诊断数据往往只有证型诊断,缺少四诊数据等;在这种大量缺失的情况下,缺失数据处理不能完全解决问题,就需要整合其他来源的数据进行补充,这种情况下可以考虑整合医疗健康数据、患者日常健康记录及相关临床试验数据。在数据准确性上,单一源的数据可能存在与临床实际不符的情况,如因为住院时长的要求,患者出院时的结局可能与电子病历记录的并不完全相符,或者在实际诊疗中并未及时记录患者辨证的变化,这可能就需要整合患者在多个医院就诊的病历数据,获取完整的诊疗过程。总的来说,多源异构数据整合应用能够大幅度提高现有中医药RWS的整体数据质量,扩大数据类型,能够更深入地挖掘临床数据;特别是在建立数据模型时,中医“证-治-效”数据的复杂性经常遇到难以详细分类的情况,利用多源数据整合,有利于保证中医特色诊疗数据的多样化,促进中医药临床规律挖掘,使研究产生的真实世界证据更符合中医辨证论治的临床实践,体现中医真实疗效。
5.2 中医药真实世界临床研究中的多源异构数据整合方案
建立一个通用的中医药RWS多源异构数据整合体系也是非常重要的。我们在此基于团队多年真实世界数据的处理经验,结合目前中医药以RWS数据库研究为主的现状,拟提出一套多源异构数据整合方案。见图2。
5.2. 多源数据采集 根据研究目的或研究人群收集不同来源的真实世界数据,建立外部接口链接各数据库外部标识符,各数据库之间可以根据不同变量建立标识符,如临床数据库可以以患者ID链接,生物样本数据库或公共数据库可以通过基因ID或疾病名链接。对于同数据源的,如同一医疗机构下不同数据库的整合,使用唯一患者ID整合链接即可。
5.2.2 数据特征分类 由于不同数据库可能存在数据重叠,或同类型数据有不同的记录方式或赋值方法,可对不同来源的数据按照数据结构和诊疗环节2个维度进行特征分类。识别数据结构时,将同含义的类型数据进行不同结构的数据转换。如患者职业,可能是以分类变量或文字数据的形式采集的,在该环节中即应进行标注,以便后续开展数据转换。诊疗数据则分为以下几类:诊断信息(中西医诊断、出入院诊断),病症信息(症状描述、发表诱因、发病部位、严重程度等),治疗信息(中西医疗法,中医治疗包括药物组成、剂型、剂量、服法、用法等),预后判断(疗效判定或评估,治疗结局描述等)以及临床检查(心/脑电图、影像学检查、实验室检查等)。
5.2.3 数据预处理 基于本团队相关经验,想要实现全数据的整合是非常困难的,主要难点在于数据预处理。我们曾试图先整合全部数据库,再进一步利用数据,但实际上各个数据库都存在较多的冗杂数据,且结构相差甚大,很难做到完全整合。因此可以在基于所收集的数据库/集的基础上,根据现阶段研究目的,制定数据提取计划和质量评估计划。随着工作逐渐开展,不断完善用于研究的整合数据库。本环节的工作是制定一定的标准对数据进行标准化、结构化处理,以供数据整合工作使用。预处理模块定义了一个数据格式,根据CDSIC、ICD-11、《中医基本名词术语中英对照国际标准》《中医临床诊疗术语·疾病部分GB/T 16751.1-1997》《中医临床诊疗术语·证候部分GB/T 16751.2-1997》《中医临床诊疗术语·治法部分GB/T 16753.1-1997》等标准文件对数据的中医术语、存储格式等进行标准化并制定数据操作规范,建立相匹配的数据字典,制定命名规则。经过对数据进行数值化、归一化,如数据类型转换和数据格式转换(如统一日期格式)及数据精简后,将数据标准化输出,提供给数据整合模块[30]。
5.2.4 数据整合 针对不同来源的中医真实世界数据,在整合前必须明确数据传输协议,包括数据类型、数据提供者、数据格式、传输方式、传输频率等。此外,还应对不同来源的数据进行质量控制,如传输测试、一致性核查等。并对数据进行盲态审核,最终确认所有数据的质疑、脱离和方案偏离、合并用药和不良事件的发生以及分析数据集的划分。数据清理完成后,数据库将被锁定,其锁定流程、负责人及执行文件必须预先设定。其后以同一外部标识符合并数据库/集,目前较常见的是同一样本在不同数据库保存有不同维度或特征的数据,在整合前建立数据字典,并划分数据属性;再利用外部标识符合并数据,再对合并后的数据进行30%的抽查完成质量评估,确认其准确性、完整性和可溯源性,并在此基础之上得到可以用于研究的数据库或数据集[31]。
5.2.5 数据分析 在数据分析阶段,应该根据子研究的具体设计和目的,在研究数据库中按照数据提取计划,合理地提取所需的数据,提取后的数据集同样需要按照30%的概率抽查,核对数据的准确性和完整性,并最终形成可直接用于统计分析的数据集。
6 结论与展望
近10年来,RWS在我国如火如荼地开展,特别是在中医药领域发展迅速,取得了很多成果;但以新药上市再评价以及中药不良反应的分析为主,用于疗效评价特别是中医辨证论治及个性化诊疗的评价还很少,这可能是受限于真实世界数据处理的难度较高。真实世界数据是医学大数据的表现形式之一;作为医学大数据的特征之一,多源异构性为大数据分析带来了机遇和挑战,具有很大的研究价值。真实世界数据的多源异构性意味着须同时处理结构化、半结构化和非结构化数据。传统的数据整合方法在多源异构数据整合中存在局限性,为了解决这个问题,学者们开展了很多研究并建立了许多新的整合方法。本文在对3种常见方法的比较分析后,认为基于特征的数据整合方法更适用于中医药真实数据的整合,并以此为理论框架,结合中医药数据特点,尝试构建了中医药RWS多源异构数据整合工作流程,为今后开展实际工作提供思路。做好数据整合工作,可以挖掘临床诊疗数据和既往临床试验数据的价值,较大程度上解決目前研究中真实世界数据完整性和准确性不足、分析结果有偏倚或难开展的问题,有助于真实评价中医药的临床疗效,解决了临床与科研脱节的问题,有利于形成新的中医药临床循证证据,具有重要的理论意义和实际应用价值。
参考文献
[1]田峰,谢雁鸣.真实世界研究:中医干预措施效果评价的新理念[J].中西医结合学报,2010,8(4):301-306.
[2]王晓丽,万生芳,魏昭晖,等.真实世界大数据下中医临床研究特点探析[J].世界最新医学信息文摘,2019,19(6):244-246.
[3]刘晓清,吴东.临床流行病学和循证医学的学科建设[J].协和医学杂志,2019,10(4):398-402.
[4]Jansen JP,Trikalinos T,Cappelleri JC,et al.Indirect treatment comparison/network meta-analysis study questionnaire to assess relevance and credibility to inform health care decision making:an ISPOR-AMCP-NPC Good Practice Task Force report[J].Value Health,2014,17(2):157-173.
[5]Schwartz JL.Real-World Evidence,Public Participation,and the FDA[J].Hastings Cent Rep,2017,47(6):7-8.
[6]方碧陶.国家药品监督管理局印发《真实世界证据支持药物研发与审评的指导原则(试行)》[J].中医药管理杂志,2020,28(2):107.
[7]陆玉林,骆文,陆丽明.开展真实世界中医药临床研究的机遇与挑战[J].中华中医药杂志,2021,36(8):4443-4446.
[8]Klonoff DC.The New FDA Real-World Evidence Program to Support Development of Drugs and Biologics[J].J Diabetes Sci Technol,2020,14(2):345-349.
[9]王雯,谭婧,任燕,等.重新认识真实世界数据研究:更新与展望[J].中国循证医学杂志,2020,20(11):1241-1246.
[10]张俊华,郑文科,张伯礼,等.真实世界研究[J].世界中医药,2019,14(12):3101-3105.
[11]袁玉虎,周雪忠,张润顺,等.面向中医临床现病史文本的命名实体抽取方法研究[J].世界科学技术-中医药现代化,2017,19(1):70-77.
[12]王俊文.常用中医诊断装备检测原理与多源信息融合方法[J].中国医疗设备,2021,36(8):157-159,164.
[13]周雪忠,刘保延,姚乃礼,等.中医临床数据库及挖掘分析平台的研究与应用探讨[J].世界科学技术-中医药现代化,2007,9(4):74-80.
[14]原旎,卢克治,袁玉虎,等.基于深度表示的中医病历症状表型命名实体抽取研究[J].世界科学技术-中医药现代化,2018,20(3):355-362.
[15]Samuel A,Sarfraz MI,Haseeb H,et al.A Framework for Composition and Enforcement of Privacy-Aware and Context-Driven Authorization Mechanism for Multimedia Big Data[J].IEEE Trans Multimedia,2015,17(9):1484-1494.
[16]Zhang LL,Xie YX,Xidao L,et al.Multi-source heterogeneous data fusion[C].成都:2018 International Conference on Artificial Intelligence and Big Data(ICAIBD),2018.
[17]刘保延.有关辨证论治临床评价若干问题的思考[J].中医杂志,2007,48(1):12-14.
[18]康耀红.数据融合理论与应用[M].西安:西安电子科技大学出版社,1997:33-35.
[19]Zhang YC,Xing TT.A New Method on Analyzing Modeling of Multi-Source Information in Complicated System[J].Tien Tzu Hsueh Pao/Acta Electronica Sinica,2009,37(11):2427-2431.
[20]Beyer J,Kai H,Hauptmann W,et al.Ensemble Learning for Multi-source Information Fusion[C].Berlin Heidelberg:The Second International Conference on Image,Video Processing and Artificial Intelligence,2010.
[21]Yu Z.Methodologies for Cross-Domain Data Fusion:An Overview[J].IEEE Transactions on Big Data,2015,1(1):16-34.
[22]Pan B,Zheng Y,Wilkie D,et al.Crowd sensing of traffic anomalies based on human mobility and social media[C].Orlando:Proceedings of the 21rd ACM International Conference on Advances in Geographical Information Systems,2013.
[23]Zhang Q,Yang LT,Chen Z,et al.A survey on deep learning for big data[J].Information Fusion,2018,42:146-157.
[24]Dinov ID,Heavner B,Tang M,et al.Predictive Big Data Analytics:A Study of Parkinson′s Disease Using Large,Complex,Heterogeneous,Incongruent,Multi-Source and Incomplete Observations[J].PLoS One,2016,11(8):e0157077.
[25]高東平,王士泉,戴阿咪.融合临床与组学数据的重大疾病生命组学协作网络平台建设初探[J].中国数字医学,2017,12(8):38-41,84.
[26]翟运开,路薇,张瑞霞,等.多维集成视角下精准医疗数据融合标准体系构建[J].中国卫生资源,2020,23(1):23-27.
[27]中医药信息化发展“十三五”规划[N].中国中医药报,2017,2017-01-26(3).
[28]刘保延.真实世界的中医临床科研范式[J].中医杂志,2013,54(6):451-455.
[29]程小恩,温川飙,许强,等.基于中医药人工智能技术探讨中医药大数据的典型特征[J].世界科学技术-中医药现代化,2020,22(4):1243-1248.
[30]闫世艳,郭中宁,何丽云,等.临床研究缺失数据多重填补敏感性分析方法[J].世界科学技术-中医药现代化,2020,22(3):819-824.
[31]熊文娟.基于大数据中医电子病历数字化标准操作流程构建研究[D].武汉:湖北中医药大学,2020.
(2022-01-10收稿 本文编辑:吴珊)