基于大数据的中医药临床研究

2017-04-04 14:16井含光孟庆刚
世界中医药 2017年11期
关键词:中医药临床研究

陈 澈 井含光 孟庆刚

(北京中医药大学,北京,100029)

基于大数据的中医药临床研究

陈 澈 井含光 孟庆刚

(北京中医药大学,北京,100029)

随着科技和互联网的发展,医学研究已步入大数据时代。在信息爆炸的大数据背景下,传统中医药研究逐渐显现出不足,而基于大数据的中医临床研究更适合真实世界研究。文章分析了大数据思维与中医思维相关性、梳理了目前中医药临床研究现状及存在的局限性,提出在大数据背景下应建立新的研究思路,即大数据临床研究(BCT),并且充分利用数据挖掘技术探索数据价值,以期为今后中医药研究方向提供一定的可行性及参考价值。

大数据;临床研究;数据挖掘;中医药

美国麦肯锡公司在2011年发表一篇有关大数据的报告,意味着大数据时代已经到来。大数据(Big Data)是指数据量庞大、数据结构复杂且依靠传统研究方法和手段难以处理的数据集。它包含规模巨大(Volume)、类型丰富(Variety)、处理迅速(Velocity)以及蕴含价值(Value)等4大特征[1]。与其他学科不同,医学领域涉及的大数据既与通识大数据概念相吻合,又有医学自身的独特之处[2]。大数据时代给中医药发展带来了机遇,中医临床研究该如何适应这种变化就成为亟需思考的问题。现从大数据角度着手,对中医临床研究现状及未来发展作一简述。

1 大数据与中医药相关性

1.1 整体性 整体观源于《易经》的原始系统观念,成于《内经》“天人合一”的自然整体论与元体-阴阳-五行学说的有机自然观[3]。作为中医学理论体系的基本特点之一,中医学以整体观作为指导思想,主要体现在以下3个方面:人与自然环境具有密切联系、人体内部是一个有机整体以及人与社会环境之间同样存在协调统一。因此要从整体角度揭示研究对象内部及与外部间的关系、结构和功能。其次,在治疗方面,中医亦强调从整体调节阴阳气血的变化、改善脏腑功能失调,消除病变对全身作用的影响,从而通过整体的治疗效应,达到祛病防变的目的。另外,现代中医的诊疗数据具有“全数据”的特点,不仅包括四诊合参的信息,还包括各类理化生物学指标,形成全面描述[4]。这一点与大数据思维相吻合。大数据中的海量数据并不是孤立存在的,必须结合在一起才具有利用价值。随着云计算、物联网等新一代信息技术的诞生,大数据可以对纷繁复杂的数据进行收集和处理,相对于传统的只针对海量数据中的一小部分进行处理的方法(即用部分取代整体),大数据将整体变成一个数据化的整体,从全局入手,将全部数据作为分析的对象,更强调数据完整性。即维克托·迈尔·舍恩伯格在《大数据时代》中所提到的思维转变:不是随机样本,而是全体数据[5]。

1.2 复杂性 中医是一个开放的复杂巨系统,复杂系统层次上的性质不适合用简单还原论思维,即通过分析各组成部分而完全解释和进行研究。比如整体大于部分之和,人体功能并不是几个脏腑功能的简单叠加;再如,相同中药组成的方剂,若调整中药剂量比例,功效主治也会完全不同;又如,中医的证候研究,涉及多方面要素,且这些要素之间存在动态相互作用,辨证过程中会存在大量不确定信息。在疾病的不同阶段,证也会呈现出差异,且不同的医生对四诊信息的判断也是不确定的。这种非线性和涌现性特征反映了中医学复杂性和多样性的特点。目前兴起的大数据技术不但能够对复杂性和多样性数据进行兼容并包,而且可以从技术层面上解决来自不同路径、不同模式、不同格式的各种数据[6],能够为中医数据处理及临床研究提供可靠的技术支持。但是,由于数据从零散的、单一的,发展到海量的、集成化的,容量相对较大,其获取数据信息的渠道亦相对较多,数据的来源和范围非常广泛,因此大数据内的数据具有一定的复杂性。对大数据中相关信息进行计算时,应用传统的机器和计算模式则无法提取其中的有效信息,需要针对数据模型和特征模型,对相对复杂的数据进行新的研究和处理[7]。

1.3 开放性 开放性是指系统本身及其子系统与周围环境之间存在物质交换、能量交换和信息交换[8]。中医理论主张“天人合一”“生气通天”,其研究的主体“人”即具备开放性。首先,构成人体的基本物质依赖于“天地之气生”,人的生命是宇宙(天)演化的产物,与自然界是交互存在的,即“人生于地,悬命于天”;其次,人体可以通过适应外部环境的变化,并根据这种环境变化调整自身的行为活动。也就是说,人体的生理和病理受到四时天地的影响,疾病的防治要顺应于自然的变化,与日月相应。大数据同样具有开放性,大数据的核心即在于数据的相互交叉与流动。因为数据是不断变化的,这种增减变化不是死的和封闭的,而是开放的。开放的目的则是通过数据的共享来产生和创造更多的价值。大数据时代出现的智能技术、开源数据库、健康数据管理平台以及一些支持在线数据收集、数据分析及应用决策技术的平台[9],打破了封闭的信息孤岛,方便了数据的开放和流通,提高了数据的获取率和利用率,为人们得到并利用数据挖掘其中的信息提供了方便。

1.4 关联性 若一个数据变化会引起另一个数据的变化,则称这2个数据具有关联性。通过分析相关性,可以找出数据集里隐藏的相互关系网。大数据构成了数量巨大、结构复杂、类型众多的数据集合[10],这种数据并非零散的信息碎片,而是依据一定的内涵联系在一起的。在传统研究中,人们倾向于寻找数据间的因果关系,而当现代科技能够获得全部数据并找出相关联系时,数据的精准性就显得不为重要。大数据研究与传统逻辑推理研究不同,需要对海量数据进行整理、挖掘、比较、聚类等分析以发现变量之间的规律性[11]。这种从因果关系到相关关系的思维转变,强调了数据的关联性。中医药研究中存在大量不精确的描述和大量的隐性知识,如中医专业术语及专家诊疗经验。这些隐性知识是中医医家在临床实践中形成的、个体所拥有的、难以用文字描述和语言传授的知识和体验,阻碍了中医知识的转化和共享。传统研究方法无法对这些隐含的、特殊的联系及规律进行正确处理。而大数据通过对整体数据进行挖掘分析,可以将模糊数据中反映的关联信息呈现出来[12],将隐性知识显性化,便于人们理解和知识传递。

1.5 层次性 中医理论体系所探讨的人体功能结构并不是简单的数学关系,而是由不同功能、不同层次的子系统组成,具有复杂而繁多的层级结构的特性。各个层次之间并不是孤立的,而是具有多功能、多结构,并且相互络属与联结[13]。中医学理论是以阴阳、五行、五脏等构成的体系,从“气、血、津、液”到经络系统,再到脏腑,皆包含着以五脏为中心的多因素、多层次的观念与思维,且每个子系统仍然能划分出相应等级与层次的内容。中医理论即利用它们之间功能的层次和涌现特征来说明人体结构、脏腑生理功能、病理变化以及对疾病的诊断和治疗。大数据同样具有层次性。第一,从大数据的构成方面,数据分为初级、中级、高级等多个不同层次,且各个层次之间并不是独立的,而是相互作用、相互制约、相互影响,有时多层数据之间还存在协同作用[14];第二,从大数据的预测角度来讲,有学者将其分为3个层次[11]:找到数据、将数据分类、进一步确定数据特征;第三,随着资源流通和共享,大数据的内容也在发生转变,开始从单一的转变为学科相互交叉的数据资源,这也体现了研究对象和内容的多层次性。

2 中医药临床研究的局限性

2.1 重视数据普遍性而忽略特殊性 随机对照试验(RCT)是中医药临床实践中的主流研究方法,但由于过分重视最佳证据的获取,容易导致普遍性与特殊性的矛盾。RCT多基于群体性特征,为了保证各组的同质性与均衡性,试验前会采用随机化的方法来最大程度地消除混杂因素的干扰[15-16]。这就是说,进行研究时,受试者都是依据一定的诊断标准、纳入标准以及排除标准来进行筛选而入组的,且临床研究中的受试者一般都是病情稳定、疾病单一、且危险性较低的人群。为了最大程度减少偏倚,不会考虑患者的体质、合并症以及特殊生理时期等情况。然而在实际诊疗中,患者往往呈现出较大的个体差异,有些患者病情复杂,兼杂它病,并不单纯。此外,中医强调辨证论治,中医诊疗具有个体性、特殊性、复杂性,患者在疾病的不同阶段证候表现各异,不同的医生也会依据自身的经验给出不同的治法与方药,因此临床上很难遇到一批真正符合研究纳入与排除标准的受试者。其次,在对研究结果进行统计分析时,对于一些严重偏离的数据,研究者常会将其予以剔除,不进行分析与讨论。如此一来,就会显得证据效力不足,难以体现出真实的研究结果。

2.2 对证候动态变化重视不足 辨证论治是中医诊疗的核心,中医的“证”是指疾病发展过程中某一阶段的病理变化的本质,代表了疾病某阶段的主要矛盾。“证候”是指患者在疾病发展过程中的某一阶段所表现出来的一系列症状和体征的概括,即证候是表现在患者身上的异常征象,为“证”的外在表现[17]。由于疾病过程是不断发展和变化的,因此反映疾病阶段本质的证候也存在连续性发展和动态变化。目前临床观察或临床研究中,大多采用一种治疗手段针对某疾病的单一证候进行研究,且疗程较长,甚至达数月。在统计分析时,简单地将基线数据与最终数据进行比较,以此说明治疗效果。这种方法偏于静态,忽略了整体和证候的动态变化过程,未经动态辨证就得出结论,可信度较低,且较为笼统。辨证论治的前提是需要动态把握整体[18],由于中医证候在疾病发展的不同阶段会随着症状及体征的改变而变化,在这过程中必然会产生大量、复杂的诊疗数据,目前中医临床研究采用这种从头至尾单一的治疗方式及简单而欠严谨的统计学处理方法,既不能体现出中医药临床研究的特点,也不符合临床实际。

2.3 医者对患者认知思维存在不同 中医诊疗是医者在望、闻、问、切的基础上,采集患者信息,通过分析内在联系,进行综合、归纳和整理,认清疾病根源及病变本质,作出判断,并根据中医“理、法、方、药”的指导,辨病辨证选取适当治疗方法和处方用药的复杂认知过程。医者在处理和传送所接收的信息时具有极大的主动性与灵活性。虽然对于患者来说,呈现在不同医者面前的是完全相同的个体,其表现出来的体征与其描述的临床症状亦是相同的。但不同的医者也许会作出不尽相同的疾病诊断与治则治法。这个对患者进行信息获取、分析、整合与判断的过程是极其复杂的[19]。中医诊疗决策不是简单的主观上随意臆断,而是一个依靠个人经验、知识和能力进行思考,并反复检验与修正的过程。由于受到生活环境、自身医学背景知识、个人临床经验和当下默会能力的制约,不同医者的认知能力呈现出明显高低层次之分,诊疗决策水平也是参差不齐。目前的中医临床实践属于经验性知识,存在大量只可意会、不可言传的隐性知识,如何保证临床诊疗思维的准确性,将这些知识合理描述,就成为急需研究的问题。

3 在大数据背景下对中医药临床研究的思考

3.1 建立新的临床研究思路 目前随机对照试验在临床研究中占主导地位,但并不能认为RCT就是最优的。首先,在临床证据的获取过程中,会受到一些其他因素的干扰,使得最佳证据并非真正意义上的最佳证据。其次,目前针对临床研究的统计学方法主要是分析基线水平与某个结局指标之间的关系,属于点对点分析,结果欠严谨,尚未找到一个较理想和合理的统计方法来分析基线及长期随访的动态过程与结局之间产生的大量数据间的关系[20]。这种情况下,有学者提出[21]Big data Clinical Trial(BCT)的概念,是指在大数据时代背景下,基于随机对照试验的指导、通过大数据应用方法开展的临床研究。中医在临床诊疗实践过程中会产生并积累海量数据,加上中医以辨证论治为核心,强调个体化治疗,研究时不得不考虑其非线性及复杂性特点,因此随机对照试验的研究方法并不完全适合中医药临床研究。而相比传统RCT研究的依靠部分人群指导大样本人群的临床诊疗,大数据临床研究收集的数据和考虑的因素更为全面与完善,大数据统计分析亦是基于总体样本进行的,不仅能全面展示数据信息特征的相关性,而且能客观地反映临床研究的真实情况,从而得出更适于中医临床应用和推广的结果[22]。

3.2 利用数据挖掘技术呈现数据价值 中医药发展进程中,不论是古籍文献还是临床实践均积累了海量的内容,它们包含许多隐性知识,但信息庞杂,处理困难,使得这些资源形成信息孤岛。为了解决这一问题,当务之急应建立数据平台,将诊疗信息和文献古籍等非结构化的原始数据进行处理,既能在大数据环境下实现资源共享,也能随时调用数据进行统计分析及数据挖掘,找到数据内部的新知识及规律,以指导临床实践。目前数据挖掘技术包括关联规则、聚类分析、决策树、神经网络、贝叶斯网络、多示例学习和多标记学习等几大类。与统计分析稍有不同,统计分析主要是验证性处理,而数据挖掘是从大规模数据中揭示出隐含的、未知的并有潜在价值的新知识的过程[23-24]。对大数据的分析技术是挖掘大数据中蕴藏价值的关键,它包括海量数据的存储技术、数据计算技术、数据的集成与融合、数据的分析技术。传统的小数据研究方法是基于全样本中的部分数据,对其进行归纳、总结、逻辑分析和认知。这种方法只能解决简单问题,而对于具有庞大数据量的复杂性问题就略显不足。大数据时代,对数据的分析要求是整体状态的全场景数据,数据分析应采用复杂性科学的智能分析方法建模、仿真,利用大数据进行机器学习,并不断地优化、分析和研究复杂系统的自组织及演化规律[25]。与现代科技相结合,将大数据的挖掘技术应用于疾病发展规律、预后、证候标准化、诊疗经验总结及临床疗效评价中会是今后中医药研究的发展方向。

4 小结

大数据时代的到来,不仅在很大程度上方便人们收集信息、获取数据,并提高分析处理数据的能力,也使人们的思维方式发生了转变。在大数据研究中,每一个个体的数据均会被全方位记录下来,包括静态数据与动态数据,当数据信息量达到一定程度的时候,大数据可完整地刻画其内在关系及其涌现现象。这给医学研究的发展带来了机遇和曙光,对于中医药临床研究具有重要意义。大数据思维与中医思维都具有整体性、复杂性、开放性、关联性和层次性特征,说明中医药临床更适合用大数据技术来研究和处理。基于大数据的理念以及真实世界的临床研究模式,使研究者不需要再去刻意寻求疾病发生发展全过程的因果关系,而是将关注点转移到了疾病干预措施与结局指标的相关关系研究上,这无疑给中医药发展带来了重大契机[26]。不过,基于大数据进行中医药临床研究需要注意以下方面:首先,大数据具有开放性,是面向用户、面向需求的,只有通过不断完善、共享与交流才能更好地实现大数据的应用和价值的挖掘;其次,基于大数据进行的临床研究不在于掌握了多大数据信息,而在于对数据进行专业化处理,因此有必要形成中医药临床大数据,充分利用好积累的数据和信息,使之成为有意义的资源;另外,大数据知识提纯难度高,进行研究必须最大限度地集成各个学科的知识和方法,结合中医自身特点,应用深度挖掘,才能显示它巨大的数据价值,如基础医学、临床医学、计算机、统计学、工程领域等等知识,并且人机结合,将定性的感性知识与定量的理性知识相结合,这样才能充分利用大数据的优势促进中医药进一步发展。

[1]Zikopoulos PC.Understanding Big Data[M].New York:Mc Graw Hill,2013:5-9.

[2]Toga AW,Foster I,Kesselman C,et al.Big biomedical data as the key resource for discovery science[J].J Am Med Inform Assoc,2015,22(6):1126-1131.

[3]曾克武.中药复杂体系现代化研究方略与思考[M].北京:科学出版社,2016:9-10.

[4]崔蒙,李海燕,雷蕾,等.“大数据”时代与中医药“知识密集型”数据[J].中国中医药图书情报杂志,2013,37(3):1-3.

[5]维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:10.

[6]Michael Wessler.Big Data Analytics for Dummies[M].New Jersey:John Wiley & Sons,Inc.,2013:6.

[7]孙阳,唐出贤,王东.大数据及其科学问题与方法分析[J].信息通信,2017,30(4):157-158.

[8]祝世讷.中医是第一门复杂性科学[J].山东中医药大学学报,2016,40(2):99-101,130.

[9]朱琳,赵涵菁,王永坤,等.全局数据:大数据时代数据治理的新范式[J].电子商务,2016,157(1):34-42.

[10]刘小刚.国外大数据产业的发展及启示[J].金融经济,2013,31(18):224-226.

[11]吕本富,陈健.大数据预测研究及相关问题[J].科技促进发展,2014,10(1):60-65.

[12]黄欣荣,张艳朋.大数据技术与中医现代化[J].中医杂志,2014,55(19):1621-1625.

[13]高晓宇,张哲,杨关林.从系统论角度阐释脾藏象理论[J].中医杂志,2016,57(19):1621-1625.

[14]朱江涛.关于大数据的系统哲学思考[J].中国高新技术企业,2016,22(3):17-18.

[15]章仲恒.大数据与临床科研[J].临床与病理杂志,2014,34(5):492-497.

[16]徐丹,张哲,张会永,等.解释性RCT和实用性RCT在中医药临床研究中应用比较[J].中华中医药学刊,2011,29(7):1529-1532.

[17]刘钊乐.中医证候表征方式对辨证诊断思维影响的研究[D].济南:山东中医药大学,2015.

[18]文理,王键.《黄帝内经》中动态整体的辨证论治[J].中华中医药杂志,2012,27(4):1111-1114.

[19]王连心.基于系统复杂性科学及其方法论的中医诊疗认知规律研究[D].北京:北京中医药大学,2009.

[20]宋勇,汪道远.大数据时代临床研究的机遇与挑战[J].医学研究生学报,2014,27(4):337-339.

[21]Stephen D Wang.Opportunities and challenges of clinical research in the big-data era:from RCT to BCT[J].J Thorac Dis,2013,5(6):721-723.

[22]赵天易,陈波,潘兴芳,等.大数据时代对中医针灸临床研究的启示[J].中国针灸,2015,35(9):938-942.

[23]谢琪,江丽杰,刘保延,等.开展真实世界中医药效果比较研究的关键问题及对策的探讨[J].世界中医药,2014,9(1):28-31.

[24]吴嘉瑞,唐仕欢,郭位先,等.基于数据挖掘的名老中医经验传承研究述评[J].中国中药杂志,2014,39(4):615-616.

[25]宋刚,张楠,朱慧.城市管理复杂性与基于大数据的应对策略研究[J].城市发展研究,2014,21(8):95-102.

[26]刘保延.真实世界的中医临床科研范式[J].中医杂志,2013,54(6):451-455.

RecognitionofTCMClinicalResearchBasedonBigData

Chen Che,Jing Hanguang,Meng Qinggang

(BeijingUniversityofChineseMedicine,Beijing100029,China)

As the development of science,technology and the Internet,medical research has entered the era of big data.Under the background of information explosion,the traditional Chinese medicine research gradually shows some defects while it is more suitable for the study of the real world to be based on big data.This paper analyzed the correlation between big data and traditional Chinese medicine,combing the current status and limitations of traditional Chinese medicine clinical research.We proposed new a research idea (Big data Clinical Trail) which should be set up under the background of big data.In addition,we should make full use of data mining technique to explore the value of it in order to provide a certain feasibility and reference value for the research direction of Chinese medicine.

Big Data; Clinical Research; Data Mining; TCM

国家自然科学基金面上项目(81473800)

陈澈(1989.04—),女,在读博士研究生,研究方向:中医理论体系研究,E-mail:395203451@qq.com

孟庆刚(1964.08—),男,博士,教授,主任医师,博士研究生导师,研究方向:中医理论体系研究,Tel:(010)64286642,E-mail:mqgangzy@126.com

R242;N39

A

10.3969/j.issn.1673-7202.2017.11.071

(2016-10-20收稿 责任编辑:杨觉雄)

猜你喜欢
中医药临床研究
FMS与YBT相关性的实证研究
辽代千人邑研究述论
中医药在恶性肿瘤防治中的应用
中医药在治疗恶性肿瘤骨转移中的应用
普外急腹症临床治疗的初步探讨
视错觉在平面设计中的应用与研究
EMA伺服控制系统研究
从《中医药法》看直销
中医药立法:不是“管”而是“促”
元胡止痛膏治疗软组织损伤的临床观察