崔蒙++李海燕++杨硕++高博++胡雪琴++朱玲
摘要:中医药信息学要获得创新发展,必须重视学科的理论科学发展。中医药信息学在理论科学领域中主要开展了4个方面的研究:非线性科学对中医药科学发展的影响;大数据理念对中医药信息学发展的影响以及中医药信息与数据所具有的特点;探讨在虚拟世界中重现意象世界的可能性及其所具有的理论意义;中医药信息学的原理与方法学。
关键词:中医药信息学;理论科学;非线性科学;大数据;虚拟世界;意象世界
2014年5月15日,中国科学院白春礼院长在《光明日报》上发表了一篇题名为《创新驱动发展战略靠什么支撑?——从科学、技术、工程的概念说起》的文章。他在文章一开始写到,“‘基础研究有什么用?这是大家常常讨论的话题。我想,明代徐光启所说的‘无用之用,众用之基,法拉第所说的‘问基础研究有什么用就好像问一个初生的婴儿有什么用,都是很好的回答。基础研究的‘用,首先体现在它对经济社会发展无所不在的作用,在我们现实生活中广泛使用的半导体、计算机、激光技术等,都是基础研究成果的实际应用”。1883年8月15日,美国著名物理学家、美国物理学会第一任会长Henry Augustus Rowland(1848 -1901年)在美国科学促进会(AAAS)年会上做了题为《为纯科学呼吁》的演讲。该演讲的文字后发表在1883年8月24日出版的《科学》(Science)上,被誉为“美国科学的独立宣言”。他在文章中有这样的论述:“我时常被问及这样的问题:纯科学与应用科学究竟哪个对世界更重要。为了应用科学,科学本身必须存在。”由此可见,理论科学的发展对科学的发展具有举足轻重的作用,中医药信息学要获得创新发展,必须重视学科的理论科学发展。在理论科学领域中,中医药信息学主要开展了4个方面的研究,第一是非线性科学对中医药学发展的影响,相对于技术而言,特别是对“中医药科学”发展的影响;第二是大数据理念对中医药信息学发展的影响,以及中医药信息与数据所具有的特点;第三是探讨在虚拟世界中重现意象世界真实的可能性及其所具有的理论意义;第四是本学科的原理与方法学。
1 非线性科学对中医药科学发展的影响
在很长一段时间里,以为阻碍中医药学发展的重要因素之一是技术发展缓慢。为此,我们探讨20世纪还原论引起科学进步所产生的技术、小数据理念下产生的技术、大数据理念下产生的技术,以及所有这些技术对中医药学发展的影响,得出技术发展缓慢是阻碍中医药发展的重要因素之一的结论。
实际上,科学发展缓慢才是导致技术发展缓慢的根本原因。中医药学的传统技术在很长一段时间内没有得到明显发展,确实严重阻碍了中医药学的发展,而其不能与现代科学技术相融合也是阻碍中医药学发展的重要原因。但近百年来,现代科学所产生的那些技术之所以不能被中医药学很好地利用,其根本原因还在于中医药学没有很好地与“现代科学”融合,而不仅仅是“技术”。我们总是在谈论,中医药学基于的科学基础无法很好地利用基于还原论科学所产生的技术,但事实是,即使是在复杂科学基础上产生的技术也未必就能很好地为中医药学所利用。因此,如果只停留在技术层面,不去发展中医药科学,那么无论怎样机械地引入现代技术都很难助力于中医药学传统技术的发展。
那么,现代非线性科学是否可以和中医药学融合呢?答案是肯定的。
100多年前出现的量子力学已经超出了还原论的范畴,其所提出的不确定性原理、测不准原理、叠加态等理念已经产生了与中医个体化诊疗的科学基础融合的条件。70多年前产生的“老三论”更是进一步确定了系统的观点。美籍奥地利生物学家塔朗菲创立的系统论认为,世界上的一切事物、现象和过程几乎都是有机整体且自成系统、互为系统;美国数学家维纳首次提出的控制论,是研究动态系统在变化的环境条件下如何保持平衡状态或稳定状态的科学;美国数学家克劳德·香农创立的信息论认为,系统正是通过获取、传递、加工与处理信息而实现其有目的的运动;有关系统的讨论,“老三论”的理念与中医药学有关天人合一的整体、系统的科学思想相一致。
40多年前产生的“新三论”则进一步探讨了平衡态的问题。1969年,比利时物理学家普利高津提出耗散结构论,认为系统只有在远离平衡的条件下,才有可能向着有秩序、有组织、多功能的方向进化;联邦德国科学家哈肯创立的协同论认为,系统从无序到有序的过程中,不管原先是平衡相变,还是非平衡相变,都是遵守相同的基本规律,即协调规律;法国数学家托姆创立突变论,并提出非线性系统从某一个稳定态(平衡态)到另一个稳定态的转化,是以突变形式发生的。有关平衡态的讨论,“新三论”的理念与中医药学追求人与自然和谐、人体自身平衡的科学思想是一致的。其后,美籍数学家芒德勃罗提出分形理论,用分数维度的视角和数学方法描述和研究客观事物,跳出一维线、二维面、三维立体乃至四维时空的传统藩篱,更加符合客观事物的多样性与复杂性,自相似原则和迭代生成原则是分形理论的重要原则;而自相似原则与迭代生成原则也与中医药学的比象取类的科学思想相吻合。
美国气象学家爱德华·诺顿·洛伦茨提出的混沌理论认为,混沌是决定性动力学系统中出现的一种貌似随机的运动,其本质是系统的长期行为对初始条件的敏感性;这与中医药学自古以来就非常重视人体平衡态的变化对初始条件的依赖性的科学思想相吻合。
最新出现的复杂性科学理论则提出,复杂性科学有3个主要特点:一是研究的对象是复杂系统;二是研究的方法是定性判断与定量计算相结合、微观分析与宏观观察相结合、还原论与整体论相结合、科学推理与哲学思辨相结合;三是研究的深度不限于对客观事物的描述,而着重于揭示客观事物的构成原因、演化历程及其复杂机理,并尽可能准确地预测其未来发展;其所提出的研究对象、研究方法与研究深度均与中医药学的科学思想相吻合。
由此可见,中医药学的科学基础已经可以与现代科学,特别是现代理论科学相融合,而基于现代理论科学所产生的一切应用科学和工程技术都应该可以被中医药学所吸收,但前提条件是,我们首先要吸收现代理论科学的理念,完善中医药科学。
2 大数据理念对中医药信息学的影响
2.1 中医药信息的特点
中医药信息是整体信息、认识信息、现象信息及时间信息。
2.1.1 整体信息相对重视客体内部各部分及其与外部交流,相互间影响后产生的整体变化状态与方式。中医药信息是完全开放环境下的信息,人体与自然、社会交流和联系产生的综合状态。中医药信息的开放性决定了中医药信息的系统性和整体性。
2.1.2 认识信息相对重视主体认识与客体信息融合后包括观察在内的体验信息。从信息的层次上看,中医药信息是认识论层次的信息,而不是本体论信息,其特征是与主体相关,即是主客融合的信息。中医药学获取人体信息时,常用的手段为望、闻、问、切四诊手段,获得的信息是包含观测信息在内的体验信息。没有中医药学的长期实践及其所建立的知识体系,就不会产生中医药的体验信息。
2.1.3 现象信息相对重视客体包含了大量稳定与不稳定关系的包括本质在内的现象变化状态与方式。中医药信息注重信息变化的关联性,主要表现在中医药信息是包含本质在内的现象信息,不稳定关系的获取是中医药信息获取的特征,因而在不精确的前提下,它能够关注到微细的现象变化。
2.1.4 时间信息相对重视体验对象在时间上延续变化的状态与方式。从中医药信息获取的内容上看,获取的是在客体表现出来的综合变化状态,这种变化状态主要是随着时间的推移而产生,对于空间分割产生的信息获取能力相对较弱。
2.2 中医药数据的特点
中医药体验信息数字化后形成的数据具有两个鲜明的特点,即全数据与知识密集型数据。
2.2.1 全数据 是指在观察某一对象时,尽可能全面地收集与该事物相关的信息,包括本质和现象,包括稳定的和不稳定的,并将信息全部数字化。这些数据可能达不到海量的概念,但对某一具体事物来说是全面的,能够从中发现事物相关关系的细节,这是一种从各个维度来描述同一事物的高维数据。全数据是符合大数据特点的一种数据,可以利用处理大数据的方法进行处理。而处理全数据方法与技术的提高,为中医药个体化诊疗数据处理开辟了新途径。全数据对于总结中医药经验、发现中医药规律具有重要的作用和意义。一旦我们回归全数据,而不是采用随机双盲、多中心、大样本的方法处理中医药数据,我们就回归了中医药学的真实。
2.2.2 知识密集型数据 中医药文献数据在中医药数据中占有重要地位,尤其是历代医家在临床诊治中的心得体会是科研学者对实验结果的探索总结,是一种智慧体现。中医药知识密集型数据就是在中医药长期医疗实践活动和科学研究过程中所产生的原始性、基础性数据。其最大的特点是与形成数据的基础信息密切相关,是一种认识论信息,不同于本体论信息。认识论信息是叠加了人类的认识后形成的信息,特别是中医药信息,都是叠加了中医经验性知识后形成的,因此,中医药数据可称之为知识密集型数据。这种数据因为需要叠加经验性知识,其数量很难达到本体论数据的量级,但其每个数据中知识的含量却要远远高于本体论数据。
中医药知识密集型数据的特点是,含有大量古汉语成分,难以与现代数据共同处理;名词术语不规范,一词多义、一义多词、近义词难以界定的现象普遍,数据清洗困难;数据多为定性,缺少量化表达,使得现有计算机程序处理困难;非结构化数据较多,结构化难度较大,给数据分析造成困难;个体化诊疗所造成的高维小样本数据,使得建立基于公理的推理难以实现;数据内容体现人文科学与自然科学的结合,不利于逻辑推理与一般数据分析工具的应用。中医药知识密集型数据的描述和表达是粗糙的,数据语义与内在逻辑没有明确表达或根本就没有逻辑性,在小数据理念下,对中医药数据的利用以及知识的转化造成巨大的障碍。
2.3 大数据特点与中医药信息特点的一致性
大数据的特点之一是混杂性,中医药现象信息的特征之一是相对重视现象信息,即包含了现象与本质、稳定与不稳定、清晰与不清晰、确定与不确定、精确与不精确的所有信息。大数据因其数量大,无法避免地存在着数据混杂,但其可以在混杂的数据中发现事物正确的相关关系,这对于处理中医药现象信息数字化后产生的知识密集型数据有很大启发和帮助。“怎样看待使用所有数据与部分数据的差别,怎样选择放松要求并取代严格的精确性,应该开始从一个比以前更全面的角度来理解事物,将样本等于总体植入脑中;每个问题只有一个答案是不成立的,一旦承认了这个事实,我们离真相又近了一步”。
大数据特点之二是关注“整体”而非“抽样”,中医药信息的特征之一是相对重视事物内部与外部相互影响后产生的整体变化状态与方式,因此是开放性信息,是在完全开放环境下获取的信息。大数据的“大”不是绝对意义上的大,而是指不用随机分析法这样的捷径,取而代之的是采用所有数据的方法。这为中医药处理数据提供了思路。因为一个患者的全部数据、一个中医师的全部数据、一个科室的全部数据、一个医院的全部数据、一个流派的全部数据都是全数据,只要获取全数据就能从中发现我们所要的相关关系和细节。
大数据特点之三是不再热衷于寻找因果关系,转而将注意力放在相关关系的发现和使用上。相关关系通过识别有用的关联物来帮助人们分析一个现象,而不是通过揭示其内部的运作机制。中医药学通过体验获得的认识信息所形成的知识之间的关系多是相关关系而不是有着很强逻辑关系的因果关系。因为缺少公理,中医药数据很难建成具有推理功能的严格的本体。如五脏之间的相生相克关系,它们只是彼此相关并非具有强大的因果联系。因此,以往的以逻辑关系为规则进行的数据计算模型和规则对中医药数据的适用性有一定的限制。大数据是建立在相关关系分析法基础上的预测,相关关系可以帮助我们捕捉现在和预测未来。
3 虚拟世界对意象世界的再现
在中医药信息学看来,意象世界不是物理世界,也不是精神世界,意象世界只能存在于中医药学对客体的体验活动之中。中医药信息学给予“意象”的最一般的规定是“平衡与和谐”,中医药学的脏腑体系、经络体系,以及天地人的三位一体都是在意象世界中构建的,人体的平衡及其与自然、社会的和谐是在意象世界中得以实现的。在意象世界中,实现了“客体”本身的“主体化”,即认识活动双方都具有主体性,这对认识中医知识,特别是认识疗效具有重要的意义。在意象世界中,客体如它本来存在的那个样子呈现出来。要把握中医药信息学的这个思想,关键在于把握中医药学对“真实”、对客体本来存在样子以及认识活动双方主体化的理解,也就是叠加了主观认识的体验信息是真实的。在中医药学看来,在任何状态下人体自身都是能够达到平衡的,与自然界不是分裂而是和谐的,这种平衡与和谐就是中医药学所追求的境界,也是人的本然状态。中医药信息学所讲的人体自身的平衡及其与所处环境的和谐不是物质的也不是精神的,因此其既不是在物理世界中,也不是在精神世界中实现的,也就是说,它不是客观的,也不是主观的。它是体验信息整合后在物质与精神之外的意象世界中实现的。换言之,人体的平衡及其与所处环境的和谐是在中医药学的意象世界中实现的。因而,既无法实际测量,也不是虚无的。中医药的疗效是一种“真实”的人体生命运动在不同时段、不同状态、不同环境下达到的自身平衡及其与周围环境的和谐,这种平衡与和谐对个体生存延续、保持最佳生活质量、合理延长寿命都具有重要意义。如果忽略了这种相对的平衡与和谐对生命的意义,是对中医药疗效的否定,更是对延长个体存在、个体获得最佳生活质量与个体寿命合理延长重要性的忽略。因此,认识并认可在意象世界中对中医药疗效的评价,特别是认识到活动双方都具有主体性,其对疗效进行的评价具有同样重要性,是有着积极意义的,也是人类对生命及健康的需求。
虚拟世界是基于电子计算机技术的发展,在电信网、广播电视网和计算机通信网内由数据“运动(计算)”而呈现的空间,该空间实际上是现实空间和思维空间的数字化显现。目前,虚拟世界是由上述三网组成的,在虚拟世界中唯一存在的就是数据。正是数据的流动构建了虚拟世界,虚拟世界对真实世界的影响正在不断增大。清华大学哲学系和认知科学研究中心教授、清华大学科学技术与社会研究中心研究员、中山大学逻辑与认知研究中心兼职研究员蔡曙山先生指出,“只有到了互联网时代,实时地看到一个被时空隔开的事件才成为可能。这个被时空隔开而可以通过虚拟技术被实时感知的事件就称为虚拟事件。现代计算机和网络技术已经能够保证,在对虚拟事件或事物的认知中,事物的属性可以超越现实的时空、而在虚拟的时空中真实地被感知。凭借虚拟技术,物性可以超越现实的时空,而在虚拟的时空中真实地被感知。计算机三维动画技术使人类第一次真正实现了对现实空间的超越。凭借虚拟技术,物可以借助物性的形式超越现实的时空,而在虚拟时空中存在,并被重新复合”。他进一步指出,“虚拟化改变了认识对象,一方面, ‘虚拟物作为一类新的认识对象,已经堂而皇之地进入认识的领域;另一方面,虚拟化使被时空隔开的客体更容易进入经验的范围,从而成为认识的对象。在人们掌握虚拟技术以前,要认识在时空上与主体相隔离的客体是不可能的。人们一旦掌握了虚拟技术,原来被时空隔开的对象就可以被改变其存在方式,而存在于虚拟时空之中的对象就能够被我们所认知”。
中医意象世界中呈现出来的真实(主客融合的真实)在很长时间内不被现代社会所接受,因为其很难实现客观验证。虚拟世界中呈现出来的真实很容易就被现代社会所接受,并且越来越多地影响着真实世界。如果能够利用虚拟技术实现跨时空的存在及重组,在虚拟世界中再现中医意象世界中的真实,那么这种真实就容易被现代社会所接受。在虚拟世界中重现中医在意象世界中形成的客体自身平衡及其与周围环境的和谐,必将对以信息为主要研究对象的中医药学发展起到极大地推动作用。但这是非常困难的,我们还需要解决很多问题。中医药的隐性知识显性化研究是虚拟世界和意象世界沟通的通道之一。它主要是将中医意象世界的知识数字化后,进行各种数据挖掘研究以寻找知识中的共性规律,以利于科研和传承。中医药的隐性知识个性化强,仅靠人脑难以全面展示或拓展;同时这种隐性知识是大量非线性的复杂数据,难以寻找共同规律,这就使中医药学找到解决复杂问题的突破口比较困难。因此隐性知识显性化研究不仅需要把人脑思维活动成果数字化体现,更重要的是找到合适的方法和技术进行深度挖掘,克服中医数据本身具有的缺陷,在虚拟世界中解决意象世界的难题,促进中医药学发展。这表明,不仅是存在于另一时空意象世界的事物可以通过虚拟技术被再现和重组,而且即使是存在于古代时空的先贤的经验也可以通过虚拟技术被再现和重组。这对于中医药学的发展具有重要的理论意义、哲学意义和现实意义。
4 中医药信息学原理与方法学
中医药信息学原理与方法学的研究处于起步阶段,还很不成熟。其原理的形成,除基于中医药学理论外,也大量采纳了信息科学的理论。其方法学的构成,主要是吸收了现代计算机科学与技术的研究成果。
4.1 中医药信息学原理
4.1.1 中医药信息形成原理 中医药信息是在中医理论指导下,主体对中医药及其子系统运动过程中内部与外部全部关系自然整合后生成的综合现象的认识,具有明显的主客相融的特征。中医药信息是中医药及其子系统内部与外部全部关系在自然状态下整合后生成的综合现象的状态及该状态改变的方式。中医药信息学的重要任务之一就是对不同载体表现出来的信息进行载体转化与处理,以提高分析和处理中医药信息的能力与效率。
4.1.2 中医药信息获取原理 中医药信息的获取需要经过感知与识别两个过程。而中医药信息是以复合方式表现出来的具有主客统一特征的现象信息,这种信息已不再单纯是客体本身的信息,而是叠加了主体感知的具有综合特点的现象信息,因而其感知的信息更多地是依赖于体验,而不是观察,仍然具有“感”而不“知”的特性。尽管由于中医药信息本身所具有的特点决定了其复杂性,但其感知的现象信息在理论上仍有可能做到不丢失客体自身现象信息的基本信息,从而基本把握各系统现象运动状态及其状态变化的方式,这是正确认识中医药及其子系统现象运动规律的基础。中医药信息学的重要任务之一就是要通过使用中医药信息学方法,尽可能地实现更全面、更准确、更接近实际地感知在自然状态下中医药及其子系统运动过程中所产生的具有稳定和不稳定联系的全部现象信息的基本信息,并使其转化为计算机可识别和分析的形式。
4.1.3 中医药信息识别原理 中医药信息识别是在感知的基础上展开的。基于中国哲学观点,中医学的认识论属于“象科学”范畴,而中医学理论在其长期实践过程中也常常采用比类取象法,因而可以认为,比类取象是其识别复杂现象信息的主要原理。从而我们认为,中医药信息的识别是建立在比类取象理论的基础上,对感知信息进行识别。中医药信息学的重要任务之一就是使用中医药信息学方法建立众多、准确、规范的信息模型,并通过数据分析,提高中医药信息识别的速度和准确度。
4.1.4 中医药信息转化原理 中医药信息转化为经验性知识是一个极其复杂的过程。在所观察的中医药现象信息中发现它们特征(中医药及其子系统现象运动状态和状态变化方式的个性特征集合)的过程,是由个别现象信息到经验性知识聚类(整合)的关键环节。中医药信息学的重要任务之一是使用中医药信息学方法在海量数据中通过数据分析发现集合特征,加速经验性知识形成的实现过程。
4.1.5 中医药信息反馈控制原理从中医药信息学的角度观察中医药系统及其子系统的运动过程可以被看作是具有自动控制功能的系统动态现象信息的运动过程。通过信息的输入控制系统和输出系统的反馈信息,发现与主体目标间的差异,根据差异调节输入信息,从而达到控制系统按预定目标进行运动的目的。中医药信息学的重要任务之一就是运用控制论方法(例如黑箱方法)分析中医药信息的信息流程、反馈机制和控制原理,从而达到认识中医药系统及其子系统在运动过程中所发生的变化,并通过信息流控制物质流和能量流,从而调节系统的运动。
4.1.6 中医药经验性知识激活的原理 中医药经验性知识的激活,就是在系统运动目标引导下,通过对经验(知识)的选择、调节和反馈机制的建立,生成相应的策略。中医药信息学的重要任务之一就是要在海量数据的基础上,利用相应的计算机技术,建立目的导向的机器学习环境,通过关联分析等方法,建立与目的关联的知识选择模型,并同时建立模型自调节与反馈算法,以促进中医药经验性知识激活的实现。
4.1.7 中医药经验性知识传播原理知识传播是知识在空间位移与时间延续上交错进行的一种知识流动与转化状态。由于中医药经验性知识自身的整体性特征,导致其转化亦具有系统整体性的特点,即某种知识转化的实现,必须是系统或子系统知识的完整的空间位移和时间延续,才具有实际效用。正是这种知识转化的复杂性使中医药经验性知识的共享特别困难。通过显性中医药经验性知识在时间上的延续和空间上的转移,以及隐性中医药经验性知识在转化成为显性知识的过程中实现传播。在中医药经验性知识传播中,中医药信息学的重要任务之一是为相关知识的移动提供新的载体及途径,以便该知识能够以前所未有的速度迅速地从一点移动到另一点;并利用信息学的方法和技术,通过数字化进程及数据分析、人工智能方法等,加速显性与隐性知识相互间转化,促进中医药知识传播的实现。
4.2 中医药信息学方法学
中医药信息学的方法学还极不成熟,没有体验信息数字化以及处理知识密集型数据的有效方法,而采用最多的是基于本体的语义网方法。基于本体的语义网方法的提出,为中医药数据间关联关系的处理提供了可能。在大数据处理环境下,不仅是基于本体的逻辑表达方法——基于本体的语言系统,而且是基于大数据处理而提出的复杂(非线性)数据处理需求,使得中医药知识密集型数据的处理方法得到发展。但我们更期待能够处理以整体、混杂、相关关系为特征的大数据方法,其必然对基于体验信息的知识密集型数据提供方法学及技术支持,使得中医药知识密集型数据的处理成为可能。
白春礼在同一篇文章中还指出,“现在知识产权的保护己从基础研究阶段开始,原始性创新是核心关键技术的源泉。基础研究还体现了人类不断追求真理、不懈创新探索的精神,也培育了创新人才,是现代社会文明、进步、发展的重要基石”。Henry Augustus Rowland也进一步指出,“对于今天已经文明化的一个国家来说,科学的应用是必需的。迄今为止,我们的国家在这条路上走得很成功,因为纯科学在世界上的某些国家中存在并得到培养,对自然的科学研究在这些国家中被尊敬为高贵的追求。但这样的国家实在稀少,在我国,希望从事纯科学研究的人必须以更多的道德勇气来面对公众的舆论。他们必须接受被每一位成功的发明家所轻视的可能,在他们肤浅的思想中,这些人以为人类唯一的追求就是财富,那些拥有最多财富的人就是世界上最成功的人。每个人都理解100万美元的意义,但能够理解科学理论进展的人屈指可数,特别是对科学理论中最抽象的部分。我相信这是只有极少数人献身于人类至高的科学事业的原因之一”。他们的观点值得我们深思。
5 小结
本文探讨了中医药信息学在理论科学领域的研究进展,这对中医药信息学获得可持续发展是非常重要的。我们认为,中医药科学发展缓慢的原因主要是理念发展滞后。如果不能更新发展中医药科学的理念,就无法在理论创新上放开手脚,使中医药学理论从哲学思辨成为哲学思辨与科学推理相结合,进而将整体论与还原论相结合,宏观观察与微观分析相结合,定性判断与定量计算相结合,最终使得中医药学理论得到创新发展,进而支持传统技术的创新发展。因此,从这个意义上讲,重视理念创新,是中医药获得快速发展的初始动力。而中医药信息学在理论科学领域的研究主要是为中医药科学发展的理念创新奠定基础。