沈淼淼
嘉兴市中医医院 浙江 嘉兴 314000
中医学的历史成就数不胜数,从周代到三国,从唐代到清末,医术不断,传承历史悠久。马王堆的汉墓医书有《足臂十一脉灸经》《脉法》《阴阳脉死候》《五十二病方》《却谷食气》等;江陵张家山汉墓医书有《脉书》《引书》等;更有《黄帝内经》《神农本草经》《伤寒杂病论》这类有名的国医典籍[1]。但在现代化发展的过程中,西医的引进逐渐使我们国医的发展慢慢被边缘化,不同于中医的内调治本,西医诊疗治标见效更快。不可否认,西医手术技术在很多疾病上确实很有帮助,而且在几千年的发展中,由于古代信息流通的限制很多优秀的国医学都没有保留传承下来,在现代信息技术爆炸式发展的今天,我们更要重视中医传承的问题。中医诊病往往讲究望闻问切,中医称其为:望诊、闻诊、问诊、切脉。作为诊病基础,四诊的研究尤其重要,本文从四诊规范展开简析其与数据分析模型结合对于中医传承的作用。
第一,名老中医队伍人员少。国务院2016年颁布的《中医药发展战略规划纲要(2016—2030年)》明确指出:“中医药作为我国独特的卫生资源、潜力巨大的经济资源、具有原创优势的科技资源、优秀的文化资源和重要的生态资源,在经济社会发展中发挥着重要作用[2]。随着我国新型工业化、信息化、城镇化、农业现代化深入发展,人口老龄化进程加快,健康服务业蓬勃发展,人民群众对中医药服务的需求越来越旺盛,迫切需要继承、发展、利用好中医药,充分发挥中医药在深化医药卫生体制改革中的作用,造福人类健康。”然而资料显示,我国传承下来著名的中医专家数量已经从20世纪80年代的5000多名减至现如今的不足500名,而且还呈逐年下降的趋势。薪火相传五千年的中医国学目前已陷入传承危机[3]。
第二,四诊标准化困难。传统的中医临床经验大多是以名老中医专家的治疗病历、著作或者是口述的形式表现出来的,因此数据的收集成为名老中医临床经验研究与传承的基础。传统手工处方、病历记录量大,但由于保存条件有限,能留存下来的并不多。同时由于跨越的年代久远收集资料所消耗的经历和时间也是无法逾越的鸿沟。没有数据基础那么就容易导致四诊标准化难度增加。同时,电子病历的概念也是近20多年来才被提出规范,认证标准也还在逐步的规范。
第三,四诊实用有效的数据提取困难。以往的四诊大多以名老专家口述,主管判断,叫法不一,缺少客观、准确、稳定的描述方式,缺少标准字典,这对数据提取是致命的打击。只有解决好这个问题,建立四诊标准字典库,才有可能保证对四诊信息能有较好的把握,才能做好四诊信息的准确提取。
第四,四诊缺少实用有效的信息分析方法。以往对于实用有效的中医四诊信息分析和特征提取方法的建立,也少有研究。在信息技术高速发展的这些年,电子病历、数据中心等信息化概念的兴起以后,软硬件平台构建数据采集,才被慢慢利用。获取四诊信息原始数据并加以分析,就需要建立数据中心构建数据中台,将标准化后的四诊数据进行特征信息提取,提取后还需要利用分析模型对于这些信息进行综合分析判断,建立科学合理的四诊识别模式,再输出需要的结果。因此构建并选择合适的数据分析模型是提取四诊特征信息并加以利用的关键。
第五,四诊传承团队的人才储备严重不足。当前,在中医的传承过程中不难发现,少数科室常常出现团队组建不完备,人员储备量较低等问题。同时,不同科室之间的资源分布也存在严重风险。为此,应注重科研团队的构建。
随着时间的推移,部分传承团队出现年龄断代的风险。数据显示,在长期的调查中可以看出,少数科室的医疗人员存储量相对较低,中医教师常常采用“填鸭式”教学法,关于临床研究和数据收集,可用人才较少。由于大多数经验丰富的中医普遍都处于退休行列,无法利用多余的精力开展教育事业。此外,跟随老中医完成科研事业的学者大多为各个科室的领导者和重要人员,其还需要落实教育工作,业务繁重。因此,在学习时无法确保能够在第一时间整理笔记。跟随中医参与问诊的人员亦无法确定。正常情况下,科室内通常委派数名资历较深中医的嫡系学生参诊。但是在学习的过程中,其需要经历一系列考核和学习,致使相关人员的精力无法高度集中在问诊阶段,无法及时有效的落实病理的归纳与总结。
中医四诊是建立在中医基础理论之上的,并且需要基于中医基本理论说明,目前存在的很多问题都涉及中医诊断概念表达的规范性问题,要开展中医四诊量化特征提取和大数据分析并建立相关规范标准,需要基于规范的中医诊断概念和理论。因此规范中医理论是第一要素且必要的。基于中医理论建立规范、客观、稳定、统一的标准定义四诊字典,目前浙江省处方一件事正在探索建立数据规范,建立统一标准字典库。例如下表规范:
表1 四诊字典规范
建立统一规范的标准以后,数据获取标准有了,但要实际应用就需要切实有效的数据分析和特征提取方法[4]。首先,需要基于中医电子病历书写规范构建标准电子病历四诊模板,模板中相关选项根据标准字典设置。构建医疗机构数据中心,对于电子病历进行集成化数据提取,汇集入数据中心,建立采集原则、清洗规则,数据采集需要全面、多维度,对于数据进行整理提取,就像沙漏一般进行过滤,提取特征信息,关键信息。
数据汇集以后,根据不同场景需要有符合中医诊断模式的辨识模型和分类分析方法,例如需要分析某一病种的四诊规律与用药方案之间的关系,就需要研究中医诊断模式,确定辨识模型和数据分类分析方法。
通过数据集成、数据选择、分析清洗,数据集成解决系统语义差别,规范语义,数据选择解决数据庞杂甄选关键数据集,数据清洗处理数据中无效、缺项、清洗无效的数据。基于现有医院医疗资源、数据库资源,采用HL7+rabbitMQ集成平台集成数据汇集数据中心
通过数据挖掘技术,基于现有医院医疗资源、数据库资源,采用一系列的信息分析技术,将大量的、不完整的、有噪声的、模糊的、随机的实际应用数据中提取隐含的、有潜在价值的信息和知识,从中分析出隐藏在数据之中的规律、特征和概念,辅助决策提升管理质量
利用数据时间序列模型、聚类分析、因子分析和关联规则,分析如中医诊疗数据将文本化医案进行智能结构化处理,确保术语名称规范统一,并提取分析疾病、症状、证候等8项关键要素,通过聚类分析、因子分析、关联规则分析进行数据的解构重组,分析名老中医历史处方得出应用支撑结论。
基于客观因素变化趋势,一年中的四季,更常见的是指任何一种周期性变化,如季度变动、月度变动、时刻变动等,由于中医的特殊属性,季节更替气候变化往往对中医诊疗有较大的影响因子,同时可以引申出季节、气候、时刻变动对于医院的财务运营的影响,通过分析大量数据可以基于某种公式模型推导出客观因素对于医院财务运营的影响率,预测未来发展趋势[5]。
建设互联互通集成平台,强化数据互通集成。通过对医院信息系统的集成互联,可以极大地提高数据的集成度、规范度、完整度、可用度。
例如聚类分析,聚类分析指将物理、抽象事物的集合进行分组,分为有共性的对象组成的多个类组的分析过程。聚类分析的目标就是在事物共性的基础上收集更多的数据源来进行分类。聚类分析的方法涉及很多领域,包括数学、计算机科学、统计学、生物学和经济学,在不同领域,聚类技术都得到了发展,它被用作描述数据,衡量不同数据源之间的相似性特征,以及把数据源分类到不同的簇集当中,最后归纳总结出特征信息及不同簇集当中的关联性。例如文献当中痰饮的四诊研究,通过1898条痰饮临床数据研究总结得出一些特征信息,比如,“头昏头晕、眩晕、恶心呕吐”等常聚为一类出现,提示痰饮上扰清窍,致清阳不升,浊阴不降出现相关症状。停手胃脘,致胃失和降、胃气上逆出现呕吐。“消瘦、身黄或面黄或目黄”常聚为一类出现,提示痰饮阻滞,影响肝胆疏泄,胆汁外溢出现身黄、面黄、目黄的患者中,常同时可见其形体消瘦。
总之,中医学中的四诊是我国几千年来对于无数人体生命体征信息处理的浓缩结晶。现代计算机大数据技术应用,对于中医临床病历的全息数据采集,不仅是实现了数据的实时采集、传输和动态管理。同时也基于高性能的后端服务器和强大的计算机学习算法,实现四诊信息“后结构化”的形成。在为探索名老中医诊病逻辑思维模式、个性化知识体系、学术及临床经验的传承中,提供了强有力的技术支撑。对于四诊的规范化、标准化是研究中医学的基础,四诊的诊断模式的提取和分析是中医传承的关键之一。通过对于四诊的数字化提取与研究将推动中医学数字化平台的搭建与发展,通过现代化技术升华传统的四诊,利用数字智慧令名老中医的诊断模式得以留存,也是为中医学拓展生命力和发展空间,更能成为中医学的另一个生长领域。