付兴,李芊芊,杨凤,周冉冉,侯鉴宸,汤阳,陶晓华
(北京中医药大学中医学院,北京 102488)
时间序列是一组在等间隔时间点上定量特征的有序观测值,其时间间隔可以是任意的时间单位,如小时、日、周、月、年等。通过对这些时间序列的分析,可以发现现象发展变化的规律[1]。中医经过漫长的历史实践,积累了许多对中风的认知。《肘后备急方》是中国第一部临床急救手册,较早描述了中风的关键症状:半身不遂、口眼歪斜、言语謇涩、昏迷。后世的方书对中风的症状和用药均有持续且丰富的记载,从而形成了漫长而复杂的症状与中药时间序列。
从仲景先师的“知犯何逆,随证治之”到柯韵伯的“合是证便用是方”[2],再到“有是证用是药”[3],症药关系一直是中医辨治的关键与难点。现有的中医药数据挖掘往往基于单一的用药频次统计,而忽略了整个历史时间线上症状与中药的相似性观察。本研究基于时间序列相似性分析的方法探讨中风症药时间序列中蕴含的症药规律。
数据来源于北京中医药大学与北京邮电大学联合申报的2019年国家重点研发计划——“基于知识元理论与临床需求深度融合的中医古籍整理及专题文献研究”项目所构建的中医古籍智能检索平台。平台内容来源于600余种古籍,平台提供综合检索、高级检索、专病检索、专题图谱、症状检索5个检索模块,其中综合检索包含中医理论、医案、方剂、病证、本草等10个分类,方剂数据库中共收纳方剂9万余首。
①方剂主治中出现“中风”或“半身不遂”“口眼歪斜”“言语謇涩”“昏迷”中任何一个者;②虽然没有出现“中风”二字,但有其近义词,如卒中、急中风、卒中风、猝中、猝中风、急风、卒暴中风、卒暴风、卒急中风等;③虽然没有出现“半身不遂”“口眼歪斜”“言语謇涩”“昏迷”,但有其近义词者,如偏瘫、口面僻、语謇、昏不知人等。
①方剂功用主治中所载“半身不遂”“口眼歪斜”“言语謇涩”“昏迷”可明确为其他病因引起者;②仅有中风病名,没有“半身不遂”“口眼歪斜”“言语謇涩”“昏迷”等主症或其近义词者;③组方用药记录缺失或不完整者;④成书或刊刻时间不详者。
根据以上标准,共收集了2 065首中风相关方剂,涉及中医古籍250余本。初筛数据格式包含方剂编号(方剂数据库中的方剂编号)、主治、组成及其出处4个方面,数据格式见表1。数据收集完成,然后进行规范化处理。首先,参考《中医内科学》[4]、《中医内科常见病诊疗指南:中医疾病部分》[5]筛选并归纳出20类中风相关症状:半身不遂、口眼歪斜、言语謇涩、昏迷、肢体震颤、肢体麻木、肢体拘挛、项背强直、肢体萎缩、口噤、言语倒错、狂躁、意识模糊、肢体疼痛、头痛、眩晕、耳鸣耳聋、情志异常、饮食异常、流涎;其次,根据《中医大辞典》[6]、《中医药学名词》[7]、《中医临床常见症状术语规范(修订)》[8]中的近义、同义词,对2 065首主治包含上述20类中风症状的中风相关方剂进行人工判定、提取和标准化处理;再次,中药名称根据《中华人民共和国药典》[9]、《中药大辞典》[10]以及《中药方剂编码规则及编码》[11]予以规范;最后,方剂年份参考《中国医籍大辞典》[12],依据方剂所在古籍的成书或刊刻时间进行记录,最终形成包含方剂编号、年代的症状、中药的0,1矩阵。
表1 中风方剂数据样例Table 1 Sample data of stroke prescriptions
为挖掘出中风症药在跨越千年的时间线中的深层次规律,本研究采用时间序列相似性度量的方法进行研究。通过计算症状、中药的时间序列频次曲线的形态相似距离(MSD)来分析症状、中药的相似度。相似度以距离作为衡量标准,任意两条时间序列通过它们的距离衡量它们的相似关系,距离越小,两条序列越相似,距离越大则越不相似。欧式距离是应用最广泛的相似度计算工具之一,MSD是在经典的欧式距离基础上,考虑待计算对象各维差值的具体分布因素进行相似度计算的一种方法。研究表明,该方法能够结合对象的大小和形状进行相似度评估[13]。MSD采用自编R语言程序实现,并分别设定在分段年数为1、20、50、100、150、200、500、1 000、1 500的条件下进行相似度计算。如果想有效地将时间序列的形态特征表现出来,就需要合理的设置分段数目。分段太少,会丢失关键的细节信息和形态特征;分段太多,则会保留较多的冗余信息增加计算复杂度。计算后发现,将公元600年以前独立为一个年代阶段(这是因为341—599年之间的空值较多),向后每150年作为一个间隔时,无论分段年数如何增加,距离也不再改变。由此确定10个年代,分别是公元341—599年(东晋咸康七年—隋开皇十九年),公元600—749年(隋开皇二十年—唐天宝八年),公元750—899年(唐天宝九年—唐光化二年),公元900—1049年(唐光化三年—北宋皇祐元年),公元1050—1199年(北宋皇祐二年—南宋庆元五年),公元1200—1349年(南宋庆元六年—元至正九年),公元1350—1499年(元至正十年—明弘治十二年),公元1500—1649年(明弘治十三年—清顺治六年),公元1650—1799年(清顺治七年—清嘉庆四年),公元1800—1949年(清嘉庆五年—新中国成立)。结果表明这样的分隔与历史的朝代分隔也有较大的相似性。根据自编R语言计算出在150年为间隔下的中风症药时间序列中症症、药药、症药两两之间的MSD二维矩阵。最后,采用Spearman计算症症、药药与症药两者间MSD的相关性,选择ward.D2进行聚类,采用R语言UpSetR、igraph等包绘图。
根据得出的中风症药时间序列中症状两两之间的MSD矩阵,采用Spearman计算其相关性,将20个症状进行分类,聚类方法选择ward.D2,并根据相关性系数绘制热图。红色系代表正相关,蓝色系代表负相关,根据相关性系数r与P值进行筛选。图1可以看出流涎、肢体麻木、口眼歪斜、意识模糊、半身不遂、肢体疼痛、肢体拘挛、言语謇涩两两之间呈正相关(1≥r≥0.644,P<0.001),构成第1组症状群;眩晕、项背强直、耳鸣耳聋、肢体震颤、言语倒错、头痛、狂躁、饮食异常两两之间呈强正相关(1≥r≥0.782,P<0.001),构成第2组症状群;口噤、情志异常、昏迷、肢体萎缩两两之间呈正相关(1≥r≥0.763,P<0.001),构成第3组症状群。同时发现,第1组症状群与第2组症状群之间呈现出一定的负相关性(-0.368≥r≥-1,P<0.001)。
注:**P<0.001,*P<0.05。图1 中风症药时间序列的症症热图Fig.1 Heat map of syndrome-syndrome in the time series of stroke syndromes and related medicines
3.2.1 中药交集分析 中风症药时间序列中共记录中药643种,每个年代所记录的中药不尽相同,为研究中药在不同年代之间的交集情况,本研究采用可以表示多个集合交集关系的upset图进行展示(图2)。图左侧为各年代药物个数,右下方节点表示其左侧对应的一个年代,由点连成的竖线表示多个年代集合。右上方条柱为一个年代或年代集合中唯一使用中药数,即只在该年代或年代集合中出现过的中药,此年代或年代集合之外并未出现。结果表明,图2绿色节点代表的1050—1199年(北宋皇祐二年—南宋庆元五年),唯一使用中药最多,有47种(绿色条柱A);其次是图2蓝色节点代表的1500—1649年(明弘治十三年—清顺治六年)有34种唯一使用中药(蓝色条柱B),这两段时期分别为宋朝与明朝,是中风理论发展的两个高峰时期,因此出现的唯一使用中药较多。公元341—599(东晋咸康七年—隋开皇十九年)和1200—1349年(南宋庆元六年—元至正九年)两个阶段并没有唯一使用中药,表明这两个阶段所使用治疗中风的中药在其他时期均有运用。
图2 各年代交集中药upset图Fig.2 The intersection of each era of Chinese herbal medicines upset chart
此外,研究还发现公元600—749年(隋开皇二十年—唐天宝八年)间使用的中药在其之后的年代均有使用,并且数量最多(紫色柱形D),多于公元900—1049年(唐光化三年—北宋皇祐元年)间的33种(红色柱形C)以及公元341—599年(东晋咸康七年—隋开皇十九年)间的25种(紫红色柱形E),可以表明从公元600—749年,治疗中风的核心中药群已经初步形成,之后的年代这些药物一直都在广泛地使用。同时,那些出现以后便在历史中连续应用的中药可以被认为是流动在中风症药时间序列中的重要经验中药,交集处理后共筛选出187味,详见表2。
表2 中风症药时间序列中唯一交集的中药Table 2 The only intersection of Chinese herbal medicines in the time series of stroke syndromes and related medicines
为筛选出中风的核心中药群,将高频次中药(频次>130)与流动在中风症药时间序列中重要经验中药再次交集处理后,得到52种中风的核心用药(图4)。
3.2.2 中药聚类分析 为分析中风症药时间序列中核心中药之间的配伍组合情况,采用Spearman相关性计算,根据相关性系数r>0.9,P<0.05,Relation为Positive进行筛选,将筛选出的药对组合绘制相关性网络图(图3),并选取相关性系数为前20的药对进行展示,结果见表3。
表3 中风症药时间序列相关性前20的药对Table 3 Top 20 correlated medicine pairs in the time series of stroke syndromes and related medicines
图3 中风症药时间序列的药药相关性网络图Fig.3 Correlation network of syndrome-medicine in the time series of stroke syndromes and related medicines
将20种症状与52种核心中药的MSD进行相关性分析,聚类方法选择ward.D2,以r>0.9,P<0.001,Relation为Positive为依据进行筛选,得出相关性最高的症药关系,绘制相关性网络图(图4),形成3组症药群,分别是类中风症药群、急中风症药群和真中风症药群。
图4 中风症药时间序列的症药相关性网络图Fig.4 Correlation network of syndrome-medicine in the time series of stroke syndromes and related medicines
这3组症药群中,半身不遂、言语謇涩与防风、川芎、当归的频次曲线较为相似(图5A);口眼歪斜与羌活、天麻、附子、麻黄的频次曲线较为相似(图5B);肢体麻木、流涎与茯苓、天南星的频次曲线较为相似(图5C);眩晕与葛根、苍术的频次曲线较为相似(图5D);昏迷与白芷、白附子的频次曲线较为相似(图5E);肢体萎缩与地黄、熟地黄的频次曲线较为相似(图5F)。
图5 部分中风症药频次曲线Fig.5 Frequency curve of certain stroke syndromes and related medicines
(1)中医药对中风的认识十分丰富且日趋完善,长期以来积累了许多治疗中风的宝贵经验。通过中风症药时间序列中的中药交集分析,发现1050—1199年(北宋皇祐二年—南宋庆元五年)与1500—1649年(明弘治十三年—清顺治六年)两个年代的唯一使用中药数较多,正好是中风理论发展的两个高峰时期,说明中风症药的时间序列分析与历史事实比较符合,方法可靠。
(2)古代中医对中风的认识存在真中风与类中风的区别,所谓真中风为外感风邪所中,蒋宝素言:“真中风者,真为风邪所中……类中风者,乃阴亏火盛,阳虚暴脱之击仆、偏枯、神昏不语诸证,与真中风之击仆、偏枯、神昏不语诸证相类,而以类相从,以类相别之证也”[14]。王永炎把真中风的临床表现总结为突然昏仆、半身不遂、口舌歪斜、语言謇涩或不语、偏身麻木5大主症;反之,临床表现不符合5大主症的,但符合西医脑卒中影像学变化的,统称为类中风[15],可见古今对真中风与类中风的认识有所变化。本研究中第1组症药群包含了半身不遂、肢体拘挛、肢体疼痛、肢体麻木、意识模糊、言语謇涩、口眼歪斜、流涎等,与王永炎所说的真中风5大主症大部分重合,故可称之为真中风症药群;第2组症药群则包含眩晕、头痛、肢体震颤、狂躁、言语倒错等主症,无5大主症的临床表现,可认为其为类中风症药群,并且与第1组症药群呈现出较强的负相关,说明其与第1组症药群有着明显的区别;第3组症状群是以昏迷、口噤等症为主的中风急性期症状,故可称之为急中风症药群。古籍中有关中风急性期的相关症状散见于真中风与类中风的论述之中,一般不单独论述,通过中风症药时间序列分析,发现中风急性期症状与用药形成一个单独的症药群,显示出一定的独立性。
(3)在真中风症药群中,半身不遂、言语謇涩与当归、川芎的MSD小,相关性高,它们的频次曲线较为相似。Gumbel copula函数模型对含有川芎和当归的45个方剂分析也表明川芎和当归在中风中具有很强的非线性相关性,而且为正相关[16]。研究表明当归与川芎的提取物在大鼠中风缺血性损伤后可通过促进神经母细胞内源性增殖和神经分化因子的产生发挥神经元保护作用[17-18]。口眼歪斜与羌活、天麻、附子和麻黄的MSD小,相关性系数高,它们的频次曲线非常接近。口眼歪斜一般被认为是外来风邪侵袭所致,辛温风药大多具有疏散风邪,温经散寒的作用。与肢体麻木、流涎相关性较高的中药是茯苓和天南星,两者均是治疗中风痰浊阻塞经络极为重要的配伍[19]。
类中风症药群中相关性较高的症状与中药并不是很多,症药间的MSD普遍较高,即相似性较差,或许说明有关类中风的症药规律并不清晰。值得一提的是,眩晕与葛根、苍术的频次曲线十分接近,且相似性系数较高,清阳不升,浊阴不降是眩晕的关键病机之一,葛根辛甘,升举脾胃清阳;苍术苦温,燥湿运脾以去痰饮之源,二者均是后世治疗眩晕的要药。
急中风症药群中,昏迷和白芷、白附子的MSD最小,相关性系数高,白芷、白附子均具有通络开窍等功用,在中风的临床辨治中,白芷可“十倍代麝香”[20]。白附子性温祛风化痰止痉,是中风治疗中至关重要的开窍药。研究表明白附子的主要活性成分脑苷脂混合物可激活BK离子通道,从而限制钙离子内流,调节兴奋性神经递质的释放及神经元的兴奋,起着将缺血性脑中风“紧急刹车”的作用[21]。
另外还发现地黄、熟地黄均与肢体萎缩具有较小的MSD,它们的频次曲线形状也极为相似,相关性系数高,体现了补肾填精法治疗萎证的思想。
综上所述,现代中医归纳传统中医对中风的论述,认为中风一般分为类中风和真中风两大类。本研究通过分析传统古籍中的中风症药时间序列的相似性,探索在历史时间线上中风方剂中的症药规律,发现中风根据症状可分为真中风、类中风、急中风三组症状群,三者症状群迥然有异,并具有各自对应的中药群。故可认为中医古籍对中风的认识其实隐藏着真中风、类中风与急中风三种不同的认知,这是在当今科学时代借助科学方法对中医古籍进行挖掘与研究的意义与价值所在,值得进一步关注。