张若凡,陈艺丹,徐天成△
(1.南京中医药大学针药结合教育部重点实验室,江苏 南京 210023; 2.合肥工业大学,安徽 合肥 230601)
穴位配伍是影响针灸临床疗效的重要因素,配穴法虽然理论丰富,但穴位配伍的依据、规律和生物学机制缺乏科学有效解释[1],故相关理论进展缓慢,制约提高临床疗效。目前,穴位配伍研究多基于单一疾病、文献书籍或某一名医的个人经验,建立相应针灸处方数据库并进行分析,或引入数据挖掘[2]、复杂网络[3]、网络生物学[4]与深度学习[5]等方法。这些研究在使用现代化技术发展针灸医学方面起了开创性的作用,但鲜有研究以较为规范的数学方法形成成果,以标准化、定量化的途径构建基于不同医家、不同时代的针灸医学典籍构建智能化知识网络,从而较难用于智能针灸处方系统的构建等前瞻性工作。这一工作需要系统性的完备研究,而从智能穴位配伍系统设计的角度而言,穴位数量的选择对于选定具体算法有重要价值[6]。在使用复杂网络技术构建智能针灸处方系统的过程中,本团队使用图论构建穴-症网络图谱,在分析其拓扑学规律的基础上,给出智能配穴数目的具体结果。本研究将结合相关研究对本团队研究的意义展开解读。
腧穴配伍可产生增效、减效与无效3种结果[7],配伍效应可能在简单的穴位组合时并不显著,只有当组合满足一定条件时才能充分体现。组合的最优化原则与复杂网络“整体性”“非线性”“复杂性”特点相吻合[1]。
复杂网络可看作复杂系统的高度抽象,复杂系统中的个体为节点,个体之间的关系为连边,由大量的节点及节点间连边构成的网络即是复杂网络[8],其在针灸学中的应用逐年增加[9]。由于复杂网络具有大规模、非线性等特征,尤其适用于腧穴配伍问题研究,这一方法加快了结构化的针灸知识图谱的构建工作。利用复杂网络方法可揭示和挖掘腧穴配伍的规律与内在关联,对于指导针灸临床具有实际意义,而受到诸多学者的关注。一些独立团队正在进行积极尝试,如任玉兰等[7]提出基于复杂网络社团结构,研究腧穴组合关系及其结构和动态演化特征。贺亚楠等[10]提出运用复杂网络的网络配穴法,阐明和预测不同腧穴配伍模式。这些研究在建模方法的角度为本团队的研究提供了启示。
目前针灸学相关文献中复杂网络的建模方法不尽相同,存在以穴位为节点、疾病为连边,或穴位与疾病同时作为节点的2-模网络这两种代表性方式。相关典型算法有聚类分析、MCODE聚类算法[11]和Q-PSO聚类算法[12]等,如表1。王佑林等[13]通过改进k核心算法,对67种疾病进行验证,得出主穴范围为3~9个。王媛媛等[14]构建基于233种证、232个腧穴的有向网络可视化图,得到平均每种证选取约5个腧穴。魏秋红[15]将穴位和疾病为节点的2-模网络投影为基于疾病的穴位网和基于穴位的疾病网,提出基于穴位疾病网络的模型,并将仿真结果与实际研究结果进行比较。这些研究的建模方法、关注的书籍并不完全一致,但是得出的配穴数量却非常接近。那么,倘若用较为统一的建模方法,关注各个时代的针灸专著,在这样相对标准化的操作后,是否会得到相似的配穴数目?针对这一问题,笔者展开了研究。
表1 常见针灸复杂网络构建模式
“六度分离”指每个人平均只需通过6个人就能认识一个陌生人。此理论最早构想源自于一战后,作家卡林西在小说《枷锁》中提出假设,人与人之间距离在逐渐缩小,任意两个人最多可以通过5个熟人建立联系。20世纪60年代,米尔格拉姆(Stanley Milgram)随机信封实验标志六度分离理论的正式成型,实验计算从总体中随机选出的两个个体连接起来所需的最小中介数量,即测量网络的最短路径,证实小世界现象,得到平均节点为5.5,路径长度为6[17]。
21世纪后,人们利用互联网模拟、计算机计算,不断验证,为六度分离假说提供依据。Jure Leskovec等[18]从微软Messenger快照中提取1.8亿个节点和1.3亿个边的通信图,发现平均距离是6,提示多达78%的用户可以通过6个人就与1个陌生人建立联系。2011年,Facebook以7.21亿用户、690亿个友情联系数据为基础,计算得出网络平均距离为4.74,即每两个用户间平均通过4.74个间接人即可建立联系[19],而2008年测算的数值为5.28,但2011年已降至4.74,原有六度分离空间现已不足五度[20],提示人与人之间连接更紧密。
图1 Facebook图、美国图和瑞典图不同年份的平均距离(单位:亿)
如上文所述,社会网络分析属于社会科学领域常用的一种研究方法,而随着各类知识领域的跨学科融合,“六度分离”最初用于各类社交应用吸引用户或营销传播,后引申至多种学科并被大量应用。
六度分离中的“度”是多种因素抽象的结果,如在营销界,商家可将声誉、顾客满意度和定价策略等因素抽象为网络进行分析,提供所有因素的合理定位,指导商户针对特定用户群体开展精准的广告投放以引导消费行为[20];在医学界,一些研究已证明疾病传播时间与复杂网络中特征路径长度非常相似, 在传播网络中加入一些捷径可使传播速度明显加快[22]。各“度”之间是否有联系,联系如何构建及亲密程度或追溯联系[19],都可用“六度分离”建模研究,如表2所示。而在本研究中,“度”指两个穴位之间通过共同主治构成直接联系的穴位数量,对智能配穴数目的选择具备指导意义。
表2 六度分离中“度”在各领域的实际含义与应用
本团队自2016年起建立以“穴位”为节点,“主治”为连边建立基于复杂网络理论的穴-症知识图谱,针对6本经典医籍(即《针灸甲乙经》《千金方》《针灸大成》《中国针灸治疗学》《新针灸学》《经络腧穴学》),提取其中关于穴位及其主治的文字叙述而形成30万条数据,构建无向网络,如图2,进行可视化分析和具体指征的临床验证[26]。
注:节点代表穴位,连线代表症状;左侧为《经络腧穴学》,右侧为《新针灸学》。图2 《经络腧穴学》及《新针灸学》穴-症知识图谱
团队前期研究已定量证明,基于这一标准化建模方法的穴-症网络具有高聚类特性和小世界效应[27],前者提示基于该网络的构成规则进行智能化的选穴治病,比随机选穴更有效;后者则提示,通过小世界网络自动配穴可实现使用相对较少的穴位,达更好的疗效,智能提供“性价比高”的针灸处方,这也是相关智能算法的开发目的之一。
在得出这些结论的基础上,团队进一步发现,由于穴位间存在结构和功能的相似性,处于同一“级别”的穴位能自行组织在一起[28],故引入社团概念,使用基于模块度优化的启发式社区发现算法(fast_unfolding算法)[15],对病症-腧穴网络进行社团划分,得出基于图论的穴-症复杂网络,其平均路径长度为2(1.87+0.2)。结合上文对这一指标的讨论,可以推断:在复杂网络意义上,通过症状的相关性寻求治疗处方其基本穴位数目为4个。这与前文所述的部分团队研究结果有相似之处,而本研究基于更大的数据体量,获得的指标更加精准,这也是在图3中得以反馈的现象。
图3 不同书籍得出的平均路径长度结果(单位:个)
与目前已有成果团队数据对比后发现,王媛媛等[14]将“证-穴”有向图可视化,得到“出度图”符合随机分布的钟形曲线模式,均数为5.47,遂得出每证约取4~7个腧穴,从“入度图”推衍出腧穴的配证特异性。王佑林等[13]则改进k核心算法,不断删除节点度最小节点及相关边,精简出最核心子图,得出用于临床治疗疾病的主穴为3~10个。值得注意的是,两项研究的网络构建方法不同,前者为有向图,后者为无向图;同时,所用思路和目的不同,前者在“证-穴”关系基础上为辨证取穴提供依据;后者挖掘主穴信息提供处方决策支持,故得出了不同的配穴数目。
而本研究的特点在于:基于标准化的方法,针对更多的针灸专著建立了规范化的“穴位-症状”复杂网络,而复杂网络理论最早在社交网络的研究中广泛应用,社交网络的研究佐证了:更大的数据量有助于逼近更加最终的稳定拓扑指标而进一步指导现实应用。如Facebook研究得出“随着年份的推移,平均距离数据越趋于稳定”的结论,提示数据量越大,系统越趋于稳定,得到范围越精确,则这一结论对针灸网络配穴有重要启示。笔者纳入更多不同时代的针灸典籍所得出的结果,要比针对单个医家或者某一时代某一本医籍得出的结论更加接近于准确的数值。针灸的网络也符合此趋势,高数据量带来精准的指标结果,可获得较精确的配穴数目,实现高效智能配穴,提供最优处方决策支持。
小世界网络可揭示当前信息传播的复杂性以及保障信息资源的最优化利用[29],由于持续增长的用户基数和不断密集的关联网络,人与人的联系更加紧密,不同节点间建立链接的效率大幅提高,分隔度不断缩小。而在针灸学的范畴中,虽然历代的穴位数量存在增减、主治病症数量也有不断的变化,但基于这两者构建的复杂网络,却具备稳定的性能参数——通过症状联系构成配穴的数目为4个。这一数值即上述“六度分离”现象中通过6个陌生人联系任意个体的体现所在。以此类推,来自不同时代、不同医家的穴-症网络,不断更新调整的穴位主治,数千年的知识积累,随着数据量的不断增加,配穴数目将无限趋近于精确结果。故本团队基于大量数据的“4穴”之配穴结果或许更具有参考价值。
智能配穴的探讨从整体角度出发,为针灸科学化、具象化提供思路,更好实现针灸智慧辅助诊疗,促进穴位配伍研究发展。本研究将“六度分离”引申于穴位配伍研究,“度”指两穴之间通过共同主治构成直接联系的穴位数量,即配穴数目。通过对小世界网络图中平均距离的计算,得到较为精确地配穴数目:4穴,实现更简洁的智能配穴,基于症状群之间的联系建立穴位处方,而非依托个体经验或者单一的书本得出相关结论,使得这一数值更具普适性,从而提高辅助决策支持力度。此外,本研究还存在许多不足,后期将补充临床数据图谱,进行大规模真实世界研究,进一步验证配穴数目。
未来团队研究考虑给“穴位-症状”的复杂网络知识图谱赋予权值,将穴位之间的联系性量化,从而更好地服务于临床诊断和智能医疗。如对特征向量中心度研究有助于发现网络中的重要节点,从而量化不同穴位的重要性,分析其在处方中的作用和地位。这一结论将用于智能配穴算法中穴位处方数量的确定,为智能针灸机器人等新型中医装备的研发提供重要基础。