梁力伟,丁长松
综述
复杂网络在中医药领域应用研究进展
梁力伟,丁长松
湖南中医药大学信息科学与工程学院,湖南 长沙 410208
中医两大核心思想“整体观念”“辨证论治”均包含大量的非线性复杂关系,复杂网络常用于中医“辨证论治”“遣药组方”等内部复杂关系的发现。本文对近年来有关复杂网络在中医药的应用进展进行综述,总结以往的中医药网络构建和分析工作,指出当前中医药网络研究遇到的挑战及未来中医药网络的研究趋势,以期为后续基于复杂网络理论探究中医药内在规律提供参考。
中医药;复杂网络;网络构建;网络分析;综述
中医理论中蕴含着丰富的复杂关系,传统的数据挖掘技术大多偏向于挖掘数据表层规律,未对其内在深层复杂关系进行探究[1],而复杂网络是通过对复杂系统的高度拓扑抽象描述其中存在的复杂关系[2],利用复杂网络技术探究中医药辨证论治及遣药组方规律,是揭示中医药内在复杂关系的有效途径。兹对近年来复杂网络在中医药中的应用进展进行综述,以期为后续研究提供参考。
1959年Erdös和Rënyi首次将随机理论引入到网络建模中,提出经典随机网络模型——ER随机网络模型[3]。ER随机网络模型的提出被公认为开创了复杂网络的系统性研究,但现实世界的网络并不完全属于随机网络。1998年,Watts和Strogatz提出小世界网络模型——WS网络模型[4],实现从规则网络到完全随机网络的转变;1999年,Barabasi和Albert提出第一个随机无标度网络模型——BA网络模型[5],该模型属一种偏好连接模型。小世界网络模型和无标度网络模型的提出为复杂网络的研究打开新的局面。
复杂网络的统计特征一般通过节点的度及度分布、平均距离、簇系数、介数、度相关性、社团结构等属性进行度量。其中节点的度表示与当前节点直接相连的边数,度分布描述节点度的分布情况。平均路径长度为网络中所有节点对的平均距离;节点簇系数为节点的所有邻居节点间实际存在的边数与最多可能存在边数的比值。上述3个指标均属描述网络拓扑结构的基本指标。此外,介数用来衡量网络中节点或边的中心性,度相关用来衡量网络中不同节点间的连接关系。社团结构最明显的特征便是同社团节点间高度连接,而社团与社团间的连接程度则比较低。
不同于西医还原论理念,中医理论以“整体观念”“辨证论治”为核心,通过处理“生命-健康-疾病-环境”间关系恢复人体机能平衡[6],其复杂关系主要体现在以下3个方面。
在实践经验基础上,中医理论借鉴古代哲学思维提出了“三因制宜”“天人合一”等基本思想,其中“三因制宜”强调“因时制宜”“因地制宜”“因人制宜”内涵丰富的复杂关系,“天人合一”思想则认为人体与外界环境是一个互相影响的非线性复杂系统[7]。“三因制宜”“天人合一”等基本思想的形成促进了中医理论体系的构建,并使中医理论呈现出整体性、复杂性等特征。
传统中医理论重点以人为研究对象,通过对人体当前状态的综合把握,选择合适的防病治病策略维持人体的平衡。由于人体以心为主宰、五脏为核心,由经络系统联系脏、腑、体等全身组织器官,并通过精、气、血、津液的作用完成机体统一的机能活动[8],是一个极其复杂的系统,故中医研究对象中蕴含着丰富的复杂关系。
中医通过“辨证论治”把握疾病本质,并结合“遣药组方”等具体手段实施治疗来维持人体健康。其中“辨证论治”涉及“病因”“病机”“证候”等众多因素,各因素间相互依赖又相互制约,即内含丰富的复杂关系;“遣药组方”中方剂药理作用不仅取决于药物君臣佐使配伍结构,而且取决于药物剂量[6]。药物配伍的复杂性及方剂组成的整体性使方剂具有“整体大于部分之和”的非线性作用特点[9],故中医的诊疗方法中蕴含着丰富的复杂关系。
传统的中医药数据挖掘技术偏向于发掘数据表层规律[10],难以揭示隐含在中医药组方配伍及辨证论治中的复杂深层关系。近年来,众多学者开始尝试将中医药研究与复杂网络研究相结合,通过构建中医药网络并分析网络拓扑属性和内在结构的方式研究中医辨证论治及组方配伍规律。
中医的两大核心思想为“整体观念”“辨证论治”,涉及“症状”“体征”“病因”“证候”“治法”“方药”等多种因素。为厘清其中的复杂关系,中医药网络研究一般将这些因素抽象为节点,因素间的特定关系抽象为连边,构建“症状”“证候”“方药”等多种复杂中医药网络。
3.1.1 “症状”“证候”等网络构建
Wang等[11]构建了脂肪肝症状网络,以探究中医症状与西医症状之间的联系。该网络以脂肪肝症状为节点,若两症状出现于同一个受试者,则在两症状间建立一条连边,其权重为症状共现的频次。Huang等[12]为探讨小儿咳嗽的症状与其预后间关系,构建了小儿咳嗽症状网络,该网络中节点为咳嗽症状,边为症状间相关性,权重为症状间相似程度。Yang等[13]为探讨冠心病心绞痛患者中医诊断信息的分布规律,利用甘草建立一个双层诊断信息网络,网络中的节点均为症状,连边为症状间关系,其中第一层为主要和次要症状节点,第二层为伴随或可能症状节点。
此外,陈霞等[14]构建电针治疗单纯性肥胖的穴位节点加权复杂网络。Hu等[15]构建失眠证“症状-处方”二分网络,并根据该二分网络的投影生成了“症状-症状”网络。Wan等[16]从整个中医文献库中提取包括“中药-证候”“中药-疾病”“方剂-证候”“方剂-疾病”等多种中医药关系类型,并将这些类型中的中医药实体(如中药、方剂、证候等)抽象为节点,依据这些实体是否出现在同一文档中建立连边,最终构建了一个异构实体网络。
3.1.2 “方药”网络构建
“方药”网络构建包括“方剂-方剂”网络、“中药-方剂”网络、“中药-中药”网络。其中“方剂-方剂”网络大多依据方剂相似度构建,而“中药-方剂”网络一般依据方剂药物组成确立,如Zhou等[17]将方剂抽象为节点,依据由“公共药物数”与“方剂长度”确定的方剂相似度构建“方剂-方剂”网络。郭文龙[18]则依据方剂药物组成,以包含和被包含的关系构建一个中医方剂知识图谱。
“中药-中药”网络中,药物节点间的联系一般通过药物相互作用程度来确定,常见的药物相互作用衡量方式包括完全图、基于频次的度量、基于相似度的度量等。其中,完全图是指同处于一个方剂中的所有药物两两相连。但这种情况会导致网络中的节点边数过多而找不到关键节点,不适用于网络密集的复杂网络分析。在此基础上,孙道平[19]提出基于频次的网络构建方法。Yang等[20]利用Jaccard系数计算药物间相似度,并构建基于相似度的慢性阻塞性肺疾病(COPD)网络。
Li等[21]提出一种基于距离的互信息模型(distance-based mutual information model,DMIM)。该模型以药物的出现频次为依据计算药对间的“互信息熵”MI,计算公式为:
式中,P(x,y)表示药物x与药物y共现的频次,p(x)表示药物x在整个方剂集中出现的频次。以药物在方剂中的位置为依据计算药物间的“药间距离”d,计算公式为:
式中,I(x,y,i)为指示函数,表示药物x与药物y是否均存在于方剂i中,d(x,y,i)表示药物x与药物y在方剂i中距离差值。依据MI和d的比值对药物相互作用进行评分构建网络。Li等[22]在此基础上提出一种“中药-复方-靶点-疾病”关联网络模型构建方法。
周伟[23]提出一种基于药对效用度和方剂长度的点式互信息(pointwise mutual information based on herb pair ED and formula length,PMIEDFL)用以衡量药物间相互作用,并根据药物间的PMIEDFL值构建了肺痿方剂核心药物网络。具体定义为:
式中,PMI(h1,h2)为药物h1与h2之间的点式互信息,ED(<1,2>,x)表示药对
孙正[24]依据药物依赖度及药物使用频次,提出一种改进的药物关联度来衡量药物间的相互作用程度,并根据药物间的sim值构建了肺痿方剂核心药物网络。具体定义为:
上述研究以药物结构为中心,未涉及药物自身属性。李茹等[25]提出一种结合药物属性和药物间联系的新型组网模型,该模型在原有依据药物相互作用确立的“中药-中药”模型基础上加入药物药性作为属性节点,最终构建一个包含240个节点、254条“结构边”、339条“性味边”、493条“归经边”、679条“功效边”的肺痿方剂药物组网模型。
方剂是在“君臣佐使”原则指导下,经辨证审因确定治法之后,选择合适药物配伍而成的内涵丰富的复杂关系。现今中医药网络分析大多集中于“方药”网络的内部规律发现,借助复杂网络的节点度及度分布、中心性、社团结构等统计指标分析其拓扑属性和内在结构。
3.2.1 基于基本统计特征的中医药网络分析
早期的中医药网络分析主要针对复杂网络的基本特征进行计算和分析,并将这些特征与现有的随机网络、小世界网络、多尺度网络或人工真实网络进行比较,了解当前构造网络的特性。
周雪忠等[26]通过分析所构建药物配伍网络的节点度分布特征发现其节点度分布服从幂函数分布,说明所构建的网络是一种加权无尺度网络。龙伟等[27]以方剂中药物为节点、药物间配伍关系为边构建了中药方剂网络,通过计算其相关特征表明该网络是一个典型的小世界网络且聚类性质很高。杜宁林[28]通过对具有代表性的5个临床复方集进行网络建模和分析,证明中药临床药物配伍网络虽然在节点度的拓扑层次上不是幂律分布,但在边权和节点强度的加权层次上却呈现强烈的幂律特性。
3.2.2 基于社团发现的中医药网络分析
上述基于基本统计量的中医药研究虽取得了众多成就,但未对中医药网络的内在结构进行深入研究,无法揭示网络中各实体间的内在联系。社团发现的本质是根据网络中节点的自然连接结构进行聚类,能促进对网络结构的理解并有助于挖掘网络中的隐藏信息[29]。为揭示中医复杂系统的内部机理,众多学者开始借助复杂网络中的社团发现技术进行中医药网络的社团发现。
孙道平等[30]提出一种用于中药方剂网络重叠社区发现的改进COPRA算法,相较于传统COPRA算法,该算法去除了标签的随机选择,引入隶属度的概念选取节点计算其聚集系数更新标签,并在社团划分时引入密度函数进行社团的剪枝和生长,省去了预先定义参数及阈值来控制社团的大小。李梦雯等[31-32]将此算法用于药物配伍研究,证实此算法的有效性。
传统的LFM算法是从单个节点出发寻找该节点形成的局部社团,当社区扩展时每次仅挑选当前图中具有最大节点值的邻居节点加入,直至没有新的节点可加入便形成了一个局部社团。周伟[23]依据其在肺痿方剂组网过程中定义的PMIEDFL值对传统fitness值进行了修改,并将此值用于LFM算法中进行肺痿方剂网络社团发现。杨晓波[33]针对当前LFM算法中存在的社团漂移、畸形社团及在稠密网络中的精度下降等问题,提出了LFMd(LFM with dynamic parameter)算法及LFMc(LFM based on clique)算法,并将其运用到构建的COPD中药网络中进行社团发现。
为将药物间的联系同药物的自身药性结合考虑,孙正[24]、王茜[34]均提出一种结合结构与属性的社团发现算法进行药物社团挖掘。其中孙正[24]提出一种结合随机游走及模糊层次聚类的重叠药物社团发现算法(SA-FUZZY CLUSTER),该算法首先采用“重启性随机游走”度量节点间相似程度,其次提出一种“模糊聚类算法”进行重叠社区的发现,最后通过将该算法运用于所构建的药物属性模型证实了该算法的有效性。王茜[34]则在SA-FUZZY CLUSTER算法基础上,提出一种新的结合随机游走及层次聚类的非重叠药物社团发现算法(RWHC),不同于孙正[24]提出的根据隶属度使样本以一定概率属多个聚类的思想,该算法在聚类过程中不考虑单独节点,故其最终结果为多个非重叠药物社团。
作为探究中医药内在规律的一种有效手段,复杂网络理论在当前中医药研究中虽取得了一系列进展,但仍面临以下问题。
3.3.1 数据样本局限
可靠的中医药数据是成功进行中医药网络分析的必要条件[6]。现今中医药数据大多是从医学文献古籍上抄录而来,其主观、模糊、抽象的特点给中医药数据标准化、规范化工作带来难度;此外,现有的中医药复杂网络研究均是在一些小规模数据集上进行,很容易造成由于样本量少或取样偏差导致的对网络的错误认识[1],从而使整个中医药网络无法全面、客观地反映中医药内在遣药组方及辨证论治规律。
3.3.2 网络构建方法局限
当前中医药网络构建方法在确定实体间联系时,多注重从某一方面考虑而忽略了整体的相互作用。以“中药-中药”网络构建为例,现有的网络构建方法在探讨药物间联系时虽然从“药物频次”“互信息”等多个角度进行衡量,但并未融入药物剂量、药物角色对实际方剂的影响,其分析存在片面性,不能综合反映药物配伍规律。此外,现阶段的中医药复杂网络构建多是单从“方药”“证型”等角度考虑,未能建立一个融合“理-法-方-药”的整体网络。
3.3.3 网络分析方法局限
当前的中医药网络分析方法在分析网络结构时,大多仅从网络局部性质出发探讨其节点度及簇等统计特征,或仅从全局出发考虑其平均距离及网络直径等统计特征,缺乏二者的有机结合[10],不利于对中医药网络整体结构性质的把握。对于社团划分后的最终分类结果,多是从组方经验、配伍原则、药性理论等角度证明,缺乏有效合理的验证标准。此外,中医药的一个重要特性是其动态性,如证候的演变、治疗方案的形成及人体对中药有效物质的吸收等,现今的研究多关注中医药网络的静态结构,而未进行中医药的动态网络分析研究[6]。
尽管中医药网络的构建与分析面临着严峻的挑战,但大数据技术、机器学习技术、深度学习技术和复杂网络技术的不断发展,使其中医网络分析仍有广阔的发展前景。其中,大数据技术可用来解决中医药对象属性复杂、数据海量及对象间关系复杂导致的数据难以管理和利用的问题[35-36],如利用大数据技术的“无模式”数据库解决中医药数据类型不确定的问题,利用可扩展的分布式文件管理系统解决中医药数据的海量性问题[36]。
传统的机器学习技术是运用分类[37]、聚类[38]、关联规则[39]等技术探究中医药内在规律,深度学习可用于分析症状间的多重共线性关系和协同关系,从而模拟症状和用药效果之间的复杂关系,实现患病风险评估及用药推荐[40]。复杂网络技术除应用于中医药网络构建外,其社团发现、模型演化及动力学行为也为中医药内在规律的研究提供了新思路,如利用社团发现技术分析药对的配伍原则[31-32]、探究名老中医用药习惯[33],利用动态演化原理分析针灸治疗面瘫的内在规律[41]等。
因此,将复杂网络与现有的大数据技术、机器学习技术、深度学习技术相结合,构建中医药网络,既有助于探索中医药的内在规律,又可促进中医药的现代化研究。
中医的“整体观念”“辨证论治”决定了其蕴含丰富的非线性复杂关系,作为研究复杂关系的有效手段,复杂网络在中医药研究中的有效性已得到证实。目前中医药网络研究虽取得一系列进展,但仍面临着诸如中医药实体间关系难衡量、中医药网络结构难分析以及中医药社团分类结果缺乏有效标准等诸多挑战。如何运用复杂网络技术解决上述问题,并对中医药进行更深层次的研究,成为今后探究中医药辨证施治及组方配伍规律的新趋势。
[1] 严蓓华,杨铭,陈佳蕾,等.复杂网络在中医药方面的研究和应用[J].中国实验方剂学杂志,2012,18(7):276-280.
[2] NEWMAN M E J. Networks:an introduction[M]. London:Oxford University Press,2010.
[3] ERDÖS P, RËNYI A. On random graphs I[J]. Publicationes Mathematicae,1959,4:3286-3291.
[4] WATTS D J, STROGATZ S H. Collective dynamics of small world networks[J]. Nature,1998,393(6684):440-442.
[5] BARABASI A, ALBERT R. Emergence of scaling in random networks[J]. Science,1999,286(5439):509-512.
[6] ZHANG Q R, KONG X J, XU H Y, et al. Progress of studies on traditional Chinese medicine based on complex network analysis[J]. World Journal of Traditional Chinese Medicine,2017, 3(3):28.
[7] 郭刚,吕雅郁,郑燕飞,等.中医体质学原理的复杂性解读[J].北京中医药大学学报,2015,38(7):437-440.
[8] 袁尚华.中医整体观念对疾病整体预防的指导作用[J].中华中医药杂志,2015,30(7):2313-2315.
[9] 罗超应,罗磐真,郑继方,等.中药方剂的复杂性科学特性及其研究探讨[J].中国中医基础医学杂志,2013,19(8):944-946.
[10] 吕庆莉.数据挖掘与复杂网络的融合及其在中医药领域应用[J].中草药,2016,47(8):1430-1436.
[11] WANG W, LI C, XU J, et al. Bridging fatty liver disease and traditional Chinese medicine:A complex network approach[C]//2019 IEEE International Symposium on Circuits and Systems (ISCAS). IEEE,2019:1-5.DOI:10.1109/ISCAS.2019.8702097.
[12] HUANG M, WANG J, ZHANG R, et al. Symptom network topological features predict the effectiveness of herbal treatment for pediatric cough[J]. Front Med,2019.DOI:10.1007/s11684-019-0699-3.
[13] YANG T, HU K. Study on distribution rules of TCM four diagnostic information based on complex network in patients with CHD angina pectoris[C]//2016 IEEE International Conference on Bioinformatics and Biomedicine (BIBM).IEEE,2016:1385-1388.DOI:10.1109/BIBM. 2016.7822723.
[14] 陈霞,黄伟,金熠婷,等.基于复杂网络技术对电针治疗单纯性肥胖处方分析[J].中国针灸,2018,38(3):331-336.
[15] HU F, QIAO Y L, XIE G, et al. Symptom distribution regulation of core symptoms in insomnia based on informap-SA algorithm[C]// 2017 16th International Symposium on Distributed Computing and Applications to Business, Engineering and Science (DCABES).IEEE, 2017:229-232.DOI:10.1109/DCABES.2017.57.
[16] WAN H, MOENS M F, LUYTEN W, et al. Extracting relations from traditional Chinese medicine literature via heterogeneous entity networks[J]. Journal of the American Medical Informatics Association,2015,23(2):356-365.
[17] ZHOU X Z, ZHANG R S, WANG Y H, et al. Network analysis for core herbal combination knowledge discovery from clinical Chinese medical formulae[C]//2009 First International Workshop on Database Technology and Applications.IEEE,2009:188-191.DOI:10.1109/DBTA.2009.65.
[18] 郭文龙.中医方剂知识图谱构建研究与实现[D].兰州:兰州大学, 2019.
[19] 孙道平.复杂网络方剂配伍研究[M].南京:南京大学,2012.
[20] YANG X B, CHEN C X, WANG Z W, et al. Community detection in TCM network of COPD[C]//2017 36th Chinese Control Conference (CCC).IEEE,2017:1397-1401.DOI:10.23919/chicc.2017.8027546.
[21] LI S, ZHANG B, JIANG D, et al. Herb network construction and co-module analysis for uncovering the combination rule of traditional Chinese herbal formulae[J]. BMC Bioinformatics, 2010,11(Suppl 11):1-12.
[22] LI Y, LI R, LI S, et al. Herb network analysis for a famous TCM doctor's prescriptions on treatment of rheumatoid arthritis[J]. Evid Based Complement Alternat Med,2015:1-9.DOI:10.1155/2015/451319.
[23] 周伟.中药方剂核心药物及其配伍规律挖掘[D].南京:南京大学,2013.
[24] 孙正.基于药物属性的中药方剂组网及药物社团发现研究[D].南京:南京大学,2013.
[25] 李茹,孙正,王崇骏,等.中药方剂药物属性的组网模型[J].智能系统学报,2014,9(2):148-153.
[26] 周雪忠,刘保延,王映辉,等.复方药物配伍的复杂网络方法研究[J]. 中国中医药信息杂志,2008,15(11):98-100.
[27] 龙伟,邳馨,向剑,等.中药方剂网络与中药化学空间的构建与分析[J].北京中医药大学学报,2011,34(11):729-732,740.
[28] 杜宁林.基于复杂网络的真实世界中医临床新药发现方法与系统研究[D].北京:北京交通大学,2013.
[29] 冯冰清,胡绍林,郭栋,等.基于角色发现的动态信息网络结构演化分析[J].软件学报,2019,30(3):537-551.
[30] 孙道平,高原,谢隽,等.一种用于中药方剂网络重叠社区发现的改进COPRA算法[J].南京大学学报(自然科学版),2013,49(4):483-490.
[31] 李梦雯,范欣生,张泠杉,等.基于复杂网络等方法的十九畏人参-五灵脂同方配伍探析[J].中国中药杂志,2017,42(18):3623-3627.
[32] 胡方媛,李梦雯,范欣生,等.基于网络重叠社团发现的十九畏丁香-郁金同方配伍分析[J].中华中医药杂志,2019,34(1):316-319.
[33] 杨晓波.LFM社团发现算法的改进与应用[D].郑州:解放军信息工程大学,2017.
[34] 王茜.基于药物社团发现的肺痿方配伍规律研究[D].南京:南京大学,2016.
[35] 梁杨,丁长松,于俊洋.基于Hadoop的中医药数据管理策略研究[J].中国中医药信息杂志,2018,25(5):96-100.
[36] 丁长松,瞿昊宇,吴世雯.大数据背景下基于对象特性的中医药数据管理研究[J].中国中医药信息杂志,2016,23(9):10-14.
[37] LIU L, LUO Y, ZHOU M, et al. Tripterygium agents for the treatment of atopic eczema:A Bayesian analysis of randomized controlled trials[J]. Phytomedicine,2019:152914.DOI:10.1016/ j.phymed.2019.152914.
[38] HAN N, QIAO S, YUAN G, et al. A novel Chinese herbal medicine clustering algorithm via artificial bee colony optimization[J]. Artificial Intelligence in Medicine,2019,101:101760.DOI:10. 1016/j.artmed.2019.101760.
[39] LU P, ZUO T, BAI M, et al. Analysis of medication rule of Chinese medicine for allergic dermatitis based on association rules[C]//BIBE 2019:The Third International Conference on Biological Information and Biomedical Engineering.VDE,2019:1-4.
[40] 张晓航,石清磊,王斌,等.机器学习算法在中医诊疗中的研究综述[J].计算机科学,2018,45(S2):32-36.
[41] 孙天晓.基于复杂网络社团结构划分的面瘫腧穴配伍规律研究[D].成都:成都中医药大学,2016.
Research Progress of Application of Complex Network in TCM Field
LIANG Liwei, DING Changsong
The two core ideas of TCM, “integrity concept” and “diagnosis and treatment based on syndrome differentiation” contain a large number of non-linear complex relationships. Therefore, complex network is often used for the discovery of internal complex relationships such as “diagnosis and treatment based on syndrome differentiation” and “prescription and medication” of TCM. This study reviewed the recent advances in the application of complex network in TCM, summarized the past construction and analysis of TCM networks, and pointed out the current challenges of TCM network research and future TCM network research trends, with the purpose to provide a reference for the follow-up exploration of the internal laws of TCM based on complex network theory.
TCM; complex network; network construction; network analysis; review
R2-05
A
1005-5304(2020)10-0131-06
10.19879/j.cnki.1005-5304.202001268
国家重点研发计划(2017YFC1703306);湖南省自然科学基金(2018JJ2301);湖南省重点科技计划项目(2017SK2111);湖南省教育厅科学研究项目(18A227、18C0380);湖南省中医药科研计划重点项目(2020002);湖南中医药大学研究生科研创新项目(2018CX67)
丁长松,E-mail:15208250@qq.com
(2020-01-17)
(2020-02-07;编辑:华强)