李 昱 杨 涛 胡孔法
(南京中医药大学人工智能与信息技术学院 南京 210023)
肺癌是我国发病率、死亡率最高的恶性肿瘤[1]。肿瘤治疗的主要方式为西医手术及放化疗,对缩小瘤体的效率高,但是患者常在放化疗过程中出现免疫功能抑制、血象下降的现象[2]。中医在改善肺癌患者生活质量、恢复体质、延长生存期等方面具有优势。如何挖掘和传承名老中医治疗肺癌的经验成为中医传承与发展的重要课题。传统中医经验传承主要通过医案整理、方药总结等途径,耗费大量人力[3]。随着信息技术的发展和普及,中医医案数量急剧增长,传统的经验传承模式已经不能满足需求,迫切需要利用现代化技术和方法进行传承。中医药蕴含丰富的非线性复杂关系,复杂网络是探寻这一复杂关系的有效方法之一,将复杂系统内部元素和关系用节点和边表示,可帮助发现复杂系统中各因素间交互规律的网络模型[4]。社团结构是复杂网络中的重要特性,通过构造肺癌用药的复杂网络提取出其中的社团结构,进而总结名老中医临床处方的配伍经验,对于深入了解肺癌的诊治规律具有重要意义。
复杂网络及社团发现在中医药发展过程中发挥重要作用,虽然中医药领域应用复杂网络的研究尚处于初级阶段,但越来越多的学者开始尝试将中医药学与复杂网络相结合[5]。周雪忠、刘保延和王映辉等[6]利用复方配伍的无尺度复杂网络现象,对名老中医的处方配伍经验及面向特定病症的配伍经验进行挖掘分析,从而发现核心药物、药对等;过红玲、顾浩和王耘等[7]依据中医基础理论以及临床用药规律,揭示中药功效之间的关系;赵君霞[8]从复杂网络角度对中医学规律进行分析,通过对丰富的中医临床数据构建药物配伍网络,并利用社团分析方法进行研究,尝试对中医基础理论的复杂网络特性进行揭示;Gao Z、Li S和Shang Q等[9]利用复杂网络分析稳定期冠心病患者的中医证型演变与心血管复发的关联性,结果显示该病患者以气虚证、血瘀证、毒症为主要证型。Guo F F、Zhang W和Su J等[10]从中药成分-网络靶标层面构建中药治疗疾病的网络模型,设计网络扰动定量评价算法来评估药物对于网络的干预程度。上述研究从不同角度进行了中医复杂网络研究及应用,对中医药传承进行了有益探索。中医用药具有层次性和结构性,在复杂网络中挖掘层次结构能够更精准地把握复杂网络的结构和组成[11]。层次社团挖掘方法分为两种:一种是自上而下的分裂式,即不断将1个大社团分裂为多个小社团;另一种是自下而上的凝聚式,即不断选取相似的小社团合并为大社团。GN算法是经典的分裂式社团发现算法。但该算法采用全连接组网的方式,计算复杂度较高,冗余连接增加,影响后续社团发现效果[12]。2004年基于模块度Q的Fast Newman算法被提出。通过不断计算模块度增量,沿着使模块度增加最多或减少最少的方向依次合并两个社团,时间复杂度明显优于GN算法[13]。鉴于此,本文以Fast Newman算法为基础,提出层次社团划分算法,并将其应用到肺癌用药挖掘中,用以揭示肺癌用药社团结构以及社团内部的层次性。
首先,对处方集进行预处理,清洗冗余信息,如药物剂量和药物用法,得到互不重复的处方集合。遍历处方集,将处方集转换为以药物总数为行维度、处方总数为列维度的0-1矩阵。在矩阵中的同一行,1代表该味中药出现在这条处方中,0代表未出现。其次,构造以中药为节点、两两中药出现频次为权重的邻接关系矩阵。再次,遍历中药关系矩阵,将矩阵中药对出现的频次与阈值进行对比,如果大于阈值则将两节点构成的边输入边集,并将药对出现频次作为边的权值。最后,输出带权边集与节点集形成复杂网络。
3.2.1 中药社团划分 以Fast Newman算法为基础,采用自底而上的中药节点合并,通过最大化模块度Q来实现中药社团划分。根据贪心算法的思想,不断沿着使Q增加最大或减小最少的方向依次合并两个中药社团。Q函数表示为:
(1)
3.2.2 中药带权网络划分过程 第1步,将构成复杂网络的n个中药节点视作n个初始社团,定义变量ai及eij如下:
ai=ki/2m
(2)
(3)
式中ki为节点i的度,m为网络中的总边数。第2步,依次合并有连边的两个社团,计算合并前后社团的模块度增量,沿着使Q增加最大或减小最少的方向对社团进行合并。模块度增量公式如下:
ΔQ=eij+eji-2aiaj=2(eij-aiaj)
(4)
合并社团后,更新相应变量。第3步,重复执行步骤2,直至整个网络合并成1个大社团,完成社团划分过程。
3.2.3 中药社团层次结构提取 社团依据模块度增量依次顺序合并直至整个网络合并为1个大社团。每层合并2个社团,层级越低合并越优先。通过树状图对上述社团合并过程进行展示,可以明显观察到社团内部层次结构,即顺序合并至同一个中药组合的药物可以认为归属于同一社团。对于划分出来的社团采取迭代划分,观察社团内部分裂结果,直至社团合并成链状结构或模块度无明显增益时停止划分。根据社团合并顺序和社团模块度提取中药组合的层次结构信息,确定最终划分类别并采用环状树状图进行展示。
4.1.1 数据来源 本研究的实验数据来源于南京中医药大学名老中医传承中心。检索近5年有关肺癌的病案数据,根据数据纳排标准最终得到167例肺癌患者的796诊次医案。其中最小2诊次,最多33诊次,平均4.67诊次。
4.1.2 预处理 对于医案中的中药数据进行预处理,包括药名规范化、异常值去除、药物用法去除等。其中医案纳入采取以下标准:依据《原发性肺癌诊疗规范》,确诊为原发性肺癌;医案包含患者基本信息、舌象、脉象、临床表现等内容。医案排除采取以下标准:医案中临床表现、舌象、脉象存在缺失;患有严重的心、肝、肾等疾病,影响肺癌四诊判断;非原发性肺癌患者。
4.2.1 肺癌高频病机 医案中出现的高频病机为痰瘀阻肺、肺气亏虚、肾虚痰阻等,见表1。
表1 肺癌高频病机(频数>5)
4.2.2 核心药物频次 方剂中共含有190味中药,其中山慈菇等20味中药出现频次最高,见表2。
表2 核心药物频次(排名前 20位)
4.2.3 药物共现频次 为中药两两出现的次数,其中苦杏仁+桔梗等20对药物共现频次最高,见表3。
表3 配伍网络对应的药物共现频次(排名前 20位)
4.2.4 中药网络 以0.1作为节点阈值筛选高频中药构建中药网络,其中共有51味中药节点,1 578条药对连边。中药的节点度越大则网络中对应的节点半径越大,见图1。
图1 中药配伍复杂网络
4.2.5 社团划分 对中药带权网络进行社团划分,采用树状图形式对社团合并过程进行展示。根据树状图、模块度变化情况,结合中医专家建议,最终划分6个社团并采用环形树状图进行展示,见图2。药物被划分成两个层次,第1层有C1、C2、C3这3个社团,其中C1又划分成C1.1和C1.2,C3划分成C3.1、C3.2和C3.3。社团C1.1由天龙、酒地龙、藤梨根等22味中药组成;社团C1.2由前胡、蜜紫苑、牛蒡子等5味中药组成;社团C2由王不留行、皂角刺、炮甲粉等5味中药组成;社团C3.1由天花粉、僵蚕2味中药组成;社团C3.2由白术、薏苡仁、木香等6味中药组成;社团C3.3由山慈菇、半枝莲、白花蛇舌草等11味中药组成。
图2 社团划分层次
4.3.1 概述 本文通过筛选高频中药构建加权网络,采用模块度衡量社团划分指标,结合中药合并过程的树状图结构确定社团划分数目。算法共划分出两层中药社团,第1层3个中药社团(C1、C2、C3),在第1层社团的基础上进行进一步划分,得到第2层5个中药社团(C1.1、C1.2、C3.1、C3.2、C3.3)。相较于传统方法,本文提出的方法较好地呈现了社团之间的层次性和结构性,可以从不同层次(粒度)分析名老中医诊疗经验。
4.3.2 药物配伍网络以及药物出现频次分析 可发现核心药物主要集中于清热解毒散瘀类(山慈菇、酒地龙、半枝莲、白花蛇舌草等)、利水渗湿类(茯苓、薏苡仁、猪苓等)、燥湿化痰类(法半夏、川贝粉、白术等)、益气生津类(太子参、醋五味子等)、养阴润肺类(麦冬、炙甘草等)、宽中理气类(姜厚朴等)。
4.3.3 社团药物组成分析 社团C1.1的药物较多,以天龙、酒地龙、醋莪术、广郁金活血化瘀,法半夏、陈皮、川贝粉、白芥子、鱼腥草、苦杏仁、桔梗等药理气止咳化痰,酒黄芩、金银花、藤梨根等药清热解毒燥湿,猪苓、茯苓、火麻仁、姜厚朴利湿通腑,仙鹤草、三七粉止血活血,再辅以灵芝补虚,炙甘草调和诸药。社团C1.2以前胡、蜜紫苑、苏子、牛蒡子止咳化痰、降气平喘,干姜温中散寒。社团C2以王不留行、皂角刺、全蝎、醋延胡索、炮甲粉活血止痛、攻毒散结。社团C3.1以天花粉、僵蚕滋阴润燥、化痰散结。社团C3.2以白术、薏苡仁、木香、砂仁、焦山楂、葛根健脾和胃、生津止渴。社团C3.3以山慈菇、半枝莲、白花蛇舌草、丹参活血化瘀、清热解毒,以五味子、麦冬、酒山萸肉、太子参、丹皮气阴双补,天麻祛风通络,枳壳破气消积。从上述功效分析来看,肺癌治疗以化痰祛瘀为主,也可兼有清热解毒、滋阴润燥、行气止痛、温中健脾等。这一结果与原始数据中病机分布一致,痰瘀阻肺出现频数最高,频率达到93.59%,其他依次为肺气亏虚(3.01%)、肾虚痰阻(1.38%)、痰瘀阻滞(1.13%)、肺失宣降(1.00%)、气血两虚(1.00%)、痰瘀水阻肺(0.75%)。
4.3.4 肺癌病机分析 依据上述社团划分结果结合临床专家意见进行合理推测(以药测证),肺癌的病机较为复杂,临床以痰瘀互结为主,兼有痰热、气虚、阴虚、气滞、中寒等。肺癌的实性病理因素主要包括痰、瘀、气郁、癌毒等,其中以痰、瘀最为常见;虚性病理因素中气虚、阴虚最为常见[14]。临床治疗应审证求因、圆机活法、灵活用药。
肺癌是危害人类生命健康的重大疾病,具有发病率高、死亡率高等特点,中医药在肺癌治疗和术后调理方面具有优势。发掘和传承名老中医诊治肺癌的经验对肺癌防治意义重大。本文借助层次社团划分算法对名老中医诊治肺癌医案进行分析,成功挖掘出核心的中药配伍社团及其层次结构,较好地反映了名老中医诊治肺癌的用药特点和规律,对名老中医诊疗经验的数字化传承具有重要意义。