席崇程 ,孙资金 ,佟常青 ,张杰 ,余阳 ,翟双庆
1.成都中医药大学,四川 成都 611137;2.北京中医药大学,北京 100029
腰椎间盘突出症(lumbar disc herniation,LDH)是指腰椎间盘发生退行性病变后,纤维环部分或全部破裂,髓核单独或连同纤维环、软骨终板向外突出,刺激或压迫窦椎神经和神经根,引起的以腰腿痛为主要症状的一种综合征[1]。LDH病情易反复发作,迁延难愈[2],发病率为2%~3%[3]。我国LDH的发病人群以青壮年居多[4],且男性发病率高于女性[5]。
关于LDH的相关论述,最早在《黄帝内经》便有记载。《灵枢·经脉》载“脊痛,腰似折,髀不可以曲,腘如结”,《素问·刺腰痛篇》曰:“足太阳脉,令人腰痛,引项脊尻背如重状。”详细论述了LDH的症状。LDH属于中医学“腰痛”“痹证”范畴[6],因此许多医家将其与腰痛合而论述,阐其病因病机、治法处方等内容。关于LDH的病机,古今医家皆着眼于“本虚标实”[7],将补肝益肾、强筋壮骨、益气温阳等扶正之法与散寒除湿、活血化瘀等祛邪手段相结合,攻补兼施,从而调整全身气血阴阳状态,缓解腰腿部疼痛和麻木。关于LDH的治疗,中医有针灸、按摩、针刀和内服中药等多种治法,并总结出一系列有效验方,如独活寄生汤、身痛逐瘀汤、四妙散。现代研究发现,内服中药治疗LDH,可明显缩短炎症反应时间和反应程度,有效减轻疼痛程度[8]。
内服中药治疗LDH具有显著优势,因此基于名老中医临证经验,挖掘治疗LDH的有效药物,对现代中医临床治疗LDH具有一定的指导作用。随着现代人工智能技术的发展,机器学习开始应用于中医药领域,用于挖掘临床数据中的隐性知识,其中应用较多的为以关联规则、聚类分析为首的无监督学习算法[9]。在计算机领域,图指代一种广义的抽象结构,用来表示一对实体及其之间的关系[10]。图数据模型及图数据库能高效处理复杂数据联系和表达非结构化数据[11],以之对中医药数据表述可以提升中医药知识表达的充分性和准确性[12],将其与机器学习相结合研究医学领域相关问题具有一定优势,因此有中医药领域相关学者以图数据模型研究中医相关理论[13-14]。本研究将机器学习算法模型与图算法模型相结合,以名老中医临床处方数据作为研究对象进行用药规律分析。再以网络药理学方法预测名老中医治疗LDH常用药物的作用机制,为后期实验提供基础,指导现代中医临床对LDH的认识和治疗。
依托国家重点研发计划课题-东北部地区名老中医学术观点、特色诊疗方法和重大疾病防治研究经验,从课题组收集的37位东北部地区名老中医(包括国医大师、全国名中医、第一至五届名老中医传承人)诊治病例数据中,选取内服中药治疗LDH、符合纳入排除标准的有效临床病例。
纳入标准:①根据LDH 的中西医诊断标准,可明确诊断为“腰椎间盘突出症”。②就诊次数不低于3诊次。
排除标准:①不符合以上纳入标准者。②患者处方信息记录不全者。③病例数据涉及精神类、传染性疾病患者。④病例数据涉及妊娠、哺乳期妇女。
参考《中华人民共和国药典》[15]和《中药学》[16],对纳入病例的处方数据进行规范化处理,将中药别称、简称等进行统一,如将“苍白术”拆分为“苍术”和“白术”,“怀牛膝、怀夕和山苋菜”统一为“牛膝”。所有数据规范工作由2人背对背处理,然后将结果进行比较综合,如有争议则邀请第3人进行判定。
本研究主要运用Python语言调用Pandas、Numpy、Networkx等包,完成数据预处理、构建独热编码矩阵和无向图等任务。
(1)独热编码:用sklearn的onehot_enconder对药物进行编码,将每一条病例使用的药物标为1,未使用的药物标为0。由于炙甘草、生姜、大枣三味药在方剂中主要是调和药性,且其应用频率较高,因此在独热编码阶段去掉三味药物,降低稀疏矩阵的维度,去除噪声数据。
(2)频次分析和关联规则分析:以Numpy对矩阵进行运算,得到名老中医治疗LDH高频药物;应用Apriori算法进行关联分析,以支持度和置信度判定药物之间的关联强度。本研究根据数据实际情况,将支持度和置信度均设置为60%,寻找满足条件的强关联规则。支持度和置信度计算公式如下。
SX→Y=N(X∩Y) /N
CX→Y=N(X∩Y) /N(X)
(3)图网络和随机游走模型分析:根据关联规则的结果,以Networkx构建药物之间的关联网络图,并以Numpy等包在图上进行步长为7、无回退的随机游走进行图采样,减小网络图的复杂程度。通过随机游走模型对复杂网络图进行采样,不仅可以减少图中噪声数据,在关联规则结果的基础上更精准分析核心药对,而且通过这种随机游走进行欠采样的“布朗运动”可以获取样本总体特征分布,保证得到的数据分析结果更加稳定。
根据采样的结果,计算采样形成链路长度,寻找最短路径。然后在最短路径形成的网络图上统计边数,判定边数较高的边所连接的药物重要性较高。最后确定重要度较高药物的剂量应用范围。
1.5.1 药物成分和作用靶点挖掘
从中药系统药理学数据库与分析平台(TCMSP,tcmspw.com/tcmsp.php)与BATMAN-TCM 数据库(bionet.ncpsb.org.cn/batman-tcm/)获取各药物(甘草、丹参、泽泻、络石藤、狗脊、杜仲、陈皮、牛膝、延胡索、鸡血藤)的成分及其对应靶点。在TCMSP数据库中,以口服生物利用度(OB)和类药性(DL)对相关成分进行筛选。将OB≥30%、DL≥0.18的活性成分纳入研究。在筛选活性成分后,使用UniProt数据库(www.uniprot.org/)中的UniProtKB搜索功能,通过输入物种限制为“Homo sapiens”的蛋白质名称,来获得每种蛋白质的官方基因名称。而在BATMAN-TCM中,设置Score cutoff为20,Adjusted P-value为0.05进行筛选,获得药物对LDH的作用靶点。
1.5.2 腰椎间盘突出症的药物-疾病靶点挖掘与预测
在线人类孟德尔遗传数据库(OMIM,https://omim.org/)、DisGeNET(https://www.disgenet.org/)和GeneCards 数据库(https://www.genecards.org/),以lumbar disc herniation为关键词进行检索,合并3个数据库的结果得到疾病靶点。将已经收集到的药物活性成分的靶点与LDH的靶点进行交集操作,并使用R4.0.2与相关R包(venn)绘制维恩图,以交集靶点作为药物治疗LDH的有效靶点。
1.5.3 蛋白相互作用网络分析
为进一步确定调节核心,将上述药物-疾病共同作用靶点提交至目前拥有最多生物与蛋白质及广泛和多样化的STRING数据库(https://string-db.org/),设置操作条件为“Homo sapiens”,置信度设置为0.9,并隐藏独立存在的节点。将蛋白相互作用(PPI)网络结果从STRING 导出,并导入Cytoscape3.9.0 软件,利用MCODE插件分析核心网络,识别联系紧密的子模块。将参数设置为degree cutoff=2,node score cutoff=0.2,K-core=2,max depth=100,选择其中score值最高的网络。
1.5.4 富集分析
将收集到的共有靶点转化为相关的Entrez ID后,进行GO富集分析和KEGG通路富集分析。使用R4.0.2与相关R 包(clusterProfiler,org.Hs.eg.db,enrichplot,ggplot2,pathview,ggnewscale,stringr)进行富集分析,P<0.05认为有显著性差异。
本研究共纳入476例有效病例,病例涉及9位名老中医,病例数据详见http://mingyi.bucm.edu.cn。涉及203味中药,其中频次≥50的中药40味。将频次≥50的中药保留并更新独热编码矩阵。
表1 476例名老中医治疗LDH病例处方高频药物(频次≥50)
对频次≥50的40味药物进行关联规则分析,设置置信度阈值为0.6、支持度阈值为0.6。本研究共获得符合条件的2味药物强关联规则81对,其中支持度排前5位的药对分别是延胡索-陈皮、杜仲-陈皮、杜仲-鸡血藤、陈皮-鸡血藤和牛膝-陈皮。对强关联规则药对以热图进行可视化展示,详见图1。
图1 476例名老中医治疗LDH病例处方药物关联规则热图(置信度≥0.6,支持度≥0.6)
将药物作为无向图的节点,药物之间的关联关系作为节点之间的边,构建名老中医治疗LDH中药处方的无向同构图。本研究以边权重代表两节点间的距离,在对边权重的设置上,其计算公式如下:
药对之间的关联程度可以用边的权重来衡量。边的权重越小,则药对之间的距离越短,药对之间的关联性越强,二者相互配合应用的可能性越大。通过这种方式,便可以构建药物之间的无向有权图。以Networkx对无向图进行可视化展示,详见图2。
图2 476例名老中医治疗LDH处方药物无向网络
以每个节点作为起点,进行步长为7的无回退游走。由于药物网络图是无向图,因此其游走方式为双向游走。如对于药对(附子,肉桂),附子→肉桂和肉桂→附子的路径皆可行。通过在无向图进行游走,生成包含8个节点的路径42 503 924条。计算每一条路径的长度,寻找出基于每个起点的最短路径,其计算公式如下:
路径长度可以反映中药联合配伍成立的可能性,路径越短,则联合应用可能性越大。通过在无向图上进行游走,获得以每个节点为起点的所有路径,然后取最短路径进行下游任务。
根据游走规则,本研究共获得86条路径。然后将这些路径以Networkx进行可视化分析,形成采样后的药物配伍复杂网络图,并基于采样后的复杂网络分析用药规律。见图3。为清晰分析用药规律,本研究将出现边数<26的药对路径以蓝色虚线表示,将边数>26的药对路径以红色实线表示。从图3可见,基于图数据模型的高频药物主要涉及丹参、泽泻、络石藤、狗脊、杜仲、陈皮、牛膝、延胡索、鸡血藤9味药。由于甘草已在数据预处理阶段去掉,因此在网络药理学研究过程中加上调和药性的炙甘草。
图3 476例名老中医治疗LDH病例处方常用路径
药物的用量并非固定值,而是根据疾病的轻重、患者体质等相关因素进行调整。同时药量少量的变动对方剂的功效影响不大。因此,本研究基于临床上药物的应用剂量,进一步探讨药物的剂量应用范围。以Pandas的cut函数对每个药物的应用剂量进行分箱,探索最佳分箱数目和药量集中范围,最终得到表2、图4所示的药物高频用量范围。将药物的用量范围与对应中药相结合,最终得到结果:丹参15~25 g,泽泻12~15 g,络石藤15~18 g,狗脊10~20 g,杜仲17~25 g,陈皮12~15 g,牛膝12~20 g,延胡索12~15 g,鸡血藤17~30 g,炙甘草9~15 g。
图4 476例名老中医治疗LDH病例处方常用药物剂量分布
表2 476例名老中医治疗LDH病例处方常用药物剂量使用情况
2.6.1 活性成分和靶点筛选结果
在TCMSP 和BATMAN-TCM 中,按照筛选条件得到筛选后的活性成分,其中陈皮4个、丹参58个、杜仲24个、甘草88个、狗脊5个、鸡血藤23个、络石藤9个、牛膝16个、延胡索49个、泽泻7个。合并,去除重复项后,共得到258个活性成分,将其作为相关药物的有效成分。
使用TCMSP数据库得到各药物成分的预测靶点后,使用UniProt数据库进行蛋白-基因名称转换,与BATMAN-TCM中得到的靶点进行合并去重后,共得到306个相关基因名称,即为相关药物有效成分对人体的作用靶点。
2.6.2 蛋白、基因分析结果
从OMIM数据库、DisGeNET数据库和GeneCards数据库获得LDH靶点。合并所有靶点并去重,共获取靶点558个。将疾病靶点和药物作用靶点经过交集操作后,药物-疾病共得到58个交集靶点,即药物作用于LDH的有效靶点。
将药物作用于LDH有效靶点上传至STRING数据库,得到含58个点、171条边,average node degree=5.9的PPI网络(见图5)。使用MCODE插件进行进一步分析,最终得到EGFR、HIF1A、FOS、MAPK1、MPAK14、ESR1共6个核心基因(见图6)。
图5 476例名老中医治疗LDH病例处方常用药物靶点PPI网络
图6 476例名老中医治疗LDH病例处方常用药物靶点作用核心基因
2.6.3 GO和KEGG通路富集分析结果
为进一步阐明药物治疗LDH的潜在机制与生物通路,本研究进行了GO富集分析与KEGG通路富集分析。通过GO富集分析分析,共获得了2 324个条目,包括2 090个生物过程(biological process)条目,74个细胞组分(cellular component)条目与160个分子功能(molecular function)条目(见图7)。
图7 476例名老中医治疗LDH病例处方常用药物靶点GO富集分析
药物治疗LDH 主要途径涉及活性氧反应、氧化应激反应及辐射反应等生物过程;膜筏、膜微区、囊泡管腔等细胞成分;RNA聚合酶ii特异性DNA结合转录因子结合、磷酸酶结合、蛋白酶结合等分子功能。
应用KEGG 富集分析研究药物治疗LDH 的信号转导通路,共有144条具有统计学意义的相关通路(见图8),包括AGE-RAGE信号通路、流体剪切应力和动脉粥样硬化、脂质与动脉粥样硬化、IL-17信号通路、卡波济肉瘤-相关疱疹病毒感染、肿瘤坏死因子信号通路等。
图8 476例名老中医治疗LDH病例处方常用药物靶点KEGG通路富集分析
《张氏医通·卷五腰痛》云:“其(腰痛)有风寒湿热闪挫瘀血滞气痰积,皆为标病,而肾虚则其本也。”从本虚标实的角度论述腰痛。此言与现代名老中医辨治LDH的思路十分吻合,从名老中医治疗LDH的高频药物和药对分析可以发现,其处方用药主要从补虚和祛邪入手。补虚方面,对于肝肾不足者以牛膝、狗脊、杜仲等药补肝肾,强筋骨。驱邪方面,寒湿者以薏苡仁、泽泻、防己、羌活、独活等祛风除湿;阳虚寒凝者,以附子、肉桂等大辛大热之品与白术、当归等少火之品,温阳散寒止痛;瘀血者,以鸡血藤、土鳖虫、延胡索等活血行气止痛。
《中医内科常见病诊疗指南》将腰痛分为肝肾亏虚型、瘀血型、寒湿型、湿热型4型。基于图数据模型发现,名老中医治疗LDH常用药物按照功效主要分为以下4类:补肝益肾、祛风除湿、清利湿热和活血化痰止痛。《诸病源候论·腰背痛诸侯》云:“夫腰痛,皆由伤肾气所为。”《杂病源流犀烛·腰脐病源流》亦云“诸般腰痛,其源皆属肾虚”,可见肾虚为LDH关键病机[17],因此名老中医以杜仲“坚筋骨”(《神农本草经》)、牛膝“补精气,利腰膝,填骨髓”(《雷公炮制药性解》)、狗脊“强筋壮骨”(《玉楸药解》),三药相伍为用,共同达到补肝肾、强腰膝[18]的功效。现代研究亦表明,杜仲-牛膝是治疗腰痛的常用药对[19],通过AGE-RAGE 信号通路作用于腰神经病理性疼痛[20],从而达到治疗LDH作用。
《金匮要略·五脏风寒积聚病脉证并治》云:“肾着之病,其人身体重,腰中冷,如坐水中,形如水状,反不渴,小便自利,饮食如故,病属下焦。身劳汗出,衣里冷湿,久久得之,腰以下冷痛,如带五千钱。”详细论述寒湿导致腰痛的病机与症状。肾着症状与LDH吻合[21],可见,寒湿在LDH 发展过程中十分重要。《丹溪心法·腰痛》有“腰痛主湿热、肾虚、瘀血、挫闪、有痰积”,肯定湿热对于腰痛的重要性。因此名老中医以络石藤“舒经活络”(《要药分剂》)以止痛,与泽泻相伍共奏清热除湿之功,与杜仲相配又有补肝益肾之效,伍鸡血藤、丹参等活血药又可活血化瘀,一药而有三功;泽泻“专主渗泄”,善治风寒湿痹(《神农本草经》《本草经解》),陈皮“燥脾湿”(《本草求真》),二药与狗脊配伍祛风除湿,与络石藤合用清除湿热。同时陈皮“同补药则补,泻药则泻,升药则升,降药则降”(《本草备要》),可以调和全方药性,使补肝肾、祛风湿和活血化瘀之功并进。三药相伍,全面兼顾风、寒、湿、热等外邪,使外邪驱散,经络得通,气血津液运行正常,腰痛自解。
《金匮翼·瘀血腰痛》云:“瘀血腰痛者,闪挫及强立举重得之。”认为瘀血是导致腰痛的重要原因之一。而气滞血瘀型是LDH常见中医证型[22],二者之论不谋而合。瘀血停于腰部,使腰部气血痹阻不通,不通则痛。丹参“破宿血,补新血”(《雷公炮制药性解》),治“腰脊强”(《本草经集注》);延胡索“活血、利气、止痛”(《本草纲目》),治“一切因血作痛之证”(《雷公炮制药性解》)鸡血藤“活血,暖腰膝”(《本草纲目拾遗》)。三药合用,行气活血、通经止痛之效甚佳,如《临证医案医方》之活血祛瘀汤便以三药配伍。瘀血得散,腰部气机通畅,通则不痛,腰痛自除。
中医药治疗LDH显示了多通路、多靶点的特点。研究表明,LDH患者椎间盘组织白细胞介素(IL)-23、IL-17、IL-6、IL-1β、肿瘤坏死因子-α(TNF-α)基因表达较高,严重程度与IL-17呈正相关[23]。动物实验发现,LDH大鼠髓核内IL-6、TNF-α的mRNA和核因子-κB p65蛋白表达水平升高[24]。本研究初步探讨中药治疗LDH的主要作用靶点及其可能的生物学过程和信号通路,发现中药可能通过IL-17信号通路和TNF信号通路减轻炎症反应和调节免疫功能发挥作用。同时,本研究从临床数据中分析出高频药物常用剂量范围,为进一步实验验证提供参考。