展俊平,郑 光,孟庆良,谷慧敏,左瑞庭,吕 诚,姜 淼△
(1.河南中医药大学第二附属医院,郑州 450002; 2. 兰州大学数学院, 兰州 730000;3. 中国中医科学院中医临床基础医学研究所, 北京 100700)
雷公藤(TriptergiumwilfordiiHook. F)为卫矛科一年生藤本植物,作为传统中药的使用历史悠久。最早在《神农本草经》中就有所记载,主要以根入药,归肝肾经,性苦、辛、凉、大毒,具有祛风除湿、活血化瘀、清热解毒、消肿散结、杀虫止血等功效。其广泛分布于中国南方,为中国的传统中药,具有免疫调节、抗炎、抗肿瘤、抗生育、抗菌等药理作用[1]。雷公藤化学成分非常复杂,目前所知其主要成分包括生物碱类、二萜类、三萜类、倍半萜以及糖在内的380多种物质,多种生物碱类化合物及其他小分子化合物已从雷公藤植物中分离鉴定出来[2]。
本文拟用文本数据挖掘方式,采用现有的临床研究及实验研究文献资料,运用基于敏感关键词频数统计的数据分层算法,对雷公藤相关的疾病及其生物作用靶点进行初步的总结分析,以期能进一步指导临床用药,并为相关研究提供一定的理论基础。
文本挖掘是从非结构化、自然语言描述的文本数据中,抽取有意义的数据应用到生物医学领域,文本挖掘可以分为文本数据收集、(预)处理、结构化分析、可视化以及评价5个步骤[3]。
文本数据的收集来自中国生物医学文献服务系统 (英文全称Chinese BioMedical Literature Database,简称CBM)的论文摘要。在主题检索下分别检索关键词“雷公藤”。经过检索出现主题词、命中文献数,合并检索主题词分别得到文献12957篇(检索日期2017年9月16日)。为获取文献的详细信息,如流水号、标题、摘要、主题词等,在显示格式中选择“详细”和“显示全部”然后进行下载。
从CBM下载的文本数据,按照下载的先后顺序合并到一个平面文本文件(后缀txt)中,并以ANSI编码进行保存。在此基础上,利用专有的文本提取工具(软件著作权,软著登字第0261882号,登记号2010SR073409),对下载的文本数据进行信息提取,并将格式化的结果保存到大型关系型数据库(microsoft sql server 2008 R2,以下简称SQL)中。针对初步提取出来的数据,构建算法并对其中可能的噪音进行清洗[4]。
清洗后的数据仍然采取数据切片分层的形式,针对挖掘对象的一维和二维频次数据进行分析(即相关挖掘要素在数据集中出现文献总的频数以及两两之间的频数关系),用Cytoscape 2.8软件进行可视化处理。
本文中形成可视化的二维网络图,笔者采用连线的宽度和图形大小2种方式同时进行客观展示,图形内为独立要素名称,连线代表要素两两之间的关联。图形的面积越大,代表该要素与其他要素关联的越多,权重越大,连线越宽[4]代表该要素与雷公藤的关系越密切,在文献中出现的频次越高。同时结合专业知识进行解析,对于不合理的结果,即回溯原文献数据集,按算法进行噪音清洗[5]。人工阅读评价使得结果更加客观,通过这种优化的文本挖掘组合,尽可能客观地呈现各方面的的信息。
表1显示,文本挖掘共提取到281种疾病,选择频次较高有代表意义的前10个列出(括号内为文献篇数,下同):关节炎(1137)、类风湿(741)、肾小球肾炎(387)、肾病综合征(321)、糖尿病肾病(287)、紫癜(250)、银屑病(247)、哮喘(139)、红斑狼疮(116)、肿瘤(86)。由于构建词表及挖掘词的包含关系,出现以上结果重复的现象,说明挖掘词越短,挖掘到的频次越高,其结果基本反映了雷公藤治疗相关疾病的一维特征。
图1显示,在此基础上依据共同出现的原则,构建雷公藤对应的疾病二维网络。图中节点为疾病名称,连线代表不同疾病间的联系,疾病的连线越多越宽,节点就越大,其权重也越大;连线宽度与临床报道文献数量多少呈指数线性关系。
表1 雷公藤疾病一维结果比较
文本挖掘共提取到1389项疾病组合,图1为频次大于2的疾病组合参与构建的网络图。由图可知,类风湿、关节炎圆圈最大,其相应的权重最高,其他疾病次之,且二者之间关联最密切(连线最宽)。回看数据结果,“类风湿”和“关节炎”频数为691。追溯原文献,可能是因为在多种疾病中均会伴随关节炎的临床症状表现。
图1 雷公藤相关疾病二维网络图
文本挖掘共提取到358个结果,选择前10个列出,T淋巴细胞(134)、滑膜(121)、血管(74)、基因(71)、细胞因子类(70)、单核细胞类(61)、蛋白质类(61)、足细胞(51)、内皮(50)、巨噬细胞(46)。
图2显示,文本挖掘共提取到65项免疫靶标组合。图3显示,血管与内皮相关度最高,其次为滑膜与成纤维细胞、膜糖蛋白类与载体蛋白质类。
图3显示,同样方法文本挖掘共提取59个生物分子靶标结果,选择前10个列出,文本挖掘共提取到184项生物分子组合,频次大于8的分子组合参与构建的网络图。图3可知,肿瘤坏死因子α处于核心位置,与白介素1、白介素6、白介素10的相关度最高。
表2 雷公藤生物靶标一维结果
图3 雷公藤生物分子二维网络图
作用靶标频次权重TNF⁃α1980245RNA1210149IL⁃2930115IL⁃6930115IL⁃1710087转化生长因子β550068CD4540066IL⁃10510063CD8410050IL⁃4410050
图2 雷公藤生物靶标二维网络图
文本挖掘共有20条通路,选择前10条列出。
图4显示,文本挖掘共提取到45项通路组合,频次大于2的通路组合参与构建的网络图。图4显示,PI3K/Akt、TLR4/NF-κB相关度最高。
雷公藤临床应用极为广泛,尽管其具有较大的副作用,但因其疗效显著,众多学者对其生物学作用机制仍进行了不断的深入研究。图1显示,雷公藤主要用于关节炎、类风湿、肾病、皮肤病等领域,提示与其抗炎及免疫抑制作用密不可分;图2显示,从浅层分析认为主要作用于T淋巴细胞群、滑膜、血管、细胞因子类,图3提示具体包括TNF-α、RNA、白介素类,而图4通路则以NF-κB、Akt、Fas/FasL等为主,二维结果中类风湿与关节炎的关联度最高,内皮与血管关系密切,肿瘤坏死因子与白细胞介素类共同出现频次较高,PI3K/Akt、TLR4/NF-κB相关度最高。
表4 雷公藤相关通路一维结果
图4 雷公藤相关通路二维结果
T淋巴细胞是雷公藤作用的主要靶细胞,能够有非选择性、非平衡性的抑制作用,纠正免疫系统紊乱,抑制免疫细胞增殖及诱导细胞凋亡等[6]。实验证实,雷公藤多苷对早期糖尿病肾病患者具有一定的血管内皮修复效应,同时可纠正患者 T 淋巴细胞亚群失衡现象[7]。而在治疗自身免疫性疾病中,雷公藤对促炎和抗炎性细胞因子均有一定的调节作用。其有效成分雷公藤甲素可以通过抑制TNF-α信号传导通路,进而抑制其与IL-6 的协同作用,达到抑制炎症反应的目的[8];亦能作用于白细胞介素-2(IL-2)及其受体的基因转录水平,抑制两者的基因表达和其介导的细胞免疫反应。此外,白细胞介素-10 (IL -10) 具有诱导致炎细胞因子凋亡的特性,雷公藤甲素通过上调 IL-10下调 IL -1、IL-6、IL -8及 TNF-α 等促炎因子,达到延缓和降低发病[9]。
NF-κB是一种重要的核转录因子,存在于大多数真核细胞中,可诱导多种细胞因子、黏附分子和受体分子等基因表达,雷公藤通过调控参与炎症级联效应多种酶的基因表达发挥免疫抑制作用[10]。研究证实,NF-κB信号通路在软骨细胞的增殖、分化、凋亡中扮演着十分重要的角色[11]。而死亡受体Fas (又称为CD95/Apo-1)介导着细胞凋亡的外在通道,FasL或抗Fas抗体与Fas结合后可激活一系列细胞内信号通路,进而诱导细胞凋亡[12]。有报道称,雷公藤多苷可明显降低TNBS小鼠结肠上皮细胞中Fas表达,增加FasL含量,同时可明显降低结肠上皮细胞处于G0-G1增殖期数量,升高S期数量,说明雷公藤多苷可以通过调节Fas/FasL信号途径,加速炎细胞凋亡,完成修复过程,进而治疗或缓解结肠黏膜炎性损伤[13]。
AKT通路则广泛存在于细胞中,是参与细胞生长、增殖、分化调节的信号传导通路,与人类恶性肿瘤、慢性炎症甚至过敏反应中相关下游主要效应靶基因激活相关,造成细胞凋亡[14]。雷公藤红素对肥大细胞脱颗粒的抑制作用是通过下调PI3K / AKT信号通路上重要的抗凋亡基因Pik3r3、Akt2的表达以及上调促凋亡基因 Gsk3b的表达实现的[15]。另外,作为雷公藤的重要靶向通路之一的ERK,报道显示复方雷公藤外敷剂能降低关节炎大鼠血清及滑膜组织中炎症因子,抑制滑膜组织ERK通路的活化,从而抑制滑膜组织增殖、减少滑膜中血管新生和血管翳形成[16]。
文本挖掘(Text Mining)技术是以计算语言学及统计数理分析为理论基础,借用大数据时代的信息服务于各学科的交叉学科[17]。中医药源远流长,有许多行之有效的宝贵经验需要更为科学直观的验证,基于循证医学的文本挖掘技术无疑是一有利工具,尤其在生物分子机制方面的深入探讨[18],通过对信息产生的潜在的关联关系,让我们获取和拓展新的知识[19]。
参考文献:
[1] WANG H L, JIANG Q, FENG X H, et al. Tripterygium wilfordii, Hook F versus conventional synthetic disease-modifying anti-rheumatic drugs as monotherapy for rheumatoid arthritis: a systematic review and network meta-analysis[J]. Bmc Complementary & Alternative Medicine, 2016, 16(1):215.
[2] WONG K F, YUAN Y, LUK J M. Tripterygium wilfordii bioactive compounds as anticancer and anti-inflammatory agents[J]. Clinical & Experimental Pharmacology & Physiology, 2012, 39(3):311.
[3] 孟庆良, 展俊平, 郭会卿,等. 基于文本挖掘技术析甲氨蝶呤与中医治疗联合应用的规律[J]. 中国中医基础医学杂志, 2014, 20(12):1665-1667.
[4] 沈姗姗, 郑光, 展俊平,等. 基于数据挖掘探讨类风湿关节炎证-症-法-方药规律[J]. 风湿病与关节炎, 2013(10):5-9.
[5] 李仲贤, 郑光, 展俊平,等. 基于文本挖掘技术探索强直性脊柱炎“理-法-方-药”相应规律[J]. 兰州工业学院学报, 2013, 20(2):23-26.
[6] 何英蒙,姚媛媛,陈一龙,等.雷公藤类制剂的研究进展[J].中国药房,2017,28(4):551-554.
[7] 周瑞琴, 李小巧, 杨艳琴. 雷公藤多苷对早期糖尿病肾病患者的血管内皮功能及T淋巴细胞亚群的影响[J]. 世界中医药, 2017, 12(8):1840-1843.
[8] 王伟东, 陈如平, 肖鲁伟,等. 雷公藤甲素对类风湿关节炎滑膜新生血管中血管内皮生长因子、白细胞介素-6抑制机理的探讨[J]. 中医正骨, 2012, 24(2):3-5.
[9] 曹学梅. 雷公藤多苷对类风湿关节炎患者血清细胞因子水平的影响[J]. 中国药业, 2013, 22(7):21-23.
[10] 张敏, 王守安, 刘黎星,等. 雷公藤多苷干预TLR-NF-κB通路发挥免疫抑制作用[J]. 中草药, 2014, 45(9):1288-1292.
[11] 周庄, 张柳. NF-κB信号通路在骨性关节炎发生发展中作用机制的研究[J]. 中国骨质疏松杂志, 2012, 18(1):78-82.
[12] YAMADA A, ARAKAKI R, SAITO M, et al. Dual Role of Fas/FasL-Mediated Signal in Peripheral Immune Tolerance[J]. Frontiers in Immunology, 2017, 8(4):403.
[13] 黄小英, 刘端勇, 程绍民,等. 雷公藤多苷对结肠炎小鼠结肠上皮细胞周期及Fas/Fas L表达的影响[J]. 时珍国医国药, 2012, 23(11):2785-2786.
[14] 王晓南, 吴青, 杨旭,等. 雷公藤红素对白血病细胞Akt信号通路的影响及在细胞凋亡中的作用[J]. 中国中西医结合杂志, 2011, 31(2):228-232.
[15] 姚赐玉, 王滔, 蒋云林,等. 雷公藤红素对致敏肥大细胞的抑制作用及其中PI3K/AKT/GSK3-β信号通路的影响[J]. 福建医药杂志, 2017, 39(1):61-64.
[16] 赵越, 唐晓颇, 姜泉,等. 复方雷公藤外敷对Ⅱ型胶原诱导型关节炎大鼠滑膜组织细胞因子及ERK通路的影响[J]. 中医杂志, 2017, 58(7):582-586.
[17] LI Z, et al.Applying Discrete Derivative Algorithm in Two Dimensions in Mining Acupuncture and Moxibustion Rules on Bell’s Palsy, in Eighth International Conference on Fuzzy Systems and Knowledge Discovery (FSKD),2011: 1570-1574.
[18] ANANIADOU S, THOMPSON P, NAWAZ R, et al. Event-based text mining for biology and functional genomics[J]. Briefings in Functional Genomics, 2015, 14(3):213-230.
[19] O'MARAEVES A, THOMAS J, MCNAUGHT J, et al. Using text mining for study identification in systematic reviews: a systematic review of current approaches[J]. Systematic Reviews, 2015, 4(1):5.