江海媚, 唐莹, 张恩欣,, 黄海福, 周瑞生, 周岱翰
1.广州中医药大学肿瘤研究所,广东 广州 510405;2.广州中医药大学深圳医院,广东 深圳 518034
肝细胞癌(Hepatocellular carcinoma,HCC)是全球范围内第六大常见癌症,也是导致癌症相关死亡的第三大原因[1]。HCC因发病率高、恶性程度高、强侵袭与转移、预后差而广受关注[2]。HCC的发生与乙型肝炎病毒感染、丙型肝炎病毒感染、酒精或进食含黄曲霉素的食物等暴露接触高度相关。另外,肥胖、糖尿病、代谢综合征等代谢性疾病与非酒精性脂肪性肝病也被逐渐成为HCC的危险因素[3,4]。2018 年全球肝癌发病人数达到841 000 人,死亡人数高达781 000 人,其中HCC占原发性肝癌病例的75%~85%[5]。HCC 五年内的复发率高达50 ~80%,而五年生存率低于5%[6,7]。HCC 的治疗方法多样,包括手术、放化疗、介入治疗、免疫及靶向药物治疗等。但由于HCC 早期发病隐匿,大多数患者确诊时已至晚期,治疗方案有限,疗效仍不如人意。为了缓解HCC 给患者家庭及社会带来的巨大医疗负担,寻找更有效迅捷的HCC治疗方法迫在眉睫。
参桃软肝方(STR)是国医大师周岱翰教授用于治疗肝癌的经验方,其主方由西洋参、当归、桃仁、仙鹤草、人工牛黄等药物组成,药物配伍在益气养阴的同时兼顾活血消癥,具有健脾养肝,解毒祛瘀,软坚消癥之功。既往研究证实,STR能改善肝癌患者karnofsky 评分,保护肝功能,抑制中晚期肝癌患者肿瘤进展并提高患者生存质量和延长生存时间[8,9]。参桃软肝片、参桃软肝丸、参桃软肝胶囊等以STR 为基础的口服制剂已经开始运用于临床和相关研究。STR 在HCC 的治疗中功效显著,但是其明确的作用靶点和具体分子机制尚未阐明。
RNA 测序(RNA-Seq)是核糖核酸测序的简称,也被称为全转录物组散弹枪法测序(Whole Transcriptome Shotgun Sequencing,WTSS)。RNASeq 是基于第二代测序技术的转录组学研究方法,是使用第二代测序的能力,在给定时刻从一个基因组中,揭示RNA的存在和数量的一个快照技术[10]。RNA-Seq 能够识别用来诊断、治疗和推断预后的各种疾病的生物标志物[11]。RNA-seq可以鉴定与药物有关的差异基因(Differentially expressed gene,DEGs),在药物治疗效果分析方面具有明显的优势。网络和功能富集分析也能更好地揭示阐明药物作用的分子机制。
本研究旨在通过生物信息学分析来揭示STR的作用靶点和抗癌分子机制,为临床治疗提供更进一步的依据。
1.1 制备STR 冻干粉 所用中药均购买于广州中医药大学第一附属医院。加入与药物克数成一定比例的去离子水用煎药机(沙益广制药有限公司)按规程操作煎煮,以液面没过药物1 cm 为宜。大火烧开后再以文火加热30 min,倒出药液,并重复两次。将两次的药液用文火浓缩至300 ~500 ml,并分装到50 ml离心管利用台式离心机(上海安亭科学仪器厂)。将离心后的药液上清吸取到培养皿中且在-80℃冰箱过夜,然后使用Christ冻干机Alpha 1-2 LD plus(北京博励行仪器youxiangon公司)来冻干,最后取出冻干粉称重。
1.2 细胞培养 人肝细胞癌HepG2 细胞购自中国科学院上海生物科学研究所生物化学与细胞生物学研究所细胞库(http://www.cellbank.org.cn/)。将细胞接种到含有10%胎牛血清(FBS,Gemini,美国),5% 100 U/ml 青霉素和100 mg/ml 链霉素的RPMI1640 培养基(GIBCO,美国纽约州格兰德岛)中,放入5% CO2,37 ℃的培养箱(Thermo Fisher Science,美国马萨诸塞州)培养。
1.3 细胞增殖试验 CCK8 试剂盒(Cell Counting Kit-8)用于测量细胞增殖。HepG2细胞以5×103细胞/孔的密度接种在96孔板中,并在37 ℃的完全培养基中孵育24 h,接着用浓度逐渐升高的STR冻干粉处理长达72 小时。然后将细胞与10 ul CCK8 在37 ℃培养箱孵育2 h。使用制造商推荐的酶标仪测定450 nm 处的吸光度。所有实验一式三份进行,并重复至少3 次,结果基本相似。抑制率计算如下:抑制率(%)= [平均OD 值(对照)-平均OD 值(药物)]/平均OD值(对照)×100%。使用GraphPad Prism软件通过非线性回归拟合方法计算IC50值。
1.4 RNA 测序 本研究使用BGISEQ-500 平台一共测了6个样品,一共检测到16 904个基因。实验流程的关键是构建mRNA 文库:对total RNA 进行处理得到纯化的所需RNA 后,进行反转录合成双链DNA,对所得DNA 进行拼接并通过特异的引物进行PCR 扩增。PCR 产物热变性产生单链环状DNA 文库后上机测序。测序所得原始数据使用华大自主研发的过滤软件SOAPnuke进行统计,使用trimmomatic进行过滤。
1.5 PPI 网络构建和模块分析 使用STRING 数据库(http://string-db.org)构建靶蛋白的PPI 网络[12]。分析蛋白质之间的功能相互作用可能会发现有关疾病产生或发展机制。在本研究中,DEG的PPI网络是使用STRING 数据库构建的,并且综合得分>0.7的相互作用被认为具有统计学意义。Cytoscape是一个开放源代码的生物信息学软件平台,用于可视化分子相互作用网络[13]。 Cytoscape 的插件ClusterONE(1.0版)是一个将PPI网络进行聚类的应用程序[14]。使用Cluster ONE识别PPI网络中的重要模块,从而确定了PPI 网络中的重要模块。随后,使用DAVID对该模块中的基因进行KEGG和GO分析。
2.1 STR 以时间和剂量依赖性抑制HepG2 细胞的生长 在用不同浓度的STR 处理HepG2 细胞24、48、72h 后,使用CCK8 试验检测细胞增殖情况。如图1所示,STR以时间和剂量依赖性降低细胞活力,并且48 h的IC50约为1.5 mg/ml。
图1 STR以时间和剂量依赖性方式抑制HepG2细胞的生长Figure 1 STR inhibits HepG2 cell growth in the time-and dose-dependent manner
2.2 RNA-Seq 结果 通过STR 剂量依赖试验处理HepG2细胞,发现STR 48 h的IC50值约为1.5 mg/ml。通过RNA 测序,以碱基对分辨率评估了未经处理的HepG2 细胞和STR 处理过的HepG2 细胞的概况。除去低质量的序列后,将每个样品的原始读数映射到参考基因组(表1)。
2.3 DEG 的识别 通过将STR 处理样品和对照组样品进行比较来筛选和产生DEG。如柱状图(图2-A)所示和聚类热图(图2-B)所示,分析确定了2 428个DEG,其中包括下调基因1 235 个,上调基因1 193个,满足条件log2(倍数变化)>1,P值<0.001。
表1 读取比对过程的一般统计资料Table 1 General Statistics of Reads Alignment Process
图2 DEGs的柱状图(A)和聚类热图(B)Figure 2 Column diagram and Clustering heat map of DEGs
2.4 KEGG和GO的DEG富集分析 为了确定DEG的生物学分类,使用DAVID 进行了功能和途径富集分析,上调和下调的基因的GO功能富集确定为P 值<0.05。GO 分析结果表明,DEGs 的生物过程的改变在对有机物的反应、胆固醇生物合成的过程、甾醇生物合成的过程、对非生物刺激的反应、脂类生物合成过程显示丰富。DEGs 的细胞成分变化主要集中细胞外区域部分、质膜部分、不溶性组份、细胞组分、膜的组成组分。DEGs 分子功能改变主要富集在GTPase调节活性、核苷-三磷酸酶调节活性、金属离子结合、阳离子结合、离子结合等途径。KEGG 通路分析表明,DEGs 主要富集在萜类骨架生物合成、p53信号通路、类固醇生物合成、B细胞受体信号通路、T细胞受体信号通路、MAPK信号通路,见表2。
表2 STR处理的HepG2细胞中DEGs的GO和KEGG途径富集分析(Top5)Table 2 GO and KEGG pathway enrichment analysis of DEGs in HepG2 cells treated with STR
2.5 PPI 网络建设和模块分析 为了分析DEG 的功能贡献,使用Cytoscape 对PPI 网络分析。计算每个P值的错误发现率(false discovery rate,FDR)。通常,FDR值<0.01的术语被认为是丰富的。确定了PPI网络和DEG的最重要模块(图3-A和图3-B)。使用DAVID 对模块中涉及的基因进行功能和途径富集分析。结果显示,最重要模块中的基因主要富集在T细胞受体信号通路、MAPK信号通路、钙信号通路、p53信号通路(表3)。
2.6 核心基因分析 总共有17个基因被鉴定为核心基因等级≥10 的核心基因。表现出显著相互作用的17 个最重要的基因是GNRH1、PTAFR、GPR68、 PLCB1、 PTGER1、 BDKRB1、 GNB3、GNG3、LPAR5、BDKRB2、SAA1、RLN3、ADORA1、S1PR4、TAS2R5、NPB、GALR2。
图3 PPI网络和DEGs的最重要模块Figure 3 PPI network and the most significant module of DEGs
表3 模块中GO和KEGG通路富集分析Table 3 GO and KEGG pathway enrichment analysis of DEGs in HepG2 cells treated with STR
转录作为蛋白质合成的第一步,在遗传信息的传递过程中起着至关重要的决定性作用。在本研究中,通过RNA-Seq 确定了HepG2 细胞的RNA图谱来探索STR 处理的HepG2 细胞的DEGs 功能。筛选出2 428个DEGs,包括下调基因1 235个,上调基因1 193 个,发现这些DEGs 与STR 介导的肝癌增殖抑制有关。使用DAVID 对2 428 个DEGs 进行了功能和途径富集分析。GO 分析结果显示DEGs 主要富集在对有机物反应的过程和细胞外区域的组织结构部分。KEGG 通路分析表明,DEGs主要富集在肿瘤抑制因子p53信号通路。转录因子p53在细胞周期中起着核心作用,是最重要的肿瘤抑制因子。p53 能促进细胞周期停滞,衰老和凋亡,其失活是每一个肿瘤失活的标志[15-17]。本研究表明STR介导的HepG2细胞增殖抑制与p53信号通路有关,并用一套序列分析软件包仔细鉴定STR处理诱导的HepG2细胞DEGs,共鉴定出17个核心基 因: GNRH1、 PTAFR、 GPR68、 PLCB1、PTGER1、 BDKRB1、 GNB3、 GNG3、 LPAR5、BDKRB2、 SAA1、 RLN3、 ADORA1、 S1PR4、TAS2R5、NPB、GALR2。使用DAVID 检测了这些核心基因。GO分析结果表明,核心基因的生物过程的改变富集在G 蛋白偶联受体蛋白信号通路、细胞表面受体连接信号转导、细胞内钙离子浓度升高、胞质钙离子稳态、细胞钙离子稳态等过程。核心基因的细胞成分变化在质膜部份显示丰富。核心基因的分子功能的改变集中在G 蛋白偶联、肽受体的活动、血管紧张素受体结合、1型血管紧张素受体结合等途径。KEGG 通路分析表明,核心基因富集作用于神经活性配体-受体相互作用、钙信号通路、味觉传导、趋化因子信号通路。GNRH是一种多肽荷尔蒙,能促使垂体释放卵泡刺激素和黄体化激素。 GNRH1 通过与受体结合,抑制子宫内膜癌细胞增殖,促进细胞凋亡[18]。PTGER1 是前列腺素E2 的四个受体之一,可编码前列腺素E 受体1。PTGER1 在醛固酮腺瘤中高表达,可诱导APA 产生过量醛固酮和促进肿瘤进展[19]。GPR68是质子敏感的G蛋白偶联受体,可能在肿瘤发生,发展和转移过程中起关键作用。GPR68 可抑制人卵巢癌HEY 细胞的增殖和迁移[20]。PLCB1是G蛋白偶联受体相关的PLC-β亚型的成员,在细胞内转导中发挥着重要作用。PLCB1的表达升高可以促进HCC 的发展[21]。LPAR5 是G蛋白偶联的跨膜溶血磷脂酸受体之一,介导对溶血磷脂酸的细胞内应答,并具有参与细胞增殖、分化相关的多种生物学功能。LPAR5 可促进胰腺癌细胞进展[22]。SAA1 是淀粉样蛋白A 的主要前体,在脂质代谢中起着重要作用,并能调节炎症和肿瘤的发病机制。SAA1 在子宫颈癌中高度表达[23]。RLN3是一种属于胰岛素-弛缓素超家族的神经肽。RLN3在HCC中表达显著增加,可能与肝癌的预后相关[24]。ADORA1是G蛋白偶联受体超家族的一员,由抑制腺苷环化酶的G 蛋白介导其活性。腺苷可通过ADORA1 诱导细胞凋亡抑制结肠癌生长[25]。GALR2是一种G蛋白偶联受体,能激活Gq、Gi 和G12 这三个家族的G 蛋白。GALR2 介导SH-SY5Y 神经母细胞瘤细胞凋亡[26]。甘丙肽通过GalR2抑制大鼠嗜铬细胞瘤细胞的增殖并诱导细胞凋亡[27]。GalR2 抑制p53 突变的头颈部癌细胞的增殖,诱导细胞凋亡[28]。血小板激活因子(platelet activating factor,PAF)及其受体PTAFR这一促炎受体配体对是肿瘤细胞粘附内皮细胞、血管生成、肿瘤生长和转移的重要调节因子。PTAFR 在卵巢癌细胞中过表达,PAF可通过PAF/PAFR介导的炎症信号通路促进卵巢癌进展[29]。BDKRB1 是一种G蛋白偶联受体,它的激活可导致激活可导致细胞增殖、迁移。BDKRB1 在前列腺癌和肺癌中过表达[30,31]。GNB3 基因在细胞生长和有丝分裂中起重要作用。GNB3基因第10外显子在825位的常见多态性(C825T),可能会增加患癌症的风险[32]。BDKRB2是一种G蛋白偶联受体,能促进前列腺癌细胞中血管内皮生长因子的表达并增加血管生成[33]。但是,现今还需要更多的研究来说明GNG3、RLN3、S1PR4、TAS2R5、NPB 这些基因与HCC 的关系。同时,本研究的对象为HepG2 细胞,还需要动物试验加以辅助验证。
本研究试图确定可能参与STR 治疗HCC 分子机制的DEGs,总共确定了2 428个DEGs和17个核心基因,可以将其视为STR 治疗HCC 的靶点。然而,这些基因在STR 治疗肝癌的分子机制和生物学功能仍需要进一步的研究来阐明。