加权基因共表达网络分析在畜禽研究中的应用

2022-07-25 06:39严晓春王凤红李文泽闫晓敏刘虹夫李金泉
中国农业大学学报 2022年7期
关键词:通路性状畜禽

龚 高 严晓春 王凤红 张 磊 李文泽 闫晓敏 刘虹夫 吕 琦 李金泉,2 苏 蕊,2 *

(1.内蒙古农业大学 动物科学学院/农业农村部肉羊遗传育种重点实验室/内蒙古自治区山羊遗传育种工程技术研究中心,呼和浩特 010018;2.内蒙古金莱牧业科技有限责任公司,呼和浩特 010018)

随着生命科学技术的发展,测序技术、高通量技术、组学技术与各种分析方法不断趋于成熟,高通量测序成本不断降低,积累的测序数据不断增多,挖掘关键功能因子的方法也逐渐丰富。常见的分析方法包括差异分析、维恩图分析、差异基因聚类分析和趋势分析等(表1)。这些方法均建立在双样本假设检验的基础上,通过筛选差异表达基因进行比较、聚类和相关性的研究,然而对于多样本复杂试验设计和表型数据的联合分析,这些方法的效率较低、分析较为困难。因此,研究人员在2005年首次提出了加权基因共表达网络分析(Weighted gene co-expression network analysis, WGCNA)方法,在人类和小鼠等相关领域中,率先解析体重、细胞周期、脑癌、肺癌、胰腺癌、自闭症、遗传疾病等复杂性状和疾病的分子机制。该方法旨在结合高通量数据与样品表型数据进行联合分析,充分利用表型数据将差异基因划分为数量较少的模块,从多样本中识别候选标志物,大大降低了分析的成本,提高分析效率。

表1 常见差异基因测序数据分析方法统计
Table 1 Statistics of common differential gene sequencing data analysis methods

分析方法Analytical method适用条件Applicable condition软件Software差异分析Differential expressionprofiling样品分组数为2组时,常用阈值法进行差异分析,通过Padj与log2fold change对差异基因进行筛选。样品分组数目过多、样本复杂时,分析较为困难。DESeq2[1]等维恩图分析Venn diagram analysis当分组数大于2组时,通常先对两两分组进行差异分析,再利用韦恩图筛选关键差异基因,但当分组数目过多、样本复杂时,分析较为困难。—差异基因聚类分析Cluster analysis能与维恩图分析联合,对差异基因进行聚类,挖掘表达趋势相同的基因。—GO富集分析GO enrichment analysis能够判断基因集主要富集在哪些功能上,结合研究目的能够定位相关的功能和基因。GOSeq[2]KEGG富集分析KEGG pathwayenrichment analysis能够提示基因集参与的生物学功能,通过富集的通路,从而筛选出关键的信号通路与基因。KOBAS-i[3]GSEA分析GSEA analysis用于确定先验定义的基因集是否在两种生物学状态(表型)之间显示出统计学差异。GSEA[4]趋势分析Short time-seriesexpression mineranalysis当样本分组间具有明显趋势时,通过趋势分析能够挖掘具有相同表达趋势的基因。STEM[5]WGCNA分析WGCNA networkanalysis当样品分组数目较多、性状信息完善时,能充分利用表型数据对差异基因进行划分,构建基因调控网络。WGCNA[6-7]

如今,WGCNA作为一种高效的系统生物学方法,能够分析RNA-seq数据(包括mRNA、miRNA、lncRNA、circRNAs等)、蛋白组数据、代谢组数据、全基因组DNA甲基化数据(Whole genome bisulfite sequencing,WGBS)和单细胞转录组等高通量数据,并且能够整合全基因组关联分析(Genome-wide association studies,GWAS)的结果进行联合分析。WGCNA方法能对多种表达数据集进行分析,进而对复杂表型进行解析,该方法不仅广泛应用在模式动植物的研究中,近年来也逐渐成为通过高通量组学数据解析畜禽重要经济性状的优异工具,广泛的应用于畜禽研究中。因此,本文将对WGCNA方法的一般流程与应用策略进行阐述,论述其在牛、羊、猪、禽等畜禽的应用以及研究现状,对该方法的应用前景进行归纳和总结,为畜禽相关研究提供新思路。

1 WGCNA方法概述

相关网络分析的方法越来越多地被应用于生物信息学相关研究,例如基因共表达网络、蛋白质-蛋白质相互作用网络、细胞-细胞相互作用网络等。2005年Zhang和Horvath首次提出加权基因共表达网络分析这一概念,描述了一个使用“软”阈值的计算框架,它为每个基因分配一个连接权重,是一种描述样本之间基因相关模式的系统生物学方法。2008年,Langfelder和Horvath通过R语言实现了WGCNA的应用,为WGCNA的分析提供了免费公开的R包,为该方法的广泛应用奠定了基础,截止2021年9月1日,该文献已被引用6 526次,在Web of science检索“WGCNA”共有2 412篇文献,分析检索结果发现,研究方向主要集中在遗传学、肿瘤学、免疫学和医学等领域(图1(a)),该方法在人类脑神经调控、阿尔茨海默病、乳腺癌、皮肤病、癌症等研究中被广泛应用。近5年来,WGCNA方法在农业领域也有有了大量应用(图2(b)),如动植物重要性状遗传标记筛选、发育生物学、生殖生物学和病理学等方面。

(a)检索“WGCNA”字段研究方向分类TreeMap图;(b)农业研究方向中WGCNA发表文献统计图(a) Search “WGCNA” field research direction classification TreeMap diagram; (b) Statistical chart of documents published by WGCNA in the direction of agricultural research图1 WGCNA方法在不同研究领域的应用现状和发展趋势Fig.1 Application and development of WGCNA approach in various research topics

WGCNA专为高通量数据而设计,能够描述样本中基因之间的相关模式,能找出与目标性状高度相关的模块,并通过模块或模块内的核心基因来对这些结果进行总结,能与样本的性状相关联,计算模块隶属度。WGCNA具有诸多优点:首先它不需要基因间相互作用的先验条件,只需基于表达数据就能分析基因间相互的调控关系;它将成千上万的基因划分为少数功能相似的模块,强调模块的效应,而不是单一的某一个基因,这符合生物学的规律;使用基因的连通性信息能较快找到核心基因;该方法能够对弱效应基因进行挖掘,能对DNA水平的分析进行补充。

WGCNA分析的目标是:建立数据之间的真实关联(而不是基于先前发现的关联);确定数据的模块划分;将模块特征信息与外部表型信息关联,提供具有生物学意义的模块;确定相关模块中的关键因子。

2 WGCNA分析的一般流程与策略

WGCNA分析的一般流程见图2,提前对软件进行安装并对数据进行预处理,构建共表达网络,对模块进行识别划分,使用表型数据与模块进行关联分析,对目标模块进行功能分析,鉴定模块中的核心基因。

图2 基因共表达网络分析的流程图[7]Fig.2 Flowchart of gene co-expression network analysis[7]

2.1 软件准备与数据处理

使用R语言中WGCNA package进行分析,参考WGCNA官方网址教程(https:∥horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/),下载相应的R版本与WGCNA安装包,参照Langfelder等方法流程对基因的表达量数据构建基因共表达网络。

数据准备:样品表达数据(需要至少15个样品),包括RNA-seq数据、蛋白组数据、代谢组数据、DNA甲基化数据等;样品对应的表型数据。

准备合适的试验数据,进行数据的录入、清理和预处理,这是网络分析的第一步。对样品数据进行归一化处理;将其处理为适合网络分析的格式。通过移除明显的离群值样本、缺失值过多的基因和样本来清理数据,这些数据会干扰网络模块的分析。

2.2 基因共表达网络的构建

2

.

2

.

1

构建相关矩阵利用基因的表达量数据,计算两两基因之间表达量相关系数的绝对值,进而构建基因共表达相关性矩阵(

S

),通过公式(1)计算基因间相关性矩阵,其中

i

j

表示第

i

j

个基因,

X

X

表示基因

i

与基因

j

的表达量。

S

=|cor(

X

,

X

)|

(1)

2

.

2

.

2

构建邻接矩阵通常构建网络采用“硬阈值”的方法,该方法会丢失网络的间接信息,而采用软阈值参数(Soft threshold,

β

)构建的网络可以克服这个缺陷,取“幂值”能够拉大“贫富差距”,会导致相关性强的基因关系越相关,相关性差的基因关系越不相关,让网络尽可能符合标准的无尺度网络,并保留连通性信息,这种网络也符合生物学基因间的关系。为了遵循无尺度网络的原则,一般要保证选择

R

>0.8或达到平台期时最小的

β

值用于构建网络。选择合适的

β

值后,将相关性矩阵中的值进行

β

次方计算,通过公式(2)将相关性矩阵转化为邻接矩阵(

a

)。

(2)

2

.

2

.

3

构建拓扑重叠矩阵评价基因间相关性,不能只考虑两两基因间的相关性,还需考虑间接基因关系。因此,在邻接矩阵的基础上计算TOM值,见公式(3),建立基因之间直接和间接的关系,进而通过TOM值构建拓扑重叠矩阵(TOM矩阵),公式中

a

为邻接矩阵中基因

i

和基因

j

的直接邻接值, ∑aa(

u

i

,

j

)表示邻接矩阵中a所对应行列位置的乘积和,K(K)表示基因

i

(

j

)与其他所有基因的邻接值之和。TOM值介于0~1,TOM值越高表示基因

i

j

越相似。

(3)

通过TOM矩阵绘制TOM聚类树,通过拓扑树结构将表达模式相近的基因聚为一类。利用基因间的TOM值进行层次聚类并对模块进行划分与合并。用不同颜色表示不同的基因模块,相同颜色表示该颜色内的全部基因被划分到相同的模块,这些模块内的基因可能在一个生理过程或不同组织中具有相似的表达变化,那么这些基因可能具有相同功能。

2.3 模块识别与筛选

寻找具有生物学意义的模块和基因是许多共表达分析的主要目标。WGCNA通过基因在样本中表达的相似性划分模块,可用于探索网络中的模块结构,测定基因和模块之间的关系(模块-基因聚类热图);探索模块之间的关系(特征基因网络);结合外部表型数据,构建模块与样本性状的关系(模块-性状相关性热图)。选择与目标性状(样品)高相关的模块进行后续分析。

2.4 模块基因功能分析

对目标模块进行功能分析,将划分好的模块网络与其他数据库进行连接,能够更充分的解释模块发挥的功能:

1)GO数据库:GO功能富集分析(Gene ontology,GO)是通过对生物学过程(Biological process,BP)、细胞组分(Cellularcomponent,CC)和分子功能(Molecular funtion,MF)这3个类别对基因功能进行注释和分类的一种方法。通过GO分析,能够判断模块中基因主要富集在哪些功能上,结合研究目的能够定位相关的功能和基因。

2)KEGG数据库:在生物体中,不同基因之间相互协调共同行使生物学功能,KEGG(Kyoto encyclopedia of genes and genomes)是一种系统分析基因功能、基因组信息的数据库。通过Pathway显著性富集可以确定模块基因中参与的最主要生化代谢途径与信号转导途径。KEGG分析能够提示模块基因参与的生物学功能,通过富集的通路,从而筛选出关键的信号通路与基因。

3)STRING蛋白质互作数据库:通过在线STRING蛋白质互作数据库(https:∥string-db.org/cgi/input.pl)进行模块基因蛋白-蛋白互作网络的分析(Protein-protein interaction,PPI)。寻找模块基因的蛋白互作关系,绘制蛋白-蛋白互作网络图。

4)网络可视化:将WGCNA输出的模块节点文件和模块连接权重文件共同导入Cytoscape软件进行网络可视化,通过权重网络关系能识别模块中的hub因子,结合基因功能进而筛选出关键的核心因子。

2.5 WGCNA分析策略

WGCNA R包提供了一套可用于执行加权相关网络分析的功能,可用于构建基因表达谱、图像数据、遗传标记数据、蛋白质组学数据和其他高通量数据的网络结构。目前,WGCNA在处理基因表达数据(RNA-seq)和研究网络变化中被广泛使用。陈林通过骨骼肌RNA-seq数据研究大蒲莲猪与长白猪的肉质差异,通过WGCNA鉴定出4个与肌肉发育显著相关的模块,发现基因富集参与P13K-AKT通路和AMPK信号通路,可能间接影响肌肉发育。Ling等对山羊胚胎期和出生后7个阶段的骨骼肌进行lncRNA分析,通过WGCNA发现“早期模块”中的基因与肌肉结构的形成有关,“晚期模块”参与了“p53信号通路”等通路,发现了lnc_011371、lnc_007561和lnc_001728可能在山羊骨骼肌中发挥重要作用。

质谱仪器和生物信息学鉴定算法的快速发展,使样品蛋白质或代谢物的高通量测定成为现实,这大大加快了对复杂生物系统功能的探索。WGCNA能够提供系统的分析,兼顾低丰度的基因信息,该方法最近也被应用于蛋白质组和代谢组数据分析中。Zhang等通过WGCNA揭示了小麦抗条锈病的基因激活模型,鉴定出32个诱导蛋白可能与条锈病抗性有关。Mantini等通过WGCNA分析揭示了一个胰腺导管腺癌(PDAC)的相关模块,该模块与代谢过程、上皮-元性过渡显著相关,并发现SPTBN1、KHSRP和PYGL蛋白与PDAC生存有关。目前WGCNA已被广泛用于代谢物数据的分析,用于识别诸多性状的中心代谢物,如肺癌与糖代谢紊乱、波棱瓜极端环境适应性、茶树发育与次生代谢、番茄成熟等相关研究。Carmelo等利用WGCNA分析杜洛克和长白猪血液代谢物,构建饲料转化效率(FE)代谢网络与代谢途径,确定与杜洛克和长白猪FE相关的关键血液代谢物,包括胆碱、吡哆胺、乙酰乙酸酯、硫酸胆固醇、黄嘌呤和脱氧尿苷等,可以通过这些特征代谢物提高养分利用率,降低生产成本,增加FE。

DNA甲基化是研究最广泛的表观遗传修饰,它在许多重要的基因组调控过程中发挥作用,包括X染色体失活和基因组印记,WGCNA能够找到具有高度相关DNA甲基化水平的基因模块,并将这些模块与表型特征联系起来。Liu等利用WGCNA发现精子的部分高度可变甲基化区域(HVMR)与繁殖性状相关性较高,揭示了基因组变异、DNA甲基化和表型之间可能存在的内在联系,证实了精子DNA甲基化与生殖特征的关联性。

全基因组关联研究(GWAS)是研究复杂性状遗传结构的有力工具,但GWAS分析微效多基因控制的数量性状检测能力不足。Farber整合GWAS和WGCNA分析,成功发掘出骨密度相关基因

TNF

,验证其在骨代谢中的作用,WGCNA为GWAS提高了数量性状的检测能力。Yan等联合WGCNA和GWAS对奶牛酮病进行研究,发现5个酮病候选基因

MAFA

C14H8orf82

MAF1

grina

RECQL4

。Deng等整合WGAS和WGCNA用于识别与产奶量相关的特定模块和枢纽基因,得到9个与产奶量相关的模块,并鉴定了一些涉及产奶量的核心基因,包括

BNIPL

TUBA1C

C2CD4B

DCP1B

MAP3K5

等。李晓凯结合内蒙古绒山羊不同毛被类型的GWAS和WGCNA数据,发现

CPLX1

LRPAP1

DGKQ

等候选基因可能与不同毛被类型存在潜在相关性。刘晓静利用GWAS和WGCNA鉴定调控肉鸡血糖-肌糖原-乳酸轴代谢的候选功能基因,发现

FOSL2

与肌糖原含量呈负相关,

CEBPB

MAP3K14

SLC2A14

等经典糖代谢相关基因也与肌糖原含量存在相关。

WGCNA能够利用多种组学数据,挖掘影响表型的关键因子,在多组学的时代里,为复杂性状的解析提供技术支撑。

3 WGCNA方法在畜禽研究中的应用

随着分子生物技术和基因组学等新兴学科的飞速发展,动物育种与分子遗传学研究取得了大量的突破性成果,分子育种已逐渐成为育种的主流。随着分子数据的逐步积累,采用更加科学合理的分析挖掘方法就显得至关重要了,WGCNA兴起于人类医学的相关研究,而近年来该方法在牛、羊、猪、禽等畜禽的应用研究中也逐渐增多,为畜禽肌肉发育、饲料利用、疾病防治、繁殖性能、优良性状定位、环境适应性等方面的研究提供了新的分析手段。

3.1 WGCNA在畜禽产肉性能研究中的应用

产肉性状是畜禽产业中重要的经济性状,WGCNA方法能够对肉产量和肉品质等重要研究方向提供助力。畜禽胎儿出生前体重对动物出生后生长性能的变化有着重要贡献,Xu等研究两个绵羊品种不同胎儿阶段的背最长肌,通过WGCNA鉴定了

TADA3

LMNB1

TGF-β3

等与胎儿体重相关的基因。Silva-Vignato等鉴定了与胴体性状相关的模块,发现3个关键候选基因

RSAD2

EIF2AK2

PARP

与背膘厚相关;

ACAT1

ACSL

与肋眼面积相关。畜禽出生后肌肉纤维的发育与肉质、生产效率密切相关。石田培等对绵羊胚胎妊娠第85、105和135天的胎儿背最长肌组织进行RNA-seq,利用WGCNA得到

TNN12

PIP5K1A

PDK4

等关键基因,同时预测出10个与肌肉发育、肌肉疾病、细胞增殖相关的lncRNAs,阐明其在肌纤维类型转换与肌纤维增粗过程中的调控机制。Li等对鸡胸肌不同发育阶段的RNA-seq数据进行WGCNA分析发析,发现有4个模块与胸肌发育的特定生长阶段有关,主要富集于MAPK信号通路、NRG/ErbB信号通路和胰岛素信号通路,筛选

FGF

MAPKAPK5

NRG1

SCD

PPAR

等核心基因可能与鸡胸肌发育的分子机制有关。皮下脂肪、肌内脂肪含量(IMF)和脂肪酸(FA)组成是衡量加工肉制品和鲜肉制品质量特性的重要指标。Zappaterra等对意大利大白猪半膜肌进行RNA-seq,发现有4个模块与猪IMF显著相关,其主要参与DNA转录和细胞分化的调控、原生纤毛的形态发生、ERK/MAP激酶和G蛋白相关的反应,随后又研究发现与棕榈酸和棕榈油酸含量相关的模块,在自噬、线粒体融合和线粒体活性中显著富集,与肌内脂肪的油酸、

n

-6和

n

-3多不饱和脂肪酸含量相关的基因模块在MAPK信号通路中显著富集。Oliveira等通过WGCNA确定与内洛尔牛肌内脂肪沉积相关的差异分子,发现葡萄糖代谢和炎症过程是影响肉牛肌内脂肪沉积的主要途径,动物脂质沉积相关的差异分子可能参与免疫系统和炎症途径,并与脂质代谢相关。FA含量是影响肉感官和营养价值的重要特征,de Oliveira等对骨骼肌中miRNAs和mRNAs与FA关联进行研究,确认胰岛素信号通路和MAPK信号通路是FA含量的重要通路,鉴定出bta-miR-33a/b、bta-miR-100、bta-miR-204、bta-miR-365-5p、

ACTA1

ALDOA

等基因是潜在的脂肪酸合成调节基因。

过多的脂肪沉积会导致畜禽的健康问题,从而造成巨大的经济损失,影响生产效率。Gao等和Yuan等构建不同鸡品系在不同腹脂含量的基因共表达网络,发现丙酮酸代谢、脂肪酸代谢、甘油酯代谢、PPAR信号通路、胰岛素信号通路等信号通路与脂肪形成有关,并发现在不同的鸡品系中,脂肪组织生长和发育有着相同的分子途径。目前WGCNA方法已在畜禽产肉性能方面的研究多有报道,涉及体重、酮体性状、肌肉纤维发育与肉质、肌内脂肪和脂肪酸含量、脂肪沉积等多方面研究,通过该方法已经筛选到大量与产肉性能相关的分子标记,为相关研究提供参考依据,但目前还缺乏这些基因的功能验证。

3.2 WGCNA在畜禽疾病研究中的应用

在畜禽养殖过程中,疾病对生产有着很大的负面影响,很多疾病的防治与治疗难度极大,通过抗病育种来降低畜禽疫病发生就成为一个重要的研究方向。

猪繁殖与呼吸综合征(PRRS)是目前养猪业最具经济破坏性的疾病之一,该疾病由PRRS病毒(PRRSV)引起,PRRS影响猪养殖的所有生产阶段,一般表现为生殖损失(不孕、流产、死胎和木乃伊胎儿),仔猪表现出较高的断奶前发病率和死亡率。Schroyen等为找出PRRS易感和抗性猪之间潜在的分子差异,通过WGCNA发现一个模块与PRRSV病毒载量有关,该模块包含大量的免疫应答基因。陈曦对通城猪和大白猪人工感染PRRSV前后的脾脏和腹股沟淋巴结组织进行研究,发现2个模块与病毒载量相关性较强,筛选出

ALDB4471

ALDB3437

等基因,验证发现

ALDB4471

在细胞中可以显著促进病毒的复制,并且显著抑制抗PRRSV基因

RSAD2

的表达。高国丽从转录水平上研究抗病个体和易感个体对PRRSV抗病性的差异,发现2个模块与病毒载量和体重增长的相关性强,抗病组和易感组共有的差异表达基因主要富集在免疫通路,易感组特有的差异基因主要富集在免疫通路和信号传导通路。绵羊胃肠道线虫感染会使羊肉产量和毛产量减少,Kadarmideen等对捻转血矛线虫和蛇形毛圆线虫感染绵羊的基因表达谱数据进行分析,确定了与感染时间相关的基因模块,筛选

CAT

FBX033

COL15A1

IGFBP7

等相关的生物标志物。新城疫病毒(NDV)对全球家禽生产构成威胁,Deist等研究感染慢传播性NDV禽类的哈德尔腺、气管和肺组织,通过WGCNA发现

EIF2AK2

MPEG1

TNFSF13B

等基因与新城疫病毒抗性相关。马立克氏病病毒(MDV)是一种可引起鸡T细胞淋巴瘤的致瘤性疱疹病毒,You等阐述了基因模块与马立克氏病的相关性,发现lncRNAs可能通过其靶基因影响鸡脾对马立克氏病的抗性和肿瘤的发生。通过WGCNA对畜禽疾病进行探究,能够进一步缩小关键因子的筛选范围,精确地探寻疾病的致病因子,构建疾病调控网络网路,为畜禽疾病的解析提供新思路。

3.3 WGCNA在畜禽繁殖研究中的应用

畜禽的繁殖性状是经济性状的重要组成部分,与生产效益、成本密切相关,直接影响农牧业经济发展。Miao等利用WGCNA鉴定与绵羊繁殖力有关的mRNA和lncRNA,发现TGF-β与催产素信号通路有关的mRNA能够促进绵羊多产性。Tian等研究了不同

FECB

基因型的中国地方绵羊生殖轴,鉴定出2个与卵巢样本显著相关的模块,主要富集到信号转导和内分泌系统,推测这些基因在调节生殖方面具有重要功能,并发现

CYP17

在卵巢类固醇合成途径中有较大程度的表达,可能具有调节生殖的功能。Bo等以不同日龄的睾丸为材料,鉴定出7个时间特异性差异的lincRNA模块和6个mRNA模块,发现了lincRNA对精子发生和睾丸生长的不同调控模式。卵泡发育在家禽繁殖过程中起着关键作用,它会影响产蛋性能,进而影响产蛋量,Shen等为揭示参与鸡卵泡发育的复杂调控网络,通过WGCNA确定了六个关键的模块,其与不同发育阶段的不同细胞类型有关,

MAPK1

CITED4

SOD2

NOVE_CIRC_0004730

等分子可能参与了卵泡发育的特定功能。Gu等研究与母鸡持续受精能力相关的关键基因模块,发现3个模块与母鸡持续受精能力高度相关,得到并验证

SPG11

CTDSPL2

MFAP3L

等15个基因表达水平与母鸡持续受精能力高度关联。

3.4 WGCNA在畜禽其他性状解析研究中的应用

畜禽的饲料转化效率(FE)是畜禽生产的重要性状,其直接关系到畜禽养殖行业盈利能力、生产力和可持续性。Xu等对DLY(Duroc×Landrace×Yorkshire)猪FE进行研究,通过WGCNA发现氧化磷酸化、产热和能量代谢相关途径与高FE组呈负相关,这些因素可能导致高FE猪的能量消耗较低,通过抑制肝脏中的脂质合成和葡萄糖代谢活性可能是改善DLY猪FE的策略之一。Hou等发现高FE和低FE猪的下丘脑中的差异基因主要富集在神经元信号转导过程,信号受体主要与JAK-STAT信号通路(

JAK2

STAT3

POMC

)、mTOR信号通路(

CAMKK2

AMPK

MTOR

)有关。Kong等发现高FE的牛,其瘤胃上皮线粒体的转录速率较高。Novais等通过血清代谢物鉴定评估肉牛FE性状,通过WGCNA发现肉牛的视黄醇代谢途径与FE有关,发现2,3-二氢黄酮、柠檬酸、植酸等代谢物与FE相关。剩余采食量(RFI)是FE的衡量标准之一,其可用来评价畜禽饲料消化、生长速度和饲料利用效率。为预测RFI的生物标志物,de Oliveira等利用WGCNA对肉牛的RFI进行研究,发现关键基因和中枢miRNAs如BTA-miR-486、BTA-miR-7、BTA-miR15a等可能在RFI变异中起潜在作用,为探究饲料利用效率的潜在分子机制提供了新的见解。羊的绒毛品质性状是羊产业重要经济性状之一,通过WGCNA方法能够进一步解析羊绒毛品质性状的遗传规律。陈华峰等通过构建苏博美利奴羊皮肤组织毛囊发生发育的共表达网络,发现毛囊发育、毛囊形态发生、Wnt信号通路、TGF-β信号通路等是毛囊发育相关的重要生物过程和信号通路。Wu等发现blue模块的基因表达与内蒙古绒山羊胚胎毛囊发育时期的规律一致,鉴定出

WNT10A

是内蒙古绒山羊皮肤毛囊发生发育成熟阶段的关键基因。Wang等分析成年绒山羊皮肤RNA-seq数据,发现有6个模块与毛囊周期性生长有关,与ECM受体相互作用、PI3K-Akt信号通路、雌激素信号通路等密切相关,筛选出

COL1A1

C1QTNF6

KRTAP3-1

等12个核心基因。龚高通过构建共表达网络发现内蒙古绒山羊毛被类型的关键基因主要富集在中间丝、中间纤维细胞骨架和角蛋白纤维,验证发现

FGF21

ASL

KRT39

KRT74

的相对表达量与毛长呈现极显著正相关关系。Fan等利用一个泌乳周期的转录组数据进行WGCNA分析,确定了与泌乳阶段、产奶量和主要牛奶成分含量有关的10个基因模块,发现半乳糖代谢途径是影响产奶量和乳糖合成的潜在候选途径;鞘脂信号通路是乳脂合成的潜在候选途径。高慧杰等对奶山羊不同生理阶段的乳腺组织RNA-seq数据集进行分析,发现4个关键模块,共得到

UQCR

RGL2

NOTCH1

PTBP1

等13个与乳腺发育相关的目标基因。Wang等利用WGCNA方法研究牦牛高原适应的调控机制,发现了一个核心模块,并筛选出与血压调节、活性氧的产生和新陈代谢有关的

ERAP1

GRAMP3

IL34

等基因。

通过WGCNA的方法对畜禽重要经济性状进行研究,能够找到调控性状的关键因子,后续能为畜禽品种培育与改良提供标记,促进畜牧养殖业健康发展。

4 总结与展望

随着基因组、转录组、表观组、蛋白组和代谢组等组学技术的发展,高通量数据不断累积,筛选差异基因的方法也越来越多。目前仅用单一的分析方法对组学数据进行分析,可能会忽视分子间的调控作用,掩盖掉部分的关键信息,很难充分挖掘这些高通量数据,利用WGCNA对数据进行分析能更为充分的解析数据。

利用WGCNA能够以系统、共表达网络、直观、降维等方式对数据进行划分,为高效的解析动植物重要经济性状功能基因提供新方法。综上所述,在畜禽的研究中,WGCNA方法已经广泛应用在生长性状、繁殖性状、抗病性状、品质性状等复杂性状优势功能因子的挖掘上,为动物遗传标记的识别提供了新的思路。但目前虽然发现了较多分子标记,但假阳性的比例仍然较高,需要进一步改进方法,并且通过大量的研究对标记进行验证。

该方法预计会更为广泛的应用于牛、羊、猪、禽等家养动物重要经济性状的挖掘上,为阐明性状生物学机制提供助力。WGCNA不仅能够对单一组学数据进行分析,通过该方法联合多种组学数据进行整合分析,也将是未来数据分析研究的一大趋势,从多个维度对数据进行处理,进而探寻多种分子间的调控关系。筛选出重要性状的“基因-转录-蛋白质-代谢产物-表型”多维度调控网络,进而全面解析性状变异的遗产机制,这将更充分的利用种质资源,对品种的培育与改良工作具有重要意义。

猜你喜欢
通路性状畜禽
DJ-1调控Nrf2信号通路在支气管哮喘中的研究进展
珠海长肋日月贝形态性状对体质量的影响
AngⅡ激活P38MAPK信号通路在大鼠NSAID相关小肠损伤中的机制研究
Notch信号通路在早产儿支气管肺发育不良中的应用意义
甜玉米主要农艺性状的研究
饲粮锌在畜禽机体中的作用
早春预防畜禽感冒五措施
如何做好春节期间畜禽管理
“常染色体遗传”等于“杂交后代性状分离比与性别无关”吗
你是如何说的?