李 林 邓 娜,2,3 张 博,2,3 李 慧,2,3 刘 妙 王建辉,2,3
(1. 长沙理工大学食品与生物工程学院,湖南 长沙 410114;2. 长沙理工大学预制菜现代产业学院,湖南 长沙 410114;3. 湖南省湘味餐调智造与质量安全工程技术研究中心,湖南 浏阳 410023)
随着计算生物学及系统生物学等新兴学科的不断涌现,生命科学大综合和大发展时期如期而至,在此过程中,“组学”的概念应运而生。组学包括DNA序列和修饰(基因组、表观基因组)、RNA和蛋白质含量(转录组、蛋白质组)、小分子(代谢组、脂质体组)和元素组成(如离子组),其均可采用相应的组学技术进行分析,统称多组学技术[1]。如采用微生物组学通过整合试验中的大量多样化信息,可揭示微生物的复杂性[2],采用脂质组学可利用多组学方法进行数据集成[3]。组学发展至今已形成涉及生命发展动态全过程、多维度的网络体系,研究对象包括代谢前体、中间体、最终产物的生物合成或降解的调控整合网络,受目前技术的限制,研究重点仍集中于微生物,包括微藻[4-5]、细菌[6-10]及其代谢物[11-14]等。
随着DNA测序技术的进步,尤其是下一代基因测序技术的发展,基于测序的应用场景更加多元,所产生的数据量大幅增加[15]。近年来组学研究的进程不断加快,多组学技术已被广泛应用到生产生活的诸多方面,交互式大数据也受到越来越多的关注[16]。复杂的食品基质与大量生理生化过程相关,而研究以上分子响应机制需结合代谢组学、蛋白质组学、基因组学、转录组学、脂质组学和生物信息学等多种方法进行综合分析,通过分析食品化合物和多种外界因素间的相关性,发掘实现相关功能的新生物标志物,以揭示其内在复杂机制,从而为食品的生产应用提供理论支撑。研究拟聚焦组学技术在食品领域的应用现状及发展前景,以期为多组学技术在食品研究中的进一步发展做出预判与借鉴。
根据中心法则(DNA→RNA→蛋白质)揭示的生命科学基本规律,基因组学、转录组学、蛋白质组学和代谢组学[17]已被广泛应用于分析研究中;研究对象不同,组学技术研究策略不同,所依赖的技术手段也不尽相同(图1)。
图1 与中心法则相关的主要组学方法及其一般研究策略[18]
1990年人类基因组计划的正式启动,揭开了基因组学时代的序幕。2006年人类基因组草图宣告完成,人们对基因组的结构和特征有了全面认识,生命科学的研究重点转移至解析基因组的功能,即对基因组的研究由结构基因组学进入功能基因组学[19](图2)。基因组学是一门对某一物种的所有基因进行核苷酸序列分析、基因定位、基因组作图和基因功能分析的科学,也是组学发展的第一步,理论体系和技术体系都已有较大发展,可在相对较低的成本下对数量空前的样本进行快速基因分型,对基因组进行有效测序,并从中预测RNA及蛋白质序列[1]。2007年第二代基因组测序技术取得突破,以Illumina测序技术为代表的高通量短片段测序与拼接技术,大大降低了DNA序列分析成本,加速了大量物种基因组草图的面世。2017年,以Oxford Nanopore为代表的第三代测序仪在测序通量和准确率方面取得显著改进[20],已成为当前基因组学的主要测序方式(表1)。
转录组学是研究特定组织、细胞或器官在特定组织生长发育阶段或某一特定生理状态下所有转录组的科学[29],其将mRNA反转录为cDNA,进而对cDNA进行分析来反映特定时空下基因的表达情况。转录组学覆盖率高、具有动态性,其兴起使大量生物分子被发现,且其数据比“下游组学”如蛋白质组学和代谢组学更容易分析和共享,有助于建立全景式的生物特定时空基因表达图。转录组与基因组学采用相同的测序技术,但转录组是在测序之前的反向翻译(mRNA→cDNA),可选择性地去除干扰核酸如DNA、t-RNA、rRNA[30]。随着第三代基因组测序技术的发展,RNA-seq方法(表1)可用于研究RNA生物学的诸多方面,如单细胞基因的表达、翻译组(translatome)和RNA结构,已渗透到动植物、微生物生长发育的各个方面[31]。
蛋白质组学以细胞内全部蛋白质的存在及其活动方式为研究对象,是揭示基因结构与表达关系的主要“功能层”[1]。同时,蛋白质是直接参与生命活动的生物大分子,对复杂生命系统进行整体性研究非常重要,蛋白质组学研究已成为生命科学研究进入后基因组时代的里程碑(图2)。蛋白质组学研究的核心在于蛋白质的分离与鉴定,主要应用双向电泳(2-DE)和质谱技术(表1)。蛋白质首先依据其等电点和分子量进行分离,去除差异蛋白条带,再对胰蛋白酶消化后产生的多肽进行质谱分析[23]。目前已有大量专门软件可通过分析比较所获得的蛋白质图谱以确定2-DE中样品间的差异,一些软件甚至可实现条带的相对量化。
图2 组学技术发展历程Figure 2 History of the development of omics technology
代谢组学是依据生物体系受外界刺激或扰动后代谢产物的变化情况研究生物体系代谢途径的一门科学,根据其研究对象可分为脂质组学、离子组学等。通过代谢组学方法能精准识别和精确定量特征代谢物,使用软件工具进行下游途径和网络分析,在发现所需的生物标志物方面具有良好应用[32]。与蛋白质组学类似,其研究核心在于代谢物的分离与鉴别,由于代谢物的复杂性,尚无一种特定的分析技术适用于所有待测样品,因此出现了多种分离分析技术组合使用的现象,目前应用最广泛的是色谱与质谱联用(表1)。先从代谢物的种类和含量得到大量复杂的多维数据,而后采用化学计量学方法进行数据分析,从而识别显著变化的代谢标志物,通过对代谢途径及其变化规律的研究,可揭示反应的潜在机制[33]。
表1 多层次组学常用技术汇总简表
随着消费认知和消费能力的不断提升,人们希望对其生产加工及贮藏过程中的各种生化过程及其详细机制拥有更加全面的认识[34],而常规分析方法难以实现以上目的。为了满足当前对食品的高要求与新期待,利用组学大数据和整体分析技术,近年来通过蛋白质组学、营养基因组学、肠道菌宏基因组学和营养代谢组学的大量研究,推动了个性化营养学的高速发展[35]。总体而言,通过整合最新相关研究,组学技术在食品领域的应用主要集中在食品原料控制、品质提升与安全机理剖析3个方面(图3)。
图3 组学技术在食品领域的主要应用Figure 3 Applications of omics technology in the field of food research
畜牧业和种植业是食品原料的供给端,为食品产业提供畜产和植物性原料,而原料的产量及质量直接影响食品的品质。应用组学技术可筛选出影响植株和家畜生长的关键因素,进而可进一步挖掘增产提质的潜能,从而为上游食品原料的质量提供保障。
2.1.1 在植物性食材生产中的应用 随着气候持续剧烈变化,土壤受到污染,农作物生长过程受环境中非生物因素的影响持续增大,导致多种粮食作物减产降质,而组学技术分析有助于加强对植物与环境相互作用的理解[36],对鉴别描述作物品种、监测植物和作物健康状况、检查植物生长和果实成熟期间代谢物的积累、提高作物生产力等方面的研究优势明显。目前,组学技术对粮食作物和经济作物在非生物抗逆性研究与改良方面颇具成效,如Kumari等[37]采用多组学方法揭示了水稻复杂的抗逆胁迫机制,从而可对耐旱品种进行精准改良;Chen等[38]通过比较野生大豆在低磷胁迫和充足磷源条件下小分子代谢物类型、数量、代谢途径和基因表达的差异,为开发耐贫瘠土壤的栽培大豆品种奠定了理论基础;Yang等[39]结合转录组与代谢组方法发现赤霞珠葡萄在调亏灌溉(RDI)中花青素生物合成相关基因表达上调,这对揭示花青素的积累机制及针对性开发高花青素含量食材具有积极作用。
2.1.2 在动物性食材生产中的应用 从养殖过程开始即可对饲养牲畜的品质进行调控以确保肉品品质。如水产养殖能够提供优质蛋白质,因此保证其在养殖过程中的整体健康状况尤为必要[40]。基于蛋白质—蛋白质相互作用的组学网络可促进对鱼类疾病的了解,有助于水产养殖过程中潜在疾病的识别和治疗[41]。罗非鱼易在养殖过程中感染链球菌病而导致大规模死亡,Foysal等[42]通过代谢组学研究发现植物乳杆菌对罗非鱼肠道微生物区系、免疫应答及其抗病性具有积极影响。Gu等[43]结合代谢组学和基因测序技术研究发现,给泌乳期奶牛饲料中补充瘤胃保护性蛋氨酸可显著增加牛奶中功能性营养素α-酮戊二酸水平,有利于功能性乳制品的开发。Liu等[44]对鹌鹑蛋进行全蛋白和修饰蛋白分析,鉴定出鹌鹑卵蛋白的175个蛋白质、109个N-糖蛋白(293个N-糖基化位点)和23个磷酸化蛋白(84个磷酸化位点),功能分析表明鹌鹑卵蛋白、修饰蛋白具有丰富的酶活调节作用。
影响食品品质的因素较多,运用组学技术与方法可研究和探讨并揭示食品(功能性食品、发酵食品等)促进人类健康的潜在作用机理,对以饮食干预降低代谢性疾病风险和预后影响、控制成本均具积极作用[45]。
2.2.1 功能性食品 人类肠道微生物区系是由数十亿个微生物组成的复杂群落,其微生物数量约为人类细胞的10倍[46]。与人类共生的微生物具有数量多、反应复杂等特点,但细菌与宿主间的相互作用涉及不同微生物区系,其对人体影响各异。其中益生菌因其对人体有益,已成为功能性食品开发的重要选择。但益生菌种类繁多,且与宿主间作用机制不一,对益生菌功能的理解尚不够明确,而组学工具的利用和测序技术的发展对揭示特定微生物与人类宿主间的相互作用提供了有效途径[47]。通常,基因组学用来确定微生物区系的组成,随后根据转录组结果筛选关键基因,再利用代谢组学定性和定量分析特定条件下的内源代谢物。多组学技术的发展加速了益生菌群的研究进程[48-49],有助于深入了解益生菌内在作用机理,有利于相关功能性食品的开发。
2.2.2 发酵食品 发酵食品历史悠久,种类繁多,待开发微生物资源丰富[50]。近年来各类组学在奶酪、发酵酒精饮料、发酵蔬菜、发酵茶、醋及豆制品中均有大量研究和突破[51-52]。Song等[53]应用多组学(代谢组学和代谢组学)、细菌活力和理化分析,发现泡菜发酵过程中不同的原料组成会导致微生物群落结构不同。Zhang等[54]利用组学研究筛选并确定了郫县蚕豆酱高渗发酵过程中具有多肽降解功能的3种菌株(Aspergillusniger、Candidazeylanoides和Bacilluslicheniformis),其能够分泌肽酶,产生氨基酸。Taylor等[55]通过多组学方法(16S rRNA扩增序列、宏基因组测序和非靶向质谱)研究不同类型的发酵食品对人体肠道微生物组和健康的影响,发现共轭亚油酸产生与发酵食品消费间存在相关性。综上,揭示发酵过程中复杂生化变化及发酵微生物作用的组学研究,可为明晰发酵过程,从原料、发酵剂、发酵条件、贮藏条件等角度优化发酵工艺奠定基础。
2.2.3 其他食品 食品在加工过程(煮沸、油炸和烘烤)中会发生一系列复杂的生化变化,导致蛋白质、脂质等营养成分变性失活,通过组学技术进行分子水平的研究可深入探究食品加工过程中组分变化对食品品质和功能特性的影响,为食品加工工艺优化奠定理论基础。Wu等[56]采用非靶向组学方法测定牛肉在煮沸、油炸和烘烤过程中缩醛磷脂的变化,发现煮沸时间和烘烤温度对缩醛磷脂指纹图谱变化起关键作用,而采用涂膜预处理可防止油炸过程中缩醛磷脂的损失,从而保持其营养品质。
食品安全的概念日益扩大,安全评价的范围也逐渐扩大,除生产、加工、贮藏安全外,还包括食品成分、可追溯性、食品安全本身(微生物、过敏原或其他污染物)等。利用多组学技术可确定食品中生物危害和非生物危害,从而确保“从农田到餐桌”的安全。
2.3.1 食品的鉴伪和溯源 食品真伪鉴别和溯源技术是保障食品安全的重要手段,在食品质量与安全领域中占据重要地位[28]。当前食品掺假事件频发、掺假手段多样,传统检测方法已不能满足食品质量与安全检测要求,而组学技术具有强大的物质鉴定功能[57],能为食品鉴别和溯源提供科学依据和技术支持。应用多组学技术可对食品中蛋白质、糖类、脂质或其他代谢产物等进行大规模的定性定量分析,其在水产品、乳制品和肉制品等食品的真伪鉴别和产地溯源等方面具有广泛应用[58-59]。Bong等[60]利用电感耦合等离子体原子发射光谱、质谱技术根据不同产地白菜中各种常量及微量元素的含量变化即可确定其地理起源。
2.3.2 食品的生物危害 食品易受病原菌的污染,利用天然或人工合成的抗菌物质可预防腐败[61],而组学尤其是代谢组学技术是阐明其潜在作用机制的有效手段。如采用核磁共振方法探究乳酸链球菌素(Nisin)和葡萄籽提取物(GSE)对肉汤和对虾中李斯特氏菌的抑菌机理,研究发现Nisin及GSE是通过阻断TCA循环、氨基酸生物合成和能量产生途径抑制李斯特菌的存活,其二元组合抗李斯特菌活性显著[62]。此外,以质谱技术为核心的多组学还可用于细菌毒力机制的阐明[63],以此为依据建立更高效的杀菌方法。交叉组学分析可揭示多种物质间的协同作用,如通过分析牛奶中黄曲霉毒素M1(AFM1)和赭曲霉毒素A(OTA)引起炎症的相关基因,根据其在分化的Caco-2细胞中的表达可确定其协同作用机制,证实AFM1和OTA的协同会加剧肠道炎症[64]。Liu等[65]利用UPLC/Q-TOF-MS结合多变量分析方法,分析了大肠杆菌O157:H7(E.coliO157:H7)对电解水和热处理响应的代谢物组成和基因表达,综合代谢组和基因组研究结果表明,电解水和热处理显著干扰了与氨基酸代谢、核苷酸合成和脂质生物合成功能相关的代谢途径,从而部分揭示了电解水和微热条件对大肠杆菌的杀菌机理。
2.3.3 食品的过敏反应 食物过敏是一种复杂的异质性疾病,影响易过敏个体的生活质量,严重时甚至危及生命,由于遗传背景、环境和微生物区系等的复杂性,准确、快速、可靠诊断食物过敏较难实现[66]。随着高通量技术和计算技术的迅速发展,应用组学方法可有效探明食物过敏的发病机制,并根据特定患者的特征确定合适的生物标志物,提供个性化精准治疗[67]。食物过敏可能与多种基因变异有关,应用基因组学有助于识别相关的常见遗传变异[68];转录组分析可通过明确过敏和非过敏受试者间基因表达差异[69],识别新的免疫过程;运用蛋白质组学对过敏性蛋白进行分析,有助于提高对过敏原的了解[70],阐明各种食源性过敏蛋白的致敏机制,将其与临床结合,可以此为依据设计合适的治疗方法。其中,牛乳过敏最为普遍,蛋白质组学在牛乳过敏原定量、诊断、治疗和预后全过程均可发挥作用[71]。
食品是一个复杂的生态系统,当前食品领域的研究多局限于单一生物影响因素,而应用鸟枪测序、气质联用、高效液相色谱和核磁共振波谱的多组学技术可对特定微生物的基因组、代谢物进行分析,基于复杂体系间的交互影响及动态变化,可揭示食品的动态网络调控机制。随着各种技术平台的不断完善,多组学技术将在控制食品原料、提升食品品质和剖析食品安全机理方面发挥更大的技术支撑作用。组学技术与食品的结合,有望将食品科学研究从材料学范畴,拓展到“食品+”的层级,以食品与人体/环境的视角切入,通过大量数据的集成,全面研究待分析物的理化变化,有助于充分认识食品的内在功能特性。但目前多组学分析仍存在一定的局限性,如当前的提取技术和检测手段尚不能覆盖所有待检物,测定生物活性化合物的仪器检测精度和灵敏度有限,且分析过程中缺乏可供参考、比较的标准数据库,数据处理能力仍有待提升,以上都在一定程度上制约了多组学技术的发展。因此,开发更高灵敏度和分辨率的检测仪器、建立并丰富组学数据库,从而提高多组学技术的精度和覆盖率,进一步拓宽其在食品领域研究中的应用,不断推动对食品本质的深入了解,这是多组学有待进一步突破的方向所在。