吴锐剑,黄宇戈,罗连响
支气管哮喘(以下简称哮喘)是一种常见的慢性气道炎症性疾病,其特征是可逆性气流受限和气道高反应性,临床表现为反复发作的喘息、咳嗽、胸闷和气促[1]。哮喘是儿童最常见的慢性疾病[2],其发病与饮食、遗传、微生物和环境等因素相关[3],具体发病机制尚未明确。目前临床主要根据临床症状、体征、肺功能和呼出气一氧化氮(FeNO)等进行诊断及病情评估。我国儿童哮喘流行病学调查结果显示,城市儿童哮喘的漏诊率达30%[4]。而且目前临床上哮喘常用的辅助检查——肺功能和FeNO 无法监测肺部炎症情况,亦不能预测病情恶化。代谢物是生物学和环境因素共同作用的结果,具备将基因型和表型联系起来的巨大潜力,代谢组学有助于从整体上识别和量化生物体内的代谢物变化。
代谢组学是对生物体液、细胞、组织、器官或生物中的低分子量分子或代谢产物进行客观地整体测量[5]。以往人们主要将代谢物视为下游产物,即生物标志物,随着对代谢物的深入了解发现,代谢物不仅是疾病的生物标志物,依据各自酶的活性其还可以修饰蛋白质和DNA,并与之相互作用,从而改变蛋白质组和表观基因组[6-7](图1)。代谢物可作为信号分子来控制转录因子,进而控制基因表达;此外,代谢物作为染色质修饰酶的辅助因子和辅助底物,积极参与表观遗传调控。代谢物还通过核糖开关传感小分子配体和转录后修饰影响RNA 代谢。最后,代谢物通过跨膜受体和转录因子的变构调节,作为生化反应催化中的辅酶因子和共底物,以及通过翻译后修饰,来主动控制蛋白活性。因此,代谢组学不仅能为临床提供哮喘的潜在生物标志物,还有助于进一步了解哮喘的发病机制。
图1 代谢物与表观基因组、蛋白质组的相互作用Figure 1 Interactivities of metabolite with epigenome and proteome
目前哮喘相关的代谢组学研究主要是针对成人哮喘,儿童哮喘相关的代谢组学研究相对较少。儿童生理特点与成人不同,儿童处在生长发育阶段,器官发育尚未成熟,功能尚未完善,儿童代谢水平有其自身特点。例如,成人哮喘患者的血清精氨酸高于非哮喘者[8],而在儿童中结果正好相反[9],这可能由儿童免疫系统不成熟导致[8,10]。与成人相比,儿童更易受遗传、性别[11]、年龄[12]、体质指数(BMI)[13]、饮食[14]、药物[15]、外界环境等因素影响,因此,需严格控制研究人群的人口学特征。此外,代谢组学在儿童哮喘中的意义不仅局限于哮喘的诊断,还包括哮喘的预测,本文对代谢组学在儿童哮喘中的应用进行综述,以期在疾病早期对患儿进行干预,从而获得更好的预后。
代谢组学按研究策略可分为靶向代谢组学和非靶向代谢组学。非靶向代谢组学是对特定环境、特定生理状态下生物实体代谢物组成的分析[16],其目的在于对所有代谢物进行分析并从中筛选差异代谢物。而靶向代谢组学则是依赖于先验代谢物及其生化途径对特定的代谢物进行定量分析,重复性更好、灵敏度更高[17]。
获取代谢组学数据的两种最常见的分析方法是核磁共振光谱(NMR)和质谱(MS)。NMR 是基于能量吸收和由于外部磁场变化而使原子核重新发射的原理的光谱技术[18],其优势在于具有很高的可重复性和定量性,且不会对样本造成破坏,但与此相对的是灵敏度较低[19]。MS 通过质荷比(m/z)和离子化合物通过相对强度获取光谱数据[20],具有很高的灵敏度和特异度以及良好的动态范围,这使其特别适合靶向代谢组学研究。代谢组学中MS 的主要弱点之一是定量分析,所用样品制备类型及其分子环境会影响信号强度[21]。基于MS 的代谢组学通常在分离步骤之后进行,这会降低生物样品的复杂性,并允许在不同时间对不同分子集合进行MS分析[18]。MS 技术中最常用的分离技术是液相色谱(LC)和气相色谱(GC)色谱柱,分别称为LC-MS 技术和GC-MS 技术[22]。GC-MS 相对稳定、灵敏度高,具有出色的分离再现性,使用商业数据库和软件即可轻松鉴定代谢物,但样品前处理工作量大,只能鉴定易挥发物质且难以进行新的化合物;而LC-MS 技术具有更高的灵敏度、更广泛的代谢物检测范围和多样化的方法,但稳定性更差,化合物鉴定更困难[23]。
代谢组学研究最常用的样本包括呼出气、尿液、粪便、血液(血清和血浆),肺泡灌洗液和痰诱导样本由于其侵入性及技术的复杂性,在临床取样时较少见。样本选择取决于研究问题的相关性和实际操作的可行性。关于不同样本的生理特征、优缺点以及相关注意事项详见表1。
表1 代谢组学常见检测样本的比较Table 1 Comparison of common samples for metabonomics analysis of childhood asthma
2.1 血浆和血清代谢组学 血浆和血清是代谢组学分析使用最广泛的样本类型,用于研究各种疾病以揭示潜在的生物标志物。两者均有很好的重现性,且两者之间有很高的相关性,但血清样品的浓度、灵敏度和可靠性更高[33-34]。血浆和血清相比其他类型的样本,优势在于能反映样本采集时生理状态的全局视图,但缺点在于差异缺乏组织特异性。CHECKLEY 等[35]在一项包含100 名儿童的病例对照研究中使用LC-MS 技术对血清中的18 种代谢物进行代谢组学分析发现,哮喘患儿的还原型谷胱甘肽浓度比对照组高70%。谷胱甘肽是一种三肽硫醇,能通过谷胱甘肽过氧化物酶清除自由基,并与呼吸道反应性以及炎症调节有关。哮喘患者肺部和血液中的谷胱甘肽升高是对相关氧化应激的适应性反应[36]。FITZPATRICK 等[37]在儿童血浆样本中使用了非靶向LC-MS技术来区分轻度和重度哮喘,并确定了与哮喘严重程度相关的两个代谢途径:甘氨酸、丝氨酸和苏氨酸代谢途径以及N-酰基乙醇胺和N-酰基转移酶途径。丝氨酸是包括甘氨酸和半胱氨酸在内的几种氨基酸的前体,甘氨酸和半胱氨酸是重要的抗氧化剂谷胱甘肽的必须成分。N-酰基乙醇胺磷脂是由膜相关的N-酰基转移酶形成的,可响应细胞损伤而代谢为N-酰基乙醇胺,并在信号转导和抗氧化应激的细胞保护中发挥重要作用。儿童重度哮喘可能与抗氧化剂谷胱甘肽失衡有关[38],患儿气道[39]和体循环[40]中的谷胱甘肽水平降低,导致气道炎性增加和细胞功能受损。在成人研究中,哮喘患者体循环中的谷胱甘肽水平较正常人降低,但并无明显差异[41-42],这可能与红细胞对氧化应激的补偿反应有关[43];有趣的是,在COMHAIR 等[41]的研究中,患有严重气流受限的哮喘患者倾向于增加血清谷胱甘肽,这与CHECKLEY 等[35]在哮喘儿童中的研究一致。
2.2 呼出气代谢组学 近几年,呼出气中代谢成分的分析受到广泛关注,因为其是一种非侵入性的方法,具有提供有关下呼吸道有价值的临床信息的潜力。目前儿童哮喘领域中大多数研究应用GC-MS 技术来研究单个呼吸中含有的挥发性有机化合物(VOC)或使用电子鼻(eNOSE)技术来研究VOC混合物,这些化合物来源可以是外源(细菌)或内源(细胞)。尽管GC-MS 存在需要训练有素的研究人员和无法获得实时在线调查结果的缺点,其仍然被认为是呼出气分析的“金标准”,因为其能够识别化合物,从而深入了解病理生理过程,并验证检测到的化合物的来源[44]。而eNOSE 技术快速、便宜、容易使用,因此是一种具有吸引力的护理技术[44]。一项前瞻性研究使用GC-MS 技术分析VOC 发现,6 种VOC的组合能预测儿童哮喘的恶化(灵敏度:100%,特异度:93%)[45],VOC 以烃类为主。另一项针对儿童的前瞻性研究表明,VOC 分析(GC-MS 法)可以准确地预测采样后14 d 的哮喘发作(灵敏度:88%,特异度:75%)[46],VOC 包含了3 种醛类、1 种烃类,与前一研究相似。醛类和烃类化合物均与氧化剂对细胞膜中不饱和脂肪酸的损伤有关[47-49]。在成人中也有类似研究,用于预测停止吸入皮质类固醇后哮喘的控制[50-51],正确分类率可达95%,有助于患者的哮喘检测和管理。得益于无创、易于获得且能反映气道生理的优势,呼出气代谢组学在监测气道炎症方面的潜力巨大。
2.3 肠道代谢组学 肠道代谢组学在探索肠道菌群对健康的广泛影响中受到了越来越多的关注,粪便是一种非侵入性样本,是肠道消化过程的最终产物[52],越来越多的研究表明,肠道微生物在哮喘发展中发挥着重要作用[53]。CHIU 等[54]通过NMR 技术对85 名儿童的粪便进行代谢组学分析发现,粪便丁酸盐的减少与螨虫特异性IgE 水平升高以及儿童哮喘的发生风险有关。而丁酸盐对哮喘的改善作用,在另外两篇文献中得到了进一步证实[55-56]。丁酸盐是结肠细胞的重要能量来源,对于结肠完整性至关重要[57]。通过保留肠道屏障,丁酸盐可防止细菌异位至循环系统;此外丁酸盐通过抑制HDAC 活性来抑制2 型固有淋巴细胞(ILC2)增殖和GATA3表达,从而减少细胞因子IL-5 和IL-13 的产生[58]。在成人中,丁酸盐被证明能诱导嗜酸粒细胞的凋亡以及抑制嗜酸粒细胞黏附于内皮,并阻止其向嗜酸粒细胞趋化因子-2 的迁移,这可能与组蛋白去乙酰化酶的抑制有关[59]。此外,丁酸盐还可促进抗原特异性B 淋巴细胞中IL-10 基因的转录和IL-10 的表达[60],而产生IL-10 的B 淋巴细胞具有免疫抑制功能[61]。除丁酸盐外,多不饱和脂肪酸和胆汁酸均有助于哮喘的改善,而鞘脂和色氨酸代谢物作为潜在的重要途径值得未来进行深入研究(表2)。肠道代谢物代表宿主和肠道菌群之间的化学相互作用,并具有无创、易于收藏和可重复收集等优势,但由于肠道代谢物可衍生自宿主、微生物群或包含饮食在内的外源性来源,所以很难查明代谢物的具体来源。
表2 肠道代谢物及其在哮喘发展中的作用机制Table 2 Roles of intestinal metabolites involved in the pathogenesis of childhood asthma
2.4 尿液代谢组学 尿液代谢组学是近年来发现非侵入性生物标志物的一个重要领域,其可以检测出针对特定疾病或治疗干预的细微代谢差异。与其他生物流体相比,尿液的特点是易于收集、代谢产物丰富、能反映体内所有生化途径的不平衡,并且在肾功能正常的情况下,尿液被过滤、细胞污染程度低[75]。SAUDE 等[76]对135 名儿童的尿液应用靶向NMR,筛选出23 种代谢物鉴别稳定哮喘患儿与健康对照组儿童、28 种代谢物鉴别稳定哮喘患儿与急性哮喘患儿,尽管该研究并没有将饮食、采样时间、药物的使用情况等混杂因素进行亚组分析,但也为后来儿童哮喘的代谢组学研究提供了参考和方向。一项基于两个独立的儿童哮喘前瞻性队列研究发现,哮喘母亲所生的健康新生儿在4 周龄时,可以通过尿液样本中的代谢谱将健康儿童与正在发展为哮喘的儿童区分开,并且两个出生队列有14 个重叠的区分特征[77]。其他研究也表明,生命最初几年的尿液代谢组学谱可预测反复喘息和哮喘[78-79]。与儿童研究不同,成人哮喘尿液代谢组学更多关注哮喘与慢性阻塞性肺疾病(COPD)的鉴别诊断,在ADAMKO 等[80]的研究中,16 种尿液代谢物能将病情恶化1~2 周后的哮喘及COPD 患者进行分类,准确率达94%,对非病情恶化的哮喘患者的阳性预测值为90.9%,这项研究与SAUDE 等[76]的研究有3 个重叠的化合物,分别是二甲胺、葡萄糖和1-甲基烟酰胺,二甲胺与一氧化氮途径有关[81],高血糖和1-甲基烟酰胺与哮喘恶化有关[82-83]。与哮喘生物标志物的筛选相比,预测哮喘的发生、发展可能更具临床意义[84]。
代谢组学为研究环境与宿主之间的相互作用提供了独特的机会,因为代谢物代表对环境刺激以及上游遗传和调控修饰(表观遗传学、转录、翻译后修饰)的响应,但是,代谢组学本身可能无法捕获相互作用过程中环境因素特征的范围或宿主反应的范围。首先,代谢物的水平受许多混杂因素的影响,例如性别[11]、年龄[12]、BMI[13]、饮食[14]、吸烟、药物[15]、体力活动、并发症等;其次,代谢组学研究过程相关操作,例如样品收集时间[85]、收集程序、前处理[86]、存储[34]、冻融[87]、提取程序[88]、稀释、分析方法等,也会对结果造成影响,所以,规范的操作可以减少偏差,增加结果的可靠性;最后,在数据处理过程中,由于变量数常大于样本数量,所以数据会过度拟合,从而导致错误。为解决过度拟合的问题,就需要足够的样本量,使用内部交叉验证或Bootstrapping 算法对模型进行校准,并在独立的外部样本中对结果进行验证。
遗传、调控和环境刺激在生物系统中触发了广泛的输入-输出级联,疾病的发病机制需要在这种广泛的生物学系统背景下进行验证。代谢组学是整合来自各种组学研究(基因组、转录组、蛋白质组、代谢组和微生物组)的数据,可能会为在复杂的生物系统背景下理解疾病的发展过程提供更大的机会[89]。尽管单个组学研究得到了大量可访问的数据,但是通过组学整合来识别新的生物机制尚未达到预期,原因是高度异构数据整合困难,以及目前所谓的大数据集与使用无监督学习方法有效工作所需的数据集相比仍然很小,并且难以达到所需的精度[90]。为了在多组学数据中实现高信息含量,仍需要遵守相关标准,并以高度系统化的方式进行实验。
其次,通过基于人工智能的机器学习方法,从数据中学习复杂的功能关系,而无需先验证假设。机器学习模型的原理是在一个生物数据集上训练,然后使用检测到的模式来预测另一个。机器学习在典型的生物学应用中分为两大类,即有监督学习和无监督学习。在有监督学习中,机器学习算法的目标是从已知分组的训练数据集推算得出疾病的类别,属于分类算法,其功能是预测;相反,在无监督学习中,目标是从“未标记”的样本推断可能的集合,属于聚类算法,其功能是降维,对样本间差异较小的特征不敏感。
此外,哮喘是一种复杂而异质的疾病,可分为不同的表型及内型,相同表型的患者,对同一药物的反应不尽相同。精确的内型是通过特定的生物标志物将病理生物学机制和可见特性联系起来,其有望将哮喘细分为不同亚型并为个性化治疗方案开辟道路。多组学数据为超越临床表型的内分型提供了机会,特别是与上述机器学习聚类算法结合使用时。将多组学数据与聚类算法结合使用,可以识别同质的哮喘内型,这些内型可能对特定的、个性化的治疗方案做出相似反应。
随着代谢组学技术的发展,不再将代谢物视为下游产物,代谢物除了是饮食、环境、遗传、微生物共同作用的结果,其还能调控基因表达、RNA代谢和蛋白质活性,在哮喘的发生、发展中发挥作用。通过对血液、呼出气、粪便、尿液等样本的检测,代谢组学可提供生物标志物的筛选、发病机制的阐释、疾病的预测与分度、呼吸道炎症的监测。此外,随着系统生物学的发展,运用多组学融合手段对疾病进行更加全面地研究也逐渐成为趋势。未来,将基因组学、转录组学、蛋白质组学、代谢组学、微生物组学和生物信息学结合,有利于为儿童哮喘的研究提供可信度更高的数据,并有望借此区分不同哮喘亚型,实现精准医疗和个体化治疗。
作者贡献:黄宇戈、罗连响进行文章的构思与设计,文章的可行性分析;吴锐剑进行文献的收集、整理,以及撰写论文;黄宇戈进行文章的质量控制及最终文章的修改,对文章整体负责,监督管理。
本文无利益冲突。
本文文献检索策略:
检索Pubmed 数据库,检索时间为建库至2020 年12 月。纳入标准:(1)以检索式metabolomics AND asthma AND (child OR children)检索相关文献;(2)尽量以近10 年文献作为参考文献。排除标准:(1)重复文献;(2)与“代谢组学”“儿童”无关文献;(3)存在研究设计缺陷,质量差的文献。