非酒精性脂肪性肝病无创诊断研究进展

2020-12-18 02:23:24吴瑞红张磊丁艳华牛俊奇

药学进展 2020年3期

吴瑞红，张磊，丁艳华，牛俊奇

（1. 吉林大学第一医院Ⅰ期药物临床试验病房，吉林长春 130021；2. 吉林大学第一医院放射科，吉林长春 130021；3. 吉林大学第一医院肝胆胰内科，吉林长春 130021）

非酒精性脂肪性肝病（non-alcoholic fatty liver disease，NAFLD）是全球最常见的慢性肝病，据估计在成年人中流行率约为25%[1]。NAFLD 的命名经专家投票已于2020 年2 月达成国际共识，更改为“代谢相关脂肪性肝病（metabolic associated fatty liver disease，MAFLD）”[2]。但为了方便理解和习惯，本文仍使用旧的命名NAFLD。NAFLD 谱包括非酒精性脂肪肝（non-alcoholic fatty liver，NAFL）、非酒精性脂肪性肝炎（non-alcoholic steatohepatitis，NASH）、NASH 相关纤维化、肝硬化和肝细胞癌。NASH 是NAFLD 的活化形式，在一般人群中的流行率约为1.5% ～ 6.45%[1]。NASH 在组织学上呈现出小叶炎症和肝细胞气球样变特征，与NAFL 相比，具有更快的纤维化进展速度[3]。

NAFLD 与代谢综合征关系密切，改变生活方式可以消除肝脂肪变（steatosis）和NASH，并且可改善肝纤维化，然而，能达到体质量下降目标的患者很少，能长期坚持改变生活方式的则更少[4]。因此，一些NASH 患者需要药物治疗。目前，除印度以外，其他国家和地区还没有针对NASH 的获得批准的药物，指南只推荐维生素E 或吡格列酮（pioglitazone）用于经活检证实的NASH 患者[5-7]。截至2019 年12 月30 日，在ClinicalTrials.gov 注册的由企业发起的NAFLD 或NASH 药物临床试验有160 项。目前，奥贝胆酸（obeticholic acid）是第1个在治疗NASH 的Ⅲ期临床试验中显示出有益治疗效果的药物，有望成为第1 个获批的NASH 治疗药物。根据FDA 和欧洲药品管理局目前的要求，对治疗无肝硬化NASH 药物有条件批准的研究终点是NASH 缓解同时纤维化不进展，和/或纤维化改善同时NASH 不进展。因此需要进行肝活检。然而，肝活检是一种侵入性手术，有发生出血等并发症风险。虽然重复肝活检在临床试验中是可以接受的，但在日常临床实践中因其有创性和高成本不太可能被广泛接受。此外，肝活检并不是真正的金标准。活检标本仅代表肝脏体积的1/50 000，NASH 的组织学病变在肝实质内分布不均，因此，肝活检取样错误可导致误诊和分期不准确[8]。临床上迫切需要找到无创方法来评估NAFLD 患者。无创方法不仅在评估疾病严重程度、选择治疗的患者、监测疾病进展或治疗效果等方面具有重要意义，在新药临床试验方面也具有重要意义。本综述中，笔者讨论了目前可用或正在开发的用于评估脂肪变、诊断NASH、评估NASH 相关纤维化分期和肝硬化的无创标志物。除了生化和影像学标志，本文还讨论了遗传学标志、表观遗传学和来自代谢组、蛋白质组等组学的新标志，并评估了标志物的准确性、可行性和局限性。

1 脂肪变的诊断

NAFLD 的诊断需要有组织学或者影像技术证据显示肝细胞脂肪变，即组织学检查显示≥5%肝细胞脂肪变或磁共振技术测定的质子密度脂肪分数（proton density fat fraction，PDFF） ≥5.5%[5,7]。NAFLD 进展为肝硬化时，脂肪变可以消失。

1.1 血液生物标志物和评分系统

脂肪肝指数（fatty liver index，FLI）由身体质量指数（BMI）、腰围、血清三酰甘油和γ-谷氨酰转移酶（GGT）构成[9]。FLI 对超声判定的脂肪肝具有中等的诊断准确性[受试者工作特征曲线下面积（AUROC）为0.84]。在意大利的一项群体研究中，15 年随访显示FLI 与胰岛素抵抗相关，并可预测全因、肝脏相关、心血管疾病相关和癌症相关死亡[10]。

肝脏脂肪变指数（hepatic steatosis index，HSI）是在1 个超1 万人接受健康检查的大队列中得出并进行验证的[11]。HIS 由血清谷草转氨酶（AST）与谷丙转氨酶（ALT）比值、BMI、性别和是否有糖尿病构成，对超声判定的脂肪肝具有中等的准确性（AUROC 为0.81）[11]。

NAFLD 肝脂肪评分（NAFLD liver fat score，LFS）是以一种更灵敏的、可定量评估肝脏脂肪含量的技术[1H-磁共振波谱（1H-MR spectroscopy，1H-MRS）]作参考标准得出的一个算法。该算法由是否有代谢综合征和2 型糖尿病、空腹血清胰岛素浓度、血清AST 和AST : ALT 比值构成，其诊断脂肪肝（定义为肝脂肪含量≥5.56%）的准确性较好（AUROC 为0.86 ～ 0.87）[12]。一项对美国9 200 例非病毒性肝炎成人长期随访（中位数为23.3 年）的研究显示，高NAFLD LFS 与肝病相关死亡风险相关[13]。目前血清胰岛素水平还不是常规检测指标，在广泛应用方面具有局限性。

虽然这些评分在横断面研究中诊断脂肪肝的效能良好，但一项研究显示这些评分在反映生活方式干预后肝脏脂肪动态变化上的性能有限，NAFLD 肝脂肪评分的变化与肝脂肪的变化无相关性，而HSI和FLI 也仅显示出弱到中等相关性[14]。

NAFLD-ridge 评分是对电子健康记录数据进行挖掘得出的算法[15]。该评分结合了实验室参数[血清ALT、高密度脂蛋白（HDL）-胆固醇、三酰甘油、糖化血红蛋白（HbA1c）和白细胞计数]和共存病资料（高血压）。以1H-MRS 为参考标准，该评分诊断性能良好（AUROC 为0.87 ～ 0.88），排除NAFLD 的性能良好（阴性预测值96%）[15]。

SteatoTest（法国Biopredictive 公司）由FibroTest-ActiTest（法国Biopredictive 公司）测定的6 个成分[包括总胆红素、GGT、α2-巨球蛋白（α2m）、结合珠蛋白（haptoglobin，也称触珠蛋白）、ALT 和载脂蛋白AI（apolipoprotein AI）]、血清总胆固醇、三酰甘油、葡萄糖、性别、年龄和BMI 构成[16]。在预测活检证实的肝脂肪变方面，SteatoTest 具有中等的准确性（AUROC 为0.79 ～ 0.80）[16]。除生化检测的费用外，使用SteatoTest 公式计算也需要费用。

近来，有研究发现血清/血浆白介素32（IL-32）和ALT、AST 联合诊断NAFLD 的性能优于ALTAST（AUROC：0.92vs0.81）[17]。

1.2 影像标志

1.2.1 超声常规超声检查是最常见的检测脂肪变的方法，成本低，现成可用。超声检查脂肪肝原理在于脂质囊泡的声波衰减和散射增加，使得脂肪性肝脏显得比周围结构更亮。一项大规模荟萃分析显示以活检为参考标准，超声在识别中重度脂肪变方面具有高准确度（AUROC 为0.93，敏感性85%，特异性94%）[18]。但是，在NASH 患者中检测脂肪变的能力受到晚期纤维化的影响，超声在晚期纤维化的NASH 患者中对脂肪变的敏感度低于非晚期纤维化的患者[19]。超声诊断依赖于操作者的诊断水平，存在不一致，并对轻度脂肪变不敏感。

1.2.2 受控衰减参数受控衰减参数（controlled attenuation parameter，CAP）是一种通过测量肝脏脂肪的超声衰减程度来分级脂肪变的方法，该方法基于瞬时弹性图。结果以dB/m 为单位进行测量，范围为100 ～ 400 dB/m。目前，M 和XL 探头都可以测量CAP，但M 探头测定值显著低于XL 探头，诊断脂肪变效能上略低或相似[20-21]。荟萃分析显示，CAP 诊断任何脂肪变（相对于无脂肪变）的AUROC 为0.82，诊断2 级或3 级脂肪变（相对于0级或1 级）的AUROC 为0.87[22]，CAP 诊断轻、中、重度脂肪变的AUROC 依次为0.96、0.82 和0.70[23]。生活方式、饮食或药物干预后，CAP 值可以出现显著下降[24]。

1.2.3 磁共振技术 MRS 可以从分子代谢水平反映活体组织的病理生理改变，被认为是磁共振定量评估脂肪含量的“金标准”。但MRS 对扫描条件和技术操作要求较高，扫描时间长，感兴趣区域（region of interest，ROI）范围选择受限，后处理操作复杂，其在临床的广泛应用受限。

磁共振成像技术估计的质子密度脂肪分数（MRI-PDFF）是一种定量评估肝脏脂肪变的影像指标，其基于磁共振化学位移的水脂分离技术，通过参数设置降低纵向弛豫时间T1、横向弛豫时间T2 及T2*衰减、噪声等因素的影响，使组织的质子密度成为影响图像信号强度的主要因素，进而获得肝脏质子密度脂肪分数。该技术能够实现一次屏气十几秒钟内完成覆盖全肝的PDFF 计算，同时在R2*图像上还能测得肝铁含量。一项纳入6 项研究（n= 635）的荟萃分析显示MRI-PDFF 对NAFLD患者肝脏脂肪含量的评估和组织学脂肪变的分级有很好的诊断价值，区分0/1 ～ 3，0 ～ 1/2 ～ 3 和0 ～ 2/3的AUROC 依次为0.98、0.91 和0.90[25]。与CAP（AUROC 为0.85）相比，在判定NAFLD 患者脂肪变方面具有更高的准确性（AUROC 为0.99）[26]。通过MRI-PDFF 估计的肝脂肪含量与通过MRS 测量的肝脂肪含量相关，且在量化肝脏脂肪含量随时间的变化方面，其比组织学确定的脂肪变等级更敏感[27]。

该技术给出的是ROI 的客观测量值，但ROI 的选择涉及主观判断。一些NASH/NAFLD 早期临床试验，将MRI-PDFF 的改变作为评价疗效的终点。由于肝脏脂肪分布的不均匀性，干预前后需在肝脏上相同的区域进行测定。小规模临床试验研究显示基于磁共振的脂肪动态变化与病理判定的脂肪变等级变化具有中等相关性[28-29]，但是不能反映其他肝脏组织学参数的变化（如NASH 缓解同时纤维化不进展等）[29-30]。但临床试验周期一般较短，需要进行长期研究，以评估持续和显著的肝脂肪减少是否会导致纤维化的改善、肝硬化进展风险的降低以及肝病死亡风险的降低。

1.3 小结和建议

腹部超声是日常临床实践中诊断脂肪肝最常用的方法，与MRI-PDFF 和MRS 相比，具有普及性和低成本特点，但受操作医生主观判断影响，对轻度脂肪变不敏感。而使用瞬时弹性成像（FibroScan）CAP 值是一种更加客观的方法，具有中等准确性。MRI-PDFF 具有较高的准确性和可重复性，可被看作脂肪变评估的“金标准”，可以用于临床试验，但其在常规临床实践中的应用受到成本和可及性的限制。血液生物标志物和评分系统的诊断效能低于影像标志物，但这些手段可以很容易地应用于回顾性大型流行病学研究及设施有限的地区。

2 非酒精性脂肪性肝炎的诊断

与NAFL 相比，NASH 纤维化进展更快。NASH患者更可能发展为肝硬化，死于心血管和肝脏相关疾病，是药物治疗的主要目标。区分NASH 和NAFL 是当前面临的一个主要问题，也是挑战。目前，NASH 的诊断金标准仍然是肝活检病理。NASH 与NAFL 的诊断都需要脂肪变证据，区别在于NASH还需要有肝细胞损伤证据，即组织学上有小叶炎症和肝细胞气球样变特征，有或无纤维化[5]。不同病理医生间评价存在差异，采用的评价标准也不尽相同。2012 年，Bedossa 和同事提出了脂肪变-活动性-纤维化（steatosis-activity-fibrosis，SAF）分级分期评分系统和基于SAF 评分的NASH 诊断算法，即脂肪肝进展阻断（fatty liver inhibition of progression，FLIP）算法[31]。后续有研究证明病理医生遵循此标准进行诊断，显著提高了诊断一致性[32]。

2.1 血液生物标志物和评分系统

临床实践中，血清肝酶水平仍然是诊断NASH最常用的血液参数，然而，荟萃分析显示仅用ALT、AST、GGT 或ALP 诊断NASH 的综合敏感性为63.5% ～ 76.9%，综合特异性为61.9% ～ 74.4%[33]，效能一般。NASH 形成肝损伤的机制复杂，涉及多种细胞、多条通路和多种分子的紊乱[34]。大量潜在的分子因而被当作生物标志物检测，包括肝细胞凋亡、炎症、氧化应激、糖脂代谢相关分子和脂肪因子等。关于血清生物标志物的诊断性能已经有几篇综述进行了总结[4,35-38]。

2.1.1 血液生物标志物 NASH 阶段，肝细胞凋亡或坏死增加。细胞角蛋白18（CK18，也称为KRT18）是肝细胞内主要的中间丝蛋白，在细胞凋亡的起始过程中可被Caspase-3 裂解成片段，释放到血液中[39]。血清/血浆中CK18 片段和全部CK18的水平可分别用M30 和M65 抗体酶联免疫吸附实验（ELISA）测定。M30 水平与NAFLD 患者的肝脏炎症和气球样变相关，随着时间的推移，与组织学改善有平行性，但与转氨酶比较并没有体现优越性[40]。荟萃分析显示，血清/血浆M30 诊断NASH的AUROC 为0.82[41]，敏感性66% ～ 75%，特异性77% ～ 82%，并显示M65 与M30 具有相似的诊断效能[41-42]。不同的研究确定的临界值具有较大变异。

组织学炎症是诊断NASH 的必备特征之一。因此，许多血液中的炎症因子和介质已被作为标志物进行了检测。但这类标志物可能不是肝脏炎症特异的。许多研究表明炎症标志物C 反映蛋白(CRP)、肿瘤坏死因子α（TNF-α）和IL-6 在NASH 患者或者模型中显著增加，但也有一些研究显示没有差异[42-44]，进行诊断效能评估的研究较少。一项小规模研究显示IL-6 诊断NASH[NAFLD 活动性评分(NAS)≥5]的AUROC 为0.73[45]。另有2 项小规模研究显示TNF-α 诊断NASH 的AUROC 为0.81～ 0.91[46-47]。IL-1Ra 是一种天然的IL-1 信号拮抗剂，在炎症水平较高时产生。人IL-1Ra 血清水平升高与肝脏炎症和ALT 水平有关，是NASH 的独立标志物。IL-1Ra 在NASH 患者中的水平显著高于NAFL 组和健康对照[48-49]。一项小规模研究显示其区分NASH和NAFL 的AUROC 为0.89[49]。CXCL10 是一个重要的促炎因子，在实验性脂肪性肝炎的发病机制中起重要作用，NASH 患者血清和肝脏CXCL10水平显著升高[50]。其在正常对照、单纯脂肪变和NASH 患者血清中水平逐渐升高，但区分后两者的AUROC 仅达到0.68 ～ 0.72[50-51]。2017 年一项纳入648 例活检证实的NAFLD 患者的稍大规模研究，检测了32 种血浆生物标志物（包括许多炎症标志物），单因素分析仅发现IL-8、可溶性IL-1R-1、总纤溶酶原激活物抑制物1（total plasminogen activator inhibitor 1，PAI1）和活化PAI1（activated PAI1，aPAI1）水平与NASH 相关，多因素分析（临床和代谢因素作为协变量）后只有aPAI1 仍能预测NASH[52]。小规模研究结果的不一致性需要更大规模的研究来验证它们的诊断价值。

氧化应激导致脂质氧化，是NASH 的主要致病机制之一。与NASH 有关的脂质氧化产物包括花生四烯酸氧化产物（11-HETE）和亚油酸氧化产物（9-HODE，13-HODE，9-OxoODE 和13-OxoODE）等[4]。亚油酸与13-HODE 比值，加上年龄、BMI 和AST组成oxNASH 评分，诊断NASH 的准确性中等（AUROC 为0.74 ～ 0.83）[4]。然而，需专用设备（质谱仪）、样品需预处理及成本限制了脂质氧化产物作为当前诊断NASH 标志物的广泛应用。

在NASH 中，参与脂质和葡萄糖代谢的一系列激素发生紊乱，包括脂联素（adiponectin）、瘦素（leptin）、抵抗素（resistin）、内脂素（visfatin，也称为NAMPT）、视黄醇结合蛋白4（retinolbinding protein4，RBP4）和脂肪酸结合蛋白4（fatty acid-binding protein4，FABP4）等脂肪因子，成纤维细胞生长因子21（FGF21）等肝源性激素[53]以及肠源性激素成纤维细胞生长因子19（FGF19）[54]等。这些物质可能参与肝损伤的发病机制，但其在血液中的水平也可能是代谢异常的一种反映。FGF21 主要由肝脏分泌，具有多种代谢功能，临床前和流行病学研究显示无论是在小鼠还是在人类中，其水平与肝脂肪含量相关。荟萃分析显示其诊断NASH 的敏感度（62%）和特异度（78%）仅处于适中水平[41]。FGF19 主要在回肠肠上皮细胞表达，通过肝肠循环参与胆汁酸代谢等功能，在NASH 患者血浆中呈现相对低表达[54]。FGF19 诊断效能未被评估。近年，FGF21 和FGF19 类似物已进入临床试验。结果显示FGF21类似物可以显著减少NASH患者的脂肪含量[55]，FGF19 类似物可以减少NASH 患者的肝脏脂肪、减轻肝损伤和炎症[56]。

一项综述显示，对NAFLD 患者饮食干预可显著降低CRP、TNF-α 和脂联素水平[57]。

2.1.2 生物标志物评分系统单个标志物诊断NASH 的准确性不高，联合可以提高准确性。CK18 与血清中可溶性Fas 联合、脂肪因子（脂联素和抵抗素）、FGF21 或血浆组织蛋白酶D（cathepsin，CTSD）等联合，诊断效能显著提高(AUROC 为0.91 ～ 0.998)[4,41]。铁蛋白（ferritin）是一种急性期反应物，通常在NAFLD 和代谢综合征患者中增加。NAFLD 患者的高铁血症与进展期肝纤维化之间存在关联。血清铁蛋白与AST、BMI、血小板计数、糖尿病状态和高血压结合后，诊断NASH 的AUROC 由0.62 增加到0.81。NAFIC 评分（由血清铁蛋白、空腹胰岛素和Ⅳ型胶原7S 组成）诊断NASH 的AUROC 为0.78 ～ 0.85[4]。NASHTest（Biopredictive）是一种有专利的算法，由年龄、性别、身高、体质量和血清三酰甘油、胆固醇、α2-巨球蛋白、载脂蛋白AI、结合珠蛋白、GGT、ALT、AST 和总胆红素的水平组成，准确度中等（AUROC 为0.69 ～ 0.79）[58]。

尽管文献中有大量的血清生物标志物和评分系统，但缺乏独立的验证，特别是在不同种族或非减肥手术人群中的验证。同样，关于最佳诊断截止值存在不确定性，对于可能影响检测数值的其他因素缺乏了解。除CK18 外，缺乏标志物随时间变化与组织学随时间变化相关性的研究，监测疾病进展或治疗效果依据不足。

2.2 影像标志物

近期一项纳入7 项研究（207 例单纯脂肪变和278 例NASH）的荟萃分析显示，1H-MRS 区分单纯脂肪变和NASH 的汇总AUROC 为0.89，提示磁共振对于诊断NASH 有辅助价值[59]。弹性成像技术显示NASH 条件下肝硬度也有所增加。在一项58例NAFLD 患者进行的磁共振弹性成像（magnetic resonance elastography，MRE）研究中发现，MRE对未纤维化的脂肪性肝炎具有早期诊断的能力[60]。2019 年1 项综述显示，基于瞬时弹性成像(TE)、声辐射力脉冲（acoustic radiation force impulse，ARFI）、MRE 和超声成像技术诊断NASH 的AUROC 分别为0.82、0.90、0.93 和0.82[61]。但研究证据还不足以支持利用影像学诊断NASH[61]。

2.3 小结和建议

CK18 是NASH 诊断中评价最广泛的标志物，但总的准确性至多是中等。尽管其他生物标志物或评分系统可能有希望，但大多数尚未独立验证。目前，没有一种NASH 生物标志物可以用于临床。然而，这一领域的积极研究将进一步对临床产生影响。不同NASH 生物标志物在临床试验中的应用取决于研究药物的作用机制。因此，代谢变化、凋亡或细胞死亡、炎症或纤维形成相关的生物标志物具有更重要的意义。

3 纤维化和肝硬化的诊断

一旦肝硬化形成，患者就有可能发展成门脉高压、肝失代偿和肝细胞癌HCC。2017 年发表的1 项荟萃分析进一步证实，全因死亡风险与纤维化等级相关，并随着纤维化阶段的增加呈指数增长，风险增加首先表现在纤维化F2 级别的患者[62]。鉴于纤维化等级和临床结果之间的密切关系，NASH 的有效治疗必须改善纤维化或至少防止其进展。

3.1 非纤维化特异性标志物和评分系统

血清生物标志物的诊断性能已经有几篇综述进行了总结[4,35-38]。大多数非纤维化特异性标志物不直接测量纤维生成或纤维降解。它们通常是纤维化相关危险因素，是常测指标，价格相对低。但其诊断效能通常比直接测量纤维生成或纤维降解的标志物要低。为了弥补准确性的降低，多数研究结合一组标志物构建评分系统。

AST 与ALT 比值[63]、AST 与PLT 比值指数（APRI）[64]和Fibrosis-4（FIB-4）[65]最初基于慢性丙型肝炎患者群构建。前两者计算简单，但在NAFLD 患者中诊断进展期肝纤维化和肝硬化的准确性较低（诊断F3 纤维化的AUROC 分别为0.66 ～ 0.74 和0.74）。FIB-4 指数由年龄、AST、ALT 和血小板计数组成，其准确度中等（诊断F3 纤维化的AUROC 为0.83）。

NAFLD 纤维化评分（NAFLD fibrosis score，NFS）是在活检证实为NAFLD 的患者中推导出并进行了验证的评分，由年龄、BMI、空腹血糖受损或糖尿病、AST 与ALT 比值、血小板计数和血清白蛋白水平组成[66]。在识别F3 纤维化方面，与FIB-4相当（AUROC 为0.82），并可预测NAFLD 患者的肝失代偿和死亡[4]。

BARD 评分（根据BMI、AST 与ALT 比值和是否有糖尿病计算）来自一个大型的美国NAFLD队列（827 人），识别F3 纤维化的准确性中等（AUROC 为0.69 ～ 0.81）[67]。

最近的一项荟萃分析（13 046 名NAFLD 患者，64 项研究）显示，FIB-4 和NFS 相比于APRI 和BARD在诊断进展期肝纤维化方面具有更好的效能，AUROC 分别为0.84、0.84、0.77 和0.76[68]。

MACK-3 得分由稳态模型评估胰岛素抵抗指数（HOMA-IR）、AST 和CK18 构成，基于法国和比利时共3 家中心846 名肝穿确诊NAFLD 患者构建，诊断“fibrotic NASH”（NASH，NAS ≥4 并且纤维化等级≥2）的性能（AUROC 为0.85）优于BARD、NFS 和FIB-4[69]。后续有研究在马来西亚患者中进行了外部验证，得到了相似的诊断性能（AUROC 为0.80），与FIB-4 和NAFLD 纤维化评分相当，优于BARD 评分和CK18[70]。MACK-3 有助于在临床试验中筛选和纳入患者，并有助于筛选药物一旦获批将从治疗中获益的患者[69]。

Hepamet 纤维化评分系统（HFS），新近基于意大利、法国、古巴和中国的2 452 名NAFLD 患者建立和验证。HFS 包括性别、年龄、HOMA-IR、糖尿病、AST 和白蛋白水平以及血小板计数。HFS鉴别进展期肝纤维化的AUROC 为0.85，高于NFS或FIB-4（AUROC 均为0.80）。HFS 将处于中间区域、无法明确分类的患者数量从FIB-4 和NFS 系统的30%减少到20%，可使更多的患者免去肝活检[71]。

以上评分均包含转氨酶，但转氨酶正常的NAFLD 患者有相当一部分经组织学检查后确诊为NASH、纤维化甚至硬化。建立模型识别这部分群体具有重要意义。Gawrieh 等[72]基于534 名ALT 和AST 正常、活检证实为NAFLD 的成人患者（其中NASH F2 ～ F3 和硬化的比例为19%和7%），利用临床常用化验指标和人口学数据建立诊断NASH F2 ～ F3 和硬化的模型，虽然敏感性较低，但具有较高的阴性预测值来排除F2 ～ F3（88%）和硬化（98%）。

尽管这些评分准确性不及纤维化特异性标志物，但它们具有更高的适用性，因为这些构成成分对临床医生来说都是现成的。此外，这些评分在排除进展期肝纤维化和肝相关事件方面具有很高的阴性预测价值，因此可作为筛查工具。

3.2 纤维化特异标志物

纤维化特异标志物反映纤维生成和/或纤维降解。肝纤维化由于肝细胞外基质（extracellular matrix，ECM）的沉积而形成。透明质酸（hyaluronic acid，HA）是一种非蛋白聚糖多糖，是肝细胞外基质的主要成分。单独使用血清HA 水平诊断纤维化≥F2 和肝硬化的AUROC 分别为0.87 和0.92[73]，在另一研究中诊断F3 ～ F4 的AUROC 为0.82[74]。循环中金属蛋白酶组织抑制剂1（tissue inhibitor of metalloproteinases 1，TIMP1）是一个重要的胞外基质金属蛋白酶的降解酶。与年龄匹配的健康对照组相比较，TIMP1 诊断肥胖NASH 患者的AUROC达到0.97[75]，但规模相当小，缺乏验证。对396名肝穿确诊的NAFLD 患者，其识别进展期肝纤维化的AUROC 为0.78[74]。Ⅲ型前胶原氨基端前肽（N-terminal propeptide of type III procollagen，PIIINP）是纤维生成过程中的一种成分，能区分单纯脂肪变和NASH 或进展期肝纤维化，AUROC 为0.85 ～ 0.87[76]。在青少年NAFLD 人群中，显示出更加优越的纤维化诊断效能。在204 例经活检证实为NAFLD 的儿童和青少年中，PIIINP 诊断≥F2 纤维化的AUROC 为0.92，诊断F3 纤维化的AUROC 为0.99[77]。在纤维组装过程中，Ⅲ型胶原在成熟前需要经特异的N-端蛋白酶裂解去掉其N-末端前肽（即PIIINP）。PIIINP 水平既反映Ⅲ型胶原的合成也反映其降解。Nielsen 等[78]开发了一种仅反映Ⅲ型胶原合成的方法，针对N-端蛋白酶裂解位点制备单克隆抗体，检测方法为竞争ELISA，测定物质定义为PRO-C3。PRO-C3 在鉴别F3 ～ F4（相比于F0 ～ F2）上具有中等准确定性（AUROC 为0.74，敏感性为57%，特异性为84%），并且在纵向队列研究显示其水平随着纤维化的变化而变化[79]。

一些研究将这些指标联合，或与临床资料和实验室资料联合构建出诊断模型。2019 年2 个诊断模型被提出和验证。一个是基于PRO-C3 的评分——ADAPT评分（基于431名活检证实的NAFLD患者），由年龄、糖尿病、PRO-C3 水平和血小板计数组成，诊断进展期肝纤维化的AUROC 为0.86，显著优于其他无创评分（NFS、FIB-4 和APRI）[80]。另一个算法基于1 036 名活检证实的NAFLD 患者建立并验证，纳入3 个指标：α2-巨球蛋白、透明质酸和TIMP1。其诊断F3 ～ F4 纤维化（相比于F0 ～ F2）的AUROC 约为0.86，并优于FIB-4 和NFS[74]。胶原形成过程有关的生物标志物成为诊断成人和儿童肝纤维化的可靠指标[77]。

增强肝纤维化（enhanced liver fibrosis，ELF）是一个诊断模型，由3 个纤维化特异标志物——PIIINP、透明质酸和TIMP1 组成[81]。ELF 可准确预测成人和儿童NAFLD 患者的进展期肝纤维化（AUROC 分别为0.93 和0.99）[82-83]。FibroTest（由法国Biopredictive 公司开发，该评分系统在美国称为Fibrosure）由5 个指标组成：血清GGT、总胆红素、α2-巨球蛋白、载脂蛋白AI 和结合珠蛋白[84]。FibroTest 在预测NAFLD 患者纤维化方面优于BARD和FIB-4（AUROC 为0.88，纤维化vs无纤维化）[85]。FibroMeter NAFLD（法国Echosens 公司）是由体质量、凝血酶原指数、血清ALT、AST、铁蛋白和空腹血糖水平组成的指标。在欧洲和亚洲进行的2 项研究中，FibroMeter NAFLD 在诊断纤维化方面优于其他血清检测[86-87]。

Hepascore 由年龄、性别、血清胆红素、GGT、HA 和α2-巨球蛋白水平组成，在诊断进展期肝纤维化上与其他基于血清指标的公式具有相似的准确性（AUROC 为0.82）[88]。

FibroMeterV2G是针对慢性丙型肝炎开发的，用于诊断进展期肝纤维化[89]，由4 个肝纤维化间接标志物（AST、尿素、血小板、凝血酶原时间）和2个直接标志物（透明质酸、α2-巨球蛋白）组成。FibroMeterV2G在诊断NAFLD 患者进展期肝纤维化方面与ELF 具有同等的准确性（AUROC 约0.80）[90]，优于APRI、FIB-4、NFS、BARD、FibroTest、FibroMeter（NAFLD）和Hepascore[88,90]。

尽管与非纤维化特异性生物标志物相比诊断准确度略有提高，但这些纤维化特异性标志物的有限可用性和高成本限制了其广泛应用。

3.3 影像生物标志物

已有几篇涉及NAFLD 影像学生物标志物的综述[4,35,91-92]。

3.3.1 FibroScan FibroScan 用于测量肝脏传播的弹性剪切波的速度。这种速度与组织硬度直接相关，而组织硬度又与纤维化程度相关；组织硬度越高，剪切波传播越快。使用FibroScan M 和XL 探头诊断进展期肝纤维化的AUROC 值分别为0.88 和0.85[68]。XL 探头是为肥胖患者设计的，其诊断准确度与非肥胖患者采用M 探头的结果相似[93-94]。尽管纤维扫描对排除进展期肝纤维化具有极好的阴性预测价值，但其对进展期肝纤维化或肝硬化的阳性预测价值不高。

3.3.2 点剪切波弹性成像点剪切波弹性成像（point shear wave elastography，pSWE）利用ARFI，短时间声脉冲将横波传递入组织，对组织进行机械激励，使组织中产生局部的微米级位移[95]。操作员可以选择在哪个确切位置获得测量值。pSWE 的一个主要优点是它可以很容易地在超声仪器上实现。一篇文章综述7 项研究，显示其诊断进展期肝纤维化的准确性为84% ～ 98%[35]。用pSWE 获得的值以m · s-1表示，范围很窄（0.5 ～ 4.4 m · s-1），使其难于设定区分纤维化等级的最佳截断值[4]。目前，pSWE 还没有得到广泛的评价和应用。

3.3.3 二维剪切波弹性成像二维剪切波弹性成像（2D shear wave elastography，2D-SWE）利用声辐射脉冲在组织中聚焦，高速振动产生横向剪切波，并结合超高帧频图像，获得实时组织弹性图[96]。操作员可以选择ROI。2D-SWE 同pSWE 一样，也可在超声仪器上实现，其结果可以用m · s-1或kPa 表示，范围很广（2 ～ 150 kPa）。2D-SWE 诊断F2 纤维化的准确性高于pSWE（AUROC 为0.85 ～ 0.92与0.70 ～ 0.83）[4]。一项荟萃分析显示，在172 例NAFLD 患者中，晚期纤维化和肝硬化的诊断准确率分别为93%（临界值9.2 kPa）和92%（临界值13.5 kPa）。并且2D-SWE 对进展期肝纤维化的诊断优于TE（AUROC 差异12%）[97]。近期，一个小规模前瞻性研究（62 名纳入，54 名有效可比）显示2D SWE、TE 和MRE 诊断进展期肝纤维化的AUROC分别为0.89、0.86 和0.95[98]。目前，2D-SWE 在NAFLD 患者中还没有得到广泛的评价和应用。

3.3.4 磁共振弹性成像 MRE 是在磁共振技术的基础上结合变应声波检测，将磁共振图像与组织弹性程度相结合的成像技术。它可以评估整个肝脏，并不受患者体质影响，参数已经标准化[99]。一项包含9 项研究、涉及232 例NAFLD 患者的荟萃分析发现，MRE 诊断纤维化的准确性很高，与肝脏炎症和BMI 无关，诊断所有纤维化阶段的AUROC 值为0.86 ～ 0.91[100]。在诊断≥F2 纤维化上，MRE 优于FibroScan（一研究中AUROC 为0.91vs0.82，另一研究中AUROC 为0.89vs0.86），在诊断F4 纤维化上MRE 亦优于FibroScan（AUROC 为0.87vs0.69）[26,101]。然而，MRE 的广泛应用受到成本和专业设备的限制，很难用于筛选试验。

一项大规模荟萃分析显示APRI、FIB-4、BARD 评分、NFS、FibroScan M 探头、XL 探头、SWE 和MRE 诊断进展期肝纤维化的AUROC 值分别为0.77、0.84、0.76、0.84、0.88、0.85、0.95 和0.96。MRE 和SWE 对NAFLD 患者纤维化分期的诊断准确率最高[68]。

3.3.5 多参数磁共振成像近年，科学家建立了一种多参数磁共振技术LiverMultiScan（英国Perspectum Diagnostics 公司）。参数包括T1mapping（纤维化图像）、T2*mapping（肝铁定量）和1H-MRS（肝脂肪定量）。T1 测量细胞外水含量，铁升高影响T1。为了校正铁的影响，shMOLLI 建立的过程中模拟了细胞外液和铁浓度变化，并生成一个校正算法，获得校正铁后的T1，即cT1。cT1 会因细胞外水肿或慢性疾病的纤维化而升高[102]。LiverMultiScan 是一种快速、无创的检查，不需要静脉注射任何造影剂。在2017 年发表的一项研究中，其诊断NAFLD相关肝硬化的AUROC 为0.85[103]。一项大型前瞻性的动脉粥样硬化相关研究发现，T1 参数在肝脏炎症和/或纤维化患者中升高。更重要的发现是，初始肝T1 参数与未来10 年发生心血管事件（包括心房颤动、心力衰竭和冠心病）密切相关。LiverMultiScan将成为临床医生监测药物对NAFLD/NASH 患者疗效的重要工具[104]。

3.4 小结和建议

基于超声的弹性成像技术（如FibroScan 和剪切波弹性超声）在诊断进展期肝纤维化或肝硬化方面具有中等到高的准确性，常规临床实践可以使用。MRE 比超声技术有更高的成功率和准确性，但受成本和可及性的限制。但是，它可以用于临床试验中以验证潜在的抗纤维化药物。在不具备这些成像设备的情况下，血液生物标志物和临床预测模型是排除进展期肝纤维化的合理选择，尽管它们在区分纤维化等级上准确度欠佳。

4 遗传生物标志物和组学标志物

测序技术和其他高通量组学技术的飞速发展为发现NAFLD 新标志物、新机制、治疗新策略提供了重要手段。

4.1 单核苷酸多态性

已经发现多个与NAFLD 相关的单核苷酸多态性（SNP），包括PNPLA3 rs738409[105]、

TM6SF2rs58542926[106]、GCKRrs780094[107]、MBOAT1 rs641738[108]和HSD17B13 rs72613567[109]。PNPLA3 rs738409 研究最为广泛，相关性最强。有研究显示PNPLA3 I148M 也与纤维化[110]、肝病相关死亡相关[111]。但纳入SNP 的模型与现有的将临床和常规实验室检查变量结合产生的生物标志物打分具有相似的诊断效能[4]。2019 年,一些新SNP 位点被发现。携带FNDC5 rs3480 次要等位基因（G）与NAFLD 患者更严重的脂肪变相关[112]。对7 个无关家系（受累个体39 人，40 岁后表现出NAFLD 和/或血脂异常）进行全外显子和靶向深度测序，发现与ABHD5 上一个单等位变异相关[113]。能否提高诊断效能，有待进一步研究。

4.2 microRNAs

microRNAs（miRNAs）通过多种途径参与NAFLD 的发生发展，如调节碳水化合物代谢、肝细胞中脂质的分解代谢等。2019 年，Gjorgjieva 等[114]从病理生理到治疗各个方面对miRNA 与NAFLD 的关系进行了综述，也提出了潜在的miRNA 标志物，如miR-122、miR-33、miR-34a 和miR-21 等。血清miR-192-5p 在对照组、NAFL 组和NASH 组呈现逐渐升高趋势。一项研究显示，循环中miR-122、miR-21 和miR-192 联合区分NASH 和NAFL 的AUROC 为0.81[115]。另一项研究通过联合血清miR-122-5p、miR-1290、miR-27b-3p 和miR-192-5p，诊断NAFLD 的AUROC 达到0.856，显著高于ALT和FIB-4（AUROC 分别为0.786 和 0.795）[116]。总的来说，由于循环中的miRNAs 非常稳定，在血浆或血清中具有高度重复性和一致性，是指示不同肝脏疾病肝损伤和肝损害的理想替代物[4]。

4.3 脂质组、代谢组等组学标志物

NAFLD 是一种代谢性疾病。越来越多的证据表明某些脂质在引起肝细胞毒性中扮演了重要角色。这些脂质通过多种机制影响细胞行为，包括激活细胞死亡受体，内质网应激，线粒体功能修饰和氧化应激[117]。因此利用脂质组学和代谢组学技术可能提供有用的诊断标志物。利用脂质组学技术，通过靶向和非靶向方法，已识别出了一些潜在的标志物[118-120]。例如，在一项探索性分析中，由10 种脂质组成的模型能够很好地区分是否存在肝纤维化（准确率达98%）[118]。

随着蛋白质组学[121-122]、代谢组学[123-124]和宏基因组学[125]方面研究的开展，一些潜在的标志物被发现。一项代谢组学研究（涉及156 名病理确诊的NAFLD 患者）发现，由最显著的前10 个代谢物（8种脂类、牛磺酸和岩藻糖）组成的模型，诊断进展期肝纤维化效能显著高于FiB-4 和NAFLD 纤维化评分，AUROC 依次为0.94、0.78 和0.84[124]。通过结合多个不同层面的潜在标志物，一定程度上提高了诊断效能。一项基于318 名接受肝活检患者的大型研究联合遗传、临床、脂代谢和代谢组学标志物得出了NASH ClinLipMet score 评分。该评分识别NASH 患者的AUROC 为0.86 ～ 0.88，效能中等[126]。对86 例NAFLD 患者粪便微生物群的宏基因组学分析确定了37 种与进展期肝纤维化相关的菌种，并开发了一种能够以高准确度（AUROC 为0.936）预测进展期肝纤维化的算法[125]。最后，组学技术已被用于识别肠道微生物群和粪便微生物群中与NASH 和纤维化相关的基因组特征[127]。

然而，目前采用组学技术的研究主要是探索性和横断面研究，缺乏验证。此外，由于组学技术存在批次效应、低重复性、方法复杂性、高成本等问题，其目前尚不能被广泛应用于临床实践中。基于组学技术发现的潜在标志物，迫切需要经过大样本证实。

5 结语

NAFLD 和NASH 的无创评估已取得了重大进展。对于日常临床实践，腹部超声由于其普及性和相对较低的成本，仍然是诊断脂肪肝的主要检查手段。FIB-4、NFS 等基于实验室检查和临床人口学建立的公式准确度有限，但易应用于大规模流行病学研究，来排除进展期肝纤维化人群。通过TE 测量CAP 和肝硬度可以同时评估肝脂肪含量和肝纤维化程度。这种方法可对高危患者进行初步评估。MRI-PDFF 和MRE 在评估脂肪变和纤维化方面优于TE、其他血清学标志物和公式，已经应用于NASH 临床试验，但目前高成本和低普及性限制了其广泛应用。目前尚没有优异的无创指标区分NASH 和单纯脂肪变。细胞死亡相关指标CK18 评估最为广泛但效能也仅达到中等。NASH 的强异质性可能是造成单个指标诊断效能低及不一致的主要原因，通过多指标联合有望提高诊断效能。遗传学、表观遗传学和组学方法不仅揭示了NAFLD 发生发展的机制，也提供了许多潜在的新标志物。需继续探索新标志和组合，并对现有标志或标志组合进行大规模验证。长期随访的大型临床试验为无创标志物的发现和验证提供了契机。

致谢：

感谢吉林大学第一医院彩超室张德智老师关于超声部分的审阅。