桑 潮,梁丹丹,谢国祥,贾 伟,,陈天璐
1.上海交通大学附属第六人民医院转化医学中心,上海200233;2.夏威夷大学癌症中心,火奴鲁鲁96813
非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)是指除过量饮酒或其他明确的肝脏损害因素之外导致的经影像学或肝组织病理学证实的肝细胞脂肪变>5%的临床病理综合征,主要包括单纯性脂肪肝(non-alcoholic fatty liver,NAFL)、非酒精性脂肪性肝炎(non-alcoholic steatohepatitis,NASH)、NASH 相关肝纤维化和肝硬化以及肝细胞癌[1-2]。近年来,随着肥胖和代 谢 综 合 征(metabolic syndrome, MetS) 的 流 行,NAFLD 已成为我国第一大慢性肝病,患病率高达29.2%[3-4]。预 计 到2030 年,我 国NAFLD 患 者 会 达 到3.145 8 亿,成为全球增速最快的NAFLD 大国[5]。研究[1,4,6-7]显示NAFLD 不仅可以进展为肝硬化和肝癌,其与肝外疾病,如肝外肿瘤、糖尿病(diabetes mellitus,DM)、心血管疾病和MetS 等高度相关。因此,对NAFLD 患者进行早期筛查,及早进行干预治疗,可减轻疾病负担,改善患者的生活质量。肝穿刺活组织检查是目前诊断NAFLD 的“金标准”,但由于其有创性及存在取样误差,费用高,有一定的感染率和死亡率等局限性,不易被患者接受,临床应用受限[8]。血清学检测作为一种无创性检测方法,因其费用低、操作简便以及可重复性强[9],在临床工作中逐渐得到了重视和发展。目前NAFLD 血清学诊断研究方向主要有3 个,即诊断肝脂肪变性、脂肪性肝炎和肝纤维化。国外NAFLD 血清学诊断研究开展得较早,现已建立了20 多个模型用于诊断NAFLD。这些模型大多是基于几项或十几项血清学指标建 立的,如 脂 肪 肝 指 数 模型[10]、NASHTest 模型[11]、NAFLD 纤维化评分[12]和基于4 因子的纤维化指数(fibrosis index based on the 4 factors,FIB-4)[13]等。多数模型已被外部队列验证,有很好的应用价值。近年来,国内也进行了大规模的NAFLD 血清学诊断研究,并建立了脂肪性肝病指数[14]、ZJU 指数[15]、NAFL 筛查评分[16]和NAFLD 岭回归评分[17]等模型,队列样本数远超国外的研究队列;但多数样本尚未被外部队列验证,仍处于研究阶段,不能应用于临床。本文就NAFLD 无创性血清学诊断方法作一综述,以期为临床工作提供一些理论和实践参考。
Bedogni 等[10]于2006 年提出脂肪肝指数(fatty liver index,FLI)模型,研究对象为经超声诊断的268 例非脂肪肝患者和228 例脂肪肝患者。该模型通过逐步Logistic回归方法,从13 个变量中挑选出4 个指标,即体质量指数(body mass index,BMI)、腰围(waist circumference,WC)、三酰甘油(triacylglycerol,TAG)和γ-谷氨酰转肽酶(γ-glutamyl transpeptidase,GGT),建立诊断公式:
FLI=100/(1+e-z);z=0.953×ln[TAG(mg/dL)]+0.139×BMI(kg/m2)+0.718×ln[GGT(U/L)]+0.053×WC(cm)-15.745。其得分介于0和100之间,FLI<30可排除脂肪肝(阴性似然比为0.2),FLI≥60 可诊断为脂肪肝(阳性似然比为4.3),准确率可达0.84,95%CI 为0.81~0.87。目前,FLI模型已被广泛应用于筛选肝脂肪变性。在一项拥有13 122 名受试者的中国西部地区NAFLD 简易指标验证的回顾性横断面研究中[18],FLI 模型表现出良好的诊断性能。其预测NAFLD 的受试者工作特征曲线下面积(area under the receiver operating characteristic curve,AUROC)为0.880 (95%CI 0.874~0.886),FLI<30 的准确度、敏感度、特异度分别为0.782、0.832、0.770,FLI≥60 的准确度、敏感度、特异度分别为0.838、0.443、0.940。但另有研究表明,FLI 预测超声诊断的脂肪肝的最佳临界值(cut-off 值)存在性别差异[19],且FLI 不能很好地区分轻度脂肪肝与中重度脂肪肝[20]。
肝脏脂肪指数(hepatic steatosis index,HSI)模型由Lee 等[21]于2010 年提出,该研究共纳入10 724 人,每个受试者都进行了实验室检测、肝脏超声、人体测量评估和问卷评估,其中5 362 人被诊断为NAFLD。随机抽取5 360 人作为训练集,5 364 人作为验证集,通过多元Logistic 回归的方法,用BMI、DM 和谷丙转氨酶(glutamic pyruvic transaminase, GPT)/谷 草 转 氨 酶(glutamic oxalacetic transaminase,GOT)比值建立诊断公式:HSI=8×GPT/GOT+BMI(kg/m2)+2(if DM)+2(if 女性)。当HSI<30 时排除NAFLD,当HSI>36 时可诊断为NAFLD。训练集中,模型的AUROC 为0.812(95%CI 0.801~0.824),HSI<30的敏感度为92.5%(95%CI 91.5%~93.5%),HSI>36 的 特 异 度 为92.4% (95%CI 91.3%~93.4%),HSI<30 或HSI>36 的样本中准确率达85.6%。验证集中,模型的AUROC 为0.819(95%CI 0.808~0.830),HSI<30 的敏感度为93.1%(95%CI 92.1%~94.1%),HSI>36 的特异度为93.1%(95%CI 92.0%~94.0%),HSI<30 或HSI>36 的样本中准确率达86.3%。在一项基于13 122 名受试者的外部验证集中[18],该模型的AUROC 为0.833(95%CI 0.825~0.841),与Lee 等[21]的结果一致,证实了模型良好的诊断准确性和稳定性。但同FLI一样,HSI 也不能很好地区分轻度与中重度脂肪变性[20]。
2005 年Kahn[22]提出脂质蓄积指数(lipid accumulation product,LAP)模型,通过WC 和TAG 评估DM 和心血管疾病风险。公式为LAP(男)=[WC(cm)-65]×TAG(mmol/L);LAP(女)=[WC(cm)-58]×TAG(mmol/L)。2010 年Bedogni 等[23]提 出 经 自 然 对 数 转 换 的LAP(natural logarithm of lipid accumulation product,lnLAP)模型可预测肝脏的脂肪变性程度。该研究共纳入588 人,超声检查无肝脂肪变性的有332 人,中度脂肪变性的有118 人,重度的有138 人。无肝脂肪变性与肝脂肪变性组的AUROC为0.79(95%CI 0.76~0.83),无肝脂肪变性+中度肝脂肪变性组与重度肝脂肪变性组的AUROC 为0.79(95%CI 0.76~0.83)。该模型只需要WC 和TAG 两个指标,相对于目前现有的其他几个NAFLD 肝脂肪变性简易血清学诊断模型,LAP 所需的费用最少,但仍能获得较好的诊断结果,其区分NAFLD 组和对照组的AUROC 值为0.853 (95%CI 0.845~0.860)[18]。但 不 同 于 其 他 模 型,LAP 目前还没有一个明确的cut-off 值,在一定程度上限制了其临床应用。
Poynard 等[24]于2005 提出SteatoTest模型,该模型是在FibroTest和ActiTest[25]的基础上衍生而来的,通过α2-巨球蛋白、载脂蛋白A1、结合珠蛋白、总胆红素、GGT、GPT、BMI、总胆固醇(triglycerides,TC)、TAG 和空腹血糖10个指标,并根据年龄和性别进行调整,建立的一个Logisitc回归方程。该研究有4个数据集,训练集有310人,验证集1 有171 人,验证集2 有201 人,验证集3 有62 人。SteatoTest 模 型 的 训 练 集AUROC 为0.79, 标 准 误(standard error,SE)为0.03,验证集1、2、3 的AUROC分 别 为0.80 (SE=0.04)、0.86 (SE=0.03)、0.72 (SE=0.05)。采用4级评分系统评估肝脂肪变性:S0级,无脂肪变性(0%);S1级,轻度脂肪变性(1%~5%);S2级,中度脂肪变性(6%~32%);S3~S4级,重度脂肪变性(33%~100%)。诊断S2~S4级,SteatoTest模型训练集和3个验证集的敏感度分别为0.91、0.98、1.00 和0.85,cut-off 值为0.30;特异度分别为0.89、0.83、0.92和1.00,cut-off值为0.70。Munteanu 等[26]在Thierry Poynard 的研究基础上,采用了新的SAF评分(steatosis,activity and fibrosis score)评估肝穿刺标本,并采用了非二进制的AUROC(nonbinary-AUROC,NonBinAUROC)评估SteatoTest 模型。该研究纳入了600名受试者,NonBinAUROC为0.822(95%CI 0.804~0.840)。能够将肝脂肪变性程度进行分级是SteatoTest模型的一大亮点,且确诊手段为肝穿刺活检,可靠性强;但该模型较为复杂,计算公式暂不明,部分检测指标临床不常用,使其在临床应用中较为受限。
除上述模型外,还有许多其他模型,如Korea 指数[27]、脂肪性肝病(fatty liver disease,FLD)指数[14]、NAFLD 指 数[28]、 ZJU 指 数[15]和FSI (Framingham steatosis index)指数[29]等,也具有一定的诊断价值,在临床应用或流行病学研究中可根据实际情况进行选择。但由于大部分研究并非以肝穿刺活检作为诊断依据,而是选择无创而又简便的超声检查来诊断NAFLD,其结果的准确度有待进一步验证。另外,评估一个模型的优劣需经过大量的外部数据进行验证,不能仅依据该研究的验证结果,而目前很多模型尚缺少外部独立队列的验证。
细胞凋亡是肝细胞死亡的重要原因,也是NASH 的突出特征。细胞角蛋白18(cytokeratin-18,CK-18)是构成肝细胞中间丝蛋白的主要成分之一,也是凋亡蛋白酶3裂解的重要底物,可反映肝细胞凋亡水平[30]。在肝细胞凋亡过程中,巯基蛋白酶被不同的凋亡刺激物激活,形成胱天蛋白酶,该酶可将CK-18 裂解成CK-18 片段[31]。有研究[32-34]表明,CK-18 和CK-18 片段与肝脂肪变性程度、小叶炎症、气球样变性和纤维化程度密切相关,可作为NASH 诊断的无创生物标志物。一项纳入了国内10项NAFLD 研究的meta 分析[35]结果显示,CK-18 诊断NASH 的敏感度和特异度分别为77%(95%CI 0.70~0.83)和71%(95%CI 0.65~0.77),而CK-18 片段的敏感度和特异 度 分 别 为83% (95%CI 0.80~0.86) 和71% (95%CI 0.66~0.76)。CK-18片段在诊断敏感度上明显优于CK-18,将CK-18 片段作为筛选NASH 的生物学标志更为可靠。虽然已有许多CK-18 与NASH 的相关性研究,但其准确度仍有待提高,目前尚未应用于临床。
炎症细胞因子主要包括肿瘤坏死因子-α (tumor necrosis factor-α,TNF-α)、白细胞介素6(interleukin 6,IL-6)和穿透素3(pentraxin 3,PTX3)等。NASH 患者TNF-α和IL-6水平高于NAFL患者,故其水平正常可考虑作为排除NASH 的参考依据[36-37]。研究显示,PTX3 水平可随着NASH 的发展而逐渐升高,NAFLD 患者血清PTX3 水平高于正常对照组,而NASH 患者高于非NASH的NAFLD 患者,因而该指标在区分NASH 和NAFL 方面有着较高的诊断价值[38-39]。由于体内存在其他炎症时,这些炎症细胞因子也会升高,其诊断NASH 的特异度较低,还需要大规模的队列研究验证这些炎症细胞因子的诊断价值。
Poynard 等[11]于2006 年提出NASHTest 模型,该模型使用了一种专利算法,由年龄、性别、身高、体质量、TAG、TC、α2-巨球蛋白、载脂蛋白A1、结合珠蛋白、GGT、GPT、GOT、总胆红素13 个参数组成,用来区分非NASH、可疑NASH 和NASH。训练集有160 人,验证集有97 人。训练集模型诊断NASH、可疑NASH、非NASH 的AUROC 分别为0.79(95%CI 0.69~0.86)、0.69(95%CI 0.60~0.77)和0.77(95%CI 0.68~0.84),训练集模型分别为0.79(95%CI 0.67~0.87)、0.69(95%CI 0.57~0.78)和0.83(95%CI 0.67~0.90),其诊断性能有待提高。另 一 项 纳 入494 例NAFLD 患 者 的 研 究[40]发 现,NASHTest 诊断非NASH 的准确率很高,更适合作为一种排除标准,使大多数非NASH患者免于肝活组织检查。
Angulo 等[12]于2007 年 提 出NAFLD 纤 维 化 评 分(NAFLD fibrosis score,NFS)模型,该研究包含2个数据集,训练集有480人,验证集有253人。模型由年龄、是否存在DM或空腹血糖异常(impaired fasting glucose,IFG)、BMI、血小板计数(platelet counts,PLT)、白蛋白(albumin,ALB)及GOT/GPT 比值组成,公式为NFS=-1.675+0.037×年 龄(岁)+0.094×BMI(kg/m2)+1.13×DM/IFG(是=1,否=0)+0.99×GOT/GPT-0.013×PLT(×109/L)-0.66×ALB(g/dL)。该模型有2 个cut-off 值,低cut-off 值(NFS<-1.455)用于排除进展期纤维化,而高cut-off 值(NFS>0.676)用于诊断进展期纤维化,-1.455~0.676 为“灰色地带”,需要通过肝穿刺活检进行确诊。模型训练集和验证集的诊断AUROC 为0.88 和0.82,总体准确率达90%。随后,该模型在不同地区和种族人群中被广泛验证,有着较好的诊断准确性和稳定性[41]。目前,NFS 已成为应用最多的NAFLD 无创性血清学肝纤维化诊断模型之一,已被美国肝病研究协会认可,作为一种临床决策辅助工具[1]。
FIB-4 最早由Sterling 等[13]提出,用来评估慢性丙型肝炎合并人类免疫缺陷病毒感染患者的肝纤维化程度。该模型采用多元逻辑回归的方法,基于PLT、年龄、GOT、GPT 4 个指标,建立公式:FIB-4=年龄(岁)×GOT(U/L)/{PLT(×109/L)×[GPT(U/L)]1/2}。该研究共纳入832名受试者,随机将其分成2 组,其中训练集555 人,验证集277 人。与NFS 类似,FIB-4 模型也有2 个cut-off 值,低cut-off 值(FIB-4<1.45,敏感度70%)用于排除进展期纤维化,而高cut-off 值(FIB-4>3.25,特异度97%)用于诊断进展期纤维化;1.45~3.25为“灰色地带”,需要通过肝穿刺活检进行确诊。区分进展期纤维化和非进展期纤维化的诊断AUROC 为0.765。目前,FIB-4 在慢性肝病肝纤维化评估中应用非常广泛,不仅可以诊断慢性丙型肝炎患者的肝纤维化程度,对慢性乙型肝炎和NAFLD 患者依然适用[42-44],且诊断效果与磁共振弹性成像的预测价值相当[45]。
Guha等[46]在原欧洲肝纤维化组合分数的基础上,简化了年龄变量,建立了增强肝纤维化组合分数(enhanced liver fibrosis panel,ELF)模型。该模型由金属蛋白酶组织抑制物-1(tissue inhibitor of matrix metalloproteinase 1,TIMP-1)、透明质酸(hyaluronic acid,HA)、Ⅲ型前胶原氨基末端肽(aminoterminal peptide of pro-collagen Ⅲ,P3NP)3 个指标组合而成,诊断公式为:ELF=-7.412+0.681×ln(HA)+0.775×ln(P3NP)+0.494×ln(TIMP-1)。该研究共纳入了192 例NAFLD 患者,其预测重度纤维化、中度纤维化及无纤维化的AUROC分别为0.90、0.82和0.76。除此之外,研究者还将ELF与NFS模型结合,建立了预测重度纤维化、中度纤维化及无纤维化3套组合公式。结合了NFS的ELF模型预测重度纤维化、中度纤维化及无纤维化的AUROC 分别提高至0.98、0.93 和0.84,模型的诊断性能显著提升,有效避免了不必要的肝穿刺检查。
由于肝纤维化程度可影响患者的长期预后[47],除了上述模型外,还有许多血清学诊断模型用于评估NAFLD肝纤维化程度,如BARD[48]、APRI[49]、Hepascore[50]、Fibrometer[51]、Fibrotest[52]等。这些模型与NFS 和FIB-4相比,适用范围较局限,且诊断准确度也相对较低,故在临床中应用较少,很多都处于研究阶段,是否适用于临床还有待更进一步的研究。
目前,NAFLD 肝纤维化的血清学诊断模型研究较为广泛,已有多达10 余种肝纤维化诊断模型建立并被反复验证;其中NFS和FIB-4模型已被推荐作为一种临床决策辅助工具[1],辅助诊断进展期肝纤维化,避免不必要的肝穿刺检查。NAFLD 肝脂肪变性诊断模型还处于发展阶段,目前在初步筛查上有着较好的应用价值,可作为流行病学调查研究中的替代指标;但因其无法准确判断NAFLD 患者肝脂肪变性程度,临床应用较为受限,多数患者仍需肝穿刺检查判断疾病进展。NAFLD 脂肪性肝炎的血清学诊断研究较少,没有明确被证实的可用于诊断的血清学模型,大多都作为排除诊断工具,且特异度不高,独立队列验证较少,模型的诊断价值还有待进一步验证。因此,在临床工作中,暂没有可完全替代肝组织穿刺活检的血清学诊断方法;且在研究工作中,仍需以肝组织穿刺活检作为确诊手段,将无创性诊断方法与之进行比较,判断其可靠性。除了提高单个血清学模型的诊断性能,还可以在现有的研究基础上,结合多个血清学诊断模型和简单的无创性影像学检查方法,进行大规模的队列研究;或结合人工智能,通过机器学习等方法,建立更加精准高效的诊断模型。目前,有研究提出FibroMeter 与振动控制瞬态弹性成像技术(vibration controlled transient elastography, VCTE) 的 组 合FibroMeterVCTE可综合评估肝纤维化程度[53];将FIB-4 与FibroMeterVCTE结合,能显著提高NAFLD 患者晚期纤维化诊断的准确率[54];另有一些研究成功将机器学习方法应用于疾病诊断[17,55-56]。此外,血清代谢组学也可作为评估慢性肝脏疾病的辅助性生物标志物。众所周知,肝脏是生产脂肪酸、胆汁酸和降解氨基酸的主要代谢器官,这些代谢物与慢性肝病的进展和预后密切相关。因此,可以将血清代谢物与现有临床指标结合,进一步提高模型的诊断效能,推动NAFLD 无创性诊断的快速发展,从而减少肝组织穿刺活检的使用,减轻患者的痛苦,为患者提供及时、准确的干预治疗,改善患者的生活质量。