敖登托娅 综述,王美英审校
1.内蒙古医科大学第二附属医院检验科,内蒙古呼和浩特 010090;2.内蒙古医科大学附属医院检验科,内蒙古呼和浩特 010010
血脂代谢紊乱是公认的心脑血管疾病发生的危险因素[1]。制订合理的血脂控制目标,可有效降低心脑血管疾病的发病率和病死率。血脂指标检测不仅是无症状人群进行风险评估的工具,更是患者降脂治疗的依据。临床常规检测的血脂指标包括总胆固醇(TC)、甘油三酯(TG)、低密度脂蛋白胆固醇(LDL-C)、高密度脂蛋白胆固醇(HDL-C)、脂蛋白(a)、载脂蛋白A(ApoA)和载脂蛋白B(ApoB)。虽然这些血脂指标都是心脑血管疾病的影响因素,但仅有LDL-C是被多个权威学会指南推荐的治疗靶标[2]。正因如此,准确测量LDL-C水平对于心脑血管疾病的预防、治疗、监测等极为重要。
LDL-C定量检测的参考方法是超高速离心法。但是该方法操作繁琐,需要大量的血清标本和超高速离心机[3]。因此不适用于普通的临床实验室。1998年,SUGIUCHI等[4]率先报道了一种可以实现自动化检测LDL-C水平的方法,即均相法。该方法的原理是利用α-环糊精硫酸盐、硫酸葡聚糖、镁离子抑制乳糜微粒和极低密度脂蛋白(VLDL)组分中的胆固醇与酶试剂(胆固醇酯酶、胆固醇氧化酶和过氧化物酶)的反应。聚氧化乙烯-聚氧化丙烯封闭共聚多醚则可抑制HDL-C与上述酶试剂的反应。最终,标本中只剩下LDL-C与酶试剂反应,借此达到选择性检测LDL-C水平的目的。此后,各种商业化的LDL-C检测试剂盒应运而生,包括Roche,Sekisui,Denka,Kyowa,Sysmex,Wako和UMA等。这些试剂盒均基于均相法,只在试剂配方、浓度、反应条件、反应顺序上进行一些调整或修饰。由于均相法测定LDL-C水平有样本量小、操作简便、易于自动化等优点,目前我国临床实验室测定血清LDL-C水平普遍采用此方法[5]。值得注意的是,按照国家胆固醇教育计划的要求,LDL-C检测的精密度和偏差均应<4%,总误差应<12%。这些商业化试剂盒的评估结果表明:试剂盒的检测性能各不一致,变异系数多在4%以下,与金标准(超高速离心法检测)之间存在7%的偏差[6]。在血脂代谢紊乱的患者中,均相法与超高速离心法之间的检测结果偏差更大[7]。此外,均相法也易受到一些标本因素的干扰,如脂蛋白X[8]。总体而言,均相法的检测结果也并不是十分可靠。因此,人们发明了各种计算公式去间接计算LDL-C水平。这些间接计算公式(Friedewald公式、Martin-Hopkins公式、Sampson公式)主要利用3个检测难度较低、准确度较高的血脂指标HDL-C、TC和TG去计算LDL-C水平。这些公式对计算LDL-C水平具有一定的准确度,且极大地节约了实验室成本,在血脂实验室得到广泛应用。值得注意的是,我国有一项研究探讨了均相法实测LDL-C水平与多种间接公式计算LDL-C水平的相关性[9],研究发现,这些公式均与均相法的结果具有良好的相关性,其中与Martin-Hopkins公式相关性表明,Martin-Hopkins公式可能是最适合中国人群的LDL-C计算公式。除此之外,机器学习也被应用于LDL-C水平的计算,且有研究指出机器学习构建的模型相比于间接计算公式能更准确地预测LDL-C水平[10]。本文在此主要介绍常见的LDL-C计算公式,以及机器学习在LDL-C水平计算中的应用。
Friedewald公式在1972年被首次提出,具体公式如下[11]:
LDL-C=TC-HDL-C-TG/5
该公式的假设是:外周血的TC主要来自3个部分,分别是HDL-C、LDL-C和VLDL中的胆固醇。其中,VLDL中胆固醇的含量是TG的1/5。Friedewald公式的提出,拉开了研发LDL-C水平计算公式的序幕。多个研究对Friedewald公式与超高速离心法结果之间的一致性进行探讨[12]。总体来看,TG水平过高和HDL-C水平过低时,Friedewald公式会低估LDL-C水平,反之则会高估[13-14]。值得注意的是,Friedewald公式的应用可能存在地域差异,并不适用于所有的国家。来自欧洲和韩国的研究认为Friedewald公式会低估LDL-C的水平[13,15]。但在伊朗的一项研究中认为Friedewald公式会高估受试者的LDL-C水平[16]。因此,将来需要在不同国家开展更多的研究去验证这一公式。
除此之外,也有研究比较了Friedewald公式与均相法的结果,在TG>400 mg/dL时,Friedewald公式的准确度并不令人满意,推荐使用直接检测法。这一结论得到了美国胆固醇管理指南的支持,并且该指南还补充Friedewald公式在LDL-C<70 mg/dL时准确度较差[17]。
尽管Friedewald公式存在着一些局限性,但是考虑到均相法有一定的成本,超高速离心法又较为繁琐。因此,Friedewald公式在很长一段时间内仍然在血脂实验室被广泛使用,特别是对于TG<400 mg/dL、LDL-C>70 mg/dL的标本。
Friedewald公式的科学假设是VLDL中胆固醇的含量是TG的1/5[10]。这一假设明显过于粗略,TG与VLDL中胆固醇的比值受很多因素的影响。2013年MARTIN等[18]对Friedewald公式进行了改进,提出了Martin-Hopkins公式。Martin-Hopkins公式认为,Friedewald公式中固定的TG不应该直接除以5,而是应该根据TG和非HDL-C的水平进行调整。Martin-Hopkins公式的具体公式如下:
LDL-C=TC-HDL-C-TG/可变系数
其中,可变系数是根据TG和非HDL-C的水平来确定的,具体可以从文献[18]提供的一个6×30的表格中读取。MARTIN等[18]PALMER等[19]的研究指出,在TG≤400 mg/dL时,Martin-Hopkins公式计算LDL-C水平的准确度高于Friedewald公式。但无论是Friedewald公式还是Martin-Hopkins公式可能均不适用于TG>400 mg/dL的患者。虽然Martin-Hopkins公式和Friedewald公式在计算TG高水平患者LDL-C中的准确度均较差,但Martin-Hopkins公式可能更准确一些。最新的一项基于111 939例TG水平在400~799 mg/dL的美国患者的研究指出,Martin-Hopkins公式的准确度仍然高于Friedewald公式[20]。在与超高速离心法的结果比较上,Martin-Hopkins公式计算LDL-C水平的准确度高于Friedewald公式,更接近参考方法。鉴于此,Martin-Hopkins公式于2018年被美国胆固醇指南推荐使用,同年,美国心脏学会心血管疾病标志物的指南也推荐了Martin-Hopkins公式作为检测LDL-C水平的首选计算方法[17]。
一项来自韩国的研究指出Martin-Hopkins公式应用于韩国患者时,会出现高估患者的LDL-C水平的情况[21]。并且 ,该研究还指出当应用Martin-Hopkins公式时,由于种族地域不同可能需要对公式的系数进行调整。由于以往关于Martin-Hopkins公式的研究大多源于欧美国家,因此Martin-Hopkins公式能否在全球其他地区推广尚不明确。将来仍有必要在不同地域和人群中开展相应的研究来探讨这一问题。
2020年,来自美国国立卫生研究院(NIH)血脂代谢实验室的SAMPSON的团队提出了新的LDL-C计算公式,即Sampson公式[22]。具体公式如下:
LDL-C=TC/0.948-HDL-C/0.971-[TG/8.56+TG×(TC-HDL-C)/2 140-TG2/16 100]-9.44
该方程基于β定量和最小二乘回归法改进了对VLDL-C水平的估计。该研究还指出,在TG≤400 mg/dL时,Friedewald公式、Martin-Hopkins公式和Sampson公式计算LDL-C的准确度相似,而TG水平在400~800 mg/dL时,Sampson公式准确度更高,尤其是与Friedewald公式比较,Sampson公式可减少35%的错误分类[21]。这表明,Sampson公式几乎可以应用于所有患者,因为TG≥800 mg/dL的患者少之又少。已经有多项研究对Sampson公式进行了验证与评估,认为Sampson公式是目前计算LDL-C水平准确度最高的公式[23-24]。值得注意的是,Sampson公式在儿童LDL-C计算上准确度也是很高[25]。
机器学习是一种将计算机科学与统计学融合的新兴的十分具有前景的人工智能技术。目前,机器学习在医学领域的应用越来越广泛。机器学习的过程大致是:预先给计算机一定量的数据(训练数据),并预先设定算法,让计算机软件根据训练数据不断优化算法参数,最终形成一个成熟的算法。之后,再利用该算法去测试新的数据(验证数据)或外部数据(测试数据),以评估算法的准确度。算法是机器学习的核心,也是机器学习能否成功的关键。目前常用的算法包括K最近邻法、支持向量机、随机森林等。很多研究利用这些算法开发新的LDL-C水平计算方案[26-33]。总体来看,机器学习算法计算LDL-C水平的结果也较为准确。在一项研究中,机器学习算法与均相法的相关系数达到0.982,高于Friedewald公式(r=0.950)和Martin-Hopkins公式(r=0.962)[32]。在TG<400 mg/dL时,机器学习算法的准确度与传统计算公式大致相似,并且在TG>400 mg/dL的个体中,机器学习算法的准确度与均相法的相关性也较高[27,29,31]。总体来看,机器学习是一种有前景的LDL-C水平计算方法。
值得注意的是,机器学习算法也有一些固有的缺陷。比如,机器学习算法本质上是一个“黑匣子”,无法像Friedewald公式和Martin-Hopkins公式那样用传统数学表达式来进行描述,必须借助计算机软件才能实现,在临床实践中难以普及。可以预见的是,如果能将这些算法整合入实验室信息系统(LIS),将极大地推动这些算法的临床应用。此外,机器学习算法较多,各种算法得出的结果不尽相同。因此,机器学习算法能否准确地计算出LDL-C水平并具有泛化能力,很大程度上取决于研究者是否利用具有广泛代表性的人群数据建立合理、稳健的机器学习算法。
目前,被广泛认可的LDL-C计算公式仅3个,分别是Friedewald公式,Martin-Hopkins公式和Sampson公式。就准确度而言,Friedewald公式不如Martin-Hopkins公式,Martin-Hopkins公式不如Sampson公式。机器学习算法虽然也具有较高的准确度,但是该方法的计算过程复杂,临床接受度尚待提升。笔者认为Martin-Hopkins公式的临床认可度较高,这主要是因为该公式已经诞生了10余年,其准确度在不同的人群中已被广泛验证。相比之下,Sampson公式诞生不到3年。虽然初步研究显示Sampson公式的准确度高于Martin-Hopkins公式,但这方面的证据还需要不断加强,最终才可能被临床接受。