韩松涛,赵晓群,黄艳春
(新疆医科大学附属肿瘤医院检验科,新疆乌鲁木齐 830011)
生物参考区间通常指参考值分布的95%置信区间[1],是解释检验结果、分析检验信息的基本依据和尺度,同时可靠的参考区间对指导临床患者诊治提供坚实依据。国际临床化学和实验室医学联盟推荐的参考区间(RIs)建立方法对临床实验室过于复杂,错误使用率高[2]。国际临床化学和实验室医学联盟和美国临床实验室标准化协会在2010年共同修订了名为《临床实验室中参考区间的定义、建立和验证》的指南第3版(EP28-A3c)。在指南中,建立参考区间的方法得到了补充,使用不少于120例参考个体的非参数法,并指出参考区间的建立是繁琐、耗时且昂贵的,因此允许临床实验室使用已建立的参考区间[3]。糖链抗原72-4(CA72-4)指标广泛用于胃肠道肿瘤和卵巢癌的诊断、治疗和预后监测[4-8]。新疆医科大学附属肿瘤医院和新疆医科大学附属第四医院CA72-4目前均采用试剂说明书中推荐的6.9 U/mL作为参考区间的上限,但在体检中发现有些体检者无明显不适症状,却表现出CA72-4异常高于试剂说明书中的参考区间的上限,初步猜测可能跟选择的健康人群及地域有关。因此,本研究选取一家肿瘤专科医院和一家综合性医院的体检人群,初步建立CA72-4的参考区间,并评估其研究价值。
1.1一般资料 数据来自新疆医科大学附属肿瘤医院及新疆医科大学第四附属医院的实验室信息管理系统,调取既往体检健康者基本信息及CA72-4的检测值,共39 957例。本研究仅对>18岁的成年人的指标进行分析,纳入标准:(1)检测信息完整准确,既往体检健康者;(2)无胃肠、妇科疾病、药物治疗(如非甾体抗炎药、糖皮质激素等)等基础疾病史。排除标准:(1)有慢性疾病、代谢性疾病、营养性疾病的患者;(2)既往有相关治疗病史。纳入39 889例,其中男性17 484例,女性22 405例。本研究经医院伦理委员会批准。
1.2仪器和试剂 全自动电化学发光免疫分析仪购自瑞士Roche公司,型号Cobase601;CA72-4检测试剂盒和校准品购自瑞士Roche公司。采用经典的Westgard多规则质控作为室内质量控制(12s作为警告规则,13s、22s、R4s、41s、10x作为失控规则),新疆医科大学附属肿瘤医院实验室累积的变异系数(CV)为5%,附属第四医院实验室累积的CV为7%。
1.3方法 使用偏度-峰度值检验(Skewness-Kurtosis)对数据进行正态性分析,当偏度值和峰度值分别小于对应偏度和峰度标准差的1.96倍即可判定为呈正态分布。非正态分布数据通过Box-Cox变换转变为近似正态分布[9],并对变换后数据使用偏度-峰度值检验分析正态性,并绘制频数分布直方图。离群值剔除采用四分位间距法[10],剔除均值±1.5倍四分位间距之外的数值。运用非参数秩和检验、Spearman相关性分析计算该项目不同性别、年龄之间是否有统计学差异。采用非参数法进行RIs的建立。运用非参数统计法计算97.5%的值作为上限。
1.4统计学处理 运用Office Excel 2010及SPSS19.0软件分析,通过非参数法,并依据参考变化值(RCV)=21/2×Z×[实验室累积变异系数(CVA)2+生物变异度(CVI)2]1/2计算本研究所得到的结果差异是否具有统计学意义,比较CA72-4检测项目的上限水平,建立符合本实验室的CA72-4的RIs,并与当前所运用的RIs进行比较。
2.1数据分布 经分析整理,纳入39 889例,剔除离群值后,最终纳入的数据为34 937例,其中男性15 544例,18~<30岁1 626例,30~<50岁7 561例,50~<70岁5 247例,≥70岁1 110例;女性19 393例,18~<30岁682例,30~<50岁8 430例,50~<70岁8 956例,≥70岁1 325例,经Box-Cox变换后,绘制频数分布直方图观察数据的分布情况,见图1、2。
注:横坐标表示CA72-4测量值(U/mL);纵坐标表示频率(例)。
图139889例CA72-4检测数据分布直方图
注:横坐标为CA72-4测量值(U/mL),纵坐标为频率(例)。
图2最终纳入34937例CA72-4值Box-Cox变换后分布直方图
2.2CA72-4检测结果和参考区间建立 运用非参数秩和检验,得出Z=-11.425,P<0.05,不同性别间差异有统计学意义,可依据性别建立RIs。运用Spearman相关性分析,CA72-4检测结果与年龄差异无统计学意义(P>0.05),不能根据年龄建立RIs。采用非参数排序法,分别对已剔除过离群值的男、女数据进行升序排列,取97.5%的数值作为参考区间的上限。见表1。
表1 不同性别之间CA72-4测量值比较和参考区间的建立
2.3运用RCV公式比较 CA72-4的生物变异度为16.06%[11],新疆医科大学附属肿瘤医院实验室累积的CV为5%,附属医院第四实验室累积的CV为7%,平均CV为6%。Z为95%的置信区间,在本研究中取1.96数值,经计算RCV=21/2×1.96×[0.160 62+0.062]1/2=47.52%;比较RCVmax及RCV的大小。得出男性RCVmax=25.36,女性RCVmax=27.10,不同性别所建立的RIs差异无统计学意义。
2.4运用EP28-A3c文件验证参考区间 运用本研究建立的RIs发现,在34 937例数据中,异常例数1 367(占比3.91%),低于厂家提供的RIs刷选出的异常例数2 060(占比5.90%);按照EP28-A3c文件根据不同性别检测20例健康体检者的CA72-4,并进行验证。经过验证,本研究所建立的参考区间适用于本实验室,见表2。
表2 CA72-4参考区间验证和新RIs正常者、异常者的频数变化
直接法建立参考区间需要筛选健康人群纳入参考个体,这一过程极为昂贵和耗时,并且在当今的临床工作中难以实现,尤其是当参考区间需要根据年龄和性别差异分别建立或者需要针对一些特殊人群进行研究时,入组参考个体的选取会变得异常困难。因此许多实验室改为引用试剂厂商或者其他实验室的参考区间,但是直接套用他人建立的参考区间可能会存在服务人群和检测系统的差异,会对临床工作和患者造成困扰[2]。因此,迫切需要一种快捷及简单方便的方法建立本地区或者适合本实验室的参考区间。国内外有许多研究基于大量样本统计分析计算出检测项目的RIs,如Robust法、Bhattacharya法、传统的非参数法等[12]。随着实验室信息管理系统的发展,调取大量实验室数据已并非难事,也为运用间接法建立实验室RIs奠定了很好的基础。同时制定严格的纳入、排除标准可为数据的可靠性提供重要的保证。在本研究中,回顾性分析了近5年体检人群的CA72-4结果,在制定纳入、排除标准时,由于使用相对较长时间范围内的数据,对于分析前的因素的控制并不是很明确,从而导致在建立参考区间受到影响,因此在制定纳入、排除标准的同时,观察体检人群其他相应指标(生化、免疫、血常规等)或者是翻阅既往病例和进行电话随访并制定患者调查问卷,以排除潜在对该指标检测有影响的人群;其次加大数据量可以优化所建立的参考区间,并尽可能将检测结果不确定的人群控制在5%以下,以此来控制分析前因素对该指标的影响。
建立生物参考区间过程中,数据的剔除是关键步骤。本研究采用剔除四分位间距法[10],剔除均值±1.5倍四分位距之外的数值。运用此剔除方法要求数据呈正态或对称分布,如原数据呈偏态分布,需将数据转换成正态或对称分布形式。本研究数据呈偏态分布,故选择“Box-Cox”转换方式对数据进行正态性转换[9]。然而在间接法建立实验室生物参考区间的文献当中,数据剔除法各有不同[13-14],每种方法各有优缺点,在选择数据剔除时可根据数据量和数据分布情况,选用不同剔除方法以到达剔除效果。许多离群值剔除方法都是以数据正态分布为前提[15],所剔除的离群值均按照剔除公式严格计算。本研究最终纳入的数据为34 937例,共剔除4 952例,剔除比例为12.4%。出现这种情况,这与离群值剔除既按照剔除公式计算,又循环使用本研究中的方法直到剔除所有离群值为止有关;同时亦不排除本研究中数据基数大导致剔除比例较高。如果离群值剔除不正确会导致参考区间反常缩小或者扩大,因此只有严格按照剔除公式进行反复循环剔除离群值才能保证所建参考区间的正确性。
确定参考区间的上、下限是最重要的一环。通常确定参考区间的上、下限有参数法、非参数法及罗伯斯特法等[15]。参数法是建立参考区间的最经典的方法,但是一般要求数据必须呈正态分布。而大多数的数据并非正态分布,这也是限制了参数法在确立参考区间的应用。罗伯斯特法是一种介于参数法与非参数法之间的方法[16],具有类似参数估计的过程并且对样本量没有太高的要求,对于数据分布形态的要求不如其他的方法严格。正是这种特性使其在非正态分布的数据中同样表现出色[3]。从严格意义上来说,罗伯斯特法是一种小样本估计参考区间的方法,被广泛应用于样本量少于120例的情况中[15]。EP28-A3c指南明确指出非参数法是建立生物参考区间的推荐方法之一。由于参数法的计量水准明显高于非参数法,因此非参数法对样本数量的要求相对较高。根据相关研究者建议,使用非参数法进行参考区间研究,最小的可靠观测量为120例。无论获得多大量的参考值,数据仍然应该根据非参数方法分析并根据适当的百分位数报告[3]。对大部分分析物而言,应该选取数据分布的2.5%和97.5%百分位值作为上、下参考限的取值[3]。
现中国大多数医院所使用的参考区间均是依据欧美健康人群所建立的,且根据卫健委最新颁布的有关肿瘤标志物的参考区间行业标准(WS/T645.2-2018)中并没有涉及CA72-4。本研究通过采用非参数法建立参考区间,得出CA72-4参考区间男性<8.65 U/mL,女性<8.77 U/mL,与试剂厂商所提供的参考区间有一定的差别,这种差别有可能是因为地区或者人群的选择不同,也有可能是在本研究中仅采用了非参数法这一种方法进行参考区间的建立,不排除此种方法存在局限性。因此在建立参考区间的过程中可进行两种以上方法的比较,以得出更加符合本实验室或者本地区健康人群的参考区间。
本研究通过非参数法初步得到新疆地区CA72-4的参考区间,具有一定参考价值。同时随着医院的实验室信息管理系统逐步完善,使用间接法建立实验室指标的RIs比直接法更加简单明了,相应技术要求较低。对于各级医院实验室可依据不同地区、不同人群建立符合本地区或本实验室的RIs,为临床或患者提供更好参考依据。