南方医科大学公共卫生与热带医学学院生物统计学系(510515) 安胜利张海兰
基于对应分析的分类变量一致性评价量化指标的构建*
南方医科大学公共卫生与热带医学学院生物统计学系(510515) 安胜利△张海兰
目的将对应分析(correspondence analysis,CA)应用于临床诊断试验的一致性评价,构建基于CA的一致性评价量化指标,提高其在一致性评价应用中的客观性。方法根据CA的具体算法构造出距离矩阵,参考kappa系数的原理,利用SAS9.1构造一致性评价量化指标(分别简称CBD和CCBD);通过不同情形下的模拟数据和实例对量化指标进行可靠性和实用性考核。结果两个待评价方法时,CBD和kappa均与符合率存在较高的正相关;多个待评价方法时,CBD或CCBD分别与kappa或fleisskappa成正相关。对于存在kappa悖论的资料,CBD表现出相对于kappa较高的稳定性。此外,CBD或CCBD与其相应的对应分析图得出的结论亦吻合。结论基于CA所构建的一致性评价量化指标是客观可靠的,对于临床科研中的一致性评价具有重要的理论和实际意义。
对应分析 一致性评价 量化指标
随着医学不断发展,新诊断方法、新治疗方法层出不穷,在临床科研中常常需研究它们与传统方法或金标准的一致性。kappa是对分类变量进行一致性评价的常用指标,但此方法不直观,且存在要求测量结果分类数相等、kappa悖论等问题[1]。所谓kappa悖论是指由于特定数据的分布原因,导致用kappa评价一致性的结果与实际观察到的符合率结果相背离。Helena等人曾经对kappa系数的缺陷进行过探讨和改进[2-4]。对应分析(correspondence analysis,CA)又称R-Q型因子分析,是多维图示分析技术的一种,主要用于分类变量的关联性分析[5-8],可藉图形直观表达结果的一致性,但因其结论具有一定的主观性,从而限制了CA在一致性评价中的应用。近年来,有学者曾提出通过构造量化指标来改进对应分析的构想[9],但并未进一步探讨实现。本研究将以CA的原理和算法为基础,并参照kappa系数的原理[2,10-11],构建能反映分类变量之间一致性情况的量化指标,即两变量一致性指标(correspondence based distance,CBD)和多变量一致性指标(combined correspondence based distance,CCBD)。通过模拟不同情形下的数据和实例对量化指标进行考核,且与kappa系数比较,验证CBD和CCBD的实用性和可靠性,以期构建一个相对客观、直观、可靠的一致性评价方法。
对应分析中得到的惯量比例是指各维度(公因子)分别解释总惯量的比例及累计百分比,一般取累计百分比达到较高时的维度,本研究将对三维以下维度的情况进行研究。根据对应分析原理可以得到对应分析图中各散点的坐标,通过计算可得到各散点之间的距离矩阵,本研究参照kappa系数的原理,应用各散点之间的距离矩阵构造出一个新的量化指标。具体构造步骤如下:
1.进行对应分析,得到对应分析图和各变量各分类的一维或二维坐标(xij,yij),其中i是变量个数,j是各变量的分类数。
2.利用以上各点坐标构建所有变量各分类之间的距离对称矩阵Dij(所有变量所有分类数的总和,i=j)。
3.参考kappa系数的原理[2,4],构造一致性量化指标(CBD和CCBD):kappa系数的原理和计算公式是根据行列表的边缘概率构造的,据此,本研究亦通过以上距离矩阵得到边缘概率,构造出基于距离矩阵的一致性量化指标。两变量和多变量的构造方法有所不同,具体如下:
(1)只有两个变量时,所用距离矩阵为Dij的子集,行为第一个变量的各分类,列为第二个变量的各分类,一致性量化指标CBD(取值范围为[-1,1]):
上式中,cap0指各变量各类别之间的实际符合率指各变量各类别之间的期望符合率(i指两个变量的相同分类第i类,j指第j类,dpi.是距离矩阵中第i行距离之和占总距离的比例,dp.j是距离矩阵中第j列距离之和占总距离的比例)。
(2)变量为三个或三个以上时,距离矩阵为对称矩阵Dij,一致性量化指标CCBD(取值范围为[-1,1]):
4.量化指标的标准误和95%置信区间。
(1)CBD的标准误计算公式为:
上式中,dsum是各变量各分类的所有距离总和。该式因将cape当作一个常数,将cap0当作总体对待,故所得结果是一个近似值,。当样本量N较大时,cape相对于CBD变化不大,且CBD近似服从正态分布,故CBD的95%置信区间为:CBD±Z0.05/2·SECBD。
(2)CCBD的标准误计算公式为:
上式中,zsum是距离对称矩阵中的距离总和。当样本量N较大时近似服从正态分布,故CCBD近似服从自由度为1的卡方分布,其95%置信区间
5.量化指标之间比较的假设检验[12]:
由于以上CBD近似服从正态分布,故两个CBD的差异性假设检验可通过下式实现:
为减小抽样误差,对每种情形下的数据均进行了500次样本量为500的模拟,最后采用这500次各个分类组合的平均频数进行分析。
1.两个待评价方法(以二分类测量结果为例)
此种设计可总结为四格表形式,共模拟了15次平均观察符合率不同数据。结果显示kappa系数、CBD均与符合率存在正相关关系(见表1),rCBD=0.98509,rkappa=1.00000,符合率与kappa的相关系数稍大于其与CBD的相关系数,但两者相差不大,且都反映出很强的正相关关系。此外,每次模拟数据所得CBD所反映结论均与其相应的对应分析图一致。若其中一个方法为金标准,则可计算相应的灵敏度和特异度。
2.多个待评价方法(以三个待评价方法二分类测量结果为例)
模拟具有一定关联性的两个待评价方法Mb、Mc和一个金标准方法Ma的数据,均为二分类(假定为normal和sick)进行多重对应分析,并利用其对应分析图上的各个点的坐标建立距离矩阵,获得总一致性量化指标CCBD,同时分别求得Mb、Mc与标准方法Ma的一致性量化指标CBD。所得结果见表2。两个CBD的差异性假设检验结果为Z=-2.048,P=0.0405,可认为二者不等。与Mb相比,Mc与金标准Ma的一致性程度更好。
3.多个待评价方法(以三个待评价方法三分类测量结果为例)
模拟了10次不同情形的数据,结果显示待评价方法两两之间的CBD与其相应的kappa系数呈正相关关系(见表3);CCBD和fleisskappa呈正相关关系。此外,各情形下得到的CCBD所反映结论均与其相应的对应分析图一致。
表1 符合率、CBD、kappa系数和灵敏度、特异度汇总表
表2 符合率、各量化指标、各kappa系数汇总表
甲、乙两个医师对相同的240个病人的X光胸片进行诊断[3],其数据如表4:
表3 两医师对X光胸片诊断结果
经计算,该数据CBD=0.667,kappa=0.0065,符合率=0.7042.由于kappa公式中的Pe与P0很接近,则分子P0-Pe接近于0,导致该资料的kappa取值很小,只有0.0065。若按照kappa系数评价,则甲医师和乙医师的诊断结果几乎是没有一致性的,但从实际观察符合率来看却较高,此即所谓的kappa悖论。而本研究构造的量化指标CBD结合对应分析图则能得到甲医师和乙医师的诊断结果一致性较好的结论,与观察符合率反映的情况一致,显示了本研究所构造量化指标的实用性和可靠性。
本研究模拟了不同情况下的分类数据,结果显示所构建的量化指标能客观正确地反映各方法测量结果之间的一致性程度,并适用于存在kappa悖论的数据;同时,本研究所构建的一致性量化指标并不像kappa那样,要求待评价方法的结果分类数相同;另外,相对于金标准,不同待评价方法之间的CBD大小还可进行假设检验。
值得注意的是,本研究构建的一致性量化指标是以对应分析过程中得到的一维或二维坐标数据为基础的,因此在分析过程中,必须先明确对应分析的一维或二维空间数据能包含大部分信息量,然后再计算量化指标。
本研究构建的量化指标尚存在以下不足:符合率较小时,CBD的抽样误差会很大,导致其置信区间较宽;对于有序变量数据是否存在更合理的加权对应分析量化指标,本次研究尚未涉及。以上问题拟在以后的研究中加以改进和完善。
1.Feuerman M,M iller AR.Relationships between statisticalmeasures of agreement:sensitivity,specificity and kappa.JEval Clin Pract,2008,14(5):930-933.
2.Chmura KH,Periyakoil VS,Noda A.Kappa coefficients in medical research.Stat Med,2002,21(14):2109-2129.
3.王军.Kappa系数在一致性评价中的应用研究.四川大学,2006.
4.闫岩,华琳,张建.对诊断一致性kappa系数及评价指标的探讨.中国卫生统计,2007,24(3):313-315.
5.高惠璇.应用多元统计分析.北京大学出版社,2005.
6.陈明,陈景武.对应分析方法及其在临床上的应用.数理医药学杂志,2007,20(2):132-134.
7.李宝红,董时富,孙振球.对应分析在生态学研究中的应用.中华流行病学杂志,2007,28(9):914-917.
8.李宝红,孙振球.对应分析在探讨疾病季节分布中的应用.中国卫生统计,2007,24(6):593-596.
9.Nadia S,Christina W,Bin Z,et al.Correspondence analysis is a useful tool to uncover the relationships among categorical variables.Journal of Clinical Epidem iology.2010,63(6):638-646.
10.赵燕,属性值测量系统分析的方法研究与应用,天津大学,2007.
11.夏邦世,吴金华.Kappa一致性检验在检验医学研究中的应用.中华检验医学杂志,2006,29(1):83-84.
12.Cohen J.A coefficient of agreement for nom inal scales.EDUCATIONAL AND PSYCHOLOGICAL MEASUREMENT,1960,1:37-46.
(责任编辑:郭海强)
The Structure of Quantitative Index for Categorical Variables’Agreement Evaluation based on Correspondence Analysis
An Shengli,Zhang Hailan(DepartmentofBio-Statistics,SchoolofPublicHealthandTropicalMedicine,SouthernMedicalUniversity(510515),Guangzhou)
ObjectiveCorrespondence analysis(CA)can be applied to the consistency evaluation of clinical diagnosis trials.It is expected to build quantitative indexes for agreementevaluation system w ith correspondence analysis to improve its objectivity.MethodsFirst,the distance matrix is constructed according to the specific algorithm of CA.Then,referring to the principle of kappa,the quantitative indexes(CBD and CCBD)were built.The reliability and utility of the quantitative indexes were tested w ith the simulative data under different situation and some examples.ResultsFor two evaluated methods,positive correlations existamong kappa,CBD and concordance rate.In the casew ithmore than 3 evaluatedmethods,CBD and CCBD are proportional to kappa and fleiss kappa coefficient respectively.As for the data in which kappa paradox exists,the stability of CBD is better compared w ith kappa.In addition,the conclusions drawn by the correspondence analysis diagrams are the same as thatof CBD or CCBD.ConclusionThe quantitative indexes of consistency evaluation builtby CA is objective and reliable,and it is of important significance both in theory and in practice to the consistency evaluation in clinical research.
Correspondence analysis;Consistency evaluation;Quantitative indexes
*:南方医科大学公共卫生与热带医学学院院长基金(GW201421)
△通信作者:安胜利,E-mail:ASL0418@126.com