贾冕 赵进喜 皇甫伟
100700 北京中医药大学第一临床医学院(贾冕);北京中医药大学东直门医院中医内科教研室(赵进喜);北京科技大学计算机与通信工程学院(皇甫伟);北京体育大学博士流动站(贾冕)
·论著·
基于中医证候学的糖尿病肾病患者肾小球滤过率评估方法的探索
贾冕赵进喜皇甫伟
100700北京中医药大学第一临床医学院(贾冕);北京中医药大学东直门医院中医内科教研室(赵进喜);北京科技大学计算机与通信工程学院(皇甫伟);北京体育大学博士流动站(贾冕)
【摘要】目的探索糖尿病肾病患者基于中医证候学评估肾小球滤过率(glomerular filtration rate,GFR)的可能性及其方法。方法基于“十一五”国家科技支撑计划《中医全程干预糖尿病肾病进程综合方案研究》的1872例研究数据,采用散点图矩阵、安德鲁斯曲线分析、平行坐标图等计算机可视化技术,探求GFR与性别、年龄、身高、体重,以及气虚、血虚、阴虚、阳虚、血瘀、湿浊、痰湿的中医证候积分等11个因素间的关系。将病例分为1400例的组1和472例的组2。基于组1的数据,使用两种方法进行GFR的估算:(1)对11个因素进行线性回归,并根据回归结果进行GFR估算。(2)以病例为单位,纳入11个因素,使用组1病例建立数据库,使用K最邻近结点算法(k-nearest neighbor,KNN),进行GFR估算。基于组2的数据,采用散点图、偏差分析、Bland-Altman作图法及ROC曲线进行验证一致性评价。结果(1)GFR与性别、年龄、身高、体重以及7个中医证候等因素之间存在特定联系。(2)散点图显示,KNN法分布于±30%范围内的点较之回归方程明显增多。两种评估方法偏差的30%符合率均达到50%以上。回归方程和KNN法偏差的30%符合率分别达到58.1%和69.3%。Bland-Altman作图显示,KNN法估算结果的偏差分布较为均匀,数据相对集中,波动范围小于回归方程估算值。用于诊断肾功能不全时,KNN法的ROC曲线下面积达到0.847。结论基于中医证候学对糖尿病肾病患者的GFR进行评估是可行的。KNN法效果优于回归法,在数据量足够大时,更有利于中医证候学的研究。
【关键词】糖尿病肾病;肾小球滤过率;中医证候;评估;K最邻近结点
糖尿病肾病(diabetic nephropathy,DN)作为一种糖尿病最主要的微血管并发症,是导致肾功能衰竭的主要原因之一。中医药在治疗DN方面有其独特优势,越来越多的学者着力于研究DN的中医诊疗方法,取得了一定进展。肾小球滤过率(glomerular filtration rate,GFR)是评价肾功能的重要指标,准确了解GFR,对糖尿病肾病的早期诊断、早期治疗以及病情监测有着重要的作用。肾小球滤过率难以直接测量,目前多以血肌酐、胱抑素C等指标进行估算,也没有针对中国糖尿病肾病患者的适用的估算公式。许多研究表明,糖尿病肾病的中医证候积分与部分现代医学指标有着密切的联系。挖掘中医证候学与肾功能指标之间的联系,尝试建立一种基于中医证候学的糖尿病肾病肾功能评价方式,不仅可以更为便捷地评价肾功能,还可以与中医疗效评价体系有机结合,探求中医药治疗糖尿病肾病的原理,进而指导临床诊疗。本研究基于“十一五”国家科技支撑计划《中医全程干预糖尿病肾病进程综合方案研究》,尝试基于中医证候评分的GFR评估方法的探索,经验证适用性较好,报道如下。
1对象与方法
1.1研究对象
本研究病例来源于由北京中医药大学东直门医院牵头的国家科技部“十一五”科技支撑计划项目:《中医全程干预糖尿病肾病综合方案研究》(项目编号:2006BAI04A03-2,简称“十一五”研究),2008年1月至2009年12月就诊于北京中医药大学东直门医院、中国中医科学院望京医院、天津中医药大学第一附属医院、北京大学第一医院、浙江省杭州市红十字会医院、河北省中医院、广州中医药大学第二附属医院等10个参研单位的住院及门诊患者。
1.2诊断标准
糖尿病诊断采用世界卫生组织1999年提出的诊断标准,糖尿病肾病依据2010年版《中国2型糖尿病防治指南》进行诊断及分期[1]。中医证候诊断标准参考1992年中华中医药学会糖尿病分会的《消渴病辨证诊断参考标准》[2]以及1987年中华中医药学会内科肾病专业委员会慢性肾衰中医辨证分型诊断专题讨论会通过的标准[3]。
1.3纳入标准
(1)明确诊断的糖尿病肾病III期、IV期患者,年龄18~70岁,性别不限;(2)血肌酐在3个月内稳定在265 μmol/L以下;(3)血糖平稳,糖化血红蛋白7.5%以下,舒张压90 mmHg以下;(4)中医辨证具备本虚(气虚、阴虚、阳虚、血虚)表现,或兼血瘀、湿浊、痰湿者。
1.4排除标准
(1)难治性水肿;(2)尿蛋白大于10 g/24h,血清白蛋白低于25 g/L;(3)肾性高血压,合并充血性心衰I-IV级,癌症、妊娠及对治疗方案药物过敏者;(4)六个月内有糖尿病酮症酸中毒、心肌梗塞、恶性高血压、脑血管意外等危急重症病史者。
1.5本研究病例选取方法
“十一五”研究纳入病例320例,以3个月为周期对患者进行了平均19个月的访视,监测中医证候积分及相关指标。本研究以诊次为单位,选择中医证候评分及实验室检验资料完整的病例资料,共计9次访视,1872例数据资料,其中男性1162人,女性710人,平均年龄(59.59±8.623)岁,平均身高(165.66±7.65) cm,平均体重(70.87±11.51) kg,平均BMI值(25.79±3.68) kg/m2。中医证候总积分平均21.83分,其中气虚4.9分,阴虚3.63分,阳虚5.66分,痰湿3.05分,血瘀1.54分,血虚1.32分,湿浊1.74分。GFR平均79.21 mL/(min·1.73 m2)。
1.6病例分组资料
将纳入病例按照3∶1的比例分为两组:将原始随机编号的顺序,按照“1、1、1、2”的顺序依次重新编号,新编号“1”和“2”分别为组1和组2。经计算,两组当为1404例和468例。为方便计算,取组1为1400例,组2为472例。
1.7研究方法
(1)评估方法的建立:使用中国改良简化MDRD公式估算肾小球滤过率[4]。按分组选择病例。基于组1的数据,使用多元线性回归建立基于中医证候积分的估算公式;使用Scipy科学计算库的spatial.kdtree模块,将病例数据中的肾小球滤过率、性别、年龄、身高、体重和气虚、血虚、阴虚、阳虚、痰湿、湿浊、血瘀等7个中医证候等信息,以每个病例为单位,进行数据库的建立。(2)新建方法的验证:基于组2的病例,利用新建数据库,采用K最邻近结点算法(k-nearest neighbor algorithm,KNN,简称“最近邻”),对肾小球滤过率进行评估,并使用新建立的公式对肾小球滤过率进行估算。采用散点图、偏差分析、Bland-Altman作图法及ROC曲线等方法,对两种评估方法进行适用性评价。
1.8统计方法
2结果
2.1病例分组基线比较
对两组病例的数据进行正态检验,两组eGFR均服从正态分布,F=1.934,具有方差齐性,组间比较采用独立样本t检验。其余各项指标均不服从正态分布,采用非参数检验进行两组间比较。两组eGFR中国、性别、年龄、肌酐、尿素氮及中医证候积分的组间比较显示,两组基线水平相似,不具有统计学差异(P>0.05)。
2.2各因素与肾小球滤过率之间的关系
2.2.1各因素的散点图矩阵分析绘制各因素的散点图矩阵,见图1。由图可以看出:(1)肾小球滤过率与肌酐关系密切;(2)肾小球滤过率与年龄呈负相关,即随年龄增长,肾小球滤过率下降;(3)肾小球滤过率与身高、体重和血虚、阴虚关系不明显;(4)中医证候湿浊、痰湿、血瘀、阳虚和气虚在最右一列图上呈现上尖下宽的“三角形”图形。
2.2.2平行坐标图绘制平行坐标系下的调和曲线图,见图2。图中每条曲线代表1个病例的数据,依肾小球滤过率的值赋予不同颜色,按其值从小到大,颜色由红到绿的规律演变。由图可见:(1)肾小球滤过率与肌酐呈现负相关;(2)GFR与年龄有负相关倾向;(3)中医证候积分与肾小球滤过率的曲线分布关系不显著;(4)趋近于绿色的曲线向中医证候积分的上半部分集中,即GFR值较大的病例,中医证候积分分值较小。
2.2.3安德鲁斯曲线分析对肾小球滤过率、性别、年龄、身高、体重及气虚、血虚、阴虚、阳虚、痰湿、湿浊、血瘀等7个中医证素,共计12个因素的相互关系进行降低维度的可视化处理,绘制安德鲁斯曲线(Andrews curve),见图3。图中每一条曲线代表1个病例,坐标数值没有实际意义。由图可以看出,曲线并非杂乱无章,大部分曲线构成了3峰2谷的类“W”型曲线。
2.3线性回归方程
基于组1数据,将性别赋值“男1女2”,使用性别、年龄、身高、体重、气虚、血瘀、阴虚、阳虚、血虚、痰湿、湿浊等11个因素进行线性回归。回归模型:eGFR=a1×p1+a2×p2+…+an×pn。其中,a为系数,p为如上12个参数,n取值1~12。
回归结果:模型拟合的可决系数调整R2=0.155,方差分析显示,P<0.01,模型是显著的,但拟合优度欠佳。回归方程1:eGFR1=304.192-3.568×性别-1.049×年龄-0.980×身高 +0.214×体重-0.265×气虚 -0.313×血瘀 -0.152×阴虚 -1.064×阳虚 -0.934×血虚 +0.360×痰湿 -0.677×湿浊。
图1 与肾小球滤过率相关的各因素散点图矩阵
图2 与肾小球滤过率相关的各因素平行坐标图
图3 与肾小球滤过率相关的各因素安德鲁斯曲线图
由回归方程可见,性别、年龄、身高、阳虚、血虚、湿浊的系数相对较大,对GFR值影响相对较大。回归结果见表1。
表1 回归系数及检验结果
2.4建立“K最邻近结点算法”样本库(KNN样本库)
(1)基于组1的数据,纳入性别、年龄、身高、体重、气虚、血瘀、阴虚、阳虚、血虚、痰湿、湿浊共11个因素,作为训练数据进行存储。
(2)设定k值,本研究取k=5计算。
(3)距离计算法
在11个因素构建的11维样本空间中,任取1点,该点与周围n个点的直线距离分别为d1,d2,…,dn。则计该点与周围n个点的距离为
(4)估算方法
在样本空间中,分别计算待测样本与样本库中11个维度的原始样本之间的距离,得到距离d1,d2,…,dn,比较d1~dn,取最小的k个样本(本研究k=5),其对应的样本库中的原始样本,即为选定的样本。选定样本的肾小球滤过率的算术平均值,即为待测样本的估算值。
2.5新建评估方法的适用性评价
基于组2的472例数据,分别运用回归方程和KNN样本库估算肾小球滤过率,与原值进行对比评价。
2.5.1散点图分析分别以原肾小球滤过率为x轴,新建方法计算的值为y轴,绘制散点图(图4和图5)。由图可见,回归方程的散点分布略呈“水平分布”的状态。KNN法的估算值呈现45°倾斜的趋势,且分布于±30%范围内的点较之回归方程明显增多。
图4 回归方程的散点图
图5 “最近邻”法的散点图
2.5.2偏差比较分别计算回归方程和KNN法估算结果的偏差,偏差=估算值-金标准,偏离百分数=[(估算值-金标准)的绝对值/金标准]×100%。15%、30%、50%符合率=估算值落在金标准±15%、±30%、±50%的病例百分数[5],详见表2。由表可知,两种评估方法30%符合率均达到50%以上,评估效果较好。KNN法优于回归方程,其30%符合率接近70%。
表2 回归方程和KNN的偏差对比
2.5.3Bland-Altman分析绘制Bland-Altman图,添加均值、均值±1.96标准差的参考线,见图6和图7。由图可知,KNN法估算结果的偏差分布较为均匀,数据相对集中。回归方程的偏差有较为明显的线性呈现。KNN法偏差的波动范围小于回归方程估算值。
图6 以中国公式为金标准的回归方程的Bland-Altmon图
图7 以中国公式为金标准的“最近邻”法的Bland-Altman图
2.5.4诊断效能以GFR<60 mL/(min·1.73 m2)作为节点,以原肾小球滤过率的值为金标准,使用ROC曲线分析进行诊断效能的评价。结果见表3、图8和图9。
表3 验证公式的ROC曲线分析
图8 回归方程的ROC曲线分析
图9 “最近邻”法的ROC曲线分析
3讨论
本研究为基于中医证候学的糖尿病肾病肾小球滤过率评估方法的建立和验证,其关键点在于探求肾小球滤过率与中医证候之间的关系,并用恰当的方法予以表示。既往公式的建立多以统计学为基础,通过分析其间的相关性。随着科技的发展,计算机技术在众多领域被广泛应用,基于计算机技术的一些新方法也可以在医学领域施展本领,或许将成为未来的发展方向。
3.1多维空间的可视化处理技术
现在可以理解并直观感受到的仅限于三维以下的空间,当自变量增加到4个甚至更多时,很难想象多条相互垂直的线决定的多维空间的具体形象。随着计算机技术的发展,更多的新方法可以用来寻找变量之间的关系。科学计算可视化技术,可以将各种数据进行转化,成为直观的,能够以图形呈现的信息。常见的有散点矩阵技术、平行坐标可视化技术、安德鲁斯曲线技术、格架图、测量图、放射性可视化技术等。将这些方法运用于医学领域,探索一些重要但难以测量的指标与其他易测量指标之间的关系,利于探索人体机能的奥秘。本研究中利用前三种技术对数据进行处理,可以较为直观地看到数据间的联系。
散点矩阵通过绘制n个因素的n2个散点图,展现每两个因素之间的关系。本研究中的散点图矩阵显示出肌酐与肾小球滤过率呈非直线的线性关系;年龄与GFR有斜率为负值的线性趋势。中医证候积分与肾小球滤过率之间虽并没有明显的线性关系,但其“三角形”的图形特性提示其对肾小球滤过率的取值存在限制作用:当单个证候积分取值很小时(位于“三角形”尖端),肾小球滤过率取值不会大,即有一定的“最大界限”。因此,当使用多个证候综合评价时,可以较为准确地限制肾小球滤过率的取值范围。平行坐标法相较于安德鲁斯曲线的空间旋转和运算更为便捷。它采用一系列平行的坐标,每个坐标有其独立的量值标准,将高维度空间的 “扭曲的线”(或称点集),分别在平行的各个坐标上予以标注,并连接成线。这样,就将高维空间的“扭曲的线”以平面上的折线的形式展现了出来。直接绘制的平行坐标图是由直线构成的,因其拐点可能重合,不易观察,可将其调整为曲线联结,并根据值的大小予以不同色彩的设定,有利于直观的发现因素之间的联系。安德鲁斯曲线技术可以简单理解为,将存在于多维空间的“扭曲的线”进行扭转,寻找某个角度,将其投射在仅有x轴和y轴的平面上。本研究中的安德鲁斯曲线,即是肾小球滤过率与11个自变量间相互关系的曲线的展现,每个数据绘制一条线,1872个数据共同表现出三峰两谷的类“W”形平滑的曲线,提示肾小球滤过率与11个自变量间的确存在一定的内在联系,当数据样本足够充足,能够更为准确地确定相互间的关联,使基于“大数据”的处理技术,从中医证候学角度评估GFR成为可能。
3.2K最邻近结点算法
KNN法属于大数据应用的一种。与前几种图像法不同,这种方法不能直观看到数据之间的关系,但可以得到估算的数值,其基本要求是建立足够大量的样本库。当需要估测某个因变量时,通过该指标的自变量的信息,在样本库中筛选k个最近距离的样本,对样本库中这k个样本对应的已有因变量的值进行平均,即为估测值。这种算法类似于将相关因素画圆圈起来,再找圆心的过程。该方法的优点在于,所有估测出来的因变量的值均由原始样本库的值平均得到,因此,其范围不会波动过大,即偏差值过大。这就避免了所有基于统计学方法得到的计算公式的弊端:利用一定范围数据建立的公式,在超过数据范围后,往往偏差巨大。比如本研究中1例肌酐为6.2 umol/L的病例,通过中国公式计算得到eGFR>800 mL/(min·1.73 m2),与实际完全不符,因此予以剔除。同样,这些偏离较远的点在公式推导过程中,往往起到了不小的作用,使线的走向发生明显偏移。KNN法可以有效避免这种情况的发生,因其选择的是“最小距离”。
KNN法虽有诸多便利,但其关键因素——k值的确定却不十分容易,不同的k值结果不同。当样本库足够大时,k值越大,准确性越高,但运算量呈指数倍增加。确定k值一般需要进行测试,由小到大取不同k值进行部分数据的运算,将其与标准进行对比,选择与标准最接近的k值。本研究中,因样本库存在11个维度的信息,仅有1400个数据,因此仅进行了少量运算,暂定结果较好的k=5作为标准,以尝试这种方法的可行性。研究结果表明,KNN法的估算明显优于回归方程的计算,这证明了KNN法在中医药领域应用的可能性。
3.3新建评估方法的评价
回归方程的散点图呈现“水平分布”,结合Bland-Altman图分析,其原因在于估算结果在肾小球滤过率较低时高估了真实值,而在肾小球滤过率较高时低估了真实值,随着肾小球滤过率值的降低或升高,偏差逐渐增大。偏差分析显示,其30%符合度接近60%,相较于一般估算公式效果尚佳。以肾小球滤过率<60 mL/(min·1.73 m2)作为节点诊断肾功能不全时,回归方程诊断的灵敏性一般,特异度较低,ROC曲线下仅有0.680,诊断效力不高。 KNN法的散点图呈45°倾斜趋势提示估算值与“金标准”符合度高,分布与±30%范围内的点较之回归曲线明显增多,Bland-Altman图也显示其偏差波动范围相对较小,且数据更为集中,其偏差的30%接近70%,说明该法用于估算肾小球滤过率效果良好。同时,用于诊断肾功能不全时,灵敏度和特异度均>0.75,ROC曲线下面积达到0.847,提示KNN法对肾功能不全具有较高的诊断效能。综合评价两种基于中医证候积分的肾小球滤过率评估方法,二者的估测值与中国改良简化MDRD公式计算的肾小球滤过率的值一致性较好,用于评估肾小球滤过率值都是可行的。比较而言,KNN法在准确性及诊断效能上,均明显优于回归方程。
4小结
本研究以中国改良简化MDRD公式估算的肾小球滤过率值为“金标准”,基于组1数据,使用回归分析和KNN两种方法进行中医证候学积分与肾小球滤过率之间关联的探索,并在组2中进行了验证。从以上数据中,可以得到一些结论:(1)基于中医证候学的肾小球滤过率评估方法的建立是切实可行的。(2)当数据量足够大时,KNN法进行估算效果明显优于回归方法。这提示,随着“大数据”时代的到来,中医或是医学界采纳更为广泛的科技手段,积累并存储、运用大量数据,或许将成为未来医学发展的方向。(3)从本研究结果来看,既然中医的7个证候与肾小球滤过率有密切的吻合度,也就证明了中医证候与各实验室指标之间可能存在着多种联系,蕴藏了大量信息。探索中医证候学与疾病主要疗效指标之间蕴藏的信息,为从中医学角度评价病情,或是选择适宜的治则治法提供了重要的参考依据。
因条件限制,本研究仅能使用现有的中国改良简化MDRD公式的估算值作为“金标准”进行探索。如能够将以普遍认可的肾动态显像等方法测得的肾小球滤过率值作为金标准,并将相应的病例信息一同纳入数据库,在汇集更多数据的基础上,采用KNN法进行肾小球滤过率的评估,或许将优于各种基于统计学的估算公式。
参考文献
[1]中国2型糖尿病防治指南(2010年版)[J]. 中国糖尿病杂志,2012,(1):81-117.
[2]吕仁和,张洁荣,高彦彬.消渴病(糖尿病)中医分型辨证与疗效评定标准[J].中国医药学报,1993,8(3):54-56.
[3]刘宏伟.慢性肾衰中医辨证分型和疗效评定标准-全国中医肾衰研讨会讨论通过[J].中医药信息,1991,8(2):27-28.
[4]全国eGFR课题协作组.MDRD方程在我国慢性肾脏病患者中的改良和评估[J].中华肾脏病杂志,2006,22(10):589-595.
[5]史浩,陈楠,张文,等.简化MDRD公式预测慢性肾病患者肾小球滤过率的应用评价及校正[J].中国实用内科杂志,2006,36(9):665-669.
(本文编辑: 禹佳)
(上接本期第274页)
配伍理论中的“七情”,讨论的是任意两味中药的配伍关系。运用一味药物治病应当不属于配伍范畴。在张廷模教授主编的《临床中药学》教材[15]中,单行的概念为“各药单独取效,互不影响临床疗效,属于两药之间的配伍形式”。本课题组认为,这才是基于配伍理论提出的科学的概念。
4小结
从建国以来的历版中药学教材内容修订情况,可看出中药理论框架中的性能理论、功效理论、配伍理论、采制理论、分类理论等均逐步发展并逐渐趋于完善、科学、合理。下一步的工作是,通过全面搜集、整理中药各种理论的历史、现状,分析其特色、优势和存在的问题,在“继承不泥古,创新不离宗”的原则下,构建能够体现中药内在逻辑和核心内容的理论框架。
[1]凌一揆.中药学讲义[M].成都:四川省成都进修学校,1957:1-175.
[2]长春中医学院编纂委员会.中药学讲义[M].长春:(出版单位佚),1958:1-458.
[3]南京中医学院.中药学概论[M].北京:人民卫生出版社,1958:1-203.
[4]上海中医学院中药学教研组.中药学讲义[M].上海:上海科学技术出版社,1960:1-572.
[5]蒋淼,王家葵,李文.统编第1版中药学教材编写沿革[J].中药与临床,2014,5(1):46-49.
[6]成都中医学院本草教研组.中药学讲义[M].北京:人民卫生出版社,1960:1-418.
[7]成都中医学院.中药学讲义[M].上海:上海科学技术出版社,1964:1-480.
[8]成都中医学院.中药学[M].上海:上海科学技术出版社,1977:1-322.
[9]成都中医学院.中药学[M].上海:上海科学技术出版社,1978.1-378.
[10]凌一揆.中药学[M].上海:上海科学技术出版社,1984:1-322.
[11]雷载权.中药学[M].上海:上海科学技术出版社,1995:1-358.
[12]高学敏.中药学[M].北京:中国中医药出版社,2002:1-635.
[13]神农本草经[M].清·顾观光,辑.兰州:兰州大学出版社, 2009:1-10.
[14]高晓山.中药药性论[M].北京:人民卫生出版社,1992:6-8.
[15]张廷模.临床中药学[M].中国中医药出版社,2004:46-47.
(本文编辑: 蒲晓田)
Exploration of GFR evaluation method in patients with diabetic nephropathy based on the theory of TCM syndrome
JIAMian,ZHAOJin-xi,HUANGFu-Wei.TheFirstClinicalMedicalCollege,BeijingUniversityofChineseMedicine,Beijing100700,China
【Abstract】ObjectiveTo explore the possibility of determining glomerular filtration rate (GFR) in diabetic nephropathy (DN) patients by TCM Syndrome, and the corresponding method. MethodsVisualization technique was applied treating data from previous studies to explore the correlations between GFR and the 11 factors including gender, age, height, weight, and the TCM syndrome score for qi deficiency, blood deficiency, yin deficiency, yang deficiency, blood stasis, dampness, and phlegm dampness syndromes. The patients were divided into 2 groups with 1400 and 472 cases, respectively. 2 methods were demonstrated using group A data to evaluate GFR: (1)Linear regression GFR predictions by the aforementioned 11 factors.(2)K nearest neighbor (KNN) predictions using the group A dataset. The prediction effectiveness was evaluated by comparing the predicted results of group B data to the real ratio, and the evaluation is facilitated by scatter diagram, deviation analysis, Bland-Altman method and ROC curve. Results (1)GFR correlated to gender, age, height, weight and 7 of the TCM syndromes. (2)The scatter diagram shows that, in the range of ±30%, the points of KNN is significantly increased compared with the regression equation. The deviation of 30% coincidence rate of both two kinds of assessment methods have reached more than 50%.The coincidence rate of deviation of 30% of linear regression and KNN method reached 58.1% and 69.3%. Bland-Altman mapping shows that, the deviation of the estimated results of KNN method is more evenly distributed. When the data is more concentrated, the fluctuation rage fell below the estimated value of the regression equation. The area of ROC curve of KNN method had reached 0.847 for the diagnosis of renal insufficiency.ConclusionThe feasibility of predicting GFR by TCM syndromes is validated. The KNN method produces more robust results compared to linear regression. The amount of data may positively relate to a satisfactory TCM syndrome study.
【Key words】Diabetic nephropathy;Glomerular filtration rate;TCM syndrome;Evaluation;K nearest neighbor node
(收稿日期:2015-03-29) 2015-10-08)
Corresponding author:ZHAO Jin-xi,E-mail: zhaojinximd@126.com
【中图分类号】R587.1
【文献标识码】A
doi:10.3969/j.issn.1674-1749.2016.03.006
作者简介:贾冕(1987- ),女,博士,在站博士后。研究方向:中医药防治糖尿病及其并发症。E-mail:592857429@qq.com通讯作者: 赵进喜(1965- ),博士,主任医师,教授,博士生导师。研究方向:内分泌疾病及肾脏病的中医药防治。E-mail:zhaojinximd@126.com
基金项目:国家“十一五”科技支撑计划(2006BAI04A03-2)