各版医学统计学教材存在异议之刍议*

2017-01-10 03:46:46滨州医学院公共卫生与管理学院264003胡乃宝孙红卫刘海霞
中国卫生统计 2016年6期
关键词:人民卫生出版社定量线性

滨州医学院公共卫生与管理学院(264003) 胡乃宝 王 玖 孙红卫 刘海霞

各版医学统计学教材存在异议之刍议*

滨州医学院公共卫生与管理学院(264003) 胡乃宝 王 玖 孙红卫 刘海霞

教材是知识的载体,是教师传授知识的范本,具有理论性、知识性和规范性等的特点,其不同于一般的读物,应精益求精、一丝不苟。一句之差,一字之差,甚至一个标点的谬误,往往失之千里[1]。

医学统计学是医学院校医学教育过程中的一门重要的专业基础课程,卫生统计学是预防医学专业的主干课程,两门课程都是应用概率论与数理统计的原理和方法研究各自领域内的数据收集、整理和分析的应用科学。卫生/医学统计学课程是医学教育过程中的一门工具课程,特别在科研工作中发挥重要作用。《医学统计学》(人民卫生出版社,第6版)[2]、《卫生统计学》(人民卫生出版社,第7版)[3]应该是应用最为广泛的两本教材,前者适用于基础、临床、口腔医学类专业,后者为预防、卫生管理类专业用。然而,近几年随着出书热潮的不断走高,教育改革的不断深化,不同出版社都在争先出版统计学类教材,其中包括人民卫生出版社、高等教育出版社、科学出版社和中国统计出版社等。现在的教材在印刷质量上有很大程度的提高,可读性增强,且在外观上、排版上都有了长足进步,在形式上也是各有特色。如《卫生统计学》(人民卫生出版社)注重了实用性与挑战性,从第5版开始,在每一章增设一节“案例讨论”,学生学习到的统计学知识有了实战的机会;从第6版开始设置了“中英文结果报告”,规范科研工作者及学生撰写统计报告;第7版则分别强化了统计学的模块意识、研究设计和样本含量估算的地位。《医学统计学》(科学出版社)[4]在每章增设了名人名言,增加了人文气息,给予读者激励和警戒。各版案例版《医学统计学》[4-5]将典型科研正反案例融入各章知识点之中,采用错误案例(或正常案例)→问题→分析→基本概念→实际科研案例→正确分析方法→知识点→思考练习模式,强调了以学生为主体、以教师为主导的教育教学理念,改变了传统教学活动中“教”与“学”分离的现象。《统计分析在医学课题中的应用》[6]则以统计分析在医学课题中的应用为主旋律,从解决问题角度撰写,一切从实际出发,易学、易懂、易用。《医学统计学——运用三型理论分析定量与定性资料》[7]将解决与统计学相关问题的思维过程和技术方法概括为统计学三型理论,透过事物的现象看清本质,用正确的统计学思想指导统计方法的应用选择。另外,还有不同学年制的《医学统计学》教材[8-13],可谓是百花齐放,竞相争辉。

但是,纵观各种版本的教材,不难发现其中也有不尽人意的地方,笔者在使用过程中,发现一些值得推敲的问题,这些问题可能会给教师授课及学生自学带来一定的不便,兹将各版本教材中存在异议的一些问题分述如下。

教材知识点的准确性

1.统计资料类型的转化问题

识别资料的类型非常重要,因为不同类型的资料需要不同的统计学方法去分析。各版教材给出的分类方法基本有两种:一是分为定量资料与定性资料,定性资料又分为分类变量(名义变量)与有序变量(等级变量);第二种分类方法分为计量资料和计数资料两大类。可以看出两种分类方法略有不同,但是实质是一致的。但是在资料类型转化的问题上产生了分歧。一种观点是资料只能由“高级”向“低级”转化:定量→有序→分类→二值,不能作相反方向的转化;另一种观点是,根据分析需要,定量资料、分类资料和等级资料可以相互转化。上述两种观点存在矛盾,教学过程中经常有学生参考其他书籍后提出疑问。观点“资料只能由‘高级’向‘低级’转化”容易理解。如例:测量一组20~40岁成年人的收缩压值。然后定义<8kPa为低血压,8kPa~定义为正常血压,12kPa~定义为轻度高血压,15kPa~定义为中度高血压,>17kPa定义为重度高血压,分别清点各组的人数。另外,可以将8kPa~12kPa定义为正常血压,其他则定义为异常血压,同时也清点人数。本例就是资料由“高级”向“低级”转化的过程。血压值是定量资料,可以通过分类赋值转化为等级资料(低血压、正常血压、轻度低血压、中度低血压和重度低血压),进一步“丢失信息量”就转化为了二分类变量(正常血压和异常血压)。但是由于“信息量已经丢失”,二分类变量不能转化为等级资料,等级资料无法转化为定量资料。

观点“根据分析需要,定量资料、分类资料和等级资料可以相互转化”一方面是定量变量向定性变量转化,与上述观点相同。另一方面是定性资料转化为定量资料,则不好理解。综合各类教材观点可以通过此例阐述:“调查某市各小区老年男性的失眠情况,具体为失眠、不失眠两个分类,分别清点人数,则该资料为定性资料(二分类资料),在此基础上,可以计算小区的失眠患病率,每个小区的患病率(数值)就构成了定量资料,即实现了定性资料向定量资料的转化。”但是仔细琢磨后会发现问题,“失眠与否是二分类资料”是个体层面的,“失眠患病率是定量资料”是群体层面的。两类变量所依赖的对象不处于同一水平,在老年男性个体水平上则根本无法实现资料从“低级”向“高级”转化。所以,“根据需要资料间可以相互转化”的观点是片面的。

2.置信区间与置信带的涵义

置信区间与置信带都属于统计推断的范畴,前者是估计总体参数的所在取值范围,后者是估计总体回归直线所在的“空间范围”,置信区间与置信带的含义基本类似。以总体均数95%置信区间为例,各版教材给出的涵义是“该区间包含总体均数的可能性为95%”,而不能表述为“总体均数在该区间的概率是95%”。总体均数是“静止不变”的恒量,而置信区间是由样本统计量计算得到的,是“动态变化”的变量,涵义“该区间包含总体均数的可能性为95%”就很好地强调了总体均数的“静”与置信区间的“动”。但是对于置信带的涵义则存在异议。以总体回归直线95%置信带为例,有的版本教材给出的涵义是“在满足线性回归的假设条件下,可以认为总体回归直线落在两条弧形曲线所形成的区带内,置信度是95%”。参考置信区间涵义,笔者认为此涵义不妥,应该表述为“在满足线性回归的假设条件下,该弧形带包含总体回归直线的可能性是95%”,以体现总体回归直线的“静”与置信带的“动”。

3.寿命表法与KM法生存曲线的不同

寿命表法(life table method)和KM法(Kaplan-Meiermethod/product-limitmethod)是生存分析中估计生存率的两种非参数方法。两种方法的思想存在一定差异,但是在个别教材中两种方法得到的生存曲线却基本相同,都呈阶梯状。笔者在教学过程中碰到学生提出异议,在此加以讨论。

寿命表法是分析分组生存资料的经典方法,用定群寿命表的思想计算生存率。该方法估计的是每个组段右侧端点的生存率,研究对象是在组段内陆续死亡的,而组段内生存率的变化规律未知,所以寿命表法生存曲线用折线连接,表现出来是折线图。KM法则将寿命表法中的时间组段取极限(limit),计算的是所有死亡时间点的生存率,即研究对象是在时间点的“一瞬间”死亡,所以生存曲线表现为生存率垂直下降,而两个相邻死亡时间点之间的生存率都等于前一个死亡时间点的生存率,所以其生存曲线水平连接,表现为阶梯状曲线。基于此,笔者认为为了区分两种方法思想的不同,各自的生存曲线也应不同。

4.教材存在的“低级失误”

随着教材版本的不断更新,知识点越来越贴近当前科技前沿,但是也必须看到,教材的“低级失误”并不是随着版本的更新越来越少。“低级失误”具体可有如下表现:①改版过程中,编者更新了例题,但在叙述方法思想或过程中的统计量(自由度、临界值)没有更换,表现为“换汤忘记换药”;②数字的笔误;③个别编委贪图省时省力,盲目地相信其他版本教材,没有仔细考证每个知识点的准确性,一味地“复制粘贴”。

学术名词的选用

专家在教材编写过程中,都会对专业名词进行反复细致推敲,但由于客观原因,一些名词使用仍然存在异议,一定程度上影响了学生学习和教师讲授效果。诚然某些专业名词难以绝对统一,个别也非原则问题,但笔者认为有必要提出来进行讨论,以取得尽可能大的共识。

1.多重线性回归与多元线性回归的区分

国内很多教材将多重线性回归分析与多元线性回归分析不加区分,但是从他们的英文出处来看两者存在区别(多重线性回归英文为multiple regression,而多元线性回归英文为multivariate regression)[14]。笔者在教学工作中便多次碰到学生问此问题。线性回归法分析是研究一个变量或多个变量(即反应变量。定量变量,满足线性回归条件时,下同)与另外一个变量或多个变量(即自变量)的数量依存关系,目的在于根据模型对反应变量进行因素分析、趋势预测及误差分析等。按照回归分析研究变量(反应变量、自变量)多少,线性回归分析大体包括:简单线性回归、多重线性回归和多元线性回归,变量个数与回归名称的关系表1。

表1 变量个数与相关、回归类型

在日常应用中,很多人将多重线性回归与多元线性回归的概念混淆,张冠李戴,包括国内很多权威的医学/卫生统计学教科书,将多重线性回归分析误称为多元线性回归分析。虽然个别教材已经“约定俗成”,在使用时也不会出现误用,但是本着精益求精的治学态度,笔者建议全国科学技术名词审定委员会能给出明确定义,以供编者参考。

2.名词log-rank test的翻译

受中国近代自然科学发展落后影响,当前大学阶段所学习的自然科学领域知识大都是欧美国家科学家提出的。在教材名词翻译过程中,有的翻译探骊得珠、浑然天成,令人拍案叫绝,但也有的翻译张冠李戴、文不对题,令人莫名其妙。

国内很多专著、文献将log-rank test译为“对数-秩检验”,但是从方法的原理来考察,该方法跟对数没有任何联系,其基本思想是:“按照生存时间大小排序,在H0成立的条件下,根据每个时间点的死亡率计算出该时间点上各组的理论死亡数,将所有时间点各组的理论死亡数累加,便得到各组的理论死亡总数;将理论死亡总数和实际死亡总数比较,得到log-rank test的检验统计量。”可见,该方法跟“对数”没有任何关系;同时,该方法也没有编制秩次,跟“秩”也没关,那么翻译成“对数-秩检验”是毫无道理的。logrank字面意思应该为:“将生存时间排序(rank),然后将死亡事件记录到时间轴上,形成日志(log)”。所以有的教材将该方法翻译为“时序检验”。但是不管怎么翻译,总有一种意犹未尽之感,难以完全表达原作者命名的初衷。

笔者认为,在名词翻译过程中,如果找到合适汉语表达最好。若难以找到合适的翻译语言,不妨不用翻译,直接用英文名字表达,如t检验,log-rank检验,或者用发现者或提出者的名词代替,如Cox回归、Kruskal-Wallis H检验等。

3.同义不同词现象

虽然出版社一般都要求编者参考由全国科学技术名词审定委员会出版的学术名词,但是名字表中有很多名词出现同义不同词现象,这样就使不同编者在选用名词时会出现前后章节不一致的现象,对专家学者来讲可能毫无影响,但是对于初学者而言就是很大的麻烦。

下面列举一些各版教材中使用各异,有的甚至在同一版教材前后不一致的名词。资料类型的“定量资料”和“计量资料”,“定性资料”和“计数资料”,“分类变量”和“名义变量”以及“等级资料”和“有序资料”;参数估计的“可信区间”和“置信区间”;常用实验设计方案的“随机区组设计”、“单位组设计”和“配伍组设计”;线性回归的“决定系数”、“确定系数”、和“可决系数”;相对数中的“构成比”和“频率分布”;生存分析中的“截尾数据”和“删失数据”,等。虽然多数名词“约定俗成”并非原则问题,但是仍不免有“伪创新”之嫌。随着学科的发展,某些名词确已陈旧过时的,应予摒弃;如果熟用已久,而且在其他课程教材中也普遍使用,则大可不必“改名”,以免人为增加学生学业负担。在编写过程中,可以将必要的同义词列出或在括号中说明,但多少要适度,主次位置要准确。

教材知识的先进性

教材内容除了要注重基础性之外,还要强调学科前沿探索性。基础理论具有相对的稳定性,因此高校教材通常更注重“三基”(基本理论、基本知识和基本技能)内容的价值。但是,高校教材毕竟是大学生的教材,也有必要包括学科最为前沿的方法理论,甚至有必要包括各派观点的争论,以拓宽学生视野,培养批判性思维能力。

卫生/医学统计学是医学教育过程中的一门工具课程,是专业基础课程,教材的内容一般都是经典的统计学理论与方法。但是近年来,伴随着遗传统计、多水平模型、结构方程模型、健康量表等新的统计理论与方法的不断涌现,现有的“三基”难以完全满足医学科研对统计学的需求。笔者认为,教材的编写在做“减法”的同时,也可做一些“加法”,适当体现统计学前沿发展,不为增加教师授课负担或学生的学习负担,只为学生知其存在、知其用途,用到的时候能自学,解决眼前问题。同时,统计学教材也要注重于相关课程(如流行病学、循证医学)的知识衔接,以便学生在今后的学习中能纵向连接、横向联系,学以致用。

[1]王东,李笑岩,刘桂香,等.各版《组织学与胚胎学》教材中的瑕疵引起的思考.西北医学教育,2009,17(4):737-740.

[2]李康,贺佳.医学统计学.第6版.北京:人民卫生出版社,2013.

[3]方积乾.卫生统计学.第7版.北京:人民卫生出版社,2012.

[4]罗家洪,薛茜.医学统计学.北京:科学出版社,2008.

[5]罗家洪,郭秀花.医学统计学.第2版.北京:科学出版社,2011.

[6]蒋知俭.统计分析在医学课题中的应用.北京:人民卫生出版社,2008.

[7]胡良平.医学统计学——运用三型理论分析定量与定性资料.北京:人民军医出版社,2009.

[8]方积乾.生物医学研究的统计方法.北京:高等教育出版社,2012.

[9]孙振球,徐勇勇.医学统计学.第4版.北京:人民卫生出版社,2014.

[10]马斌荣.医学统计学.第5版.北京:人民卫生出版社,2011.

[11]颜虹.医学统计学.第2版.北京:人民卫生出版社,2010.

[12]颜虹,徐勇勇.医学统计学.第3版.北京:人民卫生出版社,2015.

[13]徐勇勇.医学统计学.第3版.北京:高等教育出版社,2014.

[14]陈峰.医用多元统计分析方法.北京:中国统计出版社,2000.

(责任编辑:郭海强)

山东省研究生教育创新计划资助项目(SDYY11100);滨州医学院课程与教学方法改革研究立项项目(JYKT201258)

猜你喜欢
人民卫生出版社定量线性
渐近线性Klein-Gordon-Maxwell系统正解的存在性
线性回归方程的求解与应用
显微定量法鉴别林下山参和园参
人民卫生出版社
人民卫生出版社
人民卫生出版社
人民卫生出版社
当归和欧当归的定性与定量鉴别
中成药(2018年12期)2018-12-29 12:25:44
二阶线性微分方程的解法
10 种中药制剂中柴胡的定量测定
中成药(2017年6期)2017-06-13 07:30:35