陈 芳, 郭春雪, 刘一松, 沈 宁, 胡 完, 杨孟渊, 胡良平△
(1. 中国人民解放军第一医院, 甘肃 兰州 730000; 2. 军事医学科学院生物医学统计学咨询中心, 北京 100850)
在生理学研究中如何正确把握试验设计三要素*
陈 芳1, 郭春雪2, 刘一松2, 沈 宁2, 胡 完2, 杨孟渊2, 胡良平2△
(1. 中国人民解放军第一医院, 甘肃 兰州 730000; 2. 军事医学科学院生物医学统计学咨询中心, 北京 100850)
目的:为从事生理学研究的科研工作者制订科学完善的试验设计方案提供一些有效的技术方法。方法:通过正面阐述三要素和正确把握每个要素的关键点;再通过分析已发表的学术论文中未妥善把握三要素的案例,为生理学研究工作者在制订课题设计方案时能正确把握三要素提供具有可操作性的方法。结果:呈现出试验设计三要素的具体内容,即“受试对象”、“影响因素”和“试验效应”,并且,为如何正确把握每个要素提供具体措施。结论:试验设计的三要素是从事试验研究的“物质基础”,正确把握它们是制订出科学完善试验设计方案的重要环节之一。
生理学;统计学;试验设计;三要素
在开展一项研究之前,研究者需要根据研究目的制定一个完善的试验计划或方案,以保证试验顺利开展,并确保所得结果科学准确。任何一项研究都离不开受试对象、影响因素和试验效应三个方面,故称其为试验设计的三要素。三要素是试验设计的核心和支柱,正确把握三要素也是保证研究结果科学可信的基本条件。三要素看似简单,然而在实际的科研中,在三要素方面出现问题的研究并不少见,如受试对象选取过于随意,无法正确辨别影响因素和重要的非实验因素,效应指标的选取不够客观、灵敏等等。本文基于生理学研究实例,对试验设计的三要素进行详细介绍,并重点阐述正确把握三要素需注意的关键点及常见错误,使研究者对三要素有一个全面、准确的认识和把握,为制定科学合理的试验设计方案奠定基础。
在文献[1]中,研究者为探讨血浆cfDNA水平能否成为反映大鼠过度训练的新监控指标,12只雄性SD大鼠随机分为2组(n=6) :安静组和过度训练组,过度训练组进行5周递增负荷的过度训练,每周运动6 d,运动的最后1天运动至力竭运动后36 h采集静脉血,检测大鼠血浆cfDNA睾酮(T)和皮质酮(Cort)的活性。显然,这是基于一个动物试验研究而撰写的学术论文,其中,SD大鼠就是此试验的“受试对象”、是否让大鼠接受过度训练就是影响因素,而血浆cfDNA睾酮(T) 和皮质酮(Cort)等就是反映试验效应的评价指标。由于在任何一个具体的试验研究中,“受试对象”、“影响因素”和“试验效应”都是不可回避的、缺一不可的,故称其为试验设计的三要素。
2.1 确定种类
2.1.1 要符合敏感性 受试对象对被施加的处理因素应有较高的敏感性,容易显示效应。《番茄红素与葡萄籽提取物联合降血脂作用的研究》[2]中,为了研究番茄红素与葡萄籽提取物降血脂的作用,需要使用高血脂生理过程与人类高血脂生理过程相似的模型动物,根据查询已有的文献发现,大鼠、豚鼠、金黄地鼠这三种动物被施加此提取物后,都很容易产生预期的试验效应。
2.1.2 要符合特异性 受试对象对被施加的处理因素应有较强的特异性,排除非处理因素干扰。文献[2]中的豚鼠、大鼠,都是属于标准化试验动物,可以排除因带病毒、细菌、寄生虫和潜在性疾病对试验结果带来的影响。而且遗传背景清楚,能够排除试验动物杂交、遗传上不均衡、个体差异大、反应不一致对试验结果的影响。这满足了特异性的要求。
2.1.3 要符合稳定性 受试对象对被施加的处理因素的反应有较大的稳定性,减少误差。文献[2]中,对豚鼠施加提取物后进行观察,很容易得到血压降低的反应,且反应很容易辨别,具有较强稳定性。
2.1.4 要符合同质性 研究对象的种属、生物学特性及其他条件保持均衡。文献[2]中,对三种动物的脂代谢生理与病理特点进行研究,发现由于大鼠血浆中HDL是血浆胆固醇的主要载体,而人类的血浆胆固醇的主要载体是LDL,物种差别比较大,而且,大鼠血浆中CETP(胆固醇酯转运蛋白)的活性仅为人类的14%。而豚鼠在血浆脂蛋白构成、胆固醇和脂蛋白代谢及对饮食胆固醇和药物治疗的反应性方面与人类有许多相似之处。基于此,本文中实际选择的豚鼠,更满足同质性的要求。
2.1.5 要符合依从性 受试对象接受处理因素的合作程度。文献[2]中的受试对象豚鼠,是实验室常见的试验对象,试验者熟练掌握对其操作手法,依从性极高。
2.1.6 要符合经济性 受试对象容易找到,费用低[3]。对于[2]来说,虽然原文中最终选择的豚鼠与大鼠比较,成本更高,饲养需花费更多精力。但综合上述几个原则来看,为了试验结果更加科学稳定,与人类相似性大,最终还是选用清洁级豚鼠。不同于上述五条,此项要求不是必要性要求,只是为了尽可能的节约试验成本。
2.2 质量要求
在确定了合适种类的受试对象之后,还必须对其提出质量要求,分别包括纳入标准、排除标准、中止标准、终止标准和剔除标准,仍然以文献[2]为例来说明。
2.2.1 纳入标准 使用成年豚鼠雄鼠:800~1 200 g;雌鼠:700~900 g,满足此要求的豚鼠可以进入试验。
2.2.2 排除标准 体重过重或者过轻,疾病或者残疾,对于此类豚鼠不予选择。
2.2.3 中止标准 豚鼠出现明显的食欲不振,精神萎靡,连续7 d以上,怀疑或者确诊患上豚鼠常见传染性疾病,此类情况出现,则该豚鼠的试验中止;
2.2.4 终止标准 在服用番茄红素、葡萄籽提取物喂养15 d后,即终止试验。
2.2.5 剔除标准 豚鼠在建模期间死亡,豚鼠在实验期间死亡;或者在建模、实验期间受孕,虽已纳入试验模型,但还是要剔除这类对象。
2.3 数量要求
受试对象的数量指的是:(1)在一个具体的生理学试验研究中总共需要多少样本含量;(2)在整个试验研究中需要将受试对象分成若干个小组,更确切的样本含量是指每个小组中的样本数目。样本含量估计是一个比较复杂的问题,需要同时考虑数据分析时的比较类型(如差异性检验、非劣效性检验、等效性检验或优效性检验)、观测指标的性质(定量与定性)、有关的先验知识(如均值和标准差大约为多少)和有关结果精确度(允许估计或分析的结果中犯第Ⅰ类和第Ⅱ类错误的概率大小)这些要求。比较好的做法是根据具体情况、利用相应的计算公式来估算出样本含量。在本刊中,《在生理学研究中如何准确估计样本含量》一文,针对该问题进行了简要概述。文献[2]中给出的样本量,选择数量30只,却没有给出任何样本量的计算和估计的理由和过程,这是不符合科学完善试验设计要求的。
在影响因素中,除了确定的试验因素外,还有其他的因素会对结果产生影响,即非试验因素。例如在文献[4]中,试验因素为细菌脂多糖(LPS)处理,共4个水平;而重要的非试验因素有两个,第一个是细胞培养方法对细胞的影响,第二个是细胞培养环境对细胞的影响。
3.1 如何才能准确选择、合理安排试验因素和非试验因素
在生理学研究中,一定要慎重处置非试验因素。
第一种方法,将重要的定量非试验因素的取值准确地记录下来。例如,研究不同饲料对动物体重增加量的影响,饲料种类是试验因素,而动物进食量是一个很重要的非试验因素,在试验设计阶段难以严格控制,可以在试验中记录每只动物每餐进食量,最后可求出每只动物在整个试验时期内的每餐平均进食量,将来进行数据处理时采用相应设计定量资料的协方差分析方法,从而排除进食量对试验结果的影响。
第二种方法,研究者通过随机分组等方法,尽可能使全部非试验因素或重要的非试验因素在各组中分布均衡。例如[4]中,对于细胞培养液对细胞的影响的处理是,对照组中虽不经LPS处理,但要培养在与处理组同样的培养液中;对于细胞培养环境对细胞的影响,则是需要对照组和试验组在相同且适宜的环境下培养。最大限度控制非试验因素对结果的影响。此类试验设计类型包括, 配对设计、随机区组设计、平衡不完全随机区组设计、含区组因素的析因设计等。
第三种方法,则是恰当地使用多因素分析回归模型来进行分析。在文献[5]中,要研究的试验因素是性别,但人体标本的年龄是一个重要的非试验因素,于是研究者将年龄视为协变量,采用类似“协方差分析模型”处理资料。此种情况下,人们常这样描述:校正了年龄等因素的作用之后,得出某某结论。
3.2 科研工作者在确定试验因素方面常犯的错误
3.2.1 试验因素命名不科学 没有叫出明确的试验因素,笼统的把因素叫做“分组或组别”或是其他简单的归纳名词,将分成的几组当做是该因素的各个水平。事实上,很多人眼中的“组别”实际上是多个非试验因素的“复合物”。此时,对于合理选择统计分析方法是有害无益的。例如在《膀胱癌多药耐受相关蛋白和P53的表达及相关性分析[6]》中,研究者用“组织”作为5个小组的“总称”,并未针对课题的研究目的提炼出“试验因素”,可改成“膀胱粘膜癌变程度”,因素有五个水平。
3.2.2 试验因素数量过多 毫无根据的选择很多试验因素,使试验研究变得十分复杂,往往因为试验条件、人力物力、财力、技术水平和时间都达不到起码的要求,使试验研究半途而废或因安排不当,组间夹杂着某些混杂因素的影响,导致结论可信度低。所以,要尽量按照3.1中的方法,进行合理选择。
3.2.3 将多因素试验拆分为多个单因素试验 将一个多因素试验拆分成多个单因素试验,难以提高试验的广度、深度以及效率,同时所需时间较长,费用也很高[7]。
3.2.4 多因素试验中不考虑因素之间的相互作用 由于研究者试验设计水平贫乏,不会科学地利用多因素试验设计技术,只能将其他试验因素视而不见或固定在各自的特定水平上,每次只让自己关心的某个试验因素取不同的水平,当试验因素之间不独立时,基于这样的试验设计方案指导所获得的结果,即使统计分析方法选择正确,也难免得出错误的结论。
4.1 指标选择原则
4.1.1 指标的针对性 试验效应是通过评价指标来体现的,评价指标是用来反映试验因素作用于受试对象后所产生的试验效应大小的尺子,故指标的选择必须注意它的针对性。选用的指标必须与所研究的目的具有本质性联系,且能确切反映试验因素的真实效应,否则,不可能做出正确的判断。在文献[8]中,研究目的是观察电化学沉积钙磷涂层和钙磷-壳聚糖涂层的体外降解情况,则选择的指标就是钙离子吸光度,这是可以准确达到研究目的指标。在文献[9]中,为了研究对免疫性肝损伤小鼠肝脏、脾脏、胸腺脏器指数的影响,眼球采血后,立即取动物肝脏、脾脏、胸腺,称其湿重,计算各脏器的脏器指数。
4.1.2 指标的合理性 所谓“合理”就是指所选指标能真实客观地反映出干预措施的试验效应,在专业上能得到合理的解释;在文献[10]中,选择细胞凋亡百分率这个指标,一是满足了针对性,二是可以完全反映出受试对象在试验因素影响后的状态。
4.1.3 指标的客观性 在临床试验中应该尽量选择客观性指标,即通过测试仪器或工具获得观测结果的指标,应尽量避免选用由研究者主观判断观测结果或根据受试对象主诉获取观测结果的主观性指标。若不得不使用某些主观指标时,最好制订出较为严格的评判标准、对资料收集者进行严格技术培训,使主观指标趋向于客观化。在文献[11]中,选择指标有3个,LDH漏出率测定、MTT法测定细胞存活率和形态学观察,用这3个指标来说明复方脑康胶囊对Aβ导致神经毒性的保护作用。漏出率、存活率这样的客观性强的指标,易于观察。而形态学观察这个主观性指标,最好是给予一个严格的定义,将其定量化,这样可以避免人为心理因素造成的偏差。
4.1.4 指标的灵敏性和特异性 灵敏性是指所选用的指标对干预措施反应的灵敏程度。特异性是指检测结果的专一性,以便把假阳性结果控制在最低水平。最好是选用灵敏度高、特异性又好的指标。在文献[12]中,主要的评价指标有:(1)不同时间点各组大鼠体质量及李氏指数;(2)不同时间点各组大鼠摄食量结果;(3)大鼠血脂和血糖水平;(4)不同组别大鼠血清雌激素、孕激素和胰岛素水平。对于所要研究的目的,结合试验因素作用于受试对象的反映,选择的这几个指标都具有很好的灵敏性和特异性。
4.1.5 指标的精确性 包括指标的精密度(即多次测定结果与其算术平均值都非常接近,简称为重现性好)与准确度(多次测定结果与其真值都非常接近,简称为准确度高)的两重含义[13]。精密度可以通过标准偏差或者相对标准偏差等指标来判断,而准确度一般是以回收率评价。影响精密度和准确度的原因,除了方法完善程度外,还与操作人员的测量熟练程度、经验和仪器稳定性等因素有关[14]。
4.1.6 指标的经济性 检测成本应在患者所能承受的范围之内。
4.1.7 指标的可操作性 指标取值的测定通常需要相应的仪器设备或试剂,若选定的指标过新或对灵敏度要求过高,目前的仪器设备或试剂还达不到要求,就属于指标的可操作性差。
4.2 指标的分类与主次的确定
结合基本常识和专业知识,并汇集众多同行专家的意见和建议,从三类指标(诊断性指标、疗效性指标和安全性指标)的每一类中,挑选出一、二个主要指标,其他指标一律视为次要指标。若实在无法找出少量的主要指标,可找出5到10个相对重要的指标,先对它们进行“趋同化处理”,即使它们都转变成“高优指标(即指标取值越大越好)”或“低优指标(即指标取值越小越好)”,再采用综合评价方法将它们合并成一个复合型的“主要指标”。
确定一个研究项目中的主要指标至少有以下三点好处:其一,重点突出;其二,便于试验前估算样本含量;其三,可以有效避免统计分析结果出现自相矛盾的现象。
4.3 在确定指标方面常出现的问题
4.3.1 指标过多 这是效应指标选择时最常见的问题。指标过多,比如研究者要么罗列出几十项观测指标,且不告知哪些是主要的、哪些是次要的;这样做的不妥之处在于:在众多指标中分不清主次,导致“眉毛胡须一把抓”、“出现互相矛盾的分析结果”等混乱局面和无法做出肯定结论的尴尬结局,而且从经济性角度来考虑,实际上也会造成浪费。所以在实际指标选择中,尽量按照4.1和4.2中提到的方法,严格筛选。
4.3.2 测量量表 运用几十项、甚至上百项内容的“测量量表”,并采用量表中多项得分之和作为主要评价指标的观测值。从表面上看,用量表的总分反映每位受试者的试验效应似乎满足合理性。需要注意的是,第一,量表中有些项目是高优指标,有些是低优指标;第二,众多指标彼此之间的重要性程度不同,某两项指标同样得8分,但反映实际程度可能相差很多。由于上述两方面原因,所以对每位受试对象的量表中的几十项、甚至上百项指标所得分值简单求和作为主要评价指标的取值,这样的做法科学性和准确性会受到质疑[15]。
4.3.3 偏性观察 对受试对象施加影响因素后,接下来就要对确定好的评价指标的取值进行测量。若是客观性指标就没问题,但若是主观性指标,那么在观测时,研究者有预期的试验结果,有可能会对观察结果记录时产生偏倚。此时,采用盲法设计可以有效地提高观测结果的准确性。还有一种方法是,可以对与指标测定有关的过程进行标准化,例如,对采集方法、部位、时间、保存、运输、测定时间、测定方法、测定条件等方面事先给予固定。
4.4 规定好观察指标的常规方法
选好反映试验效应的指标以后,还要规定观察指标的常规方法,如观察方法、标准、时间、记录方法及记录格式等。指标的观察或测量应避免偏性,否则会影响结果的准确度。在生理学文章中,常常发现研究者遗漏了这方面的说明,例如在文献[4]中,不同组不同时期收集的细胞上清液置于-20℃冰箱中保存,最后一起检测其中的NO浓度,但没有说明在存放过程中,随着存放时间的增加,上清液中的NO含量是否会有所变化。而且四个采集上清液的时间点的确定也没有明确可信的依据,是否合适也未有预试验给予证明。
在进行试验研究之前,需要根据研究的目的制订出科学完善的设计方案,以便指导试验顺利进行,并保证以较少的人力、物力、财力和时间得到准确可靠的试验结果。试验设计方案的核心内容包括试验设计三要素、四原则以及试验设计类型。本文只简要概述在生理学研究中,如何正确把握试验设计三要素方面的内容,因篇幅所限,其他两项内容在此不便介绍。
综上所述,“受试对象”、“影响因素”、“试验效应”是试验设计不可或缺的三要素,在书写试验设计方案时应给予高度的关注。
[1] 郭志成, 殷 亮, 王晓慧. 检测大鼠血浆游离DNA的定量PCR方法的建立及意义[J]. 中国应用生理学杂志, 2015, 31(2): 186-190.
[2] 唐 红. 番茄红素与葡萄籽提取物联合降血脂作用的研究[D]. 乌鲁木齐,新疆医科大学: 2010.
[3] 陈光磊. 生理学实验中受试对象的选择与分组[J]. 河南教育学院学报(自然科学版), 2005, 14(2): 39-41.
[4] 段慧琴, 乔 健, 张永东, 等. LPS对大鼠肠黏膜微血管内皮细胞分泌NO的影响[J]. 畜牧兽医学报, 2005, 36(9): 974-976.
[5] 曲春城, 张延庆, 赵万巨, 等. P16基因改变与脑胶质瘤生物学特性相关性的研究[J]. 中华神经外科杂志, 2000, 16(6): 353-356.
[6] 章小平, 杨红枚, 鲁功成. 膀胱癌多药耐受相关蛋白和P53的表达及相关性分析[J]. 临床泌尿外科杂志, 2000, 15(8): 368-370.
[7] 胡平成, 贺石林. 医学科研三要素[J]. 湖南医学, 1997, 14(6): 364-366.
[8] 孙 琛, 王玉琛, 王贻宁, 等. 电化学沉积钙磷涂层在兔股骨内的早期骨结合[J]. 中国组织工程研究与临床康复, 2009, 13(38): 7507-7510.
[9] 张祥伟, 陈佩虹, 金晓艳, 等. 小柴胡汤超微饮片与传统饮片药效学剂量对比研究[J]. 中成药, 2011, 33(2): 225-228.
[10]李宁丽, 路丽明, 沈佰华, 等. 重组人可溶性TRAIL分子诱导细胞凋亡机理探讨[J]. 第二医科大学学报, 2003, 23(1): 10-14.
[11]胡文军, 邓朝晖, 李国锋. 复方脑康胶囊对β-淀粉样肽诱导SH-SY5Y细胞凋亡的保护作用研究[J]. 中国药房, 2012, 23(7): 594-596.
[12]Si JC, Zhang XY, Lin ML, et al. Effects of Ephedra on the body mass and levels of blood lipids, blood glucose and hormones in ovarietomized obese rats[J].ChinJClinRehabil, 2006, 10(47): 209-212.
[13]胡良平. 科研设计与统计分析[M]. 北京:军事医学科学出版社, 2014: 129-135
[14]朱秋林. 科学实验的精密度与准确度[J]. 河南医学院学报, 1980, 15(4): 263-268.
[15]胡良平. 医学期刊中常见的统计学错误及对策[J]. 中国卒中杂志, 2006, 1(12): 865-878.
How to master the three important factors of research design in physiological study
CHEN Fang1, GUO Chun-xue2, LIU Yi-song2, SHEN Ning2, HU Wan2, YANG Meng-yuan2, HU Liang-ping2△
(1. The First Hospital of Chinese People’s Liberation Army, Lanzhou 730000; 2. Consulting Center of Biomedical Statistics, Academy of Military Medical Sciences, Beijing 100850, China)
Objective: To offer a series of efficient methods for physiologists to make a scientific and rational experimental program. Methods: We bring about two questions as follows: Which are the common mistakes of statistics in the process of a physiological research? How to identify all the three essential factors? From the answers to these two questions, we highlight the methods to conduct a rigorous and accurate research design. Results: We summarized the special content of three essential factors in the experimental design: subject, influential factors, and effective indicators, which provide a basis for the design of the experimental program. Conclusion: In statistics studies, three essential factors which are “subject”“influential factors”“effective indicators”should be given considerable attention by the physiologists.
physiology; statistics; study design; three important factors
2016-01-11
2016-05-18
R181
A
1000-6834(2016)05-477-05
10.13459/j.cnki.cjap.2016.05.024
△【通讯作者】Tel: 010-66932127; E-mail: lphu812@sina.com