周 俊,李政杰,程施瑞,贺文华,孙睿睿,兰 蕾,曾 芳,梁繁荣
(成都中医药大学针灸推拿学院 成都 610075)
针灸是祖国传统医学的瑰宝之一,是中医药走向世界的名片,科学阐述针灸作用的规律和机制特点对于促进中医药的国际化具有重要意义[1]。近年来神经影像学技术发展迅速,目前常用的神经影像学技术包括功能性磁共振成像(Functional magnetic resonance imaging,fMRI),功能性近红外成像(Functional nearinfrared spectroscopy,fNIRS),单光子发射体层成像(Single photon emission computed tomography,SPECT),正电子发射断层成像(Positron-emission tomography,PET),脑电图(Electroencephalography,EEG)和脑磁图(Magnetoencephalography,MEG)等。由于神经影像学技术具有科学、可视化、在体、客观等优点,许多学科将该项技术引入进行交叉学科研究,例如精神科、疼痛科、心理学、神经科学等[2-5],中医针灸的神经影像学研究近年来也逐渐增多,其中以fMRI 的相关研究最多[6](图1)。但随着针刺神经影像学研究的逐步增多,也发现一定问题,例如研究结果的可重复性不足[7]。导致这一问题的原因包括试验质量控制、试验设计、试验目的不同等,其中试验质量控制为关键因素之一。
由于针刺神经影像学研究多数以人体为试验对象,既有临床研究的特点又引入了神经影像学的技术方法。本文以目前梁繁荣教授正在进行的针刺治疗慢性膝骨关节炎(Knee osteoarthritis,KOA)的神经影像学研究为例,从临床试验质量控制(样本量、受试者纳入、随机与盲法、针刺干预等)和影像数据质量控制(fMRI扫描、图像处理等)方面切入(图2),探讨针刺神经影像学研究的质量控制。希望抛砖引玉,得到同行专家们的批评指正,以期通过更合理更严格的质量控制,提高针刺神经影像学研究结果的可重复性,为针刺神经影像学质量控制标准的制定提供思路,为未来针刺神经影像学研究提供参考。
前期本试验方案已在中国临床试验注册中心进行注册,相关内容发表在Trials杂志,以供参考[8]。
图1 PubMed数据库针刺相关神经影像学研究论文数量及趋势
目前关于针刺脑功能成像研究中样本量的计算缺乏统一标准,通过统计学方法模拟验证,有专家认为12 例-15 例能够获得较大的统计效力[9,10],而回顾前期文献,也发现平均每组样本量在15 例左右[7]。徐春生等[11]为研究样本量大小对针刺腧穴脑功能激活区定位的影响,随机选取不同例数样本进行重新分组,当选择较小样本量时,脑内激活区显示少且差异较大;当选择例数增加时,脑内激活区随之明显增加,差异减小。在以往的研究中,我们发现,针刺效应的个体差异大,脑功能活动易受外界环境影响,样本量的大小对研究结果影响巨大,但当样本量达到每组20例时可明显提高结果的可重复性[12]。
本试验为得到更加稳定和可靠的结果,要求每组样本量至少30例,充分考虑20%的参与者退出率和扫描过程中可能出现的头部过度运动后,最终决定每组纳入36例KOA患者。
严格的纳入标准和排除标准是受试者同质性的重要保障,在临床研究的质量控制中具有重要意义。而对于样本量相对较小的影像研究,严格的纳排标准更是获得可靠结果的基础。此外,由于影像研究涉及fMRI 扫描,受试者的人口学资料、情绪、伴随症状/疾病以及其它影响因素等需要进一步严格控制。
1.2.1 受试者筛选流程
对于膝骨关节炎患者的纳入,我们严格遵循美国风湿病协会颁布的膝骨关节炎的诊断和分类标准[13],并按照计划书严格执行纳排流程,具体实施如下:①初筛:由经过专业培训的医生按照事先制定的“膝骨关节炎影像初筛表”(表1)进行逐项排查,并记录。②复核:初筛人员将合格或不确定的受试者信息上报,由复核人员再次询问受试者相关情况,重点关注受试者的民族、利手、疼痛程度,近1个月有无用药或针灸,有无幽闭恐惧症,体内有无金属等情况。③复核通过的受试者入组等待,由第三方确定其分组及编号,通知其空腹进行肝肾功、三大常规、风湿三项、血压、心电图等检查,若指标出现明显异常,由复核人员询问受试者相关情况,综合判断决定其是否符合入组条件。若在试验期间发现受试者不符合纳入标准或符合排除标准,或经试验人员反复沟通仍不愿合作者,剔除病例,并在CRF 表中记录相应时间和具体剔除原因。
图2 针刺神经影像学研究质量控制思路图
1.2.2 受试者人口学特征
受试者的人口学特征主要包括年龄、性别、文化程度、种族和利手情况等。有研究发现当其他条件都相同,仅有人口学特征不同时,可观察到矛盾的结果[14]。因此对人口学基本特征的限定是对结果质量把控的关键环节之一。①年龄:已有大量研究显示在人类生命周期,大脑的结构与功能,以及结构与功能间的连接会出现特征性改变[14-20]。例如,Luo 等[14]讨论了5967 例健康人的年龄与脑成像的关系,发现成人灰质体积在大部分区域随年龄呈线性下降变化;而结构网络相关性、功能网络连接随年龄的增长呈“U型”或“倒U 型”特征变化,并且两者的拐点在40 岁左右发生重叠。此外有研究发现人类在40 岁后大脑衰老速度加快[21,22],当年龄超过60 岁后,脑功能连接明显下降[23,24]。②性别:许多研究提供了大脑中各种性别差异的证据,包括灰质密度、灰质体积、皮质厚度等,而这些差异同时也支撑了男女行为、技能和认知/情感能力等的各种差异[25-29]。③文化程度:教育对皮层体积具有保护作用[30],受教育年限与右侧额中脑回、中后扣带回、右下顶叶皮质灰质体积呈正相关[31];而受教育程度越高,工作记忆网络中的大脑区域越活跃[32],大脑更有效率[33]。④种族:不同种族其大脑结构和功能可能有所差异[26,34],研究显示高加索人群与中国人的大脑在额叶、颞叶、顶叶、枕叶和岛叶以及扣带回皮质的厚度、体积和表面积差异显著[35]。⑤利手情况:左右利手所导致的大脑结构和功能的差异一直是人们关注的热点,有研究发现惯用右手者与左利手在大脑形态上存在显著差异,尤其是在基底神经节[36-38]。综上,在设计针刺神经影像学研究试验时,应充分考虑年龄、性别、文化程度、种族和利手情况等人口学特征等混杂因素。
表1 膝骨关节炎影像初筛表
结合本课题试验,KOA 疾病的发病人群以中老年人为主,依据诊断标准作为参考,最终将年龄范围限定为40岁-60岁;KOA的女性发病率高于男性[39],但如果选择比例较大的女性作为研究对象,则可能会给试验结果带来人为的选择偏倚,故对性别不做特殊限制;考虑KOA 患者主要以中老年人为主,且老年患者居多,结合时代背景以及临床病源情况,确定文化程度为小学及小学以上;由于汉族人口以及右利手者更为普遍,为保证受试者的同质性及招募顺利开展,排除其他种族情况。
1.2.3 受试者情绪
受试者的心理、情绪状态对脑的结构和功能有重要影响。有研究发现音乐可以调节大脑结构中与情感密切相关的活动,不同音乐唤起的喜怒哀乐情绪,在大脑中有不同反应[40,41]。早期的神经成像研究表明,青少年在与情绪反应相关的大脑区域显示出最初的发育[42];在情绪预期过程中,背外侧前额叶皮质被激活[43]。此外,在抑郁症患者中发现大脑结构的前额叶皮质(内侧前额叶皮质和眶额叶皮质)和内侧颞叶皮质区域(海马)均有显著改变[44]。另外需要特别注意幽闭恐惧症——人被限定在封闭空间内的一种病态恐惧,MRI 检查中较易发生[45]。患者容易出现压抑,胸闷,甚者心慌,气短,呼吸困难等从而导致检查失败或影响数据质量。
本研究纳入受试者在进行两次fMRI扫描前,由经过专业培训(与受试者谈话的内容、语气、神情、环境等方面规范标准)的执业医师进行病例报告表(Case Report Form,CRF)评定,其中包含对受试者心理、情绪状态的评价,例如:焦虑自评量表(Self-Rating Anxiety Scale,SAS)、抑 郁 自 评 量 表(Self-rating Depression Scale,SDS)、生活质量量表(12-Item Short Form Health Survey,SF-12)、麦基尔疼痛问卷(Short-Form of the McGill Pain Questionnaire,SF-MPQ)、针刺疗效期待量表等。当受试者情绪评价结果为中重度焦虑或抑郁时,试验人员将与其沟通调整fMRI扫描时间或剔除病例。针对幽闭恐惧症,初筛和复核人员都将对纳入的受试者进行详细询问,fMRI扫描前操作人员也将再三确认。如遇第一次扫描患者则由扫描人员做好充分解释说明,消除心理恐惧及负担,若扫描过程中仍然出现幽闭恐惧症则立即停止扫描,根据患者实际情况采取对症处理,最后剔出病例做好相应记录。
1.2.4 其他伴随症状/疾病
伴随症状及疾病可能会严重影响试验结果的可靠性和说服力,因此应根据试验目的,在试验设计中尽可能排除伴随症状/疾病的影响。例如研究非痛经引起的痛症,则需要考虑排除痛经的影响,因为研究证明痛经与相关的灰质异常变化有关,即便在无疼痛的情况下也会出现灰质异常改变[46,47]。另外,考虑到对影像数据的影响,头部外伤、失眠和其他原因引起的疼痛也应排除。除外,有报告称针刺可能是获得性血友病出血的诱发因素[48],为规避风险,凝血功能障碍者理应排除。
本课题试验中,KOA 属于慢型痛症范畴,为了减少伴随症状/疾病的影响,使结果更具说服力,我们排除了合并有精神智能障碍、神经系统疾病、心血管疾病、肝肾功能损害、免疫缺陷、糖尿病、血液病患者;并发有其他不属于骨性关节炎的患者(例如骨关节结核、肿瘤、风湿和类风湿关节炎等);合并扭挫伤或其他外伤等其他部位疼痛的患者;以及患有腰椎间盘突出症、髋关节炎、踝关节炎,其他慢性疼痛或有头部外伤史意识丧失的病人。
1.2.5 洗脱期
在考虑受试者同质性时,往往容易忽略其入组前的用药情况以及针刺后效应对研究的影响。一般来说,针刺后效应的洗脱期较药物更长,但目前还没有明确的洗脱时间。据统计,国外有关针刺研究的洗脱期较短,30 min 到2 周不等,而国内临床试验洗脱期相对较长,以2周和1个月最为普遍[49]。由于本试验为非交叉试验,无法对洗脱期的残余效应进行检验,根据已有文献研究结果,将入组前使用相关药物及针刺治疗的洗脱期定为1个月。
1.2.6 合并用药
在试验过程中,应考虑患者合并用药对结果的影响。本研究在试验周期内,建议受试者尽量不使用任何药物治疗,嘱咐受试者尽量不服用茶、咖啡等含有咖啡因的食物或饮料。遵循《赫尔辛基宣言》规定的伦理法则,若受试者在试验期间突发膝痛难忍,可临时服用非甾体抗炎药物布洛芬缓释胶囊止痛,但建议不服用其他的药物。观察期间受试者的用药情况(药物名称、剂量、使用时间等)需详细记录在《膝关节疼痛日记》上,并告知试验人员。
1.2.7 女性受试者月经期
女性月经期与大脑的结构和功能活动联系紧密[50]。研究指出即使当女性处在月经期中感觉到的疼痛强度和不适感保持不变时,与疼痛相关的大脑活动却在整个月经周期中有显著的变化[51]。因此,对于女性受试者的fMRI 扫描应统一扫描时间段以减小月经周期对扫描结果的影响。本试验中,KOA 患者虽以女性患者居多,但大多都为绝经期女性,影响较小;对于部分未绝经女性,则要求在非经期进行扫描。
1.2.8 针刺经历、疗效期待
针刺经历的有无在受试者间的脑反应可能存在显著差异[52]。因此,为保证受试者基线的一致性和结果的可比性,须考虑受试者入组前是否有针刺经历。另外,一项功能神经影像学研究显示,通过提高患者对针刺治疗效果的期待可以加强针刺效应,缓解KOA疼痛[53]。本研究在受试者入组后由CRF评定人员记录有无针刺经历(具体时间、频次、疗效等),并应用针灸期待量表对受试者进行疗效期待评估。
随机的实施是为防止人为地扩大或缩小组与组之间的差别,给试验结果带来误差。此外,有研究显示如果不实施或不充分实施分配隐藏,试验结果可能会被夸大42%以上[54-56]。由于针灸类试验的特殊性,很难对操作者施盲,因此对受试者和结局评价者施盲尤为重要[54]。
本研究将符合条件的患者按1:1:1 的比例随机分为真针刺、假针刺和等待治疗组,每组36 例。具体方法:采用简单随机,随机序列在SAS 9.2 软件上生成。试验设计者根据大小将随机数字等分成A、B、C 3 组,并将随机数字和组别装入不透光的牛皮信封中密封,信封上标注序号。随机人员负责保存随机信封,不参与分组及后期试验数据采集具体实施。当纳入膝骨关节炎受试者时,按入组顺序打开序号相同的信封,随机分配到各组进行试验。研究采用盲法评价,由不知分组情况的初筛人员评价治疗效果。资料总结阶段运用盲法统计分析,施行研究者、操作者、统计者三分离原则。
针刺治疗者的水平以及手法的不同可能会造成疗效上的巨大差异,这也是针刺研究结果可重复性低的重要原因之一。国外已有多项关于安慰针对照针刺的研究,结果显示在镇痛方面,针刺优于非针刺,但与安慰针刺无统计学差异[57,58]。这可能暗示针刺效应中安慰效应占比极大,而治疗过程中的医患沟通交流可能是安慰效应的重要来源[58,59]。之后,有研究者在尽量控制其他可能影响疗效的因素的前提下,比较了不同资质的治疗者对研究结果的影响,结果显示高资历针灸师疗效明显优于低资历针灸师[49]。因此,事先制定严密的针刺规范流程方案十分重要,建议参照针刺临床试验干预措施报告标准(STRICTA2010)[60]制定方案,包括对针刺类型,针具选择,针刺细节,具体治疗方案,治疗师背景,治疗场所环境等。此外,《灵枢·九针十二原》中记载“刺之要,气至而有效”,现代研究证实了针刺得气与不得气者的脑功能成像差异显著[61],且得气能够影响穴位及其所属经络的能量代谢水平[62],促进不同脑区的代谢[63]。因此,在每次针刺治疗后,都应详细记录受试者的得气情况。
本试验针刺治疗由两名具有主治医师以上职称并经过课题组严格培训的针灸师进行操作。具体操作方法为:针刺入穴位后行平补平泻手法,要求得气。提插捻转得气后,留针30 min。留针过程中每10 min行针1 次,共行针2 次,行针时间为每次10 s-15 s。针刺治疗每天1 次,5 天为1 个疗程,连续治疗2 个疗程,疗程间休息2 天。在治疗过程中,医生尽量避免与受试者过多交流,保持受试者相对独立安静的环境。在每次治疗结束后,由初筛人员使用麻省总医院针感量表(MGH Acupuncture Sensation Scale,MASS)记录受试者得气情况,情绪状态,针刺不良反应等。
影像数据质量受多方面的制约,其中主要包括fMRI的扫描以及图像数据的处理,每一个环节都可能直接或间接影响数据质量。如何提高检查质量,使各方面综合平衡达到最佳,产生高质量的影像数据,是针刺神经影像学研究质量控制的重要组成部分。
fMRI 成像设备的质控是获取优质数据的前提。根据试验目的选择适当的扫描参数是保证高质量数据十分重要的一环,而对各种扫描参数进行有机的组合是提高信噪比、降低噪声与伪影的关键[64]。一旦机器和扫描参数确定后,扫描过程的质控变得尤为重要,而作为一种针对人为操作技术的研究,可以通过制定和规范相关的标准操作流程,进行质量控制,减少由于操作所带来的人为影响,以尽量保证所收集数据的质量和一致性。
本试验扫描在中国电子科技大学磁共振成像中心完成,选择使用西门子3.0T 核磁共振扫描仪。所有受试者分别于治疗前后2 天内[65]进行扫描,扫描过程中保持室内恒温。具体扫描质控过程实施如下:
2.1.1 扫描前
在正式扫描前,需要充分准备,主要包括主试(扫描操作人员)以及被试(受试者)准备两部分。
(1)主试准备
①实验前提前到达操作间,检查冷头声音和房间温度及主机状态等信息,确保机器及附属设施无异常;②详细询问被试有无不可拆卸的金属植入物、有无手术史等情况,嘱被试去掉所有金属物品并更换衣物,并在换完衣服后用金属探测器扫描被试全身,确保磁共振扫描安全;③确保每个被试者在扫描前填写并签署《被试同意书》和《被试检查单》,有动过手术等情况须问清楚并记录在《被试检查单》上,确认被试安全和同意实验的情况下方可扫描;④交代被试大致操作流程及注意事项,特别强调在整个扫描过程中保持头部及身体不动,闭眼但不要睡着,保持放松状态。
(2)被试准备
①扫描前24 h 避免过度劳累、熬夜,保持正常生活方式,禁止饮用酒、浓茶和咖啡等。②到准备室休息30 min;③去除身上所有金属物品(常见物品如钥匙、硬币、耳环、发夹,女性带金属内衣等)及各种磁卡,更换被试服、拖鞋;④仔细阅读并签署《被试同意书》和《被试检查单》。
2.1.2 扫描中
扫描中只有在保证被试的安全前提下,才可能获得高质量的影像数据。具体实施如下:①主试输入被试信息,选定扫描序列;②进入磁体间前,再次用金属探测器扫描被试全身,确保磁共振扫描安全,同时嘱被试戴好防噪音耳塞,以保护听力,并再次交代注意事项;③主试去除身上的所有铁磁性物质及磁卡、手机等物品,带被试进入磁体间,嘱被试脱鞋戴好眼罩平躺于扫描床上,合上线圈后,主试将海绵垫及毛巾塞于被试头部两侧以固定头部,防止扫描过程中头部晃动,用毛毯遮盖被试身体,将报警气囊置于被试右手中,嘱其在整个扫描过程中保持头部及身体不动,双手勿交叉,闭眼但不要睡着,保持放松,如有任何不适,可按捏手中的报警气囊;④主试操作:扫描线——定位——进床至扫描位;⑤主试提醒被试开始正式扫描,并再次嘱被试保持头部及身体不动;⑥按照设定好的序列依次扫描;⑦扫描结束,询问被试有无任何不适并进入磁体间帮助被试结束扫描,如无后续扫描拔下线圈。
2.1.3 扫描后
扫描完成后,主试须及时将扫描数据拷贝于课题组的硬盘中保存备份(检查数据是否完整);如无后续扫描,关闭刺激系统(投影仪、声音系统、反馈系统等)电源,关闭磁体间照明灯电源,操作间照明灯电源等以保证机器的使用寿命。
2.1.4 特殊情况处理
头动:若在扫描过程中出现异常头动,显示屏中发出黄色信号时,密切关注头动曲线波动以及扫描室被试情况,如无特殊继续完成扫描;若出现红色警告则立即停止扫描,并询问被试头动原因,如无特殊情况重新扫描该序列,并记录此次重新扫描的被试分组、编号、姓名、时间、序列及头动原因等。幽闭恐惧症处理见1.2.3受试者情绪评定。
图像质量被认为是脑成像研究中重要的混杂因素之一[66]。大量的证据表明,低质量的图像是结果多变的来源[67],量化和监控图像质量是确保许多类型的神经成像数据分析的有效性和再现性的必要前提。实施质量控制程序是确保神经影像数据高质量及其在后续分析中的有效性的关键[68]。
2.2.1 运动伪影
头动对fMRI是一个巨大的挑战,先前的研究已经证明,扫描仪内头部运动对结构性神经成像测量的估计有偏差[69-71],即使是头部微运动也可能引入人为的个体间差异[72],还有研究显示在MRI获取过程中,头部运动减少了灰质体积和厚度的估计[73]。因此,对头动的控制十分重要,需要确保一个可接受的质量水平,并量化排除图像的标准。
2.2.2 图像分割
确保组织分类的准确性对于高质量的研究是非常重要的,但因为技术和临床实施的局限性会带来一些固有的方法上的挑战。首先,由于运动伪影或扫描仪的不稳定性,MRI 扫描的图像本身可能会模糊或解剖边界不清[74-75];其次,MRI 硬件、软件和获取序列的差异也有可能影响组织分类的对比度差异和梯度失真,使得跨位点数据集的组合比较困难[76];另一个误差来源是分割算法的参数选择,不同的参数选择可以转化为差异很大的结果[77]。因此,如何尽量保证图像的精确分割也是质控中不可忽视的一部分。
2.2.3 协变量回归
协变量回归是为了降低脑部其它协变量对研究目的的影响,协变量是指与试验目的不相关却对试验结果可能造成影响的干扰因素,而回归协变量可使得研究结果更加接近真实的研究目的。
2.2.4 全脑平均信号
去除与非去除全脑平均信号,直接关系到功能连接分析的结果,所以一直是个争议较大的热点话题。部分研究支持全脑平均信号校正处理,发现去除全脑平均信号有助于减少头动引起的功能连接差异[78];而非去除全脑平均信号可能导致功能网络的结果中参杂脑基底区或纵裂池的噪声信号,以及位于白质区边缘灰质体素与其他脑区连接性降低[79-80]。而另一部分研究者认为,全脑平均信号之后会导致负相关连接性出现[81],改变左尾网络的拓扑结构,使网络受到损害[82]。此外,还有研究者在去除全脑平均信号方法上进行了改进[83],建议同时保留去除与非去除全脑平均信号两者的结果[84]。
2.2.5 其它因素
在图像处理的过程中,有许多与影像数据质量相关的影响因素和值得注意的细节。①原始图像的质量控制:可提高配准、分割和标准化的精度,特别是当图像的初始方向与标准模板出现较大不一致时。②移除前n个时间点数据(Remove first time points):仪器开始扫描时有一个平衡过程,即刚开始测得的图像不稳定或不准确,需要舍弃前几个时间点数据以保证结果的可靠性。③空间标准化(Normalize):由于功能扫描中包含的切片数量有限,而不同受试者其头部大小和形状不完全一致,所以原始图像的空间覆盖范围也各不相同,为了使受试者之间具有可比性,个体大脑需要配准到标准化空间。④时间层校正(Slice timing):采集一个脑图数据需要逐层扫描,而不同层间存在时间偏移,需进行校正。⑤平滑化(Smooth):能够降低信噪比。此外,还包括去线性漂移(Detrend),滤波(Filter),数据擦除(Scrubbing)等。在图像预处理完成后,评价神经成像数据集的质量时,评价人员的水平以及主观性,度量标准的选择都对后续数据处理具有重要影响[66]。
近年来,利用脑功能成像技术探讨针刺的中枢机制越来越多,如何对此类研究进行质量的控制对于提高结果的可重复性尤为关键。本文以梁繁荣教授正在进行的针刺治疗KOA 的神经影像学研究为例,从针刺临床试验的质量控制,到影像数据质量的严格把控,拒绝“garbage in and garbage out”,旨在获得高质量证据和可靠的结果。
针灸临床试验质控方面:样本量的大小对结果的稳定性影响巨大,受试者同质性是对结果可靠的重要保障,试验设计与分配隐藏、随机、盲法的实施是获得高质量证据的前提,而规范化的针刺干预是结果可重复的关键因素。影像数据的质量水平很大程度上取决于所收集的临床数据的质量。此外,规范的fMRI扫描流程和图像处理对于影像数据质量的控制至关重要。目前,许多研究依赖有一定经验评判员的目测来进行影像图像的审查,而评判员之间和评判员自身的判断都可能存在不一致性,这些人为的主观性降低了研究之间的可比性。随着机器学习的不断进步,人工智能在影像数据质控领域可能大有作为。
针刺神经影像学研究属于典型的交叉学科,研究者需具备扎实的针灸临床和科研基础,在系统了解神经影像技术的基本原理、设计、分析方法等多方面知识后才可能设计出和完成高质量的针刺神经影像学研究。而质量控制贯穿针刺神经影像学研究始终,任何一个环节的质控差错都可能给试验结果带来严重影响。目前国内外仍缺乏完善的针刺神经影像学研究的质控标准以及评价标准,这使得研究质量参差不齐,在出现矛盾结果时难以抉择。本文以梁繁荣教授正在进行的研究为例,浅谈针刺神经影像学研究的质控思路及实际运用,希望为今后的研究提供参考,为标准的制定提供思路,为针刺机理研究提供更加强有力的证据。