童若一,张鑫宇,王彩薇,吴大嵘,王宇峰,万赖思琪,陈建斌,蔡坚雄*
(1.广州中医药大学第二临床医学院,广州 510120;2.广州中医药大学基础医学院,广州 510120;3.广州中医药大学第二附属医院/广东省中医院省部共建中医湿证国家重点实验室,广州 510125;4.长春中医药大学附属医院推拿科,长春 130021;5.广州中医药大学第二附属医院/广东省中医院中医临床结局评价研究团队,广州 510125;6.南方医科大学公共卫生学院心理学系,广州 510515)
卒中后抑郁(post-stroke depression,PSD)为脑卒中常见的并发症之一,患病率为18%~61%[1-2],严重影响患者的康复积极性、预后和生活质量[3-5]。卒中后抑郁与一般抑郁症有所不同[6-7],目前临床中多采用精神障碍评价工具进行卒中后抑郁评价,难以兼顾卒中的特异性。因此,对当前卒中后抑郁工具进行系统分析,有助于梳理和促进卒中后抑郁的科学评价,有利于临床治疗和康复训练计划制定[8]。本研究参照国际COSMIN 组织的COSMIN Methodology for Systematic Reviews of Patient Reported Outcome Measures工作手册(2018,V1.0)的流程要求,基于国际主流医学文献数据库的系统检索和筛选,分析总结卒中后抑郁评价工具的应用现况和规律,可为相关临床和科研工作中评价工具的选择决策提供初步参考,报道如下。
1.1 文献检索
1.1.1 数据库选择 选择Embase,Pubmed,Cosmin(www.cosmin.nl),Midss(www.midss.ie),ProQolid(www.proqolid.org),Registry of Outcome Measures(www.researchrom.com)数据库检索文献。
1.1.2 检索策略制定 Embase 和Pubmed 采用主题词和自由词组合,分别检索Cerebrovascular Disorders,Stroke,Brain Ischemia 等卒中相关主题词27 个和自由词20 个,Depression,Depressive Disorder,Bipolar Disorder 等抑郁相关主题词5 个和自由词14 个,Outcome Assessment,Measurement Instrument等评价工具相关主题词2 个和自由词10 个,并用“AND”逻辑符连接。其他数据库采用自由词检索。时间范围为建库至2019 年9 月。
1.2 文献筛选
1.2.1 纳入标准 1)研究对象诊断为卒中后抑郁障碍;2)研究对象年龄≥18 岁,性别及种族不限;3)文献类型:Meta 分析、综述、系统评价、研究方案;或随机对照试验、临床对照研究、病例对照研究、队列研究、病例观察报告;4)研究内容涉及卒中后抑郁评价工具;5)评价工具包括量表评估、影像学检查、实验室检查等。
1.2.2 排除标准 1)研究内容主要为单纯抑郁症的治疗,与卒中无关;2)研究内容主要单纯描述“如何测量或评价”或“如何研制测量或评价工具”,没有描述与卒中抑郁障碍“如何选择或应用测量工具”相关的内容;3)内容重复、中英文互译的文献,评论性文献,动物实验文献;4)仅涉及卒中后抑郁障碍的诊断,没有作为评价工具的文献;5)文献仅有标题或摘要部分,无法获取全文。
1.2.3 筛选方法 由2 名研究者各自采用Endnote X9文献管理软件,参照纳入与排除标准对文献标题和摘要进行初筛并阅读全文,最终确定纳入文献,提取文献中的评价工具数据,意见不一致时,征询第3 名研究者意见,共同判定是否纳入。
1.3 资料收集 本研究分别提取文献基本信息及评价工具名称、参数。评价工具在文献中被使用1 次,数据记为1 次,且同一工具的不同版本分别记录。数据按照时间和工具类型分类,采用描述性分析描述工具概况和应用情况。文献发表时间段划分为2000 年及以前、2001-2005 年、2006-2010 年、2011-2015 年、2016 年及以后;工具类型分为普通筛查量表、一般人群抑郁量表、卒中人群抑郁量表、实验室及影像学指标。
2.1 文献检索结果 文献检索分别获得Embase 746篇,Pubmed 858 篇,COSMIN 2 篇,ROM 2 篇,ProQolid 135 篇,合计1 743 篇,经查重和筛选后,最终纳入489 篇,包括综述/系统评价类文献88 篇,总纳入率28.06%。见图1。
图1 文献筛选流程
2.2 评价工具提取结果 从临床研究类文献中提取得到37 个工具,包括24 种量表(见表1)、9 个实验室指标(见表2)、4 个影像学指标(见表3)。从综述/系统评价类文献中提取到15 个工具。考虑综述/系统评价与临床研究类文献存在重复计算,因此,主要以临床研究文献的工具数据进行分析和讨论。按照文献发表年份分为5 个时段,其工具使用种类分别为8、7、17、20、25 种,呈现增长趋势,但不同工具的使用频次随时间有所波动。见图2。
图2 工具使用频次的时间趋势图
表1 量表评价工具
表2 实验室评价工具
表3 影像学评价工具
按适用人群可将24 种量表分为普通筛查量表、一般人群抑郁量表、卒中人群抑郁量表三类,其中一般人群抑郁量表共有13 种(条目数2~90 条),占总数54%;普通筛查量表6 种(条目数8~36 条),占总数21%;卒中人群抑郁量表5 种(条目数10~49条),占总数25%;使用频次上,一般人群抑郁量表占89%,普通筛查量表占6%,卒中人群抑郁量表占5%。
选择应用频次最高的代表性量表,对比其条目和内容特点,可发现普通筛查量表更关注自我认知和情绪状态,一般人群抑郁量表更关注情绪状态,卒中人群抑郁量表则关注情绪状态、生活状态和社交沟通,评估内容各有侧重。
卒中后抑郁患者具有复合性疾病的特点,需从患者自我报告、照顾者报告、行为观察及医学评价等角度进行病情评估[27-29]。目前临床中对卒中后抑郁的评价方法各不相同,更多是依据自身临床经验去选择评价工具。当前的评价工具种类较多,不同工具的评价特性也缺少对比,关键的核心工具也尚未得到共识认可,降低了对卒中后抑郁诊断和评估的规范性和一致性,不利于卒中后抑郁的临床和科研应用与学术交流。3.1 抑郁障碍评估在卒中康复研究中的应用情况 本研究中,抑郁障碍评估在卒中后康复研究作为主要和次要结局指标比例约为9 : 2(频次215 : 47),评价工具的使用频次也逐年增加,可见在临床实践和科研中日益重视对卒中后抑郁的评估和研究。现有研究发现卒中后抑郁患者需更多日常生活辅助及院内护理,日常生活能力较差的患者更容易合并抑郁障碍,但卒中后抑郁障碍的诊断受到疾病特点、评估工具等较多因素影响[30]。因此,更加关注卒中人群的心理状态变化和干预,也是卒中后康复的重要内容之一。
3.2 卒中后抑郁康复评价工具的用途 文献中,抑郁评价工具可分为三类用途。一是仅用于筛查评价工具,不作为结局评价工具;二是用于结局指标评估;三是作为实验室和影像学工具用于辅助评估[31]。对比发现,多数评价工具具有诊断和结局评价两用性,如同一量表用作诊断标准时,采用预先设定阈值的方法进行诊断;用于结局评价时,采取量化分数或分级的形式进行评估。实验室和影像学工具更多是作为补充参考,在特异度和灵敏度方面的研究数据仍较少,与成熟的量表工具之间缺乏可比性。
3.3 量表类评价工具的分类与差异 对比分析发现,普通筛查量表主要针对患者身心健康进行综合评定,抑郁评价条目少且结果不够精确,主要是用于抑郁障碍的快速筛查;一般人群抑郁量表,对抑郁评估具有特异性,应用比例最多,提示其在不同疾病背景下的共用性,但其与卒中之间的关联性不够强,存在与卒中人群年龄、疾病状态等方面的不匹配性,测评的信效度较低、非精神病学专业人员使用等问题[32-33];卒中人群抑郁量表是特定人群的专用评价工具,部分条目内容和普通筛查量表重叠,增加了兼顾抑郁和卒中临床特点的内容评测,更关注卒中本身导致的躯体功能障碍带来的社交、沟通等方面的影响,但文献中该类量表的使用频次仅有5%,相对于一般人群抑郁量表89%的使用率而言,其适用性有待深入研究。
3.4 量表类评价工具的演变 目前卒中后抑郁评估的量表工具呈现多元化选择的局面。研究发现,尽管新量表不断被研发和应用,部分问世已久的传统量表仍被广泛高频使用,如汉密尔顿抑郁量表(HAMD,1960 年)、老年抑郁量表(GDS,1982 年)、医院焦虑抑郁量表(HADS,1983 年)等[34-36]。近年来,研究表明PHQ-9 在卒中患者中的信度和效度良好,其应用有增多趋势,可见量表新旧程度不是影响工具选择的关键因素,更多与传统量表的普遍适用性、信度效度稳定性和权威性有关,但也可能与工具使用者的习惯性、历史积累等有关,更多的用户习惯和影响因素值得进一步研究。
3.5 量表类工具评测方式 在研究过程中,本研究发现不少临床研究并未合理地应用量表推荐的测评方式,如常用的流行病学研究用的抑郁量表(CES-D)和医院焦虑抑郁量表(HADS)推荐为患者自评,部分临床研究却单独采用电话访谈、代理报告等方式[37-38],或同时采用患者自评和代理报告[39]进行评测。评测方式的随意性选择,可能导致结果稳定性和精确性降低。因此,建议研究者应首选量表本身推荐的评测方式,或在对比推荐评测方式与新方式的一致性后,再采用新测评方式,才能更好地保证研究质量。
3.6 研究方向建议 根据研究分析结果,本研究建议今后可在以下几方面加强研究:一是可对比分析工具测量概念和内容,研究测量目标的差异和适用性;二是可横向评价不同工具间的信度、效度、反应度等测量特性,再通过德尔菲专家咨询构建核心工具集,并形成工具选择应用的规范指引;三是可对工具的不同测评方式进行一致性研究,拓展工具的应用场景;四是可对实验室和影像学评价工具开展动态文献评价,定期更新其应用指引;五是可针对用户对工具的选择偏好进行调查研究,可进一步促进工具的合理科学选用;六是对卒中后抑郁专用人群量表的适用性和本地化研究,有助于形成适合我国国情的专用工具。
3.7 本研究的局限性 本研究仅针对国际主流英文数据库和测量工具数据库进行检索,分析国际主流评价工具的现况和应用特点,并未纳入分析国内研究应用现况,数据全面性存在一定不足,但是当前卒中后康复评估仍以国际评价体系为主导,本研究结果仍具有较大的代表性和参考价值。此外,本研究尚未对各类常用工具的评价内容、评价特性、适用范围等进行深入分析和评估,无法基于工具特性进行更专业的推荐,今后仍需深入研究。
目前卒中后抑郁康复评价工具的应用呈现多样化特点,虽为研究者提供了较多选择,但也存在一些不规范应用问题,容易影响研究结论的稳定性和一致性,降低研究共性价值。未来针对卒中后抑郁的多方向、多层次深入研究有助于促进相关临床研究结局评价的合理性和规范性。