刘芳芳,包关水,2,闫梦侠
1.上海交通大学医学院附属第九人民医院神经内科,上海 200011;2.上海交通大学医学院临床研究中心,上海 200025
头痛是神经内科门诊最常见的症状之一,90%的人一年内都会发生头痛[1]。头痛分为原发性头痛和继发性头痛,原发性头痛占神经内科门诊头痛的80%以上。据报道,我国原发性头痛患病率已经高达23.8%[2]。由于庞大的人口基数,据估计,中国可能是世界上头痛人口最多的国家[3]。尽管大部分头痛不会危害患者的生命,但对患者的生理、心理、家庭以及国民经济都带来了沉重的负担[4-5]。
在原发性头痛中,偏头痛和紧张型头痛的患病率位居前2位,其中偏头痛为9.3%,紧张型头痛为10.3%[2]。数据[6]显示,偏头痛的发作频率和程度会大大影响患者的生活质量,严重者可致残。偏头痛包括无先兆偏头痛和有先兆偏头痛。无先兆偏头痛是持续4~72 h的反复头痛;典型表现为头痛呈单侧、搏动性,中重度日常体力活动可加剧,伴恶心/呕吐、畏光/畏声。而有先兆偏头痛则是在头痛发作之前逐渐出现单侧可完全恢复的视觉、感觉或其他中枢神经系统症状。紧张型头痛则是原发性头痛最常见的类型:头痛发作不频繁,每次持续数分钟至数日;典型表现为轻到中度双侧压迫性或紧箍样头痛,不因日常体力活动而加重,常不伴随恶心/呕吐或畏光/畏声。尽管典型的偏头痛和紧张型头痛具有很大差异,但大多数患者的症状并不典型,尤其是无先兆偏头痛和紧张型头痛,对两者的鉴别经常存在困难。
目前国内外通行的头痛诊断标准是国际头痛疾患分类标准Ⅲ(international classification of headache disorder Ⅲ,ICHD Ⅲ)[7],但由于认识不足以及对头痛的不重视,各级医院的临床医师仍使用不规范的头痛诊断标准和分类,如“血管性头痛”“神经性头痛”“血管神经性头痛”等。因此,规范头痛诊断标准,提高诊断准确率显得尤为重要。
临床决策模型或临床预测模型是指利用多因素模型估算患有某种疾病的概率,是实现正确诊断、个体化精准治疗的一种有效方式。目前对头痛相关决策模型的研究,主要是基于ICHD及机器学习。如尹梓名等[8]提出的原发性头痛辅助决策系统,尽管在门诊评估过程中取得了较好的敏感度和特异度,但对于非典型的头痛患者,该系统可能无法正确判别。有学者[9-11]曾提出通过机器学习实现对原发性头痛的自动诊断,但机器学习对于临床医师来说是个陌生的领域,其结果的可解释性较差。临床决策模型是促进医学转化的有效工具,近年来得到了广泛的应用。列线图是一种可视化的临床决策模型。它将复杂的回归方程,转变成可视化的图形,使模型的结果更具有可读性,方便对患者进行评估。尽管国内外多位学者致力于头痛决策模型的建立,但仍未开发出基于列线图的原发性头痛决策模型。为此,本研究通过问卷收集头痛患者的临床资料,建立基于列线图的临床决策模型,以提高原发性头痛诊断的准确性。
回顾性收集2019年10月—2020年12月就诊于上海交通大学医学院附属第九人民医院神经内科门诊的头痛患者。纳入标准:符合ICHD Ⅲ中偏头痛和紧张型头痛的诊断标准;年龄>18岁,性别不限;临床资料完整。排除标准:有器质性病变的继发性头痛患者;严重焦虑、抑郁患者;有全身系统性疾病患者,如严重的肝肾疾病或严重感染。将2019年10月—2020年8月就诊的偏头痛或紧张型头痛患者152例作为建模组,用于模型的建立,通过1 000次重复采样的Bootstrap方法对模型进行内部验证。将2020年9月—2020年12月就诊的58例偏头痛和紧张型头痛患者作为验证组,用于模型的外部验证。所有患者均为中国居民。
采用自行设计的问卷,设置了19个问题,分别收集患者的人口学资料(年龄、性别、职业、身高、体质量)和头痛的特征(病程、持续时间、性质、部位、严重程度、伴随症状、诱因、缓解方式、活动是否加重)。
为了保证临床医师对ICHD Ⅲ掌握的一致性,减少主观性偏倚,除首诊医师的诊断外,同时邀请了2位有经验的神经内科医师根据问卷做出诊断,三者一致时才被纳入研究。因本研究只进行了二分类建模,针对多种头痛合并存在的情况,主张患者进行头痛日记的记录,将发作最频繁、对患者生活影响最大的头痛类型作为该患者的诊断。
本研究获得上海交通大学医学院附属第九人民医院伦理委员会的批准(批件号:SH9H-2021-T72-1),并符合《赫尔辛基宣言》的要求。所有患者均签署知情同意书。
由于患者头痛的性质、伴随症状较多,本研究将问卷的所有问题拆分为二分类变量进行数据处理,共49个变量。考虑到部分变量发生率极低,首先采用χ2检验对偏头痛和紧张型头痛患者的数据进行比较,共筛选出12个差异具有统计学意义(P<0.05)的特征变量纳入研究。在建立列线图模型时,根据Harrel[12]的标准,当结局变量是二分类时,最小样本量必须满足特征变量数的10倍,根据目前纳入的变量,至少需要120例。本研究建模组152例患者,符合样本量要求。
使用SPSS21.0 软件和R软件(版本4.0.3 )进行统计分析。定性资料采用χ2检验。危险因素采用单因素和多因素Logistic回归分析。采用了容忍度(tolerance,Tol)和方差膨胀因子(variance inflation factor,VIF)评估特征变量的共线性问题,其中Tol均>0.10 且VIF均<10则表示变量之间不存在共线性。将单因素Logistic回归中P<0.1 的自变量纳入多因素Logistic回归分析,并用逐步向前法筛选最终纳入模型的变量。基于自变量的回归系数,建立了偏头痛和紧张型头痛个体化列线图作为决策模型。从区分度和校准度2个方面对模型进行验证。用R软件绘制列线图、受试者操作特征曲线(receiver operator characteristic curve,ROC曲线)和校准曲线。P<0.05 表示差异具有统计学意义。
本研究共纳入210例患者,其中建模组152例,验证组58例。2组患者在一般人口学资料和头痛特征上差异无统计学意义(表1)。
表1 建模组和验证组患者基线特征比较Tab 1 Comparison of baseline characteristics of patients in the modeling group and validation group
单因素Logistic分析显示(表2),性别、病程、头痛是否位于后枕部、头痛的严重程度、是否伴有恶心/呕吐、是否伴有畏光/畏声、活动后头痛的变化、与经期是否有关在鉴别偏头痛和紧张型头痛中差异具有统计学意义。另外,头痛缓解方式变量的P=0.053 (P<0.1 ),也纳入了下一步的多因素分析。共线性分析结果表明,上述9个特征变量间不存在共线性(表3)。将9个特征变量纳入非条件二元多因素Logistic回归显示(表2),病程、头痛是否位于后枕部、头痛的严重程度、是否伴有恶心/呕吐、是否伴有畏光/畏声、活动后头痛的变化是鉴别偏头痛和紧张型头痛的独立预测因素。在非条件二元多因素Logistic回归分析的基础上,将上述6个因素纳入决策模型。由于偏头痛对患者生活的影响程度较重,本研究将偏头痛设为主要结局变量,并利用R软件rms程序包编程建立并绘制偏头痛的个体化列线图模型(图1A)。根据列线图模型中以上各个特征变量对是否发生偏头痛的贡献程度,给每个特征变量的取值水平进行赋分,然后再将各个分值相加得到总评分,最后通过总评分与偏头痛发生概率之间的函数转换关系计算个体发生偏头痛的概率(紧张型头痛发生的概率=1-偏头痛发生的概率)。例如,如果一位原发性头痛患者活动后头痛程度加重、伴有恶心/呕吐、畏光/畏声、头痛程度较重、不伴有后枕部的疼痛、病程较长,那么他总得分为412分,对应的概率为0.996,即该患者发生偏头痛的概率为99.6%(图1B)。根据以上预测,该患者为偏头痛的可能性很大。
表2 单因素和多因素Logistic回归分析Tab 2 Univariate and multivariate Logistic regression analysis
表3 各特征变量的共线性分析Tab 3 Collinearity analysis of each characteristic variable
Note:A.Nomogram model to predict migraine.B.An example of nomogram model to predict migraine.
2.3.1 区分度 通过绘制预测概率的ROC曲线,分别计算了建模组和验证组的曲线下面积(area under the curve,AUC)(图2)。建模组和验证组判别的AUC分别为0.896[95%置信 区 间(confidence interval,CI)0.842 ~0.950 ]和0.884 (95%CI0.793 ~0.976 ),说明列线图预测模型具有良好的区分度。
图2 建模组(A)和验证组(B)的ROC曲线Fig 2 ROC curve of the modeling group(A)and validation group(B)
2.3.2 校准度 建模组和验证组的校准曲线图(图3A、3B)显示,2组校准曲线与标准曲线均极为接近,说明模型在建模组和验证组中较为一致。
图3 建模组(A)和验证组(B)的校准曲线Fig 3 Calibration curve of the modeling group(A)and validation group(B)
头痛是临床上最常见的症状之一。头痛病因多达数百种,对头痛进行正确诊断就普通临床医师而言是一项极具挑战性的任务。尤其针对原发性头痛,因为缺乏明确的实验室或影像学检查辅助,没有比较客观的金标准,诊断分类较困难,且受医师的主观因素影响较大,结论稳定性差,治疗效果往往不佳。偏头痛和紧张型头痛位居原发性头痛前2位。2017年全球疾病负担调查[13]结果显示,按失能所致生命损失年计算,偏头痛为第二位致残性疾病。在2019年神经系统疾病负担排名中,偏头痛单病种的疾病负担位列第二,仅次于卒中(缺血性+出血性)[14]。头痛的高患病率、高致残率、高经济负担的部分原因是由于目前的诊疗不规范。规范头痛诊断,提高头痛临床诊断准确率极为重要。在繁忙的门诊工作中,排除继发性头痛预警指标后,对原发性头痛如何进行快速分类诊断,仍是目前研究的方向。预测模型可以实现高危人群的筛查,实现个体化的诊断预测。列线图则是预测模型的一种。列线图将复杂繁琐的回归方程可视化,更加方便临床医师获得数据。近年来,列线图预测模型已广泛应用于多种疾病的诊断和预后分析。
通过单因素和多因素Logistic分析,本研究得出几个区分偏头痛和紧张型头痛的独立诊断预测因子:病程、头痛是否位于后枕部、头痛的严重程度、是否伴有恶心/呕吐、是否伴有畏光/畏声、活动后头痛的变化。既往针对简化头痛诊断标准的研究[15]中,通过恶心所建立的偏头痛单变量模型可以达到阳性似然比4.80,阴性似然比0.23 ;通过恶心、畏光/畏声、搏动性头痛所建立的偏头痛三变量模型,阳性似然比达到6.70 ,阴性似然比0.23 。Martin等[16]提出的一种偏头痛简化筛查工具,更是进一步强调了恶心、畏光在偏头痛诊断中的重要性,其中是否具有致残性、是否伴有恶心、是否伴有畏光3项特征所构成的筛查模型,达到了81%的敏感性。尽管紧张型头痛患者易合并焦虑抑郁等情况,但导致患者食欲不振、恶心/呕吐等情况较少。可见,恶心/呕吐、畏光/畏声对诊断偏头痛起着至关重要的作用,这与本研究结果一致。此外,本研究还得到了病程、头痛是否位于后枕部、头痛的严重程度、活动后头痛的变化也是区分紧张型头痛和偏头痛的重要判别因子。病程较长,头痛不位于后枕部、头痛程度较重、活动后头痛加重患者更易诊断为偏头痛,与ICHD Ⅲ相一致。
本研究首次提出偏头痛和紧张型头痛诊断预测的列线图模型。该模型基于6个临床指标,可以帮助临床医师提高快速识别患者偏头痛的概率。在建模组中,该模型的AUC值为0.896 ,在验证组中为0.8 8 4 。校准曲线显示,模型在建模组和验证组具有较强的一致性。这些研究结果表明,该模型在区分偏头痛和紧型性头痛患者中具有较高的鉴别能力。
本研究也存在不足之处:①模型只纳入了偏头痛和紧张型头痛2种发病率最高的头痛类型,虽然解决了很大部分头痛的诊断问题,但继发性头痛和其余多种原发性头痛均未纳入,需要进一步完善。②本研究纳入的是就诊的头痛患者,对研究对象存在选择偏倚,较轻的未就诊的头痛患者未能纳入研究。③本研究样本量仍然较少,尽管通过Bootstrap进行了模型的内部验证,根据时间节点划分进行了模型的外部验证,但仍需收集更多的样本,同时需要进行多中心的验证,这将是下一步研究的方向。
综上所述,本研究基于病程、头痛是否位于后枕部、头痛的严重程度、是否伴有恶心/呕吐、是否伴有畏光/畏声、活动后头痛的变化构建了鉴别偏头痛和紧张型头痛的列线图模型,提高了对偏头痛和紧张型头痛的早期识别和诊断能力。该模型在建模组和验证组均具有较好的区分度和校准度,能实现对偏头痛和紧张型头痛的鉴别诊断,有助于临床医师进行快速直观的评估,从而采取个体化的治疗策略,帮助患者缓解头痛。
参·考·文·献
[1]Hagen K,Åsberg AN,Uhlig BL,et al.The epidemiology of headache disorders:a face-to-face interview of participants in HUNT4[J].J Headache Pain,2018,19(1):25.
[2]Yu SY,Liu RZ,Zhao G,et al.The prevalence and burden of primary headaches in China:a population-based door-to-door survey[J].Headache,2012,52(4):582-591.
[3]Yao CY,Wang Y,Wang LJ,et al.Burden of headache disorders in China,1990—2017:findings from the Global Burden of Disease Study 2017[J].J Headache Pain,2019,20(1):102.
[4]Saylor D,Steiner TJ.The global burden of headache[J].Semin Neurol,2018,38(2):182-190.
[5]Takeshima T,Wan Q,Zhang Y,et al.Prevalence,burden,and clinical management of migraine in China,Japan,and South Korea:a comprehensive review of the literature[J].J Headache Pain,2019,20(1):111.
[6]Leonardi M,Raggi A.A narrative review on the burden of migraine:when the burden is the impact on people's life[J].J Headache Pain,2019,20(1):41.
[7]International Headache Society.Headache classification committee of the international headache society(IHS)the international classification of headache disorders,3rd edition[J].Cephalalgia,2018,38(1):1-211.
[8]尹梓名,董钊,孔祥勇.基于国际头痛诊断标准的原发性头痛辅助决策系统[J].计算机应用研究,2019,36(02):461-465.
[9]Krawczyk B,Simić D,Simić S,et al.Automatic diagnosis of primary headaches by machine learning methods[J].Central Eur J Med,2013,8(2):157-165.
[10]Khayamnia M,Yazdchi M,Heidari A,et al.Diagnosis of common deadaches using hybrid expert-based systems[J].J Med Signals Sens,2019,9(3):174-180.
[11]Simić S,Banković Z,Villar JR,et al.A hybrid fuzzy clustering approach for diagnosing primary headache disorder[J].Log J IGPL,2021,29(2):220-235.
[12]Jun FEH.Regression modeling strategies with applications to linear models,logistic regression,and survival analysis[M].New York:Springer Verlag,2001.
[13]GBD 2017 Disease and Injury Incidence and Prevalence Collaborators.Global,regional,and national incidence,prevalence,and years lived with disability for 354 diseases and injuries for 195 countries and territories,1990—2017:a systematic analysis for the Global Burden of Disease Study 2017[J].Lancet,2018,392(10159):1789-1858.
[14]GBD 2016 Neurology Collaborators.Global,regional,and national burden of neurological disorders,1990—2016:a systematic analysis for the Global Burden of Disease Study 2016[J].Lancet Neurol,2019,18(5):459-480.
[15]Martin VT,Penzien DB,Houle TT,et al.The predictive value of abbreviated migraine diagnostic criteria[J].Headache,2005,45(9):1102-1112.
[16]Lipton RB,Dodick D,Sadovsky R,et al.A self-administered screener for migraine in primary care:the ID migraine validation study[J].Neurology,2003,61(3):375-382.