李红艳 徐文 胡蓉 张丽 韩德民
1 首都医科大学附属北京同仁医院耳鼻咽喉头颈外科(北京 100730); △ 现在首都医科大学附属北京天坛医院耳鼻咽喉科
嗓音相关生活质量评估是嗓音疾病评估中的极重要部分, 1997年Jacobson等[1]提出的嗓音障碍指数(voice handicap index,VHI)量表在此类评估方法中最被国际所认可。本研究前期工作已证实,该量表的中文版也具有良好的信度和效度,是了解嗓音疾病对患者生理功能、社会及心理功能影响的一个简便、经济、有效的手段,可以作为嗓音疾病严重程度及治疗效果评估的有益补充工具[2,3]。但该量表有30个条目,在一定程度上限制了它的推广应用,而简化量表可以更节约时间,提高统计分析效率,便于存档记录,故部分学者为了使其更加简洁、更便于推广使用,在30个条目的基础上开展了相应的简化研究,临床应用最广的、最被肯定的为Rosen等医师根据临床经验挑选其中的10个条目组成的VHI-10简化版[4~7]。虽然此简化版具有很好的可靠性和灵敏性,但考虑到东西方经济文化的差异,并且医师选择并不能完全代表患者的感受,本研究设计了新的条目筛选方法,开展了大样本VHI-30简化研究,以探讨更适合中国国情的嗓音障碍指数量表简化中文版。
1.1 临床资料 2006年8月至2009年8月来北京同仁医院耳鼻咽喉头颈外科就诊的嗓音疾病患者5 591例,年龄6~88岁,中位数44岁;男2 449例,女3 142例。其中第一年病例为1 766例,第二、三年病例为3 825例,含喉显微镜下手术或喉部肉毒素注射病例424例(手术患者6个月后随访,痉挛性发声障碍患者肉毒素注射后2个月随访)。包括:慢性喉炎或声带角化1 446例、声带良性增生病变(声带小结、声带息肉、声带囊肿、声带任克水肿)3 017例、声带肿瘤(声带良性肿瘤、声门型喉癌)405例、声带沟267例、功能性发声障碍62例、单侧声带麻痹307例、痉挛性发声障碍87例。手术或喉部肉毒素注射病例包括声带角化21例、声带良性增生性病变258例(声带息肉184例、声带囊肿42例、声带任克水肿32例)、声带肿瘤54例(局限于声带的成人喉乳头状瘤、血管瘤、纤维瘤等声带良性肿瘤36例、早期声门型喉癌18例)、病理性声带沟31例、单侧声带麻痹28例、痉挛性发声障碍32例。排除了急性喉炎、喉外伤、变声期发声障碍、双侧声带活动不良、声门上、声门下型喉癌;声带病变外院治疗方法不明者;复杂嗓音疾病。所有患者均经频闪喉镜和嗓音声学评估,部分患者还经喉肌电图、喉部CT、病理等检查进一步明确临床诊断。
对照组为120例无嗓音疾病者,既往无发声异常,无喉部疾病史,无呼吸系统及神经肌肉系统疾病史,亦无嗓音治疗历史。年龄16~71岁,中位数为36岁;女70例,男50例。受调查者以自愿为原则,签署知情同意书。
1.2 评估方法 所有研究对象均进行发声质量医师听感知评估和VHI量表评估。统计分析1 766例嗓音疾病患者VHI量表评分以筛选简化版的条目;统计分析3 825例以及健康对照组的VHI量表评分以检验简化版的信度和效度,并与Rosen等提出的VHI-10简化版进行比较评价。
1.2.1 VHI量表评估 采用Jacobson等提出的VHI量表的中文翻译版(附1)[2]。VHI评估将嗓音异常对其生活质量的影响分为:生理(physical,P)、功能(functional,F)和情感(emotional,E)3部分,每部分包括10个问题条目,患者对每个问题进行打分,相应选项分别代表该感受发生的频度:“无”为0分;“很少”为1分;“有时”为2分;“经常”为3分;“总是”为4分。每一部分的分数即10个条目得分的总和,范围为0~40分,总分为3部分总和,范围为0~120分。某一方面分数越高,说明嗓音障碍对患者这一方面影响越大,总分越高说明患者对自己发音障碍主观评估越严重。
1.2.2 Rosen等提出的VHI-10简化版[4](以下简称VHI-10®)评估 条目包括F1、F2、F8、F9、F10、P3、P5、P6、E4、E6。
1.2.3 发声质量听感知评估 采用日本言语语音学会提出的GRBAS分级标准[5],对受试者发声质量进行主观评估。以总嘶哑度G(grade)对嗓音总体异常程度进行分级:0级为正常;1级为轻度异常;2级为中度异常;3级为重度异常。均以同样的内容和方式进行病史询问,受试者以最自然的音调和音量回答,在环境噪声小于45 dB(A)的检查室里,由3名从事嗓音医疗专业人员分别评分后,最终平均进行分级。
1.3 统计学方法 采用SPSS 11.5统计软件进行统计学分析。简化版的条目筛选采用聚类分析,简化版的信度和效度检验采用一致性检验(Cronbach α系数)、重测信度(相关系数r)、相关性分析,差异的显著性检验(区分效度)采用秩和检验。
2.1 嗓音障碍指数量表中文版的简化 VHI 30个条目之间行聚类分析(Pearson系数作为聚类统计量对指标聚类,P<0.05)(图1),根据简化版条目不能过多或过少原则,选择按纵线处划分,初步确定简化版所包含条目数的三种可能,从左至右30个条目依次可分别聚类为13、10、7个条目,结合VHI各条目平均得分大小(表1),将同一聚类条目中得分高者选为代表,进一步确定简化版的具体条目(表2)。
2.2 嗓音障碍指数量表简化中文版VHI-7、VHI-10、VHI-13的评估比较 评分方面:VHI-7评分较低, VHI-10、VHI-13评分明显增加,且VHI-10较VHI-13评分变化更显著;信度分析:三个简化版的重测信度均在0.990以上;内部一致性:VHI-10、VHI-13与原量表的相关性均很好,但VHI-7略差。与VHI-10®相比,VHI-7较差,VHI-10、VHI-13各项指标更佳(表3)。因此首先筛除VHI-7简化版。
图1 嗓音障碍指数30个条目之间的聚类分析(n=1 766例)
条目FPE10.952.121.0021.451.761.6131.092.291.2740.982.651.8950.952.001.0661.032.750.6870.921.420.8480.901.660.7691.221.310.81100.811.340.59
2.3 嗓音障碍指数量表简化中文版VHI-10、VHI-13进一步评估比较(效度检验) 将患者按疾病分组进行多个独立样本的秩和检验,结果显示:不同嗓音疾病组患者VHI-10、VHI-13评分均存在差异,患者总体与对照组相比较,评分差异有统计学意义(Z值分别为17.42、17.46,P值均为0.000), 且VHI-10 、VHI-13与VHI-30评分之比都大于各自的期望值0.333、0.433(二者各自条目数与总条目数之比),说明简化版有很好的区分效度且比原量表灵敏度更高,同时与VHI-10®相比,上述指标的差异更显著(表4)。
表2 嗓音障碍指数量表简化中文版VHI-7、VHI-10、VHI-13组成条目
表3 嗓音疾病患者VHI-7、VHI-10、VHI-13
按医师主观听觉评估总嘶哑度G分级分组,比较VHI量表评分显示(图2):VHI-10、VHI-13评分均随总嘶哑度分级增加而增大;将各级的VHI评分进行多个独立样本两两秩和检验,各级间差异也均有统计学意义(z值范围5.735~9.861,P值均为0.000);与VHI-10®比较,本组试验筛选的简化版医师听主观评估各级间VHI评分差异更显著。
嗓音疾病患者治疗后VHI评分均显著下降(图3),不同嗓音疾病患者术前术后VHI-10、VHI-13评分秩和检验差异均有统计学意义(P<0.05),且本研究筛选的简化版较Rosen等选择的简化版术前术后变化更显著。
条目筛选方法是采用以Pearson相关系数作为聚类统计量对指标聚类的统计方法,可以观察嗓音障碍指数各条目之间的关系密切程度,将意思接近、研究对象对其打分趋于相同的条目依次聚合,同时还可以根据需要确定含不同条目数的多个方案进行测试、比较,以筛选更大的保留原量表信度及效度的简化版。考虑到简化版条目过少会造成评估信息丢失过多,条目过多会失去简化的意义,结合聚类分析与各条目评分结果,本研究初步确定了VHI-7、VHI-10、VHI-13三个嗓音障碍指数量表简化中文版,结果显示,VHI-7由于条目偏少,评估信息丢失过多,与另两个简化版相比评分明显减少,代表量表内部一致性和同质性的Cronbach α系数、稳定性和可靠性的重测相关系数这2个重要信度指标以及与原量表的相关系数均明显降低,因此被首先筛除。
图2 听主观G评估各分级VHI简化版评分中位数(n=3 825例)
组别 诊断例数VHI-10VHI-10®VHI-13VHI-10/VHI-30VHI-10®/VHI-30VHI-13/VHI-30对照组1201.65±2.371.60±2.351.86±2.620.565±0.382 0.523±0.364 0.569±0.393 嗓音疾病患者3 82519.63±11.7918.21±11.5322.05±14.280.472±0.161 0.403±0.173 0.559±0.175 痉挛性发声障碍5835.37±8.2732.93±8.2237.62±11.460.432±0.105 0.395±0.119 0.468±0.135 单侧声带麻痹21133.26±8.1331.11±8.3935.74±10.870.451±0.142 0.412±0.121 0.497±0.144 功能性发声障碍4231.45±7.4829.47±8.1233.87±11.740.447±0.112 0.398±0.109 0.486±0.137 病理性声带沟16827.32±9.5124.52±9.3429.45±12.930.425±0.125 0.386±0.113 0.469±0.127 声带肿瘤30524.21±9.2320.73±9.6125.97±11.810.453±0.127 0.362±0.124 0.478±0.115 声带良性增生病变2 04818.72±8.2616.31±8.2221.61±10.320.493±0.143 0.411±0.135 0.568±0.152 慢性喉炎或声带角化99316.11±9.39 14.67±9.5219.03±11.800.467±0.142 0.399±0.131 0.556±0.167Z值17.4216.8417.46P值0.0000.0000.000
注:Z值、P值均为嗓音疾病患者与健康对照组评分差异性比较
图3 424例各种嗓音疾病手术患者治疗前后VHI简化版评分中位数
本研究又对VHI-10、VHI-13简化版进一步行效度评估,结果显示,这两个简化版量表能够很好鉴别嗓音的正常和异常,能够在一定程度上反应嗓音障碍的严重程度,不但都保留了VHI-30很好的区分效度,且在观察嗓音障碍方面更加敏感、有效。与GRBAS中的G分级比较, VHI-10、VHI-13与原量表表现一致,嗓音疾病整体分析医师听感知评估嘶哑程度重的VHI评分也高,均呈正相关,具有较好的一致性,进一步印证了这两个简化量表的可靠性。治疗后VHI-10、VHI-13评分明显下降,证实其与原量表一样可以作为疗效评价的指标之一,可以很好的反应治疗后嗓音恢复的情况,可作为经济、简单的随访手段应用于临床。VHI-10与VHI-13简化版相比,虽然减少了3个条目,但同样具有很好的信度和效度,甚至内部一致性、重测信度更高,且简化版与原量表评分比和简化版与原量表的条目数比的差异更显著。
本研究确定的VHI-10和VHI-13简化版量表均可以很好的包含原量表生理、功能、情感三部分的条目内容。但VHI-10去除了VHI-13中P7、 P9、E5三个条目,其中,P7“我会尝试改变我的声音以便听起来有所不同” 隐含着患者是否存在需要改善的嗓音情况,即嗓音稳定度(P2)和清晰度(P6)的变化;P9“我的声音晚上会更差” 也可认为包含在 P2“一天之中我的嗓音听起来不稳定,会有变化”之中。因此,与VHI-13相比,VHI-10在丢失评估信息不多的情况下更加概括、简洁。
与Rosen等提出的VHI-10®相比,本研究筛选的VHI-10简化版量表同样具有很好的信度指标,而效度评价结果则更佳,更多的保留了反映嗓音疾病对患者生活质量影响的信息,从而在评估嗓音疾病方面更加敏感,更具有代表性。条目组成分析可见,Rosen等提出的简化版功能占了5个条目,而本研究筛选出的简化版生理条目最多,共有5个,功能条目较少,为3个,考虑是由于东西方文化、生活方式、情感表达、关注角度等多方面差异使中国人更重视嗓音对生理的影响,而对功能和情感的关注略低。从条目内容比较可见,相同的分别为F2、F9、P3、P6、E4,不同的包括:功能方面,筛除了F1、F8、F10,补充了F6,这可能与当前大多数中国人没有广泛的社交生活,谈话对象多为朋友、邻居或亲人,且嗓音嘶哑对收入的直接影响较少有关;生理方面,由P1代替了P5,可能与患者嗓音异常时自觉发声时气短的发生率更高有关,增加的P2、P10,补充了除嗓音清晰度(P6)以外的嗓音稳定度(P2)和最严重失声情况(P10) 的记录,使对嗓音异常的生理描述更加全面;情感方面,由E2代替了E6,可能与东方人的情感表达有关,虽然同样高度认可嗓音障碍导致自己很苦恼,但多不考虑自己的缺陷,却较在意别人的感觉和评价,即使进一步承认嗓音异常对性格有所影响,也仅愿意委婉地表达。
总之,相较于Rosen 等根据临床经验挑选的嗓音障碍指数量表简化版,本研究筛选的VHI-10、VHI-13嗓音障碍指数量表简化中文版更符合目前中国人群对生活质量、发声质量要求背景下的应用,其具有良好的信度和效度,可靠性高、实用性强、重复性好,可以作为简化版发声障碍自我评估工具应用。VHI-10在丢失评估信息不多的情况下,比VHI-13更加简洁,更易于推广使用。
1 Jacobson BH, Johnson A, Grywalski C, et al. The voice handicap index(VHI): Development and validation[J]. Am J Speech Lang Pathol, 1997, 6: 66.
2 徐文,李红艳,胡蓉,等.嗓音障碍指数量表中文版信度和效度评价[J].中华耳鼻咽喉头颈外科杂志,2008,43:670.
3 李红艳,徐文,韩德民,等.嗓音疾病自我评估特点及影响因素[J]. 中华耳鼻咽喉头颈外科杂志,2009,44:109.
4 Rosen CA, Lee AS, Osborne J, et al. Development and validation of the voice handicap index-10[J]. Laryngoscope, 2004, 114:1 549.
5 Wuyts FL, De Bodt MS, Van de Heyning PH. Is the reliability of a visual analog scale higher than an ordinal scale? An experiment with the GRBAS scale for the perceptual evaluation of dysphonia[J]. J Voice, 1999, 13:508.
6 Lam PK, Chan KM, Ho WK, et al. Cross-cultural adaptation and validation of the Chinese voice handicap index-10[J]. Laryngoscope, 2006, 116:1 192.
7 Amir O, Tavor Y, Leibovitzh T, et al. Evaluating the validity of the voice handicap index-10 (VHI-10) among Hebrew speakers[J].Otolaryngol Head Neck Surg, 2006,135:603.