吴萍,荣瑶,吴天棋,乔磊,白玫,吴航
首都医科大学宣武医院 医学工程处,北京 100053
随着科学科技的进步,医疗设备作为疾病诊断治疗的辅助手段,其产品功能在集成性和综合性上快速发展。一体化正电子发射型磁共振成像(Positron Emission Tomography/Magnetic Resonance Imaging,PET/MR)是集成了放射性核素在体内聚集成像和磁共振成像功能[1],并将PET 分子图像与MR 结构图像结合在一起的全新高端医疗影像设备。根据《中国医疗器械行业数据报告(2022)》[2]调查结果显示,我国核医学类设备市场以进口品牌为主,2017—2021 年全国核医学类设备主要品牌保有率中,进口品牌保有率最高的为美国GE(2021 年约为57%),国产品牌保有率最高的为上海联影(2021 年约为3%)。随着国产PET/MR 设备的发展,市场对该类设备的要求不仅局限于安全有效性,更是对其稳定可靠的功能性和良好的人机协同性提出了更高的要求。因此,医疗设备在使用过程中的可用性评价成为亟待解决的问题。医疗器械可用性是指预期用户在预期使用场景下正常使用医疗器械时,保证医疗器械安全有效使用的用户接口易用特性[3]。其中接口是指用户与医疗器械的全部人机交互[4]方式,包括医疗器械的形状尺寸、显示反馈、连接组装、操作控制、培训材料等。本文旨在讨论国产PET/MR 设备的人机接口协同性,探讨该类设备在临床中的可用性评价方法。
本文研究对象为上海联影公司PET/MR 设备,型号为uPMR790,该设备于2018 年上市。
本文采用层次分析法[5]统筹构建可用性评价方法,层次分析法是基于网络系统理论和多目标综合评价的层次权重决策分析方法,即将与决策总是有关的元素分解成目标、准则、方案等层次并进行定性和定量分析的决策方法[6]。具体步骤如下所示。
(1)确定评价目标[7]。本文所述案例拟讨论PET/MR 设备软件界面和硬件接口的可用性评价。医疗器械可用性评价应结合用户、使用场景和用户接口3 个核心要素予以综合考量。
(2)建立层次模型。层次模型以自上而下的思路对目标进行分解,其中待评价主要用户为影像科技师和医师等;待评价装备的使用环境,包括技术环境和物理环境等,保证在评价过程中待评价装备是在预期使用场景下正常使用;待评价的用户操作任务主要包括设备日常质控和患者扫描、图像后处理及高级功能任务等。
(3)设立专家组[8]。本项目专家组人数共20 人,其中从业临床实操技师及医生共15 人(占比75%),设备研发人员5 人(占比25%)。工作经验的长短人数和占比分别为:<5 年为10 人,占比50%;5~10 年为4 人,占比20%;10~20 年为5 人,占比25%;>20 年为1 人,占比5%。从事相关行业5 年以上的专家占总人数的50%,基本符合项目需求。
依据专家简历和自评情况,专家权威程度评分包含两个决定性因素:专家打分的判断依据Ai 和专家对问题的熟悉程度As。专家判断依据量化打分包含实践经验和理论分析两部分,“理论分析”因子和“实践经验”因子的分值从高到低依次为0.5、0.4、0.3、0.2、0.1 和0 分,其评分为两部分总分。As 量化打分标准如表1 所示。
表1 专家熟悉程度(As)量化打分表
专家的权威程度用权威系数Ag 表示,计算方法如公式(1)所示。
以均值进行归一化计算后的第i位专家的权威程度系数为Agi,计算方法如公式(2)所示。
(4)设计调查问卷。本文根据实际需求和评价目标确定评价参数,形成调查问卷。调查问卷包括答卷人个人信息和设备可用性两部分内容。将评价参数依据自顶而下的原则进行分解,共分为三级,其中:依据设备软件或硬件设定一级指标2 项,依据PET 无源质控、PET有源质控等因素设定二级指标13 项,依据具体评价方案设定三级指标84 项。问卷设计包括指标明细及指标重要程度(指标权重)两部分内容,每条指标附具体解释及打分规则,每条指标按满分100 分计算,专家根据重要程度自行打分。
(5)计算评价指标权重。本文采用德尔菲法确定评价量表中各项指标的权重,德尔菲法(也称专家调查法,是一种反馈匿名函询法)是依靠专家知识及智慧评估并判定指标权重的一种重要方法,具有匿名性、统计性和反馈性等特征,保证评价结果较为科学合理。
根据Ag 和专家对各项指标的评分,计算各评价指标的评分权重。本问卷的三级指标分为共性三级指标和特殊三级指标两种。在计算第i位专家对第k3个三级指标的评分Xik3时具有差异:共性三级指标具体包括按钮响应及时性的重要性、按钮布局合理性的重要性、操作菜单响应及时性的重要性、操作菜单布局合理性的重要性、操作提示明确性的重要性、接口设计导致发生误操作影响的重要性、各接口完成预期任务的重要性7 个,对应二级接口指标共12 个。需要对其二级指标进行权重拆分计算,以获得三级指标权重分值。计算方法如公式(3)所示。
式中,Cik3为第i位专家对第k3个三级指标的评分,Max(Cik3)为所有专家对第k3个三级指标评分中的最大值,m2为第k3个三级指标对应的二级指标序数,Cim2为第i位专家对第m2个二级指标的评分。特殊三级指标采用直接评分的方式,所评分值即Xik3。第k3个三级指标的加权平均分Zk3计算方法如公式(4)所示:
式中,N为专家人数。
第k3个三级指标权重系数Wk3计算方法如公式(5)所示。
(6)参与调查对象。本文根据用户对设备的熟悉程度设定参与测试人员的类型与数量,现阶段主要为操作设备的技师和医生,用户采取手机微信识别调查问卷二维码的方式独立完成问卷调查,以保证测试结果客观有效。
本文使用SPSS 22.0 软件进行统计学分析,统计方法选择秩和检验,以P<0.05 为差异有统计学意义。
本文建立的评价指标体系如图1 所示,依据上述计算方法及计算公式,可以得到本调查问卷中各项评价指标的评分及权重。Ai 在[0.58,1.0]之间,平均值为0.824;As 在[0.55,1.00]之间,平均值为0.79;Ag 在[0.6875,1.00]之间,平均值为0.807。在该项目的研究中所获取的专家整体权威水平符合基本研究要求。
图1 评价指标体系框架示意图
本次参与调查对象涉及医院18 家,共计82 人次,其中有效问卷79 份。
2.2.1 二级指标评分
二级指标评分如图2 所示,生理信号门控单元接口可用性评价评分最低,PET 无源质控可用性评价评分最高,各指标之间无显著性差异。
图2 二级指标评分均值图
2.2.2 职称与评分统计
设备操作者的职称能够直接反应其在该领域工作的专业程度,本文讨论操作者职称对指标评分的影响。将被调查者分为初级及以下、中级、副高级、高级4 个组别,不同职称人员对各指标的评价分数统计表如表2 所示。由表中可见,副高级、高级职称人员对指标评分略高于中级及以下人员,但组间无显著性差异。
表2 不同职称人员对各指标的评价分数统计表(分)
2.2.3 操作时长与评分统计
由于人为因素在设备临床可用性评价中具有重要作用,操作者使用设备的时间年限决定了其临床工作的熟悉程度。本文将被调查者的设备操作时间分为3 个月以内、3~12 个月和12 个月以上3 个组别,其评分结果如表3 所示。由表中可见,不同操作时长人员对各项接口的评分具有相同趋势,即使用时长少于3 个月人员的各项评分均小于其他两组人员、使用时长为3~12 个月人员的各项评分均大于其他两组人员。使用时长在3 个月内的操作者的评分明显低于另外两组别,差异具有显著性(Z=-2.021,P=0.043<0.05);对逐个接口变量进行统计学检验,其中PET 无源质控(P=0.027)、MR 扫描重建(P=0.023)、参数测量接口(P=0.034)、控制盒接口(P=0.033)、控制面板接口(P=0.011)、线圈接口(P=0.023)6 个变量差异均具有显著性(P<0.05)。
表3 操作者使用时长与评分统计表(分)
国家卫生健康委于2023 年3 月21 日发布《 大型医用设备配置许可管理目录(2023 年)》[9]表明,PET/MR由甲类调整为乙类管理。随着配置要求的降低,未来PET/MR 设备作为一种多模态融合的成像技术以及其在神经、肿瘤、心血管疾病方面的诊断和评估优势[10-11],其装机量将有所增加,据此,建立国产PET/MR 设备临床可用性评价方案的需求更加紧迫[12-15],探讨该类设备临床可用性将对推动国产高端影像设备发展、提高市场占有率具有更重要的意义。
经调查,PET 无源质控可用性评价指标评分最高,说明PET 无源校正相关按钮和菜单的响应及时性和布局合理性、相关提示、避免误操作、预期任务完成情况等方面的可用性较优于其他指标;生理信号门控单元接口可用性评价指标评分最低,说明生理信号门控单元在操作便捷性、指示灯提示、信号接收及时性和稳定性、预期任务完成情况等方面的可用性较劣于其他接口,可能与设备硬件设计有关[16],也可能是人为因素,包括但不限于操作者的熟悉程度、熟练程度、过往经验等。各指标之间差异无显著性,表明该设备的人机接口协同性整体稳定,无明显缺陷,能够满足临床辅助诊断使用。
将操作者职称、操作时长分别与评分进行统计分析发现,副高及以上职称人员的指标评分略高于中级及以下职称人员,但组间无显著性差异;人员操作时长不同,其对各项接口的评分具有相同趋势且具有显著性差异。该结果满足学习曲线[17-18](也称为经验曲线)趋势,即随着操作者经验的丰富,其操作速度提高、错误率降低,且能够提出由经验产生的设备设计改进建议[19-21]。
人为因素在设备临床可用性评价中具有重要作用[22],本文仅讨论人员职称和设备操作时长两个影响因素,未涉及人员其他相关因素。后续工作拟扩大调查人员维度,探讨人因在设备可用性评价中的影响作用。随着国产PET/MR 设备的不断发展,设备性能指标和接口设计均会有不同程度的改变,本文基于德尔菲法建立的评价指标参数体系需要参考设备技术发展、临床评价反馈、不良事件等多方面依据,不断更新指标,以适应设备技术发展,保持评价方法的客观性。
本文建立PET/MR 设备可用性评价参数体系,分别通过Ag 和问卷调查打分的方式确定评价参数权重与参数评价分值。经统计分析,PET 无源质控可用性较好,该设备整体的人机接口协同性基本稳定,无明显缺陷;所有参与调查对象中,初、中级职称人员对设备可用性评分略低于(副)高级职称人员,但无显著性差异;操作者使用时长不同,对设备可用性评分不同但评分具有相同趋势,使用时长为3 个月内的操作者的评分明显低于另外两组别,差异具有显著性;操作者使用时长不同,对特定6 个参数的评价具有显著性差异。本文基于层次分析法建立的可用性评价体系能够用于国产PET/MR 设备临床可用性评价,基于德尔菲法形成的可用性调查问卷为探讨国产PET/MR 设备可用性评价方法提供参考。