事件率对专家与新手放射科医生医学图像视觉搜索的影响：来自眼动的证据*

2017-07-18 11:54:37陈梅香白学军

心理与行为研究 2017年3期

关键词：漏报新手次数

陈梅香白学军

（1教育部人文社会科学重点研究基地天津师范大学心理与行为研究院，天津 300074）（2厦门大学心理咨询与教育中心，厦门 361005）

事件率对专家与新手放射科医生医学图像视觉搜索的影响：来自眼动的证据*

陈梅香1,2白学军1

（1教育部人文社会科学重点研究基地天津师范大学心理与行为研究院，天津 300074）（2厦门大学心理咨询与教育中心，厦门 361005）

探讨低事件率对医学图像视觉搜索漏报的影响，用SMI250眼动仪记录放射科专家与新手检测胸部X光片的过程。结果发现：（1）专家和新手在低事件率（10%）下的漏报率多于高事件率（50%），但专家在高低事件率的漏报率的差值小于新手。（2）专家和新手在低事件率下的注视次数少于高事件率，眼跳幅度、扫描错误比例大于高事件率。结论认为：专家与新手进行医学图像视觉搜索时出现低事件率效应，低事件率效应主要是由于扫描错误引起的。

专家，新手，放射科医生，事件率，视觉搜索。

1 引言

低事件率效应（low prevalence effect）指视觉搜索任务中，随着事件率降低而出现漏报率增加的现象（Wolfe,Horowitz,&Kenner,2005）。Wolf等人（2005）采用安检图片视觉搜索任务，比较不同事件率（50%、10%和1%）对视觉搜索绩效的影响时发现，与高事件率条件（50%）相比，当事件率低至1%时，目标被漏报平均达30%。

对于低事件率效应有多重决策模型和优势反应抑制失败两种观点。多重决策模型认为低事件率会改变被试的搜索行为和知觉，使被试变得更加保守而倾向于进行没有目标的按键反应（Wolfe et al., 2005）。Fleck和Midriff（2007）提出优势反应抑制失败说，主张低事件率条件下，被试出现了更多的漏报错误，但是这种漏报错误并不是由于被试没有看到目标物造成的，而是由于他们的动作错误导致的。随后，Wolfe等（2007）、Van-Wert，Horowitz和Wolfe（2009）、Kunar，Rich和Wolfe（2010）研究表明即使给被试纠正错误的机会也不能有效地减少漏报率。可见，针对低事件率搜索中的漏报错误的产生机制存在两种截然不同的解释，一种观点归之于识别阶段的无觉察，而另一种则归之于反应阶段的动作失误（李富洪,曹碧华,肖风,李红,2011）。

医学图像是一种特殊的搜索任务，同样具有事件率低的特点。在影像学的检查中，医生的每次搜索并不能确定病灶（如肿瘤）是否存在，医院常规体检和临床检查的事件率也不均衡。研究表明，在乳腺X光影像检查人群中，其事件率约为0.3%（Gur et al.,2004;Pisano et al.,2005）。Kundel（2000）开展的12项关于肺癌检测的调查，发现肺癌发病率从0.9%-47.6%。虽然医学影像搜索有低事件率的特点，但是一旦出现漏报，会造成严重的后果，导致患者错过最佳的治疗时机，危害到患者的生命安全，引起重大医疗事故。

有研究表明事件率对被试搜索绩效的影响不显著（Gur,Rockette,Warfel,Lacomis,&Fuhrman, 2003;Gur et al.,2004），甚至随着事件率的提高，观察者回答的确信度（confidence ratings）降低（Gur et al.,2007）。而另有研究表明随着事件率的增加，被试提高了搜索绩效。Ethell和 Manning（2001）实验中使用手腕破裂出现概率为 83%、50%和22%，结果表明随着概率的增加，被试检测的绩效提高；Evans，Birdwell和Wolfe（2013）比较了1%事件率和50%事件率下被试的搜索绩效，结果显示低事件率下漏报率为30%，高事件率下漏报率为12%。研究结果的分岐，可能的原因是实验的材料、实验程序操作以及被试样本量少。已有的研究大多停留在现象学的描述或解释上，且当前关于低事件率效应的解释是基于安检任务下低事件率效应产生机制的理论探讨，由于医学图像复杂性的特点，已有的理论能否适用于医学图像，还有待于进一步考察。

在已有研究的基础上，本研究以胸部X光片（以下简称胸片）为实验材料，试图去探讨低事件率对不同经验水平放射科医生医学图像视觉搜索漏报的影响以及漏报错误产生的原因。肺癌早期表现多为肺结节，临床上，肺结节指的是肺部类直径在3-30mm间的局灶性不透明病灶（Lee,Kouzani,& Hu,2012;Valente et al.,2016）。由于隐蔽位置的结节较易漏报（贾守勤,2009;Kundel,2015），因此本研究针对肺隐蔽位置的结节进行探讨。参考已有研究关于低事率值的设定，结合医学图像视觉搜索的特点，本研究将10%作为低事件率（Egglin& Feinstein,1996;李宇涵,2014;王陵宇,2015）。

2 方法

2.1 被试

本研究选取专家和新手2组被试（Law,Atkins, Kirkpatrick,Lomax,&Mackenzie,2004;Giovinco et al.,2015）。专家医生选自福建省某三级甲等医院，选择标准是：①看胸部X光片经验10年以上；②职称为副主任医师及以上（Ericsson,Krampe,& Tesch-R觟mer,1993;Ericsson,2006）。新手选取的是医学院在读研一影像学专业学生，目前在医院临床实习。研究共选取被试30人，其中专家医生15人（男11人），平均年龄43.73岁（SD=5.31）；新手15人（男8人），平均年龄24.53岁（SD= 0.52）。所有被试视力或者矫正视力正常，无眼部疾病，无色弱或色盲。所有被试给予一定费用作为其参加实验的报酬。

2.2 实验材料

80张胸片，其中40张正常，40张异常（有结节）。刺激材料显示尺寸为787（宽）×768（高）像素。正常图片以20张正常胸片为模板（10男10女），1张胸片重复2次。异常图片以20张正常胸片为模板（10男10女），在1张正常胸片里取1个隐蔽位置，操作2个大小不同的结节。参照医学标准，隐蔽位置取肺尖区、肺门区、心影后区、脊柱旁、横隔区、肋骨重叠区，共20个位置。本实验操作的结节大小为5mm-20mm，肺部结节只有1个。

为保证模拟结节的真实性，本实验材料由精通Photoshop的1名放射科住院医师制作，实验材料制作方法参照（Burgess,1999;Beutel,Kundel,& Metter,2000；Donovan&Litchfield,2013）。由2名放射科主任医师（平均工龄19.5年）对结节真实性或难度进行了5点评定。10%事件率下的实验材料在50%事件率实验材料的40张异常胸片里取16张。结果为：50%事件率下：对40张异常胸片结节是否符合临床的真实程度进行5点量表（1代表非常不真实,5代表非常真实）评定，两个评分者一致性系数为 r=0.90（肯德尔和谐相关,p< 0.001），评定均值为4.81（SD=0.41）。对结节的难度进行5点（1代表非常容易,5代表非常难）评定，两个评分者一致性系数为0.82（p<0.001），评定均值为4.23（SD=0.55）。10%事件率下，结节难度均值为4.21（SD=0.58）。对10%事件率下16个结节的难度值和50%事件率下40个结节的难度值进行t检验，结果为t=0.17，p>0.05。

2.3 实验仪器

实验仪器是SMI250眼动记录仪，采样频率为500Hz。戴尔19英寸TFT LCD显示器呈现刺激，刷新频率为100Hz，分辨率为1280×1024像素。实验程序采用iView 2.5进行编程。

2.4 实验设计

采用2（经验:专家、新手）×2（事件率: 50%事件率、10%事件率）的混合实验设计。经验为被试间因素，事件率为被试内因素。测量指标两部分：一是行为指标，主要包括漏报率、敏感性及判断标准；二是眼动指标，主要包括注视次数（fixation count，指被试超过 100ms的总注视次数）、平均注视时间（fixation duration average，指对每个注视到的刺激的编码和比较时间）、平均眼跳幅度（average saccade amplitude，指图像观看过程中被试眼跳的平均幅度）。本实验中，围绕结节轮廓以0.5厘米为半径，划定兴趣区（李富洪等人,2011;王陵宇,2015）。兴趣区内的注视，选取兴趣区内的停留时间（dwell time of AOI，指被试的眼睛停留在兴趣区内的时间，时间越长说明加工越多，反映了用于目标识别的效率）指标。

2.5 实验程序

被试坐在离显示器约60cm的位置，实验开始前向被试呈现指导语，指导语如下： “本实验的任务是识别和定位胸部结节。下面将看到一些胸部X光片，每一张X光片有一个或没有结节。请关注肺部有无结节，无需关注心脏、骨骼、大血管等结构。首先屏幕将出现一个注视点，请注视注视点，屏幕随后会呈现X光片。请仔细观看图像，如果您判断有结节，请将鼠标移到目标的位置并点击鼠标左键。同时鼠标点击您对判断的确信程度。如果判断没有结节，同样也需要用鼠标点击您对判断的确信程度。接下来请按空格键启动下一个刺激。”被试明白后进行眼睛较准，然后进行4个练习实验，直到被试对实验操作完全明白后进入正式实验。正式实验中每张胸片的观察时间不限。

整个实验包括：10%事件率的1个block，共160试次（中间设置1次休息时间，3分钟），50%事件率的1个block，共80个试次。两种事件率block的呈现顺序在被试间进行平衡。实验过程中根据被试的状况随时可以休息。实验分为前后两次施测，前后间隔一周时间。本研究要求被试对是否有结节进行5点评分（1-5），1代表没有结节，2-5代表有结节的确定性水平，越靠近5，确定性越高（Evans,Birdwell,&Wolfe,2013;Reed,Chow, Chew,&Brennan,2014）。

2.6 数据的整理与分析

删除图片上没有一个注视点及眼动仪误差造成的错误数据，占总数据的1.17%，采用Microsoft Excel、Spss17.0软件包对收集到的数据进行分析。

3 结果分析

3.1 专家与新手放射科医生医学图像视觉搜索绩效的比较

3.1.1 漏报率

专家与新手在高、低事件率条件下的漏报率具体见表1。

表1 专家与新手在高、低事件率下的漏报率（M±SD）（%）

对漏报率进行重复测量方差分析，结果发现：经验的主效应显著，F（1,28）=122.7，p<0.001，η2=0.81，专家的漏报率小于新手。事件率的主效应显著，F（1,28）=38.97，p<0.001，η2=0.58，50%事件率下的漏报率小于10%事件率。经验和事件率交互作用显著，F（1,28）=7.88，p<0.01。简单效应分析发现，专家与新手在10%事件率下的漏报率高于50%事件率（分别为p<0.05，p<0.001）。专家在10%事件率、50%事件率下的漏报率均小于新手（p<0.001）。

为进一步考察专家与新手受低事件率影响程度的差异，把10%事件率下的漏报率减去50%事件率下的漏报率，得到两组数据的差值，以差值为因变量进行专家和新手两组漏报率差值的t检验，结果为t=-2.81，p<0.01，表明专家受低事件率的影响程度远远小于新手。

3.1.2 判断标准与敏感性

专家与新手在高、低事件率下的判断标准和敏感性具体见表2。

表2 专家与新手在高、低事件率下的判断标准与敏感性（M±SD）

（1）敏感性方面

经验的主效应显著，F（1,28）=23.59，p< 0.001，η2=0.46，专家的敏感性大于新手的敏感性。事件率的主效应显著，F（1,28）=15.77，p< 0.001，50%事件率下的敏感性要高于10%事件率。

（2）判断标准方面

经验和事件率交互作用显著，F（1,28）= 5.62，p<0.05，η2=0.17。简单效应分析发现，专家在10%事件率和50%事件率下的判断标准无显著差异，p>0.05；新手在10%事件率下的判断标准高于50%事件率，p<0.05。专家在10%事件率下的判断标准低于新手，p<0.05；在50%事件率下的判断标准与新手无显著差异，p>0.05。

3.2 漏报错误归类

参考Donovan和Litchfield（2013）关于漏报错误类型的划分办法，根据有无注视点落在兴趣区内，将漏报错误进行归类：兴趣区内无注视点的漏报错误，视为扫描错误；兴趣区内有注视点的漏报错误视为识别错误。专家与新手在高、低事件率下的漏报错误归类见表3。

对扫描错误比例进行重复测量方差分析，结果发现：经验的主效应显著，F（1,28）=24.32，p< 0.001，η2=0.46，专家的扫描错误比例小于新手。事件率的主效应显著，F（1,28）=33.32，p<0.001，η2=0.54，50%事件率下的扫描错误比例小于10%事件率。

表3 专家和新手在不同事件率下的视觉搜索漏报错误归类（%）

3.3 不同事件率下对整体图像的注视

（1）平均注视时间

以平均注视时间为因变量，对经验、事件率和反应类型（击中和漏报）进行三因素重复测量方差分析，结果发现，见表4。

表4 专家与新手在不同事件率下的异常图像的眼动数据（M±SD）

经验的主效应显著，F（1,28）=1853.51，p< 0.001，η2=0.19，专家的平均注视时间少于新手。事件率的主效应显著，F（1,28）=1562.23，p< 0.001，η2=0.16，50%事件率下的平均注视时间小于10%事件率。反应类型的主效应显著，F（1,28）=15088.54，p<0.001，η2=0.65，击中反应的平均注视时间大于漏报反应。经验和事件率交互作用显著，F（1,28）=187.82，p<0.001。经验和反应类型交互作用显著，F（1,28）=857.81，p<0.001。事件率和反应类型交互作用显著，F（1,28）=1066.56，p<0.001。经验、事件率、反应类型三者的交互作用显著，F（1,28）=505.90，p<0.001。进一步简单简单效应分析发现：专家在10%事件率下的击中反应平均注视时间、10%事件率下的漏报反应平均注视时间、50%事件率下的击中反应平均注视时间、50%事件率下的漏报反应平均注视时间均显著小于新手（p<0.001）。

专家和新手在10%事件率、50%事件率下的击中反应平均注视时间均显著大于漏报反应（p< 0.001），10%事件率下的击中反应、漏报反应的平均注视时间均显著大于50%事件率（p<0.001）。

（2）注视次数

以注视次数为因变量，进行重复测量方差分析，结果见表4。

经验的主效应显著，F（1,28）=405.52，p< 0.001，η2=0.31，专家的注视次数少于新手。反应类型的主效应显著，F（1,28）=432.89，p<0.001，η2= 0.31，击中反应的注视次数小于漏报反应。事件率的主效应显著，F（1,28）=37.06，p<0.001，η2= 0.04，50%事件率下的注视次数大于10%事件率。经验和事件率交互作用显著，F（1,28）=26.73，p< 0.001。经验和反应类型交互作用显著，F（1,28）= 4.03，p<0.05。事件率和反应类型交互作用显著，F（1,28）=358.41，p<0.001。经验、事件率、反应类型三者的交互作用显著，F（1,28）=5.14，p<0.05。进一步简单简单效应分析发现：专家在10%事件率下的击中反应注视次数、10%事件率下的漏报反应注视次数、50%事件率下的击中反应注视次数、50%事件率下的漏报反应注视次数均小于新手（p< 0.001）。专家在击中反应中，10%事件率和50%事件率下的注视次数无显著差异（p>0.05），而在漏报反应中，10%事件率下的注视次数少于50%事件率（p<0.001）。新手在击中反应中，10%事件率下的注视次数多于50%事件率（p<0.05），而在漏报反应中，10%事件率下的注视次数少于50%事件率（p< 0.001）。专家与新手在高、低事件率下，漏报反应的注视次均多于击中反应（p<0.001）。

（3）平均眼跳幅度

以平均眼跳幅度为因变量，进行重复测量方差分析，结果见表4。

经验的主效应显著，F（1,28）=56.14，p< 0.001，η2=0.29，专家的平均眼跳幅度大于新手。反应类型的主效应显著，F（1,28）=4.23，p<0.05，η2=0.30，击中反应的平均眼跳幅度大于漏报反应。事件率的主效应显著，F（1,28）=10.49，p<0.01，η2=0.07，50%事件率下的平均眼跳幅度小于10%事件率。经验和反应类型交互作用边缘显著，F（1,28）=2.89，p=0.09。专家与新手在击中反应的平均眼跳幅度和漏报反应的平均眼跳幅度上差异均显著（p<0.001）。专家的击中反应平均眼跳幅度小于漏报反应（p<0.01），新手击中反应平均眼跳幅度与漏报反应无显著差异（p>0.05）。

3.4 不同事件率下对兴趣区的注视

以击中反应的兴趣区内的停留时间为因变量，进行重复测量方差分析，结果见表5。

表5 专家与新手兴趣区内停留时间的眼动数据（M±SD）

经验的主效应显著，F（1,28）=7169.59，p< 0.001，η2=0.12，专家的停留时间大于新手。事件率的主效应显著，F（1,28）=19662.05，p<0.001，η2= 0.28，10%事件率下兴趣区内的停留时间高于50%事件率。经验和事件率交互作用显著，F（1,28）= 6411.88，p<0.001，η2=0.11。专家与新手在10%事件率和50%事件率下兴趣区内的停留时间差异均显著（p<0.001），均表现为专家在兴趣区内的停留时间大于新手。专家与新手在10%事件率下兴趣区内的停留时间均显著高于50%事件率（p<0.001）。

4 讨论

4.1 事件率对专家与新手放射科医生视觉搜索绩效及视觉注视的影响

行为指标方面，专家与新手都表现出在低事件率下的漏报率要高于高事件率，但专家受低事件率的影响程度远远小于新手。专家与新手在低事件率下的敏感性均要低于高事件率。Green和Swets（1966）研究表明，目标概率较低时，被试的辨别能力降低，以至难以确定目标。

眼动指标方面，将击中反应与漏报反应的平均注视时间进行比较，结果发现，专家与新手在击中反应中，低事件率下的平均注视时间显著多于高事件率，这说明，在低事件率条件下，为了正确地搜索出目标，在每个注视到的位置需要付出更长的注视时间。通过兴趣区的划分，进一步分析击中反应兴趣区内的停留时间则发现，专家与新手低事件率下的兴趣区内的停留时间均显著多于高事件率，这说明在低事件率下目标的识别与确认需要更长的时间。由于在低事件率条件下，对目标所在区域的刺激进行编码和比较的时间投入不够，导致低事件率下由于未能识别出目标而产生的漏报错误增多。

平均眼跳幅度方面，低事件率下的平均眼跳幅度显著大于高事件率，说明低事件率条件下要正确发现目标需要更精细地搜索刺激。注视次数方面，低事件率下，专家与新手都表现出漏报反应的注视次数变得更少，这提示低事件率条件下出现更多漏报错误可能与注视次数变得更少有关。这符合速度—正确率权衡理论的观点，错误的增多是由快速反应所导致的。

4.2 医学图像视觉搜索低事件率效应产生的机制

低事件效应是如何产生的，多重决策模型认为低事件率使被试的判断标准升高，被试变得更加保守而倾向于进行没有目标的按键反应（Wolfe et al.,2005）。本研究结果表明，新手在事件率低时，判断标准趋于保守，漏报率更高，符合Wolfe等人（2005）的理论假设。在本研究中，专家没有表现出事件率低时，反应标准显著增大的结果。可见低事件率对不同经验的放射科医生的影响是不同的，不能单单从信号检测论的角度来检验医学图像视觉搜索低事件率的问题。医生的专业水平、人格特点、医疗风险评估以及医学图像本身复杂性的特点等都有可能成为影响决策的因素。杨帆（2011）研究表明被试的判断标准升高，并不意味着其漏报率也一定升高，还应考虑误报率的变化。本实验要求被试用鼠标点击目标位置，同时又需要用鼠标点击确定性水平，因此排除了被试在低事件率条件下由于反应过快，按键错误引起的漏报错误，故而不支持Fleck和Midriff（2007）的抑制失败说。

对专家与新手在高、低事件率下的漏报错误类型进行分析，结果发现，专家和新手在高事件率下的扫描错误比例显著小于低事件率，这说明低事件率效应可能是由于低事件率下出现了更多的扫描错误导致的。结合平均眼跳幅度的数据来看，低事件率下的平均眼跳幅度显著大于高事件率，说明这些扫描错误可能是由于在低事件率下的眼跳幅度过大，没有精细而充分地扫描到目标区域导致的。

5 结论

在本实验条件下可以得到以下结论：（1）专家与新手进行医学图像视觉搜索时均出现低事件率效应，但专家受低事件率的影响程度远远小于新手。（2）专家在高事件率下辨别力更高，高、低事件率的反应标准无差异，新手则表现为高事件率下辨别力更高，低事件率条件下反应标准变高。（3）低事件率条件下，专家和新手对漏报反应图像的注视次数变少，平均眼跳幅度变大；低事件率条件下出现的由于扫描错误导致的漏报错误显著多于高事件率条件，因此，低事件率效应主要是由于扫描错误引起的。

贾守勤.(2009).常规DR胸片对肺结节漏诊原因的分析 (博士学位论文).山东大学,济南.

李富洪,曹碧华,肖风,李红.(2011).抑制控制在极小概率目标搜索任务中的作用.心理学报,43(5),509-518.

李宇涵.(2014).低事件率效应发生机制的研究 (硕士学位论文),河北师范大学,石家庄.

王陵宇.(2015).低事件率效应的机制与对策 (博士学位论文).中国科学院,北京.

杨帆.(2011).X光行李检测中危险品漏报的影响因素和对策 (博士学位论文).中国科学院,北京.

Beutel,J.,Kundel,H.L.,&Van Metter,R.L.(2000).Handbook of medical imaging:Physics and psychophysics(Vol.1).Spie Press.

Burgess,A.E.(1999).Producing lesions for hybrid mammograms: Extracted tumors and simulated micro calcifications.Proceedings of SPIE-The International Society for Optical Engineering, 3663,316-322.

Donovan,T.,&Litchfield,D.(2013).Looking for cancer:Expertise related differences in searching and decision making.Applied Cognitive Psychology,27(1),43-49.

Egglin,T.K.,&Feinstein,A.R.(1996).Context bias:A problem in diagnostic radiology.Jama,276(21),1752-1755.

Ericsson,K.A.,Krampe,R.T.,&Tesch-R觟mer,C.(1993).The role of deliberate practice in the acquisition of expert performance.Psychological Review,100(3),363-406.

Ericsson,K.(2006).The influence of experience and deliberate practice on the development of superior expert performance. The Cambridge handbook of expertise and expert performance (pp.685－705).Cambridge:Cambridge University Press.

Ethell,S.C.,&Manning,D.(2001).Effects of prevalence on visual search and decision making in fracture detection.Medical Imaging,4324,249-257.

Evans,K.K.,Birdwell,R.L.,&Wolfe,J.M.(2013).If you don′t find it often,you often don′t find it:Why some cancers are missed in breast cancer screening.Plos One,8(5),e64366.

Fleck,M.S.,&Mitroff,S.R.(2007).Rare targets are rarely missed in correctable search.Psychological Science,18(11),943-947.

Giovinco,N.A.,Sutton,S.M.,Miller,J.D.,Rankin,T.M.,Gonzalez, G.W.,Najafi,B.,&Armstrong,D.G.(2015).A passing glance? Differences in eye tracking and gaze patterns between trainees and experts reading plain film bunion radiographs.The Journal of Foot and Ankle Surgery,54(3),382-391.

Green,D.M.,&Swets,J.A.(1966).Signal detection theory and psychophysics.The Quarterly Review of Biology,42(4),578.

Gur,D.,Bandos,A.I.,Fuhrman,C.R.,Klym,A.H.,King,J.L., &Rockette,H.E.(2007).The prevalence effect in a laboratory environment:Changing the confidence ratings.Academic Radiology,14(1),49-53.

Gur,D.,Rockette,H.E.,Warfel,T.,Lacomis,J.M.,&Fuhrman, C.R.(2003).From the laboratory to the clinic:The″prevalence effect″.Academic Radiology,10(11),1324-1326.

Gur,D.,Sumkin,J.H.,Rockette,H.E.,Ganott,M.,Hakim,C., Hardesty,L.,et al.(2004).Changes in breast cancer detection and mammography recall rates after the introduction of a computer-aided detection system.Journal of the National Cancer Institute,96(3),185-190.

Kunar,M.A.,Rich,A.N.,&Wolfe,J.M.(2010).Spatial and temporal separation fails to counteract the effects of low prevalence in visual search.Visual Cognition,18(6),881-897.

Kundel,H.L.(2000).Disease prevalence and the index of detectability:A survey of studies of lung cancer detection by chest radiography.Proceeding of SPIE,3981,135-144.

Kundel,H.L.(2015).Visual search and lung nodule detection on CT scans.Radiology,274(1),14-16.

Law,B.,Atkins,M.S.,Kirkpatrick,A.E.,Lomax,A.J.,&Mackenzie, C.L.(2004).Eye gaze patterns differentiate novice and experts in a virtual laparoscopic surgery training environment.In A. Duchowski,and R.Vertegan(Eds.),Proceedings of the 2004 symposium on eye tracking research and applications(pp.41-48).San Antonio,TX:Association for Computing Machinery.

Lee,S.L.A.,Kouzani,A.Z.,&Hu,E.J.(2012).Automated detection of lung nodules in computed tomography images:A review.Machine Vision and Applications,23(1),151-163.

Pisano,E.D.,Gatsonis,C.,Hendrick,E.,Yaffe,M.,Baum,J.K., &Acharyya,S.,et al.(2005).Diagnostic performance of digital versus film mammography for breast-cancer screening.New England Journal of Medicine,353(17),1773-1783.

Reed,W.M.,Chow,S.L.C.,Chew,L.E.,& Brennan,P.C. (2014).Can prevalence expectations drive radiologists′behavior?.Academic Radiology,21(4),450-456.

Valente,I.R.S.,Cortez,P.C.,Neto,E.C.,Soares,J.M.,Albuquerque,V.H.C.D.,&Tavares,J.M.R.S.(2016).Automatic 3d pulmonary nodule detection in CT images:A survey. Computer Methods and Programs in Biomedicine,124,91-107.

Van Wert,M.J.,Horowitz,T.S.,&Wolfe,J.M.(2009).Even in correctable search,some types of rare targets are frequently missed. Attention,Perception,&Psychophysics,71(3),541-553.

Wolfe,J.M.,Horowitz,T.S.,&Kenner,N.M.(2005).Rare items often missed in visual searches.Nature,435(7041),439-440.

Wolfe,J.M.,Horowitz,T.S.,Wert,M.J.V.,Kenner,N.M., Place,S.S.,&Kibbi,N.(2007).Low target prevalence is a stubborn source of errors in visual search tasks.Journal of Experimental Psychology General,136(4),623-638.

The Im pact of target prevalence in M edical Image Visual Searching of Novice and Expert Radiologists:Evidence from Eye M ovement

Chen Meixiang1,2,Bai Xuejun1
(1 Key Research Base of Humanities and Social Sciences of Ministry of Education,Academy of Psychology and Behavior,Tianjin Normal University,Tianjin 300074;2 Counseling and Education Center,Xiamen University,Xiamen 361005)

To measure the effect of abnormality-prevalence on novices and experienced radiologists′performance during pulmonary nodular lesion detection on a chest radiograph,SMI250 eye tracker was used to record participants′eye movements.We asked experts and novices to detect chest X-ray in different target prevalence(50%or 10%).The results showed that:1)the miss(false-negative)rate of experts and novices in low prevalence (10%)was significantly higher than that of high prevalence(50%),but the miss rate difference of experts in high and low prevalence was less than that of novices.2)Experts and novices spent less fixation counts but more fixation duration average in low prevalence.In addition，the average saccade amplitude and the scanning error in low prevalence were greater than that in high prevalence.These findings suggested that scanning errors were the main reason for the more miss errors in low prevalence than those in high prevalence.

expert,novice,radiologist,target prevalence,visual search.

B842.1

2017-1-2。

全国文化名家暨四个一批人才项目。

白学军，E-mail：bxuejun@126.com。