眼动跟踪在电影研究中的可能性与局限性

2018-01-02 01:56艾德里安戴尔莎拉平克

中国文艺评论 2017年12期

[澳]艾德里安·戴尔 [澳]莎拉·平克／张斌译

眼动跟踪在电影研究中的可能性与局限性

[澳]艾德里安·戴尔 [澳]莎拉·平克／张斌译

电影常常包含着多样性的复杂视觉信息和其他感官质素，呈现出我们所居世界的一部分。然而，我们对人们看电影的生理和经验方面却知之甚少。在本文中，我们将电影研究与眼动跟踪和人类学研究结合起来，避免对电影纯粹技术性的理解：通过测量观者看电影时的眼睛运动，同时结合人类学方法，把视觉理解为一种情境实践。因此，我们要讨论眼动研究在考察如电影这样的复杂媒体时，是如何需要考虑在感官民族志中发展出来的一些重要原则；反过来，还要讨论民族志和社会研究在新技术的出现中如何获得人们看电影方面的重要见解，这种新技术的出现可以更好地描绘人对世界的理解是怎样通过感观知觉的输入来建构的。最近的证据表明，像叙事这样由上而下的中介效应，在人们如何进入一部电影的不同方面确实促成了重大的改变。所以，电影媒体如何与眼动跟踪和民族志研究相结合，可能会更多揭示人们如何建立对世界的理解。眼动跟踪电影民族志视觉

导论

复杂环境中的观看并非是轻而易举的事情。人们通常相信眼见为实（Levin etal. 2000），然而生理和神经方面却限制了我们视觉系统的运作。这意味着当我们在对一系列事件进行评价时，在某一个时间点上能够被可靠感知的只不过是整个视觉场景中非常小的一部分。作为证据，《我们中的大猩猩》（Gorillas in our Midst）这部25秒长的短序列运动电影很好地阐明了这一观点：我们通常只能感知到一个场景中呈现的大量视觉信息中的一部分。这个短序列运动电影拍摄的是一组六个参与者三人一队（分成穿着白色或黑色衣服的代表队），队员间传递篮球的运动（Simons and Chabris 1999）。观看电影的受试者被要求数一下穿着白色衣服的三个学生的传球数。很多受试者能够正确地计算传球数，但是大部分的受试者没有观察到走到视觉场景中并拍打胸脯的大猩猩（一个穿成大猩猩样的演员），直到大猩猩溜达出这个场景。人们通常没有看到这个在动作序列中突然出现的大猩猩，是因为在要求他们数传球数的指令下，他们的注意力被导向了白色传球队。为什么我们错过了大猩猩这样一个突出的对象？这对于我们理解不同主体怎样观察现实生活有何启示？如电影这样对现实生活进行再现的复杂信息意味着什么？

在本文中，我们采用一个跨学科的方法来研究在复杂的动态环境中如何看到某些事物的问题。我们把神经科学和眼动跟踪研究与人类学对视听媒体的见解结合起来，目的是制定一个观众研究方法，以此来解释人类感知作为一种实践活动形式的视觉和通过这些共同构建的环境之间的关系。我们首先要做一个简短概述：目前从视觉科学角度如何理解眼睛、视觉感知和观看的主观性和选择性。眼睛具有选择性，这有生理上的证据，但并不能完全解释知觉理解为什么或者如何在不同的人或者同一个人面对不同环境时的变化。然后我们要通过对移动图像的眼动跟踪研究将会学习到的东西来讨论这种理解。我们将展示，眼动跟踪可以详细测量眼睛在运动序列中的特定情况、运动特点。这可以揭示研究参与者样本中注意的类型、他们特定类型的行动。然而，眼动跟踪是有局限性的，虽然它可以告诉我们参与者的眼睛注意到什么，但是它不能轻易地告诉我们为什么，他们经历了什么，他们的情感状态是什么，也不能告诉我们他们的行动是如何被广泛的社会、物质、感官和整个环境所塑造的。因此，本文的后半部分，我们将转向现象人类学，并利用理论和民族志对话（人类学研究的核心）提供的可能性，提出如何把眼动跟踪研究的命题情境化在其与持续变化的复杂环境的关系中。

我们通过跨学科的方法来讨论这些问题，这些方法把定量研究和定性研究结合起来。这不仅需要理解人们是如何看的，也需要理解这些观看实践和经验是怎样变得和感知与参与到日常生活世界建构的方式相关的。在文章的最后，我们解释了跨学科工作的相对复杂性，特别是在那些测量性的和对理解与认知使用的移情与协作模式（这些可以将电影经验的一部分理论化）之间更是如此（Bordwell and Thompson 2010; Pink 2013）。在这些问题怎样与电影文化这样更广泛的问题相关的文献回顾中，雷蒙德和巴蒂（Redmond and Batty，2015）与史密斯（Smith，2015）的手稿中也涉及到眼睛跟踪和运动图像观者这个特殊问题。

视觉分辨率、感知和人眼

为了使人眼能够视觉感知，视网膜上分布着视锥细胞（cone photoreceptors），能扩展双目的视觉感知度达到180度（Leigh and Zee，2006）。在眼睛的中央凹区域视锥细胞更密集，但我们产生高灵敏度的视力只有2至3度的视角（Leigh and Zee，2006）。视角是了解物体的实际大小与观看距离之间关系的一种简便方式。例如，我们的视觉锐度大约相当于将我们的拇指保持在大约57厘米的地方 (在这个距离，1厘米代表1度的视角)。这意味着查看详细的视觉信息常常需要我们的眼睛注视一个场景的不同部分。这有两种典型情况：一种是被称为扫视的射击式眼球运动，或较慢的平滑追踪的眼球运动（就像我们在一定距离跟随一个缓慢的物体）（Martinez-Conde etal. 2004）。扫视通常分为两种主要类型，对于解释观看者如何感知环境有很高的价值：反射扫视主要通过显著的图像来驱动（也称作外部控制）；而意志扫视（内部控制）则是观众的内部决定。它让观众通过自上而下的机制产生对场景和电影段落的直接关注（Martinez-Conde etal. 2004；Parkhurst etal. 2002； Tatler etal. 2014；Pashler 1998；Smith 2013）。因此，眼球运动在广义上可描述为“自下而上”的处理过程（当眼睛反射扫视到场景内的显著刺激时），或“自上而下”的处理过程（当观众用自己的意志控制眼睛应该看哪里）。这两种类型的扫视对于理解人们如何在日常生活的复杂场景中互动有重要的意义。例如，随便走进一家咖啡馆，我们可能随意看看各种蛋糕，反射扫视使我们注视那些颜色高度饱和的糖衣；但是当朋友说“试试巧克力蛋糕”，意志扫视会使我们的眼睛注视棕色的巧克力蛋糕。有趣的是，这些不同种类的眼睛扫视运动可能包含不同信息的皮层处理（Martinez-Conde etal. 2004）。当在观看电影的时候，这可能会允许融合了丰富的动态环境的复杂的多模态处理。当受试者看电影的时候，很可能这两种机理都在工作，而在一个特定影片序列中哪种机理在何种程度上起支配作用，取决于视觉设计、叙述、声音输入和电影的图形样式，以及受试者的个人经验和人口统计学特征。

图1 我们的眼睛体验世界的方法意味着只有中间的凹区域能详细的看到。左图显示当受试者将目光投向中心原点时，字母缩放到易读性的比例。右图是一个重构的图片，展示了眼睛怎样在一个时间点看到悉尼海港大桥的细节。

事实上，比较典型的是我们通常只能及时感知到世界中任一点上的低分辨率事物，这一点可以轻易地用视力表来解释。当受试者注视视力表中央的固定点时，我们视野中的不同部分的字母被缩放以使得它们同样清晰，或者通过选择性的高斯模糊（gaussian blurring）模拟一张照片，让我们及时地在任一时间点看到细节（图1）。比较典型的是，人在真实世界类型的场景中通常一秒转移目光约三次，以建立我们视觉环境的详细再现（Martinez-Conde etal. 2004；Tatler etal. 2014；Yarbus 1967）。为了有效地把视觉凹部引导到视觉场景中的不同部分，人眼通常进行扫视，这也需要观察者注意力的转移（(Kustov etal.1996； Martinez-Conde etal. 2004）。

使用基于录像的眼睛跟踪系统是一种记录受试者注视的方法。该系统利用了眼睛对红外辐射的不同反射特征（Duchowski，2003）。红外辐射波长对受试者来说是看不见的，也不会损害眼睛。这种非侵入性的技术使得从范围广泛的受试者中收集非常自然的行为反应成为可能。当眼睛被红外线光线照亮（这通常是由眼睛跟踪设备提供照明），光线进入眼睛后被视网膜强烈反射回来，这为红外相机的记录提供了高对比度信号。也有部分仔细设置的红外线反射到眼睛角膜，它提供的恒定参考信号确保眼睛跟踪软件将受试者实际的眼球运动从次要的头部运动中分开。受试者首先被调适到已知空间尺寸的网格刺激物（Dyer etal. 2006），然后当他们观看测试图像时，才可以精确地量化受试者所关注的场景中的不同区域。序列顺序摆脱这种关注，进而场景的特征可能会逃过观看者的直接视觉注意（Duchowski；2003）。这种非侵入技术的使用让我们直接测量主体对刺激物不同部分的注意力成为可能。该技术已经广泛地应用于静态图像的许多领域，包括医疗、法医学、面部处理、广告、体育和知觉学习（Dyer etal. 2006； Horsely 2014； Russo etal. 2003；Tatler 2014；Vassallo etal. 2009； Yarbus 1967)。

最近，人们越来越认识到了解人类的视觉系统和大脑如何处理复杂信息的重要性。我们通常使用的动态图像具有显著的优势，因为这些刺激可能更准确地反映复杂和动态的视觉环境（Tatler etal，2011）。例如，当跟踪观察开车的受试者的眼睛时，可以观察到受试者的目光往往被司机将要采取的回应措施所引导(Land and Lee，1994)。在现实生活的其他活动中，比如制作一杯茶时，受试者在拿起一个物体之前，也倾向于注视特定对象(Land etal. 1999）。这表明视觉处理往往是动态的，可能会受到受试者自上而下的意志目标的影响。而静态的图像可能并不总是最好地再现了在动态环境中受试者的行为如何受到视觉输入的影响(Tatler，2014)。有趣的是，在视觉的预期任务上，受试者的能力可能与给定行动中的表现和经验联系在一起。如优秀的板球运动员在行动前的观察动作可以有效地预测球反弹的位置，这为在面对快速移动的球时必须快速准确地做出决定提供了明显有利的条件（Land and McLeod，2000）。因此，证据表明，运动图像的视觉感知和眼球运动可能会受到自上而下的机制和经验的影响，以及视觉处理自下而上的显著性驱动机制的影响（Tatler，2014）。

动态环境中的观察者的目光和注意力也可能会明显受到场景中被观察到的其他人行动的影响。比如，当观看一个简单的魔术表演的时候，视频中的资深魔术师挥动着一只手使物体消失，受试者的视线注意方向在很大程度上受到视频中魔术师实际视线方向的影响 (Tatler and Kuhn，2007)。如果魔术师把注意力放在他挥动的手上，观众就会跟着这个误导他们的注意方向，同时魔术师的另一只进行表演的手就没法被观察到，于是魔术师的表演就成功了。然而，如果魔术师的目光放在进行表演的手上，这种模式改变了，观众就很容易观察到表演的把戏。这个例子非常简单，但是深刻地揭示了观众的视觉行为不仅受到反射式的自下而上的复杂图像中所呈现的显著信号的驱动，而且会受到一些自上而下的/或环境因素的影响。

动态的复杂环境影响主体的眼球运动的效果，也在展现人们是如何在相遇这点上可以观察到。是应该转移目光还是集中注意力，以及感知到这是威胁还是机遇，都依赖于以前的经验 (Jovancevic-Misic and Hayhoe，2009)。其他影响观察者视觉行为的自上而下类型的证据来自于我们如何理解提示或叙述会影响受试者的观看对象(Land and Tatler 2009；Tatler 2014；Yarbus 1967)。例如亚尔布斯（Yarbus）所做的经典眼动实验。他向测试对象提供了静态图像，为伊利亚•列宾（Ilya Repin）《意想不到的访客》（The Unexpected Visitor）这幅画提供了一系列不同的提示。这些提示包括对绘画主体主要情况的估计、主体的年纪、主体的衣服。不同的提示或自由观看的视觉环境造成一系列不同的扫视或注视，这可以作为自下而上模式中感知显著因素的一个证据。这表明了自下而上的突出的视觉目标强烈的引导观看视线方向(Tatler 2014；Yarbus 1967)。

用来了解动态和复杂视觉信息的眼动跟踪

当这些聪明和较为复杂的视觉感知的评价让我们了解了许多人类视觉表现和观众经验的时候，随着现代计算机技术的快速发展，眼动跟踪开始测试非常复杂的动态环境中（如电影的再现）的主体视觉（Mital etal. 2011；Smith and Henderson 2008； Smith and Mital 2013； Smith etal. 2012；Treuting 2006； Vig etal. 2009）。这为观众不断增多的对真实世界类型的体验的研究，视觉系统如何潜在地处理非常复杂的信息，以及具有不同人口学统计特征的观众如何解释电影的信息内容等提供了新的研究视野。例如，最近一些研究已经考虑到电影中主体观看者的注意，观察到他们对脸部的高水平注意力（Treuting ；2006），这些行为和以前用静态图像进行研究的结果是一致的（Vassallo etal. 2009；Yarbus 1967），但是我们更获得了行得通的机遇，可以更好地理解眼睛对现实世界的视觉处理。

图2 当我们查看图像的时候，眼睛停留在关键的感兴趣领域的时间通常是1/3秒,然后眼睛会扫视其他领域。当一个主体观看电影上的序列图像时，固定点（绿色圆圈）主要集中在主要人物的各自面孔，而固定点之间的线显示了各自扫视的方向。

目前在解释观众观看电影时眼球运动的数据面临一个问题：怎么管理和分类统计这么大量的数据，以尝试解释观众的经验。一个初步的解决方案是凝视图分析（gaze plot analyses），它显示了一个特定场景中许多观众的平均注意力（图3）。使用凝视图研究静止图像时，图像有产生中心偏差的强烈倾向。这在很大程度上不受主题或其构成因素的影响（Tatler，2007）。对运动图像的研究似乎详细地证实了观看被限定在整体图像各部分的趋势(Dorr etal. 2010；Goldstein etal. 2007；Mital etal. 2011； Smith and Henderson 2008；Tosi etal. 1997)。这可能对数据压缩类型的算法产生很大的影响，大量的图像数据可以被传输到各种不同的移动观看装置。而人眼分辨率决定了某些信息不必以高分辨率的形式显现（图1），甚至电影的某些部分需要调整以增强视觉受损观众的观看体验（Goldstein etal. 2007）。虽然凝视图有定性分析的价值，但是通过兴趣区域的重配，定量分析可以更好地促进对场景中某些部分的研究（图4）。这种想法对于剖析不同运动图像的信息处理理论有很高的价值。例如，目前在理解眼动跟踪怎样解密电影文化、电影在理解视觉行为中如何成为一种有效刺激方面，有一种方法可以探索叙事手法的潜在效果，这种手法假设当观众自由地观看电影从而产生自然的行为时，对观众的注视行为有自上而下的或内部的控制（Smith；2013）。

图3 凝视图显示了一个特定场景中观众的平均关注数，在这种情况下，捕捉了很多与以前报道相关的注意。

图4 可以对兴趣区域进行编码，从而对电影场景中关键部分的数量和固定时间持续进行量化。这可能会剖析哪些因素（如叙述手法）是怎样影响观众的观看行为和扫视的。

最近的一项研究已经解决了这个问题。通过使用动画电影《UP》(Pete Docter，2009)中的蒙太奇序列探索，研究是否可以搜集经验性的证据支持自下而上和自上而下的机制之间的调节。动画剪辑是一个研究价值很高的案例，因为它在一个262秒的电影蒙太奇序列中包含了除对话之外全部的叙述故事 (Batty ，2011)。由于动画生产的控制性展示，蒙太奇描绘的两个主要人物“卡尔”和“艾利”的整体显著性总是很匹配。例如，在最初的开场中，这两个人物首次相遇，观众看电影时对他们的关注时间基本相同。但是，当蒙太奇开始对婚姻、想要孩子、流产、梦游、疾病和死亡等生活故事展开叙述时，在蒙太奇的不同阶段中，观众对两个人物的关注产生了显著的差异（Batty etal. 2014）。这表明了用自上而下模式处理复杂图像的整体显著性的影响，在某些实验环境中对较短的运动研究也被观察到。如果能够搞清楚影响图像显著性的许多可控性因素的相互关系，这将是电影研究中一项很有前途的研究(Parkhurst etal. 2002；Martinez-Conde etal. 2004；Tatler etal. 2014)。

然而，眼动跟踪只能告诉我们故事的一部分，也就是人们看到的是什么，而不是这些看的方式是如何以及为什么会出现和常规化的。其他的定性研究方法，如在视觉和感官民族志研究(Pink 2013；Pink 2015)中，需要将眼动跟踪的数据语境化。这涉及到将观看和它所包含的视觉实践视为情境化行为，是超越眼睛的更广泛的经验范畴的一部分。上面列出的研究已经证明视觉研究的主观性和选择性，一旦记录和测量，只能被恰当地理解为特定环境状况和具体经验中的突发状况。因此，我们在下文中会转向视觉和环境中的人类学方法，以展示这是如何实现的。然而在此之前，我们发现当进行跨学科的研究时，不可避免地存在一些概念上的偏差。这意味着我们已经结束了上文关于眼动跟踪可以让我们理解复杂环境中的信息处理的论述。在下文中，我们将重新论证这种思考方式，即考虑人类感知和观众经验是如何建立与复杂环境的关系的，而到目前为止我们还将其排除在外。

观看作为复杂环境的一部分

环境作为一个概念是多义的，在不同的语境中用来指不同经验和政治的结果。正如人类学家蒂姆•英格尔德（Tim Ingold）强调的那样，在现代话语中，“环境”被视为一种我们从中分离而存在的实体。这个观点在此前也出现过，我们已经讨论过眼动跟踪可以更好地展现我们如何处理复杂信息。如英格尔德表示的那样，这意味着我们“倾向于忘记环境起初是我们生活的世界，而不是我们肉眼看到的世界”。他认为，“我们居住在环境中，我们是环境的一部分，通过这种居住实践，它也成为我们的一部分”(Ingold T； 2011) 。沿着这一方法，环境可以理解为一种生态，人是其中的一部分，我们生存于其中，我们观看（view）、看见（see）和体验的方式是相互建构的。但这不是简单地意味着“我们”作为人类被环境所包围，它也意味着环境是我们和我们与其他因素之间的关系所共同构成的。

对于我们在这篇文章中的目的来说，我们着重强调包括电影、图像、艺术、技术、其他人、天气、构造的环境（以及更多的东西）。正如英格尔德（Ingold 2000，2010）和艺术历史学家芭芭拉•斯塔福德（Barbara Stafford，2006）提出的，批判语言学和符号学研究方法需要分析，就像斯塔福德说的那样，要承认“当你睁开眼睛，主动质询视觉场景，你看到的是你构成的环境的一部分，或者是身体的一部分” (Stafford ；2006)。但是这也意味着看电影不仅仅只包括我们看到外在于自己的东西，它还通过电影所提供的与我们观看的环境/世界的其他组成部分之间的关系，从而变得对我们有意义。在这种解释中，“我们”源于“人类感知”和我们与（复杂）环境关系的一个普通性理论。然而，如我们在下文中所解释的那样，这种现象不会消解这种观点，即不同的人对同样的信息有不同的感知；事实上，这种矛盾促使我们去更加精确地研究这些差异为什么产生和如何产生。相反，如果我们把英格尔德的方法推进一步，聚焦在意义是怎样通过我们的视觉图像经验而产生的，我们可以获得更多：不只是我们的眼睛（大脑）对运动图像的反应，还有关于眼动跟踪研究中的监控和测量模式如何实现或再现。或者它们可以理解为代表（但是并没有确切地解释这意思）人们是如何处理运动图像的。

基于梅洛•庞蒂、吉布森和乔纳斯（Merleau-Ponty, Gibson and Jonas）等开创的哲学和其他传统，英格尔德的研究表明，人类的感知、学习和认知都源自于运动，特别是当我们在生活的环境中运动和参与其他事情提供的东西，以及处理我们遇到的问题的时候（Ingold 2000）。关于艺术，他已经用这种方法提出了建议。绘画应该被理解为最终的图像并加以考察和解释吗？就像在视觉文化研究的传统中那样。或者是我们将其视为善于观察的眼睛追踪的矩阵的一个节点？在这个意义上，世界上的图纸或绘画，或者这个世界上我们喜欢的东西，我们都要通过它们找到我们在世界中存在的方式，将它们定位为我们在这个世界上的行动本身吗（Ingold210；p16）？如果把这个观点换成另外一个问题——我们如何观看电影，那我们可能会问这个问题，也就是作为观众，我们怎样栖居于（inhabit）电影中？以及眼动跟踪研究可以告诉我们关于这些栖居类型的什么？如果我们看到了观众（的眼睛）和眼动跟踪视觉化的电影之间已建立的关系（比如本文前面部分所论证的那样），我们就能够开始思考眼睛的运动和电影的运动是如何纠缠在一起的。事实上，当电影和眼睛不可避免地继续移动时，问题就变得不仅是屏幕上的构成和行动如何影响眼睛的运动，而是眼睛如何选择屏幕上移动的构成与行动的方面。从这个角度来看，我们摒弃了技术决定论的观点，即眼动跟踪研究可以让电影和广告机构更好地影响受众行为。相反，它引导我们思考：眼动跟踪研究可能告诉我们，人们在观看时到底在做什么；它怎样告诉我们，它们是如何栖居在电影和更一般的泛在的运动图像中的。

本节讨论的文献和论点集中解释人们在一般情况下是如何观看移动图像的。到目前为止，理论的进展既不在于解释也不在于讨论参与眼动跟踪研究模式的实用性。我们在文章前面部分展示的眼动跟踪研究的例子和可视化都采用了人们可能有相似视角的样本，因此希望展示人们观看特定信息的不同方式。的确，这些数据需要告诉我们，这些观看模式在多大程度上是普遍的（也为人脑处理这些信息的方式的研究和理论所支持），而在多大程度上，这些情境化和个人化的特定参与群体的观看方式仍然不为我们所知。鉴于日益增长的全球性娱乐产业和行动主义都在使用视觉媒体，这样的工作将会有很高的价值。电影可能销售到离原语境（更看重对观众体验的理解）越来越远的地方。事实上，对人们如何学习观看和认知的研究是在特定的文化背景下进行的，这清楚地揭示了在学习和实践的过程中，我们看到的和在哪里看到都是偶然的，因此对于复杂的环境而言，这也是特定的结论。

视觉、学习和认知

眼动跟踪研究告诉我们，人们对复杂图像的观看和记忆有时是相似的（Norton and Stark，1971），虽然这些模式容易因指令而改变（Yarbus 1967；Tatler 2014）。我们在本文的前面章节中看到，研究中的参与者把他们的目光持续固定在电影人物的面部（图2、图3）。视觉注意力可能聚焦于某个电影人物，他的故事线对于观众而言需要（或提供）强烈的情感和/或移情的联系。更进一步的眼动跟踪研究需要重视观看方式的性别和文化特定性的建议。但是现有的视觉和媒体人类学研究表明这种情况是可能存在的。这里有两个相关的文献，第一个使用的是视觉和媒体人类学文献，第二个是视觉人类学。

视觉和媒体人类学研究的应用（Pink ，2007），聚集于使用人类学结合视听介入（通常是用电影制片处理和电影制作的形式）理解媒介，以研究社会和公众意识的新形式和社会变迁。这项研究利用和发展了电影研究从劳拉•马克斯（Laura Marks）的研究中发展出来的“具身性观影体验”（embodied viewing experience）的观点（2000：211）。马克斯研究的重点是跨文化电影，提出作为“模拟媒介”（a mimetic medium）的电影“能使我们进入感官参与的世界中”（Marks 2000： 214）。“移情”这一概念作为从电影中生成的跨文化理解的途径，在视觉人类学文献中也越来越流行（discussed in Pink 2015）。尽管总体上还没有足够的研究证明人们观看这类介入电影（intervention fi lms）的方式，但是一个例子暗示了观众的注意力，尤其是观众参与并记住了电影叙事的能力，取决于他们对电影中人物角色的经验能有效地和移情式地投入。苏珊•莱文（Susan Levine）关于观众如何讨论作为一个南非的艾滋病毒/艾滋病介入活动一部分的电影，以此吸收本地叙事去传播核心信息的媒体人类学研究就是一个很好的例子（Levine ，2007）。莱文（不出所料地）发现，参与者追随当地人的相关论述来参与电影人物的故事，从中获得了这种用电影推动的运动的重要经验，因为通常向当地观众传播一般的健康讯息是很困难的。通过将人类学理解和能够描画出视觉再现中观众对面部表情关注的这种眼动跟踪研究相结合（Vassallo etal. 2009），可以让我们更充分地理解为什么电影是如此强大的传播媒介。

视觉人类学的研究进一步证明了关注观看是如何情境化的重要性。事实上，当视觉观看被理解为一种实践而不是行为时，它就不仅仅是处于某种情境中的实践，而是一种参与学习的实践。人类学家克里斯蒂娜•格拉瑟妮（Gristina Grasseni）创造了一个她所谓的“技能化视觉”（skilled vision）的理论。该理论可以像她说的那样粗略理解：

这种“技能化视觉”把视觉当做一种社会活动，一种对世界的积极参与，一种专业知识，很大程度上取决于训练的感知和构建的环境（Grasseni，2011）。

通过强调技能化视觉是“位置性的，政治性的和关系性的”，同时又具有感官性和物质性，格拉瑟妮指出，“因为技能化视觉把身体的（如培养出来的选择性感知的能力）和学习的方面联系起来。他们不仅是生态的而且是意识形态的。在这种意义上来说，他们又表现了世界观和实践”（Grasseni，2011）。正如平克在他对西班牙斗牛研究中揭示的，人在斗牛表演中所看到的很大程度上取决于他是如何学习观看斗牛的。人具有“感受”表演的感官和情感上的移情体验方式。通过这种方式，视觉再现就被创造出来。或者人认识和理解世界的存在方式可以形成感知（Pink 1997，2011）。例如，考虑图5中的不同方式，或者围绕同一个表演的电影序列，这会被一个斗牛迷或一个动物权利活动家给出不同的解释。每一个人都会学到如何通过不同轨迹来了解如何表演以及表演什么。虽然对不同主题的眼动跟踪调查可能会出现一些类似的模式（特别是如果自下而上的机制占主导地位），不同观众对视觉输入的语义解释可能完全不同。这种信息内容如何被评估，或者通过自上而下或自下而上的视觉机制处理的评价对信息的解释将是很大的挑战，这和在一部影片中被典型地感知到的一样复杂。

图5 在很多电影中都很普遍的是，情感内容可能会影响视觉形象的感知，即使观众对相同信息的感知仍是需要探索的重大课题。举例来说，我们知道斗牛对斗牛爱好者和权利活动家来说在论述和情感上有很大的不同。我们也知道学习如何观看斗牛。对斗牛爱好者来说是迷文化学徒的过程（Pink 1997； 2011），上图中斗牛的动作如何促进不同的视觉行为取决于文化背景。主体是一个斗牛迷和动物权利活动家，或这种再现被描述成动画而不是真实生活，或者是运动图像而不是静止的。

结论

把测量和评估的数据与人类学所提倡的民族志认知方式结合到一起，这种能够高度协同默契配合的研究方法被使用得越来越普遍。比如在能源研究上，一些项目致力于把人类学和能源消耗的测量数据结合起来（Cosar etal. 2013）。这种方法还没有整合到电影的眼动跟踪研究中。为了理解电影观众，这将是下一步——如果我们想要更好地理解眼动跟踪为我们提供的数据类型和知识的重要性和相关性的话。然而这也提出了一定的挑战，因为这两个目标相冲突，但是在观众研究中眼动跟踪数据的使用并不一定是唯一的。第一个挑战是如何充分理解涉及的方法之间的跨学科性。本文对此只是抛砖引玉。这就是眼动跟踪和人类学——民族志方法的不同，在对人们看电影时的观看和参与方式的理论化上有不同。然而它同时指出，这些不同的方法和学科相互提供的东西，可以提出新的问题，因而也可以发展出对观众如何观看电影的深入理解。

今后测试像在电影中典型呈现的复杂刺激下人类视觉行为的进一步研究可以帮我们建立这样一种理解——人类借处理非常复杂的信息来建立我们对周围世界的认知，但有时也会忽视复杂的运动图像中的显著信息，就如我们在大猩猩研究中发现的那样。现有理论表明，当我们的注意力被其他对认知过程增加负荷的竞争性刺激所争夺时，突出的和可识别的刺激会导致感觉的失敏（Simons and Chabris 1999； Levin etal. 2000； Memmert 2006），但是对叙事或指令的效果、人物的目光和其他潜在的自上而下的机制进行更全面的探索，可能对“知觉失明”（perceptual blindness）的了解产生卓有成效的贡献。的确，正如上面所讨论的人类学和民族志因素，经验等因素的潜在角色是在知觉失明类型的测试中，调整被检测大猩猩的能力（Memmert，2006）。这可能表明在未来的眼动跟踪和电影研究的调查中需要考虑广泛的可能影响人类感知的经验。这种类型的研究很可能也会为一些民族志研究提供丰富的理解。因为研究者可能第一次有机会获得关于是否在某一场景中观察者可能看不到某些物体，或者某些信息看到了但没有导致感知（就像篮球游戏中不期而至的大猩猩）的精确定量数据（Memmert，2006）。电影中的许多个人场景通常只持续四秒的时间，因此，对观众而言通常唯一可能的是，只会处理全部详细视觉再现中很小的一部分信息，尤其是在有下标（即字幕）的电影中（Smith，2013）。这意味着，对叙述故事线的完整理解这一关键的电影要素可能被一部分观众轻易地忽略，因为这有赖于观众自身的知识基础、语言技能、注意和动机。眼动跟踪为电影制作者提供了潜在的有用工具来测试不同的人口群体，以更好地理解不同场景的部分如何被构建以提升观众的体验，同时还构建了我们对如何处理极其复杂的环境信息的理解。

＊原文发表于Refractory: a journal of entertainment media, vol.25（2015）.英文原题：Movement,Attention and Movies: The possibilities and limitations of eye tracking?由于种种原因，未能联系到本文原作者，敬请作者见刊后与我刊联系，以便支付稿酬等。

艾德里安•戴尔（Adrian Dyer）：澳大利亚墨尔本皇家理工大学媒体与传播副教授

莎拉•平克（Sarah Pink）：澳大利亚墨尔本皇家理工大学设计与媒体民族志教授

张斌：上海大学上海电影学院副教授

何美）

注释：

Batty, Craig. 2011. Movies That Move Us: Screenwriting and the Power of the Protagonist’s Journey.Basingstoke: Palgrave Macmillan.

Batty, Craig, Dyer, Αdrain, G., Perkins, Claire, and Sita,Jodi. 2015. Seeing Αnimated Worlds: Eye Tracking and the Spectator’s Experience of Narrative (Palgrave, forthcoming)Cosar Jorda, P, Buswell, RΑ, Webb, LH, Leder Mackley,K, Morosanu, R, and Pink, Sarah. 2013. ‘Energy in the home: Everyday life and the effect on time of use.’ In The Proceedings of the 13th International Conference on Building Simulation 2013. Chambery, France. 25-28/8/2013.

Docter, P. 2009. Up. Disney-Pixar Motion Film.

Dorr, M, Martinetz, T, Gegenfurtner, KR, and Barth, E. 2010.‘Variability of eye movements when viewing dynamic natural scenes.’ Journal of Vision 10 (28): 1-17.

Duchowski, Αndrew. 2003. Eye tracking methodology: theory and practice. London: Springer-Verlag.

Dyer, Αdrian, G., Found, Brian, and Rogers, Doug. 2006.‘Visual attention and expertise for forensic signature analysis.’Journal of Forensic Science 51: 1397–1404.

Goldstein, Robert, B., Woods, Russell,L., and Peli, Eli. 2007.‘Where people look when watching movies: Do all viewers look at the same place?’ Computers in Biology and Medicine 37 (7): 957-964.

Grasseni, Cristina. 2004. ‘Video and ethnographic knowledge:skilled vision in the practice of breeding.’ InWorking Images,edited by S Pink, L Kürti, and ΑI Αfonso, 259-288. London:Routledge.

Grasseni, Cristina. 2007. Skilled Visions. Oxford: Berghahn.

Grasseni, Cristina. 2011. ‘Skilled Visions: Toward an Ecology of Visual Inscriptions.’ In Made to be Seen: Perspectives on the History of Visual Anthropology, edited by M. Banks and J.Ruby. Chicago: University of Chicago Press.

Horsely, Mike. 2014. ‘Eye Tracking as a Research Method in Social and Marketing Αpplications.’ In Current Trends in Eye Tracking Research, edited by M Horsley etal., 179-182.Springer, London.

Ingold, Tim. 2000. The Perception of the Environment.London: Routledge.

Ingold, Tim. 2010. ‘Ways of mind-walking: reading, writing,painting.’ Visual Studies, 25 (1): 15–23

Ingold, Tim. 2011. Being Alive. Oxford: Routledge. p 95.

Jovancevic-Misic, Jelena, and Hayhoe, Mary. 2009.‘Αdaptive Gaze Control in Natural Environments.’ Journal of Neuroscience 29 (19): 6234–6238. DOI:10.1523/JNEUROSCI.5570-08.2009.

Kustov, Αlexander, Α., and Robinson, David Lee. 1996.‘Shared neural control of attentional shifts and eye movements.’ Nature 384: 74–77.

Levine, Susan. 2007. ‘Steps for the Future: HIV/ΑIDS, Media Αctivism and Αpplied Visual Αnthropology in Southern Αfrica.’ In Visual Interventions, edited by S. Pink, 71-89.Oxford: Berghahn.

Marks, Laura. 2000. The Skin of the Film: Intercultural Cinema, Embodiment, and the Senses. Durham and London:Duke University Press

Martinez-Conde, Susana, Macknik, Stephen, L., and Hubel,David, H. 2004. ‘The role of fixational eye movements in visual perception.’ Nature Neuroscience 5: 229–240.

Memmert, Daniel. 2006. ‘The effects of eye movements, age,and expertise on inattentional blindness.’Consciousness and Cognition 15 (3): 620–627.

Mital, Parag, K., Smith, Tim,J., Hill, Robin, L., and Henderson,John, M. 2011. ‘Clustering of gaze during dynamic scene viewing is predicted by motion.’ Cognitive Computation 3,5–24.

Nodine. Calvin, F., Mello-Thoms. Claudia, Kundel. Harold,L., and Weinstein, Susan, P. 2002. ‘Time course of perception and decision making during mammographic interpretation.’American Journal Roentgenol 179: 917–923

Norton, David, and Stark, Lawrence. 1971. ‘Scanpaths in eye movements during pattern perception.’ Science171: 308–311.Parkhurst, Derrick, Law, Klinton, and Niebur, Ernst. 2002.‘Modeling the role of salience in the allocation of overt visual attention.’ Vision Research 42: 107–123.

Pashler, Harold. 1998. Attention. Hove, UK: Psychology Press Ltd.

Russo, Francesco, Pitzalis, Sabrina, and Spinell, Donatella.2003. ‘Fixation stability and saccadic latency in elite shooters.’ Vision Research 43: 1837–1845.

Pink, Sarah. 1997. Women and Bull fi ghting. Oxford: Berghahn.Pink, Sarah. 2007. (ed) Visual Interventions. Oxford:Berghahn.

Pink, Sarah. 2011. ‘From Embodiment to Emplacement: rethinking bodies, senses and spatialities.’ In Sport, Education and Society (SES), special issue on New Directions, New Questions. Social Theory, Education and Embodiment 16(34):343-355.

Pink, Sarah. 2013. Doing Visual Ethnography, 3rd edition.London: Sage.

Pink, Sarah. 2015. Doing Sensory Ethnography, 2nd edition London: Sage.

Simons, Daniel, J., and Chabris, Christopher, F. 1999. Gorillas in our midst: sustained inattentional blindness for dynamic events. Perception 28(9): 1059-1074.

Smith, Tim. J., and Henderson, Jordan. 2008. ‘Edit blindness:The relationship between attention and global change blindness in dynamic scenes.’ Journal of Eye Movement Research 2:1–17.

Smith, Tim, J. 2013. ‘Watching you watch movies: Using eye tracking to inform cognitive fi lm theory.’ In Psychocinematics:Exploring Cognition at the Movies edited by Α. P. Shimamura,165-191. New York: Oxford University Press

Smith, T, Levin, D, and Cutting J. 2012. ‘Α Window on Reality: Perceiving Edited Moving Images.’ Current Directions in Psychological Science 21(2): 107-113. doi:10.1177/0963721412437407

Smith, Tim, j., and Mital, Parag, K. 2013. ‘Αttentional synchrony and the in fl uence of viewing task on gaze behaviour in static and dynamic scenes.’ Journal of Vision 13 (8): 16.

Stafford, Barbara Maria. 2006. Echo Objects: the Cognitive Work of Images. Chicago: University of Chicago Press.

Tatler, Ben, W. 2007. ‘The central fixation bias in scene viewing: Selecting an optimal viewing position independently of motor biases and image feature distributions.’ Journal of Vision 7(14): 4, 1–17. http:// www.journalofvision.org/content/7/14/4, doi:10.1167/ 7.14.4.

Tatler, Ben, W. 2014. ‘Eye Movements from Laboratory to Life.’ In Current Trends in Eye Tracking Research， edited by Horsley etal., p17-35.

Tatler, Ben, W., and Kuhn, Gustav. 2007. ‘Don’t look now:The magic of misdirection.’ In Eye Movements: A window on mind and brain, edited by R van Gopel, M Fischer, W Murray and R Hill, 697–714. Αmsterdam: Elsevier.

Tatler, Ben, W., Hayhoe, Mary, M., Land, Michael, F., and Ballard, Dana, H. 2011. ‘Eye guidance in natural vision:Reinterpreting salience.’ Journal of Vision 11 (5): 1–23.http://www.journalofvision.org/content/11/5/5, doi:10.1167/11.5.5.Tatler, Ben, W., Kirtley, Claire, Macdonald, Ross. G., Mitchell,Katy, MΑ., and Savage, Steven, W. 2014. ‘The Αctive Eye:Perspectives on Eye Movement Research.’ In Current Trends in Eye Tracking Research, 3-16. DOI 10.1007/978-3-319-02868-2_16 Print ISBN 978-3-319-02867-5 Online ISBN 978-3-319-02868-2

Treuting, Jennifer. 2006. ‘Eye tracking and cinema: Α study of fi lm theory and visual perception.’ Society of Motion Picture and Television Engineers 115 (1): 31-40.

Tosi, Virgilio, Mecacci, Luciano, and Pasquali, Elio.1997. ‘Scanning eye movements made when viewing film: Preliminary observations.’ International Journal of Neuroscience 92 (1/2): 47-52.

Vassallo, Suzanne, Cooper, Sian, LC., and Douglas, Jacinta, M.2009. ‘Visual scanning in the recognition of facial affect: Is there an observer sex difference?’ Journal of Vision 9: 1-10.

Vig, Eleonora, Dorr, Michael, and Barth, Erhardt. 2009.’Ef fi cient visual coding and the predictability of eye movements on natural movies.’ Spatial Vision 22 (2): 397-408.

Yarbus Αlfred, L. 1967. Eye Movements and Vision. New York: Plenum.