许晓青 吴竑 冯婧婕
风景资源是一种信息资源[1]。视听交互感知是获取保护地中风景信息资源的重要途径。相关研究已经表明视觉与听觉是人感知环境的重要感官,视听交互很大程度上决定了环境感知[2-3]。风景园林学对环境视觉审美的研究,需要考虑声景的作用和影响,关注视觉景观与声音在审美上的协同关系[4]。
视听交互研究最早始于1976年,截至2020年6月该领域的国际研究论文约为125篇。视听交互的研究方法包括现状调研、实验室测试以及基于设计需求的研究这3种方法。研究内容包括认知偏好度、感知、情绪恢复性等议题[5]:Carles等研究了视听之间的相互作用对环境感知的影响,发现声音和图像之间的一致性会影响偏好[6];人类通常对来自不同地区的声景和视觉环境在宁静程度评价上有趋同的反应[5];还有学者比较了视觉和听觉偏好对多感官景观评价的贡献,发现声觉偏好在景观评价中起着比视觉偏好更重要的作用[7]。
视听交互研究已经在水声景感知、交通及噪声感知、自然寂静等方面取得了成就[8]:Jeon等揭示了水景的偏好可能受到水声的声学特性和水景的视觉图像的影响[9],当水景视觉特征显著呈现时,对水声的响度感知会大大降低[10];Jiang等认为高速公路的视觉冲击是增加高速公路交通噪声烦扰度的主要因素,“与道路的距离”是影响人们对高速公路交通噪声总体满意度的第二大影响因素[11];Pheasant等发现最大声压级和自然特征百分比是形成宁静度预测工具(tranquility rating prediction tool, TRAPT)的关键因素[12]。声源可见性是影响视觉评价的功能指标,也是影响听觉印象的因素[5]:Pheasant等认为需要将荒野度预测工具(wilderness rating prediction tool, WRAPT)与TRAPT混合使用来全面理解景观评价[13];Heron等研究了听觉信号与视觉感知相互影响的作用机制,认为个体感知中的相对不确定性决定了多感觉整合的感知结果[14];Pheasant等研究了视听互动对宁静(tranquility)感知的影响,评估与测量了构成寂静的关键组成部分[15]。
目前视听交互研究多以城市环境为研究对象。Viollon等评估了城市中相同的视觉环境对各类声景评价的影响[16];研究者还发现城市街道中不同类型的视觉元素对听觉感知的作用程度不同[17];Hong等认为鸟鸣声是所有声源中最受欢迎的,瀑布声会降低人们对噪声的感知[18]。从扎根理论(grounded theory)的角度开展自然保护地中的视听研究还较少。深层语义分析有助于解释数据背后的主观想法与判断,以弥补定量研究的不足。在前序研究中曾通过定量研究证实了与听觉单一刺激相比,视听双重刺激会显著提升被试者的听觉愉悦度。本研究进一步通过扎根理论得出有关视听交互作用的更加细微深入的结论。
扎根理论于20世纪60年代由哥伦比亚大学的格拉斯、施特劳斯提出,是社会研究方法中最基本的手段之一,是从大量文本中提取经验的常规手段[19]。这种由文本资料建立理论的研究方式,直接从实际观察入手,而不先入为主地设定研究假设。从观察资料中归纳出经验概括,继而由经验概括上升到理论。
武陵源因其独特的美学和地质价值被列入世界自然遗产名录,其以奇峰、怪石、幽谷、秀水及溶洞这“五绝”而闻名于世。武陵源在多样的地质和小气候条件下,孕育出了丰富的生态系统,植物垂直分带明显,群落完整,生态系统稳定平衡。武陵源还具有丰富的文化景观资源,境内还有以山谷盆地、山坡台地、高山台地3种类型为主的7处田园风光。因此,武陵源世界自然遗产地的声景资源,除了有代表野外寂静的自然声景,也有体现乡村文化的人文声景。本研究从武陵源世界自然遗产地内采集若干声景音源和照片,并从中选出4段具有代表性的声景进行视听感知实验(图1,表1)。
视听实验环节分为2个阶段,所有被试者均为在校大学生,覆盖19个专业①,男女比例约为1:3。各阶段提供的听觉刺激均为长度为45 s的4段音频(表1),由BOSE Quiet Comfort 35降噪耳机播放,在每段听音后要求被试者通过10组语义差异(semantic differential, SD)量表②评价声景感知。而2个阶段的视觉刺激有所不同,在第一阶段仅为被试者提供4张采集声源时的环境照片(图2),请被试者在完成听音后对声音和照片进行匹配,本阶段共收集到80个有效样本。第二阶段则将被试者随机分为2个组,在播放音频时在电脑屏幕(戴尔U2419HS 23.8英寸显示器)上同步播放2组不同的照片集(每段声音4张照片,每组4段声音,每组共计16张照片图3)。照片的序号用阿拉伯数字1~4来表示。在每段声音播放完成后,屏幕上再次呈现出同步播放的4张照片,请被试者根据所听声音对照片与声音的匹配程度从高到低进行排序(从最匹配到最不匹配),并对每一位被试者进行访谈,获得其排序理由及对视听的评价。第二阶段实验共获得有效问卷72份,其中组1有37份,组2有35份。访谈问题包括:1)请问为什么这样排序?2)是什么视觉或听觉要素导致了这样排序?整个过程对实验进行录音,最后通过完整地听录,整理出用以扎根理论分析的文本。
2 第一阶段实验中4段声音与照片的标杆法排序Benchmark ranking of four segments of sounds and photos in phase 1 experiment
3 第二阶段实验中视听真实与视听虚假对照组的照片对比(以声音4为例)The comparison of photos of audio-visual real and false groups in phase 2 experiment (take sound 4 as examples)
通过标杆法,分析了本实验第一阶段中被试者对每段声音与其所处环境的匹配结果(图2),得出最自然与最人工的声音(即声音3和声音2)与其所对应的环境的图片匹配准确率最高,而处于兼具自然与人工声源/半自然的2处声音(即声音1和声音4)的场景匹配准确率较低[20]。笔者选取了第二阶段中半自然声音4的访谈文本,根据视听匹配将文本分类为视听真实对照组(组1)和视听虚假对照组(组2),基于扎根理论进行分析,深入讨论复合声源条件下视觉和听觉相互作用机制。
笔者运用扎根理论的三级编码对文本进行分析,通过3个步骤进行编码与统计(表2、3)。第一步:开放式编码(一级编码)环节。采用逐句编码的方式对访谈记录进行编码,使用受访者的原话来消除研究者的个人偏见[21]。对于每一个完整的句子进行编号(a1)后,编码所有反映视觉和听觉相互作用(如听到行车的声音联想到道路)、视觉和听觉感受(如远近、强弱),以及视觉、听觉所引起的联想(如图片看起来比较像一个景区的停滞点)等词和短语,形成若干节点。在这个阶段组1(视听真实对照组)共形成192个节点,组2(视听虚假对照组)共形成128个节点。
表2 扎根理论编码原则Tab. 2 Grounded theory coding principle
第二步:轴心编码(二级编码)环节(表3)。对第一层级的范畴建立相互联系,如“视觉指向物引起的听觉感受”“听觉引发的视觉匹配”等。举例来说,支持“视觉指向物引起的听觉感受”的访谈文本有“空旷的,可能声音会比较大”“一大片水,因为这边没有听到水声”等。支持“听觉引发的视觉匹配”的原始访谈文本如“会有一种在山间或者说在田野里的那种感觉,可能会有一个比较丰富的树林和田园”。此外,这一环节的编码还包括对第一层级范畴的进一步判断,特别是对视听关系进一步推理的词和句,如“图2的话感觉就是特别的人工,图2不太像那个声音”等。
表3 轴心编码过程解析Tab. 3 Axis coding process
第三步:选择性编码(三级编码)环节。在对概念进行认定形成概念化编码(aa1)的基础上,整理能够聚类到一起的编码并最终形成A~E五大类和12个亚类。
从声音4节点(一级编码)看,组1和组2有各自的特点(表4)。组1中对声音感知、评价的节点数(106个)多于对视觉感知、评价的节点数(86个)。组2对视觉感知、评价的节点数(71个)多于对声音感知、评价的节点数(48个)。由此可知,视听真实匹配情况下,听觉可能作为优势感知,被评价的次数明显多于视觉;而视听不匹配情况下,视觉则作为优势感知,被评价的次数明显多于听觉,由此可粗略认为视听匹配与优势感知有关。
表4 两组节点数量对照Tab. 4 Comparison of the number of nodes between two groups
对具体节点和实验文本的回顾进一步验证了视听匹配与感知优势有关。视听匹配的组1中通过声音来判断视觉的节点(“听觉引起视觉”)多于通过视觉来判断听觉的节点(“视觉引起听觉”)。这表明,被试者更倾向于先判断声音,再找到对应图片,尤其关注人工与自然的区分。人们在听到鸟鸣和风声等自然声后,会弱化视觉的要素,依据听觉判断环境真实性。如被试者18表示“听到了鸟叫还有很大的风声,然后觉得图片2应该是最符合的,感觉很像吹过竹林的声音”。再如被试者22认为:“有很明显的鸟叫,感觉有很多树,然后还有一点点人的声音,就是可能几个人在游览,图4可能比较符合这个情境”(表5)。而对于视听不匹配的组2,通过视觉来判断听觉的节点(34个)多于通过声音来判断视觉的节点(13个,表4)。这意味着被试者更倾向于先看图片,找到人工或自然的视觉要素后重现记忆中的与之相匹配的声音,与音频中对应声源做比较,继而进行环境真实性判断。如被试者4认为:“可能这是一个景区的停车场,那有可能是有人的,如果是人在里面的话,从我们这个角度去录,可能人声没有那么多,所以就把它排在第二位。”再如被试者47认为:“感觉声音就像是隔着一片树林,然后树林的那一端有一条公路,它的声音源主要就是汽车在公路上由远及近行驶的声音。”视听匹配影响优势感知这一结论与学者揭示的结论一致:当声音与视觉相关时,特别是能够提供视觉参与感时,会给人带来更多的愉悦[22]。
表5 视觉引起听觉编码示例Tab. 5 Examples of visually induced auditory coding
为深入探讨视觉、听觉感知对情绪的影响,通过编码提取出访谈文本中涉及SD的相关描述,发现组1和组2在视觉评价的编码中均出现了嘈杂、人工、自然情绪词语(图4)。组1(视听真实对照组)中“嘈杂”节点数为3个、“人工”节点为10个,而组2(视听虚假对照组)中由视觉要素公路所引起的“嘈杂”节点数为4个,人工节点为8个。“过宽的公路”是引起明显嘈杂感受的主要视觉因素,许多被试者指出“公路的宽度与所听到的车声音不匹配”,其中被试者53则直接指出“图片诱导得挺明显的”。因此,在“嘈杂的–安静的”这个SD维度上视觉刺激对声景的感知影响较大。这与Hong等对视觉要素(如道路交通、栈道等)对视听感知评价的影响研究结果一致[18]。
4 由视觉要素引起的声景感知评价词频对比Comparison of word frequency in soundscape perception evaluation caused by visual elements
视听的远近、视觉场景的旷奥程度也是判断视听匹配的要点。在组1中有13个节点是视觉的远近,9个节点是声音的远近;在组2中有3个节点是声音的远近。被试者常使用视觉元素的旷奥这一概念来判断声音的远近,并且容易联想到:视觉开阔,声音较大;视觉幽闭,声音较小。
此外,不同专业背景的被试者对于声音感知的判断不同。生命科学专业的学生由于学习过《普通生态学》,理解竹林中不会有鸟类活动,因此在环境真实性判断中准确率最高,达到了100%;建筑学专业的学生由于具有空间概念思维,在听音时也更关注空间特征,所提到的关于前后、远近等空间概念的词较多;土木工程专业的学生在分析视听匹配时,展现出较强的逻辑推理能力。
本研究基于前序实验中得出的半自然环境中视听匹配度较低的结论,选取了武陵源世界自然遗产地中一段半自然声景,对两组被试者——视听真实对照组和视听虚假对照组进行访谈,并通过扎根理论对记录文本进行分析,得出视听相互作用的机制。主要结论包括:1)视听匹配与优势感知有关,视听相符情况下被试者更易由听觉引导视觉,而视听不符的情况下则更易由视觉引导听觉;2)视觉判断影响声音评价,尤其是对于嘈杂的–安静的这一情绪感知,视觉判断比听觉判断作用更大;3)视觉元素中的旷奥程度以及声音的远近感也起到辅助作用。上述观察和结论填补了视听交互中质性研究的空白,并证实扎根理论等质性研究方法是揭示视听交互深层机制的有效工具。然而,由于保护地现场实验开展难度大、时间及经济预算有限等条件限制,本研究主要以在校大学生为样本来进行研究,具有一定的局限性。虽然既存研究,如Hong等[18]的20份城市居民样本和Pheasant等[15]的20份保护地游客样本(年龄分布在38~71岁),并未显示出视听交互与年龄存在重要相关性,但未来研究仍应逐步拓展样本的数量和多样性,以进一步明确视听交互与年龄的关联。
基于上述结果,本研究对以武陵源世界自然遗产地为代表的保护地管理的核心启示在于:视觉资源和声景资源的匹配关系至为关键,应依据各保护分区的匹配情况制定视听资源联合管理政策。具体建议如下:
1)鉴于自然遗产地保护区常与人类游憩在空间上高度重合的特征,视听匹配度随旅游压力增大而降低的情况在各遗产地内愈发普遍。应在遗产地保护规划的初期阶段就注重提高视听匹配度,避免视听矛盾。武陵源核心景区内的贺龙公园就是规划不足导致显著视听矛盾的突出案例。贺龙公园四周风景绝佳,自然声凸显,而公园本身餐饮与游憩设施规模过大,形成了与实验情境类似的人工化过重的影响,导致视听愉悦度减弱。以视觉和声景双重资源的本底调查为基础制定保护策略则可以避免类似矛盾的发生。
2)对于视听环境俱佳且高度匹配的区域,如核心保护区内,应通过声景时空管控(如对游客利用时长和强度予以控制)等手段保证核心区的自然声源持久性和自然之声的优美特质,同时最大限度地减少视觉(包括远景和近景)对声觉感知的消极影响。尤其是自然特征明显且目前开发强度较低的景区(如砂刀沟景区),为减少人为噪声的影响,可通过低噪声话筒等设备来降低导游喇叭等人为声源的传播,以确保核心区的自然寂静。
3)对于视听资源欠佳且不一一匹配的区域(如缓冲区、二级和三级保护区),也应注意人工设施的建设,必要的交通设施如栈道、马路等也应当注重其隐藏性,否则在视听交互感知评价时将同时影响视觉和声觉感知,导致嘈杂、人工等负面的感知评价。
应对视听矛盾特别突出的区域加以重视,视觉或听觉环境受干扰过高都将导致消极的总体环境感知。对视觉环境优质但听觉环境极为嘈杂的区域,如百龙天梯、迷魂台等景点,应注重控制声环境质量;而对于听觉环境优质但视觉环境受干扰极大的区域,如天子山、石家檐等景区,应采用景观设计的手段降低视觉对听觉的影响。
注释(Notes):
① 参与者来自土木工程、日语、化学、风景园林、生物技术、生物医学工程、生物科学、生物信息技术、生命科学、行政管理、经济学、哲学、自动化、医学、国际经济与贸易、法学、建筑学、城乡规划、政治学与行政学19个专业。
② 10个语义差异量表:无聊的–兴奋的;紧张的–舒缓的;难受的–舒服的;尖锐的–柔和的;嘈杂的–安静的;人工的–自然的;悲伤的–愉悦的;烦躁的–高兴的;丑陋的–美丽的;焦躁的–放松的。
图表来源(Sources of Figures and Tables):
文中图表均由作者绘制。