人机交互中的社会临场感研究
——以弹幕短视频为例*

2023-03-12 09:14:26薛晨琦宋昊阳

图书馆论坛 2023年3期

李晶，薛晨琦，宋昊阳

0 引言

随着计算机迅速发展，“面对面”的信息交互逐渐被人机交互(Human-Computer Interaction，HCI)取代，计算机媒介沟通(Computer-Mediated Communication，CMC)时代随之到来，依托计算终端开展一对多的“虚拟”交互成为日常。诚然，人机交互下的CMC大大促进了信息传递和交流的效率，但冷冰冰的计算终端如何营造“交互情境”，最大程度地提升用户的感知与体验，一直是人机交互领域研究的热点[1]。弹幕较早出现在国内知名社交网站Bilibili视频平台(以下简称“B站”)，其参与式、即时性、碎片化的交互特征充分满足了当代公众的心理需求。借助其在视频内以快速滚动或静止的形式显示留言的功能[2]，用户根据自己在观看视频和弹幕时所产生的情感、态度及想法，通过发表弹幕进行及时的信息呈现[3]，依靠与计算机的交互实现信息交流。用户采用弹幕进行交互的方式营造了强烈的“围观”体验[4]，能使用户与其他参与者产生虚拟的“共在感”，大大增加了用户身临其境的体验。学者们在研究这种身临其境感时将其定义为社会临场感(Social Presence，SP)，并表明其与交互存在着密不可分的关系[5]。目前针对社会临场感已有较为丰富的研究成果，普遍分布在通讯[6-7]、远程教育[8-9]、人机交互[10-11]及营销[12-13]等领域。这些成果在研究方法方面，主要采用了问卷调查法和内容分析法；在研究主题方面，针对网站、论坛的信息交互研究居多。本文尝试对弹幕短视频用户交互行为的社会临场感进行研究，以B站科普类视频为样本对象，引入社会临场感计算方法，对视频弹幕形成的社会临场感进行精确测度，在此基础上探讨社会临场感与用户使用视频的各种行为特征关联关系。本文的研究结论为拓展人机交互领域及CMC时代的社会临场感理论，以及基于用户视角促进科普类视频的分享与传播提供启示和参考。

1 理论基础

1.1 人机交互中的用户体验研究

人机交互主要研究人与计算机之间的交互关系，是一个多领域学科交叉的研究方向，早期的概念来源于卡德、莫兰和内韦尔在1983年所著的《人机交互心理学》一书[14]。不同于现实情境下个体之间的面对面交互，人机交互依托于互联网技术特性的优势，实现了人与计算机的交流，为用户提供了一种虚拟的交互环境。虽然人机交互使用户获取信息的方式更加简便高效，但计算机的非人性化仍为用户信息的获取带来了一系列的问题。进入21世纪以来，尽管系统设计[15]、界面设计[16]及人工智能等关键技术[17]仍然是人机交互领域的焦点所在，但是也有越来越多的学者注意到与“人”有关的因素，如感知风险、愉悦、舒适、可靠等[18-19]对人机交互效果的影响[20-21]，试图找寻在人机交互中满足用户感知与体验需求的最佳策略[22]。这些对人机交互中用户体验的关注将目光转向“人”而非纯粹的技术，不仅是研究视角的转变，更凸显了研究价值的回归。

1.2 社会临场感

社会临场感，又称社会存在、社会表露、社会呈现，是来自通讯领域的一个重要概念。该理论最早出现在马里兰大学教授Short等1976年的著作《通讯社会心理学》(The Social Psychology of Telecommunications)中，并将其首次定义为在利用媒体进行沟通过程中，一个人被视为“真实的人”的程度及与他人联系的感知程度[5]。随着该理论影响力范围的不断扩大，越来越多的学者将其应用于不同的领域的交互行为研究，并根据研究情境的不同，对社会临场感展开了不同的维度划分及测量的探索。表1对社会临场感在不同研究情境下的维度划分及测量方法的部分文献进行了梳理。

表1 不同研究情境下社会临场感维度划分及测量方法梳理

学者们基于社会临场感的维度划分包括单维度、多维度两种情况。根据不同情境的要求及学者们的研究探索，多维度对社会临场感进行划分更具有科学准确性，其中针对社交媒体或在线社区的维度可以总结为意识、情感及认知3类。从社会临场感的测量方法来看，大部分学者采用量表对其进行测量计算，有部分学者针对交互内容通过人工或机器编码进行统计，但量表的测算方法仅基于部分使用者的行为与感受展开，具有一定的研究不足；基于文本的计算则是依据场景现有的整个文本内容对社会临场感进行计算，数据全面，具有更高的可信度。

2 社会临场感的计算方法

通过梳理，基于文本的社会临场感计算主要包括两种方式。一是基于文本的人工编码处理。通过对获取的文本信息根据划分维度进行人工编码，将分类数据按照深刻程度进行赋值，赋值结果的总和表示社会临场感水平[41]。二是基于自然语言处理的自动编码。面对海量、复杂的文本信息，依靠人工智能机器的自然语言处理逐渐取代了人工，学者们针对获得的文本信息，通过人工智能机器进行自动编码，在处理过程中，通过计算每种社会临场感出现的频率来确定每种社会临场感水平[42]，或者将具有社会临场感维度的记1分，自动累计分数，获得临场感水平[43]。

综合考虑上述计算方法，本文选取“意识、情感、认知”的维度划分对弹幕视频社会临场感水平进行测度(见图1)。其中，意识指用户认为其他社会行为者似乎存在并能够对用户做出反应的程度[44]，即用户与其他参与者之间存在“共在意识”，具有强烈的感知交互；情感指用户通过虚拟社交引发的情感感知，Riva等也证明情绪反应与存在感密切相关[45]，而存在感正反映了社会临场感；认知是指用户在社交平台中通过持续的交互建构知识的过程[46]，在线社区的认知也是通过用户以发帖或评论的形式持续参与在线讨论来实现的[31]。

图1 社会临场感的3个维度

根据以上分析，通过获取每种维度出现的频率对社会临场感进行计算，计算过程见公式(1)。

其中，某视频社会临场感(Sp)各个维度出现频率分别为p1，…，pi，i=1，2，…，n。后文中将应用上述公式计算视频的社会临场感。

3 实证研究

3.1 数据来源

为从B站视频中选取影响力大且具有代表性的科普视频，本文通过B站专业的数据分析平台——火烧云数据平台，以“一级分类-二级分类”的“知识-科学科普”为检索类目，选取截止到2021年4月17日排名前十的UP主。由于B站没有直接明确的功能对弹幕数、播放量等进行排名，为方便选取，对以上UP主共1，867个视频的弹幕数、视频时长、播放量、发布时间等进行排序统计，以综合筛选条件，尽量确保每个视频都在选取范围之内，最终共选取40个视频。数据的收集采用Python作为爬虫编程语言，通过B站API接口，并以B站视频唯一BVID号作为区别标识。考虑到B站现有的弹幕库只保存少数弹幕数据，因此，基于视频界面的历史弹幕列表，对弹幕库进行逐日爬取并进行去重清洗，以尽量完整地获取所有历史弹幕。获取视频的信息列表见表2。

表2 科普视频信息收集列表

3.2 数据分析方法

(1)分词处理。本文使用开源的中文jieba分词工具，对弹幕文本内容进行预处理。其原理为基于前缀词典生成句子中所有可能成词的情况，并动态查找最大概率路径，找出基于词频的最大切分组合[47]。如弹幕文本“自己就是不长痘的体质”，基于jieba分词后可以得到“自己/就是/不/长痘/的/体质”。

(2)停用词清洗。弹幕作为用户表达情感及认知的文本，往往含有无意义的表达词、标点符号、特殊符号，在一定程度会影响测量的结果。针对分词后的结果，考虑到“？”“!”及“哈哈哈”等词具有明显的情感内涵，从停用词典中删除，作为保留词，构建包含数字标识、逗号、句号等无意义词的停用词典，然后进行停用词清洗。

(3)词频统计与主题分类。为计算各类词出现的频率，利用Python的Collection包下Counter的类对分词结果进行词频统计。使用TF-IDF算法进行特征提取，进行主题归类及数量统计，计算每个视频每种社会临场感维度出现的频率。

3.3 弹幕数据的总体描述

通过去重清洗等操作，截至2021年4月17日，爬取科普类视频共计299，994条弹幕，分别将每个视频弹幕的发表日期、视频时间节点进行数量统计，得出单日发表弹幕数量列表、逐日累积数量列表及视频时间点的弹幕数量列表，并对其分别进行可视化，制作相应的趋势分布图。

(1)弹幕数量分布。所选取的科普视频在弹幕数量的日期分布上具有明显的一致性。从图2可以发现，科普视频单日的弹幕数量分布呈现初期短暂突增而后骤降，最终逐渐趋于平稳的趋势，视频发布初期的弹幕数量远远大于后期弹幕数量。这说明视频平台发布的内容具有一定的时效性，随着时间推移，视频传播力减弱，用户的关注度也随之降低。

图2 科普视频弹幕数量日期分布

(2)弹幕数量累积分布。通过对每日的弹幕的累积数量进行统计，分别制作每个视频的弹幕累积趋势图。总体上可以发现，科普视频整体趋势与弹幕数量分布相符合，但存在两种不同的累积趋势。一是普遍趋势：弹幕累计数量短时间内急剧增长后趋于平稳(见图3)；二是特殊趋势：弹幕累积数量随日期缓慢增长至某一节点以较快速度持续增长，最终逐渐趋于平稳(见图4)。

图3 弹幕数量累积普遍趋势图

图4 弹幕数量累积特殊趋势图

(3)不同视频时间点弹幕数量分布。通过对科普视频时间点的弹幕数量进行统计，制作每个视频基于视频时间点的弹幕数量趋势图(图5为某个视频的时间节点弹幕数量趋势)。可以发现，不同视频时间节点弹幕数量趋势不同，但有两个共同点：从整体上观察，所有视频均不存在明显的上升下降趋势，且弹幕数量波动不具有普遍规律；每个视频都存在明显的突增、低谷点，这意味着每个视频在某一时间段都存在互动的高潮及低谷。

图5 科普视频时间节点弹幕数量趋势图

3.4 弹幕视频的社会临场感

依据科普视频时间点弹幕数量分布趋势体现的突增点及低谷点特征，能推断由低谷点到突增点的整个阶段最能体现用户的交互特征。为此，统计每个视频的突增及低谷点，以此对视频的交互行为进行统计，计算视频的社会临场感。为达到选取标准统一，作以下设定：一是突增点(T)：①大于3/4振幅②顶点(左右时间段弹幕数量均小于此点)；二是低谷点(B)：①小于1/4振幅②突增点之前的最低点，该点之后弹幕数量均有上升趋势；三是中振幅=(最大值-最小值)/2。具体来说，分别统计每个视频突增点、过渡段及低谷点的时间段和弹幕信息，截取弹幕文本列表，通过分词及去除停用词操作，使用TF-IDF算法进行特征提取，进行主题归类。最终，共提取到4类特征：情感反馈、认知交互、UP主交互及用户交互。其中，情感反馈指用户观看弹幕视频及弹幕后产生的与视频或其他用户之间的情感反馈；认知交互指用户观看视频及弹幕后所产生的知识建构；UP主交互及用户交互分别指用户与UP或用户进行无特殊内涵的对话，如打招呼、道别等。以视频1为例，其主题代表词见表3。

表3 视频1特征提取及代表词

经过具体内容分析，对选取的B站科普类视频的社会临场感水平进行计算。在发布弹幕过程中，用户认为此刻其他用户虚拟存在，并能与之互相反应。考虑到弹幕与视频画面的位置重合且与对应视频内容相对同步的独特表现形式，可以认为弹幕用户存在绝对的意识临场感。因此，本文删除意识维度，仅从情感和认知两个维度展开研究。所提取的情感反馈和认知交互特征分别对应情感临场感与认知临场感，根据计算公式，计算出各视频的社会临场感水平。各科普视频的主题特征频率统计及社会临场感见表4。

表4 各科普视频的主题特征频率统计及社会临场感计算

3.5 社会临场感与用户视频使用行为之间的关联性分析

本文进一步探索弹幕视频临场感与用户视频使用行为之间的相关性规律。选取每条视频的视频播放量、用户点赞量、用户投币量描述用户视频使用行为[48]，对每项数据进行标准化处理，以确保数据的量纲统一，数据选取的截止时间是2021年4月17日。由表5所示的数据描述性统计分析结果看出，所有视频样本的社会临场感均值达到了0.782，说明大部分视频的社会临场感较高。图6进一步揭示社会临场感与各行为变量之间的相关关系，所有变量与社会临场感之间都具有正向相关关系。具体地，图6中(a)、(b)、(c)分图表明社会临场感增强有利于提升视频播放量、用户点赞量和用户投币量，(d)图说明了本文基于弹幕数计算的社会临场感与视频的弹幕总量之间具有较强的正向相关关系。

图6 社会临场感与视频使用行为变量之间关系图

表5 描述性统计

4 研究结论与讨论

4.1 理论启示

(1)社会临场感在人机交互中的理论构建。传统的信息交互发生在基于现实情境的面对面交流，但是随着互联网技术的出现，传统的“人-人”交互理论不适合直接解释新时代CMC的问题，而不断涌现的人机交互理论更关注的是人与计算机之间信息交换技术层面的问题[49]，忽略了人作为主体的认知特征和情感表达。本文引入新闻传播学和教育学领域的社会临场感理论研究人机交互中用户体验优化的问题，对基于文本分类的社会临场感水平进行了定量测度，证明了社会临场感测度方法在人机交互研究场景的适用性，在一定程度上拓展了人机交互中用户体验研究的理论视域。

(2)社会临场感的多维度计算方法。自社会临场感理论提出后，逐渐被应用于多个领域的理论与实践研究中，并取得了丰富的研究成果。但随着CMC时代的到来，关于社会临场感的测度研究却少有学者关注。本文对已有的测量方法进行了梳理，在此基础上对社会临场感的多维度计算方法进行了完善，并从弹幕交互行为出发，探索采用弹幕文本数据，从情感和认知两个维度，研究测算了B站科普视频的社会临场感，为社会临场感的量化研究提供了方法和技术路径。

(3)社会临场感对用户视频使用行为存在影响。长期以来，有许多学者研究用户信息行为的前置动因，如风险情境[50]、商务营销环境[51]下的用户的感知特征(感知有用性[52]、感知满意度[53]等)，信息特征(有用性[54]、质量[55]、信息不足[56]等)，用户特征[57]及社会因素[58]等。但是，CMC环境下用户信息行为的关键影响因素很少有研究。本文关注了社会临场感这一因素，通过实证研究，运用文本分析与数据挖掘及相关性分析等方法，发现社会临场感对用户视频的使用行为具有一定的影响，这是在传统的面对面交互的环境下不存在的规律和特征，本研究为完善CMC环境下的信息行为理论，包括信息分享行为、信息利用行为、信息传播行为的影响机理提供了新的视角。

4.2 实践贡献

本研究发现视频的社会临场感在一定程度上会促进用户使用视频的行为，这对于帮助科普视频制造者基于用户视角促进科普类视频的分享与传播提供了新思路。科普视频制造者可以依据视频所反映的社会临场感水平获知用户对视频的满意程度，针对用户所感兴趣的内容确定更吸引用户的科普视频主题，提高视频传播力；对视频平台方而言，在扩大平台的影响力方面也有借鉴意义，平台方可将高社会临场感的科普视频作为主页面的推荐内容，在提高视频传播效果的同时，促进用户的分享行为，从而扩大平台的影响力；同时，视频的社会临场感水平也能通过用户的使用行为反映视频的质量，为其他用户选择更具有意义和实用性的科普视频提供了参考。

5 结语

本文选取弹幕视频平台B站的科普视频为研究对象，获取视频弹幕数据299，994条，利用文本分析与数据挖掘的方法，研究了弹幕的分布特征、视频弹幕反映的社会临场感测度及社会临场感与用户视频使用行为的关联关系，研究在一定程度上丰富了CMC时代的社会临场感理论，并在科普视频制造者、视频平台方促进科普视频传播、提高自身影响力及用户的视频选择方面具有实践价值。本文作为一项探索性的实证研究主要存在两方面的不足，为未来的深入研究提供了方向。第一，本研究发现弹幕两个阶段式累积等特征，但没有深入研究，未来计划针对这两种不同的特征进一步分析不同趋势对社会临场感水平的影响。第二，本研究仅使用TF-IDF算法进行特征提取，未来将继续探索和利用不同的特征提取方法和分类算法，发现社会临场感水平测量的最优方式，以提高研究的准确性。

人机交互中的社会临场感研究——以弹幕短视频为例*