张雁冰 方雪 吕巍
摘 要: 随着人工智能与语音交互技术的发展与成熟,AI语音助手逐步走进消费者的生活。研究重点考察了智能水平对消费者AI语音助手使用意愿的影响,分析了信任的中介作用以及个人创新性和使用场景的调节作用。研究发现:(1)在个人创新性强的情况下,智能水平对人工智能语音助手的使用意愿正向影响更强,而在个人创新性弱的情况下,语音助手智能水平对消费者使用意愿无显著影响。(2)在功能性使用场景下,语音助手智能化水平越高,消费者使用意愿越强;在享乐性使用场景下,语音助手智能化水平的提升并不能提升消费者使用意愿。
关键词: 人工智能;AI语音助手;信任;个人创新性;使用场景;使用意愿
中图分类号: F 275 文献标志码: A
Abstract: With the development of artificial intelligence voice interaction technology, mature voice assistants are gradually entering the lives of consumers. This study focused on the effect of intelligence level on consumers intention to use voice assistant. The mediating role of trust and the moderating role of individual innovation and product type were analyzed. The results show that:(1)In the case of strong personal innovation, the intelligence level has a stronger positive impact on the willingness to use AI voice assistant, while in the case of weak personal innovation, the intelligence level of voice assistant has no significant impact on the willingness to use AI voice assistant;(2) In the context of functional use, the higher the intelligence level of voice assistant, the stronger the consumers′ willingness to use. In the context of hedonic use, the improvement of the intelligence level of voice assistant cannot improve consumers′ willingness to use.
Key words: artificial intelligence; AI voice assistant; trust; personal innovativeness; usage scenarios; intention to use
1 研究假设
1.1 智能水平与使用意愿
AI语音助手指应用人工智能技术,它能够为用户执行相应任务,具有功能性或社会性的属性,同时具备自动理解和完善对话和情景能力的程序/载体/产品。Davenport和Kirby(2016)提出可以从对人类的支持、重复性任务自动化、情境感知与学习、自我意识来评估AI智能水平。LIU等(2017)从知识获取到结果处理的角度,提出了对搜索引擎智能水平的定义,包括获取知识的能力、掌握知识的能力、知识创新的能力、回应用户知识的能力。智能水平更高的AI语音助手,能够为消费者提供更为自然的交互,根据不同的场景提供定制化服务,不断更新以降低犯错频率,提供更为精准的服务。本研究将AI语音助手的智能水平定义为其正确识别、理解人类语音,输出相应成果以满足用户需求的能力。AI语音助手的智能水平越高,其语音识别、理解及输出的准确率越高,满足用户需求的能力越强;反之其相应的能力则越弱。因此,本研究提出假设:
H1: AI语音助手的智能水平越高,消费者使用意愿越强。
1.2 信任的中介作用
信任指用户相信设备具有良好的任务表现、正直可靠。信任在技术接受过程中起到双向作用。一方面,信任能够显著降低消费者对新技术不确定性的态度,相信其能够帮助自身完成相应任务,从而提升对新技术的使用意愿。另一方面,信任受到技术质量的重要影响,对于不同智能水平和交互质量的新产品,消费者的信任程度有显著差别。
智能水平较高的AI语音助手,可以正确识别、理解人类语音,输出相应成果以满足用户需求,用户信任程度较高。通过语音助手的帮助,消费者提升效率,完成任务,越愿意使用。而智能水平较低的AI语音助手则相反,消费者可能要多次语音才能使其理解指令,或是无法正确完成任务,这将显著减少消费者的信任,降低其使用意愿。因此,本研究提出假设:
H2: AI语音助手的智能水平通过影响信任来影响消费者使用意愿。
1.3 个人创新性
个人创新性指个人尝试任何新信息技术的意愿。人们越早接受创新,则其个人创新程度就越高。Agarwal和Prasad(1998)研究了個人创新性对新技术知识的了解和认知的影响及其与使用意愿的关系。个人创新性较强的个体更热衷于了解新知识,因此他们对新技术的使用意愿相对更强。个人创新性能够很好地预测用户对IT创新的接纳及使用意愿。
个人创新性高的个体对尝试新技术更为热情,能够承担更高的风险。个体创新性高的消费者,语音助手智能水平提升,会增强其使用意愿;个人创新性更弱的个体则相反,他们会规避新技术带来的风险。AI语音助手目前正处于技术发展周期的早期阶段,和很多其他新技术一样,其往往和高风险与不确定性相联系。个人创新性低的个体,语音助手智能水平的提升不能增强他们的使用意愿。因此,本研究提出假设:
H3: 消费者个人创新性较强的情况下, AI语音助手智能水平对消费者使用意愿影响作用更强,即智能水平越高,消费者使用意愿更强;在个人创新性较弱的情况下,AI语音助手智能水平对消费者使用意愿影响无显著影响。
1.4 使用场景的调节作用
消费者对语音助手的使用受到使用场景的影响。在功能性使用场景下,消费者受到功能性动机驱使,更关心如何以高效、及时的方式与最小的代价实现其目标。在享乐性使用场景下,消费者会受到享乐性动机的驱使,更关注产品的娱乐性、感观刺激。不同产品本身具有功能性或享乐性的客观属性,而不同的消费者、消费场景也会使得同一产品产生不同的消费体验,从而改变消费的认知。
消费者在功能性场景使用AI语音助手,更关注语音助手能否帮助他解决问题,更为关注其实用价值。语音助手智能水平越高,消费者越愿意使用。而对于享乐性AI语音助手,消费者更关注语音助手的趣味性、情感、陪伴等因素,智能水平对消费者使用意愿影响不大。因此,本研究提出假设:
H4: 在功能性场景使用AI语音助手时,其智能水平对消费者使用意愿影响作用更强,即智能水平越高,消费者使用意愿更强;在享乐性场景使用AI语音助手时,智能水平对消费者使用意愿无显著影响。
2 研究设计
2.1 实验设计
实验1:AI语音助手智能水平和个人创新性对使用意愿的交互作用
实验1主要是为了验证对于不同类型的消费者,AI语音助手智能水平对其使用意愿的影响,从而验证相应假设。被试首先会被要求填写关于个人创新性的问卷,填写完毕后根据平均值分为高低两组,再将被试随机分配至AI语音助手智能水平高低两组,即基本等分为4组。分组完成后,被试首先要填写个人信息项,主要包括性别、年龄、受教育水平等。完成个人信息填写后问卷会跳转至关于AI语音助手智能水平的视频,被试观看完视频后要对视频中的AI语音助手智能水平进行打分,主要是为了进行操纵检验。打分完成后被试要填写关于该产品信任和使用意愿的问卷。
实验2:AI语音助手智能水平和使用场景对使用意愿的交互作用
实验2主要是为了验证对于不同使用场景,AI语音助手智能水平对被试使用意愿的影响,从而验证相应假设。在实验中,被试首先会被随机分配到两类使用场景(功能性/享乐性)和两类AI语音助手智能水平(高/低)组合的场景,即等分为4组。分组完成后,被试首先要填写个人信息项,主要包括性别、年龄、受教育水平等。完成个人信息填写后问卷会跳转至不同使用场景和不同智能水平AI语音助手的使用场景视频,被试观看完描述和视频后,对场景中的AI语音助手智能水平和使用场景进行打分,主要是为了进行操纵检验。打分完成后被试要填写关于该产品信任和使用意愿的问卷。
2.2 研究变量及其测量
本研究主要采用给被试播放AI语音助手智能水平高、低两组的视频来测量其智能水平,被试观看后对感知智能水平进行打分。信任借鉴Kim(2010)等人的量表,代表题项为“对于这一智能水平的AI语音助手,您对其的信任程度”。个人创新性的测量主要参考Agarwal和Prasad(1998)的量表,代表题目为“我非常乐于尝试新产品”。使用意愿参考Pham and Ho(2015)的问卷,代表题目为“对于这一智能水平的AI语音助手,您多大程度上愿意使用”。以 上 变 量 均 采 用Likert 7点量表,“1”表示“非常不同意”,“7”表示“非常同意”。使用场景主要参考Lee(2011)等人关于功能型和享乐型机器人的研究进行了改编。首先进行预实验,在实验初始对功能性场景和享乐性场景的定义进行描述,然后选取10种使用AI语音助手代表性场景让被试对其感知的功能性和享乐性进行打分。代表性题项为“对使用AI语音助手的场景,您如何评价它的功能性/享乐性”,具体的打分方式为“享乐性、功能性”。
3 实验1结果
3.1 实验被试
本次最终回收有效数据160份,其中男性用户为74名,占比为46%,女性用户占比为54%。从年龄上来看,130名用户处于18~25岁,占比81%,是填写问卷的主要人群。从受教育水平上来看,研究生及以上的填写人数为109,占比68%,大学本科填写人数为48人,占比30%。
3.2 操纵检验
首先,检验了两个场景下消费者对AI语音助手智能水平感知的差异。结果表明,AI语音助手智能水平低组的均值为2.438 (SD=1.2513) , AI语音助手智能水平高组的均值为4.188 (SD=1.0685) , 两者之间存在显著差异(T=-9.513,p<0.000),说明实验成功操纵了消费者对AI语音助手智能水平的感知。
其次,通过处理个人创新性问卷的数据,可以得到个人创新性的中位数为4.7,因此将个人创新性得分低于4.7的个体归为个人创新性较低的群组,将个人创新性得分高于4.7的个体归为个人创新性较高的群组。将两组的均值进行对比,相应结果表明,个人创新性低的组均值为3.663(SD=0.8787),个人创新性高的组均值为5.821(SD=0.6728),两者之间存在显著差异(T=-17.443,p<0.000),说明两组的个人创新性被成功区分。
3.3 结果与讨论
在此基础上对使用意愿进行單变量方差分析,检验主效应的显著性。结果显示,智能水平对使用意愿的影响显著。具体来说,即AI语音助手的智能水平越高,消费者使用意愿越高(M智能水平低=2.208,M智能水平高=3.025,F(1, 158)=17.642, p<0.000) ,假设1得到验证。
然后,本文采用Bootstrap法来检验信任在智能水平和消费者使用意愿之间的中介效应。将AI语音助手智能水平高编码为1,智能水平低编码为0,个人创新性高编码为1,个人创新性低编码为0,样本量选择5000,在95%置信度的情况下选择Process模型7。结果显示,个人创新性低的情况下(LLCI=0.4737,ULCI=1.1764),中介效应为0.8198;个人创新性高的情况下( LLCI=0. 9316,ULCI=1.7783),中介效应为1.3476,区间均不包含0,表明被调节的中介显著,假设2得到验证。
最后,检验个人创新性的调节效应。对使用意愿进行单变量方差分析,结果表明,个人创新性的主效应不显著( F(1, 146)=0.479, p=0.490),智能水平和个人创新性的交互作用显著(F(1, 156)=4.307, p=0.040)。具体来说,对于个人创新性高的用户,智能水平越高,AI语音助手的使用意愿越强(M智能水平低=2.075,M智能水平高=3.292,F(1,78)=16.144,p<0.000);对于个人创新性较低的用户,智能水平对AI语音助手使用意愿的影响不显著(M智能水平低=2.342,M智能水平高=2.758,F(1,78)=3.051,p=0.085),假设3得到验证。
4 实验2结果
4.1 实验被试
本次实验最终回收有效数据160份,其中男性占比45%,女性用户占比为55%。从年龄上来看,128名用户处于18~25岁,占比80%。从受教育水平上来看,研究生及以上的填写人数占比59%,大学本科占比41%。
4.2 操纵检验
首先,检验了两个场景下消费者对语音助手的感知。结果表明,功能性场景下的均值为5.20(SD=1.048),享乐性场景下均值为2.44(SD=0.992),两者之间存在显著差异(T=17.124,p<0.000),说明实验成功操纵了消费者对使用场景的感知。
在此基础上,进一步检验在不同使用场景的分组中,对AI语音助手智能水平的操纵。结果表明,在功能性场景中,AI语音助手智能水平低组的均值为2.05(SD=0.904),AI语音助手智能水平高的均值为5.10(SD=0.823),两者之间存在显著差异(T=-13.708,p<0.000);在享乐性场景中,AI语音助手智能水平低组的均值为2.45(SD=0.714),AI语音助手智能水平高组的均值为3.88(SD=0.686),两者之间存在显著差异(T=-9.097,p<0.000),说明实验在两个场景下都成功操纵了消费者对AI语音助手智能水平的感知。
4.3 结果与讨论
在数据基础处理的基础上,对使用意愿进行单变量方差分析,检验主效应的显著性。结果显示,智能水平对使用意愿的影响显著。具体来说,即AI语音助手的智能水平越高,消费者使用意愿越高(M智能水平低=2.454,M智能水平高=4.063,F(1, 158)=66.737,p<0.000),假设1得到验证。
本文采用Bootstrap法来检验信任在智能水平和消费者使用意愿之间的中介效应。将AI语音助手智能水平高编码为1,智能水平低编码为0,享乐性场景編码为1,功能性场景编码为0,样本量选择5000,在95%置信度的情况下选择Process模型7。结果显示,功能性场景下(LLCI=1.9509,ULCI=3.0336),中介效应显著,且为2.4779;享乐性场景下(LLCI=-0.0852,ULCI=0.5287),区间包含0,说明中介效应不显著。因此,整体来看信任在功能性场景下发挥中介作用,在享乐性场景下不发挥中介作用,假设2部分得到验证。
使用场景的调节效应。对使用意愿进行单变量方差分析,结果表明,使用场景的主效应显著(F(1, 156)=5.085, p=0.026),智能水平和使用场景的交互作用也显著(F(1, 156)=133.716, p<0.000)。具体来说,对于功能性场景,AI语音助手智能水平越高,消费者使用意愿越强(M智能水平低=1.783,M智能水平高=5.058,F(1,78)=248.957,p<0.000);对于享乐性场景,AI语音助手智能水平对消费者使用意愿的影响不显著,即对于不同智能水平的AI语音助手,消费者使用意愿无明显差别(M智能水平低=3.125,M智能水平高=3.067,F(1,78)=0.085,p=0.771),假设4得到验证。
5 结论
5.1 研究结论
本研究的假设得到了实验的证实。首先, AI语音助手智能水平通过影响消费者信任,显著正向影响其使用意愿。其次,个人创新性与智能水平的交互作用对使用意愿有显著影响,即在个人创新性强的情况下,AI语音助手智能水平对消费者使用意愿的影响更强;而在个人创新性弱的情况下,AI语音助手智能水平对消费者使用意愿无显著影响。再次,使用场景与智能水平的交互作用也对消费者使用意愿有显著影响,即在功能性场景下,AI语音助手智能水平对消费者使用意愿影响更强;而在享乐性场景下,AI语音助手智能水平对消费者使用意愿无显著影响。
5.2 管理启示
在实际应用中,本文的研究结论可以应用于AI语音助手的设计与营销策略。研究发现,智能水平是阻碍消费者使用AI产品的重要原因,因此企业应加强算法及研发投入,为消费者提供值得信赖的智能产品。此外,对于个人创新性较强的群体,可以主打智能化营销策略,让其身临其境地感受到AI产品的智能,提升其购买意愿。而对于个人创新性相对较弱的群体,智能水平提升作用并不明显。在使用场景上,对于功能性场景,可以强调其智能水平、完成任务的精准性,吸引消费者消费和使用;而对于享乐性场景,对于智能水平的强调并非重点,可以考虑挖掘其独特性以吸引消费者。
5.3 研究局限性
雖然本研究在文献梳理和实验的过程中力求严谨,但在研究中仍然存在不足和局限之处。第一,研究对象及其操纵方式还有待完善,在两个主实验采取了让被试观看视频以及场景想象的方式进行操纵,未来应检验用户和AI语音助手真实互动场景。第二,本研究的被试大部分是上海高校的学生,样本的多样性仍待增强。第三,本研究主要考虑了智能水平、消费者特征、使用场景的影响,其他因素如AI语音助手外形、声音类型、消费者感知风险程度、使用场合等这些因素的影响需要进一步检验。
参考文献:
[1] GAIKWAD S K, GAWALI B W, YANNAWAR P. A review on speech recognition technique[J]. International Journal of Computer Applications, 2010, 10(3): 16-24.
[2] DAVENPORT T H, KIRBY J. Just how smart are smart machines?[J]. MIT Sloan Management Review, 2016, 57(3): 20-25.
[3] LIU F, SHI Y, LIU Y. Three IQs of AI Systems and their Testing Methods[J]. arXiv preprint arXiv:1712.06440, 2017.
[4] BENTLEY F, LUVOGT C, SILVERMAN M, et al. Understanding the long-term use of smart speaker assistants[C]//Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 2018: 91.
[5] SALEM M, LAKATOS G, AMIRABDOLLAHIAN F, et al. Towards safe and trustworthy social robots: ethical challenges and practical issues[M]. In Social robotics, Springer International Publishing, 2015: 584-593.
[6] EVANS A, REVELLE W. Survey and behavioral measurements of interpersonal trust[J]. Journal of Research in Personality, 2008, 42(6), 1585-1593.
[7] 谢康, 谢永勤, 肖静华. 共享经济情境下的技术信任——数字原生代与数字移民的差异分析[J]. 财经问题研究,2018 (4):99-107.
[8] AGARWAL R, PRASAD J. A conceptual and operational definition of personal innovativeness in the domain of information technology[J]. Information systems research, 1998, 9(2): 204-215.
[9] ROGERS E M, SHOEMAKER F F. Diffusion of Innovations[M]. Third Ed. New York: The Free Press, 1983.
[10] YI M Y, FIEDLER K D, PARK J S. Understanding the role of individual innovativeness in the acceptance of IT: comparative analyses of models and measures[J]. Decision Sciences, 2006, 37(3): 393-426.
[11] HOLBROOK M B, HIRSCHMAN E C. The experiential aspects of consumption: consumer fantasies, feelings, and fun[J]. Journal of Consumer Research, 1982, 9(2): 132-140.
[12] MANO H, OLIVER R L. Assessing the dimensionality and structure of the consumption experience: evaluation, feeling, and satisfaction[J]. Journal of Consumer Research, 1993, 20(3): 451-466.
[13] PHAM T T T, HO J C. The effects of product-related, personal-related factors and attractiveness of alternatives on consumer adoption of NFC-based mobile payments[J]. Technology in Society, 2015(43): 159-172.
[14] CASTELO N, BOS M W, LEHMANN D R. Task-dependent algorithm aversion[J]. Journal of Marketing Research, 2019, 56(5): 809-825.
[15] KIM S, CHEN R P, ZHANG K. Anthropomorphized helpers undermine autonomy and enjoyment in computer games[J]. Journal of Consumer Research, 2016(43): 282-302.