孙 宜 宋 卿
(中国传媒大学,北京 100024)
2019年8月30日,中国互联网络信息中心(CNNIC)发布了第44次《中国互联网络发展状况统计报告》。报告表明,截止2019年6月,中国网民数量达到8.54亿,手机网民数量达到8.47亿,网络视频用户规模达到7.59亿,约占我国人口总数的54.2%。
个性化推荐技术本质上是系统主动进行内容和用户的匹配,因此内容标签和用户标签就成为个性化推荐的基础。其中,用户标签往往也被称为用户画像技术。用户画像近年来在个性化推荐领域发展非常迅速,该技术可以多维立体地将用户的行为偏好抽象成一个个标签,用户的标签与电影的标签相匹配,再结合目前常用的协同过滤推荐算法,便可以达到高速有效地为用户推荐电影的目的。
对于电影的个性化推荐不仅要考虑到算法的准确度,还要考虑电影的社会功能。将主流价值观的注入与推荐算法结合,可以平衡现代互联网技术与大众文化,为人民群众所喜闻乐见。
“个性化推荐”的概念最早在1995年被提出,美国卡耐基梅隆大学的罗伯特·阿姆斯特朗等人在美国人工智能协会上提出的个性化导航系统采用了“个性化推荐”的概念。几乎同时,斯坦福大学的研究者也提出了一个个性化推荐系统,拉开了个性化推荐的发展序幕。
20世纪90年代,推荐算法开始被研究。目前较为常用的推荐算法有基于关联规则的推荐、基于内容的推荐、协同过滤推荐和混合推荐等。在电影的个性化推荐中,协同过滤推荐算法使用最为广泛。
邓爱林等提出了一种基于项目评分预测的协同过滤推荐算法,通过对项目之间相似性的分析,对未打分的商品进行预测,以解决电子商务中用户评分极端稀疏情况下传统推荐系统存在的弊端,显著提高推荐系统的质量;张光卫等人将云模型与协同过滤算法结合起来,利用云模型在知识层面分析用户相似度以达到更好的个性化推荐效果;范波等人通过分析用户对多个不同类型项目的评分相似度,提出了用户间多相似度的协同过滤算法,有效提高了预测用户评分以及个性化推荐的准确率;朱磊等提出将用户的评分偏好与时间因素、物品属性结合起来,改进相似度的度量公式,有效提高个性化推荐的准确度;毕闰芳针对电影个性化推荐系统提出了基于SVR的协同过滤和用户画像融合的推荐算法,将用户对电影内容的偏好以用户画像的方式融入到协同过滤中,获得更好的推荐效果。
当下,对于个性化推荐的研究多是以提高推荐准确率为目的,诚然高准确度的推荐系统提高了用户体验,也帮助网站提升了转化率。但完全依赖于机器学习的推荐系统也渐渐将用户困于“信息茧房”中,在算法中加入价值观引导成为不可避免的趋势。
用户画像是对用户的基本信息与行为信息进行高度凝练得到的特征标签集合,“贴标签”是构建用户画像最核心的工作。
图1 用户画像构建流程图
构建用户画像包括基础数据收集、行为建模、构建画像三步,画像构建完毕后对用户进行每一次个性化推荐时,将用户的反馈纳入到数据收集环节,再次进行构建用户画像的流程,如图1所示,以此循环可将用户画像动态化,提高推荐的准确度。
用户数据的收集主要分为静态数据收集与动态数据收集两种。静态数据主要是用户填写的个人资料,包括姓名、性别、年龄等自然属性,职业、学历、婚姻状况等社会属性,这些数据通常具有较高的稳定性,在较长一段时间内不会发生非常大的改变。而动态数据主要是从用户的行为和偏好中得到的数据,包括用户的浏览行为信息数据、偏好行为信息数据和交易行为信息数据。
在获取了用户的基础静态信息和行为信息后,利用自然语言处理、机器学习、聚类算法、预测算法等技术,抽象出用户的个性化标签,对用户行为进行建模。一个行为模型主要包括时间、地点、人物、方式、内容五要素,具体可以描述为什么用户(who)在什么时间(when)什么地点(where)以什么方式(how)做了什么事(what)。
通过技术手段对用户行为进行建模后,则可以针对具体的应用场景为用户定义多维度的标签体系,以可视化的方式构建出用户画像。
协同过滤推荐算法主要通过用户过去的行为与相似用户的行为来预测用户未来可能感兴趣的项目,以达成精准化、个性化推荐效果。在实际应用中,基于用户的协同过滤算法与基于项目的协同过滤算法通常是结合起来使用的。
基于用户的协同过滤算法是通过对有相似偏好的不同用户进行交叉推荐,以达到给用户推荐可能感兴趣的项目的目的。寻找行为偏好相似的用户是使用基于用户的协同过滤算法的前提,故这一算法的核心是用户之间相似度的计算。使用适用于特定环境的方法完成对用户相似度的计算后,可对用户群体进行分类或聚类,在未来的观影行为中同类的用户之间更有可能有相似的喜好,因而可以向用户推荐同类用户观看过而本人未观看过的电影。
基于项目的协同过滤算法是通过分析用户以往感兴趣的项目,将与之相似的项目推荐给用户的推荐算法。与基于用户的协同过滤算法相似,基于项目的协同过滤算法的核心便是判断项目之间的相似性。除了传统的相似性判断方法外,在电影领域,还可以通过电影的导演、演员等要素对电影进行基于一定权重的直接划分,进而找到相似的电影进行推荐。
电影个性化推荐算法过于单一时容易使用户陷于“信息茧房”,视野逐渐窄化。推荐算法的极端情况便是“你喜欢什么,你的世界就只剩下什么”。每天看到相似甚至是相同的电影推荐,渐渐地就会给用户一种“电影都是这样”的错觉,极大地限制了用户的视野,久而久之,便会在不知不觉中将用户困在兴趣的小圈子里,就像是困在一个“茧房”中。在更极端的情况下,用户甚至会出现“信息异化”的情况,个人想法被看到的信息所影响,成为被信息支配的奴隶,不再具有作为信息控制主体的能力。若用户本身的情感倾向与价值观就与主流价值观相悖,那推荐算法就可能将他引入歧途。
在当今的网络环境之下,“流量明星”具有巨大的影响力,这并非健康的网络环境应有的特征。为改善这一情况,一方面要对内容加强监管,尽量控制流量明星的庞大粉丝群进行“控评”“刷屏”等行为,另一方面也要主动出击,利用个性化推荐算法来弘扬主流价值观。
电影不同于高度依赖个性化推荐的短视频,短视频不仅有高度的娱乐功能,还具有非常重要的教化功能。因此传统的个性化推荐算法不能全然照搬到电影推荐领域中,主流价值观的注入成为必然。
基于协同过滤的推荐算法不同于以今日头条为代表的新闻客户端所使用的基于内容的推荐算法,它将推荐的维度提高,将“人群”作为推荐的基数数据,不断进行优化和迭代。基于协同过滤的推荐算法相较于基于内容的推荐算法拥有更大的灵活性,其推荐的内容也更加丰富,可以有效避免用户接收到的信息窄化的问题,打破“信息茧房”。
个性化推荐依赖机器学习与深度学习,它足够智能化,却不够人性化,而多元化、开放式、动态化的推荐算法可以在一定程度上规避算法带来的缺陷。为打破“信息茧房”,需要改进算法,使用纠偏技术。不但要动态跟踪用户的使用行为和使用偏好,及时转变推荐的重心重点内容,还要定期给用户推荐非计划中的电影,找到用户可能感兴趣但目前还没有了解过的电影,拓宽用户的视野,打破“信息茧房”,让推荐算法更人性化。
在互联网上的传播环境是一个逐渐去中心化的系统,在这样的前提下,视频网站与视频客户端必须把握住意识形态的主动权。作为一个传播平台,必须有以多样化的方式宣扬社会主义核心价值观的意识和作为。对主流价值观的注入不仅要依靠集中力量加强人工审核,结合大数据技术进行溯源,把握不良电影和不良画面的来源,从源头上遏制不良内容流出,提高电影质量,还要从推荐系统本身入手,拒绝简单粗暴的置顶方式,更加人性化地对价值观进行个性化引导。
电影的推荐本质上是对文化的传播过程,这一过程会对用户产生潜移默化的作用,进一步会对整个社会的风气和价值观产生巨大的影响。当前广泛使用的用户画像的标签体系中,通常没有主流内容的标签维度,而在电影的个性化推荐中主流内容的标签维度是必不可少的。对于主流内容标签,应根据具体情况对其权重进行适当加强,在尊重用户兴趣的前提下,将主流价值观以多样化的方式传递给用户。
将用户画像与协同过滤算法结合不仅可以很好地解决协同过滤算法忽略用户对电影内容的偏好的问题,在用户画像构建过程中,通过分析用户的行为数据,特别是对评论等文本信息进行情感分析,还可以获得用户在一定时间段内的情感倾向,当用户出现负面情绪或价值观明显偏离主流正确价值观方向时,及时做出反应,将部分包含正面情绪和主流的正向价值观的内容推荐给用户,改变“算法无价值观”的现状。
随着5G移动网络的建设和高清编码技术的发展,会有越来越多的用户随时随地通过移动终端观看4K/8K高清电影。个性化推荐技术的引入,恰好能够帮助我们在纷繁复杂的电影资源库中快速找到那一部“对”的电影。
在目前人工智能大发展、大数据技术大应用的背景下,个性化推荐技术已经成为内容传播行业的标准配置,也将成为线上电影行业持续健康发展的突破口。用户画像基于用户自身数据的采集分析,帮助视频网站更加懂得用户所想,为每一个用户打造与众不同的观影体验。而用户画像与协同过滤算法融合,将“历史行为”“用户分群”“电影内容”都作为推荐的基数数据,不断进行优化和迭代,具有更大的灵活性,其推荐的电影准确性也会得到一定的提高,在此过程中,通过对用户情绪与价值观的监测并及时做出反应,可以有效避免用户接收到的信息窄化问题,对用户的价值观进行及时的引导。