高晨峰
摘 要 随着互联网通信技术的飞速发展,网络新媒体视频已经成为电子商务推广的主要形式。当前,网络运营商普遍采用个性化推荐系统来为用户提供网络新媒体视频观看服务,但是个性化推荐系统的用户视频观看兴趣判定准确率不高,没有完全迎合用户兴趣,甚至在一定程度上会造成用户对网络新媒体视频的反感。为了解决用户视频观看兴趣判定准确率不高的问题,文章设计并提出了基于本体的网络新媒体视频用户兴趣判定模型,该模型以本体为基本单元,根据网络新媒体视频特征,分别生成网络新媒体视频的类别本体、描述本体、主演本体、标题本体,然后建立了类别兴趣分量计算模块、关键字兴趣分量计算模块、兴趣精确度纠正模块,从而实现对用户视频观看长短期兴趣的精准判定。经过仿真测试发现,该模型对用户视频观看长短期兴趣判定准确性较高,能够针对绝大多类型的用户,通用性能较好。
关键词 网络新媒体视频;本体;兴趣判定;准确率
中图分类号 G2 文献标识码 A 文章编号 2096-0360(2019)10-0033-04
随着网络通信技术的发展与成熟,网络新媒体视频的发展迎来了新的发展契机,目前已经成为当前主流的互联网应用标准。然而,网络新媒体视频在快速发展的同时还面临很多问题。网络运营商是网络新媒体视频传播与引领的关键,他们掌握着新媒体大量的视频数据。但是,网络运营商没有充分挖掘这些网络新媒体视频的潜在商业价值,只是按部就班根据带宽收取运营费用,未曾打通网络新媒体视频业务发展渠道[1]。
也有部分网络运营商尝试针对特定用户播放相关网络新媒体视频广告,试图迎合用户对网络新媒体视频的兴趣,但是实际效果并不理想。个性化推荐系统是目前网络运营商管理网络新媒体视频的关键技术之一。个性化推荐系统是以用户的兴趣为基础,利用大数据向用户推荐可能感兴趣的视频资
源[2]。目前,基于个性化推荐系统的用户兴趣挖掘技术十分成熟,常见的技术有:淘宝推广[3]和百度推广[4]。深入分析发现,这种基于个性化推荐系统的传统用户兴趣挖掘技术存在如下缺陷,第一,网络新媒体视频数量较多,但整体收益并不高,甚至部分网页放满了网络新媒体视频,造成用户体验严重下降,从而产生消极态度,长此以往不利于网络新媒体视频用户兴趣的提高,阻碍网络新媒体视频的推广和应用。第二,网络新媒体视频千篇一律,对于绝大部分用户播放的网络新媒体视频都是一样,完全没有针对性和定制化,不能充分挖掘用户的潜在兴趣,也就不能达到网络新媒体视频长远发展的目的[5]。因此,如何构建一个令用户满意的网络新媒体视频播放氛围,并设计一个高准确率的基于本体的网络新媒体视频用户兴趣判定模型是本文需要解决的关键技术。
1 基于本体的网络新媒体视频用户兴趣判定模型设计
网络新媒体视频包含的信息十分丰富,除了网络新媒体视频主体信息,还包括:视频标题、视频主演、视频类别、视频描述等,基于本体的网络新媒体视频用户兴趣判定模型是将全部的视频特征信息纳入用户兴趣考虑范围,因此整个用户兴趣判定过程相对复杂,需要经过多个判定环节[6]。如图1所示是基于本体的网络新媒体视频用户兴趣判定模型整体架构。从图1可以看出,基于本体的网络新媒体视频用户兴趣判定模型整体架构包括3个模块,分别是:类别兴趣分量计算模块、关键字兴趣分量计算模块、兴趣精确度纠正模块。3个模块相辅相成,共同实现网络新媒体视频的用户兴趣精准判定。
从图1可以看到,虚线以上结构为模型的用户兴趣输入数据,在输入数据进行计算之前,需要对网络新媒体视频的特征信息进行预处理。预处理的目的是把视频的特征信息聚合到一个数据结构中,便于之后的兴趣判定。
完成用户的网络新媒体视频信息预处理之后,模型会自动获取网络新媒体视频信息并进行用户兴趣判定。在本次网络新媒体视频判定用户兴趣之前,还需要结合用户以往的长短期视频兴趣,及时对用户兴趣进行更新,并将更新后的兴趣重新覆盖到用户数据库中。
在基于本体的网络新媒体视频用户兴趣判定模型整体架构的最左侧是类别兴趣计算模块。类别主体是网络新媒体视频最为关键的特征信息,根据类别主体可大致判断出用户对网络新媒体视频的兴趣范围。之后是关键词主体兴趣的判定,网络新媒体视频除了类别主体可判定用户兴趣外,视频的主演、描述、标题等本体也可以判定出用户的兴趣[7]。一般而言,主演、描述和标题本体都是利用关键词提取的方式进行计算,为了提高判定效率,可以把主演、描述和標题本体分量进行聚合,得到关键字兴趣分量,再由关键词兴趣分量和类别兴趣分量按照一定的比例组合计算出初步的用户兴趣分量。
根据初步的用户兴趣分量,还需要借助网络新媒体视频的其他信息本体对初步的用户兴趣分量进行调整。这里的其他信息本体可以使网络带宽、延时、丢包等性能指标,同一个网络新媒体视频在不同大小的网络带宽上具有不同的播放体验感。在用户兴趣相同的条件下,用户对某个网络新媒体视频越感兴趣,就越会选择清晰度更高的视频[8]。因此,可以根据视频清晰度对初步的用户兴趣分量进行权重修改,得出本次网络新媒体视频用户短期兴趣判定结果。
对于用户长期兴趣判定,在用户视频播放的历史记录下,用户长期兴趣即为用户兴趣的持久度。时间越长,用户对网络新媒体视频兴趣可能发生变化。因此,在判定用户长期兴趣时,要对旧长期兴趣进行降权处理,从而可以保证用户长期兴趣判定的准确性。
根据以上对基于本体的网络新媒体视频用户兴趣判定模型整体架构的描述与分析,本文给出基于本体的网络新媒体视频用户兴趣判定模型的执行流程,如图2所示。
2 基于本体的网络新媒体视频用户兴趣判定模型仿真
2.1 仿真数据
为了验证基于本体的网络新媒体视频用户兴趣判定模型整体架构的准确性,本文进行了模型的相关仿真测试。仿真测试选择了多用户和多网络新媒体视频的样本基础,保证了仿真测试的可靠性。在仿真测试中,用户数量为12个,每个用户观看的网络新媒体视频是在1个月内完成的。网络新媒体视频涉及各行各业,包括:电影、电视剧、体育、娱乐、综艺、儿童、动漫、搞笑、资讯、游戏、直播、文学、漫画等多达13个种类。设每个用户随机选择了15~20个网络新媒体视频。每个网络新媒体视频包含:视频名称、视频类别、视频描述、主演人员、观看时长、视频总长、视频清晰度等本体信息。
2.2 模型仿真
基于本体的网络新媒体视频用户兴趣判定模型是否正确运行主要取决于用户长短期兴趣判定的准确率,而用户长短期兴趣判定的准确率的计算关键在于对生成的兴趣向量的判断程度。在模型仿真过程中,每个网络新媒体视频的视频标题、视频主演、视频类别、视频描述本体都会生成一个用户短期兴趣向量,进而求出用户兴趣向量。将计算出的兴趣向量与基准兴趣向量进行对比,比较两者兴趣相同的个数及其权重和,进而分析用户兴趣相似度。计算用户兴趣与基准兴趣的相似度公式如(1)所示。
为基准兴趣A中的兴趣总数,表示在基准兴趣A中相同兴趣的权重和。当相似度值大于某个给定阀值?(?=1),则判定该用户兴趣与基准兴趣匹配,否则该兴趣无效。根据以上判定标准对12个用户进行长短期兴趣及其准确率进行判定,结果如表1所示。
对于用户长期兴趣,本文采用跟踪记录法进行判定。对每个用户的网络新媒体视频兴趣进行记录,以基准兴趣为标准,计算用户兴趣与基准兴趣的距离,随着视频观看时间变长,用户兴趣会出现一定的波动,可能会超出相似度基线范围。如图3所示,虚线对应的为相似度基线,用户兴趣在长时间视频观看过程中出现了部分相似度基线越界,但整体上用户兴趣相似度基本保持了较高的准确率。
2.3 结果分析
根据本文的基于本体的网络新媒体视频用户兴趣判定模型仿真测试结果,我们可以发现,儿童的兴趣判定准确率较高,这与现实情况基本一致。由于儿童特殊的年龄结构,造成儿童的兴趣比较单一,对网络新媒体视频较为执着,观看的网络新媒体视频类型也较少,主要以动画、益智类视频为。因此,对网络新媒体视频选择比较明确,视频兴趣判定准确率较高。
青少年兴趣判定的准确率也相对较高,与儿童兴趣判定情况类似,青少年关注的网络新媒体视频比较有特色,辨识度较高,例如:游戏、动漫、体育等。从网络新媒体视频本身来看,游戏、动漫、体育类视频的70%观众均是青少年,这样的特征使得青少年的网络新媒体视频兴趣判定准确率较高。
儿童和青少年之后是少女和家庭妇女。少女和家庭妇女虽然所处年龄阶段不同,但网络新媒体视频兴趣基本一致,主要的网络新媒体视频为:化妆品、服饰、鞋包、装饰品等。因此,少女和家庭妇女的网络新媒体视频兴趣判定准确率也不低。
网络新媒体视频兴趣判定准确率较低的是女性白领与男性白领。女性白领与男性白领与其他用户类型存在一定的区别。男女性白领所关注的网络新媒体视频没有一个范围,涉及面较广,内容繁杂,同时由于工作原因,男女性白领观看网络新媒体视频的时间相比其他用户类型较少。因此,在分析男女性白领的网络新媒体视频兴趣时,可能会出现较大的兴趣判定误差。
从整体上来看,基于本体的网络新媒体视频用户兴趣判定模型基本适用于大多数用户类型,且保持着较高的网络新媒体视频长短期兴趣判定准确率,准确率可以维持在80%左右,相比基于个性化推荐系统的兴趣判定模型具有更高的适用价值。
3 结束语
本文从网络新媒体视频出发,根据用户观看的网络新媒体视频提取出视频的相关本体信息,同时结合大数据关键技术对提高用户长短期兴趣判定准确率进行了深入研究,提出了基于本体的网络新媒体视频用户兴趣判定模型解决方案。该模型的核心是类别兴趣分量计算模块、关键字兴趣分量计算模块、兴趣精确度纠正模块三大模块。网络新媒体视频包含多个主体,分别为:类别本体、描述本体、主演本体、标题本体。通过三大模块与四个本体计算得出初步的用户兴趣分量,然后根据网络新媒体视频的观看时长、视频总长、视频清晰度对初步的用户兴趣分量进行调整,并结合用户旧长期兴趣得出最终的用户长短期兴趣及判定准确率。
参考文献
[1]王晰巍,赵丹,李嘉兴,等.新媒体环境下网络舆情演化模型及仿真研究——基于信息生态视角[J].情报学报,2016,35(10):1011-1021.
[2]朱岚.让受众成为用户——面对新媒体和网络视频冲击法制栏目应对之策[J].环球市场信息导报,2016(14):76-76.
[3]王晰巍,韦雅楠,邢云菲.新媒体环境下企业与用户信息交互行为模型及特征研究[J].图书情报工作,2018(18):6-15.
[4]范艺馨.浅析新媒体环境下短视频的发展态势——以“抖音”App为例[J].新闻研究导刊,2018,9(7):98.
[5]赵丹,王晰巍,李师萌,等.新媒体环境下的网络舆情特征量及行为规律研究——基于信息生态理论[J].情报学报,2017,36(12):1224-1232.
[6]宋仕平,熊奡君.90后大学生的价值观:基于新媒体文化环境的现状分析[J].三峡论坛(三峡文学·理论版),2015(3):83-87.
[7]王子琳.新媒体时代下的网络微视频创意解析[J].美与时代(城市版),2015(12):130-131.
[8]洪瑤.探析新媒体时代网络视频广告的发展[J].出版广角,2017(7):66-68.