以微博为例浅析社交网站中的视频推荐算法

2018-12-19 18:55闫子琪
科技传播 2018年23期
关键词:统计分析

闫子琪

摘 要 随着网络的不断普及,人们在网络中获取消息的渠道也不断扩增,这也促进了网络上各种技术的不断发展。视频推荐算法就是这其中的一个,它的主要作用是通过一些数学上的算法,将网友在某社交网站上的喜好行为做出相应的归纳总结,再对该用户进行相关的视频推荐。因此,视频推荐算法是一个以数学理论为基础,应用于互联网,服务于全体网友的技术。文章先对视频推荐算法的发展历程做简要介绍,并就微博上的视频推荐算法进行介绍和相关优缺点的分析。

关键词 视频推荐算法;微博视频推荐;用户喜好;统计分析

中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2018)224-0148-02

当今社会,是一个信息爆炸的时代,获取信息的方式日益多样。微博作为当代社会一个巨大的公众交流平台,每时每刻都会产生无数的新信息,而它产出消息的精准和快速,也让微博从众多社交媒体中脱颖而出,成为人们获取信息的主要渠道。它具备了从海量信息中瞬间提取出我们喜好的强大功能。比如我们通常在刷微博的过程中会收到一些视频的推荐,而这些视频往往和我们的兴趣点不谋而合,所以出于好奇心人们就会点开视频。微博能够以视频的形式抓住用户的眼球,同时引发拥有相同兴趣的用户间的头脑风暴。这一技术应用的就是视频推荐算法。本文就是以微博作为例子来阐释社交网站中的视频推荐算法。

1 推荐系统的发展历程

推荐系统,顾名思义,是能给用户推荐相关信息的系统。主要目的是在现在这个互联网信息呈指数增长的时代里,解决信息过载的弊端,带给网友更加优质的网络体验,让人们能轻松了解到自己所感兴趣的信息。随着科技的不断进步,推荐系统也发展的愈加完善。

1.1 初步研究期(20世纪90年代初期)

我们一般认为,推荐系统的发现与研究,始于1994年明尼苏达大学,当时GroupLens研究组所推出的GroupLens系统。那是最早将协同过滤算法融入到推荐算法中的系统。应用到了一些数学和统计学上的知识,巧妙地把数学算法和计算机技术联系到了一起,为视频推荐算法的开启和研究奠定了基础,也使处于起步阶段的互联网技术远离单调死板。本文后续将会就协同过滤算法展开研究。

1.2 发展期(20世纪90年代末)

推荐算法作为当时新兴的一种技术,能与协同过滤算法进行联系,无疑受到了不少人的关注。紧接着,1995年,就由卡内基梅隆大学的Robert? Armstrong等人开发了全新的系统。该系统能协助互联网进行信息查找,同时进行个性化推荐。将刚起步的推荐算法进行优化,在原有的基础上扩大了其功能。同年,麻省理工学院和斯坦福大学也对此技术进行了相关的研究和发现。1997年,随着研究的不断推进,美国计算机协会就此发起会议,逐渐把对于推荐系统的研究推向高潮。

1.3 成熟期(21世纪)

21世纪,是互联网高度普及的时代。随着科技的不断发展,推荐系统也得到了相应的完善。就我国的网络现状而言,目前推荐系统已遍布各种App,像微博搜索栏下的视频推荐系统、优酷爱奇艺等视频播放平台的兴趣推荐系统、淘宝中的“猜你喜欢”等。这些我们常用的软件,随着科技的发展,都渐渐地将推荐技术的原理应用其中,说明推荐系统已不再是人们触不可及的高端科技,渐渐变成了人们网络生活中一项必不可少的功能。

2 微博中的视频推荐算法原理

关于微博中的视频推荐算法,现在最常用的有3种,分别是:基于内容的推荐算法、基于协同过滤的推荐算法和基于社交网络的推荐算法。这三种算法通过对用户的发帖内容、转发点赞和搜索等进行一系列的分析和评估,从而筛选出最符合用户喜好的视频并进行推荐。下面就这3种方法进行详细介绍。

1)基于内容的推荐算法。基于内容的推荐算法是通过搜集用戶的个人喜好,来对用户的搜索行为和兴趣进行建模,然后通过计算用户喜好和文本内容的相似度来匹配视频的一种方法。简单点说就是将用户微博内提及的内容进行总结,再联系出现相应关键词的视频文本,进行用户的兴趣视频推荐。关于提取用户文本里的关键词,我们通常用到的算法叫做“TF-IDF”。这种算法能将用户发布的微博中的“关键词”的“特征权重”进行计算分析,来衡量这个关键词在该用户喜好行为中的重要程度。“TF”是根据一个特征词在文本中出现的频率越高就越重要的原理计算的,而“IDF”则是说明一个特征词多次出现在不同文本里,这个词就不具备较强的区分性,就不能代表用户的喜好。两者的结合则高度的证明了一个用户在网络体验中的喜好。这种算法在某种程度上能使用户的兴趣和视频内容出现很大比重的重合。

2)基于协同过滤的推荐算法。协同过滤算法是通过分析该用户在微博上的喜好,同时在广大用户群中筛选出同样喜好的用户,并对这些用户对某一信息的评价进行整合评估,自动形成该用户对于这个关键词喜好程度的预测。比如说一个用户喜欢搜索关于娱乐方面的社会热点新闻,那么微博后台就会将所有这方面的爱好用户汇总,评估出这个用户在所有用户中对这方面的喜爱程度,得出用户对此内容喜爱度在广大网友中的排名,了解你在相应圈子里的位置,并进行相关视频推荐。

3)基于社交网络的推荐算法。这一算法,是基于上面两种算法进行的补充,可以用来解决一个用户特征不明确的问题。它的原理主要是利用微博上一个用户和另外用户的链接关系进行相关特征的预测。具体方法是通过分析这个用户的关注以及粉丝的特征取向,将它们共同的特征进行汇总,反映到这个用户的特征上。好友圈就是一个能很好应用这种算法的场所。两个互相关注的用户一定有着相类似的喜好,因此通过分析好友圈里各个用户的喜好可以更大程度的反应一个用户的喜好。如果说两人近期都搜索过某一综艺节目,那么微博后台自然就会推荐相应的节目花絮给此用户。

3 社交网站中的视频推荐算法短板及优势

随着时代的进步,越来越多的人选择通过微博来获取信息。但这一技术目前还没有发展到一个完善的阶段,微博平台中的视频推荐仍存在以下几点问题:

1)对于该视频搜索量的统计存在疏漏。使用目前微博里面的视频推荐算法来推荐视频,在某种程度上对其商业影响力造成影响。由于许多品牌是会对用户在搜索栏的搜索量进行数据的统计,因此搜索量的好坏可以直接影响到该品牌对于这一视频内容商业上的重视程度。微博热搜榜就是这一原理的良好体现。里面总结了当下时段搜索量最高的一些内容。品牌商官方微博的统计形式和热搜榜实则大同小异。而微博中推荐的视频是无法算作搜索量的,而搜索量对于一个品牌来说,是非常重要的参考数据。所以在搜索量统计这一方面,微博的视频推荐技术存在一定的弊端。

2)推荐方式存在局限。微博视频推荐技术只能针对完整播放和互动率高的视频进行二次推荐。假如一个用户看到他不感兴趣的视频,可能就会浏览几秒钟,那么微博系统就很难再次将这个视频推荐给其他用户。因此初始的完播率和互动率对于一个视频来说尤为重要。

现在的社会,各种各样的媒体层出不穷,但推送的内容实则大同小异。而新浪微博的这种视频推送技术,则是根据每个用户当下的“即时兴趣”进行分析在推送的。在海量的信息时代里尊重用户的差异化爱好,进行精准的个性化推荐。个性化即时推送技术打破了固有的概念和模板,进行了全新的尝试。这在个性化传播技术上无疑是一种巨大的飞跃。所以总体来说,微博视频推荐技术对互联网的影响,还是利大于弊的。以下是几个显著的优点。

1)微博视频推荐技术能较好的满足用户的个性化需求,不再一味的灌输相同的信息。有些用户常年在互联网上看到的信息都是千篇一律的。而微博视频推送的出现,能让许多用戶的个性化需求得以满足,从而逃离固有的“茧房”,享受网络带来的乐趣。

2)推荐算法将不断地与新媒体技术进行融合,并在某种程度上促进同行新媒体技术的创新发展。至今,网络出现也已经很长一段时间了。随着人们眼界的不断开阔和信息的不断轰炸,固有的传媒技术已经进入了一个瓶颈期。而微博视频推荐技术的出现,不仅满足了用户需求,还满足了媒体平台,给他们带来了很多流量。因此促进了当代网络新媒体技术的转型和升级,促使各个平台广泛普及这项视频推荐技术,从而实现更多的创新。

4 结论

本文对推荐算法的发展进行了简要概述,并就微博中视频推荐算法的原理、短板及优势进行了简单的研究和介绍。从20世纪90年代开始,推荐算法从无到有,逐渐地被科学家们重视,并且发展为今天这样能够为人们所用的技术。这一切都离不开科技和人们思维的发展。发展的同时也暴露了相关的问题,比如网络时代的个人信息泄露等。但总的来说,时代还是在进步,人们的思想也在进步。到现在,人们还在不断尝试着怎么才能让推荐算法更加便利地为广大网友所用,带给人们更加贴心的网络体验。

参考文献

[1]尚松涛,石民勇,尚文倩,等.基于大数据的微视频推荐算法研究[J].中国传媒大学学报(自然科学版),2017,24(2):38-45.

[2]刘聪.论媒体个性化推荐模式对“信息茧房”的影响——以新浪新闻“即时推”功能为例[J].新闻研究导刊,2017(23).

[3]李鹏飞.视频网站中混合模型推荐算法的优化[D].北京:北京交通大学,2014.

[4]李斌.推荐系统研究综述[J].现代计算机(专业版),2014(3):7-10.

猜你喜欢
统计分析
SPSS软件在教学统计分析中的应用
多元统计分析在企业经济效益评价中的应用
近年退役士兵培训研究内容的数据统计与评析
SQL生成器设计与实现
2004—2005年国家社会科学基金重大项目立项项目的计量研究
2015年各省区煤矿死亡事故统计分析
以统计分析为基础的房地产税收优化分析
SPSS在高校图书馆服务体系中的应用研究