张维作
摘 要:随着社交网络的不断发展及普及,人们也逐渐活跃在一个或者多个社交网络中,这对研究用户的兴趣,为用户提供精准的网络推送提供了基础。目前,我国对此的研究有很多,但是社交网络整合信息的研究却较少,在如今大数据的环境下,社交网络的用户需求、兴趣也有了可能。基于此,基于大数据时代背景,提出了社交网络用户兴趣层次化模型的构建。
关键词:社交网络;大数据时代;用户兴趣;层次化建模
web2.0时代已经逐渐到来,网络用户也不断追寻全新的应用体验,在此背景下,社交网络油然而生。社交网络指的就是以互动作为基础,以网络中用户的共同兴趣、活动及爱好为前提,以实名制或者非实名制的方式在网络中构建的社会关系网络服务,其是社会化媒体的一种主流形式,其中包括婚恋交友网络。在如今大数据时代的今天,运用数据及挖掘数据决定着社交网络的未来,所以用户的兴趣数据对社交网络具有重要的价值意义。
1 用户兴趣模型的表示
兴趣模型指的是在一定数据结构中,通过算法表示的一种形式,兴趣模型的表现形式影响着模型对用户兴趣的描述能力及计算能力。用户兴趣模型包括两方面,分别为以向量空间模型为基础及以神经网络为基础:其一,以向量模型为基础。以向量模型为基础主要是将用户的兴趣模型当成一个n维的特征向量((t1,w2),(t2,w2),...,(tn,wn)),以此表示用户感兴趣的事物及对其的感兴趣程度。ti(1≤i≤n)为兴趣特征;wi(1≤i≤n)表示兴趣特征的興趣模型权重。其二,以神经网络为基础。神经网络就是多种简单处理单元通过互联形式,以此构成的网络结构,其组织、学习及适应能力超强。以神经网络为基础的用户兴趣模型能够通过网络连接的权重网络进行表示。[2]
2 基于大数据的社交网络用户兴趣层次化模型的构建
2.1 构建兴趣层次化模型的思路
为了能够构建基于大数据时代的社交网络用户兴趣层次化模型,本文提出了如图1的研究思路:其一,在现实社交网络中,有多种数据来源方式,总的来说可以分为标签及无标签两种。用户在注册社交网站的时候要填写基本信息,有的社交网站还会要求用户填写个人标签。个人标签是能够直接反映用户感兴趣领域的方式,但是没有标签属性的信息提取只能够通过内部的结构信息实现。通过上述就可以看出,标签数据具有预测用户评论、浏览等行为的作用,非标签行为也能够论证用户的兴趣领域。其二,创建用户兴趣模型的主要目的就是能够为用户推送感兴趣的信息,并且为用户推荐具有相同信息的好友,以此描述社交网络中不同用户的不同偏好,从而创建个人偏好的名片,从而标记用户对象,满足用户的需求,提高用户推荐的成功率,从而提高商家的利益。[3]
2.2 用户兴趣层次化模型的构建方式
通过以上算法,把所有用户都聚集到同一个类中,使其兴趣通过属性值、类别及兴趣度表示,这些都是用户的共同兴趣,算法步骤为:(1)创建一个用户兴趣池Mki,用户兴趣池表示为属于第k类中第i个用户的兴趣集合,兴趣池中的每个元素都是由三元组(
从而能够得出用户的长期兴趣向量IML=(
3 实验分析
从某个交友网站中选取实验数据,得出训练集为两百名用户的基本信息,实现用户的聚类,随机选择一个类,获取一百名此类别用户在最近一周的浏览行为。
为了证明本文中的方式能够得到准确的兴趣模型,通过评价指标对模型进行评价。选择的两百名用户的评价指标为查全率及查准率,通过本文中的方法对用户创建兴趣模型。查全率能够呈现出上述方法的用户兴趣寻找能力,从而判断用户兴趣模型的全面性,查准率能够呈现出上述方法的用户兴趣准确度。
通过聚类分析法对数据集中的两百个样本训练,创建用户兴趣值,获得用户的长期兴趣IML。计算出一百名交友网站用户兴趣模型的查全率及查准率。
使用本文中的方法计算的查全率及查准率分别为0.816及0.786,传统模型的查全率及查准率分别为0.524及0.562,以此证明本文中的方法能够精准的发现用户的兴趣分类,以此满足社交网站及需求。
4 结束语
随着社会的不断进步,互联网技术也在不断的发展,使用社交网络的用户越来越多,以此构成了较大的用户数据。本文通过标签传播集成、创建用户兴趣模型,以此构建了社交网络用户兴趣层次化模型,社交网络可以通过其为用户推动个性化广告,并且为用户推荐相同兴趣的好友,以此满足用户的需求,提高商家及社交网络的利益。
参考文献
[1]张珏,杨振华,王世琪,等.社交网络大数据环境下的用户兴趣层次化模型研究[J].教育观察,2016,5(8).
[2]吴良.社交网络中社区与用户兴趣分析——模型设计与实现[D].北京大学,2014.