基于用户特征属性和云模型的协同过滤推荐算法

2017-08-01 00:21杨静河南大学软件学院
消费导刊 2017年9期
关键词:和云物品协同

杨静 河南大学软件学院

基于用户特征属性和云模型的协同过滤推荐算法

杨静 河南大学软件学院

互联网迅速发展,用户之间的互动联系越来越紧密。但正由于用户数量的急剧增长,导致互联网信息呈爆炸性增长,信息泛滥是信息时代的特点之一。有时,这种“信息过载”的问题给用户带来了很多干扰,使得他们难以迅速的获取自身需要的信息。信息检索技术中的推荐技术由此应运而生并被广泛的用户接纳认可,因为这种技术能根据用户的偏好自动推荐与推送相关的所需要的信息,因此,这种技术目前已经成为当前研究的热点。

用户特征属性 云模型 协同过滤推荐算法

一、协同过滤推荐算法简介

协同过滤推荐算法是通过对用户历史行为数据的挖掘并建立模型进行分析,发现用户信息的偏好,并在偏好基础上对用户进行群组划分,推荐与用户偏好相类似的商品。该算法又细分为两种算法,一是基于用户的协同过滤算法,二是基于物品的协同过滤算法。

基于用户的协同过滤算法是基于相同喜好用户之间的商品推荐。它通过分析总结用户历史的行为数据发现用户对商品或内容的喜好程度(如内容评论或分享,商品收藏购买等),并用制定好的分数标准将其数据化并度量化。

基于物品的协同过滤算法是将基于用户的协同过滤算法中的用户替换成物品,两种算法基本相类似。它通过度量不同的用户对不同物品的偏好获得物品间的关系,然后通过物品间的关系判断,继而对用户推荐相似的物品。

二、云模型简介

中国工程院院士李德毅最早提出云模型的概念,主要用来处理定性概念与定量描述之间的转换问题。云模型能通过模拟人类的思维方式来划分事物的属性,将低概念层的属性映射的高概念层的属性数值,完成定量与定性的相互转化。并且云模型能兼容相邻属性值和语言的重叠性,这样能使发现的知识更具有稳定性。由于云模型具有较强的随机不确定数据处理能力,因而能弥补计算机系统行为的随机性和不确定性,所以将云模型引入入侵检测系统中,能增强入侵检测系统的检测能力和适应能力。

云模型是云计算、云控制、云推理、云聚类等方法的基础,它是云的具体实现。正向云发生器是一个从定性概念到定量表示的过程。反过来,将定量表示到定性概念的过程称作为逆向云发生器。不同云的实现方法可扩展到多维云模型,也可构成不同类型的云,诸如半云模型、组合云模型、对称云模型等。

三、用户特征属性

用户的消费行为是动态的,不同的人生阶段对应不同商品和服务的消费行为。比如,幼年时期,服饰的尺码购买需求常常变化,针对营养健康食品的需求也是较大;而在成年阶段,服饰尺码基本不再变化,但是受时尚引领,对服饰的追求方向发生变化,而对于食品的要求有较宽松;等到老年阶段,服饰的样式无足轻重,食物也以易消化为主。这就是用户的特征属性,要具体的分析,同一用户不同阶段也会有不同的特征属性。同样,个人职业对消费行为模式的影响也比较显著。职业水平的高低一定程度上能反映消费水平,推荐系统必须对适宜人群推荐适宜产品,消费水平低的用户提供相对较低的消费产品,对于高消费能力的用户,主打高端产品。在协同过滤的算法中考虑用户特征对消费行为影响的话,能增强协同过滤算法的推荐效果。

四、用户特征属性和云模型的协同过滤推荐算法

基于用户特征属性和云模型的CF算法主体思想:首先通过分析用户特征属性,构成用户的行为矩阵,然后进行云模型计算。将计算的单个评分作为“云”,再将每个用户的所有“云”构成“云滴”,根据这个关系来计算用户之间的相似性。算法流程如下:

算法的输入:用户的历史行为分析评分数据集合Data、加权因子以及由用户属性信息构成的user文件。

算法的输出:Ru对Ii的预测分数。

Step1数据预处理

对用户的行为数据进行预处理。得到源输入矩阵Ru和i,即:

根据用户属性信息描述user文件采集得到用户特征属性矩阵

Step2计算用户评分特征向量

根据所得的源评分矩阵,统计每个用户所给出的对应等级的评分次数u1-u5。Step3计算用户相似度

用户的综合相似度矩阵sim ,计算公式如下

Step4产生推荐集

通过Step3得出的用户相似度矩阵找出矩阵的最近邻居,然后获得最近邻居集合Fu={F1,F2,…,FK},以F1与目标用户的相似度为最大,F2次之,以此类推到FK。然后通过使用以下公式预测得到最终的评分结果。

用户特征属性和云模型的协同过滤推荐算法利用了云模型计算用户间的相似程度,解决了传统算法因缺少数据对象属性而无法计算的问题。然后通过使用影响因子解决了新用户加入造成的影响。协同过滤推荐算法的局限性是无法缓解传统算法数据的稀疏性问题。

五、结语

互联网的发展引发了信息量的爆炸式产生。供应商为了增强互联网用户的信息精准获取的体验,满足用户及时获取需求信息的要求,从而给自己带来更多的收益,研究开发出了针对用户需求的个性化定制系统。通过搜集用户的互联网活动的信息数据,分析挖掘用户的偏好,然后针对不同的互联网用户推荐并提供针对性的产品,满足用户需求。

[1]赵文涛,成亚飞,王春春.基于Logistic时间函数和用户特征的协同过滤算法[J].计算机应用与软件,2017,(02):285-289+312.

[2]张星,刘帅.感知用户的Item-based协同过滤算法[J].信阳师范学院学报(自然科学版),2017,(01):125-128.

[3]张莉,秦桃,滕丕强.一种改进的基于用户聚类的协同过滤算法[J].情报科学,2014,(10):24-27+32.

杨静(1997-),河南开封人,河南大学,本科,研究方向:大数据、计算机算法。

猜你喜欢
和云物品协同
称物品
“双十一”,你抢到了想要的物品吗?
蜀道难:车与路的协同进化
谁动了凡·高的物品
“四化”协同才有出路
基于定位系统和云计算的电缆线路智能巡检系统
2017多媒体和云研讨会
三医联动 协同创新
花婆婆和云
2017多媒体和云研讨会