赵立新 三门峡职业技术学院信息传媒学院
伴随着互联网发展,web信息增长态势呈现出显著的指数增长特点,极易导致信息超载。在信息超载的情况下,用户难以有效获取所需信息,使信息使用效率呈现出大幅度降低。基于搜索技术,用户可采用关键字对所需信息进行搜索,但该技术缺乏对个性化的用户需求的满足。推荐算法可立足于用户喜好,为用户进行信息推荐,能实现对信息过载的有效解决。
网络理论工具能实现对复杂系统的深入理解和有效分析。基于网络和标签的混合推荐算法,具有更高的推荐精度以及个性化程度。
推荐算法,是指基于用户行为,通过相关数学算法对用户喜好事物进行推测。单一的推荐算法各自具有本身的缺陷,因此,在实际中,大多采用混合推荐算法。混合推荐算法,是指通过加权、串联以及并联等方式对单一推荐算法进行融合。混合推荐算法能实现对单一推荐算法技术弱点的有效避免,并融合其技术优势。相对于独立的推荐算法,混合推荐算法的准确率更高[1]。
基于内容的推荐算法,通常采用TF—IDF法对用户模型进行构建。TF—IDF统计法可评估字词在文件中呈现出的重要性。TF代表文档d中词条的出现频率,IDF代表反文档频率,将文件的总数目和含有词语的文件数目相除,并对商取对数[3]。
基于内容的推荐算法,以用户所选择的具体项目为依据,在项目中对关键词进行提取,通过关键词相应的TF—IDF值对向量进行构成,以对用户配置文件进行表示,以同样的方式对候选项目进行表示。通过夹角余弦等相关数学算法对用户与项目存在的相似度进行计算,并将具备最高相似度的项目向用户进行推荐。此方法在对具备多内容特征文件进行用户推荐时应用较多[4]。
在实质上,本文论述的混合推荐算法主要是基于网络的推荐算法,并辅之以两类用户偏好值,即将附加评分对基于网络的推荐评分进行增加。
第一步,对基于标签的用户偏好模型进行构建
输出:将用户偏好配置的相应文件以及用户标签支持度等进行输出
第二步,对项目资源相应的分配矩阵进行计算
输入:将用户集合
第三步,对用户尚未选择项目实施预测评分的计算
综上所述,NBI算法以用户—项目相应的二分图结构为依据,对项目呈现出的推荐程度进行计算,以用户所选择的具体项目为依据对用户尚未选择的其他项目的相应推荐程度进行计算,并对具体的推荐列表进行获取,其核心思想是对项目与项目存在的关系进行了利用。本文论述的混合推荐算法以NBI算法作为基础,以用户所选择具体项目体现的标签信息为依据,分别对TF—IDF法和标签支持度法进行运用,实现对用户偏好模型的科学构建,在此基础上,以待预测的具体项目相应的标签为依据对用户对此类项目呈现的偏好程度进行计算,并与NBI推荐模型实施线性组合,对用户推荐相关信息。相关实践证明,基于网络和标签的混合算法,相对于独立的推荐算法,具有更高的推荐精度,能更好满足用户的个性化需求。
[1]张新猛,蒋盛益,李霞,等.基于网络和标签的混合推荐算法[J].计算机工程与应用,2015,51(1):119-124.
[2]宋瑞平.混合推荐算法的研究[D].兰州大学,2014.
[3]刘传宝.基于网络关系特征的混合推荐算法研究[D].吉林大学,2016.
[4]曹春萍,徐帮兵.一种带隐私保护的基于标签的推荐算法研究[J].计算机科学,2017,44(8):134-139.