胡细玲++付达杰
摘 要:为了确实提高网络新闻,特别是移动互联网新闻的推荐过程质量,该研究以移动互联网新闻特点为研究切入点,开展了的个性化新闻推荐算法的研究。在研究中利用LDA模型与协调过滤模型技术的实践应用过程,开展了实践研究工作,为移动互联网中个性化新闻推荐算法的推进提供有力支持。
关键词:移动互联网 个性化 新闻推荐 算法
中图分类号:TP393 文献识别码:A 文章编号:1672-3791(2014)08(c)-0021-02
在当前的社会发展过程中,计算机网络技术的应用对于新闻事业的发展起到了极大的促进作用。特别是在新闻推荐过程中,网络技术的应用发挥了极大的作用。所以做好网络平台中,新闻推荐研究促进新闻事业发展就成为了重要的研究内容。在实际的研究过程中,研究者发现以手机、平板电脑为代表的移动互联网平台的出现,对于新闻推荐算法的质量,特别是个性化质量的提升有着重要的促进作用。所以在移动互联网模式下,做好个性化新闻推荐算法的研究工作,既能保证新闻推荐算法质量提升,同时对于新闻事业中网络技术应用的开展提供有效的帮助。
1 移动互联网下的新闻特点分析
在新型的移动互联网技术模式下,新闻工作整体出现了较为多样化特点的变化。这种多样化特点的变化,对于新闻推荐算法有着较为重要的影响。
1.1 主题的标签化特点
在当前的网络新闻环境特别是移动互联网平台中,新闻搜索工作主要依靠主题搜索的方式完成的。而这种主题的搜索中,标签化的特点极为明确。这种标签可以分为人物标签、事件标签以及情景标签等多种形式。人物标签主要是以人物为特点标签形式,如前一段时间以诺贝尔奖获得者屠呦呦为标签的新闻搜索就较为集中。事件标签则集中在事件本身主题展开搜索,如北京奥运会、世界杯等新闻就是这类标签的代表。而情景标签较为集中在时间、地点、环境等新闻主题的搜索中,如2008北京、2012年伦敦等都属于情景标签内容。这种新闻推荐中的标签化特点,在互联网发展中得到了较大的体现。
1.2 新闻内容实时播报特点
在互联网技术模式下,新闻发展出现了实时化播报的特点。这主要是因为移动互联网平台可以为新闻服务提供以下支持。一是新闻线索的实时性。在移动互联网支持下,每个移动互联网用户都可以通过无线网络平台,将身边发生的各类新闻线索与内容,通过微博、微信、手机QQ等平台进行发布。这就使的新闻工作者可以获得实时性的新闻内容线索,提高了新闻发布的时效性。二是新闻受众的时效性。在移动网络支持下,手机、平板电脑等移动网络用户可以通过移动网络,在网络范围内第一时间进行新闻的阅读与评论,提高了新闻阅读的实施有效性。
1.3 新闻的围观性特点
在移动互联网的新闻平台中,网络围观性特点是其新闻平台的主要特点。特别是在网络新闻热点话题的讨论中,围观现象主要表现在以下两点。一是对于事件的围观。在社会心理中,大多数社会人群具有从众心理,进而对社会讨论较多的社会事件等产生围观现象。如在2014年的马航失联事件成为了社会重点话题,进而引发了大规模的网络围观。二是对于政策的围观。在社会生活中,社会群体对于国家政策特别是民生政策新闻的围观现象,是网络围观的重要内容。如国家生育政策变化,就是社会网络围观中重要的关注要点。
2 个性化新闻推荐算法研究
对移动互联网平台下的新闻工作有了充分了解,对于开展个性化新闻推荐算法的研究有了更加良好的保障作用。在实践工作中,个性化新闻推荐算法包括了以下模式。
2.1 LDA模型支持下的新闻文档摘要算法
在移动互联网络新闻平台中,新闻内容一般分为了整体新闻与新闻摘要两种形式。在手机、平板电脑等新闻平台中,受到内容储量、阅读界面等问题影响,新闻摘要成为了新闻推荐的重要形式。所以做好新闻文档内容的摘要算法,是个性化新闻推荐算法的重要组成部分。在网络新闻文档摘要的实践过程中,LDA技术支持下的抽取式摘要方式,是较为常用的工作方法。在实际的算法应用过程中LDA技术支持下的文档摘要算法,主要是通过对LDA模型,对新闻文档中的内容进行内容通过概率分布与句子概率等基本性的特效,利用模型方式将其重要内容进行分析摘要,最终在新闻文档中形成文档的摘要工作。其主要过程包括了以下内容。
首先是LDA模型的建立。在LDA模型技术支持下的文档摘要算法中,首先需要做好LDA模型的建立工作。LDA模型技术是一项较为常用的摘要模型技术,其主要原理是利用模型方式,对文档中不考虑词汇与语法顺序,只考虑词汇出现概率,将词汇出现概率较高的词汇与句子进行分析摘要,形成摘要的过程。这一过程中,LDA模型的建立起到了重要的作用。其主要摘要过程包括了两个方面的程序。一方面其摘要生产的顺序为:文档→主题分布→主题→关键词。这种关键词摘要的产生,成为了摘要产生的主要内容。另一方面,对于摘要完成的关键词,在原文档中词分布摘要检查,提取出文档中的摘要内容。这种模型的产生,是LDA技术的主要模式。
其次是自动摘要的形成。在完成了文档LDA模型的后,将文档放入模型进行分析摘要。其摘要过程中,需要进行句子基本特征、主题概率特征以及关键词抽取三个过程。(1)句子特征分析。在摘要形成中,首先需要对文档内的句子基本特征开展分析。如对句子长度、位置以及相似度进行综合分析。其分析结果是开展算法的重要基础。特别需要注意的是,新闻文档在实际应用中,其首句及开头段落具有明显的提示性特点,在分析中具有明显的指示性特点。(2)主题概率特征分析与抽取。在完成了句子特征分析后,我们通过模型协助将其中的主题概率进行分析与初步的抽取工作,将其中的主题内容按照概率进行抽取。3、文档中的关键词抽取。在完成了以上的工作后,对于主题中抽取的主题内容进行关键词的抽取,完成新闻文档的摘要工作。
在实际工作中研究者发现,这种基于LDA模型支持下的新闻摘要推荐技术,较之传统的文件摘要技术,其推荐效果较为明显。特别是在移动互联网环境下,这种摘要推荐算法的应用具有良好的优势作用。
2.2 新闻标签与兴趣模型下的协同过滤算法
在移动互联网模式下,新闻标签与兴趣内容是其新闻平台的重要特征。在这一情况下,以新闻标签与兴趣为模型,利用协同过滤算法进行新闻推荐工作,是较为先进的新闻推荐算法。这种算法的使用,包括了以下的过程。
首先是兴趣模型的形成。在协调过滤算法的应用中,首先需要根据网络中的新闻标签,组合成新闻的兴趣模型。如将网络新闻中较为受人们的重视的“2008”、北京等情景标签,奥运会、比赛等事件标签,比赛冠军等人物标签进行统和,形成一个新闻推荐模型,为协同过滤的开展提供支持。
其次是新闻协调过滤算法过程。在完成了兴趣模型后,利用标签组成的兴趣模型进行新闻内容的过滤工作,将兴趣内容形成新闻的摘要进行推荐,保证新闻推荐质量的提升。这种利用新闻标签、兴趣模型进行的新闻推荐算法,在实际应用中采用较为普遍。
3 结语
在当前的新闻推荐过程中,以移动互联网新闻为基础的个性化新闻推荐算法的研究,是网络新闻推荐研究中重要内容。在实际的技术研究中,技术人员针对移动网络新闻的主要特点,开展了推荐算法的研究工作,利用LDA模型与协调过滤模型技术,做好个性化新闻推荐算法研究。
参考文献
[1] 吴登能.面向移动互联网的个性化新闻推荐算法研究[D].杭州:杭州师范大学,2013.
[2] 何永春.移动网络中个性化新闻推荐服务系统的设计和实现[D].北京:北京邮电大学,2006.