基于移动互联的信息化智能处理平台设计

2017-10-17 12:35毛正标彭勇
现代电子技术 2017年20期
关键词:means算法移动互联聚类

毛正标 彭勇

摘 要: 针对传统信息化处理平台一直存在耗时高、平台响应滞后以及信息聚类精度低等问题。提出并设计了基于移动互联的信息化智能处理平台和平台的物理架构。该平台由资讯服务模块、信息推送模块和智慧信息热点发现模块三大功能模块构成,分析了各功能模块的操作流程,这些功能模块协同运作,实现信息的智能化处理。通过ICTCLAS分词系统对新闻文本进行分词处理,完成对关键词的采集,利用向量空间模型获取新闻文本的知识描述模型,对新闻标题词频进行采集,得到K个原始聚类中心,通过汇总新闻标题词频的改进K?Means算法,对新闻特征向量实施话题聚类,得到热点信息。实验结果说明,所设计的处理平台具有较高的运行效率和聚类精度,信息化处理性能强。

关键词: 移动互联; 信息化处理; 智能处理; 聚类; K?Means算法

中图分类号: TN929.5?34; TP311.5 文献标识码: A 文章编号: 1004?373X(2017)20?0046?03

Abstract: Since there are many problems existing in the traditional information processing platform, such as high time consumption, delay platform response and low?precision information clustering, the intelligent information processing platform based on mobile Internet and physical architecture of the platform are proposed and designed. The platform consists of information service module, information push module and intelligence hot information finding module. The operation process of each function module is analyzed. These function modules operate collaboratively to realize informatization intelligent processing. The participle processing of news texts is conducted by ICTCLAS participle system to complete the acquisition of news text keywords. The vector space model is adopted to achieve the knowledge representation model of news texts, collect the word frequency of news titles, and get K numbers of original clustering centers. The improved K?Means algorithm for summarizing the news headlines frequency is used to execute the topic clustering of news feature vector and get hot information. The experimental results show that the designed processing platform has high operation efficiency, high clustering accuracy and strong informatization processing performance.

Keywords: mobile Internet; informatization processing; intelligent processing; clustering; K?Means algorithm

当前的互联网广泛应用在人们的生产和生活中,基于移动互联网设计的软件在不同行业中的应用价值也逐渐提升。由于移动互联的发展,我国无线网络覆盖区域逐渐提升,给商业、工业以及军事领域中的无线互联带来了便捷性[1]。对移动互联网络中的信息实施高效、智能处理,能够提升相应领域信息交互以及管理的质量。而传统基于推理的信息化处理平台,通过语义推理分析完成信息的分析,存在耗时高、平台响应滞后以及信息聚类精度低等问题,无法实现信息的智能化处理。

因此提出基于移动互联的信息化智能处理平台,采用移动互联网技术实现用户对信息的实时访问[2],通过信息推送框架,对用户不同调用申请自主配置合理的推送模式,完成信息的最优控制。

1 基于移动互联的信息化智能处理平台设计

1.1 平台物理架构

设计基于移动互联的信息化智能处理平台包括服务器端和移动产品终端,系统的物理架构如图1所示。

图1描述的信息化智能处理平台中的用户端通过智能手机和平板电脑,采用信号塔将信号传递到移动智能服务器端,移动智能服务器对信息进行处理、分析、推送,并通过路由器同信息数据库相连[3],完成信息的采集和存储。

1.2 主要功能模块设计

信息推送模块主要负责完成信息的最新动态的推送,为用户提供有价值的信息。本文基于MINA以及AndroidPN技術,设计信息推送模块。为了增强服务器推送的应用性能,通过调度申请以及切换状态方案,完成对服务器资源的有效分配[4?5],提高资源利用程度,减少能耗。信息推送模块基于资讯服务模块用户偏好数据,向客户端推送有价值的信息。信息推送模块的流程如图2所示,详细过程如下:endprint

(1) 对用户兴趣进行研究。利用资讯服务模块中用户个性和行为关联的数据,建立用户兴趣库,若有新信息被推送,则从库内采集同该条信息相关联的用户列表。

(2) 管理员对信息的接收者实施关联配置[6],将信息发送给相应的个人或群组。

(3) 依据信息推送服务,用XMPP协议对信息组装。

(4) 基于信息的重要度、接收用户种类,获取信息推送优先级[7],得到相应推送方案,增强服务器资源利用率。

(5) 通过MINA框架以及客户端对信息传递的长连接进行建立,基于该连接向客户端应用程序传递信息。

1.3 智慧信息热点发现模块

智慧信息热点发现模块将资讯模块采集到新闻文本实施操作,采用改进距离算法从新闻报道流内采集到新事件和相关的报道,对固定时间内受关注度最高和指定话题进行检测。智慧信息热点发现模块的结构如图3所示,从图中可以看出其操作过程为:

(1) 通过ICTCLAS分词系统对数据库内的新闻实施中文分词预操作。

(2) 采用设置的阈值,在分词操作后的文本内采集可描述文本内容的特征项,使得文本维度减小。

(3) 依据空间向量模型与物元模型,把文本特征项转换为文本知识描述模型进行分析。

(4) 通过汇总新闻标题词频的优化K?Means算法,对新闻特征向量实施话题聚类。

2 实验结果分析

为了验证本文设计的基于移动互联的信息化智能处理方法的性能,进行如下实验数据分析。实验对比分析本文方法、K?Means方法以及Single?Pass方法的时间耗费情况。实验过程是:从某大学的“校园动态”栏目(http://news.kxl.xlws.cn/reox/cofl.setgzws=22)内采集2014年6月5日—2015年6月5日的新闻报道数据,构成样本库;再从样本中采集不同篇数的文章当成实验检测对象。实验分别采用三种方法对检测对象实施聚类分析,得到的时间消耗情况如图4所示。

分析图4可得,本文方法以及K?Means方法在100篇新闻样本的时间大大低于Single?Pass方法,聚类时间较低,具有较高的运行速率。实验对不同方法进行信息聚类的精度实施对比,实验的检测指标如下:

如果用于测试的新闻样本数量为n,针对某话题i,全部n个样本中有a篇话题i存在关联性的新闻报道,本文方法采用智慧信息热点发现模块检测到属于话题i的新闻是m篇,通过人工判断,检测到m篇中准确属于话题i的新闻存在b篇,则该算法漏掉正确新闻概率为:

式中:[CMin]是方法遗漏本属于话题i新闻报道导致后果;[CFa]代表把和话题i无关新闻报道纳入i中导致后果,在进行实验过程中,需最大程度地将准确新闻分配至话题i中,系统会将部分和话题i无关新闻分配其中,所以本节假设[CFa]干扰较低,[CMin]的干扰较高,并设置[CMin=1.0],[CFa=0.1];[PTraget]和[PNan-traget]是两个根据以往经验获取系数,实验分别设置它们的值是0.02和0.98;[(GDet)Nam]值越低說明方法精度越高。

实验基于上述设置内容检测本文方法、K?Means方法以及Single?Pass方法的[(GDet)Nam]值,如图5所示。

分析图5可得,随着实验操作新闻样品的篇数不断增加,不同方法[(GDet)Nam]值也不断提升,说明各方法聚类精度不断降低。在新闻样本是100篇的情况下,K?Means方法与 Single?Pass方法聚类精度相差不大;在新闻样本是800篇情况下,Single?Pass方法聚类精度高于K?Means方法。主要是由于K?Means方法容易受到原始聚类中心干扰,如果检测新闻样本数较高,无法随机采集合理的K个中心,本文方法采用的智慧信息热点发现模块能够解决该问题,其[(GDet)Nam]值不会受到新闻样本数量的干扰,有较高聚类精度,实现信息处理。

3 结 论

本文设计了基于移动互联的信息化智能处理平台,通过实验验证可得,所设计的处理平台具有较高的运行效率和聚类精度,信息化处理性能强。

参考文献

[1] 李静.移动互联网下的智能会议系统的应用研究[J].数码世界,2016,11(4):41?42.

[2] 宁永强,段敏燕,余重玲.互联网街景安全保密信息处理平台设计与实现[J].遥感信息,2016,31(3):76?81.

[3] 祝忠方,张新淼.基于Android的高校智能课堂系统设计与实现[J].软件导刊,2016,15(2):73?74.

[4] 王祝琳,陈典书,李玲.基于Hadoop云平台个性化信息定制系统设计与实现[J].吉林大学学报(信息科学版),2016,34(2):271?277.

[5] 朱伟丽.移动互联网时代信息素养教育的微策略[J].中华医学图书情报杂志,2015,24(1):71?74.

[6] 徐毅.感染病毒后网络自我保护控制中的最优通信节点选择[J].现代电子技术,2016,39(18):65?68.

[7] 王志坚.基于大数据平台的电力营销信息化建设分析[J].内蒙古电力技术,2016,34(4):17?22.endprint

猜你喜欢
means算法移动互联聚类
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
场景传播视阈下的网络直播探析
移动互联开发的教学资源库的建设研究
智慧校园关键技术分析与研究
移动互联应用课程教学现状与探索
基于K—Means聚类算法入侵检测系统研究
基于Weka的Apriori算法在原油产量预测中的应用
基于HSI颜色空间的小麦粉精度自动识别研究
一种层次初始的聚类个数自适应的聚类方法研究