基于数据挖掘的计算机网络流量控制策略

2014-09-04 05:11陈诚
广西教育·C版 2014年7期
关键词:网络流量数据挖掘控制

陈诚

【摘 要】高校管理者应从制度着手,合理进行网络使用引导,对各种网络流量控制策略进行合理微调与修正,从技术角度提升网络应用水平,为教学及应用体验提供良好的网络环境。

【关键词】数据挖掘 网络流量 控制

【中图分类号】 G 【文献标识码】A

【文章编号】0450-9889(2014)07C-0187-03

随着网络规模的逐步扩大和计算机网络中流量应用的日益复杂,我们管理计算机网络的难度也逐渐增大,对网络应用的管理技术也要求越来越高,为此,计算机网络管理技术的新方法及新技术应运而生。直至目前,在现有的网络带宽的条件下,计算机网络管理技术必须根据网络流量、应用及服务的新要求,将网络管理控制逐步从网络层渗透到应用层。在应用层中,各种网络应用都会产生相应的网络流量,网络流量作为网络用户活动特征的重要载体,发挥着极为重要的作用。通过分析对网络流量进行监测得到的日志,可以实现网络异常监测、网络性能分析、链路状态监测等,此举对于计算机网络的维护和运行都发挥极其重要的作用。

网络应用的日志挖掘研究主要有两个方向:一个是将网络内所有用户的网络应用行为看成一个整体,分析这个整体在网络中的访问规律,了解用户的网络应用流量趋势,制定相应的网络访问策略,从而达到针对不同网络应用类型实现带宽优化配置的目的。第二个是对网络内单个用户的网络应用行为进行研究,每个用户作为网络中一个独立的最小单位,都具有自己独特的网络行为惯性,通过分析这些用户的网络应用行为,不仅可以从细节上完善网络流量控制策略,同时也可以针对不同的时段进行网络流量的控制,使用户能享受到更优质、流畅的网络体验。

一、数据挖掘

数据挖掘就是数据库中的知识发现,是从大量的、不完全的、有噪声的、模糊的、随机的存放在数据库、数据仓库或其他信息库中的数据中获取有效的、潜在有用的、新颖的、最终可理解的模式的过程。

在众多数据挖掘研究中关联规则挖掘是较常使用的一种主要模式,同时也是最活跃的一种日志数据挖掘研究方法。因为关联规则挖掘可以用来发现大量数据中各项集之间相关的关联信息或一些有趣的关联信息,进而找出数据库中隐藏的信息关联网。

就像在美国的沃尔玛连锁超市,为何会将尿布与啤酒这两种完全不相干的商品摆在同一个货架上?一段时间后的销售统计结果却是尿布和啤酒的销量都一并大幅提高了。原因是妻子在家照顾孩子,会让丈夫在下班后去超市买些孩子用的尿片回来,所以进入超市的丈夫们在选购尿片的时候,如果在同一货架上看到自己喜欢喝的啤酒,就会顺手购买,这就是不同事物间隐藏的关联性所带来的经济效益,而这些关联性则是通过数据挖掘中的关联规则挖掘来发现的。

至今,比较经典的关联规则挖掘算法有 Apriori算法和FP-growth算法,从算法思路上后者的效率高于前者,所以我们将使用FP-growth算法对网络日志进行挖掘计算,从而找出网络中频繁出现的应用行为和用户习惯性的访问行为,以此为参考依据对网络流量策略进行设置。

二、FP-growth算法

FP-growth算法的主要思想是分而治之,该算法会在对数据库完成第一次频繁项扫描操作之后,将扫描结果得到的频繁项集数据通过排列树算法形成一棵频繁模式树,称为FP-tree,以此来保存频繁项集的关联信息,然后将FP-tree压缩成特殊类型的投影数据库,投影中的每个节点即为之前扫描到的频繁项,相当于一棵树中的支点,并针对该FP-tree进行阙值遍历运算,此算法相比Apriori算法避免了产生大量候选项集,经过一次或多次遍历操作,即可直接获得频繁模式。

三、分析挖掘网络日志

(一)网络应用分析

因监测对象是办公网络,所以在7点半至12点是一个行政办公和教学时间,整个网络中的流量跑到了最大,表明行政和教学都有对网络的一个需求,而下行流量比上行流量高则表明网内用户都在上午时段使用网络查找资料或进行教学活动;12点至18点这段时间,上下行流量对半分则表明网内用户在处理一些非网络上的材料及教学活动已减少;而下班后至晚上22点只有下行流量则可说明在网内有部分用户在使用相关软件进行网络下载的行为,不过我们之前设置的策略已将在上班时间的下载行为控制在一个可接受的范围,即不会影响到白天正常办公及教学的展开。

总之,通过网络流量控制设备及基于SNMP协议的网络软件,可以全面了解网络中详细的流量状况,再利用相关的网络日志,结合日志挖掘的分析,分析得出网络内占用大量带宽流量的应用,将这些应用限制在一定的带宽流量范围内,使得用户获得更好的网络体验。当然也有用户的网络体验觉得不如从前,如限制 P2P 类应用使得部分用户无法快速下载所需网络资源,或是一些网络教学应用被错误识别并被限制,进而反映网络变慢或无法顺畅进行教学活动。管理者应从制度着手,合理进行网络使用引导,同时,根据长期的网络日志观察分析,对各种网络流量控制策略进行合理微调与修正,随着网络应用的不断更新发展,根据之前分析日志制定出的流量控制策略也应不断更新、调整,从技术角度提升网络应用水平,为教学及应用体验提供良好的网络环境。

【参考文献】

[1]杨际林,戴勃,唐姿伟,王礼景.基于数据挖掘算法的网格日志分析[J].辽宁工业大学学报,2011(4)

[2]晏杰,亓文娟. 基于Aprior & FP-growth 算法的研究[J].计算机系统应用,2013,22(5)

【作者简介】陈 诚,广西卫生职业技术学院助理实验师。

(责编 丁 梦)

猜你喜欢
网络流量数据挖掘控制
基于多元高斯分布的网络流量异常识别方法
基于神经网络的P2P流量识别方法
探讨人工智能与数据挖掘发展趋势
AVB网络流量整形帧模型端到端延迟计算
基于并行计算的大数据挖掘在电网中的应用
社会转型期行政权控制的路径探索
会计预算控制现状及方法
浅谈高层建筑沉降监测关键环节控制
保险公司财务风险管理及控制研究
一种基于Hadoop的大数据挖掘云服务及应用