郭凯龙 黄随 孙光虎
摘要:在当前的发展阶段下,互联网高度普及,网络在很大程度上承载了现代社会的商务活动、娱乐活动以及社交活动等,可以说现代社会生活与网络息息相关。在互联网高速发展的过程中,网络安全问题也日益凸显,针对这一问题要重视对网络异常行为的检测,从而及时排除网络风险提升网络稳定性,而传统的网络异常行为检测技术已经难以满足现阶段大规模的数据存储以及处理需求,在这种情况下就需要引入大数据技术,借助大数据技术在数据处理分析方面的优势,进一步提升网络异常行为检测的准确率以及效率,这对于网络的健康发展,以及安全互联网环境的构建具有重要的意义。
关键词:大数据:网络异常行为:检测
现代社会大数据,云计算以及人工智能技术先后崛起,相关技术的应用在很大程度上推动了互联网的发展,在全球范围内网络数据量以及数据类型正在快速增加,而这也表明了大数据时代已经来临。在大数据时代下互联网的普及率进一步提升,但是网络安全问题也愈发严重。在互联网空间每天都在产生大量的恶意程序,非法网络行为在很大程度上侵犯了用户隐私,并导致重大的经济损失。在互联网高速发展的过程中,不仅需要重视拓展互联网相关技术的应用场景,同时也需要从构建安全网络环境的角度出发,加强技术的应用,通过将大数据技术引入到网络异常行为检测中,从而及时发现存在风险的网络行为,这对于用户隐私的保护,以及安全网络环境的构建具有重要的意义,因此有必要对基于大数据的网络异常行为检测技术进行深入研究。
1大数据以及网络异常行为检测概述
总的来说,大数据主要包括结构化数据以及非结构化数据,其中非结构数据为大数据的主要构成。依据IDC相关调查数据,非结构数据占企业数据的九成以上,而这些数据正在以每年50%以上的速度增加。大数据是互联网发展到一定程度上的产物,在大数据时代下,云计算技术脱颖而出,成为驱动互联网领域进步的重要动力,在相关技术不断发展应用的过程中,技术本身的适用性也在不断提升,成为促进行业发展创新,促进产业转型的重要因素。
在互联网安全领域,可以将网络异常行为检测分为两种类型,分别是基于主机的网络异常行为检测以及基于网络的网络异常行为检测。基于主机的网络异常行为检测需要对主机日志以及主机操作进行分析,但是该检测方法具有一定的滞后性,难以实现依据网络情况进行动态检测;基于网络的网络异常行为检测,主要对网络行为分为正常的网络行为以及异常的网络行为,传统的检测方法难以实现较高的检测准确率,尤其在当前的发展阶段下,网络数据量激增,需要对大量的网络数据进行处理,这就导致网络行为检测需要花费大量的时间,难以满足大数据时代网络安全的需求。针对这一问题可以将大数据技术引入到网络行为检测中,从用户行为角度出发,建立相应的网络行为模型,从而及时准确的检测网络异常行为。
2基于大数据的网络用户异常行为检测方法设计
2.1对用户异常行为进行识别
当前,网络用户数量不断增加,网络用户在参与网络的过程中会产生大量的用户请求,而用户请求往往具有很强的突发性以及随机性。但是从网络用户的行为模式来看,对于特定用户来说,所生产的网络请求是有迹可循的,具有一定的规律性。因此建立在大数据平台基础上的网络行为识别需要着重对以下两个问题进行分析,分别是如何判断用户身份是否可信;其次如何对用于的异常网络行为进行界定。以上两个问题也是在应用大数据技术进行网络行为检测过程必须要解决的。针对以上问题可以应用挖掘方法来构建识别网络用户行为的框架图。网络用户行为框架图主要包含云基站端以及用户端,在云基站中建立网络用户行为数据库,并对数据库中的相关行为进行分类,实现检测的主要原理是将用户数据与数据库行为数据进行对比,从而对用户数据进行分类。在该框架中,云基站主要用于处理用户行为信息,优势在于能够高效率的计算机大量的非结构数据。终端用户在访问网络的过程中,需要对用户的网络行为进行分类处理,而这个过程需要结合用户的访问目的如社交,购物等,根据用户在网络中处理的不同事务,将用户行为划分为网络资源寻找类型行为,社交类型行为以及网络商务活动用户行为等。
2.2行为分析技术应用
基于数据网络异常行为分析技术的应用的主要目的在于及时发现用户的网络异常行为,从而及时采取措施,保护用户的隐私安全降低网络风险。为了实现更为高效准确的异常行为检测,需要将行为分析技术应用与异常行为检测中。在这个过程中,需要应用大数据技术对大量的异常行为数据进行分析总结,从而建立主动行为属性表,通过将用户网络行为与主动行为属性表进行对比,从而实现对用户行为的准确判断,及时发现用户的网络异常行为,该行为检测模式具有比较高的复杂度,因此在只具有主动攻击的情况下会降低一个维度,从而减少计算的复杂性。
需要注意的是该检测模式的应用需要在真实的网络环境中,准确地判断聚类个数,灵活的应用聚类算法,在应用聚类算法的过程中先添加一个比较因子T,分别找出所有样本代表的最小值,如果最小值大于T,将其作为新的代表,使T为数据集的最佳聚类个数,该算法的优点在于,不需要提前决定T,可以在一定的范围内调节聚类的个数,利用cost=Tnew-Told(1)这一公式获得T的变量值,其中Tnew代表方差和,Told為聚类的代表对象,通过聚类算法计算网络的变化值,并进行记录,将可能存在的异常的网络数据进行筛选,依据所筛选的数据进行训练,提升检测机制的效率。在完成机器训练后,系统具有较高的自动识别能力,能够针对大量网络数据进行分析处理,从而及时发现用户的网络异常行为,采取有针对性的措施,提升网络环境的安全性。
总结:
在当前的发展阶段下,互联网高度普及,依托互联网能够实现线上交易,网络社交以及各种网络娱乐活动,但是互联网以及相关技术在大规模应用的过程中,所产生的网络安全问题也值得关注,传统网络行为检测方式存在诸多弊端,在这种情况下,就需要重视大数据技术在网络行为检测中的作用,依托大数据优势,进一步提升网络行为检测的效率以及准确性,这对于互联网的安全稳定发展具有重要的意义。
参考文献:
[1]李铮,傅阳.一种基于深度学习的网络异常行为检测方法[J].网络安全技术与应用,2020(08):66-68.
[2]倪东.大数据环境下的网络异常行为检测与分析[J].九江学院学报(自然科学版),2020,35(02):87-91.
[3]刘建兰,覃仁超,何梦乙,熊健.基于大数据技术的网络异常行为检测模型[J].计算机测量与控制,2020,28(03):62-66+71.