摘要:社会在发展,时代在进步,网络技术得到了大力普及和应用,特别是在近些年,网络安全信息呈现出了规模化的发展趋势。通过科学有效地使用大数据技术,对网络安全予以全方位、多角度的分析,这些均是目前行业研究的关键内容之一。该文立足于实际角度,首先分析了大数据時代特点,然后分析了网络安全面临的威胁,并从信息采集、信息存储、信息检索、数据分析等角度阐述了大数据技术在网络安全分析中的应用,最后提出了基于大数据技术的网络安全系统构建方案,希望借此不断提升网络安全程度,建立良好的网络秩序,切实保障网络信息安全,为社会的发展服务。
关键词:网络安全;分析;大数据;技术;应用;分析;研究
中图分类号:TP393 文献标识码:A
文章编号:1009-3044(2022)11-0020-02
在整个网络架构中,网络安全分析数据错综复杂,数量也在与日俱增,网络数据内容和之前相比变得愈加精细化,网络设备性能也变得更为优异,且拥有着极佳的数据传输效率。从安全信息采集角度进行分析可以看出,其对速度的要求甚是严格,但当前网络安全漏洞问题却屡屡出现,所造成的负面影响也变得也越来越大,也有很多不法分子十分猖獗,越过法律红线窃取数据信息,对网络安全造成了巨大危害。大数据技术必将是未来社会信息技术的主要发展趋势,换言之,大数据技术必将会被广泛应用到各行各业之中。因为大数据具备着速度快、种类全、数量大等特点,这和网络安全数据的发展要求相契合。
1 大数据时代特点的分析
处在大数据时代背景下,数据增长速度十分惊人,信息呈爆炸式增长态势,但在此过程中,任何微小的数据都有可能显现出巨大作用。“大”是大数据的核心特点,由以往的MB单位和GB单位升至TB单位、PB单位及EB单位,在一定程度上对数据信息存储空间提出了严格要求。信息技术迅速发展,网络技术日新月异,多元化的数据信息不断增长,此时网络交互是数据信息的重要来源渠道,同时也是数据形式频繁变化的原因,大数据包含了日志、图文、音视频等多项内容。人们的生活和互联网紧密相连,互联网技术被应用于各行各业,每天均会产生海量信息资讯,通过应用大数据技术便可从大量数据中挖掘出有价值的信息,在此基础上,通过使用人工智能技术对其进行深入分析,从而得到更新颖的信息,可在一定程度上促进经济发展、提升生产水平、推动科研事业发展。
2 大数据时代下网络安全面临的威胁
处在大数据时代背景下,计算机网络技术的出现给民众的生产、生活提供了诸多便利,但因为计算机网络的开放性特点尤为突出,任何人都拥有使用计算机网络的权利,如此便让不法人员乘虚而入,增加了窃取他人隐私、盗用他人成果的可能性。
首先,零日攻击。官方进行新产品发布之前,很多不法人员会通过不法手段进行破解,破解后根据相应格式进行打包发布,如此就会让官方利益严重受损。此外,零日攻击可谓“无孔不入”,不法分子借助最新的技术,针对未知网络漏洞发起攻击,必然会对企业的发展造成巨大影响。
其次,APT攻击。APT对网络安全造成了巨大威胁,其具备高级性、可持续性的特点,并且隐秘性高,市面上的网络安全防护技术众多,但能够检测出APT隐患的软件却寥寥无几。APT隐秘性攻击能力极强,会给企业生产运营造成重创。
最后,云计算平台内部攻击。云计算平台内部攻击的对象即为网络系统虚拟机,市面上的服务器网络安全防护技术,大都难以有效检测出此类隐患。
3 大数据技术在网络安全分析中的主要应用
进行网络安全分析时,日志和流量成了主要数据研究对象,在此期间存在的很多行为大都是辅助信息管理,以资产和漏洞以及应用行为等最具代表性。科学有效地使用大数据技术可谓至关重要,由于部分日志和流量数据相对来说较为分散,使用大数据技术对其进行集中处理后,可不断提升网络安全分析和处理效果,大大缩短分析时间。分析时可使用新型关系等方式,对安全事件之间的关联程度予以挖掘,并对安全漏洞以及数据泄露等情况进行全面预测,实现主动防御目标,继而全面保障网络安全。
3.1 信息采集
采集数据信息时,以Chukwa工具为主,使用针对性的采集方式,对每秒数百兆的日志信息进行高效采集,最大限度地发挥出镜像采集技术的优势,对全数量数据予以采集。
3.2 信息存储
当前时期,由于数据种类日趋多样化,应用方式也在不断丰富,若想满足不同的数据分析需求并安全存储数据信息,当务之急是要提升数据检索和数据分析速度,以多元化的存储方式存储各种类型的数据信息。
部分原始安全数据自带检索功能,以日志信息和流量历史数据最具代表性,比如通过使用GBase和Hbase等列式,能够更好地发挥存储效果,系统索引速度极快,可以短时间内完成数据检索。对安全数据进行标准化处理时,通过计算构架,将Hahoop分布式作为依据,计算节点的同时设置分析数据,通过Hive分析脚本,对安全数据进行高效地挖掘和细致分析。当统计报告和分析警告等工作全部运行完毕后,需将结果置于列式存储系统内,随之针对安全数据予以实时性分析。此时可通过使用流式计算模式,将待分析的数据置于各个计算节点之上,当实时数据流通过节点时,系统便可自行完成分析,之后形成数据统计报告并发出安全警告,最后将分析结果存至流式存储系统中[1]。
3.3 信息检索
在进行安全数据查询及检索时,可应用基于Mapreduce技术的检索架构予以操作,将数据信息查询请求主语发放到各个节点上,应用分布式并行计算手段全面提升安全数据检索效率。
3.4 数据分析
实时数据分析阶段,将Storm、Spark等流式计算架构作为基础,其间与复杂事件处理技术、电联分析计算技术等相互结合,对数据内存情况进行实时分析和监控,系统化获取异常行为信息。需强调的是,在进行非实时性数据分析的整个过程中,可利用Hadoop架构,使用HDFS分布式存储技术和Mapreduce技术,与数据聚合技术、数据挖掘技术等相结合,实现离线风险统计和事态分析等,最终确定攻击源[2]。
3.5 关联性分析
通过对大数据技术的合理应用,可以综合性强化系统自身的存储能力和分析速度,在短时间内挖掘分析多源异构数据信息,让系统安全隐患无所遁形,进而分析不同阶段网络攻击行为的各自特点。以僵尸网络分析为例,通过使用大数据技术,不仅可以和DNS访问特征相结合,还能够深度扩充和分析数据源,对全分组数据集合和外界情报信息等进行系统化分析。又比如当某个主机被攻击时,通过关联性分析便可查看其他主机是否存在被攻击情况,进而及时发现威胁,做到有备无患[3]。
4 基于大数据技术的网络安全系统构建
4.1 技术层面
首先,数据源模块。计算机系统通过分布式采集器,对系统内部的软硬件实施行为信息采集操作,并将结果置于存储部分。现如今,科学技术飞速发展,网络安全防御系统的数据源不断增长,除了传统的防火墙技术和入侵检测技术的使用外,还应该对服务和存储器等硬件设施进行全面维护和检测,对系统软件和数据库等进行详细的分析和检查[4]。
其次,数据采集与存储模块。要使用大数据技术,对“元数据”进行分离,完善数据存储和采集机制,在此基础上打造分布式数据基础。通过使用分布式数据存储技术,便可从数据产生到剔除的过程中,始终保持存储功能和访问功能的稳定运行。现如今,网络数据量与日俱增,分布式数据存储在整个网络安全系统中发挥着巨大作用,可以全面提升计算机系统的存储容量,亦可强化数据库的稳定性。
再者,数据分析模块。通过使用大数据技术,可让系统在数据实时分析中和历史数据分析中展现出卓越性能。基于大数据分布式处理技术建立数据分析模块,便可有效提升数据分析处理能力,让计算机系统短时间内完成多维度的分析处理和联合分析处理。
最后,数据展示模块。该模块立足于广大用户的体验需求,让用户通过该模块,更好地利用网络安全系统使用各类计算机功能[5]。
4.2 方法层面
第一,加强网络安全监督。从宏观层面而言,要建立一套行之有效的网络安全运行机制,企业自身要有所作为,并且还要争取得到政府和外界的支持,政府和企业要形成一股合力,利用人才的力量、科技的力量构建网络安全机制,进而全面监督网络,将安全隐患扼杀在摇篮中[6]。
第二,提升安全访问标准。使用大数据技术时,要将处在不同地理位置的计算机连接起来,但在此期间很容易出现病毒,最终造成信息外泄,此时便要求专业工作人员加强安全防护技术的应用,建立防控能力效果优异的防火墙,企业可聘请一些高端技术人才,不断优化企业网络安全防控效果。
第三,提高用户的网络安全警觉性。使用大数据技术时,一定要保证网络安全,因为无论是哪种网络安全技术,并非百分百安全,技术工作者在建立安全防护机制的基础上,要对计算机使用者进行网络安全培训,唯有提升他们的警觉性才能防止低级错误产生,进而从根本上提升网络安全防护水平[7]。
5 结束语
综上所述,科学技术飞速发展的今天,大数据时代已经到来,信息技术作为大众生活中的一个重要组成部分,改变了我们的生产、生活方式。但这是一把双刃剑,由于互联网技术使用中很容易造成企业信息和个人信息的外泄,但从大的方向上去分析,使用大数据技术,这是时代发展的必然走向,任何人和企業都要做到与时俱进,所以需要最大限度地去规避网络风险,利用大数据技术去保障网络安全,让科技助力社会发展。
参考文献:
[1] 赵学栋.人工智能技术在大数据网络安全防御中的应用研究[J].计算机产品与流通,2020(5):151.
[2] 董超,刘雷.大数据网络安全态势感知中数据融合技术研究[J].网络安全技术与应用,2019(7):60-62.
[3] 余健,张帆.大数据时代下计算机网络信息安全问题分析[J].造纸装备及材料,2020,49(2):233-234.
[4] 徐洪位.基于大数据时代计算机网络安全防范探讨[J].南方农机,2020,51(5):221.
[5] 汪晓睿.大数据时代的计算机网络安全及防范措施探析[J].电脑编程技巧与维护,2020(2):170-172.
[6] 何迪.基于Hadoop的大数据网络安全实体识别方法[J].电子技术与软件工程,2019(5):204.
[7] 刘庆杰,王金峰,潘志安.大数据时代计算机网络数据安全问题探讨——评《计算机网络安全》[J].机械设计,2020,37(10):151.
收稿日期:2021-12-20
作者简介:张洁(1986—) ,女,江西九江人,本科,讲师,研究方向为计算机科学与技术。