基于人工智能的互联网络数据安全优化算法研究

2022-03-18 07:17邵迎春
网络安全技术与应用 2022年3期
关键词:数据安全机器精度

◆邵迎春

基于人工智能的互联网络数据安全优化算法研究

◆邵迎春

(河源理工学校 广东 517000)

随着互联网的快速发展,网络入侵的类型和发生率正在迅速增加。在此基础上,本文尝试分析传统算法和以人工技术特征为基础的机器学习算法特征、指标变化情况,结果表明:(1)通过使用基于人工智能的Sparktool工具进行机器学习算法和传统算法优化调节后,数据安全精准性、精度、TPR、TNR和F测量效率精度均显著提升;(2)相较于传统算法,人工智能机器学习算法执行时间低,互联网数据分类管理优质,入侵式防治效果出色。以期通过人工智能技术特征的机器学习算法为数据安全提供一定的科学依据。

人工智能;互联网;数据安全;优化算法;研究

当前,随着互联网科技、经济的快速发展,人工智能技术也逐步发展崛起,并逐渐被应用在多个领域。相较于低精度、低效率和高误差的传统网络数据安全算法,人工智能安全算法通过计算机技术模拟思维,采用机器学习算法简化网络安全数据调节优化流程,不仅提升了网络安全算法精准度,而且有效实现了人机互动,互联网数据信息交叉验证分析等安全操作。基于此,本文以人工智能技术为依据,采用Sparktool工具和NSLKDDCUP数据集特征和功能,分别比较分析传统K-均值聚类算法与基于人工智能技术的机器学习算法(支持向量算法,SVM、FS-SVM算法)准确性、精度、召回性率、真负比(TNR)、F测量等指标结果,进而分析通过人工智能技术优化下数据安全具体特征性,以确保在实现技术创新的同时有效实现人工智能与机器学习算法数据的安全协调、效率互助等分析结果。

1 互联网数据安全测算中人工智能设计原理分析

目前,互联网信息化发展越发成熟,但信息安全却受到网络入侵、病毒入侵等挑战更加严重,在此基础上,本文探索通过人工智能技术优化安全算法,实现各项数据优化管理,提升数据处理效率和准确度。首先,人工智能具备更优的信息深度特征,不仅有助于安全优化过程中扩大信息规模,而且实现了网络数据多样化的特点;其次,人工智能具备管理性和稳定性特征,在进行算法优化调整过程中,有效增加了算法处理数据能力、数据交互性等,一定程度提升了网络信息安全算法运行实现效率和准确率;最终,由于人工智能技术具备信息交叉验证、大量数据分析等特征,当网络信息安全受到分布式入侵、密码学入侵、协作入侵等现象时,人工智能技术通过机器学习算法深度优化数据结构类型、分析数据源信息、分析密码资源信息,进而通过海量数据库信息分类检测分析后,实现安全保护系统的构建等,以降低网络信息遗失率,保障计算机信息系统更加稳定、安全、高效的运行,同时协同优质算法分析实现信息安全。

2 人工智能下数据集安全优化算法及应用优势分析

本文选取KDDCUP99网络数据集为安全算法对象,以人工智能及时性、高效性为技术基础,通过机器学习算法对计算机网络数据集安全性、稳定性、多样性、灵敏性等测试分析。在网络数据安全运营中,病毒入侵是数据损害的主要来源,而人工智能面对入侵损害,能及时协同机器学习算法提前进行预估评判,相比较传统数据安全算法,其工作效率、识别精度更为优质;其次,在网络安全管理中,人工智能技术协同机器学习算法对网络系统信息进行了解,进而实现对网络不确定性信息可控,提升了数据安全性。

在网络信息安全实际应用中,网络安全算法在人工智能的辅助下,实现了对网络数据安全的定期有效检测,同时利用算法卷积运算能力,实现了在学习、数据处理过程等非线性方面解决问题能力的快速提升。

3 网络数据安全算法优化调整流程分析

网络数据安全对维护网络健康运营、用户自身信息安全、生产工作等方面极为重要,为此,本文借助人工智能高效化、智能化、安全化等特征测试分析传人工智能优化后的机器学习算法流程变化及效率等级。

第一阶段,依据机器算法特征,选取进行测试和培训的网络数据集进行相关分析。首先进行数据格式调整,统一变更格式类型为csv格式;其次,开展数据处理过程,(1)进行数据预处理分析,它将字符串值转换为数值,以便所有记录只包含数值,并将所有数据都转换成相同格式进行测试集和训练集分析;(2)数据标签分类。分别记录数据类型两个标签,即正常或攻击。0表示正常,1表示攻击,通过二进制分类便于机器学习过程检索分析。

第二阶段,选取特征向量,根据入侵类型特征格式使用分类器对入侵进行分类选取,选取的特征向量,符合所有总体中生成随机总体。生成初始总体后,计算个体的计数函数和信息增益函数。通过特征信息数据的选取,优化调节分析最佳总体,称为帕累托前沿,帕累托前沿是必须选择的最佳总体集。

第三阶段,通过人工智能分类器对数据进行分类。首先使用训练数据集训练人工智能,由于人工智能采用有监督机器学习,因此它比无监督学习技术具有更高的准确性。人工智能分析训练数据并识别模式,形成分类器推断函数。基本的支持向量机研究一组输入数据,并为每个给定的输入决定两种可能的类别中的哪一种形成输出,这使得它成为一个二元分类器。它在训练时使用核函数进行映射,机器学习算法(SVM和FS-SVM算法)协同人工智能技术实现网络数据信息安全分类。

4 结果与分析

本文依据人工智能技术特征,选取ConversionMatrix衡量网络数据安全性能,并通过准确度、精密度、召回率、FMEASURE等6方面进行算法优化调整后安全性能评估分析。

4.1 准确性

图1为传统算法与基于人工智能的机器学习方法分析数据准确性示意结果。通过图1可知,传统Kmeans算法准确性最低,为60.1%,优化后机器学习方法FS-SVM算法准确性最高,为84.03%,两者算法精度相差23.93%,表明经人工智能技术协同后机器学习算法对入侵式安全的检测结果更优,适用性和安全性更为出色。

图1 网络数据传统算法和机器学习算法间精度分析

4.2 精度

精度是用于网络安全性能比较的另一个重要参数,其精度变化表明正确预测的攻击与总预测攻击的比率。比较分析后,SVM模型和FS-SVM算法精度值分别为98.02%和97.98%,显著优于传统算法精度。

4.3 召回/TPR(真阳性率)

TPR指标示分析预测的攻击观察值与实际攻击等级中所有观察值比率变化的重要指标,通过图2可知,机器学习FS-SVM算法精度值最高(78.89%),与传统方法相比,该方法具有较高的查全率,同时高召回率结果表明在网络数据安全分析预测中,以对最相关数据进行了选取。

4.4 TNR(真负比)

TNR参数是正确的正常预测与正常观测总数比率的指标。通过图2可知,相较于传统方法,人工智能模式下的机器学习算法真阴性率高达96.16%,相较于其余指标结果更为出色,表明提出的模式也比传统检测到更多的正常数据。

4.5 F测量

F测量指标用于测量分类器的有效性,同时该指标明确精确性和召回率指标加权平均值,F测量也称为传统测量或平衡Fscore。它不仅考虑了假阳性和假阴性,而且提升了筛选类型,提升了数据安全性能。结果表明,该方法比传统方法具有更高的故障检测率,故障检测率为87.41%,在入侵检测评估参数的各个方面都有较好的性能。

图2 传统方法与改进后方法比较示意图

5 结论

本文以人工智能特征开展互联网信息安全优化算法研究,通过对人工智能技术的数据安全算法设计分析、数据集算法优化分析和优化调整后,通过Spark工具对传统算法与人工智能技术的机器学习算法进行5项关键要素分析,并得到以下相关结论:(1)Spark工具进行大数据入侵检测时,具有优化特征选择的支持向量机比传统更适合于大数据入侵检测;(2)与传统相比,准确度、查全率、召回率、TN和fmeasure等所有评估参数都显示出更好的结果;(3)与传统相比,优化的基于人工智能的机器学习算法所需的执行时间更少,能有效实现数据分类管理、防止病毒入侵等,准确地将数据分类为攻击或正常。

[1]闫卫刚.基于人工智能的互联网络数据安全优化算法研究[J].物联网技术,2021,11(08):96-99+102.

[2]柴梦竹.人工智能技术在大数据网络安全防御中的应用[J].计算机与网络,2021,47(15):44-45.

[3]姜涛.人工智能数据安全风险和有效治理措施[J].法制博览,2021(22):155-156.

[4]黄灼.人工智能在计算机网络技术中的应用[J].中国新通信,2020,22(15):98.

猜你喜欢
数据安全机器精度
机器狗
机器狗
热连轧机组粗轧机精度控制
我国5G数据安全保护供给不足,“四步”拉动产业发展
云计算中基于用户隐私的数据安全保护方法
未来机器城
建立激励相容机制保护数据安全
基于DSPIC33F微处理器的采集精度的提高
大数据云计算环境下的数据安全
以工匠精神凸显“中国精度”