云虚拟机异常检测场景下改进的LOF算法

2020-12-07 08:20贺寰烨林果园方梦华
计算机工程与应用 2020年23期
关键词:离群邻域准确率

贺寰烨 ,林果园 ,3,顾 浩 ,方梦华

1.中国矿业大学 计算机科学与技术学院,江苏 徐州 221116

2.矿山数字化教务部工程研究中心,江苏 徐州 221116

3.南京大学 计算机软件新技术国家重点实验室,南京 210023

1 引言

云服务是一种将物理资源虚拟化并向用户出售资源的一种服务模式。目前已有研究发现,未采用超额预定策略的大部分云计算中心的CPU 平均使用率仅为40%[1]。超额预定策略可以减少云服务提供商资源空闲而造成的损失,但同时还存在一定的风险——当用户对某类资源的使用峰值处于同一时间段时,就会造成资源抢占的情况发生,这将会造成云虚拟机卡顿甚至宕机等问题,这严重违反了服务等级协议(Service-Level Agreement,SLA)[2]。以CPU 资源超额预定为例,当大量用户在某个时间同时大量使用CPU 时,会发生对CPU 资源的抢占。对于其中某台云虚拟机,不仅在用户体验上有卡顿,其CPU 负载也将处于一种较低的水平。通过异常检测可以尽早地发现云平台中的各类异常状况,对维护云服务的稳定性、鲁棒性与安全性有着重要作用[3-5]。尽管云计算平台采用了相对集中和专业的管理,被普遍认为具有相对较高的可用性,但目前没有任何一种技术可以保证云服务不出现故障,而这些故障可能引起部分甚至所有服务失效[6-9]。当云虚拟机发生故障时,通过检测云虚拟机运行数据来判断异常是否发生。

为了减少云虚拟机故障对云服务提供商及用户造成的损失,近年来云虚拟机异常检测已成为云服务领域的热门研究话题。何等人[10]针对上下文异常检测提出了一种聚类中心选取策略,将具有相似上下文的虚拟机先聚类,然后将不同类别的虚拟机分别通过异常检测模型判断其中是否发生异常。Sauvanaud 等人[8]提出了一种异常检测系统,他们首先训练机器模型,然后通过这个模型来判断云虚拟机是否发生异常,在判断为异常的同时还可以提供异常种类。Farshchi 等人[7]分析了云服务活动日志与云服务虚拟资源之间的关系,提出了一种基于回归分析的度量选择方法,以解决针对云虚拟机操作方面的异常识别。在CPU资源超额预定所造成异常的例子中,异常云虚拟机由于得不到足够的CPU资源,其内部CPU使用率处于一种较低水平。而大部分异常检测的正常数据集由虚拟机在各个状态下正常运行的数据所构成。而该异常云虚拟机的CPU数据往往处于这部分异常检测训练集中的正常数据。但通过上下文异常检测则可以发现该数据与历史同期的数据不同,从而识别出异常的发生。

云服务中存在多种任务类型,云虚拟机的运行数据与所执行的任务类型有关,执行同类任务的云虚拟机的运行数据是相似的,并且异常云虚拟机占比较小。前面的例子说明了CPU 资源超额预定可能存在的异常,而且产生的异常数据不仅有宏观上明显的异常数据,还存在宏观上近似正常数据,而在局部才体现异常的数据。LOF 算法适合检测这类数据。目前已有学者在云虚拟机异常检测中采用LOF算法。Huang等人[9]在研究虚拟机在动态迁移过程中是否发生异常,他们先使用LOF算法判断迁移数据是否为异常,再结合基于时间序列的符号化算法(Symbolic Aggregate Approximation,SAX)算法检测这种异常情况是否为误报,以此提高算法准确性。他们虽然提高了检测精度,但是花费了大量计算时间与计算量。Wang 等人[11]针对云服务web 应用,先以负载向量对提供web服务的云虚拟机进行分组,采用增量聚类算法对工作负载进行训练,最后采用LOF算法检测工作负载是否发生异常。该方法可以提高对特定负载的检测准确率。但该方法适用范围小,只适用于某些云服务。吕等人[12]首先通过DBSCAN 算法先对数据集进行预处理,排除大量正常数据集,然后对剩余数据采用LOF 算法计算是否有异常点。这种算法改进方式通过排除大量正确云虚拟机来减少算法的时间花费,但是在异常检测的过程中,缺少部分虚拟机会造成准确率降低以及误判率偏高。杨等人[13]将iForest算法、LOF算法与DBSCAN 算法分别通过同类数据集进行训练,再依据训练结果对三种算法分配权重,最终通过加权的结果综合实现对异常点的检测。这种检测架构虽然提高了检测准确率,但是时间花费与计算花费非常大。

为了解决上述问题,本文提出了一种基于密度空间的局部离群因子算法。该算法将同一时间内执行同类任务虚拟机的数据作为彼此的历史数据,并参考DBSCAN 算法在密度空间中核心云虚拟机之间的密度相连、密度直达、密度可达等性质,提出了LOF计算过程中的判断规则,达到减少对正常云虚拟机的计算量的目的,提高算法的计算效率。

2 LOFBDS算法

云服务中某台云虚拟机表示为VMi,全部云虚拟机集合表示为:VM={VM1,VM2,…,VMi,…,VMn}。任意两台云虚拟机VMi与VMj之间的距离表示为d(VMi,VMj)= |VMi,VMj|,其中“ |·| ”表示两个向量的欧氏距离。以云虚拟机VMi为例,距离VMi第k远云虚拟机的距离称为云虚拟机VMi的第k邻近距离,表示为:

式(1)中dk(VMi)需满足以下两个条件:

(1)在云虚拟机VMi周围至少有不包含该云虚拟机的k台云虚拟机VMl∈VM,并符合∀d(VMi,VMl)≤d(VMi,VMj)。

(2)在云虚拟机VMi周围至多有不包括该云虚拟机的k-1 台云虚拟机VMl∈VM,并符合 ∀d(VMi,VMl)<d(VMi,VMj)。

云虚拟机VMi的第k邻近距离之内所有云虚拟机集合称为VMi的第k邻域,记为Nk(VMi)。可以得出|Nk(VMi) |≥k。云虚拟机VMi到云虚拟机VMj的第k可达距离表示为:

式(2)表示,若VMj处于VMi的第k邻域内,则VMi到VMj的第k可达距离为dk(VMi),否则为VMi到VMj的真实距离d(VMi,VMj) 。由此可以得出云虚拟机VMi的局部密度:

式(3)表示,云虚拟机VMi的局部密度为VMi的第k邻域内的云虚拟机到云虚拟机VMi的平均第k可达距离的倒数。进而可以得出云虚拟机的局部离群因子:

式(4)表示,云虚拟机VMi局部离群因子为VMi的第k邻域内的云虚拟机的局部密度与VMi的局部密度比值之和的均值。如果这个比值接近1,则表明VMi与其第k邻域的云虚拟机的局部密度相似,VMi可能与其第k邻域的云虚拟机属于同一簇;如果这个比值小于1,则表明VMi的局部密度大于其第k邻域的云虚拟机的局部密度,VMi可能为密集点;如果这个比值大于1,则表明的局部密度小于其第k邻域的云虚拟机的局部密度,VMi可能为异常点。

2.1 基于密度空间改进LOF

由于异常点是少数存在的,通过LOF算法对大量正常点计算浪费了计算资源。文献[11]提出的算法只是机械地组合了DBSCAN 与LOF 算法,并通过剪枝操作删除正常云虚拟机,只对剩余云虚拟机进行异常检测,这种检测方法由于云虚拟机数量减少而造成部分云虚拟机局部密减少,使得检测准确率降低,误判率增高。在减少计算量的前提下,为了保障检测准确率与误判率,不能直接去除正常云虚拟机,LOFBDS算法通过引入密度空间中局部核心云虚拟机概念及相关性质,并增加判断规则,实现对大部分云虚拟机的快速判断。

(1)局部核心云虚拟机的概念及性质

核心云虚拟机为局部密度大于一定阈值γ的云虚拟机。但是面对密度不同的集群,其中的异常云虚拟机与该虚拟机所在集群之间的差异也不同,因此无法有统一确定核心云虚拟机的标准。为此,在核心云虚拟机的基础上提出局部核心云虚拟机。局部核心云虚拟机为局部密度大于一定阈值γ的云虚拟机,并且有效范围为该云虚拟机的第k邻域,即局部核心云虚拟机针对这台云虚拟机及其第k邻域内的云虚拟机生效。局部核心云虚拟机具有以下四点性质:

①密度直达。若云虚拟机VMj属于局部核心云虚拟机VMi的第k邻域,而且VMj也是一台局部核心云虚拟机,则可以表示VMj由VMi密度直达。

②密度可达。对于任意两台局部核心云虚拟机VMi与VMj,若存在这样一条局部核心云虚拟机序列{vm1,vm2,…,vmm} ,其中vm1=VMi,vmm=VMj,并且vmi+1由vmi密度直达,则称VMj由VMi密度可达。

③密度相连。对于任意两台局部核心云虚拟机VMi与VMj,若存在局部核心云虚拟机VMk使得VMi与VMj均由VMk密度可达,称VMi与VMj密度相连。

④范围延伸。密度相连的局部核心云虚拟机其第k邻域都为其有效范围。

(2)局部核心云虚拟机的判断方式

局部核心云虚拟机是LOFBDS 算法能够快速检测云虚拟机是否异常的重要部分。LOFBDS 算法在判断一台云虚拟机是否为局部核心云虚拟机时会有两种情况,若该虚拟机处于某台局部核心云虚拟机的第k领域,则通过方式①判断,其他需要检测该云虚拟机的局部离群因子的情况,通过方式②判断:

①在某一台局部核心云虚拟机的第k邻域内,并满足局部密度γ的云虚拟机。具体情况如下:

若VMi为正常云虚拟机,VMj为VMi第k邻域内的云虚拟机。若满足local_dk(VMj)≥γ,则VMj也为良局部核心云虚拟机。

若VMi为异常云虚拟机,VMj为VMi第k邻域内的云虚拟机。若满足local_dk(VMj)<γ,则VMj也为劣局部核心云虚拟机。

②经过计算局部离群因子的云虚拟机为局部核心云虚拟机。若为正常云虚拟机,则称其为良局部核心云虚拟机。若为异常云虚拟机,则称其为劣局部核心云虚拟机。

(3)与局部核心云虚拟机相关的密度参数γ

密度参数γ是由局部核心云虚拟机所确定的,该局部核心云虚拟机是通过计算局部离群因子而判定的。密度参数为该局部核心云虚拟机的局部密度,即local_dk(VMi)=γ。密度参数是用来判断该局部核心云虚拟机第k邻域内的云虚拟机是否满足局部核心云虚拟机的标准。与局部核心云虚拟机相同,密度参数γ也是在局部核心云虚拟机的第k邻域内有效。

2.2 LOFBDS算法判断规则

在LOFBDS算法的执行过程中,计算并检测某台云虚拟机的局部离群因子后,其第k领域内的云虚拟机可以不需要依次计算其局部离群因子就能够快速确定是否为异常云虚拟机。根据式(4)可知,云虚拟机VMi的局部离群因子LOFK(VMi)是根据该云虚拟机与其第k领域内的其他云虚拟机的局部密度之比的均值来判定的。那么云虚拟机VMi的第k邻域内其他云虚拟机VMj将存在两种情况:

(1)local_dk(VMi)≤local_dk(VMj),由此可得出推论1与推论2。

推论1如果一台云虚拟机VMi是正常的,那么它第k邻域内的所有云虚拟机(VMj∈Nk(VMi))都为正常云虚拟机。

证明如果一台云虚拟机发生异常,那么这台云虚拟机与同类云虚拟机相似度就很低,这台云虚拟机在密度空间的位置将远离正常云虚拟机集合。假定异常云虚拟机VManomaly为VMi的第k台邻近云虚拟机,那么总是可以从正常云虚拟机集合中找到一台云虚拟机VMj,满足 ∀d(VMi,VMj)<d(VMi,VManomaly)。所以VManomaly不是VMi的第k台邻近云虚拟机。由此推广,正常云虚拟机的第k邻域内不会有异常云虚拟机的存在。正常云虚拟机的第k邻域内的所有云虚拟机都为正常云虚拟机。证毕。

推论2如果一台云虚拟机VMi是正常的,那么它第k邻域(Nk(VMi))内局部密度大于等于VMi的云虚拟机VMj的第k邻域(Nk(VMj))内的云虚拟机也是正常的。

证明由推论1可知,如果云虚拟机VMi是正常的,那么VMi为良局部核心云虚拟机,此时Nk(VMi)内的云虚拟机都是正常的。假设存在云虚拟机VMj,局部密度local_dk(VMj)>local_dk(VMi)。那么VMj为良局部核心云虚拟机,Nk(VMj)内的云虚拟机将更加靠近VMj,那么Nk(VMj)内的云虚拟机比Nk(VMi)表现更为正常。根据推论1得出,VMj的第k邻域(Nk(VMj))内的云虚拟机也是正常的。证毕。

(2)local_dk(VMi)>local_dk(VMj),由此可得出推论3。

推论3如果一台云虚拟机VMi是异常的,那么它第k邻域(Nk(VMi))内局部密度小于VMi的云虚拟机VMj也是异常的。

证明若云虚拟机VMi为异常云虚拟机,那么该云虚拟机将远离正常云虚拟机集合。假设VMj∈Nk(VMi),并且local_dk(VMj)<local_dk(VMi),说明VMj第k领域内的云虚拟机更加稀疏,则云虚拟机VMj较VMi更加远离正常云虚拟机集合,并且LOFK(VMj)<LOFK(VMi),所以VMj一定是异常云虚拟机。证毕。

LOFBDS 算法通过优化对大部分云虚拟机的判断方式,通过判断规则对不同的云虚拟机进行相对应的判断过程。LOFBDS 算法的判断规则根据以上3 点推论所得,具体规则如下:

规则1对于非局部核心云虚拟机第k领域内的云虚拟机,通过检测云虚拟机VMi局部离群因子与阈值ε的关系判断其是否为异常。结果分为以下两种情况:

(1)LOFK(VMi)≤ε,说明VMi为正常云虚拟机,同时记为良局部核心云虚拟机。

(2)LOFK(VMi)>ε,说明VMi为异常云虚拟机,同时记为劣局部核心云虚拟机。

规则2对局部核心云虚拟机第k领域内的云虚拟机进行判断:

(1)若VMi为良局部核心云虚拟机,根据推论1 可知,Nk(VMi)内的云虚拟机VMj都为正常云虚拟机,并将满足local_dk(VMj)≥local_dk(VMi)的云虚拟机记为良局部核心云虚拟机。依据推论2,Nk(VMj)内的云虚拟机也可通过此规则进行进一步判断。

(2)当VMi为劣局部核心云虚拟机,根据推论3 可知,Nk(VMi)内的云虚拟机VMj满足local_dk(VMj)≤local_dk(VMi)为异常云虚拟机,同时也记为劣局部核心云虚拟机。Nk(VMj)内的云虚拟机也可通过此规则进行进一步判断。

规则3对于无法通过规则2判断的云虚拟机,将其视为非局部核心云虚拟机第k领域内的云虚拟机,并通过规则1进行判断。

至此,在检测云虚拟机VMi的状态后,可以得出Nk(VMi)之内部分云虚拟机的状态,进而可以得到这些云虚拟机第k邻域内部分云虚拟机的状态。以此类推,计算一次局部离群因子可以判断多台云虚拟机的状态,并且在这个过程中不需要检测这些云虚拟机的局部离群因子,减少了计算量。

2.3 LOFBDS算法伪代码

LOFBDS 算法在检测过程中将云虚拟机分至4 种云虚拟机集合,分别是还未进行检测的虚拟机集合VM′,根据判断规则尚无法直接推断,还需要进一步计算局部离群因子的待测云虚拟机集合wait_VM′,已确认为正常云虚拟机的正常云虚拟机集合normal_VM以及已确认为异常云虚拟机的异常云虚拟机集合anormaly_VM。LOFBDS算法伪代码如算法1所示。

算法1LOFBDS算法伪代码

输入:VM,云服务虚拟机集合

TASK,云服务任务类型集合

ε,局部离群因子阈值

输出:anormaly_VM,异常云虚拟机集合

Begin

1.Forjin range(1,m):

2.Computelocal_dk(VMj)

3.VM′←local_dk(VMj)

4.End for #计算全体云虚拟机局部密度

5.While(wait_VM′> 0 orVM′> 0):

6.IfwaitVM′==null:

7.VM′→VMi

8.Else:

9.wait_VM′→VMi

10.End if #选择一台云虚拟机VMi

11.ComputeLOFK(VMi)#计算VMi的局部离群因子

12.IfLOFK(VMi)<ε:

13.normal_VM←VMi

14.Forrin range(1,k):

15.Iflocal_dk(VMr)≥local_dk(VMi):

16.normal_VM←VMr

17.Else:

18.wait_VM←VMr

19.End if

20.End for

21.Else:

22.anomaly_VM←VMi

23.Forrin range(1,k):

24.Iflocal_dk(VMr)≤local_dk(VMi):

25.anormaly_VM←VMr

26.Else:

27.wait_VM←VMr

28.End if

29.End for

30.End if #依据判断规则判断Nk(VMi)内云虚拟机

31.End while

3 实验

3.1 实验环境

实验数据通过收集实验云平台获得,该云平台基于OpenStack搭建,使用服务器一台,其他主机10台,具体参数如表1所示。

OpenStack 的控制节点搭建在戴尔服务器上,所有物理节点上配置相同配置的虚拟机。其中虚拟机配置CPU算力1 GHz,内存2 GB,存储20 GB,网络等采用默认配置。虚拟机部署Ubuntu16.04操作系统。其中服务器部署90台虚拟机,每台联想主机配置14台虚拟机,每台宏碁主机配置8 台虚拟机,总计200 台虚拟机。实验室云平台网络拓扑图如图1所示。

本次实验通过CPU 利用率来检测算法的有效性。虚拟机安装实验室测试使用的模块,可以通过浮点计算模拟CPU 使用,并通过atop 监控虚拟机,收集运行数据。在对虚拟机分配任务时,保证每台物理机上均有虚拟机分配到任务。

异常通过人为方式注入,云平台在执行浮点运算任务时,选取非服务器的一台物理主机,人为对多台处于待机状态中的虚拟机增加浮点计算任务,以实现CPU资源的抢占,模拟用户对某种资源的使用峰值处于同一时间段。

实验结果通过准确率、误判率、检测速度来对比各个算法之间的优劣,其中准确率、误判率的计算公式如下:

式(5)及式(6)中,TP表示正确识别正常云虚拟机的数量,TN表示正确识别异常云虚拟机的数量,FN表示错误识别异常云虚拟机的数量,ALL表示全部云虚拟机的数量。

3.2 实例分析

某虚拟机在异常注入后的CPU利用率如图2所示,该虚拟机在正常执行任务180 s 时,对其所在的宿主机进行异常注入,可以发现该虚拟机内部检测到CPU 利用率突然降低,从98%左右降至60%左右,并且CPU 利用率波动增大。

表1 实验云平台物理设备配置表

图1 云平台网络拓扑图

图2 某虚拟机的CPU利用率

图3 为一组实验数据经过t-SNE(t-distributed Stochastic Neighbor Embedding)算法降维得到的二维可视化图。其中C1 虚拟机集群运行浮点运算,主要使用CPU资源;C2虚拟机集群执行连续存储及删除操作,主要使用磁盘I/O资源。

图3 虚拟机数据二维可视化图

如图3 所示,经过对CPU 资源抢占的异常注入,三个异常虚拟机发生异常,分别是C1集群的O1与O2,C2集群的O3。其中O1与O2的成因与图3中虚拟机相同,所以这两个异常虚拟机向CPU利用率较小的C2集群靠近;O3由于CPU资源不足,导致无法在指定时间内向磁盘发送指令,从而造成了磁盘I/O 异常。并且O1 及O2表现为局部异常,O3为全局异常。可以看出C1集群中O1 虚拟机与其所在的集群之间的差异较小,而且这个差异小于C2 集群中正常虚拟机之间的差异,所以证实了无法通过统一标准确定核心云虚拟机。因此LOF 算法更适合应对此类数据。

由图3还可以看出C1集群与C2集群内部分别比较均匀,并且C1集群比C2集群更加紧密。这是由于在大量使用CPU资源时,CPU处于一种稳定满载的状态;而对连续存储及删除操作,只是CPU 在某一时间发布若干次命令,所以CPU 利用率波动较大。这表明了执行同类任务的正常虚拟机各项数据是相似的。所以本文提出的将同一时间内执行同类任务虚拟机的数据作为彼此的历史数据是可行的。

3.3 异常检测及结果分析

为了验证LOFBDS 算法在云虚拟机异常检测方面的效率,本部分采用原始LOF算法、文献[6]的算法(LOFSAX)及文献[11]的算法(DBSCAN-LOF)作为对比进行验证。实验分为两部分,第一部分检测算法的检测精度,通过对30 组数据进行测试,得到检测准确率如图4所示,检测误判率如图5 所示;第二部分为检测算法的时间花费,检测结果如图6所示。

图4 四种算法在30组实验中的检测准确率

图5 四种算法在30组实验中的检测误判率

图6 云虚拟机数量与算法检测时间花费的关系

如图4所示,四种算法的检测准确率都达到94%以上,其中LOFBDS 算法表现最好,准确率达到98.0%以上,并且误差仅在0.21%之内;LOF-SAX算法表现次之,准确率接近LOFBDS 算法,达到97.6%以上,误差在0.31%之内;原始LOF算法表现一般,准确率约为97.3%左右,误差为0.96%左右;DBSCAN-LOF算法表现最差,准确率为94.2%至96.3%之间,误差高达2.40%。

如图5所示,总体来说LOFBDS算法的检测误判率较低并检测结果稳定,误判率为0.7%以下,误差在0.18%之内;LOF-SAX 算法检测误判率次之,并且检测结果也比较稳定,误判率为0.96%以下,误差在0.28%之内;原始LOF算法检测误判率一般,检测结果稳定性较差,误判率在2.4%之下,误差在1.03%之内;DBSCANLOF 算法不论在检测误判率还是稳定性方面都表现最差,误判率在5.9%之下,误差约在2.2%之内。

造成以上情况原因可能在于对边缘云虚拟机处理情况的差异。以原始LOF 算法的检测方式为基准,LOFBDS算法在处理边缘云虚拟机时增加了判断规则,可以更加准确地识别边缘云虚拟机是否为异常云虚拟机,减少了误判的发生,提高了检测准确率;LOF-SAX算法在LOF 算法对数据进行异常检测之后,还通过SAX 算法对LOF 算法的检测结果进行核实,减少了误报的发生;DBSCAN-LOF 算法在检测之前为了减少计算花销对数据集进行了剪枝操作,这不仅增加了边缘云虚拟机的数量,同时还造成了边缘云虚拟机密度的降低,造成了检测准确率降低、检测误报率增加以及误差增大。

四种算法的计算时间花费如图6所示,趋势线皆使用多项式来拟合。在有限的数据集中,LOF算法的时间花费成指数式增长,这符合LOF 算法的时间复杂度为O(n2);LOF-SAX算法在云虚拟机较少时时间花费就比较高,随着云虚拟机台数的增加,该算法的时间花费成指数式增加,其原因是该算法相对于原始LOF算法增加了使用SAX 算法检测LOF 算法检测结果的步骤,虽然提高了检测效率,但是计算时间花费大大增加;LOFBDS算法在云虚拟机较少时时间花费较低,随着云虚拟机台数的增多,其计算时间也随之增加,其趋势线更加趋向于线性,说明本文提出的算法在减少时间花费方面有着良好的效果;DBSCAN-LOF 算法在这次实验中表现结果最优,其拟合的趋势线较LOFBDS算法更加趋向于线性,这是其对数据集剪枝产生的结果。

综上所述,LOFBDS 与LOF-SAX 算法在异常检测过程中检测准确率与检测误判率有着良好的效果,但是LOF-SAX 算法的时间花费过大,不适用于存在大量云虚拟机的云服务中。DBSCAN-LOF算法虽然有着最好的时间花费,但是该算法的检测准确率与检测误判率非常不理想。所以本文提出的LOFBDS 算法更加适用于云虚拟机异常检测。

4 结束语

云服务提供商为了提高服务器使用率、降低成本采用了超额预售策略。该策略在某种物理资源使用殆尽时会引发虚拟机异常,具体表现为资源抢占的发生,从而使虚拟机可用资源减少,导致虚拟机发生卡顿甚至宕机。针对这种异常提出了一种适用于云虚拟机异常检测的LOFBDS算法。该算法采用上下文异常检测策略,将执行同类任务的配置相同的虚拟机的运行数据作为彼此的历史数据,再将DBSCAN 算法中密度空间的相关性质引入LOF算法,提出了检测过程中的判断规则,优化对云虚拟机的检测。实验表明,本文提出的算法有着良好的检测效果,同时具有较低的时间花费。

本文算法是针对将任务进行分布式处理的云平台所提出的,要求云平台中虚拟机配置相同或者执行同类任务的虚拟机配置相同,并且要求子任务在不同服务器上的虚拟机中完成,而且本文检测算法中的输入数据皆采用原始数据,因此在计算和时间消耗上还存在优化空间,今后的工作内容主要集中在寻找适合于大规模云检测数据的降维算法。

猜你喜欢
离群邻域准确率
一种基于邻域粒度熵的离群点检测算法
基于混合变邻域的自动化滴灌轮灌分组算法
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
稀疏图平方图的染色数上界
一种相似度剪枝的离群点检测算法
高速公路车牌识别标识站准确率验证法
基于邻域竞赛的多目标优化算法
候鸟