用户行为可靠性评价综合框架*

2017-06-13 03:37:06吴清强鲍彬彬
数字图书馆论坛 2017年5期
关键词:意图可靠性机器人

吴清强,鲍彬彬

(厦门大学软件学院,厦门 361005)

用户行为可靠性评价综合框架*

吴清强,鲍彬彬

(厦门大学软件学院,厦门 361005)

用户行为可靠性评价对于网络服务的发展具有重要作用,已有研究分别从概率统计、用户意图、用户行为模式以及数据挖掘等角度对其进行广泛研究。本文在定义网络用户行为的可靠性评价基础上,梳理现有算法和模型,针对现有评价模型存在的问题,提出一种包括用户行为数据收集层、用户行为划分层、用户行为模式训练层、不可靠用户行为鉴别层以及用户行为管理与控制层的用户行为可靠性评价综合模型框架,能够在一定程度上解决用户行为可靠性评价中的恶意机器人问题。

用户行为可靠性;可靠性评价;可信用户行为

1 引言

随着计算机技术发展,互联网在人们生活中越来越普及,分析用户网络行为,挖掘用户行为规律具有重要意义。然而,在开放的网络环境中,用户行为数据的获取通常伴随网络用户非正常行为所产生的异常、恶意和噪声数据(这些异常数据大部分来自爬虫机器人),影响用户行为模型构建及其可靠性评估。由于检索引擎的需要(如百度和谷歌等,主要是为用户提供更好的检索服务),因此现实中会有大量爬虫机器人;但其中也存在大量恶意机器人,其目的是复制整个网站或从网站下载有价值信息以谋取暴利,对服务器进行恶意攻击使其崩溃或无法为用户提供正常服务,因此对机器人的不同行为需区别对待。

在可信网络中,用户身份可信并不等同用户行为可信[1],高可信用户也可能存在不可靠的、低可信的用户行为,甚至将个人可信身份附在恶意机器人上,让恶意机器人模拟用户行为进而产生大量不可信行为。对于这类用户行为,需要进行甄别并区分对待,甚至降低这类用户身份的可信度。对用户行为的可信度研究,不仅能降低或避免恶意用户行为,也能降低监控或阻止恶意用户的成本,进而提升服务水平和服务质量。

对用户行为可靠性进行分析和评估,剔除不可靠的、不可信的用户行为,对于提升网络服务的水平和质量有重要的作用。本文试图在分析现有用户行为可靠性评价模型的基础上,总结归纳现有评价模型的不足,进而提出一个有助于改善这些不足的评价综合模型框架。

2 用户行为及其可靠性评价

2.1 用户行为及其可靠性

用户行为指用户在使用网络服务过程中产生的浏览、点击、下载等行为,是用户使用网络服务的体现。互联网信息复杂多样,用户从中获取有用信息,但却很难获得想要的信息。为给用户提供更方便有效的增值服务,使用户能快速获得网络服务和所需信息,网络机器人需发挥信息收集、整理和分析功能,利用处理后的信息为用户提供针对性服务(如不同搜索引擎开发的机器人爬虫[2])。但部分恶意机器人爬虫,通过恶意或非法请求获取各种资源,该行为对服务器产生巨大压力和重大影响[3]。恶意机器人爬虫行为是不可靠的用户行为,在具体工作中必须检测出这类机器人并尽量阻止其访问服务器,以免因恶意行为造成服务器请求的负担,进而影响其他用户的网络服务。

在可信网络中,可信范围主要包括三方面,服务提供者的可信、网络信息传输的可信和终端用户的可信。其中,终端用户的可信又分为终端用户身份可信和终端用户行为可信,终端用户身份可信指终端用户的身份真实有效,终端用户行为可信指终端用户的行为是否符合服务器对其的信任要求[4]。本文仅对可信网络中的终端用户行为可信进行研究。

用户行为的可信评价实质是用户行为可靠性的度量,可信行为等价于可靠用户行为,不可信行为等价于不可靠用户行为。因此,本文将用户行为的可信评价等价于用户行为的可靠性度量,这两个概念是等价的、可相互替代的。

2.2 可靠性评价

网络用户行为可靠性评价是一个复杂的数据收集、分析和推理过程[5],也是与上下文和时间相关的一个动态过程。用户行为可靠性具有动态性和模糊性特征,这是用户行为可靠性评估的最大挑战,用户行为所在的环境上下文也会随着时间的推移而动态变化,因而通常具有一定的时间滞后性。由于用户自身的不可靠行为对服务器和用户服务的影响相对较小,因此已有研究主要集中在由机器人产生的不可靠用户行为上。部分不可靠的机器人用户行为为了特殊目的(如建立山寨网站等)试图下载整个网站资源,这些下载行为有时会对服务器造成巨大的压力,致使服务器运行缓慢、甚至宕机。但这些不可靠的机器人用户行为通常隐藏在可靠的用户或机器人用户行为中,不容易被识别和阻止。

用户行为的可靠性评价首先利用软件和硬件设备收集用户行为数据;其次,设计用户可靠性度评价模型,将收集的用户行为数据作为评价模型的评价对象;最后,在模型中计算用户行为可靠度,并将可靠度作为判断用户行为可靠性的标准,同时剔除不可靠用户行为。

2.3 用户行为可靠性评价定义

用户行为可靠性评价是一个行为规律问题,通常很难凭借单次资源请求判断用户行为是否可靠,其通常利用整个会话(Session)信息,及该用户或相关用户请求/访问资源的历史情况进行判断和甄别[6]。本文中用户可靠性甄别和评价的形式化定义如下。

假定资源请求集合为R,对于每一次请求用r表示,则r∈R。一般情况下,r包括请求发起地址、被请求资源名称和位置、响应代码以及用户代理信息等。在对用户行为可靠性进行评价时,需要通过用户行为模式判断该用户行为的来源对象(人类用户或机器人用户)。由于机器人用户行为具有连续性特征,因此,在对机器人用户行为进行识别时通常采用Session方式。假定一个Session S,S R是单个用户访问产生的所有记录sr的集合(对于所有sr,sr∈S),利用S判断该Session是否由机器人用户发起。如果是机器人用户发起的,则进一步检测该机器人用户行为的可靠性,判断其是否为恶意机器人用户。对于给定记录集合R,通常包含一系列的“S={S1, S2, … ,Sn}”,并且这些Si是互斥的,即

3 用户行为可靠性评价模型分析

在对用户行为可靠性评价调研过程中,根据已有算法或模型,将其分为基于概率统计的用户行为可靠性评价模型、基于用户意图的用户行为可靠性评价模型、基于用户行为模式的用户行为可靠性评价模型和基于数据挖掘的用户行为可靠性评价模型,四种模型的优势及问题进行归纳如下。

3.1 基于概率统计的用户行为可靠性评价模型

在大量网络用户的行为中,特别是包含网络爬虫等噪声的用户行为数据中,所产生事件具有一定数量规律,但在特定条件下部分事件的发生又具有一定随机性,符合概率统计的特性。概率统计方法虽然无法得出精确结果,但可在特定概率条件下作出具体判断,使其符合用户行为可靠性的度量要求。

任立肖利用统计方法对网络用户行为进行计量分析,通过计量指标判断网络用户行为是否正常、可靠[7];而岑荣伟[8]和梁员宁[9]等利用大规模真实网络用户行为日志,对网络用户与搜索引擎系统的交互与决策过程展开研究,通过对相关信息网络用户点击和普通点击分布状况进行比较,结合网络用户点击行为的上下文背景特征进行分析,从而完成网络用户行为可靠性度量;吕艳霞等利用模糊网络分析法,利用模糊性对用户行为的可靠性进行量化,进而区分和鉴别可靠用户行为和不可靠用户行为[10];Stassopoulou等采用概率方法描述了一个通过访问日志对恶意机器人用户行为进行检测的模型,并使用贝叶斯网络区分人类用户、机器人爬虫与恶意机器人,通过用户分类来鉴定用户行为的可靠性[11]。研究者利用用户行为的概率统计特性,在区分网络用户行为中爬虫、机器人等恶意行为起到重要的抑制或消除作用,同时对构建可靠用户行为数据集起到良好作用。但这些模型没有深入研究实际数据中的概率分布应用、阈值设定等问题,也没有考虑用户行为主体间的相互作用和影响。

3.2 基于用户意图的用户行为可靠性评价模型

用户行为意图包括用户信息需求、查询目标、查询动机等。用户的可靠性度量与用户观念及行为意图息息相关,相同用户行为在不同用户观念和意图下可能具有不同的可靠性。研究者在识别用户行为意图及其可靠性方面展开大量研究工作。

罗成等首先通过采集用户对网络服务返回结果的不同点击行为获得与用户行为相关联的资源内容,然后对采集的资源内容进行关联分析和层次聚类,最后根据关联分析和层次聚类结果定位和区分用户的行为意图[12]。张志强等利用用户标注的资源标签,识别和描述用户感兴趣的话题[13];用户标注的资源标签是由用户主动进行的、在一定程度上体现用户当前的行为意图,该方法可以用于补充或加强对用户意图的识别。

非正常网络行为不包含用户意图,通常是遍历式资源请求下载或无目的恶意攻击,因此在对网络用户行为进行分析时,需识别出可靠用户行为,剔除不可靠用户行为。Tan等将网络用户日志中的机器人用户行为模型化,从而过滤掉由机器人自动化点击造成的非正常网络用户行为[6];Craswell[14]和Guo[15]等提出瀑布模型模拟网络用户的点击行为,并利用该模型来识别正常网络用户行为;蔡岳等提出一种基于网络用户行为聚类的方法,从网络用户行为日志中挖掘其行为意图,并使用网络用户行为意图提升检索质量和效率[16];Sadagopan等以单次用户检索行为为单位,通过对网络用户行为点击流分析,并将该点击流与预设不同检索意图下正常网络用户行为过程相匹配,进而鉴别该次网络用户行为是否是真实可靠[17]。

这类模型引入用户行为意图概念,将用户行为纳入用户意图框架进行可靠性度量,可有效剔除与用户意图不相关的非可靠用户行为,降低不可靠用户行为对模型结果的不利影响。但该类模型存在一定缺陷,即当单次用户行为具有多意图时,用户可靠性行为的度量效果不显著。

3.3 基于用户行为模式的用户行为可靠性评价模型

人类用户和正常机器人爬虫的行为模式有规可循,研究者试图利用已知用户行为模式检查和鉴别恶意用户行为,并对用户行为进行可靠性度量。

通过对土壤数据库进行统计,甘肃省共有土壤亚类90个,这样的分类体系对于空间分辨率为500 m和1 000 m的MODIS数据来说类别过于复杂,容易造成分类结果不理想,因此对各个类别的图斑面积进行统计,最终舍弃了图斑面积小于0.2 cm的35个亚类,剩余55个亚类。

用户行为可靠性可以通过用户行为模式建模技术进行模拟和度量。余肖生等利用网络用户行为过程模型图,通过网络负载分析发现真实可靠的网络用户行为[18];Baeza-Yates[19]和Kammenhuber[20]等利用马尔可夫过程假设模拟网络用户的检索过程,进而对网络用户行为进行解释,以识别出真实可靠的网络用户行为;Joachims等利用用户决策过程模型,对用户行为的有效性进行分析,排除与决策行为无关的网络用户行为,保留真实可靠的网络用户行为,并使用可靠的网络用户行为提升检索结果质量[21];基于上述的研究成果, Agichtein等也提出利用群体网络用户行为解释和分析网络用户行为的可靠性,并以此对检索结果中排序偏置问题进行修正[22];Kwon等根据用户交互过程中的资源请求类型,匹配与其相应的用户行为模式,并利用该方法将资源分类[23];本文将资源分类所得结果与资源请求同等对待的区分结果进行对比,该方法对恶意机器人用户行为识别能力更强;Kwon等利用用户在整个Session过程中行为模式的改变方式和速度区分人类用户、机器人爬虫以及恶意机器人用户,同时将该方法应用于所有资源的请求和访问中[24];Hayati等提出在Web 2.0时代,恶意机器人用户一般通过模拟人类行为模式逃避系统检查,为解决这一问题,可通过给定恶意机器人用户无法模仿的人类用户浏览行为模式,并使用有监督机器学习方法来检测恶意机器人用户行为,且达到96.24%的精确度[25]。

基于用户行为模式的可靠性评价模型虽能在很大程度上识别已有恶意机器人,但该模型对未知的恶意机器人、或具有自主学习人类行为模式的恶意机器人识别能力较差,因此限制了这种用户行为可靠性评价模型的推广应用。

3.4 基于数据挖掘的用户行为可靠性评价模型

在用户行为可靠性评价研究中,如果缺乏对用户历史行为的风险分析,就不能客观地反映用户行为可靠性。用户历史行为数据真实地反映用户行为变化。如何从庞杂的用户历史行为数据中发现用户的不可靠、不可信问题,是研究用户行为可靠性评价的关键。

武小年等提出利用数据挖掘方法对用户行为可靠性进行研究[26],指出用户的大部分数据是正常行为数据,如果能有效地过滤正常行为数据,就可大幅减少要分析的用户历史行为数据量,从而提高数据处理效率。邱宜辉等提出基于BP神经网络算法的用户行为可信分析模型[27],该模型利用BP神经网络算法对用户行为可信等级进行预测,得出用户行为可信等级。Stevanovic等利用无监督神经网络模型鉴别网站恶意用户和非恶意用户,同时该模型还能正确区分不同用户类型(包括恶意机器人爬虫用户以及非恶意用户等)[28]。另外, Stevanovic等还通过选用资源连续请求率、页面访问深度等特征,通过二次分类方法识别可靠用户行为和不可靠用户行为[29-30];该二次分类模型首先通过Session将用户分为人类用户和机器人用户,然后通过机器人用户的Session特性,将机器人用户分为机器人爬虫用户和恶意机器人用户。蒋泽等采用决策属性衡量用户行为可信度和可靠性[5],该模型能够准确评价网络用户行为的可信度和可靠性,并能反映网络用户行为的动态变化特性。

这类模型利用数据挖掘技术对用户行为进行建模,从海量的网络用户行为数据中过滤掉非正常用户行为数据、并识别出可靠的用户行为数据,为基于用户行为的检索反馈系统提供可信数据,但该类模型没有考虑用户行为可靠性评价的不确定性和模糊性问题。

这四种模型在一定程度上能有效地解决不同环境下的用户行为可靠性评价问题,对于检测恶意机器人用户行为、减轻网络服务负担、提高正常用户服务的质量起到重要作用。但仍然有两个问题没有得到有效解决。(1)恶意机器人常通过收集并模拟人类用户的行为模式逃避模型检测和系统检查。即使恶意机器人模拟人类用户行为,但人类行为具有主观性(如在访问时序、对资源的请求和访问间隔频率、对资源类型的需求等方面),机器人无法完全模拟,已有评价方法无法有效识别这些恶意的、不可靠的用户行为。(2)在未知的、新型的恶意机器人检测方面,由于这些恶意机器人可能综合使用多种方式隐瞒其真实意图,从而达到逃避检测的目的。对于这类恶意机器人,由于用户意图不明确、没有先验知识,上述基于用户意图、概率统计以及有监督的数据挖掘方法均对其无能为力,而无监督的数据挖掘方法对新数据类型的分类效果也不够理想。

4 可靠性评价综合模型框架

通过上述分析发现,在当前的用户行为可靠性评价模型中,存在无法有效识别模拟人类用户行为的恶意机器人用户行为、对未知新型的不可靠用户行为识别能力不足、无法有效获得学习训练数据、适应多变复杂环境的能力较低以及无法区别用户行为的模糊性和动态性等缺点。其中有效获取学习训练数据的问题至今没有一个很好的解决方案。因此,本文提出一个集多种评价方法的用户行为可靠性评价综合模型框架(见图1)。

用户行为可靠性评价综合模型框架包含五个层次,分别是用户行为数据收集层、用户行为划分层、用户行为模式训练层、不可靠用户行为鉴别层以及用户行为管理与控制层。

(1)用户行为数据收集层。该层负责用户行为数据的收集,包括人类用户行为数据和机器人用户行为数据。该层主要负责收集所有用户行为,抽取归纳用户行为特征,将数据传至用户行为划分模型,模型根据所接收的用户行为特征对用户行为进行划分。

(2)用户行为划分层。该层利用用户行为数据收集层的用户行为特征数据,与现有用户行为模式库进行对比分析,将用户行为简单地划分为人类用户行为和机器人用户行为。人类用户和机器人用户不仅在资源导航与请求模式、不同资源获取方式等方面,而且在访问序列、访问间隔及再访问方式等特征上更具有明显差异。如人类用户的再访问一般通过导航或检索模式进行资源请求,而机器人具有记忆性,其再访问一般为直接访问资源。因此,在对用户行为可靠性评价时,可以先构建行为模式鉴别模型,区分人类用户行为和机器人用户行为;然后,从机器人用户行为中识别出恶意的、不可靠的用户行为,完成用户行为可靠性评价。

(3)用户行为模式训练层。人类用户行为模式和机器人用户行为模式随时间而发生变化,为促使用户行为模式库中的用户行为模式能够与真实用户的行为变化相匹配,在该层利用行为模式学习器,学习新的用户行为模式并更新至用户行为模式库。

(4)不可靠用户行为鉴别层。不可靠的、恶意的用户行为绝大部分来自恶意机器人,这些由不可靠用户行为产生的恶意访问通常会对网络服务器造成高负载压力,进而影响对正常用户的服务能力。由于用户行为可靠性评估方法无法适应复杂多变的环境需求,在该层,本文集成多种不同用户行为可靠性评价模型,形成一个综合评价模型。该模型同时利用用户行为模式、历史数据以及训练数据对用户行为进行评估。

(5)用户行为管理与控制层。该层通过综合用户行为评价模型,获得用户行为相关信息(包括用户行为可靠性、用户行为模式等)。在实际评价分析过程中,为遏制或消除恶意机器人用户行为对网络服务的影响,需对用户行为进行预测、管理和控制,使用户行为可靠性评价综合模型能在实际网络服务中得以应用。

该用户行为可靠性评价模型在综合考虑现有评价模型的基础上,使用集成的评价方法,对提高用户行为可靠性评价的准确度具有积极作用。与单一模型相比,可靠性评价综合模型在收集用户行为模式库的基础上,通过用户行为划分模型与行为模式学习器,实时补充和完善最新的用户行为模式,能有效解决不能较好地识别模拟人类用户行为的恶意机器人以及其他未知的新型恶意机器人等问题。但该模型对于获取训练数据困难以及用户可靠性中的模糊性、不确定性等问题仍有待改善。

图1 用户行为可靠性评价综合模型框架

5 总结

网络用户行为蕴含大量有价值的信息,可广泛用于提升各种网络服务的水平和质量。但在开放网络环境中,用户行为存在大量恶意的非正常行为,需要对用户行为的可靠性进行评价。目前对用户行为可靠性评价的研究主要集中在概率统计、用户行为意图、用户行为模式以及数据挖掘四个方面,这些评价模型对模拟人类用户行为的恶意机器人、未知新型恶意机器人用户行为的模糊性和动态性等方面仍有不足。已有用户行为可靠性评价方法无法适应不同环境下的用户可靠性评价,本文针对该问题提出一个集成多种评价方法的用户行为可靠性评价综合模型框架。该模型通过五个层次将用户行为数据收集、用户行为划分、用户行为模式训练、不可靠用户行为鉴别以及用户行为管理与控制联系起来,形成一个从数据、评价到管理控制的框架模型。

该综合模型通过对用户行为基础分析和用户行为模式识别,能够有效区分机器人用户和人类用户;并利用用户行为模式库,对新的用户行为模式进行学习训练,促使用户行为模式库中的用户行为模式能够与真实用户的时间行为变化相匹配。在此基础上,结合用户行为模式和学习训练数据,对机器人用户行为中的恶意机器人行为进行鉴别,为最终用户控制与管理提供数据基础。

针对该综合模型中存在的用户行为模糊性和动态性等难题,后续研究拟引入模糊理论或粗糙集对用户行为特征的模糊性进行表示,并将该模糊性表示纳入综合评价,对用户行为的可靠性使用概率形式表示,以期获得更接近实际用户行为的评价结果。对于有效训练数据获取的难题,后续研究拟考虑从数据集中抽取不同切片,尝试从不同角度进行诠释和归类。

[1]LIN C,TIAN L,WANG Y.Research on user behavior trust in trustworthy network[J].Journal of Computer Research & Development,2008,45(12):2033-2043.

[2]ARASU A,CHO J,GARCIA-MOLINA H.Searching the web[J].Acm Transactions on Internet Technology,2002,1(1):42-43.

[3]DORAN D,GOKHALE S S.Web robot detection techniques: overview and limitations[J].Data Mining and Knowledge Discovery, 2011,22(1):183-210.

[4]林闯,田立勤,王元卓.可信网络中用户行为可信的研究[J].计算机研究与发展,2008,45(12):2033-2043.

[5]蒋泽,李双庆,尹程果.基于多维决策属性的网络用户行为可信度评估[J].计算机应用研究,2011,28(6):2289-2293,2320.

[6]TAN P N,KUMAR V.Discovery of web robot sessions based on their navigational patterns[J].Data Mining and Knowledge Discovery,2002,6(1):9-35.

[7]任立肖.网络用户信息行为计量研究[D].兰州:兰州大学,2006.

[8]岑荣伟,刘奕群,张敏,等.网络检索用户行为可靠性分析[J].软件学报,2010,21(5):1055-1066.

[9]梁员宁,陈建良,叶笠.云服务可靠性优化方法研究[J].计算机科学,2013,40(8):129-135.

[10]吕艳霞,田立勤,孙珊珊.云计算环境下基于FANP的用户行为的可信评估与控制分析[J].计算机科学,2013,40(1):132-135,138.

[11]STASSOPOULOU A,DIKAIAKOS M D.Web robot detection:a probabilistic reasoning approach[J].Computer Networks,2009,53 (3):265-278.

[12]罗成,刘奕群,张敏,等.基于用户意图识别的查询推荐研究[J].中文信息学报,2014,28(1):64-72.

[13]张志强,彭晴晴,谢晓芹,等.面向查询意图的信息检索技术[J].软件学报,2013,24(3):162-177.

[14]CRASWELL N,ZOETER O,TAYLOR M,et al.An experimental comparison of click position-bias models[C]//International Conference on Web Search and Data Mining.ACM,2008:87-94.

[15]GUO F,LIU C,WANG Y M.Efficient multiple-click models in web search[C]//International Conference on Web Search and Web Data Mining,WSDM 2009.Barcelona:DBLP,2009,84(2):124-131.

[16]蔡岳,袁津生.用户行为聚类的搜索引擎算法与实现[J].计算机系统应用,2010,19(4):94-97.

[17]SADAGOPAN N, LI J.Characterizing typical and atypical user sessions in clickstreams[C]//International Conference on World Wide Web.Beijing:DBLP,2008,31(4):885-894.

[18]余肖生,马费成.网络用户行为模型的构建方法研究[J].情报科学, 2011(4):605-608.

[19]BAEZA-YATES R,HURTADO C,MENDOZA M,et al.Modeling user search behavior[C]//Latin American Web Congress.[S.1.]:IEEE,2005:10.

[20]KAMMENHUBER N,LUXENBURGER J,FELDMANN A,et al.Web search clickstreams[C]//ACM SIGCOMM Conference on Internet Measurement 2006.Rio:DBLP,2006:245-250.

[21]JOACHIMS T,GRANKA L,PAN B,et al.Accurately interpreting clickthrough data as implicit feedback[C]//International Acm Sigir Conference on Research & Development in Information Retrieval.[S.1.]: [s.n],2005:154-161.

[22]AGICHTEIN E,BRILL E,DUMAIS S,et al.Learning user interaction models for predicting web search result preferences[C]//International ACM SigirConference on Research and Development in Information Retrieval.[S.1.]:ACM,2006:3-10.

[23]KWON S,KIMY G,CHA S.Web robot detection based on patternmatching technique[J].Journal of Information Science,2012,38(2):118-126.

[24]KWON S,OH M,KIM D, et al.Web robot detection based on monotonous behavior[J].Proceedings of the Information Science and Industrial Applications,2012(4):43-48.

[25]HAYATI P,POTDAR V,CHAI K,et al.Web spambot detection based on web navigation behaviour[C]//Advanced Information Networking and Applications(AINA),2010 24th IEEE International Conference on.New York:IEEE,2010:797-803.

[26]武小年,周胜源.数据挖掘在用户行为可信研究中的应用[C]//第十一届保密通信与信息安全现状研讨会论文集.四川:信息安全与通信保密杂志社,2009(4):243-245.

[27]邱宜辉,陈志德,许力.基于BP神经网络的可信网络用户行为预测模型[J].福建电脑,2009,25(1):70-71.

[28]STEVANOVIC D,VLAJIC N,AN A.Detection of malicious and non-malicious website visitors using unsupervised neural network learning[J].Applied Soft Computing,2013,13(1):698-708.

[29]STEVANOVIC D,AN A,VLAJIC N.Feature evaluation for web crawler detection with data mining techniques[J].Expert Systems with Applications,2012,39(10):8707-8717.

[30]STEVANOVIC D,AN A,VLAJIC N.Detecting web crawlers from web server access logs with data mining classi fi ers[C]//Foundations of Intelligent Systems-International Symposium.Berlin:Springer Berlin Heidelberg,2011:483-489.

Integrated Framework of Reliability Evaluation Method of User Behavior

WU QingQiang, BAO BinBin
(Software School of Xiamen University, Xiamen 361005, China)

The reliability evaluation of user behavior is playing an important role on the development of network services.The current researches about reliability evaluation of user behavior include the probability statistics, user behavior intention, user behavior model and data mining.On the basis of the reliability evaluation of network user behavior, the de fi nition of network user behavior’s trust evaluation and the summary of the existing research, the paper aims at the existing problems in the current evaluation models, and tries to propose an integrated framework of reliability evaluation method of network user behavior.There are fi ve layers in this framework, which are data collection layer, user behavior division layer, user behavior training layer, unreliability behavior identi fi cation layer and user behavior management and control layer.This framework makes a positive effect in improving the solution to the problem of bad machine behaviors in the reliability evaluation of user behavior.

User Behavior Reliability; Reliability Evaluation; Trusted User Behavior

TP393

10.3772/j.issn.1673-2286.2017.05.008

吴清强,男,1974年生,博士,副教授,研究方向:情报分析、数据挖掘、机器学习、数字图书馆,E-mail:wuqq@xmu.edu.com。

鲍彬彬,女,1992年生,硕士研究生,研究方向:数据挖掘。

2017-04-07)

* 本研究得到国家社会科学基金项目“面向检索的网络用户行为可靠性度量研究”(编号:13CTQ011)资助。

猜你喜欢
意图可靠性机器人
原始意图、对抗主义和非解释主义
法律方法(2022年2期)2022-10-20 06:42:20
陆游诗写意图(国画)
制定法解释与立法意图的反事实检验
法律方法(2021年3期)2021-03-16 05:56:58
可靠性管理体系创建与实践
上海质量(2019年8期)2019-11-16 08:47:46
5G通信中数据传输的可靠性分析
电子制作(2017年2期)2017-05-17 03:55:06
机器人来帮你
认识机器人
机器人来啦
认识机器人
基于可靠性跟踪的薄弱环节辨识方法在省级电网可靠性改善中的应用研究
电测与仪表(2015年6期)2015-04-09 12:01:18