牛玉岭 恒银金融科技股份有限公司研究院
随着计算机网络的发展和普及,网络传感器的应用范围逐步扩大。为了保证嵌入式网络传感器的正常运行,需要收集传感器的多路观测数据。网络传感器多路观测数据用于描述传感器的工作状态和数据采集。目前大多数检测方法是检测数据中的异常,并且难以保证测量数据的准确性。为了保证嵌入式网络传感器多路观测数据的可靠性,需要对数据观测结果进行测试。不同的专家学者从不同角度对多路观测数据进行了测试,但这些探测方法仍存在一些亟待解决的问题。基于密度的数据检测方法引入了滑动时间窗口和网格的概念,将观察数据细分为滑动时间窗口,并通过信息熵对细分数据进行修剪和筛选,去除数据中的大部分正常数据,并通过异常值判断剩余数据,以实现观察数据检测。然而,该方法花费很长时间并且难以实现实时数据检测。基于蚁群算法的多径观测数据检测方法,将蚁群算法收敛的路径用作异常路径。通过计算每个异常路径中节点的测量值,并基于该值确定数据的异常点,完成数据检测,建立基于边缘计算的数据检测模型序列来测试数据。但是,这种方法在过程中,占用的计算机内存很大,这对网络运行的速度有很大的影响。
在系统中,数据通常表示为用户行为矩阵。用户行为矩阵的垂直坐标代表用户,矩阵的水平坐标代表产品,用户或网页。传统推荐系统主要从矩阵和网络的角度分析和预测用户的未来行为,典型的建模方法是矩阵分解。此外,启发式方法可用于预测矩阵中具有空值的元素,例如协作过滤的相关方法。在社交网络中,这两个图表退化为简单网络。在这两个图中,推荐系统估计在基于网络中的现有连接而没有连接的两个点之间建立连接的概率,并预测用户的未来行为。
当网络用户对某种类型的信息感兴趣时,他通常会浏览该信息的相关目录,查看他关心的信息的详细情况,并最终可能在线下载或付费。根据目录层次结构管理信息。每个页面信息由查询语句动态生成,以达到跟踪用户浏览过程的目的。随着电子观看和下载的普及,通过互联网完成电子信息交易具有广阔的前景。使用UNSPSC 对信息进行编码使得信息提供者,信息服务和用户之间的信息交换更加准确和有效。当使用该编码系统时,信息服务需要为每个电子信息产品编译特定代码,以便信息服务可以跟踪信息使用中的各种活动。传统的商品分类方法不能满足详细的产品数据要求。 通过研究参考模型并相应地进行调整,构建一个更适合网络电子信息的信息目录系统。代码完全采用分层系统,在原有UNSPSC 分类四个层次的基础上增加信息提供者代码和信息特定内容代码等信息,便于分类,搜索,匹配,记录和结算;同时,它还为计算用户兴趣强度提供了基础。当用户通过网站上的目录浏览相关信息时,标识号作为SQL 命令的查询条件,通过查询字符串在数据库服务器中搜索合格产品,并将其写入用户的浏览记录。
用户浏览过程记录在浏览索引库中,包括浏览日志表和浏览索引表。浏览日志表中的每条记录包括浏览信息页的目录标识号和访问时间。由于Internet上的网页不一定按严格的目录顺序链接,因此用户不一定完全遵循树目录来访问它们的命令。因此,在建立模型时,不仅需要记录用户直接读取和下载的信息,还必须通过链接记录信息交易的行为,并采用上述改进的模型算法。不仅可以找到用户按目录顺序访问的路径,还可以使用提供程序代码记录未按目录顺序链接的信息,从而更准确地记录最终采用的信息。
预测模块通过数据访问端口发送预测结果,并将它们存储在数据存储模块中。不同的安全预测模型使用不同的计算方法,计算方法的有效性反映在大型嵌入式网络上节点信息的传输速度上。预测模型不能一次对大量的数据执行操作。因此,节点信息通常被分成若干段,这些段被并行地分配给多个节点,并且操作的结果被一起写入转发节点以进行向外传输。这个过程需要一些时间,否则传输可靠性不高且极易受到网络带宽的影响。在高速传输中保持高传输和可靠性并不容易。目前,基于博弈论的安全预测模型可以在不同的采集时间保持较小的浮动和较高的数值传输速度。随着计算节点数量的增加,基于博弈论的安全预测模型可以最好地利用节点计算能力的极限值来获得良好的节点信息搜索性能。
权重公式只根据节点的统计特性反映用户对信息节点的访问频率。它并不反映用户对节点的关注受到时间的影响。一般认为,最近的观察结果应更能表明用户对最近信息访问的兴趣,对于长期未被访问的节点,随着时间的推移,兴趣强度应继续下降。也就是说,系统应该更加关注用户最近的兴趣,现在使用指数平滑法来预测用户对特定链接的兴趣。指数平滑法是一种时间序列分析和预测方法。它使用移动加权平均法,根据过去的实际数字和预测来预测短期行为。这种方法不需要大量的历史数据,计算量相对较小,能很好地消除随机因素的影响,并且很好地反映预测对象随时间的变化。因此,可以将每个浏览周期的权值之和作为观测值,通过指数平滑的方法得到每个节点的权值。即使用户不按目录的顺序访问电子信息,他们也是如此可以自动为当前节点上层的所有节点添加权重。因此,对于上层节点,它表示分层目录结构中的某种类型的信息,并且其权重总是大于下层节点。当然,上述结果与临界值的选择,信息目录结构的深度和每层的宽度以及样本的选择密切相关。当上述条件发生变化时,结果也会发生变化。根据预测算法的实验值,与强调不同信息的各种预测方法(包括时间序列模型,回归预测,灰色模型等)相比,更接近实际情况,预测方法简单,结果有较高的可信度。
大型嵌入式网络在安全,监控,通信等领域具有很高的应用价值。它体积小,能耗低,存储容量大,扩展性能好,性价比高,满足了人们对各方面信息获取的要求。随着信息技术的不断创新和发展,互联网用户数量显着增长,网络结构出现了大量漏洞。具有大存储容量的大型嵌入式网络的节点信息面临安全挑战,安全预测对于信息安全非常重要[3]。预测技术的过程和实现是研究的重点。新的想法已经出现,新的概念不断被引入,新技术层出不穷,新产品已经产生,从底层硬件技术提供的解决方案到顶级软件的想象力,所有人都在不断寻求新的技术。嵌入式互联网将比PC 时代产生数百倍的服务器和超级嵌入式服务器,这些服务器将与各种物理信息和生物相关联。未来的互联网技术将成为嵌入式互联网的主导地位。