杨 宏
(武汉铁路职业技术学院 湖北·武汉 430205)
在大规模云资源分布式系统中,其查询处理相对复杂且困难,在分层云对等的网络运用趋势下,在多属性云资源区间查找上运用分层云对等技术,既能够支撑匹配查询,也能够支撑范围查询,从而优化云资源的查询形式,相对于其它的查询算法,其能够对任意的查询数据单元进行单一检索后,尽可能地将数据查询的成本限制在一个更小的范围内。因此,基于分层云对等网络的多属性云资源区间搜索算法的研究和分析尤为重要。
云计算理念自从提出以来都受到了各个计算机领域的研究。云计算提出了一种有效的网络资源集成的新实现。通过网络优化云中存储的资源服务模式与计算,对应用服务资源和数据的配置和高效利用,并充分利用数据中心强大的传统计算能力。用户需要向企业或个人管理资源,用户将根据需要直接支付费用,就可以获得自己的资源。云计算提供的资源服务主要包括基于传统网络基础设施的计算功能、存储功能、网络服务功能等基础资源,即基于传统网络的服务基础设施,以基于传统软件资源,以软件服务示例的形式提供给用户,要让多个用户共享,即软件作为服务软件资源,为了实现云计算提供的强大服务,将云计算与对等技术相结合,构成云对等网络是当前的发展趋势。云计算的结构化网络和点对点技术在易于伸缩和资源定位方面具有明显的优势,使用云计算和对等技术,可以克服云节点集中模式下的单点故障缺陷,有效地实现分布式资源管理和快速定位。
在云计算技术背景下,分层云对等网络与传统的云计算与对等网络相比,其最大的不同在于分层云对等网络有恒稳定在县的云服务器构成,云对等网络的拓扑特征与传统的对等网络有很大的不同云对等网络由云服务器组成,提供相对稳定的云计算,不经常上下移动。因此,云资源描述信息可以存储在单个节点上。而在云点对点网络中,可用的云资源正在动态变化的情境,即每一个节点都存储在离线资源描述信息中,存储提取过程需要不断更新,导致网络通信开销的增加。基于此,设计新的分布式多维信息存储模式,实现信息的动态更新,以及降低更新成本,是当前分层云对等网络应用的关键所在。
云计算基于有效定位云资源的能力,提供了功能强大的服务。传统的哈希算法是一种云计算和点对点网络资源本地化算法,其只支持将给定键映射到节点的操作,使用一致性算法的变体来解决负载平衡,并确保在节点连接和离开时迁移的最小数据量。因此,哈希算法很简单,可扩展良好,非常适合于对等网络的大型云计算。然而,它是基于哈希值精确匹配的,它不支持多关键字搜索和间隔搜索。它具有上述一些优点,可作为该两层模型的基本算法。HTC的哈希算法是一个包含哈希函数的分层网络,所有哈希节点根据节点的兴趣划分为多个簇,同一簇内的节点根据哈希模型形成对等网络,将大型嘻哈网络划分为多个小型嘻哈网络。在资源搜索时,可以减少路由数量,提高搜索效率,同时也可以实现基于DHT的关键字精确匹配,不支持多维属性和区间查找。
在多属性云资源的区间查找方法中,当前主要运用以下三种方法。其一,将一维属性查询复用以实现多维查找方法。查找方法的最终查询结果通过每个单个属性查询结果进行交流。即使算法经过优化,搜索性能也会随着维数的增加而迅速下降;其二,建立多维索引,将数据索引树嵌入DHT网络的底部,支持多属性区间查找索引框架,以多播树形式的多属性查找。同样,本文提出了一种基于分层云对等网络的区间查找算法,基于分层云对等网络,通过对云空间的实时数据属性进行分类,建立了多维索引,并将区间划分为多个部分,以满足复杂的查询需求。同时,该查找方法能够建立云资源区间的资源簇,以使得区间查找具备效应性与拓展性。
在具有N个属性的云资源的数据类型中,通过对属性范围进行向量定义,从而保障以属性值进行区间划分。同时根据云资源的类型,相关资源存储在本地网络中,通过设置每个资源集群的入口节点来子构建资源集群,从而优化云资源的实时存储与查找。同样,为了加快云资源的快速准确定位,采用了两层哈希函数模型,第一层将相关资源类型组合成一个个资源集群。模型的第二层直接平静地存储资源集群,并通过匹配资源类型来提供资源。资源集群的大小相对于整个集群网络的大小很小,从而提高了查找效率。由于第一层主要功能为索引,也被称为索引层;第二层主要功能为特定资源的地址信息的提高,也被称为资源层。其实际的模型结构如图一所示:
图1:双层哈希函数模型
在云计算多属性资源族的随机生成上,其实际的规模存在随机性,但是在模型下的资源簇的类型定义上一定的限制,平衡系统资源和采集量。当集群过热或访问的节点太少时,可以将其他具有空闲和低通信延迟的主机添加到资源集群中。资源集群内的节点可以在物理上相对聚合,集群内的通信效率。当查询关键字不等于资源群集的类型组合时,直接哈希查询关键字无法找到资源群集,但可以使用哈希函数方法进行定位,但效率较低,网络流量较大。由于存储容量不再是主要的限制因素,因此可以适当地增加资源群集索引,以提高资源发现速度。同样,在资源集群的扩展和扩展中,采用相同的索引设计来减轻系统的存储负担,实现容错性能的提高。在资源群集代理节点的变化中,需要及时更新查找索引节点,以减少资源数据的查询等待时间。
在实际的编码与查早上,通过划分每种类型的属性值,从逻辑上形成多维资源空间,然后使用维填充曲线将多维资源缩减为一维资源循环。由于希尔伯特曲线在空间曲线族中具有最好的数据聚合特性,本文采用希尔伯特空间填充曲线编码来绘制多维希尔伯特环,这不仅降低了数据的维数,而且更好地保持了原始资源的相对位置。为方便起见,对原始的希尔伯特曲线填充方法进行了编码。
同样,在资源集群内搜索时,该表需要确定查询资源的坐标,并将其转换为空间填充曲线编码,然后根据哈希规则找到提供资源的节点,最后将资源的IP和节点发送给用户,用户可以直接与节点通信。如果资源节点提供的资源有或没有资源,则资源节点将间隔邻居节点返回给用户。如果间隔邻居节点也没有资源,则可以提供邻居间隔邻居节点,否则用户的查找将失败。用户收集资源节点提供的资源信息。当资源来自多个资源集群时,它们将按匹配的权重进行排序,并提供给用户。同时保持时间间隔的邻居节点信息增加了节点的存储成本,但该系统是建立在云服务器上的,但存储容量不再是主要的限制因素,但它可以简化查询,提高效率、搜索效率等方便性。
由此可见,基于分层云对等网络的使用,对云资源的类型和属性进行了存储和索引,有助于构建云资源的动态资源簇,通过在资源层合理运用哈希曲线来进行降维,同时增加相邻区间的索引存储,以此提升实际的查找效率,提升查找的实用性。