姜春茂,王启明,申 倩,许美玉(. 哈尔滨师范大学计算机科学技术与信息工程学院 哈尔滨 5005;. 平顶山学院计算机科学与技术学院 河南 平顶山 467000)
一种适合移动云节点的可靠存储模型
姜春茂1,王启明2,申 倩1,许美玉1
(1. 哈尔滨师范大学计算机科学技术与信息工程学院 哈尔滨 150025;2. 平顶山学院计算机科学与技术学院 河南 平顶山 467000)
【摘要】多维异构的情况下,完全副本的存储方式网络传输负担重,单个节点的能耗消耗大,可用性低。针对于此,该文提出了两种适合移动节点的存储模型:1) 交叉存储策略;2) 比例存储策略。模型中移动节点不再存储数据的完全副本,同时根据移动节点的带宽差异性的特点,将存储和并行传输统筹考虑,降低速度缓慢节点对于整体性能的影响。实验表明,该文并行传输模型相比传统的传输算法,既聚集了较大的带宽,也节省了存储空间。
关 键 词云计算; 交叉存储; 移动节点; 并行传输
A Reliable Storage Model and Transmission Mechanism for the Mobile Cloud Node
JIANG Chun-mao1, WANG Qi-ming2, SHEN Qian1, and XU Mei-yu1
(1. School of Computer Science Technology and Information Engineering, Harbin Normal University Harbin 150025; 2. School of Computer Science and Technology, Pingdingshan University Pingdingshan Henan 467000)
Abstract In the case of multi-dimensional heterogeneous networks, the full copy of storage data caused a heavy burden on the network and a single node's huge energy consumption, thus, the availability of system is very low. In view of this, the paper proposes two storage models for mobile nodes: the cross storage strategy and the storage strategy according to the proportion. In this model, the mobile node no longer stores the full copy of the data, and at the same time, according to the characteristics of the bandwidth of mobile nodes, the storage and parallel transmission are considered together to reduce the impact of the slow speed of nodes on the performance of the whole. Experiments show that the proposed parallel transmission model is more efficient than the traditional transmission algorithm in both bandwidth utility and storage space saving.
Key words cloud computing; cross storage; mobile node; parallel transmission
云存储[1-3]是利用云平台实现分布式存储的一种方式,通过将网络中大量的异构存储设备协同工作,对外提供数据存储和服务业务访问功能。现如今云存储得到了充分的发展,如google推出的google drive、dropbox、百度云盘等。
实施安全可靠的数据存储是云存储所面临的挑战。提高数据的冗余度可以提高数据存储的可靠性,同时进一步提高用户的服务体验。然而,数据的大量冗余无形中加大了云服务提供商的服务成本,同时也造成了网络的负载压力。基于此,分块存储模型被提出。其中,作为典型的分块存储范例,hadoop 和google的GFS[4-5]无疑是最成功的典型实例。
GFS的副本容错方式是至少采用3个副本存储。在副本的分布上考虑拓扑结构、机架分布、磁盘使用等因素。如果出现副本丢失情况,master服务器自动复制副本给其他服务器,使得副本个数得以保持。该方法可靠、有效,缺点在于磁盘利用率不高。
利用移动节点构造云存储方式,不仅要考虑节点的异构性和存储空间的大小、带宽、功耗等,还要考虑物理连接方式。就移动节点而言,如何以低代价的方式来实现高可靠的存储方式(提供足够多的冗余)进而构建分布式的移动云服务节点是一个挑战性的课题。文献[6-7]提出了一种基于无线环境下的移动设备合作存储方式,给出了数据重要性的概念,重要的数据要最大化可用率。系统采用分块存储模式。但是并没有考虑移动节点的传输速度缓慢问题。
公平性是移动节点另一个要考虑的问题[8-9],结构化的数据存储方式以相同的概率存储数据,有利于节点的负载平衡,但并没有考虑节点的异构性,由于移动节点的存储空间有限,完全多副本的方法很难被直接使用。完整副本的存储方式一旦出现节点不在线或能耗耗尽等情况,则只从一个完整副本的节点进行数据传输恢复。考虑网络线路故障、带宽的有限,恢复速度极慢,若数据量增加,恢复过程的失效情况也会时常发生。因而,降低数据的整体失效概率是移动节点中需要解决的重要问题[10]。
1.1 数据划分方法
定义 1 数据划分 假定M表示数据总体存储量,分布到k个节点,每个节点上存储的数据份数为x(x∈I),等量分割数据为kx份。则数据量表示为:
定义 2 本地化数据,将定义1中的kx份数据平均分发到1−k号节点上,则每个节点上存储有x份数据,这些数据成为节点的本地化数据。存储在节点i的本地数据用Li表示,1≤i≤k。
定义 3 CS(cross storage)存储模型 按照定义1的规则分割数据,节点i存储了x份数据,同时节点(i+1) mod k上存储同样的x份数据。有:
式中,Oj表示交叉存储在其他节点的数据。
定理 1 CS数据存储模型的数据存储量为2M。
证明:据CS模型的定义可得:
证毕。
定义 4 空间利用率U由定义1可得:
文件名称为f,S表示其大小,f存储的k个节点分别用N1~Nk表示。
1) 文件分块
K等分f为fi(1≤i≤k),其大小为Si,Si=S/k。x等分表示每份子文件,其大小表示为分块示意图如图1所示。
数据块存储示意图如图2所示,下层为步骤①分配的数据,称为LND数据;上层为步骤②分配的数据,称为OND数据。
明显可得,LNDsize=ONDsize,其中LNDsize表示LND的数据量,ONDsize表示OND的数据量,总量为2S。当任一节点不可用,可以从其余节点的数据集求并来获得整个数据。其中,k等分的每块原始数据用Bi表示,i∈(1, k )。
图2 数据块存储示意图
1.2 比例存储模型
文中比例分割如图3所示,首先将完整的数据文件file按照δ和1−δ(0<δ<1)的比例分成两个部分。
图3 文件比例分割
1) 对于文件的δ部分直接等分为i份,存储于对应的节点i;
2) 1−δ部分采用CS模型存储进行存储。
文件的整体存储策略如图4所示,图中Ni表示节点号。
图4 文件的比例模型存储策略示例
从数据占用的空间比较,CS存储模型使用k个节点存储数据,与完全的副本存储之比为U=2/k。而RS存储模型,空间占用比表示为: