Web 数据管理研究进展

2014-08-15 00:44
中国科技信息 2014年23期
关键词:数据量数据管理管理者

赵 峰

中国人民银行枣庄市中心支行

Web 数据的有效管理是近年来Internet 领域内专家研究的热点,随着网络使用量的增长、内容复杂度的增大、数据系统自身及应用方面的变化,造成数据库的管理面临着严峻挑战。而Web 数据管理主要以方便用户查询各种信息为目的,在Web 环境中将各种复杂数据进行有条理的整理与集成。本文将根据所读文献对领域内关于Web数据管理的研究现状及所面临的问题进行总结与探讨。

随着网络系统的发展,电脑硬件的配置也在提升,使用网络的用户也在逐日增多。网络数据量增长的速度也在逐渐增大,数据的复杂度也越来越高,Web 是众多用户数据共享的关键平台,在人们生活中扮演的角色也逐日重要。用户使用互联网的主要目的就是从网上得到自己想要的信息,或者是下载一些娱乐信息,但是由于数据量的庞大,用户在选择时根本无从下手,反而给用户带来困扰。这就需要管理者对Web 数据进行梳理、分类并组织,以方便用户使用。

Web 数据管理

目前网络数据管理方式正趋向开放性发展,用户对数据的要求也是各有不同,这都要求Web 数据不论是从数据获取方面、还是数据管理方式上都要满足用户的查询和使用需求。网络数据的复杂性、用户要求的提高等,都使得数据的管理相对于过去要更为优化,对管理者提出了更高的专业要求。

数据来源与获取

Web 数据管理就是要解决用户查询数据时的困难,让用户需要时能以最短的时间在庞大的数据库中找到自己所需要的信息,而且数据库中的数据不仅要内容丰富,而且还要求用户查询到的信息具有一定的准确度。目前用户在查询信息时常用的搜索方式主要有:一,Web 搜索引擎,这种数据获取手段是用户常用的方式,但是系统在建立时对设计者的要求较高,因为这种引擎方式具有较高的复杂度,投入应用后管理投入较高;二,Deep Web,用户在使用这种数据获取方式时获取的信息具有很高的质量,但是获取的数据有很大的离散性,不利于用户对信息的运用;三,元搜索,它是建立在前两种搜索方式之上的,它具备了前两者的优点,同时又对其缺点进行了弥补,即不但使用方便,而且获取数据的精确度比较高,可以说是目前获取Web 数据的最好方式。

当前数据管理分析

Web 网络的形成,最大限度的满足了用户对各种信息的需要,当然这都离不开高效的数据管理方式,这也是业内人士一直研究的主要领域。而现在正在使用的管理方式主要由三种,即HTML,数据库以及XML。其中HTML会在数据进行交换的时候比较常用,这种文件属于半结构化数据,一般来说其结构和信息会混合一块儿,不具有明显模式。XML 也是常用与数据交换,但是它更注重信息内容,用户使用时比较容易,比较适合Web 的信息交换。因为它本身属于半结构,所以能为这类数据进一步的研究带来积极作用。而数据库也是数据管理较为常用的方式,虽然用户使用起来比较方便,但是对于系统管理者来说比较麻烦,管理投入也相对较大。因此Web 数据要根据用户的需求,采取有效的管理方式,争取更加个性化、开放化。在管理方式变化的同时,也使得互联网的发展能够更进一步,从而为人类提高更优质的数据服务。

Web 数据存储与查询

数据管理的前提是要将获取的数据进行有效存储,它主要指数据管理者将获取的数据在逻辑或者物理形式上存储在相关设备上。当前最常用的是将数据进行逻辑存储,具体有四种形式:一,三元组表存储,这种方式比较直接,原理也比较简单,是很多Web 数据管理者常用的方式。三元组是指数据的主谓宾,当获取数据后直接存储相应存储在列表中,特别实在关系数据库中使用起来简单明了,受到管理者的高度青睐。同时它有自身的缺点,即用户使用时由于所需信息存储在同一数据表中,使得数据查询耗费时间长,效率不高。二,垂直数据存储,它对三元组进行了优化,存储结构上进行了简化。三,水平数据存储,将垂直数据存储中各个列进行合并到同一数据表,让所有属性信息在一张表上存储,但是由于数据列量比较大,而且空值多,合并时就会造成空间资源浪费的现象。四,模式生成,相对于水平存储节约了空间存储资源,将数据中属性相同的列存储在同一单元中,因此又称为实例集存储。

Web 数据集成

Web 数据进行集成时一般分为两种方式:数据仓库集成与虚拟集成。数据仓库集成是将获取的数据以数据库的形式供用户查询;用户在使用虚拟方式集成的数据时需要通过第三方平台,当获取到所需信息时根本就不知道信息的数据源。由于Web 网络数据结构经常变化、结构相对复杂、数据量也比较庞大,而虚拟数据集成方法针对这种环境有很强的适应能力,因此也受到数据管理者的关注。

Web 数据管理未来发展趋势

Web 数据管理技术融合了当前很多高新科技,如数据空间与数据搜索等,它将庞大的数据量进行分类整合、组织及存储,为用户查询提供方便。但是面对各类数据结构的复杂性,它还存在一些不足之处,需要在以后实践过程中进行优化。

第一,数据质量上有待于提高。目前数据的获取源已经足够多,但是其质量还需提高,而且有的数据还存在错误的情况,与数字有关的信息其准确度有时候还存在一定偏差。

第二,数据急需统一维护。数据管理系统时刻要与用户打交道,还要与数据相联系,但是数据以用户需求均具有随时变化的特点,这些都要求系统随时跟上变化,但是如果系统不进行统一管理,系统就会混乱化。因此要想系统与数据更新保持一致,就必须将系统数据进行统一管理。

结束语

随着互联网的不断发展,Web 数据规模也在不断扩大,人们对网络数据查询的要求也在提高,这就要求数据管理者根据实际情况不断更新数据管理方式。为让Web 数据系统能够更好地服务于大众,不仅要扩大数据获取源,还要不断提高获取数据的精度,争取让用户能够更高效的查询信息,并且查询途径更加多样化。

猜你喜欢
数据量数据管理管理者
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
基于大数据量的初至层析成像算法优化
高刷新率不容易显示器需求与接口标准带宽
CTCS-2级报文数据管理需求分析和实现
宽带信号采集与大数据量传输系统设计与研究
刘明怀:做卓有成效的管理者
管理者当有所作为
管理者当有所作为