数据导入关系型数据库内的探讨

2011-12-31 00:00:00段治川
电脑知识与技术 2011年9期


  摘要:在数据库开发现实环境中,由于产品多样性和数据库数据模型及接口等因素造成了数据导入往往存在很多问题。而关系数据库数据因为对数据有较系统的定义和规范,所以数据自然是最理想的数据模型。在实际工作中,有些数据并不是以关系数据库数据模型存放,有的可能还是用文本的形式记录的。这就有一个重要的问题,如何要将非关系型数据转换成关系型数据。从而使利用不同的计算机高级语言编写的程序和开发软件时,调用数据起来大为方便。
  关键词:数据;数据库;导入;探讨
  中图分类号:TP311文献标识码:A文章编号:1009-3044(2011)09-1971-02
  1 绪论
  随着计算机技术的不断发展,数据库作为计算机发展的一个重要方向也得到了长足的进步。数据库技术近五十年的发展过程中形成了独立的理论基础,在服务于金融、信息管理等各个方面形成了多种多样的数据库产品,广泛的应用于社会各个领域。数据库根据服务对象的不同,已经开发建设了成千上万个数据库,为政府、企业、部门提供了强大的数据处理能力。
  一般数据库作为程序开发的后台数据处理系统,在各种开发工具和环境下,往往会让数据库的“兼容性”大大降低。这种情况是怎样产生的呢?这就要从数据库的特性来分析和解决这个问题。
  2 数据库里数据导入理论基础
  简单地说,数据库就是按照数据结构来组织、存储和管理数据的仓库。而数据库里存放的数据是结构化的为多种应用服务的;数据存储独立于使用它的程序。对数据库插入新数据,修改和检索原有数据均能按一种可控制的方式进行。这也就为数据库里数据“兼容性”提供了理论依据。首先是数据整体性,数据库是一个单位或是一个应用领域的通用数据处理系统,它存储的是属于企业和事业部门、团体的有关数据的集合。数据库中的数据是从全局观点出发建立的,是按照一定的数据模型进行组织、描述和存储。其结构基于数据间的自然联系,从而可提供一切必要的存取路径,且数据不再针对某一应用,而是面向全组织,具有整体的结构化特征。其次是数据共享性,数据库中的数据是为众多用户所共享其信息而建立的,已经摆脱了具体程序的限制和制约。不同的用户可以按各自的用法使用数据库中的数据;多个用户可以同时共享数据库中的数据资源,即不同的用户可以同时存取数据库中的同一个数据。数据共享性不仅满足了各用户对信息内容的要求,同时也满足了各用户之间信息通信的要求。基于这两点数据库里数据相互导入就有了充足的理论依据了。
  3 数据导入的“瓶颈”
  在数据库开发现实环境中,由于开发公司的不同因而产品也多种多样,和数据库模型及数据接口等因素造成了数据导入难以实现。而数据往往是需要移植和共享的,所以各个公司都在积极探索数据导入方法。
  现在数据库开发的公司并不多,甲骨文公司(Oracle)是世界最大的数据库软件公司,它的开发工具有Oracle Jdeveloper和Oracle Designer等一系列产品。Oracle数据库一般比较适合超大型的行业领域,如电信、移动、联通、医疗保险、邮政部门等。微软(Microsoft)公司是全球最大的电脑软件提供商,在Windows操作系统中,Microsoft Access和Microsoft SQL Server是最常见的数据库,以及Visual Fox Pro 6.0数据库管理系统,它们同时都可以应用于网络程序应用系统。一般情况下,Microsoft Access数据库和Visual Fox Pro 6.0数据库管理系统比较适合小型或家庭型的应用程序,而Microsoft SQL Server一般比较适合大型的应用程序。还有其它如IBM等公司也有自己的数据开发平台和产品。这些公司的数据库产品都有着自己鲜明的公司属性。
  在数据库开发过程中,数据库的应用一般都是关系数据库,而关系数据库能把现实世界中的各种实体以及实体之间的各种联系均用关系模型来表示。关系模型由关系数据结构、关系操作集合、关系完整性约束三部分组成。关系式数据结构把一些复杂的数据结构归结为简单的二元关系。在关系数据库中,对数据的操作几乎全部建立在一个或多个关系表格上,通过对这些关系表格的分类、合并、连接或选取等运算来实现数据的管理。关系数据库的应用领域非常广泛,主要在证券行业、银行、公司或企业单位,以及政府部门、国防军工领域、科技发展等领域。
  4 数据导入的途径和方法
  关系数据库不但应用领域广泛而且对数据库里数据都做了严格的定义,数据自然是最理想的数据模型。因为关系数据库里的数据在数据类型、域(值)、属性等方面都有较系统的定义和规范,所以关系数据库数据就成为处理数据最实用的方式和存取方式了。再加上,现在程序编写由原来的面向过程结构化程序设计理念转向面向对象编程(OOP)编程架构的转变,都为数据库数据的调入和导入提供了强有力的保证。
  由于在实际工作中,有些数据、报表并不是用关系数据库个模型存放的,可能有的还是用文本的形式记录的。这些数据多且繁杂,往往需要导入到数据库中进行管理和储存。而这种数据的移库是一项艰巨的任务,费时费力且容易出错。在这里一个重要的问题就是要将非关系型数据转换成关系型数据。
  在日常的数据处理中一般都使用办公软件中Microsoft Excel软件。这套软件确实给日常数据处理工作带来了极大的方便,但是Microsoft Excel却只是对数字的运算和逻辑判断而不能进行关系运算。美国微软公司推出了Visual Fox Pro 6.0数据库软件,却是一款关系型数据库管理系统。由于这两种软件同属于微软公司开发,所以有着很好的兼容性,可以Excel电子表格导入成VFP6.0数据库表文件,如图1所示。
  当然,Excel数据表也可以导入到Microsoft Access成为Access数据库表。因为两者同属于Microsoft Office办公软件,所以导入也比较简单,如图2所示。
  如果数据还只是文本,可以通过Microsoft Word转换成Microsoft Excel表格再进行上述操作就可以了。
  5 结论
  导入后生成的数据库表文件就是关系数据库数据了。关系型数据库功能非常强大,使用起了非常方便。这是由于数据库采用了结构化查询语言(SQL),在对关系数据库里的数据进行存取、查询、更新和管理时,都采用一组标准的语言结构来书写,SQL语言结构简洁功能强大且简单易学,从而得到了广泛的应用。这对我们利用不同的计算机高级语言编写的程序和开发软件时,在对数据库处理时就太方便了。因为它作为软件系统一个独立的部分使用SQL就可以很方便的调用了。SQL又是非过程化编程语言,允许用户在高层数据结构上工作同时不需要用户了解具体的数据存放方式,具有完全不同底层结构的不同数据库系统,都可以使用相同的SQL语句来管理数据库数据。
  参考文献:
  [1] 陈旗.Wvindows2003 Server下RPL服务的实现[J].科