王儒升
摘要:分布式数据库是数据库技术和网络技术的结合产物,将其应用于信息化管理系统中,具有共享性和自治性双重价值:前者降低了信息化管理系统的数据成本,提高了用户的数据应用效率;后者在前者基础上为信息化管理系统提供了选择的机会,提升了分布式数据库中的数据信息安全。文章通过分布式数据库管理系统的搭建,开展管理系统相关路径选取,实现信息化管理系统中分布式数据高效应用。该文对此进行了详细论述,旨在为从业人员提升分布式数据库应用能力提供借鉴。
关键词:信息化管理系统;分布式数据库;内涵;应用方向;应用策略
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2023)35-0083-03
开放科学(资源服务)标识码(OSID)
0 引言
时至今日,信息技术应用领域日益增多,促进了新的信息化管理模式的发展,丰富了组织管理的可能性。在信息化管理系统的支持下,不仅在组织内以有效和实用的方式传播信息,而且还为管理层提供了个人和团体沟通的工具,加强了组织内的管理行动和管理过程。由于信息化管理系统对数据量、种类和速度的需求不断增加,传统的关系数据库不再适用,而分布式数据库似乎是一个可行的解决方案。目前,大量的分布式數据库广泛应用于大型企业。而这些企业的分布式数据库又为中小型企业经营数据库提供了基础设施。由于分布式数据库越来越多地部署在不同的行业领域,如电子商务、生物技术、连锁、社交网络等,分布式数据库层面的云爆炸不仅引起了研究的关注,而且从行业角度来看,论证分布式数据库的应用也很重要[1]。在此背景下,本文通过对分布式数据库的信息化管理应用价值、应用方向进行研究,希望为行业人员提供参考。
1 分布式数据库的内涵
分布式数据库被定义为多个数据库的集合,以逻辑方式连接,物理分布在网络中,并连接它们的不同节点。其中,每个节点都具有自主处理的能力。但是,需要每个节点也参与到某个全局应用程序中,也就是说,它需要访问存储在其他位置的数据。因此,在分布式数据库中,每一个逻辑都依托小型计算机和互联网,将数据存储在不同的位置,通过网络相互连接。在这样的环境中,分布式数据库安排了一组计算机,这些计算机能够彼此相互操作,但也能够自主开展工作。从另一个角度理解,分布式数据库则为分布式系统中多个位置的数据组。由于分布式环境的兴起,这种数据库的采用日益增长。正因为如此,分布式数据库能够更好地适应分散式结构。事实上,大多数企业或者已经整合或者正在开始这样做,分散数据库的使用,以便在这个适应过程中实现简单和经济的数据库改进。
通常,为了保证良好的性能,分布式数据库必须易于扩展。具体来讲分布式数据库应有4个优势:数据分片及复制管理、具有事务的可靠性存取、良好的性能、易于扩展[2],因此,在设计上,分布式数据需要体现出其数据分析片、分布式并发控制、目录管理、分布式储存等功能。关于分布式数据库设计的流程可分为以下几个步骤:概念模式设计;全局逻辑模式设计;本地物理模式设计;碎片化设计,也就是建立驱动碎片化的逻辑标准;片段分配设计,即决定数据的物理位置和可能的副本。所有这些细节都存储在一个全局数据库中,其中包括控制数据库和提供数据库自身的全局视图所需的工具。为了实现数据的快速访问,每个分布式数据库受到其对应的分布式数据管理系统所管理,管理系统具有向用户提供复制、碎片化与分发的透明度作用[3],其主要任务之一是将这些查询转换为仅匹配所涉及的片段的其他查询。
2 分布式数据库在信息化管理系统中的应用价值
当下的信息化管理系统受益于混合云的影响,除了系统性能的提升,同时还实现了系统管理业务速度的提升,避免系统数据锁定,并能够在公共云中保留数据。管理系统功能作用由数据库类型所决定,各类型的数据库在数据复制、读写操作、数据分叉和数据一致性方面存在一定差异。例如,关系数据库具有预先定义的模式,并拥有一个成熟的市场,但是,查询性能不如非关系数据库。相比之下,NoSQL数据库有一个无架构的数据模型,但为了获取更好的性能而破坏了数据库的强一致性。在这方面,信息化管理系统中应用分布式数据库的价值更多地体现在其共享性与自治性之中。
一方面,在对分布式数据库模块进行设计的过程中,这种体系结构在新客户端和附加服务器上都很容易扩展。分布式数据库选择了客户机/服务器架构,并为用户提供了 Web 界面。在分布式数据库中的程序托管服务中,能够保证用户使用数据库与集中式数据库相同,用户可在权限允许的情况下对各位置的数据进行查询或修改。有站点上的数据都是共享的,这样,就得到了一个开放的数据库设计,只需要插入相应的信息就可以在任何管理系统中使用数据,这就是分布式数据库的共享性。这种共享性能够有效降低网络通信的使用成本,提升用户的数据操作效率,能够实现分布式数据的多客户端访问,而不需要用户在本地安装任何额外的软件。另一方面,用于实现分布式数据库的软件元素如下:Web浏览器,它是用于与系统交互的可视化界面,它可以用于任何能够执行Java代码的Web浏览器;Web服务器。通常信息化管理系统选择ApacheTomcat服务器;数据库管理系统。通常信息化管理系统使用Oracle 11g,而Java和Oracle之间的连接是通过JDBC控制器实现的[4]。这种软件元素的组合由于其固有的可靠性和自主性,可以有效地用于具有节点连续连接和离开的动态对等网络,以及由大量节点永久连接到广域网的静态分散系统。在这两种情况下,一个重要的系统目标是限制分布式查询处理生成的网络流量。实现这一目标的关键是有效地定位相关数据源,以便只向存储这些数据源的节点提交查询。换句话说,各节点的数据库系统管理工作人员能够根据现实情况,决定数据是否进行全局共享。对于不可共享的数据,则将其保留于原节点数据库,充分地体现出分布式数据库的自治属性。
3 分布式数据库在信息化管理系统中的应用策略方法
3.1 分布式数据库管理系统模块构建
新时期下,科学信息技术快速发展,对于分布式数据库与其信息化管理系统有着更高的要求。一方面,高质量的分布式数据库能够为信息化管理系统的设计构建提供有效保障,使其设计过程更加合理。在应用中,分布式数据库在数据储存与分发、相关管理系统控制中起到良好的作用;另一方面,高质量的分布式数据库能够对信息管理系统进行精简。通过分布式数据库的应用,信息化管理系统的每个级别都以紧凑的方式进行描述。这种情况下,所考虑的信息化管理系统包括三个级别。其中,第一级别的应用程序是该系统的最高级别,旨在修改分布数据库中的数据;第二级别的主数据库与本地数据库通信,在具有后备通信通道的广域网中,对监督级别的访问起作用;第三级别的本地数据库和控制器之间的通信是基于数据库管理系统重构信息化管理系统逻辑控制器(RLC)的关键。
由此可见,作为信息化管理系统应用数据的核心,分布式数据库管理系统不仅能够实现分布式数据库的构建、查询与维护等功能,还可进行分布式的查询优化、全区域事务执行,为数据库的一致性与同步更新提供坚实保障。分布式数据库管理系统如图1所示。
如图1所示,虽然分布式数据库管理系统的组成较为复杂,但是总体功能模块可分为以下几块:
1) 查询处理模块。此模块包含查询分析与优化处理两项功能,前者针对系统使用者,后者針对系统管理者。该模块的目标在于减少分布式数据库中,查询处理数据的代价。
2) 完整性处理模块。此模块由维护完整性与维护一致性两类功能组成,能够更好地实现多分布式数据库的同步更新。
3) 调度处理模块。此模块由两部分组成,一是发布命令,二是数据传输。其主要目的是通过对站点进行命令发布,采用相应的DBMS对局部开展处理,从而实现站点之间必要的数据传输。
4) 可靠性处理模块。该模块包括两个功能,一是故障预警,二是故障修复。可靠性处理模块能够对系统内的各部分进行监测,及时发现故障,将故障维修后的部分重新接入系统中,从而实现数据库的一致性。
3.2 分布式数据库管理系统路径选型
在信息化管理系统应用分布式数据库的过程中,需要数据库内的各节点明确全局数据查询途径的选择性。如果事先不知道路径选择性值,可以使用估计路径选择性值的技术。为此,本文提出了一个紧凑的数据结构路径选型路径。数据查询可在分布式数据库信息化管理系统中分为两个阶段进行处理:第一阶段,查询DHP(Diffie Hellman Protocol,密钥协商协议)以确定存储数据匹配的所有节点;提交给上一阶段所识别的每个节点,以获取所有数据匹配[5]。在此工作中,查询处理的第一阶段目标是最小化生成的流量,以确定第二阶段将要查询的节点。为此,需要通过将一个键与数据库路径联系起来,然后,负责与之关联的键的节点保存一个指向存储包含所有文档的节点。例如,作为XPATE或XQQERY表达式,基本的选型策略包括将查询分成若干子查询,查询中每个路径一个子查询[6]。由于每个子查询被独立解析,以找到存储与相应路径匹配的文档的节点集。因此,来自不同子查询的结果集在查询节点交叉,然后使用原始查询交集中的所有节点,以获得与该查询匹配的所有数据[7]。
在实际中,上述选型策略可能导致在由几个子查询组成的复杂查询中系统效率低下,特别是在分布式数据库存在许多并发请求的情况下。为了克服这一缺点,另一种选型策略是只解决与选择性最强的路径有关的子问题,即:匹配最低节点数的路径,然后可以用原始查询结果集中的所有节点,以获取满足所有查询约束的文档(包括与其他路径关联的文档)。其中,路径p的选择性sp由下式表示:
[sp=np/n] (1)
其中,np为存储至少一个路径p实例的节点数,n为DHT中的节点总数,0≤sp≤1。这表示选择性sp值越低,则路径p选择性越强。换言之,最低选择性值对应于选择性最强的路径。例如,在一个有10 000个节点的分布式数据库中,存储在50个节点中的路径的选择性为50/10 000=0.005;而存储在5 000个节点中的路径的选择性为5 000/10 000=0.5。前者是高选择性路径(低选择性值);后者是低选择性路径(高选择性值)。
4 结束语
综上所述,应用于信息化管理系统中的分布式数据库可实现信息数据的冗余控制,例如需求、功能、行为和结构等。它是面向对象的、标准化的和广泛适用的,并且能够更有效地降低信息化管理系统的数据成本,提高了信息化管理系统用户的数据应用效率,提升了信息化管理系统数据信息安全水平。在具体应用中,本文通过对系统与构建分析,对管理系统模块搭建与数据库管理系统路径选型进行明确。研究显示,信息化管理系统对分布式数据库的应用是基于系统可用性和自主性需求,挑战是如何在维护安全性和可用性的同时,发布数据和程序以获得预期的性能。为此,研究建议以分布式数据库管理系统实现分布式数据库和信息化管理系统的对接。在许多并发请求的情况下,匹配最低节点数的路径,然后可以用原始查询结果集中的所有节点,以获取满足所有查询约束的文档(包括与其他路径关联的文档)。
参考文献:
[1] 水治禹,卢卫,赵展浩,等.分布式数据库多级一致性统一建模理论研究[J].软件学报,2023,34(5):2392-2412.
[2] 李峻屹.基于热点访问的分布式数据库HBase负载均衡算法研究[J].微型电脑应用,2022,38(5):138-141.
[3] 包全磊.分布式数据库系统的数据分布策略研究[J].信息与电脑(理论版),2022,34(24):196-198.
[4] 王华,王玲维,黄汉云.分布式数据库隐私信息增量式更新方法仿真[J].计算机仿真,2022,39(4):268-272.
[5] 彭成辉.基于HBase分布式数据库集群系统构建方法[J].信息技术与信息化,2022(7):95-98.
[6] 田锐,喻婧.分布式数据库技术及应用分析[J].长江信息通信,2023,36(5):165-167.
[7] 段芳婷.基于分布式SOA架构的高性能MIS框架设计与应用[D].南昌:南昌大学,2021.
【通联编辑:代影】