张磊 徐宁 李新艳 周培莹
(江苏省卫生健康发展研究中心 江苏省南京市 210036)
目前,网络与人们的工作、生活息息相关,因此人们需要借助网络对数据进行管理,以便使用数据来满足自身各方面的需求,但随着网络的普及与应用的不断深化,网络环境中的数据量级庞大,且增长速度极快,导致传统数据管理方法不适用,因此为了在新时代下做好数据管理工作,需要重新选择数据管理方法,原有技术手段亟待更新。在这一情况下,多项计算机数据库技术应运而出,从中择优而选,再围绕技术进行数据库设计,即可解决当下难题,因此有必要展开相关研究。
数据管理的前提是得到相关数据,因此需要进行数据采集工作。但在新时代下,随着网络在工作中的不断深入、普及,需要采集的数据项目飞速增长,且数据更新频率也有大幅提升,故数据量级庞大、增长速度极快,如何储存庞大数据成为了一大难题,即传统数据库虽然种类繁多,但容量均有限,而当前数据管理中的数据具有单次量级庞大、增长速度快的特征,因此传统数据库并不满足数据储存需求[1]。在这种情况下,新时代数据管理需要一个能满足当下数据储存容量需要的数据库,且考虑到数据量级会不断增长,数据库的容量还要具备良好的可拓展性。
数据管理工作的第一步就是对数据进行预处理,目的是去除重复的无用数据、修复错误或不全数据、完成数据分类,因此工作人员需要在预处理中对数据进行整理,识别数据特征,以便进行处理。但庞大的数据量级、繁多的数据种类导致人工不能直接对数据进行预处理,即庞大的量级会导致数据预处理工作量大幅增长,而人工工作效率有限,不可能在规定时间内对所有数据进行处理,同时繁多的数据种类会增大数据预处理难度,故人工难以进行整理[2]。在这种情况下,人们就需要使用技术手段来完成数据整理工作,以便做好数据预处理,故存在数据整理技术需要。
下文将对计算机数据库技术应用进行全面分析,涉及技术选型与应用方法,同时还包括数据安全管理。
计算机数据库的关键技术有二,分别为数据库技术、数据管理技术,下文将结合新时代数据管理需要进行技术选型。
2.1.1 数据库技术
自数据库概念提出以来,人们就一直在开发计算机数据库技术,故经过多年发展该项技术有了多种形式,现今主要使用的技术是基于云计算的SQL 数据库技术。该项技术与云计算结合后具有两大特征:第一近乎无限,且拓展性的储存空间,即该数据库的数据储存空间位于网络,而网络空间无限延伸,因此理论上该数据库的储存空间无限,全面满足数据储存需要。同时在近乎无限的储存容量下,人们可以随意设定容量大小,且在容量较小的情况下能随时扩张,故储存空间可拓展性强[3];第二分布式部署,即该数据技术由1 个总系统、若干个子系统组成,所有子系统相互独立,但均与总系统保持联系,图1为分布式部署的拓扑图。在这种部署格局下,每个计算机可以利用子系统对自身数据进行管理,而数据管理总管理员可以通过总系统了解子系统运作情况,同时能对各子系统进行一对一、一对多的管理,可实现子系统协同运作,并保障子系统运作正常,全面做好数据管理工作。
图1:数据库分布式部署的拓扑图
2.1.2 数据管理技术
数据库技术主要负责数据储存,并提供基本的数据管理逻辑,但并不能应对数据预处理等方面的实操需求,因此还需要进行数据管理技术选型。面对庞大的数据量以及复杂的数据关系,普通数据管理技术并不能起到良好作用,故本文主要选择智能技术作为数据管理技术。智能技术能够根据预设的智能逻辑自主完成相关工作,在数据管理的预处理环节中该项技术的基本逻辑见图2。根据图2,智能技术会依照知识库进行运作,首先提取各项数据的特征,诸如关键词等,随后将数据特征与知识库内的特征做对比,可以对数据进行识别。其次会依照数据特征对比结果判断数据是否重复,同时检测数据是否完整,即数据是否满足知识库内对完整数据的定义,若不满足则数据不完整,若发现重复则删除其中任意一项,若发现数据不完整则会通知人工补充[4]。最后将对数据进行关联性分析,若发现数据关联性不对称或不存在关联性,则判定数据组存在错误,单独列出待人工处理。
图2:数据管理技术的基本逻辑
本文结合数据管理需求,利用计算机数据库技术进行了数据库设计,该数据库总体框架见图3。
图3:数据库总体框架
结合三大关键技术,可展开方案设计工作,该项工作可分为两个部分,分别是数据库搭建、数据管理功能设计,具体如下。
2.3.1 数据库搭建
采用基于云计算的SQL 数据库技术搭建数据库:第一统计单次数据导入总量,在网络空间内划分出对等储存资源,生成初始数据库,该数据库容量可满足单次数据导入需求,便于人机交互;第二分布式部署,结合现场计算机数量、从属、级别,开发对应子系统,并完成子系统安装、子系统等级划分等工作,诸如上级部门计算机等级较高,有权对下级部门计算机进行管理,故对应子系统也要符合这种等级关系[5]。完成后将所有子系统与总系统连接,使得子系统内产生的数据会自动进入总数据库,且子系统可以从总数据库中调度出数据,以便针对性管理;第三数据分类项目设计,主要根据部门职能差异,对数据进行初步的分类定义,同步设立分类项目,诸如财务部门与财务数据对应,因此要设计财务数据分类项目,以便数据分类清晰,避免数据混乱的现象发生。另外,在之后的应用中如果出现单次数据量级增大的现象,则再次加大资源,可使容量提升,满足当下需求。
2.3.2 数据管理功能设计
根据数据管理需要,数据管理功能大体有四项:第一数据查询检索功能,主要通过编程技术开发数据查询检索窗口,结合智能技术,人工在窗口输入数据关键词,例如数据的某个字段、数据生成日期等,即可得到所有包含关键词的数据,关键词越精确,则检索结果越精确,以便人工查询数据;第二数据分类功能,主要根据智能技术得到各项数据的特征,将数据自动导入对应的分类项目中,诸如财务数据将自动被导入财务数据分类项。关于数据分类功能的实现方法,主要是设计对应的智能逻辑,逻辑包含识别流程与识别特征,其中识别流程与图2“数据特征提取系列”相同,此处不多加赘述,而识别特征见表1(表1仅展示一部分内容)。另外,关于数据完整性、关联分析功能的实现方法相同,区别仅限于智能逻辑,故此处同样不进行赘述;第三数据权限管理功能,在子系统部署基础上不同数据只能为对应部门或人员所用,否则可能会出现数据混乱或其他不良影响,因此需要设计数据权限管理功能。该功能主要采用编程方法实现,编辑部门账号身份属性以及数据分类项目属性,并通过智能技术对账号身份进行识别,同步获取账号身份属性,在得到身份属性的基础上开放对应属性的数据分类项目,用户可获取分类项目中的相关数据,其他数据则无法查看。针对高层或系统管理员的账号身份属性,每个数据分类项目中都应当包含对应属性,使相关用户能查阅所有数据。另外,数据权限管理功能的基本逻辑比较复杂,除了要针对数据查阅等需求以外,还要考虑到数据修改等权限,而权限所指虽然不同,但基本实现方法相似,只要细心设计即可;第四数据修改功能,因为在实际工作中可能会遇到错误数据或不完整数据,这一类数据无法起到实用效果,所以管理人员要对此类数据进行修改。在权限允许的情况下,数据管理人员可双击需修改数据,随即进行修改,该功能实现方法同样需编程。所有数据管理功能都依托于云计算资源,相关人员可以将这些资源在界面上进行部署、设计,若技术水平有限,也可以通过云供应商服务直接获取对应功能,以丰富数据管理功能。
表1:数据分类项目的识别特征
新时代下数据管理与网络关系紧密,诸如数据管理人员需要通过网络搜集数据,或者要将数据存放到网络环境中,因此网络内的一些风险因素会对数据造成安全威胁,故数据安全保护成为了数据管理的重点。针对数据安全问题,现代数据管理人员一般会采用杀毒软件、防火墙等安全防护手段来管理,但因为风险因素层出不穷,且数据管理人员使用手段的方式简陋,所以并不能有效保护数据,实际风险水平依然居高不下,故如何进一步加强数据安全保护力度成为了数据管理的一大问题,说明存在数据安全保护需要。
为满足安全防护需要,需要在数据库基础上增设数据库安全防护体系,该体系主要有数据库安全防护技术实现。总体上数据安全防护要求比较复杂,故单独使用某一项技术并不能起到应有效果,因此本文将选择智能技术与云计算技术进行安全防护。云计算技术主要负责提供防护逻辑,诸如利用云计算技术可以生成用户认证机制、权限管理机制,该机制作用下能够对用户身份进行识别,判断用户身份是否合法、用户身份类型,再根据判断结果赋予对应权限,即若用户身份不合法这不赋予任何权限,拒绝其访问,若用户身份合法,则根据身份类型予以对应权限[6]。而智能技术主要根据机制执行用户身份识别工作,即根据用户身份信息进行判断,再依照判断结果决定功能开闭,同时智能技术能够对外界恶意攻击等进行识别与学习,若知识库中具有某种恶意攻击的记录,则会直接处理,若没有记录则会控制恶意攻击程序,并且学习,待人工处理完成后,知识库内会生成对应记录,下一次即可直接防护,故能够应对层出不穷的网络风险。
另外,因为基于云数据库的SQL 数据库技术的数据储存空间位于网络,而网络的公共性、公共性会使得数据风险增大,可能会带来大量安全攻击,所以在安全防护基础上,建议通过智能技术与计算机数据库结合,实现用户认证功能,该功能可构成封闭式环境,只留下一个接口,用户必须通过身份认证才能进入数据库,因此借助用户认证机制,智能技术可以与计算机数据库相结合,帮助管理人员对数据安全进行管理。同时数据安全管理要考虑全面,例如针对交换机要借助智能技术开发反入侵功能、针对数据通信渠道要借助加密技术、反监听技术进行防护,通过这些技术与功能能让数据管理更加完善,计算机数据库技术的作用也能充分发挥[7]。
综上,数据管理工作内容复杂,且在新时代下该项工作难度、量级庞大,远非人工力所能及,因此需要使用技术手段来进行管理,而计算机数据库技术自然是不二之选。计算机数据库技术并不是单指某一项技术,诸如智能技术、云技术等都在其列,因此在技术应用中要结合实际需求进行选择,组合,在搭建数据库的同时丰富数据库功能,并关注数据安全问题,这样才能帮助人工全面做好各项数据库管理工作。