柳琳琳,李朋洲,李 琦,徐昱根,李鹏飞
(1.中国核动力研究设计院二所,四川 成都 610213;2.国核华清(北京)核电技术研发中心有限公司,北京 100190)
核级设备鉴定试验数据库的设计与研究
柳琳琳1,李朋洲1,李 琦1,徐昱根1,李鹏飞2
(1.中国核动力研究设计院二所,四川 成都 610213;2.国核华清(北京)核电技术研发中心有限公司,北京 100190)
围绕核级设备试验的各种类型被试样机,会产生大量的试验数据,这些数据不仅量大,而且其信息多样、类型复杂。为了充分有效地管理、分析和应用试验中产生的数据,并结合核级设备鉴定试验数据的现实环境,借鉴计算机数据挖掘分类及信息管理系统等工程思路,提出并设计了一种满足多类型、分布式数据预处理及存储的数据库系统。该系统以业务处理和数据管理为设计核心,以处理不同数据、简化工程流程、改善业务工作效率为功能设计的重点,以自动化容错为设计目标,同时为第三方后续数据分析软件提供高兼容性的接口。其实际应用结果表明,该试验数据库能较好地实现数据整理、分析和应用功能,且数据库的稳定性和健壮性均能满足核级设备鉴定试验的具体需求。
核级设备鉴定;计算机数据挖掘;数据分析;数据库系统;关系数据库
在核级设备鉴定的试验过程中,会产生大量类型丰富的数据,包括时域数据、频域数据、模态试验数据等,同时,这些数据还与不同的试验设备关联,在数据处理上涉及不同的规范要求,数据格式也多种多样[1]。而这些数据和信息对研究用于核电站反应堆安全相关的电气、仪表、控制设备、阀门、泵等有着极为重要的作用。如果能将大量且分散的数据保存起来做进一步的加工处理,并且能长期存储、组织和共享,就必须建立一个数据库系统[2]。数据库系统一般由数据库、数据库管理系统及其开发工具、应用系统、数据库管理员和用户构成。数据库的管理一般具有高度的物理独立性和一定的逻辑独立性,而数据库中的文件具有相互的关联性,在整体上也服从一定的结构形式。利用数据库管理系统能够对核级设备鉴定工作中产生的分析和试验数据进行统一的数据管理和数据控制,并且还能对这些数据提供安全性保护、完整性检查、并发访问控制和数据恢复功能[3-4]。
数据是数据库中存储的基本对象,数据模型是在数据库中对数据逻辑结构的描述,是把信息世界抽象为机器世界。数据库系统包括三种基本数据模型:层次数据模型、网络数据模型和关系数据模型[5]。其中,关系数据模型用二维表格结构来表示概念模型中的实体以及实体之间的联系,由关系数据结构、关系操作及关系完整性约束三部分组成,其理论基础为关系数学。现在,关系数据模型已经发展成为数据库的标准。常见的关系数据库系统有FoxPro、SQL-server、Oracle、DB2、Informix等。
1.1关系数据库的基本概念
一个关系对应一张二维表,每个关系都有一个关系名。关系是对概念模型中某类实体的反映。二维表中的一行即为一个元组,元组对应存储文件中的一条记录。元组是对概念模型中某一具体实体的反映。二维表中的一列即为一个属性,每个属性都有一个属性名,且一个关系中的属性不能重复。属性值是某一元组在某一属性上的具体取值。属性可以通过规定其取值类型、宽度、默认值等来加以约束。属性对应存储文件中的一个字段。属性的取值范围称为域。二维表中选定用来唯一确定一个元组的属性或属性的组合的是主码,而一个关系的某个属性虽然不是该关系的主码,但却是另一个关系的主码,称为外码。关系模式是对关系的信息结构及语义限制的形式化描述,用关系名和包含的属性名集合进行表示。关系数据库中的关系必须是规范化的。
1.2关系数据库的基础理论
关系数据库是建立在关系数据模型基础上的,具有严格的数学理论基础。关系数据库的理论包括关系运算、关系的完整性规则和关系规范化理论。关系运算包括连接、选择和投影,其特点是运算的对象和结果都是表。关系的完整性规则也称为关系的约束条件,它是对关系的一些限制和规定,通过这些限制保证了数据库数据的合理性、正确性和一致性;它包括实体完整性规则、参照完整性规则和域完整性规则。
为了区分数据库模式的优劣,数据库模式在关系规范化理论中分为不同的等级,这些等级也称为范式。通常分为5种范式,满足最低条件的称为第一范式(1NF)。
核级设备鉴定数据库的开发使用Visual C++开发工具。它提供了相当齐全的类库和友好的编程开发界面。使用该工具开发出的数据库功能性强、访问速度快、应用范围广并且占用的资源较少。
2.1VC++数据库开发的特点
VC++提供的MFC类具有强大的功能,MFC的ODBC(Open DataBase Connectivity,开发数据库连接)和ADO(ActiveX Data Objects,活动数据对象)数据库接口已经将一些底层的操作都封装在类中,可以方便使用这些接口。同时,VC++还提供了OLE技术和Active技术,可以利用各种组件和控件来创建程序,实现应用程序的组件化,并带来优良的可扩展性。为了解决访问数据库的速度问题,VC++还提供了基于COM接口的技术,可以直接对数据库的驱动程序进行访问,从而大大提供了访问速度。
2.2数据库访问技术
VC++提供的数据库访问技术包括MFC ODBC、DAO(Data Accesses Object,数据访问对象)和OLE DB(Object Link and Embedding DataBase,对象链接和嵌入数据库)。ODBC是VC++对ODBC API封装得到的,可以简化程序设计;DAO提供了一种通过程序代码创建和操纵数据库的机制,多个DAO构成一个体系结构;OLE DB是基于COM接口的技术,VC++提供了ATL模板来设计OLE DB数据应用程序和数据提供程序。
根据核级设备鉴定试验中产生的具体数据情况,该数据库系统需要管理不同数据采集设备采集的原始数据,如BBM、LMS、CRAS、Dewestron、BK等数据采集系统,同时需要关联管理从原始数据导出的中性数据文件,如txt文件。还能通过产品直接关联与之相关的试验和分析数据,同一个产品可以有多轮次相同或不同类型的试验。在应用工具集成方面,可以通过FlexPro调用中性数据进行分析,还可以集成Matlab和其他自编的软件。具体功能为:
(1)产品管理:包含产品分类定义、产品属性定义管理、通过产品分类库统一维护产品信息以及数据分析管理子模块。
(2)试验项目管理:包含对试验项目属性及各类试验数据、资源的管理,以及试验项目的数据结构、处理流程、项目创建、审核流程、个人工作区、项目库、试验数据分析和应用工具集成。
(3)试验设备管理:包含设备基本信息、状态、标定信息的管理,设备维护,提供设备借还流程管理。
(4)系统管理:包括用户管理、角色管理、组织管理、三权角色用户管理、电子数据仓管理、参数管理、属性集管理和类型管理。
(5)试验数据管理:对试验各个工况信息的记录及各个工况原始数据、中性txt数据的管理,同时提供数据分析功能及第三方数据分析软件的集成。
(6)安全设置:包括三员分立、安全策略、系统权限管理、用户审核和项目授权管理。
(7)系统审计:能把用户在使用数据库过程中进行的操作,包括操作的模块、操作的数据、操作的时间等内容记录下来,以便在安全审计时提供依据。此功能为审计管理员角色所特有的功能模块。
(8)其他:包括登录、退出、帮助等。
根据系统功能分析,经过模块化分析,得到核级设备鉴定数据库系统功能模块结构图,如图1所示。
图1 核级设备鉴定试验数据库模块结构图
在完成各个模块之前,先为产品表、试验项目表、模型分析表、设备基本信息表、流程实例表、流程模板表、流程节点定义表、流程节点实例表、系统权限表、用户系统权限表、系统用户表、系统角色表、系统组织机构表、组织角色关系表、组织角色用户关系表建立相应的记录集类。
核级设备鉴定数据库在设计上分为数据访问层、业务逻辑层、界面层和基础服务层。数据访问层包括数据访问组件和服务代理功能;业务逻辑层包含业务组件、业务实体、业务工作流和服务接口功能;界面层包括用户界面和用户界面处理组件;基础服务层包括安全管理、运营管理和通讯管理。围绕设计上的四个层次,从系统的安全架构、网络架构和数据实体架构三个方面来阐述。
4.1安全架构
为了保证数据库中的数据不会被任意修改、窃取或损坏,制定了身份认证、授权、访问控制、审计和加密等手段进行保护[6-8]。
通过对用户、用户角色、组织机构的管理,合法用户的IP地址、网卡地址以及账号口令的认证,判断用户是否能够登录系统并具有什么样的系统权限;通过检查直接对象的授权记录、策略授权记录、流程权限设定等三个层次的对象权限认证,计算用户对具体文档的操作权限;同时,安全日志模块会在后台自动记录用户的所有重要操作,根据安全日志可以追溯相应的用户操作,确保系统的安全。数据库中存储的数据和文件采用图文压缩算法压缩后,再用128位密钥的DES算法进行加密存储。客户端与服务器直接传输的信息为加密后的密文,即使被截获也不会造成信息的泄露。
4.2网络架构
该数据库采用分布式结构,业务逻辑层和数据访问层部署在数据库服务器上。采用网络云的方式对客户端隐藏实际的网络结构,如图2所示。
眼下贾鹏飞是西庄坪仅留下的年轻人之一。七零后出生的贾鹏飞,高中毕业后就留在家里,也没闹腾出个什么名堂,不过吃饭不愁,钱袋子瘪而已。媳妇范峥峥是邻村的,也是他的高中同学,毕业后不到三年两人就结了婚,后来媳妇看着坪里的年轻媳妇小伙子都到外面打工,春节回来穿着洋气,谈吐也让范峥峥自叹不如。范峥峥便纠缠着贾鹏飞一起出去闯闯。贾鹏飞说我还要留在家里建设社会主义新农村。结果,范峥峥和邻村的姐妹一起去了市里。
图2 数据库网络架构
4.3数据实体架构
实体联系图(E-R图)是抽象描述世界的有力工具,通过画图将实体以及实体之间的联系刻画,建立概念模型。在E-R图中,长方形表示实体,椭圆形表示实体的属性,菱形表示实体之间的联系。该数据库中的数据实体联系图包括系统管理E-R图和业务管理E-R图,分别如图3和图4所示。
图3 系统管理E-R图
图4 业务管理E-R图
5.1系统登录
系统登录的函数名为CheckUserLogin(),参数包括用户名userID和密码验证psw。
5.2个人工作区
个人工作区主要用于获取用户代办事项、获取用户已处理的流程任务、获取用户启动的流程、提交流程任务、撤销流程、查看流程历史等功能。参数包括用户名、查询条件、查询页数、返回总页数、返回总行数、流程实例节点信息、流程对象ID、流程对象类型(试验、模型、权限、申请、删除申请)。
5.3产品管理
产品管理包括创建产品信息、更新产品信息、删除产品信息、分页获取产品列表。参数包括产品信息、扩展属性集合、返回新产品ID、错误信息、查询条件、查询第几页、每页查多少条、返回总页数、返回总行数[9]。
5.4试验项目
5.5模型分析
模型分析包括创建模型分析、更新模型分析、删除模型分析和分页获取模型列表。参数包括模型分析信息、返回新模型分析项目ID,要更新的产品信息、要删除的模型分析ID,查询条件、查询第几页、每页查多少条、返回总页数、返回总行数。
数据库开发的关键技术包括程序开发技术、输入数据规范化技术、算法库、计算流程和交互式图形技术。
下面将对每个关键技术进行一一阐述[11-14]。
6.1程序开发技术
数据库的客户端和服务器端均采用VC++编程语言,在Visual Studio 2005环境下进行开发,并在其他文本编辑和程序调试工具下协作完成。在数据库端使用了Oracle关系数据库环境,并采用SQL语言编写结构化数据存储和查询功能代码。
混合使用多种开发工具的策略是程序开发经常使用的方式,尤其是目前国内以Windows平台作为主要的开发、使用环境,因此对于整个系统层次级的开发来说,Visual Studio环境具有无可比拟的性能优势,特别对于开发分布式的网络程序来说,Visual Studio几乎是Windows平台的最佳选择。同时,NI的Measurement Studio工具包很好地弥补了其本身不具备仪器控制和数据处理的缺点。
针对某些特定的控制与测量目标的子系统的快速开发,使用Lab Windows/CVI。该软件具有友好的界面编辑方式和功能强大的软件包,包括接口函数库、信号处理函数库、Windows SDK等。因此,在程序设计中使用了多种不同的开发工具,减轻了编程工作的负担,加快了数据库的开发速度。
6.2输入数据规范化
输入数据规范化主要是将各种类型的输入数据通过分析、处理,简化数据格式,并将多通道复杂的数据转换为统一的单通道文件。如图5所示,单通道文件采用HDM5和TYD格式规范。
图5 数据规范化方法
这两种格式的优点表现为结构简单、具有自我描述能力(即可建立复杂的数据关系和依赖关系)、高效的I/O方式,以及应用范围广。
6.3算法库
算法库是数据算法工具的集合,是搭建系统专业分析库分析模型的基础。在构建该数据库的算法库中,考虑对算法以程序组件的形式进行管理。一个或多个算法可以编译在一个算法组件中。算法组件随客户端程序发布到客户端。
算法库的编目通过XML文件完成,系统管理员负责对算法库文件进行维护。被编目文件引用的算法组件,被系统自带的分析工具调用。当增加新的算法组件时,可通过编目文件增加新算法组件的引用。
算法按接口不同进行分类,目前预定义有滤波算法接口、应力应变算法接口、数据变换算法接口、曲线显示接口。
6.4计算流程
计算流程是通过工程的方式将输入数据规范化、算法组合以及图形化数据显示进行串联组合的过程。流程控制包括图形化控制方式和脚本控制方式。对于流程中的算法可以用算法库的算法灵活替换、组合,对于工程中设置的计算流程和工程所处理的相关数据可以整体保存或上传,方便下次打开查看。如果下次需要计算相同的算法流程,也可以依据历史的算法流程计算,只需重新设置输入数据即可。
6.5交互式图形技术
交互式图形技术是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。该技术把科学数据,包括测量获得的数值、图像或是计算中涉及、产生的数字信息,变为直观的、以图形图像信息表示的、随时间和空间变化的物理现象或物理量呈现,便于用户观察、模拟和计算。
图形可视化技术是平台的图形化方式编程和仿真结果显示的关键技术,是整个平台实现上的重要部分,为数据分析提供了很好的支持。
在分析研究核级设备鉴定工作中产生的各种类型的试验数据的基础上,利用分布式编程技术,运用多层模块设计思想,以Oracle关系数据库为基本,SQL Server为后台,采用以VC++编程语言为主,多种其他语言为辅的混合编程模式,在Visual Studio环境下设计并开发了一种基于核级设备鉴定信息的数据库。该数据库有效解决了核级设备鉴定试验数据量大,数据分散、时间跨度长,数据内容复杂等问题,将数据进行有序、高效的存储,为使用数据库的科研人员提供便利。
[1] 张 辉,赵郁亮,徐 江,等.基于Oracle数据库海量数据的查询优化研究[J].计算机技术与发展,2012,22(2):165-167.
[2] 孙 荪,皇甫正贤.基于数据库的大型管理信息系统优化设计[J].计算机应用研究,2001,18(6):88-90.
[3] 曹靓姝,王志龙,李得天,等.基于数据库管理的数据采集系统的设计与实现[J].计算机技术与发展,2014,24(4):162-165.
[4] 周 薇.数据库系统安全性测试技术研究[J].计算机技术与发展,2014,24(2):140-144.
[5] 刘培玉,刘法胜,江志超,等.面向对象数据库建模方法与逻辑设计[J].计算机应用研究,1996,13(3):39-41.
[6] 徐龙琴,刘双印,沈玉利.数据库安全性控制的研究[J].计算机应用与软件,2009,26(5):138-140.
[7] 刘 浩,尹四清.数据挖掘技术在“数字黄河”工程建设中的应用[J].电脑知识与技术,2009,5(1):23-24.
[8] 陈文伟,黄金才,赵新昱.数据挖掘技术[M].北京:北京工业大学出版社,2002:3-11.
[9] 赵 泉.信息管理基础[M].北京:机械工业出版社,2003:204-210.
[10] 刘世平.数据挖掘技术及运用[M].北京:高等教育出版社,2010:3-5.
[11] Huang G Q,Yee W Y,Mak K L.Development of a web-based system for engineering change management[J].Robotic and Computer Integrated Manufacturing,2001,17(3):255-267.
[12] Tang D B,Eversheim W,Schuh G,et al.CyberStamping:a web-based environment for cooperative and integrated stamping product development[J].International Journal of Computer Integrated Manufacturing,2004,17(6):504-519.
[13] Damiani E,Vimercati S D C,Paraboschi S,et al.A fine-grained access control system for XML documents[J].ACM Transactions on Information and System Security,2002,5(2):169-202.
[14] Fan W,Simeon J.Integrity constraints for XML[J].Journal of Computer and System Sciences,2003,66(1):254-291.
DesignandResearchofQualificationofComponentsinNuclear-powerLevelDatabase
LIU Lin-lin1,LI Peng-zhou1,LI Qi1,XU Yu-gen1,LI Peng-fei2
(1.Nuclear Power Institute of China,Chengdu 610213,China;2.State Nuclear Huaqing (Beijing) Nuclear Power Technology R&D Center Co., Ltd.,Beijing 100190,China)
There exist massive test data with diverse information and complex types in the process of identification of nuclear level devices.In order to sufficiently and efficiently manage,analyze and apply the data in the test production,combined the real circumstance of nuclear level devices measuring data and considered the thoughts like computer data mining classification and the information management system,a new database system is designed which meets various data and distributed data preprocessing and storage.Its key parts are the business process and data management,with processing diverse data,simplifying engineering process and improving work efficiency as the crucial of functions and with automated fault tolerance as goal while providing high compatibility interface for third-party follow-up data analysis software.The application results show that it could better realize the functions of data arrangement,analysis and application,and its stability and robustness is able to meet the specific requirements of nuclear level qualification tests.
nuclear power qualification;computer data mining;data analysis;database system;relational database
TP302
A
1673-629X(2017)10-0140-06
2016-11-15
2017-03-07 < class="emphasis_bold">网络出版时间
时间:2017-07-19
国家科技重大专项(2012ZX 06004-012)
柳琳琳(1984-),女,硕士,助理研究员,研究方向为反应堆力学试验;李朋洲,博士,研究员,研究方向为反应堆结构力学。
http://kns.cnki.net/kcms/detail/61.1450.tp.20170719.1110.054.html
10.3969/j.issn.1673-629X.2017.10.030