韩璐遥,韦广昊,张 欢,东 成
(国家海洋信息中心,天津 300171)
面向海洋领域的环境数据管理模型的设计与研究
韩璐遥,韦广昊,张 欢,东 成
(国家海洋信息中心,天津 300171)
在信息技术飞速发展的当代,如何对高精度、多维度、多源异构的海洋环境数据进行有序管理和高效应用是一项重点和难点。通过采用特定领域建模(DSM)技术,设计面向海洋领域的环境数据管理模型,论述其数据对象抽象和元模型构建过程,并开发了应用系统实例,验证了模型的有效性,在实现海洋环境数据与具体业务逻辑的松散耦合的基础上,解决了基于数据库的传统设计模式在管理多源、异构、多模态的海洋环境数据时遇到的效率低下、灵活性差和扩展性不足等问题,提高了海洋环境数据的管理效率和服务能力。
知识类;元模型;领域建模;海洋环境数据
随着信息技术的飞速发展,各行业的数据量都在急剧增长。在海洋领域,由天基(卫星)、空基(飞机、飞船等)、陆基(台站等)、海基(船只、浮标、潜标等)等构成的海洋立体观测体系催生了呈指数级增长的高精度、多频度、多源异构的海洋环境数据。多源多类性、时空敏感性等特点加大了海洋环境数据在有效管理和高效应用服务过程中的难度。
现有的海洋数据管理模型大部分采用传统建模方法,针对某个具体项目建立专项模型,缺乏可扩展性和复用性。当用户需求发生改变时,模型也需要进行相应调整,不利于海洋数据管理人员对内容复杂、结构多变的海洋数据进行长期统一管理。
领域建模作为一种新的建模手段,通过建立面向特定知识领域的行业知识模型,可以大幅提升行业知识的复用性和可控性,增强业务人员对领域知识的学习和发现能力,有效解决传统建模方法可扩展性差、复用性低等问题。本文采用特定领域建模思想,对面向海洋领域的建模方法进行研究,提取海量海洋环境数据的逻辑特征,设计并建立海洋环境数据管理模型。
特定领域建模(DSM)是一种通过对特定知识领域进行抽象分析,获得该领域的普遍共性和个性特征,并面向具体领域对象建立元模型的建模方法[1]。
1.1 领域建模组织架构
领域知识是领域建模的本质,对象是领域建模的研究主体,类是领域建模的逻辑切面,元模型是领域建模的中间成果,领域模型是领域建模的最终产品。
图1 领域建模组成结构图
以下分别对DSM的各组成部分进行介绍。
(1)领域知识。领域知识是领域模型的一个知识切面,是关于特定行业领域的数据实体所处的状态及其变化规律的表述,集合了该领域的数据、数据之间的相互关系以及有关的数据约束。
(2)对象。对象是通过对特定行业领域知识进行特征抽取,获得该领域数据实体的共性及变化特征并对其进行分析归纳所得到的,高度概括了属性、规则和职能的业务实体集合[2-3]。
(3)类。类是具有同一属性、方法的对象集合,由领域知识类和与领域知识密切相关的外部信息类所组成。
(4)元模型。元模型是对特定行业领域的建模环境进行规范定义后得到的抽象类模型[4],元模型是领域模型的度量单位和最大组成单元。
(5)领域模型。领域模型是对特定行业领域的完整抽象,包含该领域的全部数据属性和操作定义,可有效解决数据模型一致性、扩展性与可复用性问题。
1.2 领域建模方法
构建领域模型的过程就是把领域建模的各重要组成部分按顺序实现的过程。领域建模的具体步骤如图2所示。
图2 领域建模方法图
领域建模的步骤如下:
(1)构建能够完全表示领域问题即领域业务逻辑的领域知识体系。
(2)对领域知识进行分析提取得到领域对象。
(3)对具有相同特征的领域对象集合进行高度抽象并生成类。
(4)根据已有类设计建立满足规范的元模型。
(5)将元模型进行逻辑组合,构建领域模型。
建立基于领域知识的行业通用模型,将领域知识应用到具体的业务处理策略中,使业务应用对象和知识对象有更好的内聚性,从而提升领域知识的可控性、可管理性和复用性[6-8]。
基于特定领域建模方法构建海洋领域知识模型,其主要步骤包括海洋领域知识体系构建、海洋领域对象分析提取、海洋领域知识类生成、海洋领域元模型设计和海洋领域模型建立5个组成部分。
2.1 海洋领域知识体系构建
海洋领域建模的本质是海洋知识,由海洋领域中一系列具体业务对象所共有的自成体系的知识切面组成。
构建海洋领域知识体系,即依照已有的行业标准及规范,通过对与具体实现技术无关的纯业务对象的分析,将海洋领域知识体系进行纵向切面[9],并对海洋领域的业务概念或数据实体进行可视化表示的过程,是建立完整海洋领域模型的概念基础。
构建海洋领域知识体系的主体为海洋业务领域的业务专家或工程技术带头人;构建的依据主要参照特定海洋数据领域专家经验、具体使用情境、用户偏好、已有知识体系及其综合体现等。
2.2 海洋领域对象分析提取
海洋领域对象的分析提取工作建立在海洋领域知识切面基础之上,从复杂的海洋领域知识体系中正确提取出具有代表性的关键对象,是构建具有的普适性的领域模型的重要过程。从模型复用角度来说,提取出的领域对象抽象程度越高,则模型在该领域的应用范围越广、应用价值越大。
海洋领域对象从广义上划分,主要是由各类海洋信息对象构成,从狭义上划分,又可细分为海洋数据对象、海洋业务对象和海洋人员对象3类,本文主要从狭义角度对海洋领域对象中海洋数据对象的分析提取进行探讨。
2.3 海洋领域知识类生成
海洋领域知识类是对具有相同属性特征和方法的海洋领域对象集合的概括性描述,如构建一个海洋数据类,则需要对海洋数据的关键特征、详细属性、操作方法等进行高度抽象,并通过符号语言进行描述[10]。
生成海洋领域知识类时,需要对其他相关领域的知识具有一定了解,并充分考虑与外部类之间的关系,海洋知识类与外部类的结合程度越高,则设计出的领域模型完整性越高、可扩展性越强。
2.4 海洋领域元模型设计
海洋领域元模型设计,即根据分析提取、抽象概括得到的海洋领域对象、知识类和与海洋领域密切相关的外部知识类,构建海洋领域元模型,并对元模型进行转换及验证的过程。
海洋领域元模型主要由属性定义、类属关系定义及操作定义三部分构成,其中属性定义主要界定海洋知识的特征属性,如数据来源、处理级别、更新频率等用于区别海洋数据对象的标志;类属性关系定义主要用于描述海洋知识类之间的关系,例如父类与子类之间的包含和从属关系等;操作属性定义主要用于对海洋数据对象的创建、编辑、删除、版本管理等行为进行定义。海洋领域元模型是海洋领域模型的最大组成单元。
2.5 海洋领域模型建立
建立海洋领域模型的根本目的是通过模型化的方式体现海洋领域的核心价值,为构建智慧海洋提供完备的模型支撑[11-14]。一个构架合理的海洋领域模型应当能够最大限度地涵盖海洋领域知识体系内的特征对象及业务关系等,并尽可能全面地与外部知识体系建立知识类之间的相互联系。
图3展示了一个比较简单的海洋领域模型架构,取海洋领域知识体系与地理信息知识体系中数据对象抽象的交集,建立数据对象b;取b与海洋知识域内数据对象a,c的并集,建立海洋类A。同理,建立海洋类B,C,D,海洋类A及其类属关系组成海洋数据对象元模型;海洋类B,C及其类属关系共同组成海洋人员对象元模型;海洋类D及其类属关系组成海洋业务对象元模型,三组元模型共同构成了一个基本的海洋领域模型。
图3 海洋领域模型架构图
按海洋业务需求划分,可以将海洋数据分为海洋环境数据、基础地理与遥感数据及综合管理数据3大类。其中,海洋环境数据是使用频率最高,使用范围最广的数据类型,梳理海洋环境数据管理流程,构建海洋环境数据管理模型,实现基于模型驱动的海洋环境数据管理,对更新我国海洋数据管理手段、提高海洋环境数据服务效率,具有重要意义。
3.1 海洋坏境数据管理
3.1.1 海洋环境数据分类 海洋环境数据资料按照数据来源可以分为国内科技专项调查、国内其他海洋机构专项调查、大洋调查、国内业务化海洋环境观测、国内业务化海洋环境监测、国际合作与交换和国际业务化等资料类型;按照学科可以分为海洋水文、海洋气象、海洋生物、海洋化学、海洋光学、海洋声学、地质、地球物理和地形地貌等资料类型;按照数据处理程度又可以分为原始资料、基础数据和数据产品等资料类型,复杂多样的数据分类方式充分体现出海洋环境数据的多源性、多态性和多维性等特点。海洋环境数据分类如图4所示。
图4 海洋环境数据分类图
3.1.2 海洋环境数据管理体系 为保证海洋环境数据管理方式的科学性和有效性,针对每一类数据资料的特点和处理成果,制定海洋环境数据的分类分级标准。按照原始资料、基础数据和数据产品等处理程度进行数据分层,实现海洋环境资料汇集、处理、存储、服务的全周期管理。海洋数据管理模式的确立是构建环境数据管理知识体系的业务基础。
针对海洋环境原始资料的数据特征,采用以资料来源为特征区间,清单与数据文件相关联的方式进行管理;针对海洋环境基础数据的数据特征,采用以学科要素为特征区间,航次信息与站位信息相关联,元数据映射标准数据文件的方式进行管理;针对海洋环境数据产品的数据特征,采用以学科和产品类型为特征区间,时空分辨率与数据文件相关联的方式进行管理[15-19]。上述管理方法主要用于满足科学计算和联机分析的需求,是优化整合海洋环境数据资料,提高数据管理水平的有效途径。
3.2 海洋环境数据对象抽象
3.2.1 海洋环境数据对象单元抽取 根据原始资料、基础数据和数据产品3种数据类型以及其对应的数据管理方式,在继承原有海洋环境数据库实体并对其进行逆向模型分析的基础上,根据归纳分析数据实体的共性及其变化特征,从现有海洋环境数据资料集合中抽象出6个对象单元,分别是清单数据对象、元数据对象、时空索引数据对象、原始资料文件对象、基础数据文件对象和数据产品文件对象。海洋环境数据对象单元抽取流程如图5所示。
图5 海洋环境数据对象单元抽取图
3.2.2 海洋环境数据对象属性抽取 海洋环境数据对象属性抽取是将各类海洋环境数据对象按照不同粒度进行抽取,为构建扩展性高、复用性强的海洋环境数据类提供结构基础[20-21]。清单数据对象可以抽取出接收日期、汇交单位、文件个数、数据量大小、接收人等属性;元数据对象可以抽取出数据来源、数据量大小、数据量单位、标准数据集格式、版本等属性;时空索引数据对象可以抽取出开始时间、结束时间、时间分辨率、空间分辨率等属性;原始资料文件对象可以抽取出任务名称、任务年份、项目负责人、学科等属性;基础数据文件对象可以抽取出航次号、站位号、调查船代码、质量符等属性;数据产品文件对象可以抽取出产品名称、产品类型、经度、纬度、产品质量评价单位等属性。
3.3 海洋环境数据管理元模型构造
3.3.1 海洋环境数据管理类定义 根据海洋环境数据对象抽象得到的结果,充分考虑类的可扩展性,可以归纳出清单类、元数据类、时空索引类和文件实体类4个海洋环境数据管理类。
3.3.2 海洋环境数据管理类属关系定义 根据海洋环境数据的具体业务需求,清单类拥有原始资料整编前清单类和原始资料整编后清单类1个继承类,元数据类拥有基础数据元数据清单类1个继承类,时空索引类拥有数据产品时空索引类1个继承类,文件实体类拥有原始资料整编前文件类、原始资料整编后文件类、基础数据文件类和数据产品文件类4个继承类。
清单类、元数据类和时空索引类的继承类分别实现了数据文件实体导航接口,并和对应的文件类直接关联。
3.3.3 海洋环境数据管理类操作定义 清单类、元数据类和时空索引类的继承类主要映射了对应数据文件实体的处理及统计等业务逻辑,主要的类操作包括新建、录入、删除、编辑、查询和统计等;文件实体类的继承类主要映射基于业务的海洋环境数据存储及服务等业务逻辑,主要的类操作包括导入、导出、备份和统计等,如图6所示。
3.4 海洋环境数据管理模型搭建
3.4.1 海洋环境数据管理模型搭建 以海洋环境数据管理元模型为核心,构造业务系统模型和数据字典模型,搭建海洋环境数据管理模型。其中,业务系统模型是整个业务系统功能的高度抽象,映射系统运行与服务过程中海洋数据无关的业务流程,为基于业务需求变更的系统更新提供软件复用的模型基础。数据字典模型由3类元模型集合组成,分别是通用字典模型、海洋数据字典模型和系统字典模型,其中,通用字典模型包括国家元模型、区域元模型、调查元模型等;海洋数据字典模型包括数据库信息元模型、库表映射信息元模型和表字段信息元模型等。
3.4.2 海洋环境数据管理模型在数字海洋服务系统中的应用 为测试海洋环境数据管理模型的性能,在数字海洋应用服务系统的环境数据服务模块研发过程中,采用了基于海洋环境数据管理模型驱动的软件开发方式,研发完成的海洋环境数据服务模块查询检索响应时间达到1S量级,远小于其他类型海洋数据服务模块10S量级的查询响应时间,且模块复用性高,可扩展性强,便于根据业务需求的变更进行调整。图7为数字海洋应用服务系统海洋环境数据服务模块界面图。
图6 海洋环境数据管理元模型结构图
图7 数字海洋应用服务系统海洋环境数据服务模块界面
构建海洋领域模型是一项庞大工程,目前仅面向海洋环境数据管理业务进行建模。将领域建模概念引入海洋领域,构建面向海洋领域的高度抽象化的普适模型,直接使用特定海洋业务体系中既有的概念和规则,映射海洋领域的业务逻辑,可以为模型在各种业务情景中的复用提供逻辑基础。
针对海洋数据的多维、动态及时空变化等特征,深入研究海洋环境数据的组织建模及其管理方法。采用基于特征的研究方法,对海洋资料的数据来源进行梳理,提取海洋数据资料的特征属性,将复杂多样的海洋数据进行分类,按照海洋数据处理历程,从原始、基础和产品三个层次对海洋数据进行界定;并按照海洋资料的学科类型和数据开放程度等进行分类分级,依据各层次数据资料的特点及其应用需求设计建立数据管理模型。通过实际测试证明,采用此模型可以大幅提高海洋环境数据组织、管理、查询及检索效率。
由于海洋数据类型众多、格式庞杂,海洋数据管理业务体系依据职能部门的不同各有侧重。目前仅根据国家海洋信息中心已有的数据管理体系进行模型构建,模型适用范围较小。可以预见的是,随着国家海洋信息化整合工作的逐步推进,在统筹国家海洋业务体系的基础上构建一整套抽象化的领域模型,高度概括海洋数据对象的数据属性、数据特征及数据间关联关系,形成适用于整个海洋业务领域的数据对象约束体系,可以为海洋领域业务体系的顶层设计提供模型指导,为面向服务的海洋数据共享交换提供扎实的模型基础。
[1]徐轶,战洪飞,余军合,等.基于特定领域建模元模型的知识建模方法[J].轻工机械学报,2012,30(2):74-78.
[2]赵雪,郭忠文,沈飞飞,等.海洋数据管理系统的设计与实现[J].中国科技信息,2012,23(1):72-74.
[3]李贵,张淼,李征宇,等.基于领域模型的Web数据抽取与集成[J].微电子学与计算机,2012,29(9):152-156.
[4]张炜.面向业务领域的模型驱动架构扩展应用[D].苏州:苏州大学,2007.
[5]卫红春,贾笑蕊.特定领域建模方法和代码生成的研究[J].微电子学与计算机,2013,30(9):154-157.
[6]于婷,杨锦坤,祁冬梅,等.全球海洋数据获取系统元数据(JCOMM/ODAS)服务计划[J].海洋开发与管理,2014(2):28-33.
[7]庄峻,褚燕.基于领域知识的企业知识模型[J].华东电力学报,2013,41(5):1101-1104.
[8]周骏,徐林,李征.元模型驱动的企业建模[J].计算机工程与应用,2005(27):215-217.
[9]黄光芳,金义富.基于领域驱动设计构建企业级Web平台的应用[J].实验室研究与探索,2013,32(8):72-75.
[10]徐轶,战洪飞,余军合,等.面向知识资源配置服务的特定领域建模方法[J].科技与管理,2012,14(1):27-30.
[11]李海峰.基于统一数据模型的企业数据集成与交换[J].制造业自动化,2003,25(1):8-11.
[12]罗荣良,朱勇.基于模型驱动架构的Web Services应用开发[J].计算机应用与软件,2004,21(1):110-112.
[13]朱翠丽,谢益武.面向特征的领域建模方法研究与应用[J].计算机技术与发展,2010,20(11):240-245.
[14]吴映波,王旭,林云.面向服务的领域分析与建模框架[J].计算机工程与设计,2011,32(8):2704-2707.
[15]IsabelF Cruz,Huiyong Xiao,Feihong Hsu.An ontology-based framework for semantic interoperability between XML sources[C]// Proceedings ofthe 8th International Database Engineeringand Applications Symposium(IDEAS2004),2004:217-226.
[16]AlertoPace.Technologies for large data management in scientific computing[J].International Journal ofModern Physics,C.Physics and Computers,2014,25(2):343-352.
[17]Yue-Shan Chang,Hsiang-Tai Cheng.A scientific data extraction architecture using classified metadata[J].Journal ofsupercomputing, 2012,60(3):338-359.
[18]Muhammad Waqar Aziz,Radziah Mohamad,Dayang N A Jawawi,et al.Service based meta-model for the development of distributed embedded real-time systems[J].Real-time systems,2013,49(5):563-579.
[19]Smith G.Folksonomy:social classification[R].2011.
[20]Kingston J,Macintosh A.Knowledge management through multi-perspective modeling:representing and distributing organizational memory[J].Knowledge-based systems,2000,13(02):121-131.
[21]Juan de Lara,Esther Guerra,Ruth Cobos,et al Extending deep meta-modelling for practical model-driven engineering[J].The Computer Journal,2014,57(1):36.
Study on the Meta Object Driven Data Service Platform in Marine Data Management
HAN Lu-yao,WEI Guang-hao,ZHANG Huan,DONG Cheng
National Marine Data and Information Service,Tianjin 300171,China
Along with the rapid development of information technology,orderly management and efficient application is an important and challenging technique for marine environmental data,which have high-precision, multi-dimensional and multi-source heterogeneous features.This paper puts forward an ocean-oriented environmental data management model based on DSM,expounds abstraction of data objects and meta-model's establishment process concerning this model,and then illustrates an application instance to prove its validity.The proposed model integrates marine environmental data and concrete business logic in a loosely coupled manner, and therefore solves the problems of low efficiency,less flexibility and insufficient extensibility in managing multi-source,heterogeneous and multi-mode marine environmental data based on traditional database design, and ultimately improves the management efficiency and service capacity of marine environmental data.
knowledge class,meta-model,domain-specific modeling,marine environmental data
TP311.5
A
1003-2029(2017)03-0084-07
10.3969/j.issn.1003-2029.2017.03.016
2016-11-23
韩璐遥(1987-),女,硕士,工程师,主要研究方向为数据库建设与管理、大数据技术在海洋领域的应用研究。E-mail:hlyiocean@126.com