李栋科,丁圣彦,赵清贺
(1.平顶山市公安局网安与技侦支队,河南 平顶山 467000;2.教育部黄河中下游数字地理技术重点实验室,河南 开封 475004)
基于本体技术的优化系统研究与应用
李栋科1,2*,丁圣彦2,赵清贺2
(1.平顶山市公安局网安与技侦支队,河南 平顶山 467000;2.教育部黄河中下游数字地理技术重点实验室,河南 开封 475004)
为满足海量异构数据优化需求,对本体的概念和应用进行论述,分析构建地理本体的方法,设计基于地理本体的推理与查询系统、本体控制优化模型等优化系统子系统。在对过程数据作完整性分析、对异构数据源实现数据集成必要性分析的基础上,设计并实现基于本体的优化系统,既可以消除信息孤岛,又可以共享和重用生态文明政务知识,实现信息增值。应用该优化系统对研究区景观格局进行多目标优化,绘制出该研究区域的景观优化格局图。
本体;推理;遗传算法;优化系统
目前,本体技术在“多个领域”优化系统中的应用较为薄弱,尚须进行深入研究。本文对本体、本体优化系统的构建设计进行论述,其可基于大数据采集平台,对领域内研究对象进行有效优化,该优化系统广泛应用于生态、环保、土管、信息安全等多领域。
本体(ontology)是基于概念模型的明确的、清晰的、系统的形式化规范说明。地理本体是采用严格地形式化(rigorously informal)本体表示方法,规范定义地理领域的概念和关系,并对封丘地理本体中的概念进行严格地语义解释,同时基于一些公理、定理和规则实现知识推理。地理本体构造遵循客观性、完全性、最大单调可扩展性、一致性、最小约定原则和最小承诺规则,其构建的方法通常有实用方法、理论方法、经验方法。在研究实践中,常采用3种方法相结合的综合法建立。
本研究采用综合法构建封丘地理本体[1-2],它的构造要经过5个步骤:1)知识获取,即勾勒出目标本体的主要轮廓。由于地理本体的构建主要是为景观优化服务的,因此首先要分析农业景观规划的相关领域知识,挖掘农业景观结构优化和景观空间优化的实质,遴选和提取领域核心概念(术语)。2)领域知识概念化。首先建立知识字典,收集整理领域的概念分类等必要信息,并将概念的定义、所属类别、语义表达、包含的属性和实例,分别写入字典项。其次对地理本体概念类知识表进行必要的知识检验,保证封丘地理本体中的每个概念都符合准确性规则、完整性规则、一致性规则。最后定义概念间分类关系。建立概念分类树,以全面、清晰地表达本体的概念层次和关系。在研究区地理本体中,概念和概念之间通过8种关系(时间关系、距离关系、拓扑关系、方向关系、分元关系、概念相关关系、功能相关关系)来交互。3)概念分类层次的知识检验。4)定义类的属性和实例属性值。5)使用本体编辑工具Protégé 3.3.1[3],生成研究区地理本体。
本研究设计的优化系统总体结构为3个体系架构、5个基本层次,如图1所示。
图1 系统体系结构
3个体系为:基于语义分析综合管理信息系统体系;系统网络和安全保障体系;生态优化工程标准规范体系。
5个基本层次为:生态优化工程运行基础平台层(计算机网络设备等);系统应用支撑平台层(安全认证、公共数据交互、应用系统互操作等);统一数据采集平台和生态业务系统应用层;系统用户数据交互共享层;基于语义的数据挖掘、比对、分析和辅助决策层。
本研究对过程数据作了完整性分析,对异构数据源实现数据集成必要性分析,设计并实现基于本体的综合管理信息系统,既可以消除信息孤岛,又可以共享和重用生态文明政务知识,实现信息增值。
基于地理本体的空间信息语义表达与服务系统研究设计框架[4-7],设计地理本体推理与查询系统,并实现其功能,如图2所示。
图2 系统设计框架
地理本体推理与查询系统的体系结构如图3所示,其中:1)推理控制层分为推理和控制2层。控制层的主要完成数据流(Data Flow)的转发控制(其中数据流包括用户端优化指令输入数据流和返回用户端语义输出数据流的)。推理层是整个地理本体系统的核心,其目的是在数据层接口之上开发基础业务逻辑层,包括本体建库和推理。推理层主要是完成概念显式的形式化语义表达,建立基于封丘地理概念的语义数据库,以实现有效的本体推理。本研究满足实现基于Jena的推理要求。描述逻辑的推理功能集中在进行概念集合的一致性检测,分为包含(subsumption)和相容(satisfiability)两方面,分别为判断一个概念是否为另一个概念的子集和判断一个概念和已有的概念集(本体)是否相容。2)地理本体库层保存本体、OWL文件和RDF文件。本体数据对语义类、语义属性、语义关系以及语义规则进行定义。本层使用连续的语法表示本体。RDF是定义元数据的框架。资源:以RDF形式描述的所有事物属性,每个属性都有一个特定的意义,用于定义和描述资源的特性或关系。语句:一种特定资源与其一个命名属性及该属性的值构成了RDF语句。
图3 系统体系结构
本体控制优化模型是基于景观格局时空分异特征,在景观格局现状数据模型、景观生态系统服务定量化和主要生态限制因子定量化评价支撑下,运用景观生态学原理,采用本体和人工智能技术,建立典型农业区景观生态系统本体优化模型[8-17],对典型区农业景观格局进行多目标优化,绘制研究区域的景观优化格局图,为区域经济与环境的协调健康发展提供参考依据。其结构如图4所示。
图4 本体优化控制模型系统结构
首先,基于农业景观结构优化和景观空间优化2个本体,根据景观结构优化中使用基期年各类景观用地的经济效益数据与生态效益数据,使用多目标线性规划模型,以三态综合效益(经济效益、社会文化效益、生态效益之和)最大化为目标函数,寻求一个适合于约束条件下的最优景观结构初步优化方案。实现农业景观结构优化可以分为结构优化目标函数构建、结构优化约束规则库构建和结构优化模型3个组成部分。其中,结构优化目标函数构建是在专家打分的基础上通过层次分析法模型计算出各景观要素的效益系数,然后根据研究区实际需求采用自定义方式对目标函数进行局部修改,进而获得一个科学、合理的结构优化目标函数;结构优化约束规则库构建是用户根据区域的发展现状和发展目标将社会经济条件、农业景观条件、各景观要素约束指标等土地结构优化相关因素转化为对景观要素数量的约束,并通过农业景观结构约束编辑器输入到农业景观结构优化任务本体中,系统通过农业景观结构优化任务本体将约束解析为相应的结构优化规则,指导结构优化模型求解。3个组成部分有机结合,在景观要素需求预测的基础上,根据用户设定的结构优化约束条件,将景观结构优化结果反馈。
其次,选择以遗传算法模型为主,作为本系统的景观空间优化模型。根据遗传算法的特点可以将算法实现分为景观类型面积指标分解、农业景观空间优化目标函数构建、农业景观空间优化约束规则构建、染色体初始化方式、染色体杂交方式、染色体变异方式、染色体选择、算法终止条件几个部分。其景观要素面积指标分解是通过县域的规划用地量扣除县级以上规划用地的需求作为待分解的用地面积,根据各个镇历年对用地的需求情况按照等比例对待分解用地进行分解;空间优化目标函数构建是在农业生态系统服务定量化的基础上进行,以整个乡镇评价累计值为目标函数,求解满足约束规则的县域优化累计值最大的景观空间模式。景观空间优化约束规则构建是将区域发展模式、景观类型约束指标等景观优化相关因素转化为对各区域范围内各景观要素的保持量、总量以及景观要素之间的转变量的约束,并通过景观空间优化约束编辑器输入到系统中。系统通过景观优化任务本体将约束解析为相应的景观优化规则,指导景观优化模型求解。染色体初始化可以分为3步:第1步,将县级以上规划已经确定的局部区域布局和通过本体知识库可以确定的景观空间格局进行初步规划;第2步,以生态系统服务评价最高值优先、景观要素优先布局等方式在景观空间优化约束范围内对耕地和城乡建设用地的布局进行初始化;第3步,对园地、林地、道路交通用地、坑塘、河渠、湿地及裸地继承性原则(保持现状不变)进行初始化。染色体杂交方式是随机选择染色体杂交组合,以乡镇(因为指标分解到镇层次,导致各个镇的城乡建设用地和耕地的数量确定)为单元对针对城乡建设用地和耕地进行杂交(若是不同染色体同一基因的值为耕地或者城乡建设用地,就以一定概率进行交换)。染色体变异方式是以乡镇为单元同一染色体进行耕地和城乡建设用地进行交换。染色体选择方式是以对适宜值最优和适宜值最劣的染色体进行保留,其他染色体以其自身适宜值减去最劣适宜值为概率,以锦标赛选择方式进行染色体选择。算法终止条件是染色体进化超过县域调研所指定的次数、算法运算时间超过调研指定的时间、连续k次最优适宜值没有提高。通过该算法可以将情景规划转换为约束条件,计算出满意的景观空间优化方案。
最后,基于农业景观结构优化和景观空间优化结果,根据景观优化受到区域总体发展规划、政府行政长官意志、区域的复杂社会环境以及区域地理环境等因素的较大影响的特点,通过一个本体优化系统半自动地输出最终景观优化结果。同时系统计划提供一个交互式修改子系统,以方便后期优化。总之,本研究计划结合社会和野外调查数据,综合政策、管理、自然、人为等因素,统筹分析优化条件,科学构建生态廊道和生态节点等景观组分来加强生态网络的空间联系,在景观生态本体优化模型驱动下,以“稳定粮食生产,建设美丽生态新农村”为核心,坚持景观作为一个整体考虑,协调人与环境,在时间和空间上协调景观空间格局和生态特性及其内部的社会文化活动,以优化利用景观。
以河南省封丘县为例优化应用。封丘本体优化系统的数量结构优化目标主要是经济效益、生态效益和社会效益这3个方面。故此,建立的目标函数为:
maxz=maxVe=maxVs+maxVel=
C1X1+C2X2+C3X3+…+C18X18
其中:Vec、Vs、Vel分别为规划实施后达到的经济效益、社会效益和生态效益;Ci为效益当量;Xi为18种用地类型,xi为18种用地类型中的任一种;C1i为各土地利用类型的经济效益系数;C2i为各土地利用类型的社会效益系数;C3i为各土地利用类型的生态效益系数。优化结果如图5所示。
图5 2025年研究区优化后景观格局
基于地理本体构建优化系统,其适用性强。对研究区景观格局进行多目标优化,绘制出了本研究区域的景观优化格局图,为区域经济与环境的协调健康发展提供参考依据。但优化系统部分模块的可移植性较差,模块间耦合存在一定问题,系统后期须有诸多地方改进。系统模块间需要调用的数据流量大,并限于数据的可获取性,部分参数难以准确设置,对模型的精度存在影响,因此有待继续获取更多的参数数据对模型进行优化。同时,下一阶段的研究应重视系统面向网络的深度开发与应用,使其系统功能更强大,交互更便捷,优化效果更佳。
[1] 安杨,边馥苓,关佶红.GIS中地理本体的建立与比较[J].武汉大学学报(信息科学版),2006,31(12):1108-1111.
[2] 陈虎,李宏伟,马雷雷.本体在地理知识库构建中的应用[J].地理空间信息,2011,9(5):78-83.
[3] Protégé官网[OL].[2015-10-11].http://protege.stanford.edu/.
[4] 韩冬梅,王雯,杭丽娜.基于语义Web的地理领域本体建模及推理研究[J].情报科学,2013,31(8):53-56.
[5] 顾锦注,杨佰新.电力系统机组组合优化的快速模拟退火算法[J].中国电机工程学报,1992,12(6):69-73.
[6] 宫丽红,刘则毅,唐万生.模拟退火算法在贷款组合优化决策中的应用[J].吉林大学学报(信息科学版),2003,21(2):143-147.
[7] 李栋科,丁圣彦,梁国付,等.基于移动窗口法的豫西山地丘陵地区景观异质性分析[J].生态学报,2014,34(12):3414-3424.
[8] 王真星.基于本体的计算机支持协同学习关键技术研究[D].上海:复旦大学,2003:10-94.
[9] 魏丕国.基于本体的信息检索系统模型研究[D].济南:山东科技大学,2007:4-82.
[10] 王重洋.基于本体案例推理与规则推理的土地利用空间布局研究[J].资源科学,2013,35(2):353-361.
[11] 张鸿辉,曾永年,谭荣,等.多智能体区域土地利用优化配置模型及其应用[J].地理学报,2011,66(7):972-984.
[12] 张吉军.模糊层次分析法(FAHP)[J].模糊系统与数学,2000,14(2):80-88.
[13] 赵赟.基于本体的问答查询系统关键技术的研究与实现[D].南京:东南大学,2004:7-91.
[14] 赵晶,唐焕文,朱动芝.模拟退火算法的一种改进及其应用研究[J].大连理工大学学报,2006,46(5):775-780.
[15] 赵文.基于本体的Web信息抽取系统的研究与实现[D].沈阳:沈阳工业大学,2007:11-99.
[16] 赵文杰.德惠市农业景观变化研究[J].东北师大学报(自然科学版),2004,36(2):82-87.
[17] 赵永华.多学科本体构建与集成技术研究[D].济南:山东科技大学,2010:15-88.
Research and Application of Optimization System based on Ontology Technology
LIDongke1,2*,DINGShengyan2,ZHAOQinghe2
(1. The Network Security and Technical Reconnaissance Detachment of Pingdingshan City Public Security Bureau, Pingdingshan 467000, China;2. Key Laboratory of Geospatial Technology For the Middle and Lower Yellow River Regions, Ministry of Education,Kaifeng 475004, China)
To meet the massive demand optimization of heterogeneous data, an account of the concept and application of geographic ontology and analysis of its construction method, an optimization system and its subsystem was designed according to the geographic ontology inference and query system and ontology control optimization model. Based on integrity analysis of process data and the necessity analysis of heterogeneous data sources in realizing data integration, the optimization system was designed and implemented, which could not only eliminate information islands but share and reuse the government affairs of ecological civilization and realize the information multiplication. This optimization system was applied to the landscape pattern to perform the multi-objective optimization and plotted landscape optimization pattern mapping of the research area so as to provide reference foundation for the coordinated and healthy development of the regional economy and environment.
ontology; reasoning; genetic algorithm; optimization system
10.13542/j.cnki.51-1747/tn.2015.04.005
2015-10-29
国家自科基金项目“农业景观异质性对非农生物多样性和生态系统服务的影响研究”(41371195)
李栋科(1983— ),男(汉族),河南平顶山人,工程师,博士,研究方向:大数据优化、信息安全,通信作者邮箱:ldk021@163.com。 丁圣彦(1963— ),男(汉族),河南商丘人,教授,博士,研究方向:景观生态学。
TP311
A
2095-5383(2015)04-0014-04