面向水土保持措施适宜性评价的本体知识库构建

2016-05-27 06:57姚应龙徐伟铭
关键词:水土保持

姚应龙, 徐伟铭, 涂 平

(福州大学空间数据挖掘与信息共享教育部重点实验室, 福建省空间信息工程研究中心 福建 福州 350002)



面向水土保持措施适宜性评价的本体知识库构建

姚应龙, 徐伟铭, 涂 平

(福州大学空间数据挖掘与信息共享教育部重点实验室, 福建省空间信息工程研究中心 福建 福州350002)

摘要:针对无法实现水土保持领域内知识的重用与共享的问题, 研究基于本体的知识库构建方法, 研发水土保持措施适宜性评价知识库系统, 并以福建省长汀县梯田措施的适宜性评价为例验证系统的科学性和有效性. 结果表明, 本体知识库能够有效实现水土保持领域知识与经验的重用, 提高水土保持措施适宜性评价的科学性.

关键词:水土保持; 适宜性评价; 本体知识库

0引言

水土保持措施适宜性评价用以衡量某种水土保持措施与一定的水土流失现状的适合程度, 是水土保持基础理论研究的重要内容之一, 系统分析不同水土保持措施的防蚀机制和适宜条件, 弄清各种措施的产出效益, 丰富了水土保持措施的理论知识, 具有十分重要的理论意义[1]. 同时也是科学和优化实施水土保持措施的基础[2]. 正确地分析水土保持措施在特定区域的适宜性, 对水土流失治理的成效起着至关重要的作用. 目前水土保持措施适宜性评价理论与方法尚不成熟, 大多数的研究都是基于水保法、 多元回归分析法、 加权求和法、 模糊评价法、 灰色关联分析法、 模型预测法等研究水土流失的治理效益[3-8]. 但是这些方法的共同缺点是无法将长期以来专家学者们积累的经验知识运用到评价中去, 无法实现水土保持领域内知识的重用与共享. 因此, 如何提炼、 整理专家知识, 构建水土保持领域知识库, 为水土保持措施适宜性评价服务, 是一个亟待解决的问题. 本体(ontology)是“概念模型的显式表示”[9], 是共享概念模型的明确的形式化、 规范说明[10], 是知识共享、 重用与构建的重要工具. 因此本文将本体知识库引入水土保持措施适宜性评价领域, 借助本体构建面向水土保持措施适宜性评价的要素和要素间的关系, 提取水土保持措施领域专家知识, 构建面向水土保持措施适宜性评价的本体知识库系统.

1面向水土保持措施适宜性评价的本体模型库建设

1.1确定领域知识范围

具体领域的研究首先需对该领域进行分析, 确定领域研究的范围以及涉及到的具体领域知识[11]. 本研究本体库构建的目的是使选择出的最优水土保持措施在当地最适宜. 由于某一特定水土保持措施是否适宜于特定的区域受诸多因素的影响, 因此构建的本体知识库必须覆盖土壤条件、 地形地貌、 社会经济条件、 水土流失条件和生态效益等方面的知识.

1.2领域概念遴选

水土保持措施在特定评价单元的适宜性受自身的生态效益和当地立地条件的影响. 相同立地条件下, 不同水土保持措施具有不同的适宜性, 相同水土保持措施在不同的立地条件下具有不同的效益. 因此, 本研究从立地条件、 措施自身效益两个方面入手, 选取领域概念.

为了使选取的领域概念更规范更准确, 选取的概念主要参考文献[12-16], 并通过与领域专家学者交流, 构建出面向水土保持措施适宜性评价的本体模型库的类及主要关系, 如图1所示.

1.3本体模型库构建

采用Protege本体编辑工具和OWL本体描述语言对本体进行编辑以完成本体模型的形式化表示. 由于OWL DL语言具有良好的知识表达和推理能力[11], 因此本研究以本体模型作为知识推理的依据, 选择OWL DL语言作为本体的描述语言. 如描述本体类 (evaluateCell 评价单元)具有对象属性(hasMeasure具有治理措施), 该对象属性的值域为measure治理措施, 而某一评价单元实例 (evaluateCell_0) 具有的治理措施类型为梯田(Titian), 可用OWL语言简要描述为:

< evaluateCell rdf: ID="evaluateCell_0">

完成本体模型的形式化表示后, 利用Jena提供的API将本体模型持久化进数据库, 以完成领域本体模型的构建.

2基于Jena的水土保持措施适宜性评价规则构建

Jean以其强大的基于规则的推理引擎而被广泛应用, 在其规则语法中, 每一条规则都是由规则名、 规则头部和规则结论组成, 而规则中的每一项都是由本体三元组或者Jena规则内置原语Builtin的调用来形成. 如规则“如果某研究单元的坡度为40°, 那么该研究单元不宜采取梯田措施”, 采用Jena的规则语法可以表示为: (?ardf: type ns: evaluateCell)(?brdf: type ns: Slope )(?bhasValue ?v)(?ans: hasMeasure ns: Titian)(?ans: hasEvaluationFactors ?b)ge(?v, 40) -> (?c ns: hasSuitabilityGrade ns: noSuitable). 该规则由形如(?ardf: type ns: evaluateCell)的term或hterm组成, 其中, “?varname”表示三元组的节点, “ns”为本体库的空间名称, “ns: evaluateCell”为OWL本体文件中定义的类名, “ns: hasEvaluationFactors”为OWL本体文件中定义的属性名. “ge(?b, 40)”为Jena的内置元语, 表示b大于40.

本文知识库中的规则主要有3种, 一是针对不同评价因子确定其权重的评价因子权重规则; 二是适宜性评价模型构建规则, 三是水土保持措施适宜性分级规则.

2.1基于AHP的评价因子权重规则构建

层次分析法(AHP)是一种定性与定量相结合的决策分析方法[17]. 既包含了主观的逻辑判断和分析, 又包含了精确计算和推演, 从而使决策过程具有很强的条理性和科学性. 它能以主观赋权的方式有效地捕捉专家知识. 如图2所示为基于AHP法进行适宜性和生态效益评价因子权重确定的界面, 首先设置准则层的相对重要性, 再分别设置各个评价因子内部的相对重要性. 其过程简述如下.

首先建立两两比较的判断矩阵, 即以某一元素Ok为基础, 对下层中受其约束的一组元素c1,c2,c3, …,cn之间的两两相对重要性进行设定. 在进行比较时, 采用1-3标度(表1)作为比较的标准. 为了获取准确的知识, 邀请15位相关领域的教授和专家分别给出判断矩阵的元素值, 并取平均数作为判断矩阵元素的最终数值. 然后计算在元素Ok下的元素c1,c2,c3, …,cn的权重, 并进行一致性检验.

表1 1~3标度参考表

效益评价因子有径流系数、 侵蚀模数、 林草覆盖度、 土壤肥力, 以此构造出两两比较的判断矩阵(表2). 该判断矩阵的一致性检验结果为:λmax=4.012 5, RI=0.9, CI=0.004 23, CR=0.004 7. 该判断矩阵的一致性非常好.

表2 效益评价因子的判断矩阵

同理可计算出适宜性评价因子的权重, 如表3所示.

表3 适宜性评价因子各层权重

完成表单后点击“计算权重”按钮, 系统会计算出AHP权重, 即层次总排序. 系统没有提示错误则说明判断矩阵通过一致性检验, 点击“生成规则”系统会结合Jena语法规则和本体知识库生成相应的评价因子赋权规则.

2.2适宜性指数计算模型创建规则构建

各适宜性评价因子的适宜性指数直接影响到评价结果, 推理规则库必须包含各适宜性评价因子的适宜性指数计算方法的规则. 由于各适宜性评价因子的适宜性具有模糊性, 采用模糊数学方法进行单项指标适宜性评价可获得科学的评价结果[18]. 因此, 本文采用隶属函数来计算各适宜性评价因子的适宜性指数. 依据适宜性评价因子与水土保持措施适宜性之间的关系, 可将隶属度函数分为升半梯形分布的隶属函数、 降半梯形分布的隶属函数、 近似抛物线形梯形分布的隶属函数和特征函数. 对于前三种我们需要依据不同的治理措施设置拐点的值, 以形成特定于不同的治理措施的指标适宜性指数计算模型. 对于特征函数往往是依据经验用赋值方法来为不同治理措施建立不同的指标适宜性指数计算模型[18]. 坡度、 土壤肥力、 土壤类型、 水土流失强度通过参考水土保持技术手册[12]以及相关文献并结合当地的实际情况来确定; 土壤可侵蚀因子取福建省长汀县土壤可侵蚀因子的最低值和最高值; 建设需求投资、 距道路距离、 距居民点距离由长汀县多年治理资料确定. 具体取值见图3.以评价单元采取梯田措施坡度规则的提取为例简要说明规则获取的方法.

基于现有的研究成果发现: 在5°~15°范围内坡改梯的水土保持效益随着坡度的增大而增加, 在18°~23°之间, 坡改梯减轻侵蚀的效果明显减小[19-20]. 结合长汀县多年治理经验坡度在0°~15°坡改梯的水土保持效益随着坡度的增大而增加; 在15°~20°坡改梯的水土保持效益上下波动不大, 基本保持不变; 在20°~30°坡改梯的水土保持效益随着坡度的增大而迅速减小. 由此便可得出坡度规则为: 如果某一评价单元具有坡度属性, 并且在该评价单元采用的治理措施为梯田, 则该坡度属性的计算模型为抛物线型, 各拐点分别为0°, 15°, 20°, 30°.

如图3所示为各适宜性评价因子的适宜性指数计算模型构建界面, 在填写完相关数据并确定完成后, 结合本体知识库即可形成单指标适宜性指数计算模型构建规则.

同样, 各治理措施在特定评价单元的效益指数也直接影响着评价结果, 因此还需定义关于效益指数的计算规则. 利用2.1中求出的各效益的权重与相应数据加权求和, 得到各个监测点具体的效益值, 然后利用该效益值与坡度、 水土保持措施、 植被覆盖度做多元非线性回归分析. 得出效益值与坡度、 水土保持措施、 植被覆盖度的多元非线性回归模型.

水土保持措施在特定评价单元的最终适宜程度是各评价因子综合作用的结果, 在创建了各指标适宜性指数计算模型的构建规则、 效益计算规则之后还需定义综合适宜性指数计算规则. 综合适宜性评价模型算法为:

其中: SI表示综合适宜性指数;u(x)是各评价因子的适宜性指数;w为各评价因子的权重;B为该评价单元内的生态效益指数.

该模型将水土保持措施的适宜性指数加权求和后再与由生态效益计算模型得出生态效益指数求几何平均数, 表示在适宜性评价中生态效益和适宜性同等重要, 不能偏废其一.

图4 为生态效益计算模型和综合适宜性计算模型的选择界面, 系统根据用户选择即可形成相应规则.

2.3水土保持措施适宜性分级规则

水土保持措施适宜性分级是在某一评价单元中的综合适宜性指数的基础上确定的, 它能让决策者对评价结果有更明晰、 明确的认识. 为了让决策者既能清晰的认识到各级别之间的差别, 又不使级别太多而导致混乱. 为此, 根据依据水土保持措施综合适宜性指数得分由高到低划分为高度适宜、 比较适宜、 一般适宜和不适宜4个级别, 具体划分标准如图5所示, 完成后系统便可生成水土保持措施适宜性分级规则.

3知识库系统设计与应用分析

3.1系统基本结构

系统采用Java EE结合ArcGISServer与Jena开发包, 开发基于WebGIS的水土保持措施适宜性评价本体知识库系统. 如图6所示, 整个系统主要分为两大部分: 本体知识库与基于Jena的本体知识推理部分.

本体知识库主要存储水土保持措施适宜性评价领域本体模型及相关的规则. 基于Jena的本体知识推理部分主要依靠Jena推理子系统, 并结合相关计算模型将评价数据与本体模型结合生成水土保持措施适宜性评价本体实例. 然后, 将规则库中的规则与本体实例结合绑定到本体推理机, 执行推理过程, 最后通过对推理出的RDF三元组模型进行查询即可得到最后的推理结果. 图7所示为本体知识库推理过程.

3.2系统应用

系统以福建省长汀县采用梯田措施的适宜性评价为案例对系统性能进行验证.

3.2.1研究区及数据

长汀县位于福建西部, 由于历史和自然原因, 长汀是南方花岗岩地区水土流失最严重的典型区域, 风化剧烈、 表土层薄、 土壤抗蚀能力差、 肥力衰退严重、 水土流失历史长、 面积广、 危害大, 居福建之首. 据2009年遥感调查结果, 长汀县现有水土流失总面积为32 249.22 hm2, 占全县土地总面积的10.41%. 其中, 强度以上的水土流失占全县水土流失面积的51.73%. 水土流失严重的原因, 主要是由林下流失、 坡耕地、 崩岗侵蚀等水土流失造成.

依据本体模型与规则的设计, 系统所需的数据及数据处理如下列示, 并利用ArcGISServer将这些数据发布为要素服务供系统使用.

1) 生态效益评价数据. 径流系数: 用长汀县2012年径流小区监测的径流量除以降雨量得到; 侵蚀模数: 来自长汀县水保站2012年监测数据; 植被覆盖度: 来自2012年遥感影像解译; 土壤肥力: 将长汀县2012年水土保持措施监测点监测数据, 利AHP法计算出各指标权重, 再加权计算出各个监测点的土壤肥力.

2) 适宜性评价数据. 坡度: 利用ArcGIS软件从长汀县1 ∶10 000的DEM中提取; 土壤肥力: 先将2012年长汀县水保措施监测点的有机质、 全氮、 全磷、 全钾、 速效磷、 速效钾在全县区域做插值, 然后利用插值后的数据, 利用AHP法计算出各指标权重, 再加权计算出全县的土壤肥力, 然后对其进行等级划分[21]. 土壤类型、 土壤可侵蚀因子、 水土流失强度均来自长汀县水保站. 距道路的距离、 距居民点的距离: 利用ArcGIS软件对从长汀县1 ∶10 000 DLG中提取的道路、 居民点(面)数据与研究区做临近分析; 可用建设投资: 从长汀县2008-2013年治理实施方案中提取. 再利用ArcGIS软件以本研究区为范围, 生成100×100的格网, 分别与适宜性评价数据做叠置分析, 并取单元格内面积最大属性作为相应数据在该单元格中的值.

3.2.2系统应用

如图8所示界面显示了利用本体知识库系统进行水土保持措施适宜性评价的流程, 第一步, 键入要评价区域监测点的生态效益数据服务地址, 系统默认为福建省长汀县2012年监测点数据. 第二步, 键入要评价区域适宜性数据服务, 系统默认为福建省长汀县2012年数据. 第三步, 选择要评价的治理措施. 第四步, 点击评价推理, 系统会根据用户的数据和评价目标调用系统的评价推理模块进行水土保持措施的适宜性评价, 并返回在用户感兴趣区域中采取用户指定的措施的适宜性程度图.

分析返回的适宜性程度图可发现, 适宜性好的地方主要分布在距道路和居民点近、 土壤肥力高、 坡度较缓、 水土流失强度高的地区, 与往年采用梯田措施并且取得了很好效益的地区吻合. 这验证了本文知识库构建机制的有效性.

4结论

本文将本体知识库引入水土保持措施适宜性评价领域. 通过遴选水土保持措施适宜性评价领域的概念与定义, 构建了水土保持措施适宜性评价领域本体, 并以Jena规则语法为基础, 基于AHP实现了对评价因子权重规则的定义; 基于模糊数学实现了适宜性因子的适宜性指数计算模型构建规则的定义; 基于多元非线性回归分析实现了生态效益指数计算规则的定义; 基于结合加权求和与几何平均方法实现了综合适宜性指数计算规则的定义. 进而构建了水土保持措施适宜性评价规则库, 完成了水土保持措施适宜性评价知识库的构建, 实现了水土保持领域专业经验知识的共享与重用. 最后开发基于WebGIS的水土保持措施适宜性评价本体知识库系统, 以福建省长汀县梯田措施的适宜性评价为例, 对系统的科学性和有效性进行验证, 取得了令人满意的结果. 由于水土保持措施的多宜性的特点, 本系统评价出的多种措施在同一评价单元有可能都达到高度适宜的级别, 决策者可以权衡利弊, 采用适当的措施, 可以提高决策的准确度. 此外, 本系统所使用的数据均以服务的形式发布在GIS服务器中, 用户可以根据自己的兴趣来选择治理措施和评价区域, 只要为系统提供自己的数据服务, 即可完成适宜性评价推理.

水土保持措施适宜性评价是一个非常复杂的工作, 本文对面向县级水土保持措施适宜性评价的本体知识库构建进行了初步的探索, 但由于模型、 知识的不确定性且不完善, 对于系统知识库知识的获取和维护仍需要进一步的研究.

参考文献:

[1] 代富强, 刘刚才. 紫色土丘陵区典型水土保持措施的适宜性评价[J]. 中国水土保持科学, 2011, 9(4): 23-30.

[2] 刘刚才, 张建辉, 杜树汉. 关于水土保持措施适宜性的评价方法[J]. 中国水土保持科学, 2009, 7(1): 108-111.

[3] 王健, 吴发启, 孟秦倩. 农业耕作措施蓄水保土效益试验研究[J]. 水土保持通报, 2004, 24(5): 39-41.

[4] 蒋定生, 黄国俊, 范兴科. 黄土高原坡耕地水土保持措施效益评价试验研究(Ⅲ)坡耕地水土保持措施综合效益评价[J]. 水土保持学报, 1990, 4(4): 8-13, 20.

[5] 张理华, 周秉根, 万荣荣. 皖南低山丘陵区水土保持综合评价[J]. 水土保持学报, 2001, 15(6): 20-23, 77.

[6] 张忠学, 郭亚芬, 任玉东. 小流域生态经济系统的评价研究[J]. 水土保持通报, 2000, 20(l): 24-27.

[7] 黎锁平. 水土保持综合治理效益的灰色系统评价[J]. 水土保持通报, 1994, 14(5): 13-18.

[8] 贾宁凤, 段建南, 陈焕伟, 等. 黄土高原小流域综合治理效益多维灰色动态评价[J]. 农业系统科学与综合研究, 2005,21(2): 156.

[9] GRUBER T R.A translation approach to portable ontology specifications[J].Knowledge Acquisition, 1993(5): 199-200.

[10] STUDER R , BENJAMINS V R, FENSEL D. Knowledge engineering, principles and methods[J]. Data and Knowledge Engineering,1998, 25: 161-197.

[11] 谢小华. 本体知识库系统驱动的树木生长可视化模拟[D]. 福州: 福州大学, 2010.

[12] 王礼先, 孙保平, 余新晓. 中国水利百科全书: 水土保持分册[M]. 北京: 中国水利水电出版社, 2004: 77-167.

[13] 刘宝元, 刘瑛娜, 张科利, 等. 中国水土保持措施分类[J]. 水土保持学报, 2013, 27(2): 80-84.

[14] 中华人民共和国国家质量监督检验检疫总局, 中国国家标准化管理委员会. 水土保持综合治理效益计算方法: GB/T 15774-2008[S]. 北京: 中国标准出版社, 2009.

[15] 关君蔚. 水土保持原理[M]. 北京: 中国林业出版社, 1996: 49-205.

[16] 水利部, 中国科学院, 中国工程院. 中国水土流失防治与生态安全: 水土流失影响评价卷[M]. 科学出版社, 2010.

[17] 徐建华. 现代地理学中的数学方法[M]. 北京: 高等教育出版社, 2002.

[18] 王建国, 杨林章, 单艳红. 模糊数学在土壤质量评价中的应用研究[J]. 土壤学报, 2001, 38(2) : 176-183.

[19] 李双喜. 紫色岩区水土保持综合治理实验研究[J].人民长江, 1996, 27(7): 34-35.

[20] 李秋艳, 蔡强国, 方海燕, 等. 长江上游紫色土地区不同坡度坡耕地水保措施的适宜性分析[J]. 资源科学, 2009, 31(12): 2 157-2 163.

[21] 陈海滨. 侵蚀红壤小流域土壤养分空间变异与肥力质量评价[D]. 福州: 福建师范大学, 2011.

(责任编辑: 林晓)

Construction of ontology knowledge base for water-and-soil conservation measures suitability evaluation

YAO Yinglong, XU Weiming, TU Ping

(Key Lab of Spatial Data Mining and Information Sharing, Ministry of Education, Spatial Information Research Center of Fujian Province, Fuzhou University, Fuzhou, Fujian 350002, China)

Abstract:Because of the existing knowledge was shared rarely which in soil and water conservation field, the function of building knowledge base was studied based on Ontology, the system of ontology knowledge base for water-and-soil conservation measures suitability evaluation was constructed. At the end, effective and scientific results were evaluated though the research of suitability of terrace in Changting County. Results showed that ontology knowledge base can be beneficial to reuse of knowledge and experience, and improve the scientific suitability of these measures.

Keywords:water-and-soil conservation; measures suitability; ontology knowledge base

中图分类号:TP181

文献标识码:A

项目基金:国家科技支撑计划资助项目(2013BAC08B02); 福州大学科技发展基金资助项目(2013-XY-15); 福州大学科技启动基金资助项目(0460-022500); 福建省教育厅科技资助项目(JK2014004, JA15070)

通讯作者:徐伟铭(1986-), 讲师, 主要从事地理信息建模与分析技术研究, xwming2@fzu.edu.cn

收稿日期:2014-10-22

文章编号:1000-2243(2016)02-0188-08

DOI:10.7631/issn.1000-2243.2016.02.0188

猜你喜欢
水土保持
《水土保持通报》第七届编委会章程
《水土保持通报》第七届编委会成员名单
昆明有色院编制的四项水土保持设施验收报告通过评审
关于水土保持的几点思考
省水利厅召开2021年度水土保持重点工程推进视频会
水土保持监测对水土保持的重要性与改进策略
石油资源开发的水土保持补偿对策研究
特高压输变电工程中的水土保持措施设计
无人机低空遥测技术在水土保持监测中的应用分析
水土保持和信息化管理制度建设及发展