张建龙 ,解建仓
(1. 山西省水利建设开发中心,山西 太原 030002;2. 西安理工大学 西北水资源与环境生态教育部重点实验室,陕西 西安 710048))
随着社会经济的高速发展,我国水资源逐渐呈现出短缺的趋势。如果对煤矿开采过程中产生的矿井疏干水作为水资源加以处理利用,实现矿井水资源化,则有以下优势:1)开辟了新水源,减少了淡水资源开采量,增加了资源化后的经济效益[1-2];2)缓解了矿区及周边区域水资源矛盾,减少了污水排放量,使水资源的利用更加经济合理;3)减轻了矿井水对地表水系的污染,堵住污染源,美化了矿区环境[3]。因此,矿井疏干水的资源化是解决煤矿缺水和矿井水污染环境的最佳选择。但是矿井疏干水的利用是一项复杂的系统工程,具有涉及部门广、问题多、风险高、管理复杂等特点[4-5],因此,矿井疏干水开发利用需要建立完善的平台管理体系,以实现对矿井疏干水的管理和决策,降低因高风险引起的损失,以及实现矿井水事件的应急管理。
以事例推理(CBR)理论为基本思想,利用检索、重用、修正和保存的推理过程,进行矿井水资源开发利用的风险管理。主要过程包括:1)根据新问题特征属性,从事例库中检索出与新问题相似的事例或事例集;2)选择最相似的事例,或通过事例组合,形成新的解决方案;3)修正建议的解决方案;4)将确认的新事例存入事例库,供后续使用。
矿井疏干水风险管理决策支持系统的主要任务是突发事故的推理决策和经验案例库的建立及维护,事件发生后通过寻求相似度范围内相似事件,立即对此做出决策;如果事件库中还没有相似事件,就将此事件加入事件库,以充实事件库的事例。
基于文本的案例推理 TCBR 是 CBR 机制的分支,是为了进行非结构化的自然语言表示的文档的提取而产生的,与传统 CBR 的不同之处是案例通过信息实体(IES)描述,而推理则通过构建案例提取网(CRN)实现[6]。因此,本文采用 TCBR 推理机制进行风险管理的研究。
矿井疏干水风险管理决策支持系统采用 B/S 架构,所有用户均可以通过内部局域网或者互连网进行操作[7]。通常,系统是基于案例库、知识库、模型库、数据库的系统,由于纯文本案例的特殊性,矿井疏干水应急管理决策支持系统,并没有引入知识库及模型库,取而代之的是信息实体库和 2 个关系库,但这 2 种结构都存在难以对推理结果进行修正的问题。为此本研究以数据作为底层支持,以风险管理、知识库、案例库及模型库作为业务层,以此为基础建立视图层。
2.1.1 案例库的建立
案例库建设主要分为 2 个阶段,第 1 阶段为案例库建设之初的管理,主要是矿井疏干水历年风险事故事件的录入,当初始案例库建立起来后,进入第 2 阶段案例库的维护,如添加、删除、学习的过程,具体操作过程分为以下几个步骤:
1)经验案例资料的收集。对有关矿井疏干水管理资料进行整理,对事件过程进行描述,规范表达。
2)信息的分解。将所有入库信息表达成关键字的形式,建立事件推理的逻辑过程,提供相似事件的相似率,参照专家决策实现信息全集库的建立。
3)根据信息之间的区别程度提供信息的相似率,结合专家意见,对信息关键字进行比较。
4)信息实体与事件之间的关联关系。系统中所有案例与信息实体之间的关联关系由事故处置专家拟定,在系统运行过程中会有所调整,以使得系统对当前问题进行更有针对性的推理。
5)信息实体之间的关联关系维护。系统中所有信息实体之间的关联关系由事故处置专家拟定,在系统运行过程中会有所调整,以使得系统对当前问题进行更针对性的推理。
2.1.2 案例库的实现环境
系统实现过程中采用 JAVA 语言环境,具有面向对象、数据库操作方便和开发周期短等特点。采用 MYSQLS.5 为后台数据库,操作系统为 Windows XP。按上述过程及方法建立案例库,在 MYSQLS.5 中存储案例及信息实体,案例和信息实体是分开存储的,案例与信息实体的相关关系由关联表存储,案例的增加和删减对其他案例与信息实体的关系是没有影响的。如果用于表示当前案例的信息实体不够充分,可以修改信息实体表或增加信息实体,这种修改并不影响当前案例库中的设置。这体现了信息实体表示案例的灵活性,不像 CBR 中案例由固定结构的特征向量表示,这种表示结构随时可以发生变化,而不影响其他案例和信息实体。
案例的检索和匹配是系统的关键步骤,是从事例库中找出与当前求解问题最相似的事例(或事例集)。案例检索与匹配的步骤如下:
1)案例的抽象及相似案例的链接。信息实体是在信息传播中携带信息的媒介,是信息赖以附载的物质基础。如何判断 2 个案例是否表达相近的含义,根据 CRN 网的结构特征,可以采用相似度函数判断即
式中:对于案例描述 c,c1和 c2分别为 2 个案例;e1和 e2分别为信息实体的子集,若 E 为系统信息实体的全集,则 e1∈ E,可以看出,越不相近的 2 个案例的函数值会越大。
2)CRN 和 IES。IES 是 CNR 中知识描述的最小单元,通常情况下使用多个信息实体描述 1 个实例,各个实例由不同的信息实体描述。不同信息实体之间有相似性,信息实体可以看作是实例的关键字,且具有以下特征:不同的信息实体之间有相似关联性;信息实体根据表达意义进行分类;不同信息实体与它表达内容的关联程度可以不同;信息实体是有层次的,不同的自然语言表达可以对应相同的信息实体。例如:“矿井水”、“疏干水”、“煤矿水”可以同时对应 1 个相同的信息实体 “矿井疏干水”,这是一个 2 层的树形匹配结构。
CRN 除要在数据库中存储案例和信息实体,还必须存在如下 2 个关系:相似性,表示不同信息实体之间的相似程度,用 σ (e1, e2) 表示;相关性,表示某一信息实体和案例描述之间的相关度,用 ρ (e, c) 表示。
CRN 的构建过程主要包括以下 3 个步骤:
Step1。根据提出的问题,将其解析为不同信息实体的子集 e。此时,与案例库中所有的信息实体 E 相比较,当问题描述中出现该信息实体 e∈ E,则有 α0(e) = 1,否则 α0(e) = 0。通过这一步的解析,最终可以得到解析后信息实体的集合 Q0={e|α0(e) = 1, e∈ E}。
Step 2。对于实例库中的任一信息实体 e∈ E,计算信息体间的相似性,即
式中:e1, e2, …, es∈Q0;ω 为加权函数;ε0为阈值,表示所提取的信息实体与集合 Q0中所有信息实体的相似关系的最小值。
通过式(2)和集合 Q0可以激活另外一些信息实体,激活的过程可以无限扩展,这些信息实体与 Q0中的信息实体取并集构成 Q1={e|α0(e) = 1, α0(e) ≥ ε0, e∈ E},且满足 α1(e)>ε0, ε0≥ 0。激活的过程可以表示为
式中:e1, e2, … , es∈Qt-1,且 Qt-1={e|αt-1(e) ≥ εm};εm是阈值。
Step 3。计算与当前问题相关联的信息体与案例库中每个案例的相关性,计算公式为:
式中:e1, e2, … , es∈Q0是与当前问题相关联的信息实体的集合 Qt中的信息实体。为减少计算量和节省计算时间,又不影响计算效果,在相关性计算时仅选择与 Qt中的信息相关联的案例集合 c 即可。
3)问题的推理和求解。利用相关度的计算 α2(c)进行相关案例解决方案的提取,结合构建好的 CRN 网络解决方案的提取。根据计算结果的大小,只需按照 α2(c) 的值从大到小排列案例,值越大表明当前案例与问题相关程度越大,一般通过设置阈值来选择关联度大阈值的几个案例作为最终问题解决的建议。
在事例推理中,除了相似性和相关性的计算,另外一个重要的环节就是经验的学习,只有通过不断的学习、修正,案例库中的案例才能更加满足各种查询条件,使得对决策支持的准确度不断地提高。在经验学习过程中,最重要的是把案例材料转化成为系统中案例的结构,并且能将信息实体与该案例的相关程度体现出来。当新旧矿井水资源利用风险事例的相似度小于预先设定的阈值 0.6 时,将新事例添加到事例库中;当新旧矿井水资源利用风险事例相似度在 0.6~0.9 之间时,调整之后的事例可以被添加在事例库中,如果优于被检索出的事例,则可以替换原有的事例;当新旧矿井水资源利用风险事例相似度大于 0.9 时,新事例可以被丢弃。
因此,经验学习的流程显得更为重要,根据系统特性、信息实体及案例库之间的关系,绘制的经验学习流程图如图 1 所示。
图1 可以看出系统对新案例的学习过程为:
图1 经验学习流程图
1)当 1 个矿井水资源利用风险新案例进入系统,系统要进行案例的相似性判断,以判断案例库中是否已经存在相似的案例文档;
2)使用字符串匹配的方式对矿井水资源利用风险新案例进行解析,将其转化成为信息实体子集;
3)设置解析的信息实体与矿井水资源利用风险新案例的相关度,对于满足设置相关度要求的信息实体直接存入相关关系库,而出现的新信息实体则存入信息实体库,最终存入相关关系库。
以案例库的实现环境为基础,结合案例的建立和存贮、检索与匹配,以及经验学习的实现,进行平台风险推理功能模块的设计,主要包括:用户输入事故现象描述,中文分词,匹配信息实体与关键字集合,迭代扩充信息实体集合,给出推荐的解决方案,案例学习,推理流程如图 2 所示。
矿井疏干水资源开发利用风险管理系统的研究是基于矿井企业风险决策需求,实现对矿井疏干水的管理和决策,降低因高风险引起的损失。此系统实现矿井水事件的应急管理,完成对风险事件的拆分、学习、应急预案、专家决策功能,最终提出应急方案。主要功能包括: 案例查询、应急机制、事件描述、学习机制、风险推理及事件管理。
图2 风险推理流程
本研究将人工智能领域中的 TCBR 技术应用于矿井水资源开发利用风险管理中,以事例推理理论为指导思想,针对基于 TCBR 的风险管理中需要解决的关键问题进行分析和研究,并提出相应的解决思路和方法。TCBR 风险管理能够充分利用案例资源,从成功风险管理事例中借鉴经验,使风险处理更加快速、准确和智能化;该方法不仅能够处理定量因素,而且可以将专家和专业人员的经验知识融入到风险管理中,使得管理结果更合理、可行,并且可以实现知识的重用;同时,TCBR 风险管理模式,符合人们的认知和思维过程,推理过程具有生动形象的特点,推理结果易于理解和接受。
基于 TCBR 的风险管理模式是提高矿井水资源利用效率的有益探索,为矿井水资源的开发利用提供风险管理对策及保障手段。风险管理研究是十分复杂的系统问题,在后续的研究和应用中,应进一步提高对矿井水开发利用中各环节的风险状态进行准确描述的研究,以更好地解决案例特征抽取的关键问题。
[1] 李福勤,李硕,何绪文,等. 煤矿矿井水处理工程存在的问题及对策[J]. 中国给水排水,2012, 28 (2): 18-20.
[2] 常雨. 煤矿矿井水回用处理工程设计[D]. 太原:山西大学,2011: 38-42.
[3] 邵立南. 矿井水井下处理与复用技术研究[D]. 北京:中国矿业大学,2009: 15-19.
[4] 傅成诚,梅凡民,马建宏,等. 我国煤矿矿井水资源化现状[J]. 现代矿业,2009 (3): 15-17.
[5] 陈洪彪. 矿井疏干水开发利用可行性研究[J]. 煤炭技术,2005, 24 (6): 100-101.
[6] 李贇. 基于事例推理的城市公共设施应急管理决策支持系统的研究[D]. 北京:北京交通大学,2009: 8-13.
[7] 罗军刚,解建仓,陈田庆. 基于事例推理技术的水库洪水调度研究与应用[J]. 水科学进展,2009, 20 (1): 32-39.