曲靖野+高俊峰
〔摘 要〕本文提出一个面向增值的应急知识挖掘模型。以形式概念分析和概念格理论为基础,建立应急知识形式背景和应急知识概念格,通过格上作业,发现应急知识定域隐含的知识关系,达到应急知识增维的目的。实证结果表明,该模型具有良好的应急知识挖掘表现,所获得的高维应急知识能在一定程度上给下次同类型突发事件的应对提供启迪。
〔关键词〕危机管理;应急知识挖掘;概念格;模型
DOI:10.3969/j.issn.1008-0821.2017.11.006
〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821(2017)11-0034-06
Study on a Model for Emergency Knowledge Mining Based on Concept Lattice
Qu Jingye1,2 Gao Junfeng3
(1.Institute of Scientific and Technical Information of China,Beijing 100038,China;
2.College of Information Technology and Media,Beihua University,Jilin 132013,China;
3.Library,Beihua University,Jilin 132013,China)
〔Abstract〕This paper proposed an emergency knowledge mining model for knowledge increment.Based on formal concept analysis and concept lattice theory,formal background and concept lattice of emergency knowledge had been established.Through the lattice operation,the implicit knowledge relation of emergency knowledge domain was found,and the goal of increasing the dimension of emergency knowledge had been achieved.The empirical results showed that the model had good performance for emergency knowledge mining,and the acquired high dimension emergency knowledge could provide some enlightenment for the next same type of emergency.
〔Key words〕crisis management;emergency knowledge mining;concept lattice;model
1 研究背景
随着后工业化社会的发展,自然环境遭到持续破坏,而其也因此报复性地导致一系列的天灾人祸,人类社会正面临着空前复杂的突发性危机事件地考验。以往的经验表明无论何种类型的突发事件,其应急决策与管理过程都受到危机事件所处的自然环境、经济水平、政治规律、文化习俗等诸多因素的制约。此外,突发事件应急过程中所涉及到的诸多部门与组织,也增加了应急管理决策任务的复杂性[1],因此对于过往应急知识的总结、分享、增值和复用变得尤为重要。总所周知,知识具有显性和隐性的区分,显性知识通常能够通过某种载体以结构化的形式进行表述;而隐性知识更具有个体性,存在于个体潜意识中的隐性知识,由于个体语言逻辑上的匮乏而无法将隐性知识外显[2]。有鉴于此,本文所提出的应急知识增值模型主要着眼于能够被形式化描述和编码的外显型应急知识,对于模糊生涩且不容易表述的内隐型应急知识暂不考虑。
概念格(Concept Lattice)作为形式概念分析(Formal Concept Analysis,FCA)理论的核心算法[3],一经提出即在知识发现、数据分析与知识描述等领域展现出一定的优势。本研究尝试借助概念格强大的频繁项目集生成和关联规则运算功能,以突发事件应急管理过程中应急知识之间的关联关系挖掘为目标,构建应急知识挖掘模型,通过对过往的应急数据、应急信息和应急知识进行整合,探索其中的应急管理规律,进而实现对应急知识的增值再利用。
2 研究现状综述
2.1 应急知识管理的研究现状
通过文献回溯发现,国内外学者在应急知识的描述、序化和管理等方面已经取得了一定的研究成果:2011年,国外就有学者提出将突发事件的具体情境与应急知识片段相结合来进行应急管理[4],在此基础上,基于应急知识描述框架的应急决策支持系统[5]、基于知识单元的应急管理方法集成模型[6]、面向知识管理的应急知识库结构与功能描述[7]、城市危机事件的应急策略[8]等一系列研究得到了相应的讨论。由此可见,应急知识在突发事件处理过程中所起到的关键作用及其重要性已经逐渐被认可,但如何就應急知识进行深度挖掘以便发现知识间的隐含规律,进而实现应急知识增值等方面的探索研究仍稍显稀疏。
2.2 基于概念格的知识挖掘研究现状
由于形式概念分析理论在生成数据频繁项目集和发现蕴含规则方面具有天然的优势[9],因此利用FCA和概念格进行数据挖掘与知识发现的相关研究并不罕见,例如:应用概念格对数字图书馆用户的信息习惯进行规则挖掘,进而实现个性化知识服务[10]、运用概念格分析企业竞争情报的差异性需求,从而揭示需求之间的共现和关联[11]、基于用户在虚拟社区的被动知识行为构建被动知识需求概念格,并在格上进行规则挖掘,建立用户社区知识“推式”服务模型的基础[12]。此外,基于概念格理论进行三支决策算法改进[13]、利用概念格进行案例集成学习[14]等研究也在陆续开展。但形式概念分析和概念格理论应用于应急信息挖掘、应急知识发现等方面的成果尚不常见,且概念格在该领域所具有的天然优势尚未得到彰显。因此,本文尝试构建基于概念格的应急知识挖掘模型,以期为应急人员的危机事件管理和决策提供一定的借鉴和知识支持。endprint
3 基于概念格的应急知识挖掘模型构建
3.1 面向增值的应急知识挖掘原理和路径
设Event={e1,e2,…,en}表示已发危机事件的集合,Emergency knowledge={ek1,ek2,…,ekn}表示从事件集中抽取出的应急知识单元的集合,Rule={r1,r2,…,rn}表示应急知识与危机事件之间的关系集合。那么一个完整的应急知识定域可通过一个三元组加以描述:EKS=(Event,Emergencyknowledge,Rule),“(e,ek)∈R”表示在此定域中的某事件“e”中蕴含某应急知识单元“ek”。
反观形式概念分析与概念格理论,应急知识定域恰好能与形式背景三元组K=(G,M,I)无缝对应。其中K(形式背景)=EKS(应急知识定域),G(对象)=Event(危机事件),M(属性)=Emergency knowledge(应急知识),I(偏序关系)=Rule(应急知识与危机事件的隶属关系)。那么应急知识定域即可以形式概念分析的方法来对其进行描述和处理。例如现存某应急知识事件集EventX={e1,e2,e3,e4,e5,e6},其中蕴含的应急知识单元集为Emergency knowledgeX={ek1,ek2,ek3,ek4,ek5},那么二者之间的蕴含关系集合RuleX则可以表示成一个二模的矩阵,该矩阵即形式概念分析理论中的形式背景:
矩阵中的行与列分别代表突发事件和应急知识元,其中行列交叉部分的“X”代表某事件的应对活动中包含某应急知识元。显然事件与应急知识元的关系集“Rule”已然蕴含于上述矩阵之中。若要实现以增值为目的的应急知识挖掘,必须通过概念格上的作业才可实现,因此,根据表1中隐含着的偏序关系采用概念格生成软件LatticeMiner[15]将表1中的形式背景转换成应急知识概念格如图1所示。
图1的概念格实质上是将表1中的应急知识定域以形式概念分析的方法进行了一次分化与重新整合。在知识系统中,知识分化是从整个知识定域中细分出各种专门的知识[16],在自顶向下遍历应急知识概念格的过程中,已然实现了对应急知识系统中的应急知识细分。例如节点[e3,e5\ek3],是指突发事件“e3”和“e5”在应急活动中共同用到了知识“ek3”(并不是说上两个突发事件只需一个知识单元),应急知识“ek3”构成了应对突发事件“e3”和“e5”的一个必要条件。反之,在自底层向上层遍历应急知识概念格的过程中则实现了对应急知识单元的整合,因为即使是同灾源、同类型的突发事件,在管控处理过程中所应用到的手段和策略也不能保证完全相同,所以各个事件所总结析出的应急知识单元也并非完全一致。概念格的结构特征能将纷繁众多的甚至在知识系统中相距甚远的知识单元进行整合,例如节点[e3,e5\ek3],概念格中与其直接相连的子节点包括第二层的节点[e5\ek3,ek4]和第三层的节点[e3\ek1,ek2,ek3,ek5],也就是分别将突发事件“e3”和“e5”在应急处理过程中所涉猎的应急知识加以枚举。节点[e3,e〕5\ek3]成为了上述两个突发事件的知识交集,通过概念格的数据结构能准确的发现节点之间的链接关系,从而将应急知识定域以有机的整体形式加以展现。
在明确概念格对于应急知识系统处理的重要作用后,进一步探讨基于概念格的应急知识挖掘功能。所谓知识挖掘,是指对某个应急知识论域中具有一定程度上联系性的应急知识单元以某一形式集成输出,其实质与数据挖掘中的关联规则挖掘并无二致。而关联规则挖掘的基础性工作在于计算事物数据库中项目的频繁项目集(Frequent Itemsets),经典的关联规则算法诸如“Apriori”或“Hash”等,由于需多次扫描全域数据以便将支持度不小于给定阈值的项目进行聚类输出[17],导致其共有的性能瓶颈问题是算法响应时间过长,而概念格在建格过程中已经完成了对定域数据的聚类处理,所形成的格上节点即可被看作所聚得出的类目,所以借助形式概念分析与概念格,能够压缩频繁项目集的识别时间,实现应急知识的快速发现。
要实现对表1中的应急知识定域增值,只需挖掘其中应急知识单元之间的联系规则,即可达到对应急管理中应对流程和处理思维上盲区覆盖的目的,从而为下次同类型突发事件的应急活动提供借鉴。笔者设置支持度(Support)=15%,置信度(Confidence)=65%,基于应急知识概念格对表1中的应急知识定域进行挖掘,得出结果如表2所示。
表2包含了11条有意义的规则,基本勾勒出应急知识单元之间的关联关系。一条规则以如下的方式解读,以规则1为例:该规则中应急知识单元“ek2”被称为先导(Antecedent),而应急知识“ek4”被称为后继(Consequence),表示在表1的所有突发事件之中,与应急知识单元“ek2”有关的事件也有33.33%与应急知識单元“ek4”有关,其可信度为66.66%。如此,则为突发事件案例之间的比对和参照提供了清晰的路径,无论是应急过程中习得的知识,或者是问题处理过程中应用到的知识,笔者认为与该类型事件高度相关,只要满足了预置的挖掘条件,就认为具有关联的应急知识单元之间的关系是稳定的强关系,可以作为增值后的应急知识而被诉求方使用。就此意义而言,未得到挖掘的应急知识单元可被理解为简单知识,而挖掘后增值的知识被解读为复杂知识。这里的简单和复杂不是以知识内容来化分,而是从知识的维度出发,而所谓维度就知识的关联因素。独立出现的应急知识片段是一维的,而以关联关系的形式出现的应急知识是多维的,维度越高知识的复杂程度越高,应急知识所涉猎的特定因素越多,因此应急知识的价值也就越大。
3.2 面向增值的应急知识挖掘模型
在剖析基于概念格的应急知识挖掘原理并通过模拟数据对挖掘过程加以演示后,本文进一步提出基于概念格的应急知识挖掘模型,如图2所示:endprint
4 实证研究
为了进一步对模型加以演示和验证,本研究选择近年我国煤矿业的突发性事件作为原始数据进行实证研究。2013-2016年间,全国较为重大的煤矿突发性事件共33起:①贵州金佳煤矿;②黑龙江永盛煤矿;③河北艾家沟煤矿;④黑龙江振兴煤矿;⑤贵州马场煤矿;⑥吉林八宝煤矿;⑦吉林八宝煤矿;⑧吉林庆兴煤矿;⑨四川桃子沟煤矿;⑩贵州大山煤矿;湖南司马冲煤矿;江西曲江煤矿;新疆白杨沟煤矿;云南下海子煤矿;云南红土田煤矿;陕西大海则煤矿;重庆砚石台煤矿;贵州新华煤矿;黑龙江安之顺煤矿;贵州新田煤矿;新疆米泉沙沟煤矿;贵州松林煤矿;黑龙江兴运煤矿;山西姜家湾煤矿;贵州政中煤矿;江西永吉煤矿;黑龙江杏花煤矿;陕西刘家峁煤矿;吉林松树镇煤矿;重庆金山沟煤矿;黑龙江景有煤矿;内蒙古宝马煤矿;湖北辛家煤矿。
笔者进一步采集资料,选择上述煤矿突发事件的事故原因和现场救援措施作为应急知识单元,以便于进一步研究需要,所得数据如表3所示。
基于我国煤炭业突发事故与其发生原因和采取措施的隶属关系构建起形式背景如表4所示。
进一步按形式背景中蕴含的偏序关系诱导构建出应急知识概念格如图3所示。
笔者分别设置支持度(Support)=20%、置信度(Confidence)=80%,支持度(Support)=130%、置信度(Confidence)=50%,进行挖掘,所得出的结果均过于稀疏,进一步调整为支持度(Support)=10%、置信度(Confidence)=50%后,挖掘出12条规则,如表5所示:
观察表5能够发现一些有意义的高维应急知识。例如气体中毒和煤与瓦斯突出两种诱因所引发的矿难事故,通常均采用入井救援的应急策略,其置信度达到了100%,笔者分析也许上述两种类型的矿难事故,只要携带氧气并且弃绝火种,那么即可保证外部人员进入矿井的安全,而爆炸等类型的事故进入矿井救援危险性过大,容易引发二次事故,所以上述类型事故对入井救援策略的使用较为慎重。此外,对于应急策略的惯常搭配也能够在表5中得到体现,例如规则1:采用矿道掘进策略进行救援的案例事项中,有18.18%也同时选择了入井救援策略,其可信度达到75%,笔者分析极可能是发生矿难事故后在高度混乱的情况下进入矿井的通道不够通畅,只能采取掘进的方式来达到下井的目的。
通过概念格和格上作业,将零散的应急知识片段关联到一起,或可对下次同质危机事件的应急管理和应急知识的使用产生新的启发,应急决策主体所面对的应急知识之间也形成了体系,更符合人类的知识习得和复用机制。从此种意义而言,知识之间的关系也是一种新的知识,能对孤立出现的应急知识起到补充和增值的作用。
5 结 论
本文所提出的基于概念格的应急知识挖掘模型旨在实现应急知识的增值和增维,通过应急知识概念格的构建,可以将散乱无序的应急知识片段整合统驱在一个体系之下,又通过格上作业,实现对单维知识单元的增维和对隐含在应急知识论域中关联关系的发掘,从而将非显性的应急知识使用惯例加以揭示,进而实现应急知识增值。
未经历过知识挖掘和知识增值处理的应急信息,不过是相关应急事件的一种杂乱无章的数据堆砌,这给应急人员的知识内化造成了严重阻碍,通过本文所设计的应急知识增值模型的处理,可以实现应急知识的网络化表述,使得具有不同知识背景的应急人员可以根据所面对的问题情景在应急知识网络上寻得所需的问题求解方案。通过应急知识模型的挖掘作业,可以使得原有的彼此之间孤立的应急知识得到一定程度的关联;通过应急知识挖掘模型所发现的一些处置方案与事故类型之间的惯常匹配规则能够较好的为危机应急活动提供量化参照,从而有效对应急决策进行辅助支撑。这并不是说应急人员必须依据所挖掘出的规则来行事,这里的规则是对已发同类危机事件的高度总结,有助于当次突发事件的应急人员对以往的应急知识、救灾经验和教训有更加精确的把握,可对救灾资源的配置活动提供有效的参考,是针对应急人员的救援方案所提供的有效情报服务。
另外,本文采用真實数据对模型进行实证也在一定程度上弥补了应急信息管理研究中的实践稀缺问题。但由于时间和篇幅限制,本研究的实证部分只从两个观测点对突发事件数据中所蕴含的应急知识进行挖掘和增值展示,在接下来的研究中,笔者将进一步探索在多个观测点中抽取应急知识并进行知识挖掘的可能,从而进一步验证基于概念格的知识挖掘模型的效用。
参考文献
[1]陈雪龙,董恩超,王延章.非常规突发事件应急管理的知识元模型[J].情报杂志,2011,30(12):22-26.
[2]SMITH E A.The role of tacit and explicit knowledge in theworkplace[J].Journal of Knowledge Management,2013,5(4):311-321.
[3]Wille R.Restructuring Lattice Theory:An Approach Based on Hierarchies of Concept[C].InProceedingsof the 7th InternationalConference on Formal Concept Analysis.Berlin,Heidelberg:Springer-Verlag,2009:314-339.
[4]Hernández J Z,Serrano J M.Knowledge-based models for emergency management systems[J].Expert Systems with Applications,2001,20(2):173-186.
[5]Maio C D,Fenza G,Gaeta M,et al.A knowledge-based framework for emergency DSS[J].Knowledge-Based Systems,2011,24(8):1372-1379.endprint
[6]Chen X,Wang Y.A Knowledge Element Based Model Integration Method for Emergency Management[C]// IEEE / Wic / ACM International Conference on Web Intelligence and Intelligent Agent Technology.IEEE,2015:152-155.
[7]蔣勋,苏新宁,刘喜文.突发事件驱动的应急决策知识库结构研究[J].情报资料工作,2015,36(1):25-29.
[8]宋绍成,高俊峰.基于知识管理的城市公共危机动态控制策略研究——以吉林市为例[J].情报科学,2013,(10):52-56.
[9]毕强,滕广青.国外形式概念分析与概念格理论应用研究的前沿进展及热点分析[J].现代图书情报技术,2010,(11):17-23.
[10]滕广青,毕强.基于概念格的数字图书馆用户用法细分——数字图书馆用户使用方法的关联规则挖掘[J].现代图书情报技术,2010,26(3):8-12.
[11]王萍,支凤稳,王毅,等.运用概念格分析企业竞争情报需求[J].现代图书情报技术,2013,(10):66-72.
[12]田依林,滕广青,张凡,等.基于概念格的社区用户知识服务模型研究[J].情报科学,2011,(8):1201-1204.
[13]王立亚,张春英,刘保相.基于区间概念格的三支决策动态策略调控模型[J].计算机工程与应用,2016,52(24):80-84.
[14]Kang X,Li D,Wang S.A multi-instance ensemble learning model based on concept lattice[J].Knowledge-Based Systems,2011,24(8):1203-1213.
[15]滕广青,毕强.概念格构建工具ConExp与LatticeMiner的比较研究[J].现代图书情报技术,2010,26(10):17-22.
[16]李喜先,著.知识系统论[M].北京:科学出版社,2011.
[17]毛国君,段立娟,王实,著.数据挖掘原理与算法[M].北京:清华大学出版社,2008.endprint