萧海东,陈 宁
(1.中国科学院上海高等研究院,上海201210;2.上海交通大学中美物流研究院,上海200030;3.华东理工大学信息科学与工程学院,上海200237)
基于知识库的应急领域脆弱性指标体系研究
萧海东1,2,陈 宁3
(1.中国科学院上海高等研究院,上海201210;2.上海交通大学中美物流研究院,上海200030;3.华东理工大学信息科学与工程学院,上海200237)
应急事件的演化和应急领域的脆弱性指标变化有着密切关系。大型运作系统核心能力受损后的应急期间,管理者非常关心如何根据动态变化的受损情况把握关键指标因素进行恢复,从而降低应急管理成本。本文基于知识库对应急领域知识结构进行分析,并将层级时序记忆方法引入应急脆弱性指标知识挖掘体系,通过脆弱性态势感知解决了指标约简问题,最后给出了构建知识库的推理机设计和推理算法。本文得到有助于应急管理的结论:基于知识库的脆弱性指标体系可动态分析突发事件和应急管理中蕴涵的知识,有助于对应急事件演化机理准确把握,提高应对效率。
知识库;脆弱性;层级时序记忆;应急管理
由异常不确定性引发的突发事件,具有发生概率低,难以预测的特点,如果事前没有做任何防范措施,这类事件一旦爆发,会给企业和社会造成巨大的损失,影响整个供应链的运行。根据华尔街报道[1],2000年3月的飞利浦半导体火灾,给爱立信造成4亿美元的损失;还有2000年美国新墨西哥州雷电事件,2008年的汶川大地震等,最近2011年日本大地震和海啸造成日本工业生产中断,引发全球供应链动荡,世界上许多工厂被迫停产。到2011年3月末,这种供应链中断影响已经导致全球汽车产量降低60万辆。上述几个案例给我们带来的深刻启示是,突发事件的有效处置迫切需要掌握复杂环境下突发事件演化机理的内在规律,分析应急领域脆弱性指标。脆弱性体系的研究是应急管理领域的一个热点问题:
Kannan[2]等从计算机系统脆弱性体系角度研究了软件脆弱性和计算机应急响应决策对应的内在机理;Benth[3]等从系统能力的角度研究了脆弱性体系,其建模适用于计算机系统和企业组织系统,并明确把脆弱性对系统的影响纳入评估系统能力的成本;张灵[4]等以防洪系统应急决策为例,用脆弱性描述了承灾阶段中系统面临洪灾时应对、抵御洪水的能力,构建了系统脆弱性诊断指标体系,结合GIS技术建立了基于极大熵原理的模糊诊断模型;文凤华[5]等从金融脆弱性角度研究了房地产价格波动对金融的冲击,通过选取宏观经济面和微观金融两个层次的六个指标编制脆弱性指数,并建立向量自回归模型对金融脆弱性进行定量分析;王守全[6]研究了脆弱性分析框架,从脆弱性的度量和脆弱因素的识别等方面进行分析。事实上,由于管理者对突发事件的发生概率不敏感或不理解,使得他们很难做出启动应急方案的决策;又由于缺少数据和合适评价应急领域脆弱性的指标,现有的脆弱性体系缺乏从脆弱性知识的角度分析,难以用计算机表述并用计算机理解。企业界很难相信辅助决策应急方案的有效性,也很少有企业为应对突发事件而积极投资于应急方案,因为没有人会为不一定发生的事情去投资买单[7-8]。在这个背景下,我们展开对突发事件扩散的内因发现及脆弱性指标知识库的构建研究。通过对关键影响因素如突发事件性质机理、演化过程的分析挖掘突发事件中蕴涵的显性知识;并通过对管理体制、应急机制的分析寻找应急管理中蕴涵的隐性知识,构建应急领域脆弱性知识结构模型和脆弱性指标评价体系,让计算机能够表述并理解这些脆弱性知识,会非常有助于应急现状的解决。
2.1 应急环境脆弱性感知
针对应急领域脆弱性分析,陈兴,姜艳萍,唐承沛等分别从决策模型、动态决策方案以及系统体系层面做了论述,阐述了脆弱性是指承灾体对破坏和伤害的敏感性,是应急管理里的重要影响因素[9-11]。同时,国外也对应急领域脆弱性做着积极研究,如:澳大利亚紧急事务管理部(Emergency Management Australia)定义脆弱性为系统应对人群、环境等各类危险的易感染性和恢复力;美国国家农村水协会(National Rural Water Association)定义脆弱性分析为:应对影响服务能力的威胁,系统安全薄弱环节的确定。美国国家海洋与气象部(National Oceanic and Administration)定义脆弱性为:资源对于来自于负面危害事件的易感染性。美国Sandia国家实验室(Sandia National Laboratories)定义脆弱性为:可攻击的设施安全薄弱环节。Gheorghe和Vamanu定义脆弱性为:集体或系统应对危害环境的易感染性、恢复力和存活性。Timmerman认为,脆弱性是一种度,即系统在灾害事件发生时产生不利响应的程度。系统不利响应的质和量受控于系统的弹性,该弹性标志着系统承受灾害事件并从中恢复的能力。Eichner[12]研究了脆弱性的动态变化和波动,指出动态脆弱性研究新的方向。目前,如何让计算机能够表述并理解这些脆弱性知识,从而让计算机辅助生成初步的突发事件处置方案是应急管理研究的一个热点。基于知识库,国外学者William R.Swartout、David Wilkins指出应急管理的知识有领域事实、领域本体、问题求解知识三类。国外一些机构如Co AKTing受英国e.Science网格研究计划资助,集成和采用AKT项目中关于知识汇聚的概念和技术,使目前英国的网格研究向语义网格研究过渡和发展。Austin Tate教授等开发了多agent协作系统,用于辅助应急响应中不同场所人员的协作,以提高应急响应的效率。这些研究定义了有关方案(Plan)与行为(Activity)的本体,成功地将AI规划与行为管理技术运用于应急响应。
应急领域的脆弱性和应急事件本身的演化过程和应急救援恢复有密切动态的联系。例如当供应链受到应急事件冲击时,其脆弱性会随着时间演化逐步增加,直到运营体系崩溃;而应急事件恢复过程中,由于供应链能力有了部分修复,其脆弱性较之前会降低。影响这种动态变化的内在原因是脆弱性形成的指标及指标关联知识。目前,大多数应急领域的脆弱性研究是从系统风险上思考问题,从知识层面的研究还较少,针对供应链所面临的脆弱性风险的研究大多采用与企业运营风险几乎相同的方法,从时间、空间和成本三个维度对脆弱性的危害程度建立测量指标体系,在提取特征时没有把脆弱性和其他运营要素区别对待,在发生应急事件时生成的汇聚指标不鲁棒,而且没有考虑到供应链网络信息空间数据本身的不对称、分布性等特性,因此使整体辅助决策系统的性能和效率降低。由于牛鞭效应等影响,使得这一问题在多级供应链网络环境下变得更严重。因此,如何针对供应链所面临的问题,研究适合应急环境下供应链脆弱性指标提取和鲁棒高效的处理方法,是我们的突破口。下图即为脆弱性感知框架,该框架构建在对供应链应急情景中多层次异构多维脆弱性数据的基础上,从感知的层次上由低向高划分为指标提取、特征评估、态势汇聚三个部分。
图1 应急环境脆弱性感知体系
其基本原理如下:
(1)首先对应急环境中脆弱性数据利用现有技术进行采集,得到脆弱性相关的突发事件性质和应急管理层面数据,作为后面处理的对象;其中突发事件性质数据将包括破坏范围,持续时间等,应急管理层面数据将包括供应链信息,资产价值信息,供应链受到冲击后的恢复时间,成本因素等,企业应急预案数据也纳入到这一部分;对于涉及外部环境影响数据可以通过应急响应的人、物、管理等几个维度获得,外部环境包括供应链运营环境、政策环境、制度环境等;脆弱性因子数据主要涉及到资产、服务对业务节点的影响,可参考应急预案获得;
(2)对于每个层面的脆弱性信息,结合应急事件发展过程,观察脆弱性数据变化情况,引入演化时间轴,提取时空关联特征,得到多层面的局部时空对象的特征表述;
(3)然后对这些特征信息进行评估筛选,摒弃权重弱化的特征,保留抗数据污染强的鲁棒特征。在特征评估筛选过程中,对特征样本进行预设定的攻击,得到特征集和应急环境风险反馈数据集,一并作为后面层级时序记忆(HTM)方法的样本数据;
(4)利用基于HTM的鲁棒态势汇聚方法,确定HTM网络的分层结构,将样本数据转化为分层结构感知数据,并训练它。结合应急领域多层面脆弱性特征表达的互补优势,利用基于半监督学习的HTM鲁棒态势汇聚器,完成样本数据在空间阶段和时间阶段的学习,同时得到HTM量化中心数据描述集,存储到脆弱性态势知识库并构建推理索引;
(5)对于态势感知结果,根据指定时间节点或一段时间段进行基于时空检验矩阵运算,对错误的系统脆弱性虚警匹配删除,精练后的结果将被可视化展现;
(6)同时态势感知的时空检验矩阵参数可作为学习训练各级信息处理层的负反馈输入,一方面保证态势感知体系在受到突发事件重创时能自行修复,恢复态势数据的上行通畅,增加系统整体鲁棒性,另一方面,给HTM网络提供更多的学习数据,使HTM量化中心数据集更加贴近实际[13]。
该体系有以下特点:①对于数据信息的处理可以在线也可以离线,虽然在特征提取时会涉及到一些计算量较大的操作,但兼容离线方式,使得系统响应并不受学习影响;②数据在感知层次上逐级提炼,在保留脆弱因素特征同时并不形成数据的爆炸,极适应不断增长的大规模数据集的需求。③在数据信息、特征信息、态势信息、特征筛选、可视化处理等方面,都强调数据的时空关系,有助于形成脆弱性态势推演,理解应急事件风险演化,有别于已有的脆弱性感知框架。
从区域地质构造环境分析,此区具有类似大型矿集区产布的成矿地质环境、各种成矿因素耦合关系显著性和矿种多、类型复杂等特征,有较大的矿产资源潜力,有望找到规模大的金、铜矿床。
该框架涉及到的关键技术有:基于层级时序记忆(HTM)的脆弱性指标汇聚、脆弱性指标知识库构建等,下面对这些技术和方法进一步说明。
2.2 基于层级时序记忆(HTM)的脆弱性态势指标汇聚
HTM(Hierarchical Temporal Memory)是一项对大脑新皮层进行建模的技术[14]。大脑新皮层占了大约75%的人脑的容量,负责所有高层次的理解,包括视觉、听觉、语言、触觉等。因为HTM是从生物学中得到的,所以它适合那些对于人类非常容易而对计算机非常困难的工作,例如物体的识别、做出预测、理解语言、在复杂的数据中发现模式等。HTM是一个记忆系统,随着时间变化,它通过给它的感知数据来学习它的世界,并从数据中抽象出高层的概念。抽象允许HTM网络来进行一般化,并对于传统计算机编程处理的严格规则提供灵活性和提高效率。例如,在不完整或是模糊不清的数据呈现中,模式能够被学习并可以被识别出来并储存。通过组合模式的学习、记忆以及当前的输入,HTM网络能够预测下一步可能发生什么。
HTM网络的设计首先确定了分层结构的大小与架构,其次为分层结构提供感知数据并训练它。感知数据来自应急响应场景中的历史数据。重要的是在分层中,有许多数据用来训练,而且数据是具有时间这一基本元素。在应急环境脆弱性动态分析中,为了进行有效的学习,都需要通过感知数据在一段时间流逝中来观察一组模式的学习过程和学习质量。
图2 基于层级时序记忆(HTM)的脆弱性态势感知指标汇聚网络结构
对于一个脆弱性信息处理节点,不管它在HTM分层结构中的位置如何,它的输入都是一组模式构成的时间序列。如:归一化处理后:报警系统为3,应急物资为1,应急分工及指挥为1,空间矩阵化为[3,1,1],图示为:,在下图中标识为(a)的第一层节点,它的输入对应着一个“拐角形”特征描述,如果空间矩阵向右移动一帧,也就是在下一个时刻,它的输入对应的是一个变化的“拐角形”。这些输入对于这个节点来说,就是一组由模式数据构成的时间序列。
这个结构由3层构成,数据的输入在最低层,节点在每个网格里表示,顶层节点用来实现最终的脆弱性态势汇聚。中间分层节点数指数级扩展,可以有效实现大规模脆弱性信息流的态势汇聚。图中输入的特征矩阵大小为3×3大小,每4个下层特征描述区域与上层一个节点对应,如对于第1层的a和b节点,下层被标记为A和B的特征区域和之对应,同样的道理,第2层的c和d节点与最下层的C和D特征区域对应。
不同脆弱性信息描述在经过这个节点的可接受区域时观察得到的一些模式。这个节点的目的是把这些模式进行分组,那些属于同一事物变体的模式属于同一组。变体的来源之一就是脆弱性特征与脆弱性观测标准的相对偏离,另外一个就是随机噪声。如果加入的节点能够将对应于同一个源的变体模式分在同一组,那么这个组就是这个变体的恒定体。就被认为是同一个脆弱特征的汇聚。一旦形成分组,节点就可以产生输出。
2.3 脆弱性指标知识库构建
对于左侧基于应急情景风险和案例的研究[15-16],领域内也是一个热点,涉及范围也比较大,本文不会重点深入,我们重点探讨右侧在应急管理领域的知识聚融,包括如何给动态评估提供科学的决策推理数据,以及推理机设计等。
应急领域信息环境复杂,容易发生中断和信息缺失。针对这种需求,我们需要设计一个结构灵活,易于扩充和能够动态控制推理策略的推理机系统。
不同于传统的设计,它不是预先将各个属性的规则库以某种格式(如一阶逻辑格式)存入知识库中,而是在需要支持这个属性的时候将该属性的推理机注册到推理协控中心。如对于应急情景下事件的特征属性,按照传统专家系统的习惯,首先要将规则转换为内部格式,然后导入知识库,而在本系统中,这些规则被封装在推理机内部,该推理机对目标知识库施加特征属性蕴涵的语义操作。
推理机系统设计如图所示:
图3 应急响应策略和应急领域脆弱性指标知识库设计
图4 结构灵活,易于扩充和能够动态控制推理策略的推理机
系统分为三个层次,包括下层推理机引擎,中间层的各个规则解析器,最上层的外部知识库接口,比如是某一描述应急情景的逻辑语言知识库。这样的结构设计简化了系统的开发难度,提高了模块化程度。系统通过规则解析把脆弱性感知知识转化为内部格式(使用XML技术来异构表征映射)[17],然后内部格式的信息通过各种推理机进行处理,这些处理可以是插入、查询或者是一致性检查。
我们设计关键决策点脆弱性特征属性都对应一个独立的推理机,这样,当这个推理系统要针对某一个具体的应急情景进行推理工作的时候,它只要把该类型异常事件涉及语义推理工作的关键词属性对应的推理机注册到动态推理机即可。同时,在推理过程中,如果要动态控制推理工作中是否考虑某个特定的规则(比如传递性),通过在动态推理机部分添加或者删除这个推理机即能实现。
同时设计动态推理机部分中的每个推理机接口满足系统平台内部知识库表示格式,在推理机内部可以使用自己的内部独立的知识表示形式来表示知识和进行推理,虽然这会增加额外的开销,同时需要推理机在返回结果的时候把答案表示格式转换为系统内部统一的格式,但它提供了极强的推理能力扩充的性能。
对于推理算法设计,首先要完成鲁棒特征筛选,形成有效的脆弱性特征感知数据源。当量化中心处理过程完成后,推理机切换会到推理模式。在这个模式下,推理机能够针对每个新的输入来产生输出。使用n来表示量化中心的个数,C1,C2…Cn表示每个量化中心,输出则是一个长度为n的向量,比如[x1,x2,x3,…xn]。比如来一个输入模式,如果它与哪个量化中心相似,其在对应的位就为1,其它位为0。比如输入模式与C3最相似,则输出时[0,0,1,0,…0]。但实际上,这个输出的向量不是非0即1的表示,而是在量化中心的空间上的一个概率分布,说明输入模式与对应的量化中心的一个匹配程度。计算步骤如下:
(1)计算输入的模式和已存在的每个量化中心的欧几里得(Euclidean)距离D,用Di来表示与第i个量化中心的距离。Di越大,说明匹配程度就越小;
(2)一个输入模式属于量化中心i的概率正比于符合规则知识表达公式的值,这里面就用到了上一步的Di,这个是假设下成立。假设是一个输入模式属于(或是说匹配)每个量化中心的概率符合欧几里得的高斯函数分布;
(3)这样,就向上一层的(应急情景特征接口)提供了输出,为一个向量,其分量的值是上面提到的输入模式与每个量化中心匹配的概率值,方便快速找出与相应应急情景最优匹配的输入模式。
推理机引擎完成了脆弱性信息感知到动态评估决策的联动,最终形成应急领域的脆弱性指标知识库。结合前面基于层级时序记忆(HTM)的脆弱性汇聚算法,这种体系可以完成从应急环境脆弱性分析到支撑应急响应决策知识库整体信息聚融过程,尤其针对大规模动态数据,可以从多个层面(多维)综合分析。
大型运作系统核心能力受损后的应急期间,脆弱性指标呈现多维异构而且动态变化。本文提出基于知识库构建应急领域脆弱性指标体系的基本思想,通过层级时序记忆方法的引入来解决应急脆弱性指标知识挖掘问题,建立了可动态推理的推理机引擎,给出了推理算法设计原理。
在脆弱性指标汇聚算法中引入层级时序记忆方法,可拓展脆弱性指标分析到多维,可完成突发事件中蕴涵的显性知识(其性质机理蕴涵事实知识,演化过程蕴涵原理知识)与应急管理中蕴涵的隐性知识(管理体制蕴涵人力知识,应急机制蕴涵技能知识)的综合分析,并将结果输出到动态推理机引擎。这种基于知识的匹配,利于计算机表述和理解应急环境脆弱性,是提高决策预案在查准率和查全率上的保证,对应急管理体系有更好的支撑。
[1]于辉,陈剑,于刚.协调供应链如何应对突发事件[J].系统工程理论与实践,2005,(07):9-16.
[2]Kannan K,Telang R.Market for software vulnerabilities?Think again[J].Management Science,2005,51:726-740.
[3]Benth F E,Dahl G,Mannino C.Computing optimal recovery policies for financial markets[J].Operations Research,2012,60:1373-1388.
[4]张灵,陈晓宏,王兆礼.防洪系统脆弱性的模糊极大熵诊断[J].系统工程理论与实践,2011,31(8):1600-1607.
[5]文凤华,张阿兰,戴志锋,等.房地产价格波动与金融脆弱性:——基于中国的实证研究[J].中国管理科学,2012,20(2):1-10.
[6]王守全.基于复合极值理论与故障树技术的脆弱性分析[D].上海:上海交通大学,2010.
[7]于辉,陈剑.突发事件下何时启动应急预案[J].系统工程理论与实践,2007,(08):27-32.
[8]Chopra S,Sodhi M S.Managing risk to avoid supplychain breakdown[J].MIT Sloan Management Review,2004,46(1):53-61.
[9]陈兴,王勇,吴凌云,等.多阶段多目标多部门应急决策模型[J].系统工程理论与实践,2010,20(11):1977-1985.
[10]姜艳萍,樊治平,苏明明.应急决策方案的动态调整方法研究[J].中国管理科学,2011,19(5):104-108.
[11]唐承沛.中小城市突发公共事件应急管理体系与方法[D].上海:同济大学,2007.
[12]Eichner T.Mean variance vulnerability[J].Management Science,2008,54:586-593.
[13]Starzyk J A.Spatio-temporal memories for machine learning:A long-term memory organization[J].IEEE Transactions on Neural Networks,2009,20(5):768-780.
[14]Hawkins J.Why can′t a computer be more like a brain?[J].Spectrum,IEEE,2007,44(4):21-26.
[15]Carrillo J E,Gaimon C.Managing knowledge-based resource capabilities under uncertainty[J].Management Science,2004,50:1504-1518.
[16]Tomlin B.On the value of mitigation and contingency strategies for managing supply chain disruption risks[J].Management Science,2006,52(5):639-657.
[17]Rakes T R,Deane J K,Rees L P.IT security planning under uncertainty for high-impact events[J].Omega,2012,40(1):79-88.
Research on Disruption Area Vulnerability Index Infrastructure based on Knowledge base
XIAO Hai-dong1,2,CHEN Ning3
(1.Shanghai Advanced Research Institute,Chinese Academy of Science,Shanghai 201210,China;2.Sino-Us Globe Logistics Institute,Shanghai Jiaotong University,Shanghai 200030,China;3.School of Information Science and Engineering East China University of Science and Technology,Shanghai 200237,China)
In this paper,vulnerability index infrastructure of disruption area is constructed based on knowledge base theory,to solve the problem that vulnerability of disruption is difficult to be described or understood by computer.Firstly,vulnerability index infrastructure is analyzed based on knowledge base,and vulnerability perception structure is constructed under disruption environment,multiple dimensions vulnerability data source are from multiple levels of supply chain in scene of disruption scenarios,the whole construction processing cover 3 parts:index extraction,features evaluation and situational awareness. Then,vulnerability index knowledge is mined with HTM(Hierarchical Temporal memory)method,which contributes to simplify index description with vulnerability situational awareness.Finally,inference machine design and inference algorithm are given to construct the knowledge base.The research shows that there is close relationship between evolution of disruption events and changes of disruption area vulnerability index infrastructure,with this vulnerability index infrastructure,explicit knowledge contained in disruption events and tacit knowledge contained in disruption management can be dynamically analyzed based on knowledge base.It contributes to manager's decision in recovering disruption with key factors accurately and dynamically,and reducing cost of disruption management,improve response efficiency.
knowledge base;vulnerability;HTM;disruption management
F272.3
A
1003-207(2014)07-0076-06
2012-02-10;
2012-12-30
上海市科学技术委员会资助课题(12ZR1415200);教育部人文社会科学研究项目青年基金资助项目(10YJCZH180);国家自然科学基金资助项目(60903186,70732003);上海市信息安全综合管理技术研究重点实验室开放课题(AGK2012008)
萧海东(1975-),男(汉族),甘肃临洮人,中科院上海高等研究院,博士,副研究员,研究方向:应急决策、复杂系统态势分析.