煤炭科学研究总院 孙 瑜
科技经费管理决策支持系统本质上属于决策支持系统(DSS)的分支,其处理对象是科技经费投入和产出的分析。从科技经费管理决策支持系统的构成和设计依据来看,处理知识规则和逻辑判断,涉及到的环节较多,需要对经费使用的细节、目的性、使用效率等进行评估。对于一个通常意义下的科技经费管理决策支持系统而言,一般都包含了表示层、逻辑层和数据知识层三个基本的结构。其中逻辑层需要处理的内容最多,包括模型库、数据发掘和知识库管理等较为复杂的内容。本文就将对逻辑层的内容展开分析,主要分析在数据处理中较为关键的知识表示方法,这类数据属于定性分析(非定量)的内容,而处理方式对决策影响较大,因此有深入研究的必要。
在决策支持系统中,有大量的定量数据,可以直观的给出某项指标的水平,也需要处理一些难以用定量数据来描述的内容。而这些定量和非定量的内容都可以用一种通用的概念——知识来表述,即可进一步的将知识定义为针对一个或一类问题或领域,通过对客观数据的分析和处理所抽象出来的规则集合,或是以特定结构和逻辑组织起来的数据集合。在明确了知识的基础上,便可进一步通过知识工程学的有关理论来进一步研究知识的表示方法,这是在处理决策支持系统时的重要基础。
知识表示方法主要有四类,产生式规则表示法、语义网络表示法、框架表示法和面向对象表示法[2]。本文以科技经费管理决策系统作为研究对象,由于该系统中所包含的内容具有对象类型多样的特点,其中包含较多定性指标,通常的系统设计逻辑不容易处理好这类问题。本文以此为背景,研究以面向对象的表示方法来作为科技经费管理决策支持系统的知识描述方法。
面向对象的知识表示方法所依据的林论基础为面向对象技术(OOKR),面向对象的知识表示是将多种单一的知识表示方法按照面向对象的设计原则组合到一起而形成的混合知识表示形式。面向对象的知识表示方法可以处理结构性知识、过程性知识和面向对象的推理三类较为复杂的知识表示。因此这一知识表示方法能够以较为接近人的认识方式来描述不同的数据,而且能够整合已有的表示方法,在不同的数据之间的融合方面具有明显的优势,加之可以利用对象之间的逻辑推理和协作,对较为复杂的问题能够进行有效的分解求解。
科技经费管理决策支持系统需要处理和科研经费的使用和决策相关的信息。从知识表达的角度看,不同类型的信息都可以归为某种知识。在科技经费管理决策支持系统的设计中,需要处理以下三类主要的信息(知识):(1)科技项目相关信息。这是科技经费管理系统区别于其他类型的决策支持系统重要特征,这些特征性项目信息对于决策具有重要的参考价值。在这些和科技项目有关的信息中,包括科技项目的申报单位、科技项目所要研究的主要内容,以及通过项目的研究可能取得的成果和社会经济效益、项目研究中各个阶段和环节的经费计划使用情况等。对于这些和科技项目有关的信息形式多样,既有定量内容,也有文字描述的定性内容,因此是较为繁琐也较难表述的部分。(2)规则信息。这类信息主要用于描述科技项目的政治、法律法规等外部环境,如对于某些特定的科技项目是否有国家有关政策的支持和扶住、是否有专项资金支持等,通常在进行系统设计时都将这类外部信息作为规则信息处理,归为规则性知识。这类信息多数为逻辑型和定性描述的内容,不便量化,因此采用面向对象的逻辑推理方式进行描述较为方便。(3)评价模型。作为决策支持系统不可缺少的部分,评价模型在科技经费管理决策支持系统中非常重要,评价模型针对在科技项目不同阶段的特点,分别制定相应的评价模型来完成分析和决策,例如在科技项目的申请和审批阶段,就需要利用相应的模型来对科技项目的申请人具备的科研能力以及可能取得的研究成果、申请人所提出的经费合理性做出评价,从而供决策者利用评价结果来做出判断。
对于系统设计者来说,对于某个申报的科技项目的了解,主要来自于项目申报书,且申报书的内容又大多以文字描述,因此对这些文字性的内容进行抽象和分类,提取和项目的有关的管理和决策信息就显得很关键。需要从项目申报书中提取的内容主要包括项目基本信息、项目负责人及项目组情况、项目承办单位情况、关于项目本身研究内容与进度的信息、项目经费预算。这五类信息中,前四类都属于定性描述的内容,最后一项属于定量描述的内容。
对于定性内容,在程序设计时可采用建立不同的类(class)来进行处理,对于上述五类信息,可分别建立起项目类(记录项目的名称、编号等信息)、参与人员类(记录参与人员姓名、职称等)、负责人类(记录项目负责人信息,如负责人所在单位、职称、联系方式等)、承办单位类(记录单位名称)、地址类(记录有关联系人的通讯地址、工作地址等)、账户类(记录和项目有关的资金支付账户)。
科技经费管理决策支持系统的重要功能之一就是评估项目的经费预算的合理性,进而做出决策。在这个评估过程中的一个很重要的参考因素就是类似项目的预算情况。通过对比类似项目的经费使用情况,能够对申请项目的经费使用预算做出有益的参考。但两个项目之间的相似性程度是一个模糊概念,跟决策者的经验有关,因此难于采用定量分析的手段。为了解决这个问题,本文尝试采用面向对象的推理方式来做出决策。采用这种方式的步骤如下:
(1)选取匹配指标。这一步是为选定申请项目的控制性指标,作为在数据库中搜索类似项目的标志,如果找到了类似的项目,则调出该项目的决策信息。如果项目比较特殊,没有找到可参考的对象,则返回空值。(2)如果找到了参考项目,则分析和比较本项目和参考项目之间的指标,对项目预算进行评估和建议。在上述两个步骤中,关键是选择合适的指标,在评价项目之间的相似性时,需要利用一定的相似评判方法。通常情况下,计算两个数据之间的相似性需要借助于相似性理论,通过计算相似度来辅助决策。但这一方法还需要对不同相似评价指标之间的权重,要合理的拟定这些权重很困难。因此为了便于分析比较,采用以下方法来比较项目之间的相似性:选取项目类型特征指标,按如下优先级进行排序,项目的关键字、所用技术、应用领域、所属领域、经费数量等因素,通过对数据库中已有项目的遍历对比,来寻找与目标项目接近的项目,当存在某因素交集时记为1,无交集记为0,并做出累加,最后选取总得分最高的项目作为最佳参考项目。在找到接近项目后,调用对比项目的经费使用情况来判断。从理论上讲,应着重研究项目相似度的计算理论,通过对项目间进行全面的相似度分析,可以作为后续课题展开研究。
[1]徐伟,王儒敬,杨化峰.基于RuleML的多级知识单元知识表示方法[J].计算机工程与应用,2005,1.
[2]贺玲,吴玲达,鲁汉榕.一种可用于基于内容智能检索的知识表示方式[J].计算机工程与应用,2000,35(1):1-4.
[3]林仙,刘惟一.基于上下文的知识表示与推理——人工智能的观点[J].计算机科学,2010.