(郑州中学 454170)
摘要:现在国际上数学的发展十分的先进,但还在相似算法方面的研究内容还比较的稀缺,目前已经有学者提出来了相似算法的广义的定义。这种定义是以案例推理为基础建立的,本文主要介绍的就是案例推理的内涵以及案例推理中相似度算法的使用情况及在该领域内相似度算法的发展情况。
关键词:相似度算法;案例推理;发展状况;
一、相似运算的含义
案例推理的运算系统是通过依赖以往的解决问题的方法经验来应对现在面临的问题。当我们遇到一个新的问题的时候,系统会通过搜索以往处理过的问题并进行相似度的匹配,直到找出相似度最高的那个问题,通过借鉴那个问题的解决方法来处理当前问题。所以相似度对于案例推理运算而言有着重要的意义,除此之外,还有许多领域的发展运用都需要运用到相似的技术。
二、如何对相似度进行评估
案例推理的相关工作者通过和心理学的知识认知方面的内容进行结合,在对相似度进行评估的方面形成了一种共同的认识,也就识对相似度进行评估需要依赖输入的案例和历史数据库,或者在检索的过程中能够保障自动化程度较高,使得输入的案例可以与大量的历史数据进行快速的比对。可是由于一些内容之间的联系比较的抽象,对比推理起来难度较大,那么对于案例推理系统的联想能力要求就更高了。
三、相似度算法的概念
许多人对于相似度算法以及检索方法之间的联系和区别认识有误。相似算法与表现链接更为紧密,检索更趋向于计算,两者之间的本质有所区别,但都是包含在相似算法之内的。在这篇文章中,相似度算法就是代表了两者的总称,由于两者间差别不大,在学术界一般也将两者混在一起述说。
四、案例推理中的相似度算法
在案例推理系统中,相似度算法不仅仅应用于某个方面,而是贯穿整个系统。也就是说相似度算法在案例推理的很多方面均有所使用。
(1)案例推理系统和相似度算法的关系
相似度算法的基础条件之一就是案例,在进行相似度计算的过程中,需要大量的案例来进行比对,面对不同类型的案例,需要采取不一样的计算方法。
案例根据表示复杂程度的不同可以划分成为两个类别,即结构化和简单的表示。早进行案例推理计算的时候,系统会默认案例都是一种类别的,但是随着该领域的逐步发展,这种计算方法咋一些较为复杂的情况下就不适用了,为了解决所面临的的问题,就有人提出了新的相似度算法,这种新算法的出现也给整个案例推理系统带来了巨大的影响。
(2)案例的分类和相似度算法间的关系
为了保障检索的高效性,在计算的时候需要对案例进行分类。在进行相似度计算的时候,会根据案例的不同特点把它们进行分类,形成一个个的类别或者簇,当我们输入想要研究的问题时,系统就会根据输入的案例进行检索找到它所属于的类别,之后再在这个类别中去进行仔细的查找。使用这样的计算方法,前提就是要对案例进行分类,所以可以说案例分类是相似度算法的基础。
五、案例推理系统中相似度算法的应用情况
随着近几年来学术界对案例推理系统的不断完善,在进行相似度运算的时候越来越快速灵活。系统会根据输入案例的特征对安利进行自动的划分,并根据案例的种类选取相适应的算法来进行运算。主要的研究成果有一下几个方面。
第一,最邻近算法。这种算法是整个案例推理系统中最常见也是最简单的计算方法,它乐意通过加权运算将案例的全部属性进行加权、综合处理,到最后根据加权的得分找到案例所归属的类别,并对数据库中的案例与之相似程度进行排序,最终找到最最贴近的案例作为例子,根据找到的案例的解决方法来解决当前输入的问题。
第二,进行多维的检索。一些结构型的案例可以很清楚额表现出其属性和相关的内容,但是还有很多的表示型的案例不能被直接观察到,它具有的属性以各种各样的方式组合在一起。这时候就需要对案例进行多维的检索,形成多维的空间再在其中找寻临近的点。目前的多维检索主要是指降低维度的索引方法和空间的索引方法。
第三,以归纳方法为基础的相似度算法。在商业范畴内,有许多的案例推理系统都运用到了归纳的方法,通过对原来的检索进行汇总归纳,制造出决策的流程,通过原来处理案例的经验来对新的案例进行识别处理,自动的将案例根据属性的不同划分成簇,最后使得每个簇中的案例都有许多的相似之处,这就是归纳,对案例的归纳。这种以归纳作为运算基础的算法比较适合于语义方面,面对一些描述不够完整的案例,运用这种计算方法能够很快又准确的进行。不过这种算法需要很高的知识和工程成本,而且这种算法必须借助互联网进行运算传播。
第四,以模糊逻辑为基础的算法。有时候输入案例和我们储存的案例差异程度较大,这个时候就需要采取模糊逻辑来对案例进行处理。案例推理系统一般是通过讲案例的结构和属性进行转化,转化成模糊的逻辑或者模糊的逻辑术语,从而使得匹配的过程得以简化,同时也便于对案例的分类。运用这种算法还可以将多个案例结合在一起建成一个索引,这种方法运用起来十分灵活,在天气预报方面的使用十分广泛。
第五,以神经网络为基础的算法。以神经网络作为基础的相似度算法又可以根据连接结构分为以原型为基础的神经网络和以专家经验为基础的子网络。以原型为基础的神经网络将案例库分为了三层,第一层是输入,输入的案例的每个属性作为一个神经元来储存,第二层则是代表了神经元的原型,原型之中包含了案例的特征,第三层是输出,输出的内容作为一个类别。除了整个输入输出的过程,整个系统还有储存的空间来安放那些无法被识别和分类的内容。专家经验的子网络及时通过对每个输入层内容的属性进行相似度进行分析,最终和历史信息比对,一层一层的找出相似度最高的案例。
总结:
案例推理系统是以相似度算法作为核心的一种研究方式,随着近几年来相关专业的不断发展,人们对此耳朵重视程度也越来越高,相关专业的衍生技术也越来越多,案例推理系统也发展的越来越完善,可是相比较于其他专业的发展,相似度算法方面的研究还是过于浅显,笔者认为在该方面还有很大的研究和发展空间。加强对相似度算法的研究,有助于推进案例推理系统的发展,同时也有助于拓宽专业的研究范围,推进我国相关产业和技术的发展。希望相关方面的专家学者可以在现有的理论基础上进一步对相似度算法进行研究,以挖掘其深层次的作用和意义。
参考文献:
[1] Gentner D. Structure-mapping: A theoretical framework for analogy[J].Cognitive Science, 1983, 7 (2 ): 155一170.
[2] Gick M.,Holyoak K J. Analogical problem solving[J].Cognitive psychology,1980, 12:306-355.
[3]Tversky A. Feature of Similarity) JI .Psychological Review, 1977, 84 (4 ) : 327一352.
[4] Vosniadou S, Ortoxry A. Similarity and Analogical Reason-ingl MI·New York:Cambridge University Press, 1989.
[5] Bunke H, Messmer S T. Similarity measures for structuredrepresentation) CI //Proceedings First European Workshop on Case-Based Reasoning.}S. 1. I:}s. n. I,1993: 26一31.
作者簡介:王西妍,(2000.9.7-),女,汉族,河南省焦作市人,学生,郑州中学。endprint