方叶祥+陈晓猛+刘碧云
摘 要:教学起点的公平在教学公平上具有显著意义,本科毕业设计教学力量的配置属于毕业设计的教学起
点。文章针对目前本科毕业设计环节师生双选无法公平这一现象,给出了基于本体的解决方案,方案以本体库为师生互选的媒介,将师生的意愿转化为知识之间的语义匹配问题,用人机交互代理引导学生表达真实的意愿,设计师生交互作业模型。这种基于个性化考虑的匹配本体知识库结构,能够实现师生公平双选。
关键词:教学公平;毕业设计;本体;公平配置
中图分类号:G640 文献标识码:A 文章编号:1002-4107(2014)01-0058-03
教学公平是指教学主体在教学态度、教学参与机会、教学资源配置、教学方法选用、教学评价等方面所采取的比较合理性行为。教学公平作为教育公平的要求与体现,是教学发展的必然要求,也是教学有效性的客观要求。它具有以下四种属性:(1)协同性;(2)差异性;(3)整体性;(4)共益性[1]。教育社会学家认为, 教学平等( 公平) 可以从三个层面加以考察: 即教育起点、教育过程和教育结果, 这三个层面既相互区别又相互联系。起点公平是教育公平权益的前提, 是宏观的和显性的[2]。过程的任何一个环节的不公平都会影响整体教学有效性。教育结果的评价合理性是教育公平的又一显性指标。因而,一个公平的教学方式应该在各个环节都予以公平性设计。
毕业设计(论文)是实现本科阶段培养目标的重要教学环节。毕业设计(论文)在培养学生探索真理、增强社会意识、训练科学素质、提高综合实践能力与素质等方面具有不可替代的作用,是教学与生产劳动和社会实践相结合的重要形式,对培养大学生的创新能力、实践能力和创业精神具有重要作用。师生双选是开展这项教学活动的第一步。由于学生之间的学习态度、学习成绩存在差异,同时教师本人的繁忙程度、教学态度和水平也存在差异,从而导致不同的师生组合对结果具有重大的影响,这个影响直接关系到对学生成绩评价和教师工作评价,因而,师生双方都愿意选择优秀的一方作为自己的组合。如果将师生看作知识创造的服务资源,那么,这个教学管理问题可以抽象为知识创造过程中服务资源配置的公平性研究。
为了实现双选的客观性,目前有很多做法:(1)教师匿名给出选题,学生选题。由于一人一题,题目有难有易,简单的题目可能很快被选掉,剩余的较难的题目可能对那些本来综合能力就不是很强的学生来说难度太大,后选的人没有实现自己的愿望。这个方法非常欠缺公平性。(2)也有的研究者采用随机筛选法[3],即将教师编号,学生随机抽签选择教师,之后再由教师确立课题,缺点是不确定性太大。学生抽到的教师可能与他所选的专业发展方向相关联度不大、学生与教师之间关系不是很融洽。(3)学生自由申报课题方向,学校为学生指定相关方向的教师。缺点是学生根据自己的兴趣及未来的工作或者学习方向来申报自己喜欢的又能掌握的课题,但对综合能力不是很强的学生来说,自己独立申报课题本身就是个难题,如果再在此基础上做毕业设计,很可能这些学生的毕业设计成绩会比较低。因而,寻找一个能兼顾师生意愿和公平的师生配置的方法是非常重要的,也是困难的。这也是本文需要解决的问题。
一、解决方案的特征分析
教学实践表明,本科生由于自身的知识水平所限,对自己大学四年下来的知识体系还未建立有机的联系,还不能够自己寻找一个科学问题展开研究(这是博士阶段的任务)。尤其是文科方面,由于问题的边界界定比较困难,学生更感到研究的茫然,对自己内心到底需要研究什么样科学问题是模糊的,所以,需要一个工具帮助学生明确自己的需求。此外,教师本人由于受过专业研究训练,明确地知道自己要研究的内容,迫切希望能够带到优秀学生,为了避免由于教师身份等知识外差异带来的干扰,要有一个工具能够屏蔽教师的个人信息而只保留教师的知识信息。
因而,一个理想的解决方案是在师生之间有一个真实传递彼此意愿并且能够自动找到彼此意愿的工具,这个工具具备这样的智能,这样工具本身的客观性可以提高师生满意度。
综上,解决方案中的工具应该具备如下特征:(1)须能够体现师生的真实意愿;(2)须能够帮助师生找到自己的真实意愿;(3)须具有客观性、智能性,便于计算机计算;(4)能够有效减少权力等因素对教学力量配置的影响。
二、基于领域本体匹配的公平资源配置模型
本体(Ontology)是哲学上的一个概念,是对客观存在的事物的一个系统解释或说明,关注客观事物的本质抽象和联系。后来,人们将本体的概念引入计算机的人工智能领域,Neches等将其定义为:“给出构成相关领域词汇的基本术语和关系,并对利用基本术语和关系构建的词汇的外延进行规则化定义。”[4]Studer认为本体是一个“共享概念模型的明确的形式化规范说明”[5],通过对某个领域内的概念以及概念之间的关系描述,提供一个共同认可的、明确和唯一的定义,便于人机之间交流、机器之间交流和推理。Fensel对这个定义进行分析后认为Ontology的概念包括四个主要方面:(1)概念化(conceptualization):客观世界的现象的抽象模型;(2)明确(explicit):概念及它们之间联系都被精确定义;(3)形式化(formal):精确的数学描述;(4)共享(share):本体中反映的知识是其使用者共同认可的。本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义。总的来说,构造本体可以实现某种程度的知识共享和重用,以及提高系统通信、互操作、可靠性的能力。
所以,本体为不同对象之间交流提供了媒介。
正是本体的明确化和唯一性以及媒介特征让我们可以充分地表达自己的意愿,并被准确地推理和传递。让我们联想到,若在师生之间建立一个基于知识的意思表达,则更能表达教学的本质(教学应该是知识的传递和创新),师生将自己的意愿通过结构化的知识表达,则更能体现心声,那么资源的配置就可以转化为结构化知识之间的匹配问题。因此,我们构建如下的资源配置模型,如图1所示。endprint
该模型的运作流程是:首先由专业教师组成本领域的专家,构建领域本体知识库,然后,学生阅读该库,同时,在自己的工作桌面有一个按照本体库的结构需求表单,学生填写,完毕提交给系统,由系统自己去匹配计算。教师群体在充分讨论协商后,确定本体库,给出本体库修改的开放接口,以便未来对本体库维护、更新。之后,教师个人提交自己的题目并给出按照本体库结构建立的知识结构向量,提交给系统,由系统匹配计算。
图1 兼顾公平的服务资源配置模型
三、本体及本体库结构设计
出于对各自问题域和具体工程的考虑,构造本体的过程各不相同。目前没有一个标准的本体的构造方法。不过在构造特定领域本体的过程中,有一点是得到大家公认的,那就是需要该领域专家的参与。最有影响的是Gruber(Toward Principles for the Design of Ontologies Used for Knowledge Sharing)在1995年提出的5条规则:(1)清晰(Clarity):本体必须有效地说明所定义术语的意思。定义应该是客观的,与背景独立的。(2)一致(Coherence):本体应该是一致的,也就是说,它应该支持与其定义相一致的推理。(3)可扩展性(Extendibility):本体应该为可预料到的任务提供概念基础。(4)编码偏好程度最小(Minimal encoding bias):概念的描述不应该依赖于某一种特殊的符号层的表示方法。(5)本体约定最小(Minimal ontological Commitment):本体约定应该最小,只要能够满足特定的知识共享需求即可。
本体的构建方法有很多种,常见的有:Tove、Methontology、骨架法、kactus法、IDEF、Sensus和七步法。本体库的特征应该是一个智能学习库,任何一个领域的概念可以在领域本体内找到,并有它与其他概念之间关系的网络图。
就本课题来说,本体的结构树可以按照专业领域、学科方向、应用、知识点这样四元组来构建, 如图2所示。本体库采用面向对象技术来开发,建立基于继承的类结构,用类的属性表达其特征以及它与其他概念(也是一个类)之间亲缘关系,用行为来表达其判断、推理、学习等行为。本体库功能包括:浏览、重构、自学习、用户意思翻译等。
四、人机交互的知识匹配结构及其算法设计
(一)人机交互的知识匹配结构
如果在工作时,无论学生还是教师的工作桌面就是一个人按照本体结构设计的人机交互代理的话,那么,知识之间的匹配比关键词搜索匹配还要简单。但是,现在的教育越来越强调个性化。因此,完全基于领域本体的人机交互还不能完全表达学生甚至教师的意愿,譬如交叉学科的选题就无法在领域本体内实现,即便教师设计了交叉学科,学生由于搜索不到而倾向于无交叉学科,因而,本体只是其核心,实际的交互应能适应更自然的表达。尤其是现代科学发展的一个基本特征是学科交叉,如何表达不同学科之间的联系是对领域本体的扩展。
就目前交叉学科的基本特征来看,学科交叉的特征是一个领域采用另外一个领域的思想或方法来解决本领域的问题,所以,“方法”应作为一个共有属性,包含到知识点中,这样就解决了不同学科之间的联系问题。
最后一个是兴趣的知识表达问题,学生对自己的兴趣通常是包含两个部分:本专业的和其他领域的或是一个现象。对于本专业学生可以进行知识的表达,对其他领域的或一个现象它所蕴涵的知识学生不能明确表达,因而,若要在学生工作桌面允许学生填写兴趣这样的匹配项,则系统应该能够帮助学生找到相关领域。这就要求系统支持对自然语言的语义识别。由于是毕业设计,所以,教师的出题不可能天马行空,就选题性质来说,无外乎理论性、应用性还有生产实践课题,即教师能够从事的科研活动决定选题的范围是有限的。
综上,我们设计如下的二进制匹配结构。
图3 支持人机交互的匹配结构设计
图3中学科编码为三位表达了可以涵盖8个学科,目前高校一般的学科包括:理、工、文、史、哲、医、农等几大学科,专业方向设置为8个方向,也够用了;32个大的知识点,如果一门课有8章的话,则一个专业方向可涵盖4门课,8个方向可以涵盖32门专业课,这已经超越一般本科的教学计划,已经足够适应各个高校了。选题性质就两类,即设计和论文,兴趣此处用以表达课题来源,即理论、应用、生产实践、卓越工程师计划、大学生创新训练计划等。此处采用三位编码可以表达8种情形,也够用了。
(二)算法设计
这样我们将师生的匹配转换为师生各自独立给出的结构相似度计算,利用本体来计算两个概念之间的相似度,其前提条件是:两个概念间具有一定的语义相关性,在概念结构树上存在相似的路径。Resnik 根据 2 个词的公共祖先节点的最大信息量来衡量 2 个词的语义相似度[6];Agirre 在利用 WordNe计算词语的相似度时,考虑了语义距离、概念层次树的深度和概念层次树的区域密度[7]。文献提出基于距离的语义相似度计算模型,这种模型简单直观,但它非常依赖预先建立好的本体层次网络[8]。
为了保证系统运行的健壮性,本文在上文建立的结构树基础上,采用如下算法:
R=w1*d1+w2*d2+w3*d3+w4*d4………………………(1)
式(1)中di(i=1,2,3,4)分别表示图3中各种编码与学生所填的距离,wi(i=1,2,3,4)分别表示各种编码的权重, ,其中,
最后,将所有匹配按照R值的大小排序,最大者显示给学生,由学生确定,完成匹配。
教学起点的公平在教学公平上具有显著意义,本科毕业设计教学力量的配置属于毕业设计教学起点。本文采用本体作为师生双选的媒介,将师生的意愿转化为知识之间的语义匹配问题,设计了师生交互作业模式,建立了本体的知识结构,给出了语义相似度算法,实现了师生的公平选择,有利于学生明确自己的意愿。通过对本体的扩展构成人机交互代理,更能实现个性化培养,最终实现公平、个性化教学管理任务。
参考文献:
[1]王升,张燕.教学公平重要性及实施策略[J].中国教育
学刊,2009,(5).
[2]杜德栎,张俊列.论教学公平性问题[J].教育理论与实
践,2007,(22).
[3]余桂兰,左敬龙.基于伪随机的高校毕业设计选题模式
研究[J].计算机教育,2102,(5).
[4]袁佳乐,韩利凯,黄兆华.基于邻域本体的元搜索引擎的
研究[J].价值工程,2011,(35).
[5]邓志鸿,唐世渭.Ontology研究综述[J].北京大学学
报:自然科学版,2002,(5).
[6]Resnik P.Using Information Content to Evaluate
Semantic Similarity[C]//Proc.of the 14th IJCAI.
Montereal,Canada:[s.n.],1995:448-453.
[7]Agirre E,Rigau G.A Proposal for Word Sense Dis-
ambiguation Using Conceptual Distance[C]//Proc.
of the 1st International Conference on Recent
Advances in NLP.Tzigov Chark,Bulgaria,[s.n.],
1995:1-7.
[8]Leacock C,Chodorow M.Combining Local Context
and Word Net Similarity for Word Sense Identi-
fication[J].Computational Linguistics,1998,(1).endprint