孙新宇,耿传辉
教育研究需要拓展研究的方法和思路,研究方法的多样化有助于教育研究的繁荣。在教育研究领域,思辨性的定性研究一直占据主流地位,很多学者倡导在教育研究领域引入多学科的研究视角、多学科的研究方法。美国著名教育研究专家伯顿克拉克在其著作《高等教育新论——多学科的研究》中,从历史、经济、社会等八个不同研究角度研究和分析了高等教育,探索了不同视角、不同方法的高等教育研究。我国著名教育专家潘懋元教授编写的《多学科观点的高等教育研究》中,倡导多学科交叉研究,从历史学、哲学、心理学、文化学、科学学、经济学等视角对高等教育进行分析,拓宽了高等教育研究的路径和方法。近年来,随着教育科学的发展,各个领域的研究方法和视角被引入到教育研究领域当中,定量研究逐渐受到重视。定性研究和定量研究并行,丰富了教育研究的理论和方法。在大数据背景下,相关软件因其操作的简便性和处理数据的快捷性,逐渐被引入到教育研究领域当中。新工具新方法的出现,总会受到具有敏锐学术触觉的研究者青睐,知识图谱就是其中的一种。正如郭文斌所言,在教育学领域使用知识图谱,能够以图谱的形式展现教育领域的知识及其联系,判定教育领域的研究前沿及历史演进路径,为后续科研选题和研究走向提供合理性的意见和建议。[1]
知识图谱在各个学科应用已经有很长时间,有学者对知识图谱在国内的传播应用进行了总结和分析。肖明等运用citespace软件对citespace的应用情况进行了分析,包括研究前沿、知识基础、存在的问题等。[2]胡泽文等比较分析了各知识图谱绘制工具的功能、方法流程及优缺点,梳理了知识图谱在情报学中的应用情况。另外,对知识图谱在其他学科的应用情况也进行了介绍。[3]杨思洛对知识图谱的应用情况进行了整体分析,总结了国外学者知识图谱的应用情况,包括预测学科前沿、揭示学科关系、探究学科历史、促进科研管理、明晰学科结构、描述科研合作、分析研究内容、进行科学评价、用于学科分类、检索知识信息等方面。[4]孙雨生等人对我国知识图谱的研究情况进行了元分析,重点分析了知识图谱原理、研究内容、方法、数据来源及分析工具等几个方面。[5]颜鑫等分析了知识图谱的研究情况,采用文献计量法分析了知识图谱研究的核心作者、主要研究机构、高频关键词等。[6]
因为知识图谱软件属于科学计量学和图书情报学的范畴,所以对该软件和方法的总结分析多来自这两个领域,对于教育领域中知识图谱的应用情况总结分析较少。教育研究领域引进知识图谱较早,至今已有十多年时间,对知识图谱的应用情况进行一个回顾总结,对于更好地使用该方法和软件,规范相关研究,引进相关方法和软件,创新研究思路等很有必要。本研究以运用知识图谱的教育研究成果为分析对象,进行回顾和分析,以总结其发展脉络,找出存在的问题,基于此展开相关思考并提出有关建议。
为了清晰地展示知识图谱的应用情况,本研究以主题词“知识图谱”在中国知网(CNKI)数据库进行检索,按照一定标准筛选,共获得教育领域学术论文、学位论文798篇,以此作为数据源进行分析。通过相关软件的阈值设置,得出教育研究中知识图谱应用主题词图谱(图1)。
从图1可以看出,图的下方为知识图谱的分析方法、软件工具等;中间位置为知识图谱的分析主体,即各类教育研究对象;图的上方为运用知识图谱得出的教育研究结果,即教育研究对象的研究现状、热点、前沿、趋势等。从图中呈现的节点来看,教育研究的对象,既包含宏观的创业教育、职业教育、高等教育、基础教育、民族教育等大的教育领域,也包括中观的创业型大学、高校、一流学科等方面的研究,还有包含教师专业发展、翻转课堂、核心素养、创业教育、教学质量与评价、相关教育专业、教育技术等方面的微观研究。
图1 教育研究中知识图谱应用主题词
1.描述研究热点、探测学术前沿
学术文章是学术研究成果的重要载体,关键词是文章主旨内容的凝练和升华,能够很大程度上反映文章的内容。学者们经常通过学术文章关键词出现频次来探测某一时期的研究热点,关键词频次越高说明热点率越高。关键词的突变情况能够反映某一时期的重要变化,有学者们认为通过关键词的突变率来确定研究的前沿,突变情况越大说明属于研究前沿的可能性越大。运用知识图谱软件进行关键词的共词分析,能够获得关键词的共词图谱,获取关键节点和关键词的突变情况,进而对一个时期内的有关教育研究的热点问题和前沿状态作出描述。
2.分析发展演进趋势
对某一领域或者某一学科一段时间内的成果进行分析,能够厘清其发展的脉络和演变的趋势。通常这些研究成果的积累需要一定的时间跨度,普遍认为五到十年为一个时间段,分析近十年或者某一特定时间段的研究较多。基本分析方法是基于研究热点或者研究前沿的基础上,分时间段进行分析,结合自身知识储备、政策变化等,得出演变的规律。知识图谱工具中带有时区视图和聚类视图,对于研究教育领域的发展趋势具有很好的辅助作用。对于领域和学科的演进趋势,研究者们更多地是根据掌握的数据资料分析结果和自己的主观判断得出的结论,所得结论也各有千秋。
3.凸显关键研究者
文章是研究者成果的呈现,通过分析文章的作者,能够找出该领域的关键作者。通过作者的分析,可以得出学术合作团体,以及合作机构等。知识图谱软件中,含有作者分析和作者共被引分析,能够根据发文量和共被引量的结果,得出高产作者和高被引作者。高产作者说明其在领域内具有较高的活跃度,对某一领域或者专业具有持续性研究,可以作为专家遴选的参考。高被引作者说明该作者的成果具有较大的影响力,可能开创了某一领域的研究先河,或者实现了某一领域重大突破,对于学科的发展具有重要贡献。此类研究者一般学术影响力较大。
4.梳理知识基础脉络
参考文献的共被引网络组织了研究的知识基础,知识基础是一个领域开展研究的支撑。在教育研究中,研究者们运用相关图谱软件,通过文献共被引分析来找寻某一领域的代表性文献,进而对代表性文献进行解读,得出知识基础脉络。这些文献有的是经典理论文献,有的是开某领域研究先河的成果,有的是在思想、方法或者实践方面具有重大突破或者影响的成果。这些成果有的属于教育领域的成果,也有来自管理学、心理学等其他学科的经典文献。
1.研究主题逐渐细化
知识图谱在教育领域的运用,其研究主题呈现由面到点的趋势。最开始是对大的教育领域、学科进行研究,比如高等教育、职业教育、民办教育等领域进行的历史、现状和趋势分析,例如一定时间段内(一般为五年到十年区间)该领域的发展、研究演进情况等。后来,逐渐细化到某个专业,比如教育技术学,或者某个主题的研究,比如创业大学、校企合作等。呈现的图谱也由大领域演进图谱,聚焦之小专业发展图谱。焦晓静等将其分别称为科学全景图谱与科学局域图谱。[7]
2.工具使用由单一到综合
在软件工具的应用方面,最初多采用单一软件进行图谱的绘制,经过多年发展,研究者将几种软件工具综合使用,一项研究中会交叉使用多个可视化软件进行图谱的绘制。不同的软件有各自的特点,在研究中取其所长综合运用。
3.使用人员逐渐增多,产出递增
从发文量和发文期刊的级别来看,知识图谱的应用最初由少数前沿学者引进,相关文献多发表于核心期刊,后来,随着此项研究方法的成熟和普及,更多的教育科研人员逐渐接纳、认可和掌握了该方法,涌现出了一大批的研究成果,更多的文献出现在一般期刊当中。一方面体现了新方法的快速传播,另一方面也体现了研究者对于新事物的认识接纳和理性对待的态度。
知识图谱在梳理文献、厘清知识脉络、探寻理论基础方面具有很强的优势。相对于传统的文献梳理方法,知识图谱在文献综述、回顾等方面更加直观、快捷,能够很大限度地减少人力和时间成本,更快捷地实现某一主题的文献回顾,找到相关的经典文献、关键节点、理论基础等。通过关键词共现词频的分析和突变词的分析,能够寻找各个时期的研究热点和研究前沿。通过研究者的共现分析,能够得出相关领域的关键人物和研究团队情况。另外,在探寻理论基础、机构分布方面也有良好表现。基于以上优势,知识图谱方法在教育领域中得到快速扩展。但是,经过回顾分析,本研究认为,知识图谱在教育研究应用中还存在一定问题,需要研究者注意和明晰。
在前期相关工具刚刚引入教育研究领域,在数据分析时,一些阈值的设定比较随意,缺乏规范性。在关键节点的选择,关键人物的选择方面,有些学者仅根据出现的频次作为依据、或者中心性作为标准,存在商讨和质疑观点。正如有学者所言,机构的节点与标签的大小并不能代表其研究者的影响力,研究者节点与标签的大小也不能完全代表其所在机构的整体研究水平。[8]
经过多年的发展,学者们也注意到阈值和标准的问题,在核心作者的确定方面,较多的学者认可普赖斯的计算方法,这也是国际上比较公认的计算公式,即M=0.749(Nmax)1/2(其中M为核心作者最低发文篇数,Nmax为发文最多作者的发文篇数)。另外,在核心关键词的界定方面,也采纳了国际上认可的计算公式。高频词与低频词的界定主要是根据多诺霍提出的公式:T=[-1+(1+8I)1/2]/2,I为关键词个数[9]。
在已有的研究方面,研究者更多地是以相关数据作为分析基础,进而通过图谱软件绘制图谱,最后通过对图谱的解读得出相关结论。在此过程中,存在着对数据过度依赖的情况。仅就数据和图谱论研究,缺乏对数据图谱的深度解读,忽略了图谱背后的学科发展、理论基础、社会需求等,脱离社会背景进行数据解读会使得最终的研究结果缺少现实支撑。基于此得出的结论也存在着很大的主观性。另外,对关键主题的分析,需借助内容分析法,详细掌握相关资料方能实现,在此过程中存在主观判断误差的可能。[10]伴随数据分析和图谱解读,可通过文献回顾、专家论证等方法,对存在的误差进行修正。
数据转化软件的开发和汉化版软件的出现,大大方便了使用者,使得知识图谱绘制软件得到迅速推广。学者能够更加便捷、迅速地使用图谱软件处理中文数据库中的文献,或者进行中外研究的比较分析,产出了一系列学术成果。但是,在数据选择、筛选、使用方面还存在不严谨的情况。期刊数据库、博硕士论文数据库、外文数据库等,在选择时较为随意。另外,利用专利数据,对技术领域的研究热点与前沿进行可视化图谱分析的研究比较少。[3]
目前的研究中,大多倾向于可视化软件的工具性应用,缺乏对相关方法、工具的理论性探索。杨思洛认为,大多数研究者将知识图谱当作工具或方法来使用,没有形成完整的理论体系,图谱的应用与实践缺乏有力指导,在应用中具有一定的盲目性和随意性。在图谱的解读方面,很大程度上依赖定性的描述与判断。知识图谱的功能并没有完全发挥。[4]
知识图谱的数据挖掘在文献整理分析,找到相关领域的经典文献、多产作者等方面有很好的优势。但是不能全部依赖软件,有些问题的把握还需多方论证。另外,软件分析根据的是已经产出的科研成果进行的,在回顾总结方面有很大价值,适合对相关领域进行追溯、探究,丰富发展。但是对于未来的发展趋势变化,因为受到多种因素的影响,特别是政治经济环境的变化、科技发展等,有着很强的不确定性,不能完全依据之前的走势进行预判。
各学科发展到一定程度以后,交叉吸收融合是其创新发展的必由之路。借鉴吸收各个学科的研究方法、研究视角,从多学科的视角下研究教育领域的问题才能促进教育科研的繁荣。当今,随着科学计量学、计算机技术的发展,各种工具性的软件层出不穷,在教育研究中,应积极引进各种软件工具,开展量化研究,提高分析效率,以达到事半功倍的效果。在工具软件的借鉴方面,不可随波逐流、浅尝辄止,而应该认真学习、弄懂各个软件的基本原理以及与教育研究的适应性,不能以新软件的噱头取代创新的根本。
另外,我们也应该认识到,所有的理论借鉴、研究方法、研究工具的使用,最终的落脚点都应该是教育研究,这些理论、方法、工具都应该是为教育研究服务的。工具等的分析结果需要运用教育领域的理论和事实来解读,同样的数据结果可能会有不同的解读深度,根源在于教育基本理论、知识积累的区别。陈悦认为绘制出品质优良的图谱需要通过各种算法才得以实现,图谱的整体设计、算法选择及解读依赖的是哲学思维。[11]蔡健东等也指出,科学计量学的方法与技术在教育理论研究中存在着一定的局限性,无法对客观现实资料进行准确的分析。在图谱分析结果的解读方面,需要研究者对关键文献的深度解读,并依赖研究者具有相关问题的知识框架。[12]所以,教育研究者在积极引进使用各种工具的同时,应该清醒地认识到,软件工具只是教育研究的手段,不能够脱离教育理论、教育基础知识的学习。