孙雨生,彭梦媛,刘 涛
(湖北工业大学经济与管理学院,湖北武汉 430068)
伴随“双一流”建设和“双万计划”纵深推进,学科治理体系和治理能力现代化需求不断提升,高校学科作为高校教学、科研及社会服务能力提升的重要基础,其建设地位愈加凸显。当前我国学科建设整体虽取得一定成效,但仍需提升高校学科方向明晰性、学科布局合理性、学术氛围浓厚度、学科梯队完善性、学科基地健全性、学科成果优质度等,亟须深度理解并科学评估学科建设,避免学科间内涵同质化、资源配置失衡等问题。
传统相关研究多基于同行评议、问卷调查、文献综述等定性方法,从教学、科研、人才培养、社会服务等宏观视角统计分析学科建设外部特征,虽能部分揭示学科建设质量及其显性特征,但难以有效揭示学科微观联系、静态结构和演化规律,也无法充分挖掘学科发展历程及规律、把握学科发展特征及本质、预测学科发展前沿及演化;另外,如杨渊鋆等[1]、万昊等[2]在研究均指出,还存在结论主观且封闭、工作量大且低效、文献量少且低质等问题,严重影响评估结果信效度与易理解性、学科建设决策效果。因此,亟须用新型分析方法和工具深度分析体现学科建设水平、质量、前沿的系列科研成果,以高效直观、全面客观揭示微观学科主体及其联系、中观交流主体及其结构、宏观知识主题及其演化特征,以弥补传统评估方法不足。在此形势下,学科知识图谱应运而生。学科知识图谱运用可视化技术转化海量抽象学科知识为直观形象统计型、关联型知识图谱[3],生动揭示学科横向关联结构、纵向发展脉络并立体反映学科知识体系[4],以便精准把握学科建设着力点,合理配置学科建设资源进而提升学科竞争力。
现有学科知识图谱成果多用特定方法和工具构建、挖掘和分析特定学科及领域具体问题知识单元之间的联系和演化规律。此外,部分学者按需构建学科知识图谱:如汤建民[5]、魏瑞斌[6]等聚焦于学科发展测评、机构资源分配及学科布局,以辅助学科建设优化;伍国勇等[7]、黄薇[8]、吾司曼等[9]通过学科服务方向明确、价值倍增、效率提高来提升学科服务质量;何超[10]、张勇等[11]、蒋禹飞等[12]以教学先进化、可视化、智慧化赋能课程教学改进,但多因研究工具与方法不科学、研究内容与解析不全面、学科建设理论研究不充分等,难以深度揭示学科建设内涵及规律,不能有效辅助学科建设决策。为此,本文研究学科知识图谱类型及其构建机理,辅助深入分析并揭示学科建设内涵及规律,从而为政府、高校决策提供参考。
2.1.1 内涵与价值
就内涵而言,学科建设是高校遵循学科发展规律,面向政府、产业、学者、学生等主体的价值需求,结合自身教学和科研实际,以提升人才培养、社会服务质量为宗旨,基于行为维度的学科组织形态建构学科教学、科研体制,以有序化、规范化重构与重组知识活动并提供服务,基于空间维度的学科活动形态开展知识创新活动以组织与建构知识,基于时间维度的学科知识形态演化构建系统知识体系以分化与丰富学科内涵及应用的复杂系统工程[13]。就价值而言,学科建设对接政府战略、高校定位、产业发展和学者需求,丰富学科内涵、提升学科水平,以促进学科发展并辅助提升高校学科研究、人才培养、社会服务质量。
2.1.2 要素及其关系
学科建设要素涉及学科方向、布局、环境、梯队、基地、课题等,各要素互联形成学科生态系统(见图1)。其中,学科方向建设为基础,遵循前沿性、可行性原则,以学科特色、交叉方向、新生长点凝练为导向,明晰学科方向;学科布局建设为思路,遵循战略性、特色性原则,横向以基于高校间相同学科实力强弱设置学位点为导向,纵向以高校内基础、新兴、交叉学科分布规划学科资源为导向,优化学科布局;学科环境建设为保障,遵循创新性、自主性原则,以学科设备配置、学科交流合作为导向,营造学科环境;学科梯队建设为核心,遵循学术性、层次性原则,以梯队质量提升、结构调整为导向,配置学科梯队、引领学科前沿;学科基地建设为支撑,遵循优势性、协同性原则,以学科战略定位、结构优化、资源配置为导向,部署学科基地,营造学科环境,组建学科梯队,孵化学科课题;学科课题建设为突破口,遵循适标性、校本性原则,以学科课题立项、成果产出、人才培养为导向,明确课题方向,更好地组建学科梯队和配置学科资源。
图1 学科建设要素间关系
2.2.1 内涵与价值
学科知识图谱以可视化技术为手段,以学科期刊、文献、作者、机构、基金、关键词等为对象,以学科理论与知识体系为核心,以学科画像与知识发现为目的[14],综合运用引文分析、多元统计分析、社会网络分析等方法并遵循数据检索、处理和分析以及图谱构建和解析流程处理纷繁复杂学科对象信息[15]7-9,以可视化知识图谱揭示学科发展历程与知识结构关系。学科知识图谱可用于辅助分析学科发展历程及规律、学科发展特征及结构、学科知识共享及传播、学科发展前沿及演化,探究学科建设现状及发展趋势,以便各相关主体采取系列措施有针对性地提升学科建设水平。
2.2.2 类型及关系
学科知识图谱按学科建设内涵分为学科流派、学科交流和学科脉络图谱,均以学科文献为核心,其相互关系如图2 所示。学科流派图谱以学科文献所属期刊载文量、作者发文量、机构发文量、基金立项量以及期刊影响因子、被引半衰期、被引频次、篇均被引频次等指标初步界定核心期刊、文献、作者、机构、基金:基于引文分析揭示学科流派的成果特征,基于共被引或共现分析和社会网络分析揭示学科核心知识单元及其相互之间交叉、渗透、衍生、融合等引证关系,并通过多元统计分析或聚类分析揭示学科静态结构及流派共同体。学科交流图谱以微观作者、中观机构、宏观地域(国家)层面的合作群体、规模、强度等特征分析学科流派图谱中核心作者、机构及所属地域(国家)间网状关系,从空间维度基于引文分析揭示学科成果分布差异,基于社会网络分析揭示研究主体间知识融合与传播,辅助学科知识融合、信息传播、资源配置和学术氛围营造。学科脉络图谱以学科流派图谱中学科文献关键词中心性、密度、频次,从时间维度基于词频分析发现学科文献高频关键词,基于共现分析分别融合社会网络分析、聚类分析来识别学科知识间关系和结构,揭示学科主题结构、知识脉络演化历程和路径以及研究热点和前沿,辅助明确学科方向、规划学科布局。
图2 学科知识图谱类型及关系
学科知识图谱构建旨在从学科建设要素间关系视角,依托数据挖掘、信息处理、知识计量、网络分析、可视化技术量化分析学科文献并立体展现学科全貌、历程与趋势[10],以揭示学科潜在结构、机构科研规模、分析学科合作网络、评估学者学术地位,探测学科演化趋势和追踪学科前沿课题等,辅助学科建设决策,进而满足政府战略制定、高校学科统筹、学者科学研究需求。具体而言,辅助政府分配学科财政资金、部署高校学科学位点、优化地域(国家)间合作机制、制定学科课题指南,以便形成学科体系;辅助高校强化自身学科特色、组建高水平学科队伍、规划配置学科资源、举办学科交流活动、构建合作交流平台,以便构建学科共同体并提升学科质量;辅助学者引领学科发展方向、聚焦学科前沿课题,加强学者及学术群体间交流、产出学科优质成果,以便参与主流学科群体并进行学科创新。
为提升学科知识图谱的全面性、普适性以及学科建设决策支持度,在数据检索环节注重数据来源全面安全,选取时效性强、可靠度高的数据。同时,参考孙小欣[16]、刘静[17]的研究,在数据预处理环节应注重规范格式转换、剔除冗余数据,以提升数据一致性及使用高效性,并选择能够反映研究目标支持度和处理简洁度的知识单元,以横向共现、纵向引证关系界定单元关系构建的合理性。此外,遵循数据标准性和简洁性原则进行数据处理,并通过易操作的、适用的方法和工具开展数据分析。最后,学科知识图谱构建注重流程普适性、步骤规范性、类型多样性、图谱易懂性,在图谱解析环节注重解析建构性、结论科学性[18]。
遵循上述构建目标及原则,学科知识图谱构建思路如图3 所示。首先,以美国的科学引文索引(SCI)、社会科学引文索引(SSCI)、WoS 数据库和我国的中文社会科学引文索引(CSSCI)、中国科学引文数据库(CSCD)和中国知网(CNKI)数据库等为数据源检索学科数据,并参考肖明[15]7的做法进行数据预处理;其次,选择学科期刊、文献、作者、机构、基金、关键词等知识单元并构建单元关系;再次,参考刘敏娟[19]的方法进行引文、共被引、共现、多元统计、社会网络等数据分析,并参考肖明[15]8的研究选取适用的计量分析和可视化工具构建学科知识图谱;最后,对学科知识图谱进行分析。
图3 学科知识图谱构建思路
学科期刊是学科成果重要交流载体,其质量直接影响学科知识传播广度和深度。学科期刊图谱涉及期刊共被引网络图谱、期刊多维尺度图谱,常用于揭示学科核心期刊、学科间关系以及学科结构类型。分析核心期刊内容可辅助学者明晰学科方向,明确学科性质、特征、关系、结构、演化规律,以立体建构学科知识体系,并通过揭示学科所处发展阶段以及与其他学科协同关系和高校学科定位等,辅助政府统筹学位点、高校配置学科资源以优化学科布局。具体而言,首先,通过引文分析统计期刊载文量、被引频次、影响因子、被引半衰期等指标揭示学科重要期刊,其中期刊平均被引半衰期越长,学科被替代性越弱、研究难度越大[10];其次,通过重要期刊间共被引频次构建共被引矩阵,结合共被引、聚类、社会网络分析构建期刊共被引网络图谱,并依托节点、连线、中心性等特征及指标揭示核心期刊间关系并推断学科间关系,或基于共被引矩阵结合相关性、因子、多维尺度分析等多元统计分析构建期刊多维尺度图谱,通过期刊相关性划分学科期刊群进而明确学科结构等;最后,基于各时段图谱内容分析相关学科类别、结构、关联度、关注度等,以追溯高质量学科主题演化规律。
学科文献是学科知识源流和成果的主要表现形式,文献间引证关系体现学科知识累积性、连续性、继承性[10]。学科文献图谱主要是文献共被引聚类网络图谱,常用于揭示学科核心文献和知识基础,辅助学者培养学科素养、遴选学科文献、梳理学科脉络、申请学科课题,同时用于分析学科研究突破口,辅助学者发现学科新生长点。具体而言,通过引文分析统计文献共被引频次、找到高被引文献,基于高被引文献间共被引关系构建文献共被引聚类网络图谱,并依托节点及共被引年份、中心性等特征揭示核心文献和知识基础,最后分析文献共被引聚类网络图谱时区视图,结合知识基础、核心文献内容揭示知识源流演化历程以发现学科突破口[20]。
学科作者是学科知识创造、传播与践行主体,其水平与结构决定高校学科地位、声誉和发展方向。学科作者图谱涉及作者共被引网络图谱和学术群体多维尺度图谱,常用于揭示核心作者和主流学术群。分析和明确学科核心作者和主流学术群研究方向能够辅助学者追踪学科前沿,推动高校人才引进、学科梯队组建及其质量提升和结构优化[21]。具体而言,通过引文分析统计作者被引频次,发现高被引作者,基于高被引作者间共被引关系构建共被引矩阵,并结合共被引、社会网络分析构建作者共被引网络图谱,同时依托中心性、密度等指标揭示核心作者间关系疏密,或结合作者共被引、多元统计分析构建学术群体多维尺度图谱,聚集研究方向相似作者形成科学共同体,以揭示主流学术群和特色分支流派等。
学科机构是学术交流、人才聚集、成果形成依托。学科机构图谱涉及机构共现网络图谱和机构共现学科图谱,常用于揭示核心机构和机构学科分布。分析核心机构学科实力、梯队水平等,能够辅助政府战略部署学位点;同时,分析机构内学科分布和建设路径,能够推动高校特色化配置人才、设备、资金等学科资源。具体而言,首先,通过引文分析统计机构发文量、被引频次、篇均被引频次等指标发现高产机构,然后基于高产机构间共现关系构建共现矩阵,结合共现分析、社会网络分析构建机构共现网络图谱,并依托节点、中心性等特征及指标发现核心机构,最后基于不同时段机构文献所属学科间共现关系,结合共现分析、社会网络、聚类分析构建机构学科共现图谱并依托节点、学科关联度、中心性等特征及指标,分析机构内学科分布[22]。
学科基金是学科建设经费重要保障,支撑学科演化、学科研究和人才培养。学科基金图谱涉及基金共现图谱、课题关键词共现网络图谱,常用于揭示学科重要基金和学科前沿动态。追踪学科前沿问题有利于超前部署重要基金,辅助学者产出优质成果;而分析学科发展潜力、基金资助特征(如分布、力度、对象等),可辅助政府优化学科基金资助规模和结构。具体而言,首先,基于学科文献中基金共现关系构建共现矩阵,结合共现分析、社会网络分析构建基金共现图谱,并依托资助课题数、中心性等特征及指标发现学科重要基金;其次,按地域、机构、作者分类统计历年基金资助数量、经费及对象揭示学科基金资助规模、增速、比重等特征[23],进而分析学科发展潜力[24];最后,基于重要基金所资助课题中高频关键词共现关系构建共现矩阵,结合共现分析、社会网络分析构建学科基金资助课题高频关键词共现网络图谱,并依托节点、连线特征揭示学科研究热点与前沿。
学科作者合作直接反映学科成熟度,间接保证学科成果质量。学科作者合作图谱主要是作者合作网络图谱,常基于学科交叉性,结合学科作者合作强度与规模辅助高校有针对性地举办学科会议以形成学术交流群体,推动学科梯队间深度交流合作。具体而言,通过引文分析统计作者发文量等指标发现高产作者,基于高产作者间共现关系,结合共现分析、社会网络分析构建作者合作网络图谱,并依托合作作者数、连线特征和作者中心度、合作度、合作密度等指标揭示学科作者间合作规模和强度[25]。
学科机构合作有利于机构间开放协同创新以及学科成果的落地转化。学科机构合作图谱主要是机构共现网络图谱,常基于学科机构间合作关系及其合作对象特征,帮助高校追踪学科发展状态及动态,发现合作机遇及构建合作平台,加强学科合作及跨域创新。具体而言,通过引文分析统计机构发文量发现高产机构,基于高产机构间共现关系,结合共现分析、社会网络分析构建机构共现网络图谱,并依托连线、中心性、密度等特征及指标揭示学科机构间合作关系、规模、强度等特征。
学科地域(国家)合作揭示学科宏观合作关系及特征,以推动学科的跨域协同创新。学科地域(国家)合作图谱主要是地域(国家)学科合作网络图谱,常基于学科发展地域差异及合作关系分析其所处阶段及成因,辅助政府优化学科跨域合作政策及机制、营造学科跨域交流氛围、提升学科影响力[26]。具体而言,通过引文分析统计作者、机构所属地域(国家)发文量,揭示学科发展地域差异,并基于地域(国家)发文间共现关系,结合共现分析、社会网络分析构建地域(国家)学科合作网络图谱,依托节点、连线等特征揭示学科发达地域(国家)及合作关系。
廓清学科主题结构可发现学科核心研究主题、主干分支结构。学科主题结构图谱涉及关键词聚类图谱,常基于学科主题结构、学科间关系构建学科知识体系,分析学科建设内容和相关学科,辅助政府学科学位点规划及布局。具体而言,基于词频分析不同时段学科文献关键词发现高频关键词,并基于高频关键词间共现关系构建共词矩阵,结合共现分析、聚类分析和社会网络分析构建关键词聚类图谱,依托节点及其类别、连线等特征揭示学科主题结构[27],同时根据其所属学科推断学科间关系。
学科研究热点及其演化可揭示学科知识演化轨迹,发现新兴生长点。学科研究热点图谱主要是学科文献关键词共现网络图谱,常基于国家、地区、高校间学科研究热点差异辅助高校分析学科建设阶段及差异原因、明确学科建设方向[20];同时基于学科研究热点及其演化揭示学科学术动态和趋势,为学者选择课题研究方向提供参考。具体而言,基于词频分析期刊文献关键词以发现高频关键词,并基于不同时段高频关键词共现关系构建共词矩阵,结合共现分析、社会网络分析构建关键词共现网络图谱,依托节点、连线、密度、中心性等特征及指标揭示学科研究热点及其演化。
学科研究前沿揭示学科前沿主题和研究趋势。学科研究前沿图谱常基于学科主题演化趋势及研究前沿,辅助学者判断研究方向、找准切入点,明确学科方向,同时有利于政府制定学科建设战略、发布课题指南,促进学科课题建设。具体而言,基于引文分析统计近年学科文献被引频次发现高被引文献,然后分析文献各时段关键词,结合共现分析、聚类分析构建前沿关键词时区图谱,统计各时段研究前沿关键词以揭示研究主题演化趋势,或基于关键词共现聚类图谱的聚类向心度和密度指标构建战略坐标图以揭示学科研究前沿[28]。
学科建设要素涉及学科方向、布局、环境、梯队、基地、课题建设并关联形成学科生态系统;学科知识图谱分为学科流派图谱、学科交流图谱、学科脉络图谱,能够协同辅助学科建设决策。就构建机理而言,学科流派图谱涉及学科期刊图谱、文献图谱、作者图谱、机构图谱和基金图谱;学科交流图谱包括学科作者合作图谱、学科机构合作图谱和学科地域(国家)合作图谱;学科脉络图谱涉及学科主题结构图谱、学科研究热点图谱和学科研究前沿图谱。学科知识图谱构建应遵循选取的数据具有时效性强、可靠度高并按照标准性和简洁性处理数据,知识单元能够体现研究目标支持度和处理简洁度,以及流程普适性、步骤规范性、类型多样性、图谱易懂性等原则,通过立体展现学科全貌、历程与趋势,辅助学科相关决策、统筹建设和研究需求。
本研究对学科知识图谱的研究整体还处于机理分析阶段,后续可利用人工智能、深度学习等新一代信息技术设计基于多源数据、融合多方法及工具的学科知识图谱并进行实证分析;此外,还可纳入课程建设、招生就业、师资队伍建设等人才培养和学科建设体系相关内容构建完善的定性定量混合评估方案,进一步有效支持学科建设决策。