高等教育学科发展背景的自动化计算和图示化描绘
——以数据科学为视角

2016-09-02 08:38:22汤建民
高教发展与评估 2016年2期
关键词:机遇国际化背景

汤建民

(1.武汉大学 世界一流智库评价研究中心(筹),湖北 武汉 430072;2.武汉大学 信息管理学院,湖北 武汉 430072)



高等教育学科发展背景的自动化计算和图示化描绘

——以数据科学为视角

汤建民1,2

(1.武汉大学 世界一流智库评价研究中心(筹),湖北 武汉 430072;2.武汉大学 信息管理学院,湖北 武汉 430072)

大数据时代的来临,数据科学的兴起,为高等教育学科研究模式的创新提供了新的可能。高等教育学科面临的机遇与挑战是什么,这是每个高等教育研究者共同关注的问题,但在以往,这类研究几乎都是基于模糊、定性的判断。为此,以数据科学为视角,以词频计量、共词分析、知识图谱呈现等为技术手段,以CSSCI论文数据库为数据来源,设计 一种通用而高效的自动化计算和图示化呈现的方法重新解答这个问题,实现其研究方法上的创新。

高等教育学科;文献计量;知识图谱;学科发展背景;数据密集型科学;“化”研究

一、引  言

当前高等教育学科面临的机遇与挑战是什么?明晰了这个问题可以帮助学者进行预流性、前沿性的研究工作,高等教育领域的领导者和决策者可以此制定高校未来的发展规划。当然,这就会自然地产生出第二个问题,就是如何去洞察这些机遇与挑战(本文称之为“学科发展背景”)?显然,在以往,这类问题的解答大都是基于研究者和决策者自身的学习和感悟,或是虚心向他人求教的方式。但是,依靠这些方法所获得的认识一般都是主观的、零碎的。就近期发表的相关论文看,大多数论文都只是从某一方面或者是针对某一类型高校进行的主观性论述。比如,赵立莹和司晓宏发表的《国际化背景下高等教育质量保障发展趋势及中国选择》,重点论述了“国际化”背景下的机遇与挑战问题[1]。郭芳芳和史静寰的《全球化时代高等教育质量保障的特点和发展趋势》,重点论述了“全球化”背景下的机遇与挑战问题[2]。郑旭东和魏志慧的《高等教育信息化及其发展趋势——访美国高等教育信息化协会主席戴安娜·亚伯林格博士》,重点论述了“信息化”背景下的机遇与挑战问题[3]。赵丽的《论我国民办高等教育发展面临的机遇和挑战》,重点论述的则是中国“民办高校”面临的机遇与挑战问题[4]。也就是说,依靠专家,人工定性判断的方法固然有它的优长,但缺点也非常明显,这些方法很难做到系统、客观和及时。难以覆盖整个学科、基于翔实的证据对动态变化进行及时地捕捉和发现。本研究尝试以数据科学为视角,以词频计量、共词分析、知识图谱呈现等为主要研究方法,以中文人文社会科学索引数据库(CSSCI)为研究数据来源,通过自动化的计算和图示化的展示来监测和描绘当代高等教育学科的发展背景,力求实现研究方法上的创新,即从主要基于主观定性的研究方法向基于数据的自动化计算和可视化描绘的研究方法转变,进而建立起基于集体智慧基础之上的精英智慧,以在大数据时代已逐渐来临,海量的数字化的文献数据库已日渐完善、数据分析技术快速进步、数据密集型科学发现作为科学研究的第四范式已经诞生的大背景下,为高等教育学科研究模式的创新作出新的探索[5-7]。

二、研究方法

1.研究思路

数据科学,顾名思义就是以数据为研究对象的一门科学。数据的含义是极为宽泛的,只要是针对某种客观事物记录下来的、可以鉴别的符号都可以称之为数据,既包括数字、文本,也包括音频、视频、图像和网络日志等,既可以是结构型的数据,也可以是非结构型和半结构型的数据。从应用的角度讲,数据科学要解决的是基于数据的决策,因此数据分析的本质既不是数学,也不是软件程序,而是对数据的“阅读”和“理解”,旨在将数据转化为有价值的信息和知识以解决相应的问题[8]。笔者的意图也就是要在已有的高等教育研究论文数据中分析出高等教育学科面临的机遇和挑战,或者说学科发展背景,笔者认为这是完全可能的。

从大的背景来讲,学术研究不可能从无开始,学术的进步主要在于对先前知识的修改,在试探和淘汰中接近合适的东西。简略而言,学术上的新发现都离不开前人知识的积累,新的学术本身是已有学术的累积的延伸[9]。反过来说,现有的海量的高等教育研究论文数据既是未来我们进一步发展学术的源泉,也是历史和当前现实环境下高等教育学科学术成果的一种集成和总反映。那么,我们要洞察的“高等教育学科当前面临的机遇和挑战”,即“学科发展背景”,理论上说本身就已蕴含和反映在这些论文数据中。从这个意义上说,这些文献数据库中的论文数据,已经不仅仅是我们高等教育研究的成果,同时还是我们进一步开展高等教育研究的基础之一,通过这些相关文献的大数据分析,我们完全有可能从中分析总结出某些特征、关系和规律,从而帮助我们认清现状,预测未来。即现在我们的挑战只是要炼成一双“慧眼”,再一次去发现数据世界中本身存在着的这些“美”。

从具体的问题背景看,依据对中文高等教育学科研究模式、特征和规律的多年跟踪分析,笔者认为:从考察论文题目和关键词中“化”字的使用视角,基本可以回应上述挑战。按照汉语词典的解释,“化”最多的是作为动词用,表示变化、融化、消化等;但还有一种重要用法是作为后缀,即加在名词或形容词之后,作为一种对某些已在实践中悄然兴起和发展但又很难用单一的准确术语表达的现象的统称,它既是状态的描述,又是过程的表达,如信息化、国际化、城镇化和碎片化等。在学术论文中,类似上述的由“化”字组成的关键词,往往代表着“机遇和挑战”,如很多论文的开头中经常使用的“随着国际化时代的来临”、“随着城市化的发展”等。因此,通过对这些“化”关键词的考察,我们可以在一定程度上,或者说在某种比较宏观的意义上,观察到这些“机遇和挑战”,或者说“学科发展背景”。虽然和专家的定性判断相比,这种方法免不了有“生硬”和“遗漏”等不足之处,但大数据时代会要求我们的思维要随之作出调整的方面。比如,从一味追求精确性转移到可以接受一定程度上的模糊性和混杂性,从一味琢磨背后的因果关系转移到重点关注事物间的相关关系。在海量的论文数据已日益齐备、数据分析技术快速进步、教育研究中实证研究比例尚需大幅度提高的背景下,通过使用对数据进行自动计算的研究方法,来回答以往用传统的定性方法来解决的学科发展背景等问题,不仅是必要的,而且是可能的,并且是有益的和增值的。

2.数据来源和计算方法

基于上述研究思路和逻辑假设,本研究选择中文人文社会科学索引数据库(CSSCI)2013-2014年收录的来源论文作为研究数据样本来源。之所以考虑CSSCI数据库,主要是因为这样的选择能够使本研究所要使用的数据同时满足“最新”、“优质”和“系统”的要求。根据CSSCI网站的介绍,该库是遵循文献计量学规律,采取定量与定性相结合的方法从全国2700余种中文人文社会科学学术性期刊中精选出学术性强、编辑规范的期刊作为来源期刊而建成的,目前已收录包括法学、管理学、经济学、历史学、政治学和教育学等在内的25个大类的500多种学术期刊,已开发CSSCI(1998-2014年)17个年度数据,来源文献近140万篇。

数据下载:选择2013-2014年CSSCI来源论文数据库,学科限定为“教育学”,首先下载论文关键词中含有“化”字的论文数据,然后再按照中图分类号选择出其中的高等教育学科论文(即G64类),共得到969篇论文数据。内容包括题名、作者、机构、关键词、期刊名、发表时间等。数据清洗:由于“化”的使用中,有一种最常见的组合用法是作为“文化”使用,而这种使用方法又和本文的研究目标关系不大,因此首先予以踢除,这样,研究样本就只留下了622篇。数据计算和分析:按照从“宏观”到“微观”层层深入的分析思路,对论文中含“化”的关键词进行词频计算、共词计算和知识图谱绘制,最后结合高等教育学科研究的具体情况作简略的筛选和论述(在图谱绘制时踢除了明显和本文研究目标无关的一些关键词,如“分析化学”、“深化体制改革”等)。

三、研究结果

1.宏观视野下高等教育学科面临的机遇和挑战

依据上述研究假设、数据来源和计算方法,本研究首先统计出了这些论文中所使用的关键词种类及其频次,含“化” 的关键词共有300多种,其中频次最高的关键词是“国际化”,词频为48次。踢除一小部分和本文研究目标关联不大的关键词后,可使用netdraw软件将其绘制成图1。图中结点的大小和字体的大小代表词频的高低,结点和字体越大,说明该词出现的频次越高。

图1 高等教育学科发展背景的宏观描绘

由图1可以看出,中国高等教育学科目前面临的问题、机遇和挑战是一个非常广泛、多层次和立体化的集合,它们大多有各自的特殊性,但相互之间又有很多交叉重合,其内涵非常丰富。比如,从关键词频次的大小角度看,高等教育学科目前面临的问题、机遇和挑战主要是在如何处理和解决好“国际化、全球化、去行政化、大众化、职业化、本土化、专业化、多样化、多元化、一体化、现代化、市场化、信息化 ”等过程中所带来的问题和挑战。有些关键词尽管频次不是很高,却是和高等教育学科密切相关的。如“数字化教学、小班化教学、专门化培养模式、校长职业化”等。又比如,这些问题、机遇和挑战中,有些是普适性的,即除了高等教育学科以外,其它学科也同样面临的问题,如“国际化、本土化、专业化、科学化、一体化、多元化”等,但有些则是高等教育学科所特有的或是关系特别密切的,如“去行政化、大众化”等。

当然,限于各人的兴趣和知识背景方面的差异,我们要全面、系统、客观地解读图1背后的丰富含义有时也并不容易,这就需要我们从微观的角度来继续细化地描绘和回答我们所要重点关心的问题。

2.微观视野下高等教育学科面临的机遇和挑战

从理论上讲,对于图1中呈现的任何一个关键词,我们都可以应用和上面类似的文献计量方法来进一步予以专门的研究,以便帮助我们深化认识。限于篇幅,同时由于本文的研究目标主要是定位于新的研究方法方面的探索和介绍,因此下面笔者就以出现频次最高的“国际化”这个主题为例,来进一步展示其丰富的情景细节。

首先,我们可以通过对论文关键词中含有“国际化”三个字的关键词进行抽取,这样就得到了一组“国际化”族关键词,如表1所示。

表1 含“国际化”的关键词

然后,我们还可以对“国际化”论文的关键词进行词频计算和共词计算,并用netdraw可视化软件绘制出国际化研究主题知识图谱,这样就得到了图2。

图2 国际化研究主题结构知识图谱

通过结合表1和图2展示的情景细节,我们可以更好地加深对“国际化”问题的理解,其它的主题则可按照实际情景需要依次类推,由此形成一系列的研究主题图谱,如“大众化研究主题图谱”、“去行政化研究主题图谱”等。

四、结  语

综上所述,本研究以数据科学为视角,综合运用词频统计、共词统计及知识图谱呈现等文献计量手段,以CSSCI数据库为研究样本来源,设计了一种通用而高效的新方法,对当代高等教育学科面临的问题、机遇和挑战进行了自动计算和图示化描绘,为高等教育研究者更好地思考和理解这些问题提供了从宏观到微观的系列“战略地图”,或者说为相关人士进一步思考和理解这些问题提供了望远镜和显微镜,实现了该类问题领域研究方法上的创新。本研究既是高等教育研究领域如何实现知识自动化的一次有益尝试,也为开展人文社会科学领域的数据密集型科学发现提供了小规模样本的初步经验,同时也有利于高等教育研究者更好地去洞察高等教育学科面临的机遇与挑战。相对于传统研究方法而言,该方法的优势是能够做到客观、全面、系统、自动、高效和直观,有利于我们建立起基于集体智慧基础之上的专家智慧。当然,这种新的方法和视角的尝试,其得到的结论也仍然有它的局限,比如在结果呈现中往往由于数据清洗的困难而免不了还掺杂着一些杂质,有些方面还不能尽如人意等,但瑕不掩瑜,它显然是一种很有意义的另一种视角的补充、丰富和完善,值得我们为之做出进一步的努力、改进和创新。

[1]赵立莹,司晓宏.国际化背景下高等教育质量保障发展趋势及中国选择[J].高等教育研究,2015(6):42-48.

[2]郭芳芳,史静寰.全球化时代高等教育质量保障的特点和发展趋势——基于“全球化时代大学生学习与发展研究”国际研讨会的分析[J].比较教育研究,2015(2):24-29.

[3]郑旭东,魏志慧.高等教育信息化及其发展趋势——访美国高等教育信息化协会主席戴安娜·亚伯林格博士[J].开放教育研究,2014(6):4-9.

[4]赵丽.论我国民办高等教育发展面临的机遇和挑战[J].亚太教育,2015(14):35.

[5][美]Tony Hey.第四范式:数据密集型科学发现[M].潘教峰,译.北京:科学出版社,2012:21.

[6]邓仲华,李志芳.科学研究范式的演化——大数据时代的科学研究第四范式[J].情报资料工作,2013(4):19-23.

[7]周晓英.数据密集型科学研究范式的兴起与情报学的应对[J].情报资料工作,2012(2):5-11.

[8]魏瑾瑞,蒋萍.数据科学的统计学内涵[J].统计研究,2014(5):3-9.

[9]汤建民.学术论文的创造性阅读[M].杭州:浙江大学出版社,2007:60.

10.3963/j.issn.1672-8742.2016.02.006

汤建民(1967-),男,浙江东阳人,教授,博士研究生,研究方向为科学计量学与高等教育学。

G64

A

1672-8742(2016)02-0043-06

2015-10-20;编辑:荣翠红)

猜你喜欢
机遇国际化背景
聚焦港口国际化
金桥(2022年10期)2022-10-11 03:29:46
“新四化”背景下汽车NVH的发展趋势
RCEP与房地产机遇
《论持久战》的写作背景
当代陕西(2020年14期)2021-01-08 09:30:42
人民币国际化十年纪
中国外汇(2019年12期)2019-10-10 07:26:56
你的焦虑,也是你的机遇
时代邮刊(2019年16期)2019-07-30 08:01:58
再见,机遇号
不必过于悲观,四大机遇就在眼前
汽车观察(2019年2期)2019-03-15 05:59:50
从园区化到国际化
商周刊(2018年12期)2018-07-11 01:27:18
晚清外语翻译人才培养的背景