李利利,任振朋,王现强,廖文豪
在当代信息爆炸和大数据时代背景下,超大的信息量是时代赋予的特征。激增的数据背后隐藏着许多重要的信息,缺乏挖掘数据背后隐藏的知识的手段,将导致“数据爆炸但知识贫乏”[1]的局面。如何在数目庞大的文献资料中,将这些零散的信息全面、快速地综合起来,从众多繁琐的数据中判别和筛选出具有代表性的信息并进行分析,获得事物的发展动向和趋势已经成为众多研究者关注的热点。加菲尔德认为科学研究前沿知识可以从来源文献标题中出现频次最高的单词或词组提取出来[2]。关键词作为学术论文的重要组成部分,虽在论文中所占篇幅最少,但却是论文的精髓所在[3]。《GB7713—87 科学技术报告、学位论文和学术论文的编写格式》中把其定义为:“关键词是为了文献标引工作从报告、论文中选取出来用以表示全文主题内容信息款目的单词或术语”[4]。在最新的《GB/T3860—2009文献主题标引规则》中同样提到:“学术论文关键词选词实际上就是一项文献主题标引工作。[5]”显然,关键词对于学位论文的重要性不言而喻。新世纪以来,我国研究生教育高速发展,如:2000年全国研究生毕业人数为58 767人(博士11 004人,硕士47 565人)至2016年全国研究生毕业人数增至为563 938人(博士55 011人,硕士508 927人),博士毕业生增加了五倍,而硕士增加11倍[6]。硕、博士学位论文是衡量一个学科的发展水平和科技产出的重要指标[7],也代表着本领域或研究方向的最新热点话题。笔者收集2000—2016年四个奥运周期我国田径为主题的文献并对其关键词进行分析,以期对我国田径研究的前沿趋势予以描述。
本研究以2000年—2016年四个奥运周期,我国体育学类(包括学术型硕士办法教育学硕士;专业性硕士办法体育学硕士;而博士为教育学博士)以“田径”为研究主题的博、硕士学位论文中的关键词为研究对象。
首先,通过中国知网查阅收集2000年—2016年有关“田径”类体育硕、博学位论文。共收集学位论文1 607篇,关键词2 935个;其次,查阅情报学学科方面的相关资料,并根据实际情况查阅内容分析法、数理统计法、田径理论和田径百年史等资料。通过检索文献筛选得到研究的初始数据。
共词分析法是一种科学计量分析方法,属于内容分析方法的一种。其主要原理是在词频统计的基础上将关键词两两一组,统计两组词在同一篇文献中出现的次数。两个关键词同时在一篇文献中出现的次数越多,它们之间的关系就越密切,以此来反映关键词所代表的学科和主题的结构变化[8]。本研究通过对体育学硕、博论文关键词的共词分析,总结出近十几年来“田径”科学研究的热点。
首先使用Excel表格对体育学硕、博论文“田径”研究关键词进行归类整理;其次,运用SPSS 19.0对统计数据进行聚类分析和多维尺度分析,将众多的因子进行聚类并得到高频关键字(研究热点)。
3.1.1 数据来源笔者以CNKI数据库为文献来源,检索选取时间为2000年1月1日至2016年1月1日的全国各类高校体育学博士、硕士学位论文;以模糊配对的方式查询研究主题为田径的文章,其中包括:走、跑、跳、投和全能项目;参与田径的相关人员研究;器材、设施和设备;学校田径教学、课程和科研论文等。共检索到1 607条记录,利用Excel对关键词进行抽取和词频统计,共得到2 935个关键词。
3.1.2 数据处理首先删除具有广泛意义的词语,如:现状、研究现状、调查、田径、我国、对策、影响、调查与分析等词语。其次,合并和转换近义词语:将关键词意思相同的词语进行语义上转化和合并。如:核心力量包括身体核心力量、核心力量训练等;定向越野运动包括定向越野、定向运动发展、百米定向运动等;运动员包括各个项目的运动员、运动员特点、业余运动员等;最后用力包括最后用力阶段和技术等;体能训练包括体能、专项体能训练、体能结构特征等;马拉松包括:马拉松赛事、各个城市的国际马拉松赛、女子马拉松、城市马拉松等;成绩包括运动成绩、成绩分析和成绩现状等;高校包括各个省份的普通高等院校;田径后备人才包括:后备力量、后备人才培养和后备人才等。选取其中词频数大于等于18次的关键词为高频关键词(见表1)。
表1 本研究筛选的高频关键词列表
3.2.1 共词分析将关键词频数大于等于18次的36个关键词两两配对,并统计在1 607条文献中出现的频次,形成矩阵(如表2所示)。数据显示高频关键词进行两两配对后统计在每篇文献中所出现的频次,在对角线上的数字表示的是自身在文献中出现的次数。高校(1)和运动学分析(2)共同出现的次数为79次;高校(1)和运动员(3)共同出现次数为92次;高校(1)和田径课程(4)共同出现次数为87次。从共同出现频次中可以看出,高校与运动学分析、运动员和田径课程的共同出现数较大。将表2中的关键词矩阵转化为相关矩阵,可以直接观察文献的共引频次,并分析对象间的相关度[9],也可以将原始矩阵标准化,剔除高被引对象与那些与其相似却很少被引的对象在规模上的差别,进而也就消除文献引用特性不同所造成的数据偏差[10]。
表2 本研究提取的硕、博士学位论文高频关键词的共词矩阵(部分)
表3 本研究提取的硕、博士学位论文高频关键词的相关矩阵(部分)
3.2.2 聚类分析首先,每个个体自成一类。然后,按照某种方法度量所有个体间的亲疏程度,并将其中关系最密切的个体聚成一小类。接下来,再次度量剩余个体与小类的亲疏程度,并将当前关系最密切的个体或小类再聚成一类[11]。利用聚类方法中选择组间连接,并在度量标准区间中选择pearson相关性的处理方式得到图1的树状图。
从图1中展现的树状图能清晰地看出每个类团的形成和结合过程。利用SPSS软件的图表操作画出实际测度为17.5的竖向将高频关键词分为10类。例如:关键词1(高校)和4(田径课程)先形成一类,再与10(体育教育)形成一类,以此类推直至36个高频关键词经过一系列的聚类分析以后得到10类聚集图。
3.2.3 多维尺度分析通过适当的方式降维来反映多个研究事物之间相似或不相似程度,并在低维度的空间中用点与点之间的距离表示出来,以此来帮助认识事物间相似性的潜在因素[12]。
图2所示:统计得到的数据模型与原始的数据变量有较好的拟合程度,可进行下一步多维尺度分析。图3中显示的是将众多变量展现在二维的坐标轴上,可直观地体现众多散点的情况分布。可以得到在原点中心位置较多散点聚集,形成较大的集群,且中心位置的散点有较多重合的点。表明我国研究生学位论文在研究内容上的选择较为相似,在研究内容和科学的知识结构中具有较高的相似性。相似度较高的变量聚集在一起,并形成一个类别。在中间位置的对象与有联系的对象越多,也就形成核心,反之,则在外围形成散点[13]。
通过图3可知:第一区域主要包括:V8(成绩)、V29(教练员)、V33(起跳 )、V21(体能训练)、V25(身体素质)、V11(体育教育专业)、V22(竞走)、V28(运动负荷);第二区域主要包括:V12(优秀运动员)、V13(定向越野运动)、V14(最后用力)、V19(中长跑)、V30(训练方法)、V36(力量训练)、V27(中学)、V37(撑杆跳高);第三区域主要包括V31(全运会)、V17(田径课余)、V26(中学)、V35(标枪)、V16(跳远)、V15(女子)、V7(田径后备人才);第四区域主要包括:V18(短跑)、V20(男子)、V24(起跳)、V10(马拉松)、V23(三级跳远)、V6(田径教学)。
图1 聚类树状图
图2 本研究关键词变量线性拟合的散点图
图3 本研究田径类关键词变量多维尺度图
通过表5的数据和结合上述高频关键词矩阵、聚类分析和多维尺度分析得到在2000年至今我国硕、博士研究生学位论文的研究热点,由此综合概括为下述几类:
3.3.1 第一类相关热点分析鉴于田径在体育运动中的重要地位以及奥运会奖牌设置中所占比值之大,所以在2000年以后,我国体育学者、硕、博士关于田径学术研究中,“运动员、优秀运动员、教练员、青少年、男子和女子人群”等主题的研究居多。尤其是对优秀田径运动员、教练员的研究,则是希望通过对田径中各个项目的优秀运动员比赛、训练、管理等方面进行分析探讨,发现问题提出对策和建议,以更好的理论指导我国竞技田径运动发展。青少年作为国家竞技体育后备人才,所以抓好青少年体育工作是国家竞技体育可持续发展的基本保障。同样对于青少年田径运动的研究也是本时期内硕、博士的研究对象。
表5 我国田径研究热点领域分类
通过上述表格在高校田径课程的研究显示:硕、博士论文主要集中于普通高校和中学的体育教育专业、田径课程、田径教学方面,即说明学校体育管理体系中现实存在的问题,也恰恰反映出学校田径运动的开展现状。
马拉松运动集动作技术简单、包容性(参赛门槛低)、赛场特殊(设计比赛场域广)[14]等优势在国家大力倡导开展全民健身大环境下,全民兴起马拉松热。同时马拉松赛事广泛的影响力,纷纷被各个城市模仿借鉴。同样在马拉松赛事“热”的同时,由于参与人数众多带来诸多管理问题,诸如赛场混乱、交通堵塞、运动员运动损伤等问题。马拉松赛事作为社会现象被众多硕、博士进行研究,如:对近几年的各个城市举办的国际马拉松赛事和城市马拉松比赛为城市的发展和城市的名片,突出各城市的举办的特色和赛事的运作、赛事的收益等。同时作为我国田径传统强项如三级跳远、标枪、中长跑和背跃式跳高等项目也是众多硕、博士研究的热门项目。
从运动学的角度分析田径各项目运动员身体素质、运动负荷和技术动作最后发力等等主题类研究也不在少数。其中,最主要体现在投掷项目中最后用力阶段和最后用力技术上的分析,如:铅球蹬地转髋,手指拨球;标枪的超越器械。另外在运动学的特征上,存在对田径运动的位置、姿态的改变来呈现项目的特殊性,大致体现在技术动作的分析,探究各项技术中的关键环节和技术衔接,以更好地指导和纠正运动员的技术动作,进行科学化训练。
3.3.2 第二类相关热点分析我国竞技体育后备人才相关研究在所有项目中历来都是最受硕、博士重视的研究领域。研究形式主要包括理论研究、实证考察等。
我国田径后备人才研究主要集中在各个项目的开展现状、发现问题提出策略。如:人才培养断层、人才培养机制不完善等。具体到各个区域田径后备人才的研究,各个省份则根据自身优势、重点发展部分项目,从而使项目的优势得到保持。面对在后备人才培养中的种种问题,硕、博士生们通过借鉴国外经验,提出“体教结合”发展包括田径项目在内的我国竞技体育后备人才,利用学校的优势条件,如文化素养沉淀、德智体美全面发展等有利于后备人才(青少年)未来职业生涯中的发展。培养方式的多样化、培养体制的健全化、培养人才方式的创新化等都是影响后备人才的发展模式。同时,在聚类分析的第四类和第七类中提到“中学田径教学中的定向越野研究”“跳远和田径课余训练”同样有关田径后备人才在学校体育的发展。在体育界流传一句话“田径苦、体操累,轻轻松松找球类”,所以竞技化强、枯燥、辛苦的田径项目在学生中很不受欢迎,但是近年来在高校、中学里逐步开展起来的定向越野,以其独特的赛道安排、技术动作随意化等特点深受学生的喜爱。定向运动作为新兴校园田径运动的代表,不仅取代了一跑到底的中长跑和长跑的运动功效,同时提高了学生对方位的认知感,培养了学生对长跑运动的兴趣。定向越野开展现状是研究的趋势;定向运动在教学中的实现、定向课程资源的开发与利用、定向课程在趣味运动会中的开展都可促进博士、硕士生们对定向越野运动的关注。至于“跳远和田径课余训练”,中小学生和大学生的课余训练较多,在业余训练为数不多。在校园运动会、省级运动会和全国运动会等运动会的驱使下,使得田径的课余训练具有普遍性和针对性,促使校园田径课余训练的较好发展。
对于竞技体育的研究如果涉及到部门数据,如运动员生理指标、比赛技战术分析、训练成绩效果与评定等相关研究时,一般的学者和硕、博士生们很难收集到运动员和比赛的相关成绩。田径比赛作为可直接量化的指标,比赛成绩一般可从各个媒体的报道中获取,为研究者提供原始数据,所以在第二类中从运动成绩中分析田径类各个项目在各级别的比赛中的情况相对较多。通过成绩反映我国田径整体和部分项目发展状况以及不同省市不同项目的发展,同时也可通过运动成绩挖掘数据背后各项技术动作的训练方法和负荷等影响因素。相对于田径比赛成绩,在第五类、第八类、第九类、第十类中关于“短跑和体能训练研究”“训练方法”“力量训练”“实验研究”伴随着研究对象和研究内容的局限性,研究数量逐步在减少。而诸如“体能、力量、训练方法、实验”主题类研究在整个田径运动发展中至关重要,甚至决定着田径运动的发展方向。在研究方法和技术上要求较高,只有少数高水平硕、博士生在做。
3.3.3 其他类相关热点分析在聚类分析图表中,第三类撑高跳高相关研究较多,主要集中在撑高跳高技术上和训练中的应用,并在高校中开展撑杆跳高课程和各省份中训练研究。项目本身在竞技体育中的地位和普及度是促进研究的重要因素。同样在第六类中作为我国优势项目的竞走研究中,主要涉及训练方法和手段,归纳总结训练、竞赛经验保持我国在此项目上的优势,以此经验开发、发展其他潜优势项目,对促进我国田径运动发展有重要意义。
每年全国众多体育类硕、博士都要面临着学位论文的选题,同样每年硕、博士生学位论文选题也代表着体育(田径项目)研究最新、最热的领域。田径项目作为运动之母,在所有体育项目中处于执牛耳的地位。面对北京奥运会以及后奥运时代我国由体育大国向体育强国发展战略的转变、以及国家体育体制不断深化改革、学生体质健康逐年下降的现状下,我国田径相关学术研究逐步成为热点。从2000年—2016年我国有关田径主题的体育学硕、博士学位论文关键词的分析可知,田径研究的热点问题有十大类。针对每一类做出具体分析,得出:“运动员、优秀运动员、教练员、青少年、男子和女子人群”、“高校田径课程”和“马拉松”比赛排在前三位,这恰恰很好反映出田径相关研究三个重要主题——竞技田径运动、学校体育田径运动以及田径社会化。另外关于竞技田径运动成绩、训练、实验以及我国具体田径优势的项目也有相关研究,从侧面反映出近年来我国体育学硕、博士论文在有关田径主题类学位论文选题上的多样式、前瞻性和新颖性的鲜明特点。
参考文献:
[1]潘黎,王素.近十年来教育研究的热点领域和前沿主题——基于八种教育学期刊2000—2009年刊载文献关键词共现知识图谱的计量分析[J].教育研究,2011(2):47~53.
[2]侯海燕,刘则渊,栾春娟.基于知识图谱的国际科学计量学研究前沿计量分析[J].科研管理,2009(1):164~170.
[3]刘则渊,尹丽春.国际科学学主题共词网络的可视化研究[J].情报学报,2006(5):635.
[4]GB 7713-87科学技术报告、学位论文和学术论文的编写格式[S].
[5]GB/T3860-2009文献主题标引规则[S].
[6]教育部官方网站[EB/OL].http://www.moe.gov.cn/s78/A03/moe-560/jytjsj-2016/.
[7]李长玲,翟雪梅.我国情报学硕士学位论文的共词聚类分析[J].情报科学,2008(1):73 ~76.
[8]冯璐,冷伏海.共词分析方法理论进展[J].中国图书馆学报,2006(162):88~92.
[9]付鑫金,方曙,庞弘燊.基于共词分析的我国情报学硕、博士学位论文研究热点分析[J].情报科学,2011(11):1723.
[10]吴霞,冷伏海.基于文献的知识挖掘:概念、关键技术与应用[A].情报学进展(2006—2007年度评论)[C].北京:国防工业出版社,2008.
[11]梅雪雄.SPSS在体育统计中的应用(第一版)[M].北京:人民体育出版社,2008.
[12]谢龙汉,尚涛.SPSS统计分析与数据挖掘[M].北京:电子工业出版社,2012.
[13]付鑫金,庞弘燊.基于共词分析的我国情报学硕、博士学位论文研究热点分析[J].情报科学,2011(11):1723~1724.
[14]崔永衡,任振朋.马拉松“晒客”自我呈现分析——基于戈夫曼拟剧理论[J].体育研究与教育,2016(4):22~27.