王淑一,纪卫宁
基于数据挖掘技术的外语类国家级大创项目立项热点研究
王淑一1, 2,纪卫宁2
(上海外国语大学日本文化经济学院,上海,201620;青岛农业大学外国语学院,山东青岛,266109)
数据挖掘技术可应用于高校外语专业创新创业教育研究。通过数据分析发现,国家级大创项目中外语类项目占比较低,且以外语类国家级大创项目为依托的高水平论文成果较少。基于此,使用文本数据挖掘软件KH Coder分析了外语类国家级大创项目的立项热点。研究发现,创新项目主要关注文化、翻译、教育教学等领域,以应用研究为主。其中,调查方法在外语类创新项目中最为常用。创业项目集中在文化产业类,以语言服务和外语培训为主。同时,外语类大创项目存在理论深度不足、项目主题集中、计算机技术的应用不足等问题。针对以上问题,提出了相应建议。
国家级大创项目;外语教学;KH Coder;词频;词语共现网络
2011年,教育部颁发《教育部、财政部关于“十二五”期间实施“高等学校本科教学质量与教学改革工程”的意见》。意见指出,支持在校大学生开展创新创业训练,提高大学生解决实际问题的实践能力和创新创业能力[1]。2012年,教育部颁发《教育部关于批准实施“十二五”期间“高等学校本科教学质量与教学改革工程”2012年建设项目的通知》,“批准北京大学等109所高校实施16 300个大学生创新创业训练计划项目,每个大学生创新创业训练计划项目支持建设经费1万元”[2]。自此拉开了国家级大学生创新创业训练计划项目(以下简称“大创项目”)实施的序幕。国家级大创项目的实施可促进高等学校改变人才培养模式,增强学生的创新创业能力,以培养适应创新型国家建设需要的高水平人才。可以说,国家级大创项目对于高等学校的人才培养有着重大意义。然而,外语专业却存在着“立项难”的困境。据笔者统计,每年国家级大创项目中外语专业的立项项目占比不足2%,且其中大多为英语专业相关项目,小语种专业在大创项目中的立项少之又少。且外语专业的立项大多集中在语言类院校,综合性大学或者理工类大学外语专业立项更是难上加难。外语专业的“立项难”,这其中固然有外语专业较难与生产实际相结合的客观因素,但是与其抱怨“立项难”,不如思考如何在“难”中突围。而如何突围,或许现有的立项项目就是最好的参考材料。因此,本文拟借用计量分析方法,探讨国家级大创项目中外语类项目的立项热点,以期为今后外语专业师生申报大创项目提供参考。
目前大学生创新创业相关研究主要从以下两个方向展开。一是大学生创新创业教育研究,研究主体多为高校教师。二是以大创项目为依托的论文成果转化,研究主体多为高校学生。
在大学生创新创业教育研究方面,学者从教学模式、人才培养模式、项目管理模式、教学实践等方面进行了诸多探讨。除此之外,也有学者从计量的角度探讨大创项目的立项热点及存在的问题。刘继安、高众对教育部2012—2017年公布的大创项目信息进行分析发现,人文、社会科学学科立项数目整体处于劣势,但是学生参与创业活动的积极性更高[3]。同时,该研究还指出,目前大创项目主题过于集中,多样性和创新性不够。林斌、宋毅通过对2013—2018年福建省公布的大创项目信息进行分析发现,在理学、工学、农学、医学、人文、社科六大学科门类中,工学类、社科类大创项目占比较高[4]。以上研究均表明,人文类项目在大创项目中整体占比较低。然而,从目前知网检索结果来看,还未有对某一具体学科门类立项情况的计量分析。
为确认以国家级大创项目为依托的论文成果转化情况,笔者使用知网学术期刊库中的高级检索,将检索关键词设为“基金”,并输入“国家级大学生创新创业训练计划项目”,检索方式选择“模糊”,来源类别限定为北大核心和CSSCI,共检索到论文4 777篇。然而,从学科分布上看,这些论文中,人文、社科类论文仅有200篇左右,而其中外语类论文仅有徐明昊、范梓幸1篇,约为总体的0.02%。徐明昊、范梓幸结合了“一带一路”的时政热点,并引入了贸易学中的引力模型理论,研究语言对双边贸易流量的影响[5]。以外语类国家级大创项目为依托的高水平论文数量过少,这一现象值得我们深思。外语类大创项目的立项主题是否存在一些问题?因此,笔者认为,分析外语类大创项目的立项热点,不仅有助于我们了解国家级大创项目的立项倾向性,也有助于我们发现外语类项目中存在的问题,促进外语类国家级大创项目的高水平发展。
本文以2013—2018年国家级大学生创新创业训练计划项目为研究对象。之所以抽取2013—2018年这6年的数据,是因为虽然在国家级大学生创新创业训练计划平台上可以查询其他年份的数据,但是只能通过输入项目编号、项目名称等信息查询个别项目,教育部并未公布全部的立项名单。因此,本文仅以教育部公布的全部立项名单的6年数据为研究对象,所有数据均可在教育部官方网站上下载。本文采用人工甄别方式,从2013—2018年国家级大创项目中筛选出所有外语类相关项目,保留项目名称、项目简介、学校名称、项目类型等信息。在筛选项目这一环节,王昱、范武邱使用“翻译”和“译”两个关键词进行了搜索[6]。考虑到外语类专业语种的丰富性,以及研究方向的多样性,本文如果采取设置关键词的方式进行搜索,恐有遗漏,因此,全部采用了人工甄别的方式。由于数据量过于庞大(共有186 727条),在最终的数据呈现中可能会有少许误差。必须要提到的是,由于本文的意图是给外语专业师生提供参考,本次筛选中排除了非外语专业学生的外语类项目,如计算机专业学生申请的外语教育类App研发项目、中文系学生申请的外国文学研究项目等。
需要补充的是,教育部公布的立项名单中有部属高校和地方高校的区别,本文对部属高校和地方高校不做区分。另外,国家级大创项目共分为创新训练项目、创业训练项目、创业实践项目三类,本文将后两者合并为一类,把大创项目分为创新项目和创业项目两类。
本文采用文本数据挖掘软件KH Coder对研究对象进行分析。KH Coder软件由日本立命馆大学的樋口耕一教授开发,主要用于文本数据的统计分析,支持汉语、日语、英语、韩语、西班牙语等多国语言。KH Coder软件的基本功能有词频统计、词性分析、上下文关键词、检索功能、自动分类、自动聚类、摘要生成、可视化和预测功能等[7],操作较为简便。此外,对于KH Coder无法实现的功能,本文使用Python编程语言实现。
2013—2018年,教育部共批准通过国家级大创项目186 727项,其中创新项目共计156 383项,创业项目共计30 344项。表1详细列出了各年度创新项目和创业项目的立项数。需要说明的是,教育部公布的2014年国家级大创项目总计25 474项,其中包括20项联合基金项目。由于其他各年度均未出现联合基金项目,且联合基金项目也不在本文的研究对象之列,表1中2014年度总计的地方扣除了20项联合基金项目。
本文采用人工甄别方式从上述186 727项中筛选出了所有外语类项目2 718项,其中创新项目2 382项,创业项目336项,其明细如表2。从表2中可以看出,外语类项目立项数整体偏低,其最高占比为2014年的创新项目(1.93%),也并未超过2%。单从数量上来看,外语类大创项目立项数似乎整体呈现上升趋势。但是从占比上来看,2014年外语类创新项目和创业项目占比均为最高,之后逐渐下降。2016年后虽然有所提升,但是涨速比较缓慢。外语类创业项目占比整体低于外语类创新项目, 2016和2017年的创业项目占比甚至跌破1%。据刘继安、高众的调查,人文、社科类创业训练项目和创业实践项目占比均高于创新训练项目,人文、社科类学科学生参与创业活动的积极性更高[3]。然而,我们观察到,外语类国家级大创项目呈现出与之相反的情况,其背后原因值得我们深入挖掘。
表2 2013—2018年外语类国家级大创项目数量及占比
本文统计了2013—2018年外语类大创项目中各院校的立项数目,其结果如图1。如图所示,前25位的院校中,语言类院校高达10所,占总体的40%。前7名被语言类院校包揽,其中北京外国语大学和上海外国语大学两所国内知名外语院校的立项数远高于其他院校。然而我们也看到,有些不以外语专业见长的院校,如华中农业大学、中南大学等也取得了较好的立项数。而前25位的院校中,有的院校在国内大学排名中并不突出。这表明,不管该院校是不是知名院校,也不管外语专业是否是该院校的特色,只要项目足够优秀,都有可能在国家级大创项目中占据一席之地。因此,本文采用计量手段分析外语类国家级大创项目的立项热点,为外语专业师生的项目申报提供参考。
图1 外语类国家级大创项目中立项数前25位的院校
上文提到,本文提取了项目名称、项目简介、学校名称、项目类型等信息。项目名称和项目简介均能很好地反映出项目的关键词,因此,本文将分别把项目名称和项目简介作为分析对象。
从2013年到2018年,外语类创新项目共立项2 382项。表3是基于KH Coder软件做出的外语类创新项目名称的高频词表。本文将高频词按照语种、研究领域、研究方法、研究对象四个类别归类,无法归类的词语则放入“其他”中。值得一提的是,“学习”一词在表3中出现了两次,这是由于KH Coder软件是根据词类进行词频统计的,“学习”在分词环节被分成了名词和动词两个词类,笔者分别做了标注。再者,有的词可能同时属于两个类别,如“英译”一词既可以放入“语种”中,也可以放入“研究领域”中。为统计方便,下表中仅将其归为“语种”这一类别。由于KH Coder软件没有词云功能,笔者基于Python的jieba分词和wordcloud两个库,将词频结果可视化为图2。
表3 创新项目高频词表(前30位)
图2 创新项目词云
从语种来看,首先,表3中“英语”出现了781次,“英译”出现了96次。笔者用“英”字对创新项目名称进行了重新搜索,发现相关项目共计1 004项,除去“英才”“英雄”等与语言无关词语,带“英”字的项目共计999项,约占全体外语类创新项目的42%。而实际上英语相关项目的立项数目应超过此数。如华北电力大学立项的“目的论视阈下企业外宣文本翻译策略研究”,项目名称中并未体现“英语”字眼,但是从项目简介可知,其探讨的正是商务英语的问题。其次是日语相关项目,总词频表中“日本”出现了101次,“日语”出现了64次,除此之外还有“中日”“对日”“日文”“日本语”等多种词语。
从研究领域来看,文化、翻译、教育教学相关领域项目较多。本文使用KH Coder软件的上下文关键词(KWIC Concordance)功能,检索以上三领域的高强度共现词。如表4所示,文化领域主要关注跨文化交际以及中国文化传播课题,教育教学领域主要倾向于英语相关研究,多采取调查方法。而翻译领域则主要关注外宣、公示语、旅游等方面。笔者用“译”字对创新项目简介进行了重新搜索,发现与翻译相关的项目共计660项,约为总体的1/4。而其中基于地域的公示语翻译研究、旅游景点及民俗文化的外宣翻译研究高达154项。比如内蒙古大学立项的“内蒙古旅游景点对外英译研究——以昭君博物院展品说明文字中英文对译问题研究为例”,这一类项目多与地域相结合,在解决实际问题的同时,也体现地域特色。然而可以预想到,此类研究大多遵循一定的流程,结论也大同小异,较难产出高水平论文成果。外语类创新项目的同质化问题值得我们重视。另外,许多翻译项目还将翻译与学校学科特色有机结合起来,比如浙江农林大学立项的“《茶经》英译与中国茶文化的国际传播研究”,长春中医药大学立项的“意译法指导下的中药功效术语翻译实践研究”,中南民族大学立项的“景宁畲族民族史诗《高皇歌》的英译”,北京体育大学立项的“冬奥会背景下从接受理论视角看冰雪旅游外宣英译——以张家口为例”,等等。
表4 各研究领域的高强度共现词
科学研究一般可分为理论研究和应用研究。从表3显示的研究方法来看,外语类创新项目多偏向于应用研究。由于“调查”一词出现频率较高,笔者使用Python编程语言对项目简介进行重新搜索,检索到使用“调查”或者“调研”方法的项目共计771项,约占总体的1/3。换言之,调查方法是外语类创新项目的主要研究方法。另外,KH Coder软件的词频统计可以根据词类进行词频排序。值得注意的是,创新项目名称中出现了大量的地名专有名词,共计1 800次。而在这些专有名词中,“中国”(323)、“日本”(101)、“美国”(38)、“德国”(33)等与国家相关的专有名词共计出现了1 124次,而“北京”(60)、“广西”(32)、“上海”(27)、“青岛”(12)等与我国省市名称相关的专有名词共计出现了637次,这些地名主要为各立项学校的所在地,如北京外国语大学立项的“海外留学生融入北京高校校园生活情况调查”,广西外国语学院立项的“广西农村留守儿童英语学习现状调查——以东兰希望小学(解放军驻澳门部队资助)为例”,上海外国语大学立项的“德国城市轨道交通建设对上海的启示——以柏林为例”,青岛大学立项的“青岛世园会植物介绍牌纠译”等。这一结果一方面表明基于地域的实践研究相对容易立项,另一方面也佐证了外语类创新项目侧重于调查研究这一事实。表3中的“平台”一词在此多指在线平台,而“平台”“建设”等词的大量出现反映了互联网技术在外语研究领域的应用。然而“平台”相关项目主要为各种网络平台的构建,其中微信公众平台建设项目多达40余项。而检索“建设”相关项目,则主要是小型语料库及各种网络平台的构建。由此可见,虽然外语类创新项目在一定程度上利用了互联网技术,但是技术含量较低,较少引入自然语言处理、机器学习等方面的前沿技术。
从研究对象来看,“学生”“大学生”“大学”“高校”“学院”“专业”等词的大量出现,表明外语类创新项目的申报者更关注学生自身,致力于解决身边的实际问题。这非常符合大创项目“提高学生解决问题的实践能力”这一设立初衷,也充分体现外语类创新项目的特点,可谓是以学生为主体的外语类创新项目的独特之处。为了进一步佐证这一观点,本文选取2022年国家社科基金外语类立项项目(240项),对比二者的高频词语。如表5所示,以教师为主体的国家社科基金研究领域更宽广,也更为细化。然而,创新项目中较为高频的“学生”“大学生”“大学”等词语并未出现在国家社科基金的高频词语中。
表5 创新项目高频词与国家社科基金项目高频词对比
本文使用KH Coder软件制作了项目名称的词语共现网络。如图3所示,同一词群中圆的大小代表了词频的高低,而实线则代表了较强的共现关系,虚线则代表较弱的共现关系。本文参照毛文伟的研究,将同一词群的词语用线框加以标识[8]。图3的词语共现网络主要分为六个词群。第1群为翻译研究和英语相关研究。而与“英语”共现的词语主要有“学生”“学习”“能力”“调查”“现状”“就业”等。这同样表明,英语相关研究多集中在调研类课题上。第2群的主要课题为跨文化交际和中国文化传播。第3群为旅游景点及城市的公示语译介问题。然而正如上文所述,此类课题同质化现象严重。第4群为语料库及各种在线平台的建设。第5群主要为“一带一路”相关研究。笔者用“一带一路”对创新项目简介进行了重新搜索,发现相关项目90项。“一带一路”概念最早由习近平总书记于2013年提出。外语类创新项目中,“一带一路”相关研究最早出现在2015年,如西安外国语大学立项的“‘一带一路’对中国翻译事业的影响及相关建议”等。上文中提到的徐明昊、范梓幸研究也是结合了“一带一路”的时政热点。第6群主要为批评话语分析视角下的国家形象研究,研究对象多为国外的新闻媒体等。习近平总书记多次强调,要注重塑造我国的国家形象。研究国外媒体对中国的形象建构,有较高的参考意义和实用价值。第5群和第6群的主题词群提示我们,教师在指导大学生创新项目时,有必要追踪时代热点和时代前沿。
表6是基于KH Coder软件做出的2013—2018年外语类创业项目名称的高频词表。首先,从语种上看,高频词表中第1名为“英语”,共计出现了77次。英语之后是日语相关项目,总词频表中“日语”8次、“日本”3次、“日”3次、“日式”2次。这与创新项目趋势相同。其次,从创业方向上看,高频词表中的第2名是“翻译”。KH Coder软件将“翻译”一词按照词类分成了两部分,其中名词“翻译”出现次数为64次,动词“翻译”出现次数为12次。可见外语类创业项目主体是“翻译”,其次是“文化”类相关项目。与“文化”共现的词语主要有“交流”“推广”“交际”等。表6中的“培训”“教育”等词语共同指向外语培训类项目。因此,从创业方向上来看,外语类创业项目主要有翻译服务、外国文化推介、外语培训三大方向。再者,从创业形式上来看,主要有“平台”“公司”“工作室”“服务中心”等。值得一提的是词频表中第18位的“App”。近年来,随着大学生计算机素养的提高,外语专业的学生开始逐渐将外语优势与计算机技术结合起来,做出有意义的尝试,如暨南大学立项的“‘译风吹(Transwind)’手机App——掌上翻译买卖与及时交互平台”、四川外国语大学立项的“‘中医说’——面向德国人的中医养生App”等。然而必须提到的是,与外语类创新项目相同,与互联网相关的外语类创业项目主要为各种网络平台的构建,技术含量仍比较低。人工智能、大数据等先进技术较少被应用到外语类创业项目中。
图3 创新项目的词语共现网络
表6 创业项目高频词表(前20位)
本文使用KH Coder软件制作了项目名称的词语共现网络。然而得到的共现网络图比较分散,倾向性不是很明显。笔者认为,这主要是因为创业项目数量较少,不够词语共现分析的体量。因此,本文以项目简介为分析对象,制作了创业项目的词语共现网络。图4的词语共现网络比较集中,主要有三大词群。第1群主要提示了创业类项目的目的,是提高学生的专业水平,培养学生的创业实践能力。第2群和第3群则提示了外语类创业项目的两大方向:翻译服务和英语教育培训。上文提到外语类创业项目的占比低于外语类创新项目的占比。从上述分析中,我们可以大致了解个中原因。总体来说,外语类创业项目主要集中在文化产业类,以语言服务和外语培训为主。诚然,语言服务和外语培训确实是外语专业创业时的两大主流方向,然而这些项目同质化问题凸显。在实际项目申报时,如何在众多相似项目中脱颖而出,是申报者需要着重思考的问题。
图4 创业项目的词语共现网络
本文以2013—2018年国家级大创项目(186 727项)为研究对象,通过人工甄别的方式,筛选出了所有外语类项目2 718项(创新项目2 382项,创业项目336项)。通过分析发现,外语类大创项目立项数整体偏低,而其中外语类创业项目占比更低。由中国知网检索结果可以看出,以外语类国家级大创项目为依托的高水平论文数量也比较少。为深入了解外语类大创项目的立项热点以及存在的问题,本文使用文本数据挖掘软件KH Coder分析了外语类大创项目的倾向性。研究发现:①外语类国家级大创项目中,英语相关项目占据绝对优势,其次是日语相关项目。②外语类创新项目多偏向于应用研究,其中调查研究类课题约占总体的1/3。同时,与时代热点、地域、学校学科特色相结合的课题较容易立项。③外语类创业项目集中在文化产业类,主要有翻译服务、外国文化推介、教育培训三大方向。
同时,外语类大创项目还存在以下问题:①外语类创新项目以调查研究为主,这非常符合大学生创新项目的设立初衷,然而此类课题需要重视理论深度不足的问题。②无论是创新项目还是创业项目,都存在项目同质化问题。③创新项目和创业项目都在一定程度上体现了互联网技术在语言学科领域的应用,但目前来看技术含量较低,较少使用人工智能、大数据等前沿技术。基于以上问题,本文对指导外语类大创项目的一线教师提出以下建议:
(1) 加强理论学习,提高学生在理论框架下解决问题的能力。虽然大创项目的本意是提高学生的实践能力,但是没有理论支撑的研究宛如空中楼阁。目前大创项目的申报主力多为本科生。除英语专业之外,零基础的小语种专业多注重语言技能的培养,理论知识的教授不足。很多院校将语言学、文学等方面的专业课程设置为限选课,而理论知识晦涩难懂,学生更倾向于选择容易学习的课程,很多理论课甚至无法开课。由于缺少理论知识的学习,学生的问题意识不足,申报课题往往缺乏深度,也较难产出高水平的论文。本研究认为,高校外语专业应在本科阶段设置语言学、文学、文化、区域与国别等方向的必修课程。同时,一线教师在指导学生申报大创项目时,应注重学生理论知识的学习,指导学生在理论框架下解决实际问题。
(2) 关注时政热点,培养学生服务国家战略的意识。过去,外语专业大多只要求学生有较高的听、说、读、写、译能力和跨文化交际能力,其在国家战略中的地位并不明确。然而近年来,随着国家一系列政策的落地,外语专业的定位越来越清晰。习近平总书记要求我们“推进国际传播能力建设,讲好中国故事,展现真实、立体、全面的中国”[9]。在百年未有之大变局下,如何讲好中国故事,构建中国特色对外话语体系,塑造积极的中国形象,是我们每一个外语人应该思考的问题,也是我们每一个外语人应承担的使命。一线教师在指导大创项目时,应注重培养学生的家国情怀,引导学生用所学知识解决中国文化对外传播中的具体问题,服务国家发展战略。
(3) 注重学科融合,鼓励学生开展跨学科研究。2020年11月3日,新文科建设工作会议在山东大学(威海)召开,新文科建设全面启动。所谓新文科,是指“对传统文科进行学科重组,实现文科内部及文科与自然科学学科之间交叉与融合之后形成的新文科”[10]。新文科建设工作的全面推进,对外语的研究提出了更高的要求。我们不应再囿于传统的研究范式,而要积极探索外语与其他学科融合的可能性。可以看到,外语类国家级大创项目中,有不少项目体现了跨学科研究的特点,如同济大学立项的“基于语料库的失智症老年人语用特征研究”、中山大学立项的“基于人工智能的英语演讲例据使用基准研究”等。近年来,随着Python等脚本语言的普及,计算机技术逐渐呈现出简单化、平民化的趋势。数据挖掘等本应用于理工类专业的技术也逐渐应用到语言研究中。虽然外语类国家级大创项目在一定程度上结合了计算机技术,但目前看来技术含量仍比较低,有较大的发展空间。这就要求我们一线教师要与时俱进,了解人工智能等方面的技术,并指导学生运用新技术解决语言问题。
① 本文使用上下文关键词功能,检索“文化”“翻译”“教学”“学习-verb”“学习-noun”“教育”的共现词,并选取高强度共现词前10位。由于“教学”“学习-verb”“学习-noun”“教育”四词与教育教学领域相关,表4中仅展示与四词均有高强度共现关系的词语。
[1] 教育部. 教育部财政部关于“十二五”期间实施“高等学校本科教学质量与教学改革工程”的意见: 教高函〔2011〕6号[A/OL]. (2011−07−01) [2022−01−12]. http:// www.moe.gov.cn/srcsite/A08/s7056/201107/t20110701_ 125202.html.
[2] 教育部. 教育部关于批准实施“十二五”期间“高等学校本科教学质量与教学改革工程”2012年建设项目的通知: 教高函〔2012〕2号[A/OL]. (2012−01−20) [2022− 01−12]. http://www.moe.gov.cn/srcsite/A08/s5664/moe_ 1623/s3845/201201/t20120120_130542.html.
[3] 刘继安, 高众. 我国高校创新创业训练项目的实施情况、问题与对策——基于2012—2017年“国创计划”项目信息的计量分析[J]. 中国高教研究, 2018(11): 78−84.
[4] 林斌, 宋毅. 项目为导向: 地方高校创新创业教育的精准实践——基于福建省2013-2018年“大创计划”项目信息的计量分析[J]. 黑龙江高教研究, 2019(6): 119−124.
[5] 徐明昊, 范梓幸. 双边贸易的语言效应——基于“一带一路”沿线国家的实证分析[J]. 东南大学学报(哲学社会科学版), 2020, 22(S1): 157−162.
[6] 王昱, 范武邱. 近五年翻译类国家社科基金立项热点及趋势分析(2015—2019)[J]. 上海翻译, 2020(5): 18−23.
[7] 程慧荣, 黄国彬, 郑琳. 非结构化文本分析软件比较研究——以KH Coder和Wordstat为例[J]. 图书与情报, 2015(4): 110−117, 122.
[8] 毛文伟. 数据挖掘技术在学习者作文特征分析中的应用研究[J]. 日语学习与研究, 2022(2): 72−81.
[9] 习近平. 习近平谈治国理政: 第三卷[M]. 北京: 外文出版社, 2020.
[10] 胡开宝. 新文科视域下外语学科的建设与发展——理念与路径[J]. 中国外语, 2020, 17(3): 14−19.
Research on hot spots of national innovation and entrepreneurship training projects for foreign language majors based on data mining technology
WANG Shuyi1, 2, JI Weining2
(1. School of Japanese Studies, Shanghai International Studies University, Shanghai 201620, China; 2. School of Foreign Languages, Qingdao Agricultural University, Qingdao 266109, China)
Data mining technology can be applied to the research on innovation and entrepreneurship education of foreign language majors. Through data analysis, it is found that the proportion of foreign language projects in national innovation and entrepreneurship training projects is relatively low, and there are fewer high-level papers based on foreign language projects. Based on this, the text data mining software KH Coder is used to analyze the hot spots of foreign language projects. The study found that innovation projects mainly focus on the fields of culture, translation, education and teaching, and mostly consists of applied research. Among them, the survey method is most commonly used in foreign language innovation projects. Entrepreneurship projects concentrates on the cultural industry, with language services and foreign language training as the main focus. There are problems such as insufficient theoretical depth, lack of diversity in project themes, and insufficient application of computer technology in foreign language major projects. In response to the above problems, corresponding suggestions are provided.
national innovation and entrepreneurship training projects; foreign language teaching; KH Coder; word frequency; word co-occurrence network
G640
A
1674-893X(2023)06−0049−09
2022−11−20;
2023−08−09
教育部产学合作协同育人项目“英语专业应用型人才校企合作培养模式研究”(201602028010)
王淑一,女,山东临沂人,上海外国语大学日本文化经济学院博士研究生,青岛农业大学外国语学院讲师,主要研究方向:计量语言学;纪卫宁,女,山东莱阳人,博士,青岛农业大学外国语学院教授,主要研究方向:话语分析,联系邮箱:iamwangshuyi@163.com
[编辑:何彩章]