周海燕,李听炎,余碧燕
(1.山西师范大学外国语学院,山西临汾,041004 2.西安交通大学外国语学院,陕西西安,710049 3.长安大学外国语学院,陕西西安,710064)
国家社会科学基金(以下简称国家社科基金)和教育部人文社会科学基金(以下简称教育部人文社科基金)是目前国内最高级别的社科类基金,是国内最能反映人文社科界的现状与趋势的航标灯之一,也是最受国内人文社科界瞩目的。对这两类基金立项项目进行科学的分析和评价可以帮助人文社科学者更好地跟踪相关领域的学科动态,从而有效地预测所在学科领域的未来发展趋势。作为人文社科比较重要的学科分支,语言学在两类基金中也占到了一定的份额。分析研究语言学课题的立项情况有助于语言学研究者了解学科发展趋势以及国家对该领域的扶持力度,提高成功申报率。
近年来,从国家社科立项情况看对语言学项目进行统计分析的相关研究不少,这些研究时间跨度较大,且研究对象只是针对国家社科基金,虽然对语言学近几年的学科发展动态有比较准确直观的呈现,但由于研究视角比较宏观,因此很难看出立项课题本身的特点,以及立项课题的标题设计对成功入围的影响[1-6]。学者康勇、葛明贵对比分析了国家社科、全国教育科学规划和教育部人文社科三大基金语言学立项的课题,但该文只对立项项目中的高频词分类进行了统计分析,研究略显片面[7]。
本研究从微观层面对2018年度国家社科和教育部人文社科语言学的课题标题进行分析和考察。不同于以往的研究,本研究立足于各项目类别之间的差别,分析两类基金立项项目标题的关键词、高频词、句法结构及常用的两种句型进行具体分析。希望本研究对语言学研究者了解该学科的方向和热点,并根据方向和热点,定位自己的课题和研究方向,为提高申报的成功率提供一定程度上的参考。
(一)数据来源
本研究的数据来自全国哲学社会科学规划办公室网站(http://www.npopss-cn.gov.cn )和教育部社会科学司网站(http://www.moe.gov.cn) 。国家社科基金设立于1986年,资助项目主要分为年度项目(含重点项目和一般项目)、青年项目、后期资助项目、西部项目和艺术学重大项目五大类。其中年度项目是国家社科基金资助体系中设立时间最早,立项规模最大、覆盖面最广的资助项目。主要资助对推进理论创新和学术创新具有支撑作用的一般性基础研究;青年项目于2013年单列出来,用于资助和培养哲学社会科学青年人才。国家社科基金后期资助项目和西部项目同时设立于2004年,前者主要资助人文社会科学基础研究领域中完成80%以上且尚未出版的优秀研究成果;后者主要资助西部地区社科研究工作者,扶持西部地域特色、少数民族社会发展调查、文化遗产抢救、濒危语言整理和保护等方面的研究。教育部人文社科项目分规划项目、青年项目、自筹项目、西部项目和新疆地区项目以及社会科学研究专项项目。
本研究主要以2018年国家社科基金资助的“语言学”年度项目(含重点项目、一般项目)、青年项目和西部项目以及2018年教育部人文社科“语言学”规划项目、青年项目和自筹项目为研究对象,对比分析两大国家级基金在项目标题设计上的共性及差异性。
(二)研究方法
本研究采用计量语言学中的关键词统计和对比分析法,通过以下两个层面分析对比两个大的国家级基金的语言学立项课题标题的共性及差异性:1.词汇层面:关键词、高频词的分布特点;2.句法层面:项目标题的句法结构及常用句型分析。
主要处理步骤如下:1.把国家社科和教育部人文社科所在学科为“语言学”的立项课题标题提取出来,按标题和所在单位分别保存,一一标上序号,存为txt 文档,然后借助Excel 进行统计加工;2.统计标题的句长(即标题字数)分布特点,将所有标题的总字数按顺序排列,然后统计出每种句长出现的频率,比较两类基金的共性和差异性;3.统计项目标题中的关键词和高频词分布;4.分析标题的句法结构,通过标题高频词的统计,分析标题的句法结构,对比国家社科和教育部人文社科标题的句法结构上的异同。
(一)立项项目数据描述分析
2018年国家基金年度项目(含重点、一般)、青年项目和西部项目共公布立项4996 项(已排除因异议未公布的年度项目6 项),其中语言类立项353 项,约占总数的7.07%;2018年教育部人文社科规划项目、青年项目和自筹项目共立项3128 项,其中语言类229 项,约占总数的7.32%。从这个数据(表1)看,教育部语言类立项比例略高于国家社科,但无显著差异。而在国家社科项目中,一般项目占了一半以上(67.14%),与之相对应的教育部项目中,青年项目的立项率超过一半(68.12%),比规划项目(31.44%)多一倍以上。因此,可以看出,教育部基金对于青年学者的支持力度大于国家社科基金。
(二)立项项目标题微观分析
本研究运用计量语言学的一些技术和指标,对2018年语言类国家社科基金和教育部基金的项目标题进行了句长统计,并通过对项目标题中的关键词、用词信息的分析,挖掘出2018年语言学立项项目的标题特点和研究热点,以及据此对未来成功申报提出一些建议。
1.标题的句长统计
本研究利用excel 数据分列工具,对国家社科基金和教育部基金语言学所有项目标题进行了分词处理,然后分别统计出每个标题句长,这里的句长指标题的所有用字数量,再统计出每种句长的标题分布情况(见表2、图1、图2)。从表2 可以看出,国家社科标题句子最长36 个字,最短6 个字,根据每种句长的标题项目数看出,大多数标题(项目数超过10)字数分布在11-26 个字之间;教育部项目标题最长41 个字,最短7 个字,大多数标题(项目数超过10)字数分布在13-23 个字之间。通过图1、图2可以很明显地看到句长和项目数的分布特点,横坐标为标题字数(句长),纵坐标为项目数,字数分布基本类似一条正态分布的曲线,独立样本T 检验显示(表3),国家社科项目标题字数与教育部人文社科项目标题字数无显著差异(P=.062>0.05),这表明国家社科基金和教育部人文社科基金对项目标题字数的要求不尽相同,这可能和省力原则有关,省力原则是美国哈佛大学教授Zipf 在1949年出版的专著《人类行为与最小省力原则一大类生态学引论》中所提出的,指的是人们在社会活动中,总是期望付出最小的代价而获得最大的收益。对于国家级基金项目的标题而言,要想让评阅专家第一时间被标题所吸引,标题的字数不宜太多,太多不便于快速理解内容;也不能太少,太少恐表述不清。
表1:2018年国家社科基金和教育部基金总表
图1:国家社科语言类标题字数分布
图2:教育部语言类标题字数分布
表2:国家社科、教育部语言类项目标题句长分布
表3:国家社科和教育部项目标题句长独立样本T 检验结果
2.标题的关键词
本研究用ICTCLASS 2015 对国家社科和教育部语言类项目标题中的关键词分别进行了统计(由于教育部语言类自筹项目只有一项,因此该项目的关键词和高频词不做统计),分析两类国家级项目的研究热点及趋势。在进行数据统计之前,我们首先去除了标题中的标点符号,考虑到不同类别的课题所关注的重点不同,因此本研究分别从不同类别课题中截取了排名前十位的项目标题关键词。如表4 所示,关键词数量在一定程度上代表语言学在该项目类别中的关注度,即热度。立项关键词频次反映出关注度差别,由此可以推测2018年语言学热点问题有哪些,便于来年申请项目时对于热点问题的把握[8]。
表4 显示,今年国家社科和教育部语言类项目关注的热点仍然是“语言”“现代汉语”“中国”“语法”,学者蒋跃、祁玉玲发现,汉语及相关研究的热度最高,本研究结果与之类似。由此看来,有关汉语的研究是历年语言学国家社科立项的焦点[6],也是教育部科研支持的重中之重。
表4:国家社科、教育部语言类项目标题关键词分布
不过,从不同项目类别看,关键词仍略有不同。国家社科重点项目是现阶段国家社科基金中层次较高,资助力度较大,权威性较强的项目类别,是国家社科研究的重要风向标之一[8]。该项目往往紧跟时代需求,解决的是我国社会科学发展过程中面临的重大问题,这些课题直接关乎国家科研战略的决策。因此,重点项目的关键词往往涉及面比较宏观,涵盖内容比较宽广,比如“汉语”“外语”“体系”“神经”“跨境”等。青年项目主要是面向青年学者或者刚毕业的博士,方向呈多样化,而且出现了一些与时俱进的新词“动态”“多模态”“语法化”等。一般项目覆盖面最广,不论是年龄限制,还是职称要求,都较之前两者范围大,因而此类项目关键词也出现了一些不同的词“方言”“语义”“汉语趋向动词”“翻译”等,这些关键词往往是语言学大类下的二级乃至三级学科,由此可见,标题中出现具体学科更容易引起评阅专家的注意。最后,国家社科西部项目主要面向几个西部地区和省市,也是为了扶持科研较薄弱的西部。但是,从今年前十的关键词来看,有关西部研究的项目标题只出现了“蒙古语”,西藏、宁夏、青海等地的地方语言研究仍比较滞后,值得未来申请者加以重点关注。
对比教育部项目标题关键词,与国家社科略有不同。比如教育部规划项目语言学立项课题名单中,排在第一位的关键词是翻译,第四位和第五位分别是网络话语和二语,青年基金项目也有一个比较新的词“构式”,这说明国家社科更关注语言学中的经典、传统内容的研究,而教育部基金则更关注信息化时代新出现的语言问题的研究以及汉语之外的其他语种的研究。比如关注“翻译”,说明翻译活动的作用日益突出,对翻译现象的观察与思考逐步成为各领域学术研究关注的热点问题[9]。国家社科项目中“翻译”虽然不是第一位,但也位于一般项目的前十行列,这预示着翻译研究未来强劲的发展势头,不过,翻译与语言学的结合可能稍显不足,才使得在语言类项目中“翻译”作为关键字的权重不及其他。“网络话语”作为一种新生事物,新的语言变体,反映出某个时期的民族情绪与社会心理,加强对网络话语的监测是国家文化安全战略的重要组成部分[10],因此教育部对此课题的关注也是国家构建安全网络话语体系的需要。“二语”研究从来就是一个经久不衰的话题,研究二语习得,比较汉、英两种语言间的内在联系与区别,不过近年来有关网络环境下的二语交际行为研究逐渐增多,成为新的研究趋势[11],这一点从教育部青年基金项目的关键词中可略窥一二。
总之,两个国家级语言类项目的关键词反映出各基金的关注热点,申报者在申报前一定要确定自己项目的关键词,做到准确申报,投其所好。
关键词可以反映国内哲社科界关注的研究热点以及国家近年来社科基金的立项倾向。高频词则不仅可以反映研究热点,更可以反映标题的用词特点以及句法特点。
3.标题的高频词和句法分析
本研究中的高频词是指从所有语言类立项课题的标题中统计出来的,多次重复出现的字词。本研究使用ICTCLASS 2015 进行分类统计(见表5)。学者徐润华、王东波在统计高频词的过程中保留了标点符号,从书名号和双引号可以反映项目内容大多是关于著作、典籍或者命名实体的研究选题[12]。吴珊统计高频词时去除了功能词和与实质内容无关的词,主要是为了考察语言学近几年的关注热点,这些都是研究高频词比较好的方法[8]。但是本研究主要想通过对比几类项目标题的高频词的使用,总结出项目标题的句法特点,为未来项目申报者撰写项目标题提供可借鉴之处,因此在统计高频词之前只剔除了所有的标点符号,而对功能词未做处理。而ICTCLASS 作为国内比较通用的汉语词性标注软件,其准确率高达98%,可以用来帮助我们进行标题中的词性标注分类工作。
表5:国家社科、教育部语言类项目标题高频词分布
从表5 可以看出,不论是国家社科还是教育部项目,下面这几个词都是高频词:“研究”“的”“基于”“与”“汉语”“下”,为什么题目中会反复出现连词、介词、助词呢?这是因为社会科学项目标题中基本不会出现问句形式,也不会出现主谓结构的陈述句形式,多以偏正结构的名词性短语为主,而这些名词性短语需要借助于连词、介词和助词来搭配。更具体地说就是两类项目标题以“基于……的研究”和“……下的研究”两种句式最为常见。为验证这一点,本文对“基于……研究”和“……下”的标题进行了统计(见表6)。
表6:“基于……研究”和“…….下”的标题
虽然两类基金的项目标题内容丰富,形式多样,但是“基于……研究”和“……下”两种标题所占比重较多。其中国家社科项目中一般项目类别使用此种标题的分别有35 项和38 项,所占比重均超过10%,教育部项目中青年项目使用这两种标题的分别有32 项和34 项,也超过10%。由此我们推断,这两种句式比较适合于社科类项目标题。以“基于……研究”和“……下”为主要结构的句式是汉语典型的偏正结构,主成分在结构的后半部分,一般是研究的对象或者研究目的,前半部分是研究的前提条件、理论基础或者研究方法,比如:“基于知识图谱的汉语趋向动词非空间义研究”,知识图谱是研究方法,研究对象是汉语趋向动词非空间义研究;再比如“社会性别视角下女性媒体工作者的职业发展研究”,标题中的“社会性别视角”表明理论基础是社会语言学,研究目的是讨论女性媒体工作者的职业发展。从标题中很容易能获取到项目的重要信息,能很快吸引评审专家的注意力。因此申请者以这两种结构来撰写题目会给项目申报增加几分成功率。
本研究从词汇和句法角度统计分析了2018年353 个国家社科基金和229 个教育部人文社科基金的语言类项目的标题特点,描述并总结了2018年语言学研究的现状和可能发展趋势。
(一)从词汇层面看,国家社科和教育部基金的一些语言细节需要关注。比如,两类基金的标题字数基本都分布在11-26 个字之间,比较集中,方便评阅专家阅读。再比如,从话题、选题,即关键词上看,国家社科基金项目主要关注如汉语本体和方言等比较经典和传统的语言学研究话题,而教育部基金项目更关注比如网络、语言动态性发展等新的研究领域。预计2019年国家社科项目和教育部基金项目可能仍会把重点放在与汉语语言相关的话题上,建议申报者可以多关注此方面的相关研究。
(二)句法层面上,立项项目比较常用的两个句式是“基于……研究”和“……下”两个偏正结构。这两个结构便于展示申请者想要表达的重要信息,也方便评阅专家抓住标书的核心思想,提高申报成功率。
基于以上微观分析,本文建议以后的申报者在拟定项目题目时要仔细斟酌语言搭配和句式平衡,惜字如金,把项目的主要研究内容、目的、方法乃至创新点在合理的数字范围内简洁明了地展现出来,让评阅专家一目了然,省时省力。
不同于以往的研究,本研究只考察了2018年国家社科基金和教育部人文社科基金中语言类立项项目的标题特点,希望通过更细微、更具体地分析为未来项目成功申报提供一些建议和预测。同时也希望国家继续加强对中西部青年科研力量的大力扶持。