基于大数据的“一带一路”沿线国家中文学习关注度研究*

2022-10-09 05:11何山华杨晓春
关键词:检索趋势汉语

何山华, 杨晓春

(扬州大学 外国语学院,江苏 扬州 225127)

引 言

不同国家的人民之间,在语言和文化维度上的相似或接近程度,与两国在其他领域的交流密切程度具有高度相关性。(1)Hutchinson.Does ease of communication increase trade?Commonality of language and bilateral trade[J].Scottish Journal of Political Economy,2002,(5).实证研究显示,一旦两个经济体之中使用相同语言的人数达到一定比例,双边贸易就会有显著增长。(2)Melitz.Language and foreign trade[J].European Economic Review,2008,(4).在“一带一路”沿线国家加强中文传播,对于实现与相关国家的贸易畅通、民心相通等“五通”合作,具有先导性和基础性作用。及时探知各国的中文学习需求,则是有效开展中文国际传播资源部署的重要前提。不过囿于技术和资源等限制,目前我们尚无法准确获得世界各国中文学习需求的数据,更无法掌握这一数据的动态变化情况。

本文尝试使用大数据技术,通过对搜索引擎关键词的追踪,观测“一带一路”沿线各国民众对中文学习关注度的变化,试图通过大样本数据对各国中文传播环境进行评估。同时基于这一案例,探讨了语言管理过程中的“关注”环节等理论问题,以期为相关工作的开展提供参考。

一、文献回顾

国内迄今已有较多研究关注世界各国中文传播的发展情况,主要是通过HSK考试人数、来华留学人数等既有数据进行间接估算。采用这种方法存在两个问题,一是估测数据的准确性受到质疑,二是基于这些数据进行动态研判预测的效果也远不够理想。安亚伦和段世飞根据各国来华留学人数和孔子学院数量的增长判断中文国际教育市场正在增长且潜力巨大。(3)安亚伦,段世飞.“一带一路”倡议下的汉语国际教育:现状、问题及对策[J].湖南师范大学教育科学学报,2018,(6).谢孟军从各国参加汉语水平考试(HSK)人数的增加认为这些国家中文学习的吸引力在增长。(4)谢孟君.语言自信能否推进产能合作:HSK数据的实证检验[J].世界经济研究,2019,(3).过国姣通过文献研究发现各国将中文教育纳入中小学国民教育体系和高校专业教学的情况增速明显。(5)过国姣.“一带一路”沿线国家汉语国际教育发展新趋势及对策研究[J].现代教育科学,2019,(7).黄方方通过对各国与中国经贸总量的变化来判断中文使用的需求。(6)黄方方.“一带一路”沿线国家汉语教育状况探析[J].河南师范大学学报(哲学社会科学版),2017,(3).邢欣和张全生则通过在中亚国家开展实地调查发现中国企业在这些国家创造了切实的高层次和普及型中文人才需求。(7)邢欣,张全生.“一带一路”倡议下的语言需求与语言服务[J].中国语文,2016,(6).此外还有不少类似研究,大都采取上述方法反向推测各国对中文人才的需求,并做出乐观判断。(8)赖林冬.“一带一路”背景下东盟孔子学院的发展与创新[J].南洋问题研究,2017,(3);李琰,阿勒满詹.“一带一路”战略下的哈萨克斯坦高校汉语教育现状及其新变化[J].民族教育研究,2016,(6);李宝贵,刘家宁.“一带一路”战略背景下孔子学院跨文化传播面临的机遇与挑战[J].新疆师范大学学报(哲学社会科学版),2017,(4);杨煜.“一带一路”背景下汉语国际推广研究[D].西北大学博士学位论文,2018.但一些同期研究则基于其他数据提出了不同的观点,比如尹春梅等认为各国孔子课堂的分布数量和增长速度实际上都很不理想,而中文国际推广未能根据对象国情况进行精准资源投放和调整推广形式导致了工作中的困难。(9)万莜铭.“一带一路”进程中汉语国际推广问题探究[J].江西社会科学,2017,(4).由此可以发现,现有研究在国际中文传播环境的评估方面,需要实现方法论上的革新,目前还难以做到准确观测和分析。

国际上对于语言学习需求的分析,实际上有较长的研究历史。(10)澎湃.国内外外语需求分析研究的发展历程[J].江西师范大学学报(哲学社会科学版),2022,(5).在现有文献中,对此类需求的调查大都使用问卷、访谈等形式,对目标人群进行抽样量化调查(11)张黎.汉语在国际商务领域使用状况调查与分析[J].语言教学与研究,2012,(1);郭素红,杨亚军.留学生汉语学习情境需求视角下的动机削弱研究[J].新疆师范大学学报(哲学社会科学版),2012,(2);戴曼纯.我国外语人才需求抽样调查[J].外语教学与研究,2016,(4).或通过观察、测试、个案跟踪调查等进行质性研究(12)郭素红,吴中平.留学生汉语需求分析的理论与方法[J].汉语学习,2012,(6);倪传斌.外国留学生汉语的学习需求分析[J].语言教学与研究,2007,(1).。但这种传统研究方法实际上受到很多条件的限制,对于研究者的语言素养、资源调配能力提出很大的挑战,很难展开较大范围甚至是跨国规模的调查。自进入数字化时代之后,国际和国内学界都注意到语言学研究,包括语言教育与社会语言学,都必须与大数据结合起来。(13)Fruehwald.Big data and sociolinguistics[J].Penn Linguistics Conference,2015.而利用搜索引擎数据来监测甚至预测公众的兴趣点,是一个已经发展相对成熟的技术方法。较早的经典研究是Eysenbach通过搜索引擎开展的流行病学研究,(14)Eysenbach.Infodemiology:The epidemiology of (mis) information[J].The American Journal of Medicine,2002,(9).即通过统计美国各地检索流感相关症状、疾病和治疗信息的关键词数据来追踪和预测流感的传播(15)Eysenbach.Infodemiology:tracking flu-related searches on the web for syndromic surveillance[J].AMIA Annual Symposium Proceedings.American Medical Informatics Association,2006;Ginsberg,et al.Detecting influenza epidemics using search engine query data[J].Nature,2009,(457).。该研究开创了使用搜索引擎数据来监测公众兴趣的研究方法,启发了后来大量研究者在其他领域的跟进,比如在经济学领域通过检索趋势预测失业率、汽车销量、房屋销售和旅行热点;(16)Askitas,Nikolaos & Klaus Zimmermann.Google econometrics and unemployment forecasting[J].Social Science and Electronic Publishing,2009;Choi & Varian.Predicting the present with Google Trends[J].Economic Record,2012,(88);沈苏彦,赵锦,徐坚.基于“谷歌趋势”数据的入境外国游客量预测[J].资源科学,2015,(11).在心理学领域监测公众在特定事件背景下对心理健康、政治和暴力等元素的关注;(17)Goodman-Casanova JM,Dura-Perez E,Guzman-Parra J,Cuesta-Vargas A,Mayoral-Cleries F.Telehealth home support during COVID-19 confinement for community-dwelling older adults with mild cognitive impairment or mild Dementia:Survey Study[J].J Med Internet Res,2020,(22).在传媒学领域对全球193个国家民众的媒体事件关注情况进行横向对比;(18)Kwak.H.,An.J,Salminen J.What we read,what we search:Media attention and public attention among 193 countries[J/OL].https://doi.org/10.1145/3178876.3186137.国内也有不少基于百度指数开展的流行病传播、入境游客数量预测、文艺作品流行度等研究(19)王璐,张娟.基于百度指数的H7N9传播动力学模型研究[J].云南师范大学学报(自然科学版),2018,(2);吴昊澄,鲁琴宝,丁哲渊,王心怡,傅天颖,杨珂,吴晨,林君芬.基于百度指数和手足口病的疱疹性咽峡炎预测模型研究[J].预防医学,2022,(3);朱寒婷,尹敏,贺樑.基于首播前搜索数据的电视剧流行度预测[J].计算机工程,2017,(7);陈洪,肖蓬,陈鹏.基于百度指数的艾滋病疫情时空分析[J].福建师范大学学报(自然科学版),2016,(3);沈苏彦,赵锦,徐坚.基于“谷歌趋势”数据的入境外国游客量预测[J].资源科学,2015,(11).。目前基于搜索引擎数据对全球语言学习兴趣进行观测的学术研究尚不多见,仅有个别语言学习软件开发商对2021年疫情防控期间各国外语学习检索情况进行了简单统计,发现英语仍然是全球范围内最受欢迎的外语,而中文在日本、泰国、新加坡、越南和马拉维等国排名第一。(20)Wortips网站.Which Language Does Every Country Want to Learn?[EB/OL].https://word.tips/multilingual-world/.本研究拟借鉴上述研究,基于谷歌趋势、关键词检索量等数据,对“一带一路”沿线各国民众的中文学习关注度进行观测。

二、理论视角

对语言学习市场需求的动态观测数据,可以在实践层面帮助中文国际传播管理者预判资源需求的发展变化并及时做出调整和部署。同时,这种基于大范围观测展开的规划行为,也有助于我们在理论层面理解语言管理过程的发生机制,比如宏观语言管理与微观层面需求的关系。

“语管论”提出,微观和宏观管理之间存在着一个连续激发的循环,在理想状态下,底层需求会促动高层管理者实施规划行为,并反作用于微观层面解决需求问题:微观层面需求宏观层面管理微观层面问题解决(见图1)。(24)Sherman,T.Language management on the front lines:A report from Dunajská Streda Language Management Workshop[J].Report on the Research Projects,2007,(154).不过这一过程可能起始或中断于任何阶段,这意味着底层和高层均可以通过自身能动性发起一项宏观规划行为。中文学习近年来在世界各国出现增长,同时各国出现相关规划措施;但其中值得探究的是,究竟是社会底层的中文学习需求促发了各国政府的政策制定,还是社会精英通过政策措施在引导更多民众学习中文?

图1 宏观-微观语言管理循环图

本文将通过大数据技术获取“一带一路”国家民众对中文学习的关注度数据,借此讨论各国中文教育规划行为的性质,并探讨“关注”对于国际中文教育管理的作用。

三、研究方法

本文的基本假设是:“一带一路”沿线国家的个体,在对中文学习产生兴趣后,会在网络上使用其母语检索相关信息,因此研究者可以通过对相关关键词的检索次数和热度进行观察并判断一个地区民众对中文学习的关注程度。具体而言,本文主要关注自21世纪以来“一带一路”国家民众对中文学习的兴趣呈何种发展和分布特征。

Ripberger曾对基于关键词检索展开的研究提出过质疑,即某一搜索引擎是否反映检索总量,是否存在网民群体偏差等问题。(29)Ripberger,J.T.Capturing curiosity:Using internet search trends to measure public attentiveness[J].Policy StudiesJournal,2011,(39).根据流量分析网站Similarweb的数据,2022年4月的全球所有平台检索数据分析,谷歌占据91.04%的市场份额,在土耳其等国家则高达99%以上,即使是在份额较低的俄罗斯也有74.65%,是目前市场上使用最为广泛的搜索引擎,覆盖了最大的用户群体,其数据可以反映一般民众的使用习惯。而根据数据统计网站Statista的数据,2022年全球网民数据已经达到50亿(30)Global digital populafion as of Spril 2022[EB/OL].https://www.statista.com/statistics/617136/digital-population-worldwide/.,占全球人口的65%,可以较好地覆盖全球范围内对外语学习存在真实兴趣的人群。

本研究的具体操作思路可以分为如下步骤:

(1)选定国家。本文聚焦于“一带一路”沿线国家。“一带一路”倡议自2013年提出以来,已逐步从构想进入实施阶段,但官方并未对这一倡议的参与方限定过范围,因此并不存在一个明确的名单。在初期,学界有过64个国家的说法,(31)杨亦鸣.前言[A].“一带一路”沿线国家语言国情手册[M].北京:商务印书馆,2015.但目前“推进‘一带一路’建设工作领导小组办公室”主管的“中国一带一路网”上列出了149个国家(32)中国一带一路网:“各国概况”板块[OL].网址:https://www.yidaiyilu.gov.cn/info/iList.jsp?cat_id=10037.。本文根据数据的可获取性,选取了其中位于亚洲、欧洲和非洲的50个国家,作为观察对象(见表1)。研究者联系上述国家在华留学生,请其提供本国语言中可用于检索中文学习相关的关键词,各相关国家检索使用的语言见表1。(33)为检索方便,该表中所有阿拉伯联盟国家均使用了阿拉伯语,独联体国家和乌克兰等广泛使用俄语的地区则使用了俄语检索,其他多语国家则根据所联系到的留学生母语确定检索语言,因此检索使用的语言并不一定是该国官方语言。

表1 关键词检索覆盖国家及使用的语言

(2)选定关键词。本研究的难点在于各国民众在检索其感兴趣的信息时必定倾向于使用其熟悉的语言,而研究者无法掌握所有国家的语言。经过多次尝试后,研究使用了分类搭配的方式确定了关键词组合。具体方法为:请受访留学生提供两类关键词,一类是关于中文表达方法的关键词,如中文中可能有汉语、中文、普通话,英文中可能有Chinese,Mandarin,Putonghua,甚至Cantonese;另一类是关于学习的关键词,如中文中可能有学习、教学、教育、培训、课程,英文中可能有learn,study,teach,train,course等。在获得两类关键词后,第一类关键词可直接作为关键词进行检索,同时将第一类和第二类关键词两两搭配,获得多组关键词用于检索。研究者用“问卷星”工具将上述提供关键词的请求制作成问卷,发往国内不同地区的8所高校,以达到较好的留学生国籍覆盖率,并要求每个国家至少发送3个以上的受访者。研究者共计回收119份问卷,去除其中填写时间过短、答案相关度较低的问卷,再对获得的关键词进行比对,通过翻译工具进行确认,最终确定了50个国家的关键词为有效数据。

四、数据采集与处理

第一步,使用Python编写爬虫程序,获取上述关键词组合自2004年以来的谷歌趋势信息(谷歌仅提供2004年以来数据)。总共获得41个国家的相关信息,有9个国家未获得任何关键词的信息,这是因为如果某个关键词检索数量未达到一定量级,谷歌不提供该关键词的变化趋势信息。

第二步,爬取上述50个国家“HSK”(汉语水平考试)这一关键词的谷歌趋势信息和谷歌检索次数。本文认为,真正的中文学习兴趣,最终将转化为中文学习行为,并且其中有一部分学习者会参加HSK考试以获得专业认证。最终获得36个国家的HSK检索热度信息,有14个国家因检索数量较少未显示热度信息。不过我们获得了50个国家所有的HSK检索数量信息。

第三步,根据上述统计结果对涉及的50个国家进行分类。我们将所有国家按照变化幅度分为上升、稳定和下降等类别,在分类过程中遵循了如下分类原则:(1)关键词热度数据和HSK热度数据上升和下降趋势一致,根据变化幅度进行自然归类;(2)未获得HSK热度数据,则根据HSK检索次数并参照关键词热度数据进行分类;(3)关键词热度和HSK热度仅有一种发生变化,另一种显示稳定不变,则根据变化情况进行分类;(4)关键词和HSK热度不一致,则同时检索相关国家的关键词内容和HSK检索次数以进一步研判,进行分类。

五、结果与讨论

(一)总体趋势

本文采取两种方法判断总体变化趋势。

一是看逐年变化幅度数据。即将某一年热度数值减去上一年度数值,再除以上一年度数值,通过增减幅度(显示为正值或负值)看逐年变化。数据显示,自2004年以来,各国获得关键词热度数据的所有年份中,41%的年份呈下降趋势,而47%呈上升趋势,另有12%呈持平趋势,所有年份变化幅度的平均值为12.3%,显示近20年来“一带一路”国家对中文学习的兴趣呈总体上升趋势。如果聚焦于HSK的检索情况,这一趋势更为明显,63.16%的年份呈上升趋势,2013年“一带一路”倡议提出之后,80%的年度呈上升趋势。

二是看某一国家关键词热度变化的数值。即自2004年至今,热度值逐年变化后所达到的数值与2004年相比总体上是上升还是下降。我们将所有国家按照变化幅度分为快速下降、缓慢下降、稳定不变、缓慢上升、快速上升5类,见图2。需要说明的是,本文重点关注2010年之后的变化趋势,这是因为2005年时全球互联网普及率仅16.8%,而到2010年移动设备较为普及后达到29.3%,具有更高的覆盖率。(34)Percentage of global population accessing the internet from 2005 to 2021, by market maturity[EB/OL].https://www.statista.com/statistics/209096/share-of-internet-users-in-the-total-world-population-since-2006/.统计发现,有30个国家,即60%的国家呈上升趋势,有20%的国家未发生变化,而呈下降趋势的占22%(见图2)。

图2 不同国家检索变化趋势对比

数据显示,“一带一路”国家的中文学习兴趣自进入21世纪以来呈总体上升趋势,主要变现为逐步加速和广泛上升两个特征。逐步加速主要表现在,各国的中文学习兴趣在2004年以后的绝大多数年份都呈上升趋势,而2013年以后上升年份的比例更高;广泛上升则表现为本研究调查的50个国家中有39个国家的中文学习兴趣呈稳定或上升趋势,且其中有22个以较大速度上升。

(二)分地域讨论

对所有50个国家按照亚洲、非洲和欧洲3个区域分别进行观察,则会发现各国的中文学习兴趣呈现为亚洲领跑、非洲稳健、欧洲迟滞的特征。

亚洲32个国家中,共计有24个国家呈稳定或上升趋势,其中13个国家快速上升,仅有3个国家是快速下降。快速上升的国家缅甸、巴基斯坦、孟加拉国、柬埔寨、老挝、沙特、越南、蒙古、伊朗、马来西亚、泰国、亚美尼亚、塔吉克斯坦等13个国家,而下降较快的国家是阿曼、叙利亚和也门。

部分研究显示,自2005年以来,世界各国,尤其是东亚、南亚、东南亚各国民间对华友好态度,总体是呈下降趋势的。(35)Xie,Y.,Jin,Y.Global attitudes toward China:Trends and correlates[J].Journal of Contemporary China,2022,(31).不过与此相反的是,南亚和东南亚国家民间对汉语的兴趣在不断增长。考虑到这些国家在地理上离中国较近,且经济上的联系非常密切,可见地缘和经济的影响是最为切实的,其影响超过网络或媒体炒作的主观态度。

比如越南“学习中文”检索词呈逐年上升趋势(见图3)。

图3 越南“学习中文”检索热度变化趋势

这一趋势与越南“HSK”检索数据相符(见图4)。

图4 越南“HSK”检索热度变化趋势

中东地区的3个国家呈下降趋势,很可能是受部分国家当地政治局势的影响。以叙利亚为例,该国在2004~2010年之间呈快速上升趋势,2008年达到100,而2010年是86。但2011年叙利亚危机发生之后,剧降到16。可以推测是由于发生了战事,民众的注意力不再放在中文学习上,而是转向了其他更为重要的事情。但如果从2011年的最低点往后,实际上是不断增长的,在疫情前达到45,并在2022年保持了上升趋势(见图5)。

图5 叙利亚“中文教育”检索热度变化趋势

也门对中文的关注度,也随着国内政局变化而变化。比如在2004~2010年,中文的热度从最高点的100断崖式下降到最低点11,而这段时间正是也门从内战爆发到签署停战协议的时期。2011年之后发生显著回升,但随后遇上“阿拉伯之春”以及国内形势再度恶化,中文热度随即下降。随后虽保持在低位,但近年来也保持了总体上升趋势(见图6)。

图6 也门“中文”检索热度变化趋势

在欧洲10国中,增长较快的国家有塞尔维亚、白俄罗斯、罗马尼亚等4国;而下降较快的2个国家是波兰和摩尔多瓦;其他有4个国家显示为缓慢下降或不变。

近年来我国与中东欧国家的交往不断密切,在该地区影响力不断增加。2012年至2020年,中国与中东欧17国双边贸易年均增长8%,是中国与欧盟贸易增速的2倍以上(36)人民网:中国与中东欧17国贸易比增长约五成[EB/OL].https://baijiahao.baidu.com/s?id=1699591271950222286&wfr=spider&for=pc.2021-05-13.。在欧洲,有一种声音认为我国在中东欧地区的影响正在增加,甚至将该地区称为是中国打入西方的“特洛伊木马”。(37)Brattberg,Erik and Evan A.Feigenbaum.China’s Influence in Southeastern,Central,and Eastern Europe:Vulnerabilities and Resilience in Four Countries[J/OL].https://carnegieendowment.org/2021/10/13/china-s-influence-in-southeastern-central-and-eastern-europe-vulnerabilities-and-resilience-in-four-countries-pub-85415.2021-10-13.但从我国与中东欧的经贸总量上看,实际上2020年才首次突破千亿美元,与当年我国与东盟贸易额的6414亿美元和2021年与欧盟的8281亿美元相比差异巨大。因此中文在该地区的影响力无法与在东南亚相比也是可以理解的。

据一些调查显示,波兰是中东欧地区对美和对华态度相差最大的国家,即对华好感度最低的国家。(38)Xie,Y.,Jin,Y.Global attitudes toward China:Trends and correlates[J].Journal of Contemporary China,2022,(31).根据波兰本土调查显示,汉语在波兰确实不是一门热门语言,少量人对汉语感兴趣,但同时认为汉语难学。(39)Maciej,Arent Pawel.波兰卢布林市汉语教学情况调查研究[D].四川外国语大学硕士学位论文,2021.摩尔多瓦的汉语学习人数总体较少,有不少人寻求到邻国罗马尼亚学习,因为那里汉语教学体系更为成熟。HSK未提供热度数据,因为考试费用高、考试结果急迫性低等因素,参加HSK考试的人数比例较低。(40)运欣.摩尔多瓦自由国际大学孔子学院汉语教学现状调查报告[D].西北师范大学硕士学位论文,2016.

在本次调查的非洲8国中,增长较快的国家包括埃塞俄比亚、南非、摩洛哥、刚果、肯尼亚等5国,其他3国显示为稳定不变或缓慢增长。非洲与我国关系较好,所以没有国家显示中文热度下降,而仅有少数国家显示上涨较慢。

(三)分地理位置讨论

谷歌工具可以提供检索者所在位置,因此我们同时也关注了HSK这一关键词检索量发生的地理信息,其总体特征是大量检索集中发生于HSK考点周边地区。我们从网络上爬取到16个设有HSK考点的国家,其中7个国家的HSK考点超过10个,而9个国家的考点只有1~2个。结果显示,所有HSK考点数量较少的国家,相关检索就集中在首都等大城市,而这些城市一般正是孔子学院、HSK考点所在的地区。如果HSK考点数量较多,则相关检索发生的地区就覆盖较大的地理范围。

比如埃塞俄比亚首都亚的斯亚贝巴有2个HSK考点,则几乎所有的检索都集中于亚的斯亚贝巴。其他有类似情况的包括喀麦隆、亚美尼亚、格鲁吉亚、阿塞拜疆、保加利亚、斯洛文尼亚、塞尔维亚、伊朗。

巴基斯坦考点数量较多,分布于伊斯兰堡、信德省、旁遮普省等处,则HSK检索主要集中于这些地方。而泰国考点数量更多,覆盖了大多数大型城市,也使得中文学习的影响辐射到大部分城市和地区,HSK搜索分布也比较广泛。其他具有类似情况的则包括越南、马来西亚、印度尼西亚等国。

(四)分时段讨论

从时间跨度上看,“一带一路”国家对中文学习的兴趣,呈先快后慢再加速的发展过程,且全球新冠疫情对此只有短暂影响。我们观察到,在所有国家中出现热度增长达到100(最高值)的年份,主要出现于2010年之前(13次)和2018年之后(24次)。在2011年至2017年之间有长达8年的空档期(图7)。如果我们考虑到2010年之前的网络普及率,特别是2004~2007年期间,全球网络普及率只有不到20%,那么2018年之后的变化就更为重要。很有可能是“一带一路”倡议提出后,有一段时间的滞后效应,到2018年才开始显现出相应的影响,可见“一带一路”倡议提出确实有效提升了沿线国家的中文学习兴趣。

图7 “一带一路”国家中文学习相关关键词检索热度达到100的年份数

我们特别关注了新冠疫情对学习兴趣的影响。根据所有关键词2020年迄今的热度变化幅度,发现一个显著的V型变化曲线。即2019年呈上升趋势,但2020年有显著下降,而2021年又恢复上升趋势(如图5~7中均显示了这一趋势)。可见疫情的影响是真实存在的,但由于我国对疫情控制较好,对生产生活的影响相对较小,甚至出现国际贸易逆势上涨的情况,“一带一路”国家对中文学习的兴趣仍保持了快速上升的大趋势。

(五)启示探讨

基于上述数据,我们可以对国际中文传播的宏观层面规划及其可能理论启示进行探讨。

首先,“一带一路”国家的中文教育管理,是一种存在广泛民意需求基础的宏观规划活动。数据显示,“一带一路”沿线国家,每天均产生着总量巨大的中文学习相关关键词检索。即使是在关键词热度未显示的国家,也存在数量较多的检索行为。这些检索都显示中文学习是一种具有切实底层需求的活动。在“语管论”看来,理想情况下,这种需求会被高层管理者所关注到,并启动宏观管理程序来满足这一需求。鉴于此类检索自2004年起就大范围存在,从事件发生的时序上看,在“一带一路”国家,应当是先有民间需求,再有政府规划。据我国教育部统计,目前已有180多个国家和地区开展中文教育,70多个国家主动将中文纳入国民教育体系。(41)光明网:70多国将中文纳入国民教育体系,国外累计近2亿人学习使用中文[EB/OL].https://m.gmw.cn/baijia/2021-07/07/1302392784.html.2021-07-07.这种规划总体上是政府对基层需求的积极回应,至此形成了“语管论”所描述的管理循环的第一步“微观层面需求宏观层面管理”。同时需要注意的是,这种民间需求的产生,在一定程度上也是自上而下式管理的结果。关键词检索的地理信息显示,孔子学院所在城市似乎存在着更大的学习需求,这说明中文国际教育在全球的传播,与我国相关组织的大力推进有相关关系。“一带一路”倡议提出以来,宏观层面的鼓励与引导,可能也创造了一部分需求。

但是,这一宏观规划最重要的其实在第二步,即“宏观层面管理微观层面问题解决”。完成这一传导取决于两个条件:第一是在各国民众中所出现的中文学习需求,能够被管理者所关注到;第二是管理者对关注到的需求,能给出及时精准的回应。就目前的数据来看,这一步骤确实在部分程度上得到落实,比如关键词检索热度高的国家,有更高的比例出现较高HSK热度,说明不少学习兴趣转化成了真正的学习行为。大数据技术可以对这一步骤有所推进,即帮助管理者发现不同地理范围、时间范围(实际上如果对用户信息进行更多的分析,还可以包括性别、年龄、教育程度等)中存在中文学习需求,并进行精准的回应以满足这种需求。

从理论层面上来说,“关注”到特定语言现象,是情况评估、发起规划、实施干预的前置步骤,是开展语言管理的前提条件。对于中文国际传播来说,管理者要主动建立多种有效渠道,对世界各国的语言学习需求进行监测。此类渠道包括网络数据监测、专家调查、学习团体反馈等。对此类需求的精准把握,可以有助于中文教育资源的提前配置和精准部署,提升中文传播效果。从管理循环上来看,管理者一方面要注意关注底层需求,及时启动管理程序以解决问题。同时也要注意这种管理行为,是否与底层需求存在错配,比如在汉语教师和汉语学习材料的分配方面,是否能精准投放。比如我们的数据显示,全球新冠疫情发生以来,实际上中文学习检索词在多国出现了热度大幅提升的现象,这就考验我们在疫情防控措施的限制下,能否有效满足这种需求。

结 论

本文尝试使用搜索引擎的关键词检索数据来观测“一带一路”沿线国家民众21世纪以来对中文学习的关注度,主要获取了谷歌趋势和谷歌关键词数据,覆盖了亚洲、非洲、欧洲共计50个国家,使用的关键词均为上述国家广为使用的语言。

相关分析发现,自2004年以来,“一带一路”沿线国家对中文学习的兴趣总体上呈上升趋势,而2018年之后尤为明显,即使在全球新冠疫情暴发之后,仍保持了总体上升的趋势。亚洲国家的增长幅度最为显著,除少数中东国家因国内政治局势影响增幅较小外,南亚和东南亚各国的增幅是一致和稳定的。非洲的增加是整体性的,即尽管增加幅度不同,但所有国家都呈上升趋势。中东欧地区的兴趣总体不高,只有少数国家呈上升趋势。本研究数据显示,当前的中文国际传播在全球范围内存在广泛的需求基础,各国政府在注意到这一需求后开展了针对性规划行动,总体上是一种自下而上式语言管理活动的结果。相关地理信息则显示,大多数检索都发生在孔子学院和HSK考点所在地区,这说明为中文国际传播提供组织性支持至关重要。从理论上看,“关注”是开展任何规划的前提,对宏观层面的“关注”行为开展系统性研究有助于我们更为深刻地认识语言规划的过程。

本研究在设计上具有创新性,是国内首次使用大数据技术研究中文国际传播情况。通过这一方法我们可以不开展大规模的本地人工调查就了解到一个地区的中文传播环境。当然,一个国家汉语相关关键词的热度提升,可能与相关新闻事件有关,不一定反映的都是完全真实的汉语学习兴趣,不过在大样本量和较长的时间幅度中,这一因素的干扰得到一定程度的抑制。限于篇幅和研究者的能力,本文未对每个国家进行详尽分析。未来可以进一步改善关键词选择,并扩大监测范围。同时也可以配合来华留学生数据、HSK考试数据、中外语言合作中心在一国投入的教学资源等数据构建中文国际传播成效预测模型,以更好地辅助中文国际传播的规划工作。

猜你喜欢
检索趋势汉语
学汉语
趋势
轻轻松松聊汉语 后海
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
追剧宅女教汉语
汉语不能成为“乱炖”
初秋唇妆趋势
SPINEXPO™2017春夏流行趋势