2021年4月22日,北京语言大学语言资源高精尖创新中心通过线上学术发布会的形式,正式推出世界语言和文字基本知识库、“世界语言文字名称中文译写规则”(简称“两库一蓝本”),全面展示世界语言文字基础知识。
语言是了解一个国家最好的钥匙,为了让国人更好地了解全世界的语言文字基本情况,语言资源高精尖创新中心设立了由孙宏开教授和黄行教授联合主持的“语言识别理论及语言数量统计的方法论研究”重大项目,在全球范围内汇聚各种权威开源信息,经整理加工,构建“世界语言基本知识库”和“世界文字基本知识库”,重点展现世界上7000多种已知语言的存在状况和使用状况,具体内容包括:世界诸语言的国际标准语言代码(ISO 639-3)、语言名称、使用人口、地理分布、语言地位和活力、语言系属、语言类型、方言情况、文字情况等。此外,项目组还基于我国已有国家标准和全球主流翻译软件的翻译结果,以英语音节和汉字对照的方式,研制了“世界语言文字名称中文译写规则”,为世界语言文字名称的中文翻译和文献检索提供了学术蓝本。
本次发布会上,语言资源高精尖创新中心特聘研究员黄行教授还介绍了诸多基于“两库一蓝本”提炼总结的知识点,包括:世界上语言数量最多和最少的国家,世界诸语言的活力地位情况,所辖语种超过100种的全球10大语系,世界上作为母语使用人口最多的20种语言,世界上作为官方语言分布国家最多的10种语言,中国和14个陆地邻国共有的50余种跨境语言,全世界主要文字的样态和源流关系以及中国文字与世界文字的源流关系,依据“一蓝本”首次译写的部分语言的中文名称等。
北京语言大学李宇明教授认为“两库”进一步普及了世界语言文字基本知识,将在诸多领域发挥重要的应用价值:第一,服务教育和科研。将世界语言文字的最新知识补充到教科书中,有利于学生更加客观全面地了解世界的语言文字情况,相关知识库也为今后编写《世界语言志》、更科学地划分语言和方言等提供了知识支撑;第二,服务国家外语规划。例如,阿拉伯语、俄语、英语是“一带一路”地区作为官方语言使用最广的三种语言,因此要重视培养俄语和阿拉伯语的人才语言规划;第三,服务国家安全。例如,我国和周边国家有数量众多的跨境语言,研究利用好跨境语言,对睦邻友好和边防安全等大有裨益。他还认为“世界语言文字名称中文译写规则”为规范和新译世界语言的中文名称提供了重要的学术蓝本,希望未来能够不断完善并争取成为国家标准。
中国社会科学院、北京外国语大学顾曰国教授认为以往的语言学研究更多关注的是语言与个人的关系,对世界语言的总体情况尤其是语言与国家的关系关注不够。“两库一蓝本”基于科学的规划方案,充分考虑了语言和国家之间的关系,取得的成果对语言本体研究、人工智能、语言学习等都具有重要的参考价值。