冯丽,孙言梅,胡莉
(1.武汉大学文学院,湖北武汉430072;2.深圳大学国际交流学院,广东深圳518060)
促进中国语文的规范化、信息化、国际化
——中国语文现代化第一届国际会议综述
冯丽1,2,孙言梅1,胡莉1
(1.武汉大学文学院,湖北武汉430072;2.深圳大学国际交流学院,广东深圳518060)
2010年10月23至25日在武汉大学召开了“中国语文现代化第一届国际会议暨中国语文现代化学会第九次学术会议和语言研究与信息处理国际研讨会(LIIP2010)”。其主要议题是:纪念《国家通用语言文字法》颁布10周年;促进中国语文的规范化、信息化、国际化。会议就扩大汉语国际传播,实现汉语国际化;汉语拼音和拼写工具完善;汉字改革;汉语水平测试现代化;汉语语言信息处理;汉语语料库理论与应用;自然语言资源建设等课题等进行了广泛研讨。对中国语言文字的规范化、信息化、国际化起到了积极的推动作用。
中国语文现代化;规范化;信息化;国际化①
“中国语文现代化第一届国际会议暨中国语文现代化学会第九次学术会议和语言研究与信息处理国际研讨会(LIIP2010)”于2010年10月23至25日在武汉大学召开。本次大会由武汉大学语言与信息研究中心承办,协办单位有中国语文现代化学会、新加坡中文与东方语文信息处理学会、江汉大学、浙江大学、广东国笔科技有限公司、武汉大学(计算机学院和外语学院)。大会的主要议题是:纪念《国家通用语言文字法》颁布10周年;促进中国语文的规范化、信息化、国际化。来自中国大陆、新加坡、蒙古国、法国和香港地区的专家、学者、研究生及企业人员等160余人参加会议。共提交论文110多篇,涉及拼音、文字、普通话的教学及推广研究;语言信息技术处理;语文教学;对外汉语教学;词汇、句法、语义、语用研究等多个方面。大会评出了30篇获奖论文。
大会开幕式在武汉大学计算机学院召开。武汉大学副校长周创兵、教育部语言文字应用管理司副司长张世平、语言文字信息管理司副司长王铁锟及中国语文现代化学会会长马庆株等应邀在开幕式上作了报告。开幕式后,大会进行了中国语文现代化学会理事会的换届选举。此后进行了为期两天的论文分组报告。
根据与会代表的论文主题,大会分四组进行了为期两天的分组报告。主要涉及三大领域:语文现代化(包括拼音、文字、普通话、语言规划及语言教学);语义和语法;语言与信息处理。
南开大学外国语学院的陈辉提出要抵御“外来”冲击,构建和谐语文生活。他认为“外来”冲击的实质是中国人自己滥用外语。其根源在于广大民众规范使用语文、遵守语文法律和保护语文的意识淡薄。语言和文字称得上是一个民族不可再生的非物质文化遗产,是民族认同的重要基础。他呼吁保护好自己的语言文字,维护我国的文化独立。建设和谐语文生活,首先要解决思想认识问题。要把语文使用问题提到国家文化安全、文化可持续发展及保护文化多样性的高度。动员社会各方力量,从道德和法律两方面入手,大力宣传、落实国家语文主管部门提出的构建“和谐语文生活”的构想,对于外来概念要遵循尽量汉化的原则。
上海教育出版社的唐发铙也提出语言工作者应站在推动汉语走向世界队伍的前列。目前,汉语在世界上的地位并不高。中国学习英语的人数众多,这极大地威胁到我们本民族语言的安全。国家和社会应高度重视汉语的地位,制定语言政策,在法律上给汉语以合理的位置。把语文学习重心转移到汉语上来,营造一个适宜的国内语言环境,这样才能扩大汉语的国际传播。
《北华大学学报》编辑部的李开拓、香港的吴正中、吴文超都认为汉字需要改革,实行“一语双文”很有必要。不论是从文化本身还是作为文化载体来说,汉字都需要发展,需要进行变革,打破旧的并不意味着全部毁掉。中国一度掀起的拼音化运动成绩斐然。从拼音在语文生活中发挥的作用来看,从有利于外国人学习汉语汉字来看,从现行汉字在许多领域上的不便来看,中国汉字有必要向拼音化方向发展,起码应实行“一语双文”。在对外汉语教学和计算语言信息处理方面,拼音文字有着不可替代的优越性。
北京中自汇河科技文化研究院的赵功德先生对汉字的信息化进行了研究。他历时十余年,对众多汉字逐个剖析,找到了破解汉字数字化的密钥。按照国家规定的汉字基础部件使用规则,采用平面切分的方法,将汉字分为10种结构。将这10种结构和汉字的5个基本笔画分别与阿拉伯数字相对应,打开了汉语数字化的大门。使得汉字信息处理的难题迎刃而解。在此基础上,他还发明了“汉字数字+音码排序法”,以此排序的全新的《汉字结构新字典》即将面世。他将传统的汉字和现代化高科技设备紧密结合,使汉字信息处理技术驶入了规范化、信息化、国际化的快车道。
有的与会代表对《现代汉语常用词表》中的轻声词语进行了调查,发现《现代汉语常用词表》中的轻声词语可分为有规则和无规则两大类。各词典在轻声词的数量上和收集的标准上不完全统一。学界对于“哪些词读轻声”尚存在分歧。针对以上情况,研究者建议以《现代汉语常用词表》的轻声词语作为标准化、规范化的依据,限定轻声词语的范围;对于轻读、重读皆可,又没有区分词义和词性作用的词不作轻声处理;限制无规则的轻声词的数量,减少方言区的人们学习普通话的难度。
与会代表还对《汉语拼音方案》提出了修改意见。他们认为随着社会时代的不断发展,1958年颁布实施的《汉语拼音方案》有些内容与现代汉语语音应用实际已经脱节。在拼音教学上不易操作,应对其进行适当修订。他们建议:轻声应正式纳入声调范畴;y、w纳入声母表;ê、er、-i(前)[ɿ]、和-i(后)[ʅ]等纳入韵母表;摒弃、ĉ、ŝ、ẽ的写法;修订“字母表”中字母的标音等。以利于汉语拼音教学和汉语拼音的进一步推广和应用。
本次会议对于汉语的语义研究涉及范围较为宽泛。从宏观的汉语语义系统建构到微观的一组同义词的辨析;从同义词群或语义聚合网络的建构到单个词语词义的多角度研究一应俱全。江汉大学语言文字研究所的夏凤梅构建了一个汉语语义系统的框架。对语义类型进行了重新概括;在语义单位的性质和层级上进行了具体的界定;在语义类型间的关联关系上,借用语法学中的词类系统、句类系统和逻辑学中的概念系统理论,突出范畴义之间的自然联系和人因历时的感知过程所形成的心理联系。这是一个多层级、多层面类型系统的骨架。这一框架根据意义的主客观来源将最高层语义分为主观表达义和客观意味义。主观表达义又分为理性义和情绪义,客观意味义又分为语言义和言语义,各类还有下属分类。这样构建了一个宏观的汉语语义系统。
武汉大学的几位博士研究生运用萧国政先生2007年提出的“词群—词位变体理论”,以某一类词为例构建形容词或动词的同义词集和语义聚合网络。本次与会代表研究涉及到的动词类别有“爱”类、“看”类、“言说”类、“交互”类、“放置”类等。形容词涉及到单音节量度形容词、表人的性质形容词、表“聪明”义的心智形容词等。这种同义词群的建构是围绕一个基元词即核心词形成一个包含若干同义词的集合。集合中词与词之间的关系不同,有的构成上下位关系,有的是同位关系,有的是邻位关系。每个词的意义都是在基元词的基础上增加某个义素。这需要批判性地看待词典中的原有义项,必要时要对原有义项进行再分割并对每个义项的意义进行细致地描写,最终形成多义词的某个意义的多层次多侧面的立体词群系统。这个方法不仅可用来为计算机建立同义词群,也可以用于对外汉语教学,是一种人机共享的研究模式。
在同义词辨析研究方面,主要是方法论的探讨。有的是以义项为单位的辨析,有的是从句法、语义、语用等层面进行的全面剖析。既对同义词的异同进行了比较,也为同义词研究提供了新的方法上的借鉴。
在词法研究方面,国家语委《现代汉语规范词典》课题组的钮葆先生谈到了“区别词”如何定名,如何同形容词及其他一些词类划界的问题。在汉语中,形容词和动词一并统称为“谓词”,而不能作谓语或谓语中心的唯定语性的一类词,学界称法不一,有非谓形容词、区别词、属性词、定质形容词、固态形容词等不同称谓。他认为称“区别词”较准确。这是由其特点决定的,它只能作定语,有的可兼做状语,无级度变化。除了“非”以外,不能被其他副词修饰。但当它与形容词、动词、名词兼类时,当按兼类处理,不能只视作“区别词”。鲁东大学中文信息处理研究所的周明海等也对区别词、属性词、非谓形容词进行了考察。通过对《现代汉语语法信息词典》、第五版《现代汉语词典》和《试论非谓形容词》中这三类词的比较,他们发现这三类词的总数差不多,但共收的词却较少。认为造成收词不一的主要原因在于:分类标准不统一;区别词、属性词、非谓形容词并非完全一致;三者是“词”还是构词成分,尚有疑问;对这部分“词”的性质认识不足。
与会代表还就某些句式进行了研究。如:一直为语法学界关注的“是……的”句、“NP+V-起来+AP(VP)”句、“有+VP”句等,他们从不同角度,运用不同理论对句式的句法构造和深层语义,以及用法和条件限制加以解释和说明。丰富了语法研究的内容,也为教学实践提供了参考。
随着信息产业的高速发展,利用计算机对语言信息进行处理就摆在了至关重要的位置上。在此次会议上,有不少与会代表在语言信息处理方面做了相关研究。
新疆大学中文系的薛宏武先生认为,中文信息处理走向句处理阶段应更加注重语用因素的能动作用。立足于短语结构语法、从属关系语法、配价语法与题元阶层等理论方式生成的句子(clause)只是句子的基础结构(base structure),是不含语用因素的简单词组。而在其之上还有更高的语义因素在起作用,这表现在动态句子里(sentence)就是人为作用,可概括为语用因素。将基础结构和语用因素都考虑在内计算出的句子才逼近自然句。他就汉语中词组的嵌合重组进行了研究。认为词组的不同组配模式是基础结构在动态使用中产生的各种变体。研究表明,语用因素是句处理中不可或缺的语义知识,它不仅与基础结构同现于一个语法单位内,与基础结构存在着线性组合,更重要的是其能动作用造成自然句子的灵活多变。说明汉语句处理中更应关注语用组形因素。
针对现代汉语复杂谓语句处理以工程方法为基础的理论,闫梦月在会议中提出了自己的想法。她认为复杂谓语句是由多个小句复合而成,并试图建立以单个小句分析为前提,再进行综合处理的计算理论。现代汉语中各类小句就其在篇章语用层面的自主性而言可分为自足句和非自足句。前者不依赖语境而独立运用,语义上有一个行动的终点,后者则相反。汉语缺乏形态变化,复杂谓语句就是为了用较简省的形式容纳较多的语义内容,把自足的或非自足的小句通过形式扭曲手段融合在一起的。虽然这种计算理论假设在应用处理中更具有经济性和一致性。
计算机网络技术的发展和翻译需求量的激增给传统翻译教学提出了挑战。现代译者必须掌握运用计算机辅助翻译工具高效完成翻译项目的技术。武汉纺织大学外国语学院的陈奇敏对翻译教学模式的改进进行了探讨。通过一种网络翻译实训平台,根据教学需求,在初级阶段,选择“人机模拟实训”的简化模式,让学生通过自由训练,熟悉职业译者的工作流程。高级阶段运用“标准小组实训”模式,逼真再现翻译公司的商业环境,提供真实的翻译文件。通过这种网络翻译实训平台,可扩充更新翻译教学的内容,将教学模式与人才培养目标紧密结合起来,明显提升了学生的语言运用能力与职业素养,取得了良好的教学效果。
对于现今机器翻译中未登录词的翻译问题,会议上有关人士提出了一种基于句对齐双语语料库的词对抽取技术。通过马尔可夫模型计算同语言中前后字串的相关度来识别未登录短语,并通过词对去冗和共现概率与共现权重结合的方法确定其译文。此方法对未登录词的识别更新和翻译具有一定优势。在机器翻译中,句法分析也是不可或缺的环节,为了追求高质量的机器翻译,有的与会人员开发了基于JAVACC的日语句法分析器,用于短语之间的关系分析及语义分析。同时也试做了日蒙机器翻译系统并进行了实验评价,翻译正确率均已经达到95%以上。
与会代表还介绍了目前信息检索测试平台采用的评判池(Pooling)技术。其涉及两方面的工作:机器抽取相关文档并排序构成一个测试集;人工对该测试集进行相关性的评估。针对人工评判缺乏统一标准,影响精确度这一问题,研究人员提出了“模板匹配策略”。此方法有助于规避人工评判的主观性,为人工评判测试集的规范和标准提供一定的依据。
在藏文信息处理中,藏语句子边界识别是关键环节。由于藏语标点符号具有歧义性,故转而借助述语来判断句子边界。有人通过对藏语语法的研究和藏语真实文本的观察建立了一个藏语助动词表,同时提出了藏语句子边界识别算法。实验证明,这种方法能够很好地解决述语是由动词和助动词构成的句子的边界识别问题。
语言与信息处理方面研究的重点是语言研究与信息处理的结合。大会探讨了“信息处理需要什么样的语言知识及当前语言理论是否适合信息处理的需要”等问题,不仅从理论上探索了语言知识与计算技术的深入结合,而且在应用上也进行了有益的尝试。
本次会议“三会联袂”召开充分表明中国语文规范化、信息化、国际化的紧迫性,同时也具有鲜明的时代意义和现实意义。大会充分肯定了《中华人民共和国国家通用语言文字法》的意义及建国以来中国语文工作的成就;充分认识了普通话、规范汉字和汉语拼音的法定地位。会议就扩大汉语国际传播,实现汉语国际化;汉语拼音和拼写工具完善;汉字改革;汉语水平测试现代化;中国少数民族语言信息处理;汉语语料库理论与应用;自然语言资源建设等课题等进行了广泛研讨。大家相互交流,共同探讨,共享研究成果,对中国语言文字的规范化、信息化、国际化起到了积极的推动作用。
Promoting the Standardization,Informationalization and Internationalization of Modern Chinese
FENG Li1,2,SUN Yan-mei1,HU Li1
(1.College of Chinese Language and Literature,Wuhan University,Wuhan 430072,China;2.College of International Exchanges,Shenzhen University,Shenzhen 518060,China)
From October 23 to 25 in 2010,“the First International Conference on Modernization of Chinese Language and the Ninth Conference of the Chinese Language Modernization Association”was held in Wuhan University.Its main topic was“memorizing the issue of Law of the People’s Republic of China on the Standard Spoken and Written Chinese Language and promoting the standardization,informationalization and internationalization of modern Chinese language.In the conference,hot discussions on focused on the following points:promotion of internalization of Chinese language,improvement of Chinese pinyin,Chinese character reform,modernization of Chinese language proficiency test,information process of Chinese language,theory and practice of Chinese language corpus,natural language resource construction,etc.it promoted the standardization,informationalization and internationalization of modern Chinese language.
modernization of Chinese language;standardization;informationalization;internationalization
H1-01
A
1674-9014(2011)01-0121-03
2010-11-07
冯丽(1963-),女,山东聊城人,武汉大学文学院博士研究生,深圳大学国际交流学院讲师,研究方向为语言学及对外汉语教学。
(责任编辑:刘英玲)