〔摘 要〕中国少数民族语言网络舆情研究是网络信息资源管理的重要内容。本文在介绍国内少数民族语言网络舆情研究现状和问题的基础上,总结了少数民族语言网络舆情研究的4个特征:政治性、交叉性、跨境性和超前性,分析了少数民族语言网络舆情研究整体趋势,指出语义分析、情感倾向分析、多语种分析等有待突破的研究方向。本文的研究结论对于中国少数民族语言网络舆情监测和分析体系的建立和少数民族语言网络舆情科学研究的开展具有一定的参考价值。
〔关键词〕少数民族语言;网络舆情;民族信息学;述评
DOI:10.3969/j.issn.1008-0821.2014.02.034
〔中图分类号〕C913.62 〔文献标识码〕A 〔文章编号〕1008-0821(2014)02-0168-04
西方国家舆情研究可以追溯到19世纪兴起的民意调查。近年来,国内外各类政府组织都将网络舆情作为民意的重要形式予以关注,网络舆情分析与监测已成为传播学、情报学、社会学、公共管理等学多个学科共同关心的热点问题。网络舆情(Internet Public Opinion)是在特定的时间和社会空间内,个人和社会群体在以互联网为媒介进行信息沟通和传播的过程中所反映出来的对相关公共事务所持有的态度、情绪、意愿和行为倾向的集合[1]。网络舆情的功能具有两面性:一方面它是现实舆情民意在网络空间直接体现,可以作为公共决策的重要依据;另一方面,网络舆情可能带有情绪宣泄的色彩,有可能成为重大公共危机的“导火索”,对社会的稳定和发展构成严重影响。
1 中国少数民族语言网络舆情研究的概况中国是统一的多民族国家,多民族、多语言、多文字是国情的基本特征。近年来,在国家通用语言文字网络信息资源飞速增长的同时,以蒙古文、满文、维吾尔文、哈萨克文、柯尔克孜文、藏文、朝鲜文、彝文、傣文等为代表的一大批少数民族文字网站也在互联网上相继亮相。国家语言资源监测与研究中心少数民族语言分中心调查显示,2011年我国大陆地区少数民族语言文字网站总量在389个左右,其中维吾尔文网站175个、藏文网站109个[2]。随着支持少数民族文字的计算机软件和移动通信设备应用范围逐步扩大,越来越多的少数民族人口开始熟悉和掌握网络应用的使用方法,互联网成为我国民族地区人口表达意愿、交流信息和共享文化重要空间的趋势已经开始显现。采用科学的理论和方法进行少数民族语言网络舆情的分析和研究,是政府在数字时代实现科学、民主决策的基本需要,也是民族地区社会稳定和繁荣的重要保障。我国民族地区大多处在祖国的边疆地带,在国家稳定和团结的整体格局中具有举足轻重的地位,与少数民族事务相关的各类事件大多是国际国内各类机构所关注的焦点。随着互联网在民族地区的逐步普及,建立网络舆情的分析和监测体系已经成为民族地区公共管理体系创新的重要内容。少数民族语言网络舆情分析与监测具有重大的社会意义,主要有:第一,通过对少数民族语言网络舆情的分析和监测,可以倾听广大网民用少数民族语言文字所表达的心声,了解民族地区广大网民对公共事务的意见和建议,从而为科学决策和改进工作奠定基础;第二,通过对少数民族语言网络舆情的分析和监测,可以及时发现可能导致严重公共危机的事件,提前进行预警和处置,将危机消灭在萌芽状态;第三,通过对少数民族语言网络舆情的分析和监测,可以掌握网络舆情信息传播的规律,采取必要措施合理干预,防止引发重大危机事件,引导网络舆情朝积极、健康的方向发展。近年来,我国一些学者已经开始探索少数民族语言网络舆情分析的理论与方法。例如,江涛等人设计了基于的藏文网页舆情监控系统,讨论了藏文网页的判定算法、不同藏文编码向国家标准扩A转换的算法以及格助词与藏文舆情分词词典相结合的自动分词算法等[3];邓竞伟等根据复杂网络理论的研究方法对藏文网络舆情传播规律进行实证分析,构建了基于藏文网络的舆情传播模型[4];阿布都瓦依提·尼亚孜研究了维吾尔文网站网络舆情的引导和控制问题[5];卢修配等人探讨了维吾尔文网络舆情分析目前国内外的研究状况和要解决的关键技术问题[6];王嘉梅等人以云南跨境民族语言彝文为例,对跨境多民族语种网络舆情内容进行深入分析与理解,构造了基于人工免疫系统的网络舆情信息智能滤取系统[7]。近年来,少数民族语言网络舆情分析领域的研究基金课题逐渐增多,例如中央民族大学闫晓东主持的“藏、维文网络敏感信息自动发现和预警技术研究”、新疆大学艾斯卡-艾木都拉尔主持的“新疆多民族语言网络舆情监测预警系统开发与应用”、新疆大学禹龙主持的“维吾尔语网络舆情信息自动获取与分析方法研究”等[8]。一些IT企业近年来也开始研发少数民族语言网络舆情分析软件,例如北京中科点击公司研发的“军犬网络舆情监控系统”[8]、山东鲁网开发的“政府网络舆情监测系统”[9]据称都可以实现藏文、维吾尔文、蒙古文、彝文、朝鲜文等少数民族文字网络舆情的自动采集和分析功能。从已公开的资料来看,少数民族语言网络舆情研究的重大意义已经得到普遍认同,国家相关机构在少数民族语言网络舆情研究领域的投入呈现递增趋势。然而,受制于少数民族语言文字信息技术普及率不高、少数民族语言文字网络信息资源的数量有限、少数民族语言文字信息深度处理所需的语言学基础还不成熟等各类因素的综合影响,目前我国的少数民族语言网络舆情研究整体上还处于起步阶段,研究成果总体数量不多,主题较为分散,还没有形成相对完整的理论体系。其次,对涉及的各类深层次问题关注不够,偏重于单一语种舆情分析系统的技术实现,对于各语种少数民族语言网络舆情分析当中的共性需求关注不多。再次,目前少数民族语言网络舆情分析领域的研究目标过于单一,大多强调从公共安全视角进行的网络舆情监测与控制,从网络问政角度进行网络舆情民意分析的成果相对较少。上述问题的出现是对目前我国民族地区信息化发展现状的直接反映,客观地说具有一定的必然性,需要来自民族学、情报学、传播学、公共管理学、社会学等领域的学者共同探讨,基于对少数民族语言网络舆情管理特殊需求的思考,推动少数民族语言网络舆情管理理论体系的构建和系列重大问题研究的开展,为民族地区网络舆情管理体制的完善提供理论支持。endprint
2 中国少数民族语言网络舆情研究的特征中国少数民族语言网络舆情研究是一项具有高度综合性和复杂性的任务,涉及网站、博客、微博、论坛等多样化的信息来源,网页、图形、图片、视频、音频、文本、数据等多种信息类型,藏语、蒙古语、维吾尔语、哈萨克语、柯尔克孜语、彝语、傣语、朝鲜语等多种少数民族语言文字。由于和民族问题紧密相关,少数民族语言网络舆情研究除了具有国家通用语言网络舆情研究的基本特征之外,还有一些具有自身特色的需求特征,主要体现在以下方面:
2.1 少数民族语言网络舆情研究的政治性少数民族语言网络舆情研究是以少数民族语言文字的广泛应用为前提的,从侧面显示了国家保护少数民族语言文字和少数民族文化的政治立场。目前,我国的《宪法》《国家通用语言文字法》和各少数民族自治地方的语言文字工作条例当中都明确规定:国家尊重和保护少数民族人口使用和发展本民族语言文字的权力。在西藏、新疆、内蒙古等省区,特定语种的少数民族语言文字和国家通用语言文字同为官方语言,使用少数民族文字的法律文书与使用国家通用语言文字的法律文书具有同等效力。从网络问政的角度来看,少数民族语言网络舆情研究又是政府倾听少数民族群众意见和建议的一种方式。从维护社会管理秩序的角度来看,少数民族语言网络舆情监测的目的在于是及时识别不利于民族团结和社会稳定的负面信息并采取措施进行干预和引导,从而主动化解社会危机。因此,少数民族语言网络舆情并不是单纯的网络信息分析问题,它始终与我国多民族国家的政治整合和社会稳定紧密联系在一起。
2.2 少数民族语言网络舆情研究的交叉性网络舆情研究是传播学、情报学、社会学、公共管理学等学科相互交叉形成的新的学科领域。少数民族语言网络舆情在这些学科的基础上,又融合了民族学、语言学的知识,使这一问题变得更加复杂。少数民族语言网络舆情研究当中的大多数难题主要是源于语言学基础支持程度不够。例如,目前舆情分析当中普遍使用的敏感关键词检索和追踪技术,这项技术必须以成熟的自然语言分词技术为基础,否则检索结果的准确度会受到很大影响。网络舆情研究当中的网络信息资源情感倾向分析技术同样必须以典型情感用语词库为基础才可以进行计算和判断。在实践中,要实现语音信息、图像信息等多媒体网络舆情的内容分析时,还必须将多媒体信息转换为文本信息后再信息分析,因而又需要语音识别、图像文字识别等领域专业知识的支持。从民族学角度来看,少数民族语言网络舆情也是少数民族文化的一种表现形式,其形成和传播有其特殊的规律性,例如与国家通用语言网络舆情的共生和关联规律等。总之,少数民族语言网络舆情研究是一个高度交叉性的研究领域,需要对多个学科的专业知识进行综合集成。
2.3 少数民族语言网络舆情研究的跨境性中国56个民族中,有28个民族的语言是跨境的,如蒙古、藏、维吾尔、朝鲜、哈萨克、苗、瑶、壮、傣、哈尼、景颇、怒、独龙、佤、京等民族的语言[10]。这些跨境语言是在长期历史演进过程中形成的,目前正在被我国特定地区的少数民族人口和境外其他国家相同民族人口所共同使用,例如蒙古语是我国内蒙古自治区的蒙古族人口与境外的蒙古国共同使用,朝鲜语是我国的延边朝鲜族自治州的朝鲜族人口与境外的朝鲜、韩国共同使用,哈萨克语是我国新疆自治区的哈萨克族人口与境外的哈萨克斯坦国共同使用。这些跨境语言的存在,在一定程度上会对少数民族人口的国家认同产生影响,因而互联网发展之初,一直就是我国政府与境外相关国家争夺文化自主权,保卫边疆民族地区文化安全的重要阵地。此外,境外一些敌对势利也企图利用互联网的跨时空传播特性,专门在互联网上建立少数民族网站,制造和传播对民族团结和国家稳定有害的言论。因此,少数民族语言网络舆情研究除了分析我国少数民族人口所形成的网络信息资源之外,也要关注境外相关国家和社会组织所建立的特定语种的网络信息资源。
2.4 少数民族语言网络舆情研究的超前性由于少数民族语言网络信息资源整体数量较少,目前各民族地区进行少数民族语言网络舆情监测主要还是依赖人工方式,而一些开通博客、微博等服务功能的少数民族语言网站则按照“先审核、再发布”模式进行信息发布[2]。例如,人民网的舆情监测室所提供蒙古、藏、维吾尔、哈萨克、朝鲜等少数民族语言舆情报告全部是采用人工分析方式完成的。以人工方式进行网络舆情管理具有简单易行的优势,但是由于人认知能力的局限性,往往更注重表层信息的理解,对于各类数据之间的深层次关联关系很难把握,不容易发现舆情信息背后所隐含的规律性,对于处在酝酿期的网络舆情危机事件往往难以识别。此外,人工方式费时费力,工作效果受到分析人员状态的影响而呈现出波动性特征,目前之所以没有自动分析系统的辅助,主要还是相关领域技术和方法的还不够成熟,无法满足网络舆情分析的精确度要求。未来随着少数民族语言网络信息资源数量的持续增加,这种模式肯定会难以为继。从推进民族地区民主管理和社会稳定的长远需求来看,尽管现阶段我国少数民族语言网络舆情信息数量不多,进行少数民族语言网络舆情领域的理论研究,开发具有智能分析功能的舆情监测系统,探索人工与自动相结合的少数民族语言网络舆情分析模式,对维护民族地区社会的繁荣和稳定具有非常重要的现实意义。总之,少数民族语言网络舆情研究要以民族学、语言学知识为支撑,通过人工分析与自动分析相结合的方式,实现传播学、情报学、社会学、公共管理学等多个学科知识的集成与融合,共同服务于少数民族文化保护、民族地区民意获取、边疆地区公共安全保障等国家大局。
3 中国少数民族语言网络舆情研究的展望少数民族语言网络舆情研究必须以少数民族语言网络信息资源为基础,其发展必然受到少数民族语言信息处理技术的发展水平和普及程度的制约。目前,藏语、蒙古语、维吾尔语等影响较大的几种少数民族语言文字的文本编辑排版和网页制作技术已经成熟,在互联网上使用少数民族语言文字的人口数量正在持续增长。以藏语信息技术为例,网络的普及正在改变藏族民众的生活方式,据报道,一些藏传佛教寺庙里的佛学院也为修行的学僧开设了计算机课程,学习打字、排版和网页设计等内容,并将推出自己的网站[2]。可以预见,未来从事少数民族语言网络舆情研究者也会随之增多,除了中央民族大学和西北民族大学之外,越来越多的学者和研究机构会开始关注这一领域。伴随着这一趋势,研究内容也会随之出现变化,主要体现在:第一,少数民族语言网络舆情研究所关注的语种由藏语和维吾尔语扩展到多个语种的少数民族语言,例如朝鲜语、彝语、傣语等语种网络舆情的分析方法也会受到关注;第二,少数民族语言网络舆情研究的深度会继续增加,由目前基于维护社会稳定的单一目的向着网络问政、危机预警、社会治理等综合型目标体系转型;第三,少数民族语言网络舆情分析的方法由目前的人工定性分析为主,向着基于网络舆情自动分析系统加人工辅助判断的复合型分析模式转型;第四,从事少数民族语言网络舆情研究人员的学科背景将会更加多元化,从传播学、社会学、公共管理学等角度研究少数民族语言网络舆情的研究成果会不断增多。在少数民族语言网络舆情研究持续推进的同时,以下3个重要的研究方向值得特别关注:endprint
3.1 基于本体的少数民族语言网络舆情语义分析技术 目前的少数民族网络舆情自动分析主要依赖基于关键词检索的话题发现和跟踪技术,进行文本的简单比对和匹配,不能结合上下文语境和用户需求进行智能检索。按照语义网(Semantic Web)的发展趋势,未来的网络信息资源将会根据领域知识本体(Ontology)模型进行语义标注,检索时可以结合本体进行逻辑推理,从而增加检索的查全率和查准率,更好地满足少数民族语言网络舆情分析的深层次需求。少数民族语言网络舆情语义分析的关键是构建各语种的知识本体词网模型,这是一项非常复杂和艰巨的任务,必须在参考WorldNet,How Net等通用词网的基础上,结合对各语种叙词逻辑关系的分析,建立各语种叙词本体词网模型,作为语义标注和智能检索的参照体系。
3.2 少数民族语言网络舆情信息情感倾向自动分析技术 目前基于关键词的网络舆情分析技术还无法处理不包括敏感词但是内容却具有一定社会危害的网络信息。少数民族语言网络舆情的深度分析,必须在敏感词检索的基础上,通过倾向性分析可以明确网络传播者所蕴含的感情、态度、观点、立场、意图等信息,从而提高网络舆情分析的准确性。少数民族语言网络信息情感倾向分析是具有挑战性的研究任务,需要建立对应语种的情感倾向词语料库,通过比对和计算对网络信息资源的情感倾向做出判断。
3.3 以国家通用语言为中介的多语种少数民族语言网络舆情分析技术 民族信息学(Minzu Informatics)是研究信息化背景下多民族语言信息共享规律的科学领域[11]。按照民族信息学观点,为了便于实现多民族语言信息资源共享,少数民族语言网络信息资源在发布时应当遵循“双语原则”,也就是同时提交少数民族语言和国家通用语言文字两者版本。该信息在网络当中显示可以根据需要进行双语对照显示或者隐藏国家通用语言文字版本,将其作为语义元数据进行嵌入式保存。按照民族信息学原则进行网络信息资源发布后,少数民族语言网络舆情分析可以借助发展较为成熟的国家通用语言文字网络舆情分析技术进行,而且可以非常方便地进行不同语种舆情信息之间的比较研究。当然,这种方法以高质量的少数民族语言网络舆情信息为基础,必须以严格的管理制度为保障。
4 研究总结中国少数民族语言网络舆情研究是随着民族地区信息化建设的推进而受到关注的重要研究领域,与政治问题紧密联系,需要综合多学科的专业知识对境内外使用我国少数民族语言文字产生的网络信息进行监测和分析,满足民意分析、危机预警、公共治理等多方面的社会需求。目前,我国少数民族语言网络信息资源数量整体不多,少数民族语言网络舆情分析还处在起步阶段,未来需要结合民族地区社会发展进一步完善,建立少数民族语言网络舆情分析的基础理论和方法体系,并争取在语义分析、情感分析、多语种分析等研究方向取得突破。
参考文献
[1]刘毅.网络舆情研究概论[M].天津:天津社会科学院出版社,2003.5.
[2]李光,钟雅琼.大陆研拟藏维文网络舆情监测系统,监控分裂风险[N].凤凰周刊,2012-06-25.
[3]江涛,于宏志,李刚.基于藏文网页的网络舆情监控系统研究[C].上海:全国第23届计算机安全学术交流会论文集,2008.10.
[4]邓竞伟,邓凯英,李永生,等.基于藏文网络的舆情传播模型[J].计算机系统应用,2013,(3):209-211.
[5]阿布都瓦依提·尼亚孜.浅析维吾尔文网站网络舆情的引导和控制[J].新闻世界,2010,(7):204-205.
[6]卢修配,齐向伟,艾斯卡尔.维吾尔文网络舆情研究现状及几个关键问题[J].新疆师范大学学报:自然科学版,2012,(2):86-88.
[7]王嘉梅,张建营,赵继勇.云南跨境多民族语言复杂网络舆情内容分析[J].信息与电脑:理论版,2013,(6).
[8]中科点击,军犬网络舆情监控系统实现多民族语言监控功能[EB/OL].http:∥www.54zk.com/contents/152/1988.html,2013-10-05.
[9]鲁网舆情频道,鲁网政府网络舆情监测系统——少数民族语言网络舆情监测[EB/OL].http:∥service.sdnews.com.cn/yuqing/#3dtx,2013-10-05.
[10]戴庆厦.跨境语言研究[M].北京:中央民族学院出版社,1993.12.
[11]赵生辉.民族信息学的学科定位与理论体系初探[J].图书情报工作,2012,(5):56-61.
(本文责任编辑:马 卓)endprint