中国少数民族地区网络舆情监控研究综述

2016-10-17 02:19艾勇刘赛
现代计算机 2016年22期
关键词:网页舆情少数民族

艾勇,刘赛

(中南民族大学计算机科学学院,武汉 430074)

中国少数民族地区网络舆情监控研究综述

艾勇,刘赛

(中南民族大学计算机科学学院,武汉430074)

0 引言

中国是统一的多民族国家,55个少数民族人数之和约占总人口的8.4%,居住在155个民族自治地方:包括5个自治区、30个自治州、120个自治县(旗),民族自治地区的面积为616万平方公里,占全国面积的64.2%[1],大多分布在中国边疆地区。由于少数民族在风俗习惯、生活习俗上的不同,使得少数民族的事务处理存在特殊性,尤其要防止在个别人员、个别事件问题处理上产生敏感性问题,并被别有用心的人员利用,断章取义、隐瞒关键信息,甚至欺骗、篡改后恶意在网络上扩散传播,演变成为网络上和现实中事件结合的群体性事件。

如今,受到政治、经济、民族文化、社会变革等新形势的影响,再加上国外政治和宗教势力的渗入,中国民族问题舆情呈现出了活跃、参与广泛、影响面大等特点[2],尤其随着移动互联网快速发展,微博、微信等手机网络社交媒体普及率非常高,别有用心的人通过醒目标题标示含有民族、特殊地域等信息时,更容易使得不明真相的网民产生情绪,使得少数民族的舆情活跃度、参与度、影响面进一步扩大。少数民族网络舆情的监控也成为了新的关注点,处理好少数民族舆情监控与引导对国家稳定和团结起着重要作用。

随着互联网和移动互联网的快速发展,中国少数民族地区的网民规模和互联网普及率都得到显著上升,根据中国互联网络信息中心(CNNIC)2016年1月发布的《第37次中国互联网络发展状况统计报告》显示,截止至2015年12月,中国互联网普及率达到50.3%,网民规模为6.88亿,增速达到6.09%,多个少数民族地区的统计值超过了全国平均水平[3](见表1)。

表1 2015年主要少数民族地区网民规模及互联网普及率统计

数据来源:中国互联网络信息中心,《中国互联网络发展状况统计报告》(2016年1月)

如表1所示,在中国少数民族人口集中的省份和自治区中,网民规模增速全部超过全国平均水平,近一半的互联网普及率也超过了全国平均水平,说明中国少数民族地区的网络普及率高的同时,也进一步说明了少数民族网络舆情监控的重要性。

1 少数民族网络舆情的特点

1.1以突发事件为中心,具有极强地域性

舆情的本质就具有地域特性,虽然随着互联网的发展,舆情逐步脱离了现实地域,然而少数民族的网络舆情仍然具有较强的地域性,一般多于当地的突发群体性事件有关,例如新疆省近年来发生了多起群体性事件:2014年5月22日乌鲁木齐沙依巴克区公园北街早市爆炸案;2013年6月26日鄯善暴力恐怖袭击案件、6月28日和田县群体聚集闹事事件;2012年2月28日达叶城恐怖袭击事件等;又如西藏拉萨2008年3月14日打砸抢烧严重暴力犯罪事件;云南省2014年3月1日昆明火车站暴力恐怖案件等。这些暴力事件的发生导致了网络舆情的快速扩展,迅速在当地形成了极大影响,并扩散到全国。

少数民族网络舆情的扩散一般离不开突发性事件的发生,尤其是事件发生地点处于边疆少数民族聚集区域时尤其容易形成当地及全国各族人民的关注,从而进一步扩大其影响,从事件出发,围绕事件为中心,形成了极强的地域性。

1.2因历史因素而导致的民族性

在少数民族网络舆情事件中,有一些事件及舆情的产生是和其历史的一些事件相关的技术和移动互联网技术的推动下,形成网络舆情,快速扩散导致舆情危机[4]。

1.3因宗教及国外势力而导致的政治性

大多数少数民族都有自己的宗教信仰,如佛教、伊斯兰教、天主教、基督教、道教等。宗教信仰是人类一种正常的社会意识形态和文化现象,但是由于部分宗教信仰存在偏激人员,对其他宗教进行抵制和攻击,容易导致由于宗教信仰不同而导致宗教之间的冲突。此外,还有一些少数民族信教群众违反相关规定引发的纠纷,以及跨地区非法传教引发的纠纷,外来信教人员擅自建立宗教活动场等事件所引发的纠纷等[5]。例如2007年3月甘肃省平凉市出现的清真寺门口悬挂猪肉的事件[5]。此外,境外反华势力也采用宗教渗透的方式来引发少数民族事件,引发矛盾或者突发事件后进行宣传扩散,进而造成网络舆情危机。

由于宗教和国外势力的渗透的目的更多是破坏国家民族团结和稳定,因此也导致了少数民族的舆情具有很强的政治性。

1.4因逃避网络监控而产生的隐蔽性

由于少数民族舆情多和政治、宗教、民族等因素有关,因此全国各地政府对少数民族的舆情监控也非常重视,为了逃避政府的监控,少数民族的舆情并不都是通过简体中文在网络上进行传播和扩散,少数民族语言文字也从线下转到了线上,部分网络舆情采用了少数民族语言进行发布和传播,给少数民族舆情的监控和管理带来了一定的挑战。

目前网络上已有藏文、维吾尔文、满文、蒙古文等多种少数民族语言文字网站。然而,根据2016年1月发布的《第37次中国互联网络发展状况统计报告》显示,截至止2015年12月,全国网页按照编码类型分的比例中,中文网页比例达到98.4%,繁体中文网页占0.7%,英文网页占0.4%,其他占0.5%[3],即所有少数民族语言文字网页之和还不足0.5%,因此要在海量的网页中寻找和发现少数民族语言文字的网页,进而分析网络舆情,也是一个重要挑战。

由于少数民族网络舆情的特殊影响性和政治性,也使得网络舆情扩散过程中更注重隐蔽和逃避监控体系,使得舆情的发现和监控也更加困难。

2 少数民族网络舆情监控研究现状

少数民族网络舆情监控不同于一般的网页监控,首先要能够从海量的一般网页中发现其网页,并分析其语言文字,才能进行进一步的内容分析。兰义湧等人在文献[7]中总结了三类文本文字识别方法:基于规则的方法、统计模型、以及规则与统计相结合的方法。Brown R D.将相对熵[8]和支持向量机[9]等统计模型应用到文本文字识别中,并在这些算法的基础上使用数据平滑等技术使得识别率达到99.998%[10]。

在国内少数民族语言文字的分析研究上,国内外对藏文[11]、蒙古文[12]和维吾尔文[13-14]等我国少数民族语言文字网页文本的自动识别也开展了一些研究工作,主要采取了规则和统计相结合的方法。

在少数民族语言文字舆情监控研究方面,江涛等人2008年在文献[15]中提出了基于藏文网页的舆情监控系统,系统监控藏文网页的“敏感点”并对“热点”实现预警[15];邓竞伟等人2013年在文献[16]中根据复杂网络理论和Web信息挖掘的知识对藏文网络舆情传播规律进行实证分析,设计了一个藏文网络舆情模型结构,对藏文网络舆情传播模型进行了理论分析和数值模拟,对舆情进行预警和引导[16];姜志威等人2015年在文献[17]中提出基于观测合理聚类的模型结构优化方法和结构与参数相结合的字符模型优化策略,并应用于多字体维吾尔文文本行的无切分识别[17];阿布都瓦依提·尼亚孜2010年在文献[18]中讨论了维吾尔文网站网络舆情的引导和控制问题[18];卢修配等人2012年在文献[19]中分析了维吾尔文网络关于搜索系统设计、舆情语料库建立、维吾尔语言自动识别算法设计、热点话题分析方法以及网站结构分析等五个关键问题[19];王嘉梅等人2013年在文献[20]中以彝文为例,构建了基于人工免疫原理的网络敏感信息滤取系统[20]。

3 少数民族舆情监控应用现状

在少数民族语言文字舆情监侦、预测和预警的应用系统方面,国内比较知名主要包括:方正智思舆情监测系统、乐思舆情监测系统、TRS网络舆情监控系统、军犬网络舆情监控系统、鹰隼网络舆情监控系统等[21]。在这些舆情监控系统中,只有部分系统都可以针对少数民族语言文字进行舆情监控,如其中的北京中科点击公司就推出了“军犬少数民族语言舆情系统”版本,实现了53种少数民族语言的检测及多语种的采集,能够实时地对信息进行自动分类、消重、提取关键词等处理,为用户提供准确、无冗余、无杂质、易检索的信息服务[22]。

此外,还有山东鲁网的“政府网络舆情监测系统”可有效监测藏文、维文、蒙文、彝文、朝鲜文等少数民族语言舆情信息[23],搜讯科技研发的御猫网络舆情监控系统可以全面监测藏、维、彝、蒙十余种少数民族语言的软件系统[24]等,总体应用不是很广泛。

4 结语

从少数民族地区的角度来研究网络舆情对中国的稳定和团结具有重要政治意义。本文首先论述了少数民族地区舆情监控的重要意义,在此基础上,总结了少数民族舆情的四大特点:突发事件为中心的地域性、历史因素导致的民族性、宗教和国外势力导致的政治性、以及逃避网络监而产生的隐蔽性;然后从学术界研究现状和行业应用现状对少数民族地区舆情监测的研究进行了综述和总结。

[1]中华人民共和国国家民族事务委员会.中国的民族区域自治白皮书中文版[EB/OL]. http://www.seac.gov.cn/art/2005/2/25/art_145_113679.html.2005-02-25

[2]寇鸿顺,马洪伟.民族问题舆情的特点及影响因素探析[J].青海社会科学,2015,1:013.

[3]中国互联网络信息中心.第37次中国互联网络发展状况统计报告[R].37-41,2016.01.

[4]梁春阳.少数民族地区网络舆情及网络舆情危机特点分析[J].图书馆理论与实践,2014(1):30-34.

[5]吴亮.中国少数民族群体性事件及治理机制研究[D].北京:中央民族大学,2011.

[6]云南大学课题组.边疆多民族地区的社会利益格局变动与利益协调[J].云南行政学院学报,2008(2):49-53.

[7]兰义湧,刘海峰,杨媛媛.少数民族语言文字网站的自动识别和采集[J].计算机科学,2015,42(z1):79-82.

[8]Sibun P,Reynar J C.Language identification:Examining the issues[J].1996.

[9]Kruengkrai C,Srichaivattana P,Sornlertlamvanich V,et al.Language Identification Based on String Kernels[C].Communications and Information Technology,2005.ISCIT 2005.IEEE International Symposium on.IEEE,2005,2:926-929.

[10]Brown R D.Finding and Identifying Text in 900+Languages[J].Digital Investigation,2012,9:S34-S43.

[11]王思丽.藏文网页自动发现与采集技术研究[D].西北民族大学,2010.

[12]王睿.蒙古文网页抓取及编码识别转换研究[D].内蒙古大学,2008.

[13]哈力旦.维吾尔文字识别技术中的切分算法研究[J].新疆大学学报:自然科学维文版,2013,34(2):68-73.

[14]买日旦,吾守尔,维尼拉,等.电子词典软件系统中对维,哈,柯文进行自动判别技术的研究[J].新疆大学学报:自然科学版,2011,28(1):88-92.

[15]江涛,于宏志,李刚.基于藏文网页的网络舆情监控系统研究[J].全国计算机安全学术交流会论文集(第二十三卷),2008.

[16]邓竞伟,邓凯英,李永生,等.基于藏文网络的舆情传播模型[J].计算机系统应用,2013(3):209-211.

[17]姜志威,丁晓青,彭良瑞.针对无切分维吾尔文文本行识别的字符模型优化[J].清华大学学报:自然科学版,2015(8):873-877.

[18]阿布都瓦依提·尼亚孜.浅析维吾尔文网站网络舆情的引导和控制[J].新闻世界,2010(7):204-205.

[19]卢修配,齐向伟,艾斯卡尔.雏吾尔文网络舆情研究现状及几个关键问题[J].新疆师范大学学报:自然科学版,2012(2):86—88.

[20]王嘉梅,张建营,赵继勇.云南跨境多民族语言复杂网络舆情内容分析[J].信息与电脑:理论版,2013(6).

[21]杜智涛,谢新洲.利用灰色预测与模式识别方法构建网络舆情预测与预警模型[J].图书情报工作,2013,57(15):27-33.

[22]中科点击.军犬少数民族语言舆情系统[EB/OL].http://www.54yuqing.com/contents/2/12645.html.2014-06-28.

[23]鲁网舆情检测.政府网络舆情监测系统——少数民族语言网络舆情监测[EB/OL].http://service.sdnews.com.cn/yuqing/#3dtx.

[24]姬玉山.御猫:网络舆情监测的大数据平台——访山西搜讯传媒科技有限公司总经理万嘉[J].记者观察,2013(1):125-127.

Minority;Public Opinion Monitoring;Minority Language

Survey on the Public Opinion Monitoring on Minority Area

AI Yong,LIU Sai
(College of Computer Science,South-Central University for Nationalities,Wuhan 430074)

1007-1423(2016)22-0044-04DOI:10.3969/j.issn.1007-1423.2016.22.010

艾勇(1985-),男,湖北武汉人,博士,研究方向为数据起源、舆情监控、信息安全

2016-05-31

2016-07-29

中国少数民族地区网络舆情的研究对国家稳定和团结具有重要政治意义。在论述少数民族地区舆情监控的重要性的基础上,总结少数民族舆情的四大特点:地域性、民族性、政治性和隐蔽性。最后,对少数民族地区舆情监测的研究发展现状和技术应用现状进行综述和总结。

少数民族;舆情监控;少数民族语言

国家民委科研项目(No.14ZNZ018)、中南民族大学中央高校专项资金项目(No.CZW15079)

The research on network public opinion of minority area has important political significance to the national stability and the reunion.Discusses the importance of the monitoring of minority language public opinion,summarizes the four major characteristics of minority public opinion:regional,national,political and concealment.Finally,concludes the related works of research and application development on public opinion monitoring of minority area.

猜你喜欢
网页舆情少数民族
基于HTML5与CSS3的网页设计技术研究
我认识的少数民族
基于CSS的网页导航栏的设计
基于HTML5静态网页设计
基于URL和网页类型的网页信息采集研究
消费舆情
舆情
舆情
少数民族治疗感冒的蕨类植物(一)
少数民族治疗感冒的蕨类植物(二)