基于三角模糊数的网络舆情预警指标体系构建

2012-07-23 13:05
统计与决策 2012年2期
关键词:舆情指标体系预警

刘 毅

(天津外国语大学国际商学院,天津 300204)

0 引言

所谓网络舆情,指的就是通过互联网表达和传播的各种不同情绪、态度和意见交错的总和[1]。网络舆情的产生源自公共事务中所包含的刺激性信息。公共事务从本质来看是社会矛盾的反映,往往都是人们普遍关心的、触动人们现实利益的、迫切需要完善和解决的社会热点社会问题等。目前我国正处在转型期,社会运行机制的转变、社会组织结构的变化、利益群体的调整,都直接影响到每一个社会成员切身的经济利益和社会地位;生活节奏加快、下岗失业、贫富差距拉大、社会竞争加剧等社会问题使得一些人的心理结构失衡,紧张、焦虑、困惑、不满等社会情绪浮动,浮躁心理流行。但是,公众对现实的种种不满往往缺乏适当的排解渠道,而互联网为民众宣泄情绪和表达态度、意见提供了最佳的渠道,成为一条上情下达、下情上传的“管道”。然而,那些不利于社会安定团结的消极舆情,往往是群体性突发事件爆发的前兆。如何建立一个网络舆情指标体系对群体性突发事件进行预警,已成为当前理论研究、政府治理和社会控制等应用领域的热点问题。

1 基于三角模糊数的研究方法

三角模糊数是指R上的模糊集具有隶属度函数:

这一三角模糊数表示了“大约b”,“b左右”等模糊概念。

在实施网络舆情预警评价的过程中,由于指标具有难以量化或不能精确度量的特点,因此适宜使用模糊方法。但采用一般的模糊评价方法,由于选择“优”、“良”、“中”、“差”等模糊语言对指标进行评价,会使许多有用的信息在计算过程中丢失。因此,本文采用以三角模糊数这种逼近形式来近似地表示模糊语言为基础的模糊德尔菲法和模糊层次分析法。为了有效地解决了专家小组不确定的语义评价数量化的问题,不仅可以扩大可以利用的信息范围,增加有效信息量,还可以使计算结果更加贴近实际,提高评价的可靠性和精确性。

1.1 模糊德尔菲法

传统德尔菲法主要目的是为了取得专家的共识,但执行的过程中有一些问题会发生,如专家的挑选有所偏差、因采用匿名的方式使专家的回答草率且退出率高、为取得共识而忽略不一致的意见、问卷问题模糊不清或过于简化、缺乏理论基础等。因此,模糊德尔菲法是加入模糊理论概念,利用语意变量表达每位专家的意见,以获取更佳的整合结果。

1.2 模糊层次分析法

层次分析法(AHP)是20世纪70年代初由美国著名运筹学家、匹兹堡大学T.L.Saaty教授提出的一种定性分析和定量分析相结合的系统分析方法。而Buckley认为层次分析法在准则评价上,无法适当地呈现评估者的主观认知与判断,因而将模糊理论与层级分析法相结合,提出模糊层级分析法,以反映真实环境下决策分析所遭遇的问题[3]。Buckley将层次分析法中成对比较值加以模糊化,以顺序尺度取代数字比率来表示两两要素间相对重要程度。

2 网络舆情预警指标的初选

2.1 网络舆情预警的警源

在社会预警的研究过程中,往往会涉及到社会警情、警源、警兆、警限和警级等若干概念[5]。其中,网络舆情预警的警源来源于现实社会中公共事务,它是社会矛盾在现实生活中的反映。因此,网络舆情预警的警源在网络上的主要表现形式就是涉及某些公共事务或热点问题的网络话题,是对现实的网络表达。

在警源的归纳上,为了避免主观随意性,本文梳理了当前社会学、新闻与传播学、信息管理等相关领域的研究成果。同时注意了其概括性和全面性,避免过于琐碎,尽量让刺激舆情产生的每个具体事件都能归入其中一类,最终形成以下四类警源:

第一类为自然内生警源,即环境污染和环境保护、自然资源和能源问题、流行性疾病传播。第二类为自然外生警源,即各种不可抗力引起的自然灾害。第三类为社会内生警源(1)基本生存保障问题,包括人口问题、婚育问题、粮食与食品安全、个人及家庭收入问题、就业与失业问题、医疗问题、养老问题、住房问题。(2)政治问题,包括立法问题、司法公正问题、民主政治、军事与国防、各级政府工作绩效、外交政策、国家主权与统一、方针路线政策、体制或制度改革、选举与任命、维护公民权利与义务、民族问题、腐败问题、恐怖主义活动。(3)经济问题,包括经济增长和衰退、进出口贸易及争端、引进外资及经济合作、通胀与物价、财政与债务、货币与金融、股市涨跌。(4)社会问题,包括三农和新三农、城市新贫困、贫富与地区差距、社会公平与公正、家庭暴力、劳资矛盾、社会治安、刑事犯罪、重大安全事故、社会谣言、群体性事件、上访事件。(5)思想文化问题,包括宗教问题、道德与伦理问题、信仰与价值观、教育问题、文化思潮、文体娱乐、科技发展。第四类为社会外生警源,即世界政局变化、全球及区域经济涨落、区域政治对立及武装冲突、区域民族及宗教问题、经济援助与制裁、外来价值观及文化冲击。

2.2 网络舆情预警的警兆

网络舆情预警中最关键的一步是选择警兆指标。社会警兆是警情在孕育与孳生过程中先行暴露出来的现象,所以警情在发生之前必有征兆可循。

鉴于舆情的产生是一种复杂的社会和心理运动相互作用的结果,在确定警兆指标时,我们坚持主观指标和客观指标相结合、可行性和可操作性之上的全面性,即所选取的指标必须可计量,否则只能停留在理论意义上,在实践中无法实现。为了避免主观随意性,我们在参考社会学、新闻与传播学、信息管理等相关领域的研究成果的基础上,从以下四类警兆指标入手。

(1)网络舆情广度(X1):①网络舆情传播渠道的广度(X11),即时通讯软件、BBS、Blog、微博、贴吧、新闻评论、社交性网络等;②参与网民的总量(X12);③网民地理分布状况(X13),可通过IP获取。

(2)网络舆情热度(X2):①事实性主题发布量(X21),主要指新闻报道类主题,特点是以陈述事实为主,突出表现为主流媒体原创新闻的发布;②评论性主题发布量(X22),带有鲜明态度倾向和情绪色彩的评论性主题,包括主流媒体及网民原创性内容;③主题点击率(X23);④主题转载量(X24),即对原创性主题的转载,大多是为了表明对转载内容的支持和赞同;⑤主题评论量(X25),对所发布的主题进行评论的数量;⑥主题及评论持续时间(X26),从第一条信息出现到反映该内容的信息逐渐不为人们关注所持续的时间;⑦主题的敏感度(X27),所发布主题内容是否涉及政治、经济、社会等领域中的敏感问题。

(3)网络舆情的态度倾向(X3):①支持(X31),对主题包含的观点表示赞同或支持;②反对(X32),对主题包含的观点表示异议或反对(包括以理性的言论表明反对态度或以情绪化的言论表明反对态度);③中立(X33),无明确态度指向或认为该观点对错参半;④质疑(X34),对主题包含的观点提出质疑;⑤无所谓或说不清楚(X35);⑥对其他网友评论的态度(X36),例如对赞同意见的支持、对赞同意见的反对、对反对意见的支持、对反对意见的反对等等;⑦其他(X37),不能归入以上各类的评论内容归入此类,例如与此主题毫无关系的纯灌水类内容等。

(4)网络舆情的行为倾向(X4),即有无导致从心理状态发展成为实际行动的苗头性信息,该类信息包括:①怂恿集体上访活动(X41);②支持罢工行为(X42);③号召静坐、集会、游行、示威等活动(X43);④煽动宗教和民族冲突(X44);⑤鼓动暴力性事件(X45);⑥呼吁集体抵制和不合作行为(X46)。需要注意的是,这类行为倾向应该具有群体性和突发性的特征,对社会稳定造成一定的威胁,应该予以高度关注。

3 网络舆情预警指标的筛选

网络舆情预警指标的构建实际上就是对警兆指标的筛选和确认,本文利用基于三角模糊数的模糊德尔菲法对初步提出的评价指标进行分析和筛选。

3.1 专家问卷调查

利用问卷调查搜集专家群体意见,以取得每位专家对初始指标重要性的评估值。每位专家利用语意变量,表达每个初始指标的重要性。课题组向北京、天津、上海、南京等地区的12个高校、科研机构和相关部门机构的专家发放问卷共50份,回收50份,整体有效问卷共计48份,有效回收率为96%。

3.2 问卷的信度和效度检验

本研究的信度检验采用内在信度检验,用Cronbachα系数进行评价,该系数一般要求均不低于0.6。效度分析检验一般采用内容效度(表面效度)和结构效度检验。内容效度是指设计的题项是否能代表所要测量的内容或主题,通过专家评阅确定,结构效度则使用因子分析法。

笔者使用SPSS 17.0对内在信度和结构效度进行检验。分析结果显示,问卷总体Cronbachα系数在0.620-0.975之间,反应调查结果能够满足信度的基本要求。在分析结构效度前,首先进行抽样适度测定值(KMO)衡量,KMO值为0.914,P=0.00056(P<0.001),表明数据适合进行因子分析。对23个指标进行因子分析,产生4个公共因子,能够解释总体方差的71.10%。23个指标的因子负荷在0.49-0.87之间,所有指标在相应因子上的因子负荷均≥0.40,可以认为本问卷具较好的结构效度。通过专家意见征求和反馈,显示本问卷同时具有较好的内容效度。

3.3 建立三角模糊数

利用模糊德尔菲法整合48位专家的模糊权重评估值,以计算每项初始指标重要性的三角模糊数。以X11“传播渠道的广度”的模糊权重评估值为例,其0.9+22×0.7+3×0.5+3×0.3)=0.75,c=0.9。因此,0.75,0.9)。

3.4 指标筛选

利用简易重心法,将各个初始指标的模糊权重W͂k转成单一值Sk,以网络舆情热度中第一个指标“传播渠道的广度”为例:Sk=(0.3+0.75+0.9)/3=0.65。本文选取临界值大于0.6的指标,经过筛选最终得到如表1的指标。

在表1指标筛选的过程中,有一些指标未通过筛选,例如,第二大类中的“主题敏感度”属于典型的不易计量指标,因为敏感性本身就是相对概念,受时间、事态发展、主观认识等因素影响较大,所以实际操作性较差,因此未被通过;第三大类中的“对其他网友评论的态度”虽是网络舆情碰撞的最常见形式,但其基本内容同样可归入支持、反对、中立、质疑等几种基本态度,可以略去。

表1 指标帅选结果

因此,该指标体系的筛选原则是可行性和可操作性之上的全面性,即指标能被较好地予以量化表示,主观影响因素尽量最小,全面详尽并不一定具有较强的可操作性。此外,由于舆情是人们对于自身情绪、态度、意见的表达,所以指标体系必须包含对主观态度倾向进行判断的指标类别,体现了对主观变量和客观变量进行测量的要求。

这一指标体系较适合对当前备受关注的某一的公共事务或热点问题进行网络舆情预警。在网络上则表现为对涉及某一公共事务或热点问题的网络话题进行网络舆情预警,这往往也是现实舆情工作的需求。

4 确定网络舆情预警指标模糊权重

本文利用基于三角模糊数的模糊层次分析法确定预警指标模糊权重值。在回收的48份问卷中,专家还被要求利用表2的语意变量对四个层面的预警指标的相对重要性进行评估,以用来确定预警指标的模糊权重值。

以四个一级指标为例,根据48位专家对四个一级指标重要程度的评估作出比较矩阵(如表2所示),然后对每个专家分别建立模糊正倒值矩阵:

表2 各评估专家层面间重要程度比较矩阵

为了使计算结果更加准确可靠,我们运用matlab7.0软件进行编程来计算各级指标的模糊权重以及一致性检验和最大特征根计算。在通过一致性检验和最大特征根检验的前提下,最终得到如下结果。

四个层面的模糊权值:

网络舆情广度层面下评估指标的模糊权重值:

网络舆情热度层面下评估指标的模糊权重值:

网络舆情态度倾向层面下评估指标的模糊权重值:

网络舆情行为倾向层面下评估指标的模糊权重值:

经过以上指标筛选和权重确定等步骤,最终得到图1所示的网络舆情预警指标体系。

图1 网络舆情预警指标体系

5 结语

本文构建的指标体系是网络舆情预警研究的基础,具有以下几个特点:第一、该指标体系更加适合对针对某一具体公共事务或热点话题而产生的网络舆情进行预警时使用;第二、指标的筛选原则是可行性和可操作性之上的全面性,即指标能被较好地予以量化表示,主观影响因素尽量最小,全面详尽并不一定具有较强的可操作性;第三,权重不是一成不变的,受到主观认识、具体事件、实际工作部门需求等诸多因素的制约,因此在实际应用中,指标的权重可以根据具体需求进行重新赋值。此外,该指标体系也具有一定的局限性。由于网络舆情本身表现形式的多样性,我们无法完全确定网络警兆指标体系的全部指标,也不清楚各个指标之间的联系,使网络警兆指标体系带有结构灰性、关系灰性的特征[6],呈现出一种“部分因素已知,部分因素未知”的情况的适用性[7]。因此,本文所使用的研究方法虽然在指标体系建构方面存在若干优点,但方法的局限性使其很难完全满足对预警功能的要求。为了解决这一问题,我们在今后的研究中还将以本文得到的指标体系为基础,运用基于白化函数的多指标灰色评价方法作为构建网络舆情指标体系后进行网络舆情预警的评价方法,以完善网络舆情预警研究,弥补本文在研究方法上的局限性。

[1]刘毅.网络舆情研究概论[M].天津:天津人民出版社,2007.

[2]Ishikawa A.,Amagasa M,etc.The Max-Min Delphi Method and Fuzzy Delphi Method Via Fuzzy Integration[J].Fuzzy Set and Systems,1993,9(5).

[3]Buckley J.J.Fuzzing Hierarehical Analysis[J].Fuzzy Sets and Systems,1985,(17).

[4]Csutora R.,Buckley J.J.Fuzzing Hierarehical Analysis:the Lamb⁃da-Max Method[J].Fuzzy Sets and Systems,2001,(120).

[5]阎耀军.超越危机:社会稳定的量度和社会预警[M].延吉:延边大学出版社,2003.

[6]邓聚龙.灰理论基础[M].武汉:华中科技大学出版社,2002.

[7]邓聚龙.灰色系统基本方法[M].武汉:华中科技大学出版社,2005.

猜你喜欢
舆情指标体系预警
2022城市商业魅力指标体系
网络空间攻防对联合作战体系支援度评估指标体系构建
法国发布高温预警 严阵以待备战“史上最热周”
园林有害生物预警与可持续控制
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
消费舆情
舆情
舆情
舆情