基于事理图谱的政策影响分析方法及实证研究

2019-07-11 08:30单晓红庞世红刘晓燕
复杂系统与复杂性科学 2019年1期
关键词:事理新政相关者

单晓红,庞世红,刘晓燕,杨 娟

(北京工业大学经济与管理学院,北京 100124)

0 引言

政策的出台往往会引起利益相关者或者市场的较大变化,进而会影响社会和谐和市场稳定。例如2006年颁布的房地产政策“国六条”,在短期内,政策的实施有效地抑制了房地产投资与消费过热的问题,对房地产市场的稳定起到了一定的作用[1]。研究政策颁布后的影响对于政府了解政策实施效果以及提高政府治理水平具有重要意义。目前政策影响的研究主要包括研究内容和研究方法两个方面。

政策影响的研究内容主要集中在政策对某利益相关者和相关市场的影响。首先,政策对利益相关者的影响研究方面。从公共政策角度,李素利[2]、王亚民[3]分别研究了养老政策和延迟退休政策的影响,结果表明,养老政策的不同价值特性对养老生活有不同的影响;延迟退休政策引起的非议异性较高,推行需要调整。从产业政策角度,Aghion[4]、何熙琼[5]指出产业政策和企业之间的竞争有相互促进的作用。从经济政策角度,货币政策[6]、结构性减税政策[7]、公允价值[8]等对利益相关者的影响较受关注。其次,政策对相关市场的研究方面。研究者倾向于探讨经济政策对相关市场带来的影响,Chung[9]以及余春雨[10]指出货币政策能够显著影响股票价格。Kulczycka J认为高税收会削弱铜矿业开发的前景[11]。从产业政策角度出发,Freedman M等研究证明,产业政策增加了劳动力市场上女性的比例[12]。周阳敏[13]、Wang X[14]以及Tabeau A[15]从公共政策出发,得出结论:限购令与房产税相比,限购令对房地产市场产生的影响更大;授权和补贴相互协调互补,对农业起到更好的作用;严格的REDD政策能够保护可能用于农业生产的土地储备。

在政策影响的研究方法上,学者主要采用回归分析方法[2]、CGE模型[16]、幂律[17]等数学模型,量化政策对利益相关者或者市场产生的影响;常飞[18]使用向量自回归(VAR)证明货币政策对不同地区房地产市场影响的差异化程度较大。随着研究的深入,SVAR模型[19]、PVAR模型[7]等VAR的演化模型被引入政策影响研究。在数据源上,研究者多使用面板数据[20-21]、年报或数据库中的数据[15,18],以及调查问卷[2,22]收集到的数据。

综上所述,在政策影响数据来源方面,历年的统计数据数量较少,调查问卷数据受到调查方法、调查样本的限制,无法充分分析政策带来的影响。在线评论可以有效克服调查问卷和统计数据的时效性及数据量不足的缺点。现有研究方法多利用定量方法,内容多以分析政策对具体市场或某一利益相关者影响为主,无法深入和完整地解释政策对多个利益相关者和市场变化带来的影响。利用事理图谱[23]能够清晰地刻画政策和利益相关者行为以及市场变化的因果关系和顺承关系,进而深入地分析和解释政策带来的影响。

事理图谱是以事件为节点、以关系为边的有向图。在关系识别上,利用触发词识别句子关系[24-26],进而有效刻画事件之间的关系和影响。本文以政策颁布后形成的评论为数据源,使用触发词识别句子关系,进而抽取事件对,构建政策影响事理图谱;使用扎根理论泛化事件,形成代表性更强的抽象事理图谱,据此分析政策影响。本研究通过事理图谱可以同时分析政策对市场及利益相关者产生的影响,根据图谱中的节点及时调整政策和采取措施,对政府等相关工作者具有重要意义;同时拓展了事理图谱的应用范围,促进事理图谱的发展。

1 政策影响事理图谱构建

首先对政策颁布后发生的事件以及事件之间的关系进行界定,其次对数据采集与预处理给出相关说明;然后介绍从文本中抽取事件的过程及步骤;最后介绍事件泛化的方法,并提出事理图谱构建。整个构建流程如图1所示。

1.1 概念界定

事件:一项新政策颁布后,利益相关者会产生相应的行为以适应该项政策对自身带来的影响,市场也会随之发生变化。相关事件被提及的频次越高,表示该事件引起的关注度越高,政策产生的影响程度较大。本文的事件是指通过在线评论所反映出的政策颁布后利益相关者行为以及市场的变化。

事件的顺承关系:以时间为标志的事件的先后顺序,反映了政策与利益相关者和市场变化的时间上的关系。

事件的因果关系:在满足顺承关系基础上,两个事件存在原因和结果关系,反映了政策对利益相关者和市场的影响结果。

在线评论、事理图谱以及客观事实的关系:在线评论是客观事实的反映,从在线评论可以知道现实世界中发生的事件;而事理图谱则是以图的形式刻画了现实中发生的相关事实;本文基于在线评论的数据形成事理图谱,从而观察政策带来的相关影响,如图2。

1.2 数据采集与预处理

本文数据源来自与所选政策相关的网络论坛。根据所选政策的百度指数的波动趋势,确定研究的时间段。使用八爪鱼采集器采集网站相关数据。对采集到的数据按时间整理,删除重复数据。运用哈工大提供的LTP,对数据进行分句、分词及词性标注等预处理。

图1 事理图谱构建流程Fig.1 Procedure for event evolution graph

图2 客观事实、在线评论和事理图谱之间的关系Fig.2 Relationship among objective facts, online reviews, and event evolution graph

1.3 事件抽取

本文选取基于规则匹配的方法识别句中的因果关系。汉语文本中,因果句包括明确因果句和模糊因果句两种形式[27]。明确因果句具有标识词,可以据此采用规则模板的方式抽取因果对。模糊因果句虽然有明确的提示词可以区分,但是因果成分模糊,不易提取,因此基于扎根理论的方法抽取事件对。类似地,对于一般句子中的顺承事件对的抽取,也采用扎根理论的方法进行。

1.3.1 规则模板的生成

规则模板是在句法模式的基础上生成的,它是用来判断数据是否是因果句的判定规则,格式为。其中,Pattern是根据汉语语法的特点以及因果句中含有的提示词等,规定的判断因果句的正则表达式。Priority表示句子优先匹配的句法规则等级。

本文利用文献中总结的明确因果句和模糊因果句的句法特点,编写句法模板[27],例如明确因果句中,模式1明确因果句句法模式[Cause],[Effect],其中Cuec1∈[因(为),由于,既(然),如果,只要]。这类句法模式的句子如:“<由于>[感冒了]Cause,[可可今天没去上学。]Effect”;模糊因果句与明确因果句不同的地方仅限于因果提示词不同。

根据前面提出的句法模式,设计出9个规则模板。用A表示一个词集合,用Sen表示一个句子,那么一个句子可以表示为Sen={a1,a2,…,an},ai是集合A中的词,i=1,2,3,…,n句子经过词性标注之后表示为Sen1={a1/t1,a2/t2,…,an/tn},ti表示ai的词性。如上面提到的明确因果句中的规则模板为:ifa1∈c1andt1=cthenSen为模式1明确因果句(其中c1和c表示不同的连词)。

规则模板的优先序的设计基于“北京大学现代汉语语料库(CCL)”,对语料库中因果句按照规则模板进行统计,以频数高低判断优先序。

1.3.2 事件对抽取

根据前述形成的规则模板可将句子分为3类:明确因果句,模糊因果句,一般句子。为了能够明确地表示事件,抽取的事件对用一个名词、一个动词或者动名词词组来表示。

1)明确因果句事件抽取

明确因果句主要是通过规则匹配的方式,区分句子的原因部分和结果部分。例如句子“你之所以成功,主要缘于你的努力”,原因部分为[你的努力],结果部分为[成功]。接下来对明确因果句进行依存句法分析,结合句法依存关系加以判断原因和结果部分是否存在主谓(SBV)、动宾(VOB)或介宾(POB)关系。例如上面的句子的提取到的因果对为:[你努力,你成功]。在这个句子中,我们将“你努力”和“你成功”看作两个事件,分别是原因事件和结果事件。在事理图谱中,表现为“你努力”是一个源节点,“你成功”是一个目标节点,两个事件之间就存在一条因果边。

2)模糊因果句事件提取

由于模糊因果句无法采用规则模板匹配的方法提取事件,因此引入扎根理论的方法抽取模糊因果句的事件。

扎根理论由社会学家Glaser 和Strauss 于1967年提出。扎根理论中对资料分析和归类的过程称为编码,它将收集的资料不断打碎、整理和重组,从而挖掘概念、提炼范畴,包括开放式编码,主轴编码和选择性编码[28]。

开放式编码主要是对收集到的数据概念化,用一定的概念和范畴来反映收集到的资料中心内容,然后把抽象出来的概念“打散”,重新进行整合,聚类的过程。以表1中的数据为例,这里将原数据中体现事件发生的句子概念化,并提炼为一个范畴进行表示。

表1 扎根理论抽取事件示例Tab.1 Event extracting based on grounded theory

3)顺承事件对的抽取。

对于一般的句子,同样采用扎根理论方法提取其中的事件对,过程与上面相同。对于使用规则模板抽取明确因果句中,结果不理想的因果句也采用扎根理论方法抽取事件对。这样抽取的事件对既有因果事件对,也包括顺承事件对。

主轴式编码的主要任务是旨在发现独立范畴之间的潜在联结关系[28]。利用主轴式编码,判断抽取出的事件对是因果关系还是顺承关系,进而确定边的类型。例如范畴“317新政”、“中介调整”以及“中介推房”之间,引起“中介调整”的原因是“317新政”的发布,中介在调整后马上推出了“中介推房”的措施。因此,在范畴“317新政”和“中介调整”之间存在因果关系,而范畴“中介调整”和“中介推房”之间存在着顺承关系。

1.4 事理图谱构建

事件抽取之后,就可以利用Gephi工具,以事件为节点,以事件之间的关系为边,构建政策影响事理图谱和政策影响抽象事理图谱。

1.4.1 政策影响事理图谱的构建

为保证数据的完备性,首先构建政策影响事理图谱。以经过开放式编码所得到的范畴事件为节点,以因果关系或顺承关系为节点之间的边。需要指出的是,在政策影响事理图谱的某一链条中有因果关系和顺承关系交叉的情况。在政策影响事理图谱中,节点颜色的深浅代表节点的度的大小,可以表示为事件的重要性程度。节点的标签表示该节点代表的事件。

图3 事件泛化示意图Fig.3 Illustration for event generalization

1.4.2 政策影响抽象事理图谱构建

经主轴式编码生成的因果链和顺承链只关注特定事件之间的关系,但是却无法发现事件之间的一般性规律。为了更好地体现政策的影响,对事件进行泛化处理,使事件更具代表性。

选择式编码是寻找核心范畴,建立核心范畴与主范畴和其他范畴之间的联系,以故事线的形式将其呈现出来[28]。在这一阶段,本文主要对比各独立的因果链、顺承链之间的合理性,将能够相容的事件泛化为一个高层次的事件,有关系的事件链相互联结,最终形成事理图谱。如图3中,关系链“A→B1→C1”和“A→B2→C2”经过主轴式编码,范畴B1和范畴B2可以用同一核心范畴B表示,同理,范畴C1和C2可以用核心范畴C来表示,最终泛化得到的关系链为“A→B→C”。

对事件进行泛化处理之后,事件之间的边就有了权重。在政策影响抽象事理图谱中将因果关系和顺承关系区别开来分别构建因果图谱和顺承图谱。其中,节点代表泛化事件,边代表因果关系或者顺承关系,边的粗细代表权重的大小。

2 政策影响分析

新政策颁布之时,会很快形成大量的在线评论,包括理解的、不理解的、赞成的、反对的多种情感倾向,均以文字、表情等多种形式发布,在这些繁杂的表达中蕴含着丰富的能够体现各利益相关者行为和市场变化的信息。利用事理图谱将这些信息表达出来,进而分析政策产生的影响。

2.1 基于政策影响事理图谱分析

政策影响事理图谱表达了政策与利益相关者行为以及市场变化之间的因果、顺承关系。以政策为原因事件,所有从该节点出发的无标签边(因果关系)所指向的目标节点均为该政策的直接结果事件,因果关系依次传递形成多个因果链,如图4a所示。类似地,顺承链如图4b所示,其中边上的标签f(follow)表示顺承关系。同一个事件可能同时出现在两种关系链之中,可能是作为因果事件和顺承事件交替同时存在,如图4c所示。由这种交叉的链条相互连接,形成事理图谱。

图4 因果链、顺承链示意图Fig.4 Causal chain and follow chain

2.2 基于政策影响抽象事理图谱分析

政策影响抽象事理图谱是具体事件经过泛化得来,在政策影响事理图谱中表示政策、利益相关者具体行为和市场具体变化之间因果顺承关系的边,在抽象事理图谱中则表示政策与某类利益相关者和市场之间的关系。如图5所示,节点B21、B22、B23可以抽象为事件B2,其中由节点A到B21是顺承关系,由节点A到B22、B23为因果关系,所以在因果图谱中,A→B2边的权重为2,顺承图谱中权重为1。根据权重的大小,可以清楚地研究政策对利益相关者行为和市场变化的影响力大小。

图5 政策影响抽象事理图谱形成示意图Fig.5 Abstract event evolution graph for policy impact

3 实证研究

3.1 数据获取

317新政是北京市建委、北京政府为稳定房价,于2017年3月17日出台的房地产调控政策。本文以“317新政”房地产政策为例,阐释政策影响。

在百度指数中搜索“317新政”,可以发现该词的指数从2017年3月17日开始到2017年3月31日波动较强。四月份以后没有较大的波动,如图6所示。因此,选取2017年3月17日到2017年3月30日为研究时间段,采集到“水木社区”的评论数据共6 823条。

图6 “317新政”百度指数趋势图Fig.6 Baidu index for the “317 New Deal”

3.2 317新政影响事理图谱构建

按照前述步骤处理数据。经过因果句判断,得到的明确和模糊因果句共计213句。最后经过提取得到的因果事件对有101对,顺承事件对有27对。构建的政策影响事理图谱如图7所示。其中未经泛化的节点数为133,边128条。

图7 政策影响事理图谱Fig.7 Event evolution graph for policy′s impact

房地产政策颁布后,通过在线评论的分析,受到政策影响的利益相关者包括政府、银行、中介和公众,因此这些利益相关者的行为和房地产市场是泛化的主要依据。

经过泛化,最终得到16个节点,形成政策影响抽象事理图谱(如图8、图9所示)。同时,由于论坛中讨论的话题并不全部集中于房地产政策上,因此有11个关系对无法列入上述分类之中。

3.3 基于在线评论的317新政影响分析

3.3.1 317新政影响事理图谱分析

图7主要包括51条因果链,41条因果顺承交叉链,没有单独的顺承链。这里以网民关注较多的几个因果链和顺承链为例进行分析。

图8 政策影响抽象事理图谱—因果图谱Fig.8 Causal graph for policy′s impact event evolution graph

图9 政策影响抽象事理图谱—顺承图谱Fig.9 Follow graph for policy′s impact event evolution graph

因果链1:317新政→哄抬房价→住建委检查→中介被关闭/中介自行停业。

因果链2:317新政→离婚潮→央行新规→离婚无效

因果/顺承链3:317新政→成交量减少/观望/房子惜售→房源减少

“317新政”颁布后,立即引起了巨大的影响。部分中介部门以新政为噱头,借助在线舆论来哄抬房价,扰乱房地产市场。针对此,政策相关部门对中介进行了排查,11家中介被先后关闭。与此同时为了破除限购带来的限制,钻新政的空子,选择假离婚,因此形成了离婚潮。面对这种现象,中国人民银行对离婚一年以内的贷款人贷款做出了限制,对控制假离婚产生了较大的作用。新政颁布后的几天内,公众对新政认识不充分,不明确是否利好,出现了诸多观望的现象,甚至出现违约的行为,市场房源迅速减少,成交量同时下降。

3.3.2 317新政影响抽象事理图谱分析

1)因果图谱分析

在图8中,政策到公众积极行为、公众消极行为、公众预测、公众其他行为、房地产市场其他变化这五条边的权重均≥6。当房地产调控政策出台时,受到影响最大的是公众。出于对新政引起的不稳定的顾虑,多数公众处于消极的状态,如犹豫、骗房等。也有一部分仍然积极进行买房。

房地产市场受到政策影响次之。政策到房价变化、政府严查房地产市场、银行相关行为的边的权重≥4。房地产政策是为了稳定房价,房价短时间内出现较大波动;房地产市场也进入动荡期,炒房、哄抬房价等频发,政府部门此时对市场进行排查,惩罚相关的部门。银行部门也受到新政的影响,查贷、查征信的人数增多,颁布相关的规定等等,积极配合政府部门的行动。房地产政策的颁布主要为了稳定房地产市场,房价必定会受到较大的影响。一般政策在颁布之后,针对具体的实施情况后续会出台一些新的规定来保证政策有效实施。政策颁布后在短时间内可能会引起房地产市场的不稳定现象发生,如中介炒房、哄抬房价等,政府部门为了保证房地产市场稳定进行了一次排查,对于违规违法部门给予一定的惩罚。

此外,政策到新规定、股市变动、成交量变化、政府其他行为等多个事件的权重≤3,可见这些事件相对来说重要性较弱。

2)顺承图谱分析

在顺承图谱中,节点数量较因果图谱少,这是因为因果关系是以顺承关系为基础的,在政策影响中,多数事件之间都以因果关系的形式存在。在图9中以看到权重较大的边是由政策到房价变化、政府严查房地产市场。这几条边在因果图谱中的权重也比较高,这可以说明政策带来的主要影响集中在这些事件上。

3.4 相关建议

针对以上分析,本文提出以下几点建议:

1)由“政策→公众正面负面行为”的权重较大可知,政策对公众产生的影响较大。公众的行为又容易影响市场的稳定。因此在新政颁布后,公众应做到保持冷静。对于违规违法等行为对自己权益形成危害的,应及时举报,共同维持市场的稳定。

2)由“政策→中介正面行为/中介负面行为→政府严查房地产市场”可以得知,中介在新政颁布后活动相当活跃,接连采取相关措施,趁机盈利。然而如果其行为超出了法定的界限,结果将会是接受制裁。因此中介应提高自觉意识,增强从业人员的素质,齐心协力维护市场的稳定,才能长久的与市场一同获利。

3)由“政策→银行相关行为/股市变动”可知,银行、股市与政策的颁布息息相关。因此,在新政颁布的同时,银行等金融部门应积极配合采取相应措施,协调推动新政有条不紊地实施。

4)政府部门是政策的颁布者,在政策实施的过程中保证政策的有效运行。从抽象事理图谱中可知,政策可以主要关注公众和中介部门,对于炒房、哄抬房价等违规行为绝不姑息;完善档案监管机制,重点监督相关对象,防患于未然。

因此,在政策颁布时,通过在线评论将政策带来的影响可视化,更好地分析政策对利益相关者及市场的影响关系。从在线评论中反映的影响市场稳定和社会和谐的行为要引起高度重视,并加以科学的引导。

4 总结与展望

本文给出的基于事理图谱的政策影响分析方法是对以往分析方法的创新,主要利用大数据的优势,构建了政策影响事理图谱,将政策影响可视化。通过对“317新政”实证研究表明该方法是可行和有效的,能够客观地反映政策颁布后对利益相关者和市场产生的影响。

本文提出的方法给政策影响的研究提供了新的视角。通过事理图谱的方法,可以同时将某一政策对市场或者利益相关者产生的影响完整地呈现出来。根据事理图谱,可以找出新政产生影响较大的节点。以后政策颁布后,分析这些重要节点相似的节点出现的可能性,及时预警、重点监控。研究结果对于预测政策影响下事件的发生具有一定的参考价值,为政府更好地颁布、实施政策提供了借鉴,对于政府提高治理水平有一定帮助。

猜你喜欢
事理新政相关者
阐释现象 揭示事理——说明文写作六步曲
语 丝
基于利益相关者理论的本科教学中教师调课现象审视
“新政”爆款第一车?
新政不是“半夜鸡叫”
新政
关于新政的思考
全生命周期视角下PPP项目利益相关者关系网络动态分析
建构利益相关者管理的三层次结构分析
XBRL的传播对利益相关者参与程度的影响研究