基于本体的创新政策网络可视化研究*

2021-03-17 02:29刘晓燕庞雅如单晓红
科技促进发展 2021年1期
关键词:客体工信本体

■ 刘晓燕 庞雅如 单晓红

北京工业大学经济与管理学院 北京 100124

0 引言

科技创新是经济发展和社会进步的驱动力,是提高我国综合竞争力的重要路径,也是我国成为科技强国的重要支撑,而创新政策对于科技创新的形成具有激励和促进作用。提升我国创新政策的政策效果,不仅要考虑到政策之间的相容性,还要考虑到政策主体之间的协同性。因此越来越多的学者从政策网络的视角分析政策多元主体与政策的关联关系,力图从网络的视角揭示政策作用的机理。国家基金委也将政策分析视为创新治理要解决的关键问题,本文是国家社科重点项目“新兴科技环境下提升我国创新政策供给能力研究”的部分成果,通过对政策的采集、处理,展示政策网络的结构及关联关系,并对政策进行可视化,作为识别政策冲突、促进政策协同的依据。

作为连接社会与政府的重要纽带,公共政策受到越来越多利益团体的关注。但是由于公共政策所处的社会环境复杂,政府制定政策及相关机构执行政策的精准性[1]和有效性是目前面临的主要问题。政策网络这种新型的治理模式则为问题的解决提供了思路,能够将分散和分化的信息及资源整合起来满足不同部门交换信息的需求,实现社会资源最大化利用、提升制定政策的精准性、调节社会与政府之间的关系,推进政府精准治理[2]。早期学者们聚焦于政策网络的定性研究,主要关注政策网络的形成原因,类型及网络功能。Smith[3]认为政策网络是一种关系分类的方法,当团体与政府之间达成资源交换且获得政府认可时就会产生政策网络;Rhodes[4]指出政策网络的形成缘于资源依赖,且根据资源依赖的不同,分为政策社群、专业网络、府际网络、生产者网络和议题网络5 种类型;Heclo[5]和McFarland[6]提出具有政策网络雏形的议题网络,这些议题网络在结构上具有非正式、开放性和节点类型众多的特点;Kenis 和Schneider[7]认为除官僚组织和市场之外,政策网络也是一种新型国家治理模式,这种模式主张公私行动者在政策过程中进行互动,有助于解决政府失败和市场失灵的问题;Kickert[8]关于政策网络的研究则侧重于网络治理,他认为社会治理成功的关键在于实现有效的网络治理。后期学者们逐渐突破比喻或描述意义上开展研究的局限性,采取定量视角进行研究,主要关注政策网络结构特征及网络绩效。政策网络背景下,考察新兴经济体政府间机构关系演变的3种途径,即政策议程、权力集中度和异质性依赖,并将其应用于中国创新决策的演变分析[9];龚虹波[10]在构建政策网络比较分析框架的基础上,对中美4 水资源管理政策网络的网络参数、网络功能和网络绩效进行比较分析;Peters[11]等以四个与公共卫生相关的府际网络为例,探究政策过程中不同阶段的结构网络特征与网络绩效之间的关系;在区域创新政策网络的结构优化上,张韵和钟书华[12]提出网络高密度、网络中心均衡、凝聚子群力量约束和网络高协同性是结构优化的关键所在。

综上,国内外学者对于政策网络的定性和定量研究主要涉及政策网络的理论背景、网络的结构特征、网络绩效和网络优化等问题,缺乏政策网络本身结构视图方面的研究,但是要将政策网络的研究更好地应用到政府治理中,首先必须全面了解政策的基本情况,即政策网络结构及网络过程,可视化是政策研究的基础,能够把传统政策研究过程中的“黑箱”至少部分地暴露出来,以最简单的视图形式来清晰呈现,这对于深入研究政策网络尤为必要[13]。政策网络作为政策过程中多元行动者形成的一种网络状结构[3],其中的节点和关系具有多样性。节点包括政策制定主体、政策接收客体与政策等多样性节点,关系的多样性不仅体现为政策的发布与接收关系,还包括某些隐藏的关联关系如政策制定主体之间的府际关系、政策之间的关联关系等。伴随政策数量不断增多,大数据分析方法也逐步被应用于政策的研究中,其中基于政策文本的主题发现和政策主体关系抽取,不仅可以发现大量政策中隐藏的规律特征,还可以呈现政府间府际关系等政策主体特征,为借助智能化手段挖掘政策关联提供了重要手段。本体具有良好的概念层次化结构[14],可以借助类以及类与类之间的关联关系,将多样化的政策主体和关系结构有机呈现,是直观呈现政策多元化特征的途径和重要环节,不仅体现了政策制定和实施过程,而且可以服务于未来的智能化政策分析,为智能政务的发展奠定基础。因此本文将大数据处理方法与本体引入到政策网络分析中,从大量的政策文本中抽取政策网络的不同类型节点与关系,借助本体进行建模,构建系统的政策发布与响应框架,从多个维度对政策网络进行可视化分析,本研究对政策网络结构进行了可视化呈现,有效弥补了先前研究中对政策网络框架下主体、客体及政策之间隐藏关联关系认识的不足,对揭示政策全貌、发现政策是否存在重叠、实现政策协同、避免政策冲突、从而帮助政府实现有效社会治理具有重要意义。

1 政策网络结构

政策网络中的核心是政策,政策中隐含了政策发布者、政策接收者、政策主题等特征。因此可以将政策网络中的节点分为:政策即各部门发布的具有法律效力的政策文件、政策主题即政策中包含的主要内容、政策主体即政策的发布者、政策客体即政策响应的部门。政策网络中的关系可以抽象为:合作关系、发布关系、响应关系、包含关系。合作关系是政策主体间联合发布政策而形成的关系,发布关系是政策主体与政策之间的对应关系,响应关系是政策客体与政策间的对应关系、包含关系是政策与政策主题的关联关系。如图1所示,以部分主体、客体、政策及主题为例描述政策网络结构。

图1 政策网络结构图

2 基于本体的政策网络模型构建

基于本体的政策网络可视化模型构建主要分为3个步骤:第一,对政策的主题进行抽取,本文将引入LDA主题模型完成政策主题的抽取。第二,对政策网络进行本体建模,按照政策网络结构特征选取政策、政策主体、政策客体及政策主题4 个类。第三,借助Protégé 对本体进行可视化。

2.1 基于LDA的政策主题抽取模型

隐含狄利克雷分布(Linear Discriminant Analysis,LDA)是由David Blei 等人在2003年提出的一种基于文本的主题挖掘及生成模型,理论基础为贝叶斯理论[15]。LDA 中文档被表示为潜在主题的随机混合体,由主题的一个多项式分布来表示。另外,每篇文档的主题以概率分布的形式存在,即每个主题由词语的一个多项式分布表示,这些词语与这个主题有较强的相关性。

政策主题具体抽取过程如图2所示,首先提取所有政策文本并对其进行清洗和分词处理。其次将处理好的政策文本语料库放入已经构建好的LDA主题模型中,调用LDA 工具包并为主题模型设定参数。LDA 主题模型可以自动识别文本和所提取主题之间的关系,并得到被提取出的主题列表以及政策文本与主题之间的权重矩阵,以此确定出每篇政策文本的最佳主题。本文中一条政策对应3个最优主题。

图2 LDA主题抽取

2.2 政策网络本体建模

2.2.1 本体的内涵

本体的概念起源于哲学领域,古希腊哲学家亚里士多德将本体定义为研究的科学[16]。随着计算机的不断发展,人工智能和图书情报等领域引入本体并将其用于知识表示和知识组织,即认为一个本体其实就是一套关于某一领域概念的规范而清晰的描述,它包括类、类的属性、属性的限制条件及一系列与某个类相关的实例,这些实例共同组成了一个知识库[17]。虽然不同的领域对本体的定义不同,但是普遍认为本体具有4大特征:(1)明确。是指本体中的所有概念、限制条件等都是清晰明了的。(2)形式化。即本体面向计算机,具有机器可读性。(3)共享。本体中所表达的观念被整个群体所认可,反映的是相关领域中公认的概念集。(4)概念化,又称概念模型(Conceptualization)。是将现实世界中的客观对象抽象为某一种信息结构[18]。本文主要引用人工智能和图书情报等领域对本体的定义,因此在此研究背景下,构建政策网络模型首先需要确定出政策领域内的类、类的属性及属性的约束条件。

2.2.2 政策网络中类的定义

基于本体的概念,本文定义了4 大类。政策(policy)、主体(subject)、客体(object)、主题(keywords)类。政策类是关键类,它是链接主体类、客体类及主题类的桥梁。主体类和客体类分别是指发布政策与接收政策的政府部门。主题类(keywords)旨在捕捉政策热点,提取政策精髓,是对政策内容的高度概括总结。

2.2.3 政策网络中属性的设置

属性在形式上分为数据属性和对象属性两种,对准备阶段收集到的大量数据分析后,本文设置了以下5 个数据属性:①post_name(发文字号);②Y/N(是否有效);③pub_date(政策发表时间);④imp_time(政策实施时间);⑤eff_level(效力级别)。数据属性的取值范围一般为常见的数据类型,包括字符串、整型等。对象属性是一种较为抽象的动态属性,与定义域和值域相关联,三者之间的关系与数学中函数的对应关系类似,其形式化表示为:domain-property-range(定义域-属性-值域)。以本文中的被发布属性为例,政策-被发布-主体为一个二元关系,属性为“被发布”,定义域为“政策”,值域则为“主体”。确定本文对象属性为被发布(is_released_by)、被接收(is_received_by)及拥有(have)属性,具体描述见表1。

近年来,随着经济和工业的快速发展,环境问题也变的日益严重,尤其是环境中的卤代芳香烃类、芳香族胺类、染料类等的污染引起了人们的广泛关注。[1]研究表明,这些污染物具有强致突变、致癌性,严重影响着人类健康。且在环境中不易被降解消除而持久性存在。

表1 对象属性

2.2.4 约束条件的设置

约束条件与属性相关。首先,数据属性的取值范围限制为常见的数据类型,而对象属性的定义域和值域限制包括范围限制和基数限制。其中范围限制分为allⅤalues From 和some Ⅴalues From 两种限制类型,基数限制对具有该属性域的个数进行限制。在本文中对于属性域约束条件的限制只涉及到all Ⅴalues From,即属性及属性实例的定义域和值域必须源于该属性限制下已定义的类或数据类。

3 科技创新政策的实证研究

3.1 数据来源

本文以“科技创新”为关键词,从北大法宝政策数据库中选取了2012年至2018年科技创新方面共270 条中央法规类型的政策数据,数据内容包括政策题目、政策发布部门、发布时间、实施时间、效力级别和发文字号。

3.2 科技创新政策下的本体实例化

首先将270 条政策经过清洗分词导入LDA 主题抽取模型后得到18 个主题,即科技成果与战略支撑、创新体系建设、粮食及交通、科技创新平台、技术研发、科研基地与创新合作、健康与医疗、文化产业与服务业、科研项目与研发支持、育种与林木、农村科技与科普、自然资源开发利用、知识产权与金融支持、科技人才计划、地理与遗产、新兴产业科技创新、中小企业科技创新、气候与环境与公共安全。

其次与政策网络模型构建类似,政策网络模型的本体实例化研究同样以政策为主线,通过对象属性关系链接主体、客体及主题,从政策的实例化推广到整个政策网络的实例化。结合本体构建工具Protégé 软件首先在类下创建政策实例,设置数据属性,再根据政策内容设置主体实例、客体实例及主题实例,通过对象属性链接。如图3所示,以“财政部、工业和信息化部、科技部关于组织开展新能源汽车产业技术创新工程的通知”(简称为通知)为例,该通知被财政部、科技部和工信部联合发布;被各省、自治区、直辖市、计划单列市及新疆生产建设兵团的财政厅(委、局)、科技厅(委、局)和工业和信息化主管部门所接收;拥有科技创新平台、新兴产业科技创新和科研项目与研发支持3个主题。该通知的数据属性:①post_name(发文字号):财建[2012]780 号;②Y/N(是否有效):现行有效;③pub_date(发布时间):2012.09.20;④imp_time(实施时间):2012.09.20;⑤eff_level(效力级别):部门规章。

3.3 科技创新政策网络可视化

本文从主体、客体、主题3 个维度采用Protégé 下的OntoGraf 插件对政策网络进行可视化分析,挖掘其中隐含的主体、客体、政策之间的关联关系。

3.3.1 政策主体可视化及分析

由于发布创新政策的主体类型较多,为了更清晰的展示主体与政策、客体、法规类别、主题以及相关主体之间的关系,本文以“工业和信息化部”(简称工信部)作为政策主体类的一个实例进行搜索。如图4所示,检索得到12 条政策,运用Protege 软件的自动整理功能对政策进行分类整理,最终得到所有政策及政策的URI、对象属性信息及数据属性信息。

根据is_released_by 属性对上述12 条政策进行扩展,得到发布政策主体之间的联系,所构成的以工信部为中心主体的部门关系网如图5所示。在政策网络中,与工信部直接合作的部门关系网包括:科技部-工信部;财政部-工信部;税务总局-工信部;发改委-工信部;工程院-工信部;商务部-工信部;体育总局-工信部;国家卫健委-工信部;海关总署-工信部;市场监管总局-工信部;中医药局-工信部。其中科技部与工信部之间存在10 次直接合作,财政部与工信部之间存在6次直接合作,市场监管总局与工信部之间存在4 次直接合作,发改委或商务部与工信部之间存在3 次直接合作,国家卫健委和工信部之间存在2 次直接合作,税务总局、体育总局、海关总署、中医药局与工信部分别存在1 次直接合作。上述合作关系网中与工信部合作次数最多的是科技部,其次为财政部、市场监管总局等。而多部门合作制定公共政策能够平衡不同部门间的利益冲突,加强不同政府部门之间的协同程度,从而有效避免政策冲突,实现政策协同。以工信部为研究主体时,科技部与工信部在科技创新领域合作最为密切,政策协同程度最高,政策冲突较少,但同时合作紧密的部门间可能也存在职能重叠或冲突,此外,本文政策网络中与工信部有直接合作关系的大多数部门之间也存在潜在的合作关系,例如发改委、科技部和市场监管总局等,这对于促进政府开发合作伙伴关系、实现隐性知识的管理具有一定的指导意义。

图3 政策实例的属性

图4 “工信部”政策主体实例检索网络图

为了深入了解与工信部主体相关的客体范围,本文将检索得到的12 条政策按照is_received_by 属性进行扩展,得到政策主体-政策-政策客体之间的关系,如图6所示。工信部单独或参与发布的政策被大量的、不同种类的客体所接收,但其主要针对的政策客体为各省、自治区、直辖市、计划单列市的科技厅(委、局)、财政厅(委、局)、工业和信息化主管部门及新疆生产建设兵团科技厅(委、局)、财政厅(委、局)、工业和信息化主管部门。因此对于工信部发布的创新政策,接收部门较为集中,即创新政策的去向具有一定的方向性。这对于检验整体创新政策的实施效果具有一定的意义,政府可以根据上述部门对创新政策的接收程度来预测整体创新政策的实施效果,也可以根据整体或部分政策的实施效果来判断上述部门对政策的接收程度和政策的合理性,从而优化政策发布部门对于政策的制定及政策接收部门对政策的实施,促进社会治理。

图5 “工信部”政策主体-政策-政策其他主体网络图

图6 “工信部”政策主体-政策-政策客体网络图

将上述12条政策按照have属性进行扩展,得到政策主体-政策-主题之间的关联关系,如图7所示。每条政策均对应3个主题,其中一些主题出现的频率较高,例如科技创新平台出现了7 次,创新体系建设出现了6 次,中小企业科技创新出现了4次,新兴产业科技创新出现了3次,科技人才计划出现了3次,科研项目与研发支持出现了3次。上述数据一定程度上表明工信部非常重视科技创新平台构建,创新体系建设、科技人才培养、中小企业和新兴产业科技创新,同时在科研项目研发上也给予了较大的支持。文化产业与服务业、粮食与交通、技术研发等主题只出现了1次,出现次数较少,但其中技术研发是实现我国自主创新的重要途径,而众多中国高科技企业面临着关键技术被“卡住脖子”的困境,自主研发新技术迫在眉睫,工业信息化部在推动重大技术装备发展和自主创新时同样对技术研发存在巨大需求,但发布的有关技术研发的科技创新政策为数不多,仅有1条,因此为了鼓励新技术的研究开发,满足自主创新的内在需求,工信部应该加强对技术研发激励政策的颁布。总之,政府部门在制定政策时可能会有侧重点,对某些政策主题较为关注,同时也忽略了其他隐藏的重要主题,对政策主体颁布政策所包含的主题出现频次的挖掘分析可以帮助政府部门识别出现频次较少但具有重要意义的主题,从而制定更全面,更有针对性的政策。

3.3.2 政策客体可视化及分析

以“各省、自治区、直辖市、计划单列市商务主管部门”(简称地方商务主管部门)为政策客体关键词进行检索,如图8所示,得到5 条相关政策,即地方商务主管部门共接收5 条科技创新政策。分别将这5 条政策按照is_released_by属性进行扩展,如图9所示,得到地方商务主管部门与该政策客体下的政策及政策主体所构成的府际关系网。府际关系网中政策主体包括商务部、科技部、财政部、工信部、市场监管总局、发改委、海关总署、住房城乡建设部、自然资源部、民政部、税务总局、国家广播电视总局及教育部13个发布部门。其中科技部、商务部参与发布5 条政策,工信部参与发布4 条政策,财政部参与发布3 条政策,由此可以看出地方商务主管部门主要接收科技部、工信部、商务部和财政部发布的科技创新政策。总之,政策接收部门会接收来自多个政策发布部门发布的政策,而不同政策主体发布的政策在政策客体集中实施时可能存在政策冲突,政府可以通过挖掘政策客体所接收政策的主要发布部门来加强政策客体和相关发布部门之间的沟通,减少政策冲突,促进政策的有效接收与实施。

图8 “地方商务主管部门”政策客体-政策网络

图9 “地方商务主管部门”政策客体-政策-政策主体网络

为了从政策客体的角度探究政策客体-政策-主题之间的关系,本文将上述检索得到的5 条政策分别按照have 属性进行扩展。如图10所示,最终得到9 个主题,即科技创新平台、创新体系建设、知识产权与金融支持、科技人才计划、中小企业科技创新、科研项目与研发支持、科研基地与创新合作、文化产业与服务业及健康与医疗。其中4 条政策均拥有科技创新平台主题,两条政策拥有创新体系建设、文化产业与服务业、知识产权与金融支持主题,由此可以推断出商务部主要接收创新领域内关于科技创新平台的政策。挖掘出政策接收部门所集中接收的政策主题有利于政策客体充分认识特定领域所接收的政策具体内容,避免政策接收时出现偏差,从而促进对关键政策内容的吸收、理解和应用。

图10 “地方商务主管部门”政策客体-政策-主题网络

3.3.3 政策主题可视化及分析

如图11所示,以“文化产业与服务业”主题和“科研项目与研发支持”主题为关键词检索得到5条相关政策。3 条政策由文化和旅游部发布,2 条政策由科技部发布,这些政策展开还得到了另外2 个主题,即科技人才计划和中小企业科技创新。从中可以推断出在科技创新领域下,有关文化服务类的政策主要由文化和旅游部发布,科研项目与研发支持的政策主要由科技部发布。主题-政策-主体网络可以从主题角度发现政策主题主要被哪些政策主体所发布,而不同政策发布部门由于职能不同,对于相似主题发布的政策侧重点略有不同,可能产生政策冲突,因此借助主题-政策-主体网络可以缩小可能产生政策冲突的政策发布主体范围,有助于识别政府部门间的冲突与实现关系协同治理。

图11 主题实例-政策-主体、其他主题网络

将上述检索到的5 条政策按照is_received_by 属性进行扩展,如图12所示。同时拥有“文化产业与服务业”主题和“科研项目与研发支持”主题的政策由多个客体所接收,例如各省、自治区、直辖市、计划单列市科技厅(委、局),国务院有关科技主管部门,新疆生产建设兵团科技厅(委、局),中国艺术科技研究所等。其中各省、自治区、直辖市、计划单列市科技厅(委、局)及新疆生产建设兵团科技厅(委、局)是主要政策接收部门。不同于聚焦政策发布和接收过程的主体-政策-客体网络,主题-政策-客体网络擅长从主题角度发现主题主要被哪些政策客体所接收,有助于帮助政府根据对应政策客体的政策接收和实施效果来检验相关主题的政策是否上得到有效落实,发现政策传导中存在的问题,帮助优化政策发布范围,检验政策实施效果。

4 结论与政策启示

本文的创新性在于引入本体的概念构建政策网络模型,建立类与类之间的关联关系,从多个维度利用可视化工具进行了量化分析,充分展示了主体、客体、主题及政策之间的联系,有助于政府了解政策全貌,减少政策冲突,辅助政府决策。

(1)政策主体间网络展示横向府际合作特征,通过对合作次数的分析,可以发现合作紧密的部门间是否存在职能重叠或冲突,缺少合作的部门与哪些部门存在潜在合作的可能。不仅有利于机构的重组与整合,也可以对拥有间接合作关系的政府部门进行识别,从而实现隐性知识的管理。

(2)政策主体—政策客体网络展示纵向府际合作特征,有助于政府检验整体创新政策的实施效果,从而指导政策发布部门政策的制定,加强政策接收部门对政策的实施,促进社会治理。

(3)政策主体—主题网络可以呈现现有政策的分布特征,一是政策主体颁布政策所包含的主题出现频次的挖掘分析可以帮助政府部门识别政策空白点。二是可以看出政府部门的政策主题特征和趋势,从而制定更全面,更有针对性的政策。三是能够依据相同主题缩小可能产生政策冲突的政策发布主体范围,有助于识别政府部门间的冲突与实现关系协同治理。

(4)政策客体间网络可以帮助政府挖掘政策客体所接收政策的主要发布部门来加强政策客体和相关发布部门之间的沟通,减少不同政策主体发布的政策在政策客体集中实施时可能存在的政策冲突,促进政策的有效接收与实施。

(5)政策客体—主题网络有利于政府充分认识特定领域所接收的政策具体内容,避免政策接收时出现偏差,从而促进对关键政策内容的吸收、理解和应用。还可以帮助政府根据对应政策客体的政策接收和实施效果来检验相关主题的政策是否上得到有效落实,发现政策传导中存在的问题,帮助优化政策发布范围,检验政策实施效果。

综上所述,本文选取部分主体、客体及政策作为研究对象,验证了本体模型用于构建和分析政策网络的有效性。为进一步深入研究府际互动及府际协同奠定基础。

猜你喜欢
客体工信本体
社会公正分配客体维度与道德情绪的双向互动
工信部发布智能手机摄像头防抖行业标准 今年7月1日起生效
工信部:加快制定工信领域数据安全管理政策
眼睛是“本体”
浅议犯罪客体
一种基于社会选择的本体聚类与合并机制
工信部发布人工智能三年产业规划 促进AI未来加速落地
工信部发布第二批劝退名单专用汽车成“重灾区”
专题
Care about the virtue moral education