连婷婷 袁曦临
《中华人民共和国政府信息公开条例》的发布使得政府信息更加透明化,同时亦有利于公民进行信息获取和监督政府工作。《条例》中指出政府信息公开目录编制是各级人民政府信息公开的一项法律义务,也是政府信息作用得以发挥的基础性制度保障[1],是政府信息公开的重要内容。政府信息公开目录提供了有效的指引,可让公民更好地利用政府信息,实现政府信息公开。2007年国家发展改革委、中央网信办印发了《政务信息资源目录编制指南(试行)》的通知,推进了“互联网+政务服务”,经过几年推进,于2013年出台了《政务信息资源目录体系》国家标准。但目前大多数政府部门制定的目录体系是相互独立的,不同部门之间难以共享和整合政府信息资源,公民获取政府信息时亦会遇到困难。
本体具有强大的语义表达能力,对于实现语义层次上的信息共享有巨大作用,通过本体能从复杂的领域知识中抽取出统一的概念术语以及它们之间的关系,使信息共享成为可能[2],实现领域知识的共享和复用,能够为系统间的互操作提供良好的工具。将本体应用于政府信息组织中,可以增强系统之间的语义交互性,促进异构数据的整合,增强政府机构之间信息的沟通与共享[3]。因此,通过构建本体的方式来组织政府信息资源,有助于信息惠民。本文提出基于政府信息公开目录的政府信息本体模型,以期克服传统的信息组织方法中存在的由于缺乏语义而造成的信息无法共知、共享、共用的问题。
政府信息资源组织的方式一般包括分类法、主题法和元数据方法等。分类组织方法是政府信息公开的基础,2007年发布的《政务信息资源目录体系》第4部分对我国政务信息资源的分类进行了比较明确的规定,按照电子政务的类别属性和特征对政务信息进行分类[4]。主题法则以《综合电子政务主题词表》为主,内容覆盖了我国电子政务各领域及相关知识范畴[5]。元数据方面,我国在2017年出台的《政务信息资源目录编制指南》对政府信息资源元数据做了规范说明[6]。
政府信息资源组织的方法有很多,传统信息组织方法随着政务信息资源的增多面临着种种问题。分类、主题词表和元数据的信息组织方式只能显性地对信息进行描述,从语句和语法层面组织信息资源,并不能揭示政府信息之间的内在联系。此外,传统政府信息组织的应用服务对象以政府部门为主,较少从公民角度组织信息,不便于公众对于政府信息资源的查找和检索。政府信息公开目录是通过对政府信息进行分类,使社会公众能够根据目录提供的线索获取政府信息的工具[7],作为目前政府信息组织的主要方式,政府信息公开目录只对政府信息进行简单划分,层次不够深入,不同政府制定的目录各不相同且不能互通,分类体系较为固定,缺乏灵活性,无法适应不断变化的政府机构和日益增多的信息资源,当前政府信息公开目录依然无法完全满足公民获取和检索的信息需求。
随着本体研究和技术的发展,利用本体来进行政府信息资源组织的研究日渐增多,国外较早就开始了将本体应用于政府信息组织的研究和实践。西班牙政府建立了基于本体的法律信息检索系统EgoIR,该系统能用于检索电子政务文档和处理房地产交易文档,为市民、公司和政府提供了整合和发现文档的平台,实现对电子政务文档的管理、检索和共享[8]。美国印第安纳州电子政府建设也很成功,FSSA(印第安纳家庭与社会服务管理局)为了解决数据库的异构性、分布性和信息量大等问题,利用分布式本体对数据库进行组织管理,从而让用户能够很容易地获得来自不同数据库的政府信息[9]。
我国目前还未大范围地使用本体来组织政府信息,仅有部分学者探讨了政府信息资源本体构建方式。耿瑞利结合我国政府信息资源特点,提出政府业务流程和主题词表相结合的领域本体构建依据,对宁波市发改委政府信息领域本体进行了模拟构建[10];高洁和李佳培基于《综合电子政务主题词表》,尝试构建“国土资源、能源”领域本体,实现电子政务信息资源底层概念的复杂联系和简单查询功能[11];赵鹏程在政府知识领域中建立数字公文本体,从国家行政机关的公文写作规范入手,详细分析国家行政机关常用的法定文种,结合甘肃省国际文化交流中心公文处理的实际情况,构建该单位的数字公文本体,以实现对格式的要求[12]。可见,我国在政府信息资源本体构建方面的相关研究多注重政府业务流程,旨在提高政府内部的工作效率,而较少从政府信息公开角度进行本体的构建。
政务信息的公开,目的是为了让公众更好地了解政府的服务,同时也是为了更好地提高政府工作的服务效率,拉近政府机构与群众的距离,真正实现政府工作的网络化和透明化,使得政务信息在线查询,在线督办等成为现实。随着数字和网络互联技术的不断发展,数字资源内容的呈现越来越注重对关联关系的展示,本体的构建恰好可以为此提供较好的解决方案。“本体是概念化的明确的规范化说明”,本体语言由于是通过更加深入细致、全面的语义描述而来,在结构上具有清晰层次,并具有逻辑推理功能,因此引入本体能够实现政府信息之间的互联互通,向公民更加直观地展现政府信息及相关部门之间的联系,能够使公民更方便地理解和检索信息,同时为政务信息资源管理提供各种智能化、个性化的服务,弥补了政府信息公开目录等传统信息组织方法的不足,实现了政府信息组织方法上的突破,从而推进“服务型政府”的建设[13]。
目前已有的政府信息公开目录,包含了相关的术语词汇,也具有等级层次结构,能够揭示不同概念的从属关系,提供类目的划分标准,为引入本体进行政府信息组织提供了基础,使得本体能够利用政府信息公开目录来构建词间关系。用本体建立的词汇模型可以让机器理解Web页面的语义,揭示资源本身及资源之间更为复杂和丰富的语义信息,可以解决语义层次上Web信息共享和交换。本体的描述采用规范化语言,在不同的应用系统中可以重用,有利于各部门、各单位之间展开信息公开工作。同时,本体可以将政府公开信息的相关概念及其关系进行较为精确的定义,从而提高政府信息公开及政府信息检索的效率。因此,对政府信息公开目录进行完善的设置研究,构建起合适的政府信息资源分类体系,在政府信息公开目录的基础上构建面向公众的政府信息资源本体,是政府信息公开的必经之路。
在经济全球化和信息化时代,信息和知识扮演着社会的主角,已成为社会经济发展和人们在工作学习生活中处理相关事宜的决定因素。作为最重要的政府信息涵盖全社会信息的80%,它即是公众了解政府行为的直接途径,也是公众参与并监督政府行为的重要依据。因此,对于政府信息公开来说,具有能够帮助公众准确查询相关信息的完善的目录无疑在一定程度上有利于更好地实现面向公众的政府信息公开,真正推进政府信息公开工作的开展。
我国国务院办公厅政府信息公开目录采用了按公文种类和主题分类两种分类方法。公文种类分类的方式,包括国令、国发、国函、国发明电、国办发、国办函、国办发明电、其他等8类。主题分类方式以《政务信息资源目录体系》为基础,将公开的政府信息划分为22个类别,下设二级类目,如表1所示。
表1 国务院政府信息公开目录主题分类一级类目
我国31个省级政府(除港澳台外)网站均设置了政府信息公开目录,且分类方式各不相同,主要包括主题分类、组织机构分类、组配分类、文种分类、体裁分类等,其中使用最多的是主题分类方式,其次是体裁分类和组织机构分类,较少使用服务对象分类方式。换言之,其导向并不主要面向服务公众和信息公开。
以江苏省为例,政府网站采用主题、体裁两种目录分类方式,体裁分类包括决定、命令(令)、通告、意见、通知、通报、批复、其他等8类。江苏省政府信息公开目录主题分类一级类目共有16个,总体上是基于国务院办公厅政府信息公开目录进行分类,减少了组织机构,民族、宗教,对外事务,港澳台侨工作,国防五个类目,同时将“人口与计划生育、妇女儿童工作”类目并入“卫生、体育”,类目名称改为“卫计、体育”,使该类目下所含项目的数量与其他类目基本相同。
政府信息公开目录为本体的构建提供了术语概念和分类的基本标准,然而在对我国的政府信息公开目录进行分析后,发现依然存在着一些问题使其不能完全用于构建政府公开信息资源本体。首先是类目较多且展开不够深入,各类别的界限比较模糊,无法为本体构建提供清晰明确的概念。其次是分类方法单一,缺少“服务对象”的分类,而面向对象的分类能够帮助公民准确查找信息,也使得构建的本体更加完整,更具针对性。
基于上述分析,将政府信息通过4个维度进行分类,即主题分类、体裁分类、机构分类和服务对象分类。主题分类是根据信息资源内容所属主题对其进行分类;体裁分类是根据信息资源的外部属性体裁对其进行分类;组织机构分类是依据信息资源的发布机构对其进行分类;服务对象分类是依据信息资源所服务的特定群体对其进行分类,形成以主题分类为核心,以体裁分类、机构分类和服务对象分类为辅的分类体系,同时明确了本体构建的核心概念和层次结构。
(1)主题分类。在当前政府信息公开目录的基础上,把所含内容相似的类目进一步合并,减少类目的数量,使类目之间的界限更加明确,一级类目设置如表2所示。
表2 政府信息公开目录主题分类一级类目设置
针对目录深度不够的问题,一级类目可以向下继续拓展,以三级到四级类目为宜,最多不超过五级。以“科教文化、卫计、体育”这一类目为例,向下划分的类目如表3所示。
表3 政府信息公开目录主题分类二、三级类目(科教文化、卫计、体育)设置
(2)体裁分类。体裁主要是根据公文的文体进行分类,《党政机关公文工作处理条例》规定了十五类常用公文文种,即决议、决定、命令(令)、公报、公告、通告、意见、通知、通报、报告、请示、批复、议案、函、纪要。
(3)机构分类。国家层面上,国务院组织机构分为国务院办公厅、国务院组成部门、国务院直属特设机构、国务院直属机构、国务院办事机构、国务院直属事业单位、国务院部委管理的国家局等7类,而省级政府在信息公开时,一般分为省政府办公厅、省政府组成部门、直属特设机构、直属机构、部门管理机构等5类。省级以下政府部门则依据具体机构的设置来划分。
(4)服务对象分类。服务对象分类是从公民获取和利用政府信息角度出发,遵循以用户为中心的原则,根据用户所处场景的不同来划分。我国政府信息公开目录并未设置服务对象分类,但全国政务服务总门户根据办事场景对用户进行了划分,而政府信息资源的产生与发布和公民的办事时效性需求是息息相关的,因此本研究就参照了网上办事的方式,一级类目先对服务对象类型进行划分,二级类目则结合了公民的业务场景进行分类,相比于主题分类,服务对象分类对用户来说更容易理解,用户可以根据自己想做的事情进入相应的类别,体现了目录的便民性。
本研究将政府信息公开目录中面向服务对象分类的一级类目设置为公民、企业、社会组织和外国人,如表4所示。公民指的是我国所有公民,企业为盈利性组织,社会组织为非盈利性组织,外国人为在我国生活或暂居的外国公民。公民信息根据生命周期分为结婚生育,教育,就业,社保,住房,医疗,户籍,养老;企业根据企业的发展分为开办,变更,贷款,投资,招录,税费,注销;社会组织根据类别划分成社会团体,基金会,民办非企业单位,涉外社会组织,慈善组织;外国人根据需求分为出入境,移民定居,文化旅游,婚姻收养,教育留学,在华就业,商务投资。
表4 政府信息公开目录服务对象分类类目设置
本体通过获取、描述和表示相关领域的知识提供对该领域知识的共同理解,确定该领域共同认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇间相互关系的明确定义,一般具备概念、关系、实例和约束等要素[14]。Gruber在1995年提出的指导本体构建的5个原则(明确清晰、一致、可扩展性、编码偏好程度较小、最小本体承诺)被引最高,常用的本体构建方法中七步法的通用性最好[15]。本文在七步法的基础上结合领域应用需求的特点进行了适当改进,按照以下流程构建了政府信息领域的本体模型,采用的工具为protégé5.5.0。
本文将本体构建的领域限定为政府信息资源领域,范围包括政务信息资源的主体内容及所属机构等必要信息,《政府信息公开条例》中对需要公开的政府信息范围进行了规定:政府信息是指行政机关在履行行政管理职能过程中制作或者获取的,以一定形式记录、保存的信息,由各级人民政府对政府信息公开工作进行组织领导[16]。构建本体过程中将以上文所建立的政府信息公开目录作为添加概念的依据。
政府信息资源领域的重要术语能够清晰的展现政府信息的内容和范围,是直接对政府信息的概念化抽象总结,反映了政府信息资源领域本体类目关系,因此对领域本体的构建有重要意义。重要术语的总结也是构建政府信息资源本体的重要基础工作[17]。本文所使用的概念术语是根据上述整理的政府信息公开目录来确定的,包括主题、体裁、组织机构、服务对象等。
本体中的类是用来描述领域内某些具有某种关联关系的集合的抽象化概念术语,是对多政府信息的概念化描述,根据类所描述对象范围的不同和其上下位概念的不同,类的结构呈层次性体系结构,如图1所示。
图1 政府公开信息资源本体结构
在“政府信息”这个父类下构建了“主题”“体裁”“组织机构”“服务对象”4个大类,每一个大类下又分了若干个子类及子类的子类,构成了一个本体的层次结构。
本体中描述概念之间联系的要素是关系,它通常表现为动词,表示一个命题或断言,描述类、实例之间的各种联系。关系将一个概念与其他概念或实例联系起来,起到知识连通的作用。政府信息本体的关系有:(1)发布——组织机构发布了政府信息资源;(2)适用于——某条政府信息适用于某一类服务对象;(3)属于——政府信息资源属于某体裁。
属性描述本体中类或实例的一个侧面,数据属性的功能是对个体赋值,将个体和文字联系起来,准确描述领域个体。政府信息本体的数据属性如表5所示。
表5 政府公开信息资源本体数据属性
本文基于我国目前政府信息资源分类标准、目录和实践,构建起以主题分类为主,机构分类、体裁分类、服务对象分类为辅的政府信息公开目录。在此基础上,利用protégé5.5.0软件构建起政府信息资源本体,实现了相关数据资源的层次化化、概念化,将有助于政府信息资源的组织和扩展,是利用本体的思想进行政府信息资源组织的一次有益尝试。相比于单纯使用政府信息公开目录来组织信息资源,本体组织不仅能够很好地表达政府信息之间的语义关系,还能实现政府信息资源的语义查询,增强政府部门之间的信息共享和信息交换,为公民的信息查询提供便利。在完成本体的构建之后即可添加实例,利用protégé的搜索功能,可以很容易地查找相关的实例和概念,并直观地展示出它们的关系,从而提高政府信息资源整合的效率。例如,一市民用户想获取养老保险的政府相关规定信息,可直接进行搜索,结果如图2所示。
图2 政府公开信息资源本体实例展示
用户能够检索出政府部门发布的养老保险关系转移的公开信息,包括正式的官方文件和办理养老保险关系转移的流程等,从服务对象分类中公民信息下的养老信息也可以找到相关内容,方便用户通过不同方法获取信息。当用户想了解文件的内容时,点击该实例就可以获得索引号、发文字号、发布日期、内容概述和发布信息的网址,用户可以通过这些信息来判断该文件是否符合自己的需求,通过网址就能阅读文件内容。同时,检索结果显示,人力资源社会保障部为国务院组成部门,点击该节点,就能展开人力资源社会保障部的数据属性,进一步了解人力资源社会保障部的详细信息,如领导人员、机构地址和机构网址,这使用户可以对政府部门进行有效的监督和反馈,真正推进政府信息公开。