朱红灿 沈超
DOl:10.3969/j.isn.1008-0821.2021.10.005
[中图分类号]D035-39 [文献标识码]A [文章编号]1008—0821(2021)10—0040—07
政府开放数据是由政府或政府控制实体产生或委托的,任何人都可以自由使用、重新利用和重新分配的数据,政府数据开放有利于提高政府透明度、释放社会和商业价值、加强公民参与式治理。在“互联网+”社会和信息社会背景下,如何满足用户对于政府数据开放的需求已成为我国政府部门当前的重大问题。2013年1月11日,工业和信息化部发布了《关于数据中心建设布局的指导意见》,指出要大力提升我国数据中心,特别是大型数据中心的合理布局和健康发展。《2020年中国地方政府数据开放报告》指出,我国地方政府数据开放已发展到了一个更为成熟的阶段,因此政府数据开放的重点也应从准备基础向数据利用等实际成效倾斜。截至2020年4月底,我国已有130个省级、副省级和地级政府上线了数据开放平台,上海、山东、北京和贵阳等地举办的政府开放数据创新利用比赛持续受到关注,但要释放数据能量、创造公共价值还有赖于科研用户率先去研究和使用政府开放数据,如何将科研用户的主动性与政府开放数据利用的迫切性结合起来,是实现政府开放数据更好更快利用必须面对的问题。基于此,本研究将对科研用户利用政府开放数据影响因素进行深入挖掘和分析,探究影响因素的作用机制,对于进一步提升政府开放数据的建设效果和用户利用水平,以及加强政府数据开放供需适配I生有参考意义。
1相关研究评述
国内外文献关于“政府开放数据+用户”的研究众多,依据其侧重点不同,可从供给侧和需求侧两方面内容综述。一是围绕供给侧研究:主要包括平台建设、政策制定等内容。Mful-Dadzie E等在研究非洲OGD网站门户现行基础结构之上.以媒体从业者视角进行分析,得到关于发展中国家用户所需的OGD结构。Kubler S等开发了一个开放数据门户质量(ODPQ)框架,该框架使用户能够轻松、实时地进行数据处理。文献[8]以用户体验为切入点,突出用户体验对于建立用户满意的政府数据开放平台的指导意义。刘桂琴依据政府数據开放平台的评论反馈内容做情感差异分析,明确平台服务后期用户的满意状况,为后续平台持续建设提供思路;二是从需求侧展开讨论:涉及公众采纳、用户需求和数据使用等内容。Taukder M S等以孟加拉国的一项实证为例,研究用户接受和使用政府开放数据的决定因素。高天鹏等以技术接受和使用整合模型为理论框架,构建政府数据开放平台用户采纳模型。李白杨根据利益相关者理论识别了我国政府数据开放的用户类型,并通过内容分析法确定用户数据主题、数据格式、数据质量、平台功能、安全保障和其他共6个方面的需求。曾倩使用BP神经网络方法对政府数据开放的用户需求进行模型预测。陈水湘基于用户利用的视角,对政府数据开放平台的价值进行分析评价,并以19家地方政府数据开放平台做实证研究。
总之,“政府开放数据+用户”相关研究侧重于公众采纳模型、用户需求分析,较少运用扎根理论,对科研用户的政府开放数据利用进行影响因素识别与路径分析。同时,张路路等认为,用户认知与用户数据行为之间的关系,可为系统优化、用户服务创新提供参考和借鉴。而认知因素包括:认知风格、认知能力、知识与经验、情感等,科研用户的数据认知行为包括:认知价值判断、认知加工、认知采纳和认知期望等。基于此,本文通过分析科研用户自身的认知风格、认知能力,科研用户对政府开放数据的质量认知、价值判断,科研用户所处情境、面临的任务等,探究各因素对科研用户政府开放数据利用的影响情况,并深入剖析各影响因素的作用机制,以期从科研人员视角更进一步提高我国政府数据开放的供需适配性水平,为推进政府数据开放更好更快地发展提供参考。
2研究设计
2.1理论基础
为了从用户认知角度有效识别科研用户政府开放数据利用影响因素,本研究采用扎根理论来进行探索性研究。扎根理论是经典的质性研究方法之一,要求从现象中系统收集原始资料进而分析、发现和发展理论,是一个从事实到实质理论,再到形式理论演进的过程。扎根理论法包括开放式编码、主轴式编码和选择式编码3个阶段,由此形成的“程序化扎根理论”是目前应用最广泛的版本。扎根理论主张不在研究前提出任何假设,从事实到实质,这对深层研究科研用户政府开放数据利用具有很好的适用性,因此,本研究期望通过扎根理论的方法有效探究科研用户政府开放数据利用影响因素,实际研究流程如图1所示。
2.2数据收集
扎根理论要求对受访者进行半结构化的深入访谈,研究者需要在访谈过程中不断提问和不断比较,从而针对所要研究的主题获得更广泛的内容和更精确的细节,使得访谈兼顾开放性和聚焦性。主要包括以下步骤:①确定访谈主题。本次访谈需要向科研用户了解在其实际的数据利用过程中,哪些因素会促进或者抑制他们使用政府开放数据;②设计访谈提纲。在阅读相关文献和预访谈基础上确定访谈提纲,并根据受访者的实际回答深入交流。访谈提纲如表1所示;③确立访谈原则。围绕访谈提纲所设计的6个问题,向受访者提出“除此之外还有什么……吗?”“能不能具体说一说……”“您对此的看法是什么”“为什么是这样的?”等开放、探索的问题,以获得更为丰富的原始访谈资源。充分围绕访谈的核心主题,抓住科研用户的特性,探讨政府开放数据利用过程中的相关细节;④访谈资料的整理与分析。将访谈内容转录为文字资料,并对文字资料做进一步的整理分析。
考虑到受访者对研究问题的认识程度,本研究选择的受访者是有政府开放数据的使用或相关研究经验的科研用户,或者曾经参与数据开放创新大赛,对政府开放数据有一定的认识,并对数据分析等有着丰富的工作或实践经验。本文选取40位与政府开放数据接触较多的一线人员和专家,围绕“影响科研人员使用政府开放数据的因素”这一主题进行深入访谈。在访谈之前与访谈对象沟通访谈主题、访谈目的和访谈大致内容等,使得访问者充分了解研究内容。在访谈过程中不断追问更具体更详细的情况,充分挖掘访谈影响科研人员使用政府开放数据的因素。本研究以线下面对面访谈为主,同时辅以微信视频电话的方式进行线上访问,访谈时间保持在30~50分钟。访谈结束后立即将语音信息转化为文本资料,并在每次访谈结束后及时查阅相关文献整理本研究的核心思路和主题,并完善访谈提纲和临时提问思路。直到访问过程中大量的内容开始趋于重复,达到饱和时终止访谈并整理出最终资料合集。选择2/3的受访者资料进行编码分析和模型构建,剩余1/3的受访者资料留作饱和度检验。其统计信息如表2所示。
由表2的受访者信息可知,受访者样本女性18位,男性22位,性别比例均衡;受访者年龄18~38岁占总受访人数的70%;职业上学生和教师共21人,公司职员19人;学历上以硕士为中坚力量。受访者符合来自多个人群、多个领域,并对政府开放数据有充分了解,可以为调查提供更全面、更精准的资料。
2.3影响因素抽取
对基于扎根理论进行访谈所获得的文本资料进行分析,从科研用户认知视角,包括科研用户自身的认知风格、认知能力,科研用户对政府开放数据的质量认知、价值判断,科研用户所处情境、面临的任务等,通过开放式编码、主轴式编码和选择性编码,不断挖掘影响科研人员使用政府开放数据的核心概念,同时辅以质性分析软件NVivo12进行文本分析。
2.3.1开放式编码
扎根理论的第一阶段即开放式编码,也称一级编码,是将采访所得的原始语料进行打散分解,命名原始代码,再得出能清楚描述原始语料的原始概念,并将概念化的内容抽象、提升、综合为范畴。编码内容要求依据采访的原始语句提炼,不遗漏重要的语料信息。本文对原始语料进行切分和提炼等操作后总计获得248条原始语句。表3是通过开放式编码所得到的12个范畴,并提取了部分原始语料与之对应。
通过开放式编码得到的12个范畴分别为:B1基本素养、B2数据检索与处理能力、B3数据质量认知、B4数据呈现、B5数据访问、B6项目驱动、B7竞赛驱动、B8资源投入、B9开放观念、B10产业技术升级、B11法律法规、B12潮流压力。接下来进行主轴式编码,实现进一步的归纳总结。
2.3.2主轴式编码
主轴式编码是在12个开放式编码的基础上,对语料、概念和范畴进行反复比对、转移和建立连接。寻找概念与范畴的相互作用关系,并对核心范畴进行精确从而完成主轴编码,表4为主轴式编码的过程和结果。通过主轴编码得到数据利用能力、数据准备度、科研任务和科研情境共4个主范畴,这4个主范畴是影响政府开放数据利用因素的主要类属。
2.3.3选择性编码
选择性编码是在开放性编码和主轴式编码后所精炼出的更具统领性的主范畴,为探究主范畴对科研人员利用政府开放数据的影响因素,围绕主范畴来描述和解释各范畴之间的关系并进行编码。基于对科研用户政府开放数据利用的影响因素的4个主范畴探析,数据利用能力、数据准备度、科研任务和科研情境均是科研用户科研过程中政府开放数据利用的影响因素集合,从而将“政府开放数据利用影响因素”确定为核心范畴。
2.3.4饱和度检验
在3位研究人员完成选择性编码之后,由另外3位研究人员对剩余1/3的原始语料进行饱和度检测,检测结果显示,剩余内容的编码未超过科研人员利用政府开放数据的影响因素的四大范畴,未遗漏重要概念、范畴和关系。表明本扎根理论模型已经达到饱和。
3模型构建与分析
基于以上编码分析,本研究认为影响政府开放数据利用的影响因素包括数据利用能力、数据准备度、科研任务和科研情境4个方面,以此构建的政府开放数据利用的影响因素如图2所示。
3.1数据利用能力
科研用户获取政府开放数据后将直接对信息进行分析挖掘,所以用户自身数据利用能力是影响科研用户数据利用效果的关键因素,包括基本素养和数据检索与处理能力两个部分。基本素养包括科研用户具有的数据认知素养和科研素质,数据认知素养即科研用户对数据较为敏感,能够发现和分析有价值的数据,对数据进行批判吸收并能够根据自身需求与数据提供方沟通等,存在较大的个体差异性,也是科研用户能否适应开放数据研究的核心因素,同时科研人员长期以来的科学思维方式和实践经验也会对开放数据利用产生影响。数据检索与处理能力包括数据检索和聚焦能力、数据价值判断能力和合作创新能力。在访谈中发现,不同学科领域的科研人员对使用政府开放数据的目标、方法、态度和价值感知等均不相同,加之数据利用能力的差异,会直接影响到数据利用的科研工作中。如有受访者表示“很难直接从现有开放数据中找到合适的研究选题”,而有的受访者则表示“数据完全够用,是方法和角度的问题”;另一方面,更多受访者则表示“数据处理有关的科研和技术发展很快,持续性学习对科研用户提出了更高的要求”。
3.2数据准备度
在政府开放数据从呈现到获取过程的各个环节都可能影响科研用户对政府开放数据的利用,数据准备度是影响科研用户数据利用效果的基础因素。数据准备度包括数据质量认知、数据呈现和数据访问。数据质量认知是核心,是科研用户对政府开放数据真实性、原始性、相关性、有用性、规范性、数据分类、层次性等内容质量的认知,具有真实性、原始性高的政府开放数据是科研用户得到科学、准确的科研结论的基础,同时政府开放数据必须与科研用户研究内容具有相关性,数据对其科学研究是有用的,政府开放数据的规范性、数据分类、层次性等方面无疑可以为用户感知政府开放数据的价值和数据利用提供便利;另一方面,在开放政府数据平台呈现的数据,关键数据是否位置清晰容易查找,数据内容描述是否准确无误,数据业务问题是否定义清晰易于理解等数据呈现方式,都将直接影响科研用户对政府开放数据的利用。最后,数据开放平台是否在省级或者国家级进行统一管理,政府开放数据平台的交互体验如何,如何获得数据的详细信息和下载使用权限,同时确保数据授权合理并能够完成数据保密工作,都将在数据访问层面对科研用户利用政府开放数据产生影响。如有受访者表示“如果能实现有用好用易用而且没有风险,那政府开放数据肯定会成为大多数的选择”。
3.3科研任务
在政府开放数据挖掘过程.科研项目驱动和数据竞赛驱动是政府开放数据利用的两大驱动力。科研项目驱动是科研用户主动选择政府开放数据作为研究对象,包括项目申报前的选题资料分析,也包括项目进行过程中的数据内容挖掘分析。政府开放数据开发者竞赛等类似活动则是地方政府或者地方政府与企业联合对专项的数据进行开发和挖掘,吸引更多领域的学者参与到同一项数据业务中来。只要实现项目落地,解决现实问题,那科研项目驱动和数据竞赛都能驱动科研用户对政府开放数据的利用。如有受访者表示“如果主办方将现实问题定义成数据问题有待决解,那这就是很多擅長数据分析的专家的优势领域了”,数据业务定义准确,形成具体问题,将有助于吸引不同领域的科研用户进入到政府开放数据利用中来。
3.4科研情境
从科研情境来看,资源投入、开放观念、产业技术升级、法律法规和潮流压力等都会对政府开放数据利用产生重要影响。政府开放数据需要充足的资源投入,需要国家政策的扶持,政府需要在平台建设上投入人力、物力和财力,需要数据领域专家来指导平台的建设和数据的整合,需要有良好的推广和激励机制,在目標和行动上都做到面向用户需求,以实现数据的公共价值。如有受访者表示“目前政府开放数据平台的交互功能不太好用”“数据质量参差不齐,太难用了”等,可见资源建设仍有较多的进步空间。政府对于开放的态度,对于开放内容的保守和开放程度,是否敢于承担数据开放创新带来的未知风险,既对政府开放数据的范围及数据质量产生影响,也影响科研用户对政府开放数据的认知和利用。如有受访者表示“感觉目前开放比较谨慎,数据的内容不够丰富”“开放得很小心,我们暂时也不敢大胆地使用”等。产业技术升级则是实现政府开放数据利用的重要推动力.随着政府数据产生和收集的方式越来越丰富,数据的使用、流通、脱敏、保密、开发等技术随之快速发展,信息技术新的进步以及跨领域合作都能为政府开放数据注入新的活力,可以推动科研用户政府开放数据利用。如有受访者表示“期待数据开放平台能够自带一部分基础的数据整理或者分析的工具”“希望数据能有更好的脱敏,这样使用起来更方便也没有更多的顾虑”等,均为科研工作者对政府开放数据技术的期待。法律法规在数据安全立法、隐私立法、数据使用协议等方面更清晰的界定可以规范开放数据使用行为,引导政府开放数据利用良性发展。潮流压力包括国外开放潮流压力、国内民众对开放政府数据的期盼,民众对现存政府开放数据的评价口碑等,也将影响科研用户使用政府开放数据的意愿。如有受访者表示“社会环境和法律环境实实在在地影响着我们选择科研的内容和方向”。
4研究结论与展望
如何基于科研用户认知来研究利用政府开放数据,既是对科研用户数据科研工作的更深要求,又是对政府实现提升供需适配性水平的进一步发展。本研究通过对政府开放数据科研用户的参与式观察深入访谈.利用扎根理论的方法从理论层面构建科研用户利用政府开放数据的影响因素分析框架,并对关键要素及其作用机制进行剖析,得到数据利用能力、数据准备度、科研任务和科研情境四大影响因素。本研究提出的框架能为后续面向用户认知的政府开放数据管理与服务提供借鉴和参考。同时本研究也具有一定局限性,整体研究仍在理论层面上进行分析与探索,仍需要实证研究、实践研究和量化研究来验证与补充,以期为实现政府开放数据进一步提升提供更具体的意见和建议。
(责任编辑:郭沫含)