专题导语: 政策文本计量分析的公共数据管理应用场景

2023-08-14 16:02马海群
现代情报 2023年8期
关键词:公共数据图谱聚类

政策是以政府为核心的相关社会组织为主张自身目标、价值而制定的行动策略, 通常以计划、规划、指南、方针等形式呈现。政策文件( 文本) 则是行动策略的直接记录、样本、依据和凭证, 具有客观的可观测性。作为广义政策文献的重要组成部分, 政策文本相对而言是通过文本载体直观反映政策内涵的关键与核心。政策文献计量中的政策文本计量, 体现了图书情报学科中文献计量方法在政策科学研究中政策外部结构属性认知与揭示的一种渗透、应用, 可以一定程度地减少研究的主观性、不确定性和模糊性[1] , 也对政策科学方法论提供了有益补充和丰富。国内外研究者们已经运用内容分析、文献计量、网络分析、知识图谱等多种方法开展了以政策变迁、府际关系、政策关联为重点的多样化研究, 逐步形成有效的方法与规范的范式, 也可以视为一个新兴的跨学科研究领域。当然, 研究方法还在持续改进,研究应用领域和场景也在不断地扩展和丰富, 以更有效地揭示政策文本的显性信息和隐性信息。面对学术界已经出现的一定规模且呈现跨学科特征的政策文本研究文献, 需要加以归纳梳理与计量分析, 事实上已经出现了从数据—方法—应用三维视角对政策文本进行量化研究的综述文献[2] , 而作为当前我国政府及相关社会组织共同重点关注并有可能体现中国特色的公共数据政策的现实涌现, 则成为政策文献计量分析方法应用的重要新场景。

本专题是国家社科基金重大项目(21&ZD336) 的阶段性成果, 共组稿4 篇文献, 一是“基于CSSCI 的我国政策文本研究文献可视化定量分析”, 区别于已有研究文献, 基于文献计量学和可视化分析视角, 从作者共现图谱、机构共现图谱、关键词共现图谱、关键词聚类图谱、关键词突变图谱等文献结构属性, 呈现我国政策文本研究中具有影响力的作者及科研机构间的合作情况, 通过分析关键词共现、聚类、突变情况, 揭示政策文本研究发展脉略, 并对研究方法与研究范式进行总结。二是“ 地方公共数据政策量化评价研究———基于PMC 指数模型”, 在现有评价指标体系基础上, 细粒度地构建了地方公共数据政策的PMC指数模型, 并根據PMC 指数值绘制了PMC 曲面图, 更直观地呈现政策的优劣现状, 实现对政策样本总体和单项的量化评价, 而且提出参考性的政策改进路径和建议。三是“ 基于质性分析的我国省级公共数据管理办法文本研究”, 借助质性文本分析软件NVivo 12PLUS, 对我国典型省级公共数据管理办法依次进行政策文本分析并提出管理优化对策, 以推动公共数据的开放、利用与安全监管。四是“基于LDA 模型的我国开放公共数据政策供给特征分析”, 运用LDA 模型方法对我国公共数据开放政策进行聚类量化分析, 进而归纳出我国开放公共数据政策供给特征, 即呈现出明显的“差异性” 和“不均衡性”。“差异性” 主要体现在公共数据开放供给关注于日常状态下的数据开放, 对于突发事件紧急状态下的关注则明显不够;“不均衡性” 体现在内容上的不均衡和地理位置上的不均衡。

参考文献

[1] 黄萃, 任弢, 张剑. 政策文献量化研究: 公共政策研究的新方向[J]. 公共管理学报, 2015, 12 (2): 129-137, 158-159.

[2] 汪大锟, 化柏林. 政策文本量化研究综述[J]. 科技情报研究, 2023, 5 (1): 92-105.

马海群

黑龙江大学信息管理学院博士、博士生导师、二级教授

猜你喜欢
公共数据图谱聚类
论公共数据管控权的规范建构
绘一张成长图谱
公共数据开放许可的规范建构
基于DBSACN聚类算法的XML文档聚类
补肾强身片UPLC指纹图谱
基于高斯混合聚类的阵列干涉SAR三维成像
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例
杂草图谱