国外科学数据质量评估框架比较研究

2021-06-24 10:35黄国彬陈丽
图书与情报 2021年1期
关键词:对比分析

黄国彬 陈丽

摘   要:文章调研了目前国内外科学数据质量评估框架的研究现状,对英国、美国和澳大利亚国家科学数据平台数据质量框架和三大主要的国际组织发布的数据质量评估框架进行了比较研究。通过对各框架内容的剖析和数据质量维度的比较分析,找出了不同评估框架在各维度上的差异性和一致性。

关键词:科学数据;数据质量评估;质量框架;对比分析

中图分类号:G311   文献标识码:A   DOI:10.11968/tsyqb.1003-6938.2021013

Comparative Study on the Foreign Framework of Scientific Data Quality Assessment

Abstract To understand the foreign research status of scientific data quality assessment framework for domestic scholars to scientific data quality assessment framework to provide the reference and reference, this article research the present domestic and foreign research situation of the scientific data quality assessment framework, in Britain, the United States and Australia's national science data platform data quality framework and three main data released by the international organization has carried on the comparative research on quality assessment framework. Through the analysis of the content of each frame and the comparative analysis of data quality dimensions, the difference and consistency of different evaluation frameworks in each dimension are found.

Key words research data; data quality assessment; quality framework; comparative analysis

1   引言

科学数据的质量对科学研究至关重要,可以说科学数据在一定程度上决定了研究的质量,因此,科学数据的质量评价研究对于科学研究和数据共享具有重要意义。国外对数据质量评估的研究更多是针对目前各领域中的数据质量问题进行讨论并提出相关建议。国内在数据质量评估方面的研究主要是以现有的数据质量评估框架为研究对象进行总结和分析或者分类,如学者程开明[1]、袁满[2]等;也有学者通过研究国际上较成熟的数据质量评估框架,借鉴其经验并阐述了对我国构建数据质量评估框架的启示,如学者朱松[3]、许涤龙[4]、常宁[5]、童铭红[6]等。

考虑到数据质量评估框架的通用性和对本研究的可借鉴性,本研究选择了国际货币基金组织数据质量评估框架、经合组织统计活动质量框架、欧盟统计局统计质量保证框架三种框架作为研究样本。根据re3data统计,全球已注册的科学数据平台已经近2000个。这些科学数据发布平台大多数都有对数据质量的规范和標准,但具体要求的维度和内容不同,详细程度也不同。考虑到平台对数据质量的规范内容和这些平台涉及的学科综合性、数据发布平台的认可度和重要性,本研究选取了国际上规模较大、认可度较高的五个科学数据平台的数据质量评估内容作为样本进行研究,分别是美国政治与社会研究校际联合数据库、英国数据档案、数字管理中心、澳大利亚国家数据服务中心、数据治理研究所。本研究以上述8个框架为样本进行内容分析,结合科学数据的特点,参考学者Wang和Strong等[7]提出的数据质量框架维度,通过比较分析法对其包含的数据质量维度、应用情景等进行研究,发现他们的差异性和一致性,进一步总结经验和启示。

2   数据样本内容概述

2.1    国际组织数据质量评估框架

2.1.1   国际货币基金组织数据质量评估框架DQAF

DQAF通过将国家统计实践与最佳实践(包括国际公认的方法)进行比较,为评估数据质量提供了一种结构[8]。DQAF评估由六部分组成,保证数据质量的先决条件是DQAF框架首要考虑的问题,包括法律和制度环境、必要的资源、相关性问题。DQAF进一步分析了数据质量的五个维度:客观性、方法健全性、准确性和可靠性、适用性、可访问性(见表1)。

为节省篇幅,本文后续部分用编号A代替DQAF数据质量评估框架。

2.1.2   经合组织统计活动质量框架

OECD(经济合作与发展组织)成立于1948年,负责管理美国资助的马歇尔计划,以重建受战争蹂躏的大陆。经合组织统计数据质量的提高是经合组织的主要目标之一,其统计数据涵盖范围的领域广泛,从经济学到健康和教育,从税收和农业到环境,从迁移和创新到生活质量。

OECD统计活动质量框架有四个要素:质量及其尺寸的定义,确保拟议的新统计活动质量的程序,定期评估现有统计活动质量的程序,经合组织统计活动的一系列广泛原则和质量。这四大要素涵盖了统计生产过程所有阶段的准则(见表2)。

为节省篇幅,本文后续部分仅用编号B代替OECD统计活动质量框架。

2.1.3   欧盟统计局统计质量保证框架QAF

欧盟统计局(ESS)成立于1953年,以满足欧盟共同体的要求。欧盟统计局的关键作用是向其他总干事提供统计数据,并向委员会和其他欧洲机构提供数据,以便他们可以定义、实施和分析社区政策[9]。欧盟统计局的使命是为欧洲提供高质量的统计数据。欧洲统计局的质量保证框架确定了可能的活动、方法和工具,可以在制定、制作和传播欧洲统计数据时为实施“行为准则”提供指导和证据(见表3)。

为节省篇幅,本文后续部分仅用编号C代替ESS统计质量保证框架QAF。

2.2    科学数据平台数据质量评估框架

2.2.1   ICPSR的数据质量评估框架

ICPSR(Inter-University Consortium for Political and Social Research,政治与社会研究校际联合数据库)于1962年由美国密歇根大学社会研究中心建立,是国际上重要的学术研究数据资料库,也是世界上最大的社会科学数据中心。ICPSR的目的是收集和保存社会科学研究数据资源,并提供公平公开且合理的使用,以加强数据资源的有效利用,包括政治学、人口学、社会学等学科,提供的数据包含了数据的原始文件、数据描述文件,以及其他相关文档[10]。

ICPSR的数据质量评估包含在ICPSR的数据管理计划中,是针对数据的提供者提出的,其内容也包含了对数据消费者(或使用者)较为重要的质量维度,如数据完整性、可访问性、及时性、访问安全性、可追溯性等(见表4)。ICPSR的数据质量规评估主要是用于评估社会科学研究数据,但由于其对数据质量规定的维度有一定的普适性,并不是针对某一具体学科数据形式的详细定义,因此对其他科学数据的质量保证也有参考意义,可以在一定程度上用于其他学科的科学数据质量评估。

为节省篇幅,本文后续部分仅用编号D代替ICPSR的数据质量评估框架。

2.2.2   UKDA的数据质量评估框架

UKDA(UK Data Archive,英国数据档案)成立于1967年,英国数据档案馆位于埃塞克斯大学,是一个获取、策划和提供最大的社会科学和人文数据集的卓越中心。UKDA拥有丰富的数据资源,其数据涉及环境保护、社会科学、人文科学等多个领域[11]。UKDA是英国数据服务的主要合作伙伴,为研究人员提供支持、培训和访问英国最大的社会、经济和人口数据集。

UKDA为研究人员提供了数据管理清单,数据发布必须按照清单的要求来进行。这份数据管理清单包含六个部分:数据规划,文档化,格式化,存储,保密、道德和同意,版权分享。每个部分还有更详细的要求(见表5)。UKDA对数据质量的规定和评估要求也包含在该清单中,UKDA还针对定性数据和定量数据使用不同级别的质量控制,包括数据集维度检查、元数据检查、数据有效性检查等。其数据涉及环境保护、社会科学、人文科学等多个领域。

为节省篇幅,本文后续部分仅用编号E代替UKDA的数据质量评估框架。

2.2.3   DCC的数据质量评估框架

DCC(The Digital Curation Centre,数字管理中心)是国际公认的数字管理专业中心,专注于建立研究数据管理的能力和技能[12]。

DCC专注于数据存储、管理、保护和共享,数据涉及范围广,几乎没有学科限制。DCC数据质量评估主要针对研究人员和数据管理人员,分为以下七部分:与使命的相关性、科学或历史价值、唯一性、不可复制性、成本效益、文档完整性、重新分配的可能性。

为节省篇幅,本文后续部分仅用编号F代替DCC的數据质量评估框架(见表6)。

2.2.4   ANDS的数据质量评估框架

ANDS(The Australian National Data Service,澳大利亚国家数据服务中心)由澳大利亚政府通过国家合作研究基础设施战略(NCRIS,National Collaborative Research Infrastructure Strategy)资助。自2008年正式成立以来,ANDS一直支持澳大利亚各地的众多研究数据项目,它还在国际研究数据界发挥了重要作用。ANDS的旗舰服务是澳大利亚研究数据发现门户网站,用户可以在其中查找,访问和重复使用来自澳大利亚研究组织、政府机构和文化机构的研究数据[13]。

ANDS的数据质量评估依据FAIR数据原则。FAIR数据原则于2015年在荷兰莱顿的洛伦兹中心研讨会上起草,依次涵盖四项原则:可查找、无障碍、互操作、可重复使用(见表7)。

为节省篇幅,本文后续部分仅用编号G代替ANDS的数据质量评估框架。

2.2.5   DGI的数据质量评估框架

DGI(The Data Governance Institute,数据治理研究所)由DGI数据治理框架的主要作者Gwen Thomas于2003年创立,它是业界公认的第一名,世界各地的从业者一直在基于DGI数据治理框架和支持材料报告他们的计划。DGI于2004年推出了DGI数据治理框架,以响应对分类、组织和沟通涉及对企业数据做出决策和采取行动的复杂活动的新方法的需求。使用该框架使数据战略专家,数据治理专业人员,业务利益相关者和IT领导者能够共同合作,制定有关如何管理数据,实现数据价值,最小化成本和复杂性,管理风险以及确保合规性不断增长的决策法律,法规和其他要求[14]。

DGI数据治理框架中的数据质量评估依据DGI数据治理指导原则。该原则包括以下八个组成部分:诚信、透明度、可审计性、问责制、管家、检查和平衡、标准化、变革管理(见表8)。

为节省篇幅,本文后续部分仅用编号H代替DGI的数据质量评估框架。

3   评估框架内容比较分析

3.1    框架应用情景分析

框架应用情景是指框架在应用过程中涉及的相关对象和使用情景,包括框架产生的背景(或目的),框架评价的数据对象,框架的具体评价内容,框架的使用者等。通过调研各框架的发布机构或平台的信息以及对框架内容的梳理,笔者发现,由于不同的科学数据平台或机构需要处理的数据内容的不同,其所发布的数据质量评估框架的应用场景也不尽相同,如框架适用的学科数据有哪些,框架涉及的数据质量评估维度是针对数据发布者还是使用者等。根据框架发布者的背景信息和框架内容,笔者总结了框架内容来源(背景)、数据涵盖学科、评估内容和适用对象四个方面进行对比,得到内容特点和适用性(见表9)。

从框架提出的背景来看,框架A、B、C都是国际组织已经公开发布的有一定独立性的数据质量评估框架,框架D、E、F、H则是依托于平台的数据管理规范。从框架涵盖的学科来看,由于各组织和数据平台提出的数据质量框架都是为了对其自身涉及的数据进行质量规范,因此本研究中把组织和平台涉及的数据学科作为其对应框架的数据涵盖学科。由表9可知,只有框架D和E的数据涵盖学科有一定限制,框架D的数据涵盖学科是包括了政治学、人口、社会等社会科学,框架E则是环境保护、社会科学、人文科学等。其余框架均对数据学科没有明确的限制。从评估内容来看,各框架的评估内容分4-8个部分不等,框架A、B、C、D、G更多的是对数据本身的质量维度要求,而框架E、F、H还增加了涉及数据管理过程的相关要求。更详细的数据质量评估维度的分析在5.2中。从适用对象来看,8个框架的提出大多是针对数据生产者或数据提供者,但所有框架也同时对数据使用者或管理者适用。

3.2    数据质量评估维度分析

通过对大量研究的总结分析发现,目前对数据质量框架的研究中,学者Wang和Strong[7]提出的数据质量框架包含的数据质量维度是最为广泛和权威的。该框架已被不同国家的许多大型企业和政府机构所采用,许多研究人员也将其作为研究对象或参考。该框架选择了20个对消费者使用数据较为重要的质量维度,后来将其减少至15个,并划分四大类别。这些数据质量维度的选择基于以下目标:数据使用者必须能够访问数据;消费者必须能够解释数据;数据必须与消费者相关;消费者必须找到准确的数据(见表10)。本研究选择以此框架中包含的数据质量维度作为参考,研究科学数据质量评估框架。

笔者在研究了三个成熟的数据质量评估框架以及五个科学数据平台对数据的质量要求内容后,以Wang等提出的数据质量评估框架维度为参考,根据对8个科学数据质量评估框架的具体内容分析,整理得到差异性比较结果(见表11)。

由差异性比较结果表可以看出,三个较成熟的数据质量评估框架涉及的数据质量维度大多数是相同的,如可信度、准确度、相关性、及时性、可访问性等。综合其他五个框架来看,数据质量对可信度、准确度、可追溯性、相关性、一致性、可访问性、成本效益等数据质量维度有较为普遍的要求,而对客观性、增值、易于操作、访问安全等维度的要求则较少,八个平台的数据质量要求都没有对适当的数据量、灵活性、简明表示三个数据质量维度的要求。结合不同平台的服务对象和学科数据内容分析,可信度、准确度、相关性、一致性和可追溯性以及可访问性、成本效益可以看作是对数据质量的基本要求。

下面根据四大类共20个维度对数据质量评估框架的内容分别进行梳理,将各框架中的内容与每个大类相应的指标一一对应。

3.2.1   数据准确性

数据的准确性即数据提供者必须提供准确的数据,以便使用者能找到和利用准确的数据。数据准确性包括了数据必须是正确的、客观的、来自有信誉的来源等内容。科学数据的准确性是保证科学研究能得到正确结论的重要前提,因此对科学数据准确性维度的评估是数据评估的基本要求。

(1)可信度。可信度是指数据的可信程度和可靠性。框架A中有明确的专业性与透明度指标要求,框架B中的可信性要求还包含了三个方面:统计问题的透明和专业,数据发布避免在时间和内容上的政治干扰和数据使用者对数据的怀疑有相应的处理方法和程序。框架F则要求数据有研究领域当前价值的权威证据。框架H也有明确的诚信要求,规定数据治理参与者通过彼此的交易来实践诚信,在讨论与数据相关的决策的驱动因素、约束、选项和影响时,是真实的和即将到来的。而其他框架中则没有明确提及可信性要求。

(2)准确度。准确度是指数据经过认证,准确可靠,无瑕疵,误差小。8个数据质量规范有5个涉及到对准确度的要求,准确度也是数据质量控制的重要内容,对数据质量起决定性作用。框架A要求原始数据和统计方法可靠,统计数据充分反映实际情况;框架B和C也有明确的准确度指标要求,框架B主要是在数据标准、数据输入和评估精度方面作要求,框架C則更细致,在变异系数、单位回答率等统计指标上有要求。另外5个框架的数据质量规定对准确度的要求内容则比较模糊,框架D只提及会在数据过程中保证质量,框架H则要求数据的真实透明(见表12)。

(3)客观性。客观性是指数据是公正、客观的。表中8个数据质量规范只有框架A明确提及到对客观性的要求,其他框架中对客观性的要求不明确或是融入到了可信度与准确度要求中。

(4)完整性。完整性是指数据的宽度、深度和范围是完整的。框架A、C和F对完整性的要求主要是在源数据和文档记录上,这一点和可追溯性也相关联。

(5)可追溯性。可追溯性是指数据有良好的文档记录、易于追踪,可验证。可追溯性对于数据的使用也有重要作用,数据的可追溯性保证了数据是可以由使用者根据数据的相关记录和文档进行验证的。框架D、E、F、G、H都有对可追溯性的要求。框架A要求有源数据、中间数据及统计结果的评估和验证,框架B要求提供数据说明、目录和收集方式,框架E和H都要求有数据文档与可验证、可审计,框架F则要求数据资源出处与元数据创建和使用的背景。

(6)声誉。声誉是指数据的声誉、权威问题。数据是否有一定的声誉和权威性,决定了数据在使用中能否有效支撑科学研究的理论实践。但在表12中,8个框架只有D和E涉及到声誉维度,对数据的存档和数据存留与销毁有相关要求。

(7)各种数据源。数据源是指数据有各种明确的数据源。对数据来源有特殊要求的数据,如要保证数据的唯一性,只有在这个数据集中能获取相应数据,则要求有明确的数据源,但对数据源有具体要求的只有框架E和F。

在数据准确性的评估中,8个框架有至少3个框架的评估内容包含可信度、准确度、完整性和可追溯性,说明机构组织和科学数据平台在进行数据质量评估的时候,将这些维度作为基础要求;对数据客观性、声誉和数据源维度的要求则比较少,只有个别评估框架中有相关内容。

3.2.2   数据相关性

数据相关性主要是从数据使用者角度出发,即数据与使用者的使用数据的相关性,能够让数据使用者在研究和决策中有效使用数据。数据相关性包含了数据是相关的、及时的、易于操作的等内容(见表13)。

(1)增值。增值是指数据提供的竞争优势,为运营带来数据增值。只有框架F在规范中提到要有对未来潜在利益的评估。其他框架在这方面都没有明确要求。

(2)相关性。相关性是指数据是可应用的,相关的,有趣的,有用的。相关性的评定更多的是从数据使用者的角度,判断数据与研究的相关程度和可应用性。框架A、B、C、F都把相关性作为大类指标进行要求,框架A在把相关性放在了质量的先决条件指标中,框架B对相关性的要求侧重于数据与客户需求的相关性,框架C的相关性要求则是统计上的数据可得率,框架F对相关性的要求与B类似,相关性评估的对象是用户需求和研究内容。

(3)及时性。及时性是指数据收集和发布的及时,时效性。表中只有框架A和C的质量规范内容涉及到对及时性维度的要求。由于数据平台对数据内容和保存时限的要求不同,部分数据可能要求是较新的、发布及时的,但有的数据跟发布时间和使用时限无关。

(4)易于操作。易于操作是指数据可用于多种用途,易操作、易连接、易修改,数据可集成。表中只有框架G明确提出了对这一维度的要求,数据需要使用社区商定的格式、语言和词汇表,元数据还需要使用社区商定的标准和词汇表,并包含使用标识符的相关信息的链接。

(5)适当的数据量。数据量适当且适合使用。选择的8个框架均没有明确规定对数据量的要求。

(6)灵活性。灵活性是指数据是可适应的,灵活的,可扩展的。由于DCC是国际专业数据平台,对数据适用的广泛性有一定的要求,因此框架F中包括了对灵活性维度的要求,而其他框架都没有涉及。

在数据相关性的评估中,只有相关性一个维度是在大多数的框架中有涉及,而增值、及时性、易操作等维度只有个别框架将其列入数据质量评估内容,但对于科学数据而言,数据的及时性或时效性也是评价其质量的重要方面。

3.2.3   数据可理解性

数据可理解性即数据的发布者用数据使用者可理解的语言描述和表示数据,且数据内部表示是一致的。数据可理解性包括了可解释性、易于理解、具象一致性和简明表示(见表14)。

(1)可解释性。可解释性是指数据可解释、可翻译。可理解性维度表中只有框架B、E、G涉及到对可解释性的要求。框架B对可解释性的要求分为三点:提供源数据覆盖的概念、定义和方法;提供数据准确性的评估或分析以及提供基于数据的解释性分析。框架E要求有描述和上下文文档来解释数据含义、数据收集方式以及创建方法,框架G的可解释性要求则包含在互操作和可重复使用中,要求有明确数据描述可清晰的机器可读。

(2)易于理解。易于理解是指数据容易理解,清晰可读。表中只有框架E涉及到对易于理解的要求,明确规定在数据管理清单中指明相关文档确定他人是否能够理解数据并正确使用。

(3)具象一致性。一致性是指数据以相同的格式持续地、一致地表示和呈现。一致性涉及到已经存在的数据集内部数据的一致性,还涉及数据集在后续的更新过程中是否保持一致性。框架D、E、G、H对一致性的要求都是在数据描述与数据格式上,要求有按照固定格式和标准来组织数据。框架A对一致性的要求包含在适用性里,要求统计数据是一致性的并且遵循可预测的修订政策。框架B的一致性要求包含三方面:使用共同的概念、定义和分类;数据处理使用共同的方法和系统;对抗和和解的数据集可能会发生冲突。框架C和F的质量规范内容则没有涉及到一致性维度。

(4)简明表示。简明表示是指数据表示简明紧凑,组织良好美观,数据格式规范。由于不同学科对数据格式和类型的要求不同,数据质量评估框架并不能对数据格式进行细致规定,这一点在表中的各个框架中也没有体现。

在数据可理解性的评估中,可解释性和具象一致性是比较重要的维度,而易于理解和简明表示维度的评估在8个框架中则很少涉及。由于科学数据的使用对象是科研人员而不是普通大众,这一对象对该学科领域有一定的专业知识和理解能力,因此在科學数据的易于理解和简明表示上不做重点要求。

3.2.4   数据可访问性

数据可访问性即数据生产者和发布者允许数据被他人以一定的手段和方式获取、使用。这也就意味着数据在一定程度上成为共享数据,因此数据可访问性还涉及到数据的存放和访问带来的成本效益,以及访问过程的安全问题(见表15)。

(1)可访问性。可访问性是指数据是可访问的、可检索的,访问速度,数据是可用的、最新的,可访问性也是数据得以共享和使用的重要评价指标。可访问性维度表中6个数据质量框架都涉及到了对可访问性的要求,可访问性要求不仅包括了数据的可获取性、可读性,还包括了对数据重用的要求。

(2)成本效益。成本效益是指数据收集和整理的成本与使用效益。数据的收集和保存都需要成本和资金,因此对数据成本效益的估算在数据的质量评估中也具有重要作用。可访问性维度表中有5个框架都涉及到了成本效益维度,但大多数都只要求了对数据保存的成本预算和控制,以及是否有相应资金和资金来源,因此只涉及到成本并不涉及效益,只有DCC明确提及了要对数据的未来潜在效益进行评估。

(3)访问安全。访问安全是指数据不能被竞争对手访问,数据具有专有性质,访问数据可受到限制。对于需要一定保密性的数据会考虑到访问安全问题,这一点只有框架D有明确规定,其他框架对安全性的要求多为法律层面,涉及到数据版权、隐私等问题,但都没有明确提出访问的安全性。

在数据可访问性的评估中,可访问性和成本效益是大多数框架都考虑到的内容,这源于科学数据共享带来的价值,因此数据的可访问性十分重要;而科学数据的产生、保存和共享都需要付出一定的成本,因此各框架也都比较重视对科学数据成本效益的评估。

4   结语

通过数据质量评估维度的比较分析,笔者发现,各个框架对数据质量的要求内容除了涉及到表9的数据质量维度,还几乎都提到了数据的版权或知识产权问题、数据涉及的隐私问题、数据涉及的道德和法律问题、数据保留期等问题。如框架A把法律和制度环境列入了质量的先决条件中,并且包含了对职业道德标准的要求;ICPSR的数据管理计划的要素中包含了安全(包括机密、权限、限制和禁运)、知识产权、存档和保存、道德和隐私、法律要求等问题;UKDA还把保密、道德和同意与版权作为两个大类指标进行数据质量要求。可见这些指标在数据质量评估中的重要性,弄清楚这些问题对数据发布者和使用者来说都具有重要意义。

目前国内外在科学数据领域的研究成果较为丰富,国外在数据质量评估问题上的研究也比较成熟,尤其是对统计数据的质量评估研究更多,这源于国家政府或者国际机构的数据很多都是统计数据,统计数据在一定程度上关系着社会和经济的发展,我国也有不少学者针对政府统计数据、统计数据做了数据质量评估研究,成果显著。在科学研究中,基础数据起着决定性作用,而科学研究对一个国家的发展、社会的进步、国家的国际地位等都有关键性的作用,因此我们应该更加重视科学数据质量。笔者在研究过程中发现,国外许多国家都有很多大型的科学数据共享平台,特别是英国、美国、澳大利亚,并且许多平台都对自己的数据有一定的质量要求。目前中国的科学数据共享平台发展还不够成熟,国内主要的科学数据平台是中科院科学数据共享工程中开发的多个学科数据共享平台,包括基础科学、地震科学、人口与健康科学等多个学科数据共享服务平台等,以及社会科学数据库:中国人民大学中国调查与数据中心、复旦大学社会科学数据平台、北京大学开放研究数据平台。由于平台的限制,科学数据的发布、共享和使用效率都有很大的提升空间。国内对科学数据质量评估的研究还处于一个不成熟阶段,学者们提出的有效的科学数据质量评估框架是有限的,其适用范围也不够广泛,此后还需要更多相关研究,以促进科学研究的发展和科学数据的共享。

参考文献:

[1]  程开明.三种国际统计质量管理框架的比较及启示[J].统计研究,2011,28(4):74-79.

[2]  袁满,刘峰,曾超,等.数据质量维度与框架研究综述[J].吉林大学学报(信息科学版),2018,36(4):91-98.

[3]  朱松,高喜燕.國外统计数据质量评估框架、方法及对我国的借鉴[J].西部金融,2014(10):78-81.

[4]  许涤龙,龙海跃.欧盟数据质量评估框架及其对我国的启示[J].统计与决策,2013(8):4-7.

[5]  常宁.IMF的数据质量评估框架及启示[J].统计研究,2004,21(1):27-30.

[6]  童铭红,虞波.国际统计数据质量管理框架的思考和实践[J].现代经济信息,2013(24):92-93.

[7]  Wang R Y,Strong D M.Beyond Accuracy:What Data Quality Means to Data Consumers[J].Journal of Management Information Systems,1996,12(4):5-33.

[8]  Data Quality Assessment Framework[EB/OL].[2019-05-20].https:// www.imf.org/ externa/ np/sta/dsbb/2003/eng/dqaf.html.

[9]  Quality Assurance Framework of the European Statistical System[EB/OL].[2019-05-20].https://ec.europa.eu/eurostat/documents/64157/4392716/ESS-QAF-V1-2final.pdf/bbf5970c-1adf-46c8-afc3-58ce177a0646.

[10]  ICPSR.Data Management & Curation[EB/OL].[2019-05-20].https://www.icpsr.umich.edu/ icpsrweb/content/datamanagement/dmp/framework.html.

[11]  UKDA.The UK's largest collection of digital research data in the social sciences and humanities[EB/OL].[2019-03-20].https://www.ukdataservice.ac.uk/manage-data.

[12]  DCC.Digital curation standards[EB/OL].[2019-05-20].http://www.dcc.ac.uk/resources/ standards.

[13]  ANDS.The FAIR data principles[EB/OL].[2019-06-01].https://www.ands.org.au/working-with-data/fairdata.

[14]  DGI.Goals and Principles for Data Governance[EB/OL].[2019-03-20].http://www.data governance.com/adg_data_governance_goals.

作者简介:黄国彬,男,北京师范大学政府管理学院副教授,研究方向:信息法学、信息分析;陈丽,女,北京师范大学政府管理学院硕士研究生,研究方向:信息分析、信息资源管理。

猜你喜欢
对比分析
国内外本硕一体化培养模式的对比分析
丝绸之路经济带高素质外语人才的需求与缺失现象对比分析
理想液体元流能量方程推导的对比分析式教学模式探索
留学生形容词谓语句的习得研究
戴·赫·劳伦斯《菊馨》三个版本对比分析
成渝经济区城市经济发展水平比较研究
英汉动物词汇文化内涵的对比分析
基于数据库的唐诗宋词对比研究