郑威
关键词:数据质量,因素分析,关键成功因素,信息系统。
一、引言
数据质量
随着数据仓库的扩散,通信和信息技术在组织中对高数据质量(DQ)的认识和需求日益增加。
二、数据质量关键成功因素的研究模型
信息系统的成功措施包括:信息系统使用、用户满意度、个人影响和组织影响。根据先前的研究建模,以下是假设:
·1):数据质量与感知的净效益呈正相关。
·2):系统质量与感知的净效益呈正相关。
数据质量和先决条件
1、数据质量维度
为了提高整体数据仓库成功模型中数据质量构造的解释力,该模型从三个维度度量数据质量:准确性、相关性和可访问性。
2、数据质量先决条件
根据之前的研究,数据质量系统分为两个主要类别:管理基础设施和技术基础设施,其中包含15个技术基础设施元素。这些数据质量程序元素如下面的表1所示。
本研究提出数据仓库数据质量的先决条件除了包括与大多数成功的数据质量程序相同的那些因素,还应包括另外四个因素:创新、标准化、培训和教育,以及在数据仓库中显得特别相关的检查和测试。
我们分别重新命名了主要类别:组织基础设施和数据质量系统实施。这些数据质量元素类别定义如下:
组织基础设施:高级管理层对数据质量的承诺和参与程度,以及促进或阻碍数据质量的组织的整体文化和特征。
数据质量系统实施:将数据质量视为一个完整系统的程度,包括客户驱动的需求分析; 测试、检查、测量和评估过程; 以及数据质量规划和改进机制。
基于这些定义,提出了包含这两个数据质量元素类别的四个数据质量先决条件。四项数据质量先决条件的定义如下:
管理承诺和参与:高级管理层对数据质量的承诺程度和参与程度。这种正式的承诺和参与表现为政策、目标设定、项目启动、问责制、数据供应商管理、改进过程和信息链管理。
促进组织文化和特征:广泛认为数据和信息是商业资产,并相应地加以处理的态度。这种待遇表现为创新、积极的数据挖掘、适当使用标准化、尽量减少权力斗争以及在整个组织中进行充分的培训和教育。
需求分析和技术流程实施:有效识别和处理客户需求并确保维护质量控制的数据质量流程。正确维护质量控制体现在数据录入的准确性和经验性质量测量和评估的形式上。
数据质量系统规划和改进:主动规划数据质量系统的实施,并将质量改进纳入其中。
建议的数据质量元素结构如表2所示。
根据这些定义,假设下列数据质量先决条件:
·1):“管理承诺和参与”、“促进组织文化和特征”、“需求分析和技术流程实施”、“数据质量系统规划和改进”与数据仓库数据质量正相关。
最后,我们提出了考虑操作数据质量在所提出的数据质量先决条件和数据仓库数据质量之间的中介作用。因此,假设如下:
·2):组织内的运营数据质量与DW数据质量成正相关
·3):“管理承诺和参与”、“促进组织文化和特征”、“需求分析和技术流程实施”、“数据质量系统规划和改进”与运营数据质量成正比。
这些假设反映在图3所示的完整研究模型中。
三、结论
该研究模型基于现有文献和以往关于数据质量关键成功因素的研究,包括四个因素类别组和二十五个因素项目。从大规模调查的因子分析结果来看,原有的信息系统关键成功因子数据质量研究模型应该修改为数据质量管理因子、人员因子、组织因子和环境因子四大因子类别,25个因子项目应该重新归类为不同的因子类别。本文提出的因子分析方法为现有文献中缺乏的数据质量关键成功因子的研究模型提供了更加科学的依据。因此,该研究对数据质量领域具有重要的理论贡献。此外,它还为数据质量和信息系統管理领域的从业人员提供指导,说明确保其系统中的高质量数据的关键成功因素。
参考文献
1. 张琼文. 试论数据治理在数据质量管理中的作用[J]. 通讯世界,2017(3).
2. 卿曦. 源头数据治理 优化数据质量[J]. 大众用电,2018,32(11):20.
3. 杨春红. 数据治理在数据质量管理中的影响分析[J]. 电脑编程技巧与维护,2018,000(012):92-93,107.
4. 程大庆,郑承满. 数据仓库数据质量的治理及体系构建[J]. 中国金融电脑,2011,000(006):28-34.
5. 徐岚珊,郭树行. 面向数据治理的数据资产质量评估模型研究[J]. 科技资讯,2020,018(003):18-19.
6. Lee,Y.,Strong,D.,Kahn,B. and Wang,R. (2002) AIMQ:a methodology for information quality assessment,Information and Management,40,133-146.
7. Pipino,L.,Lee,Y. and Wang,R. (2002) Data Quality Assessment,Communications of the ACM,45,4,211-218.
8. Rahm,E. and Hai Do,H. (2000) Data Cleaning:Problems and Current Approaches,IEEE Computer Society,23,4,3-13.
9. Redman,T. (1998) The Impact of Poor data Quality on the Typical Enterprise:Poor Data Quality Has Far-Reaching Effects and Consequences,Communications of the ACM,41,2,79-82.
10. Wand,Y. and Wang,R. (1996) Anchoring Data Quality Dimensions in Ontological Foundations,Communications of the ACM,40,5,103-110.