基于GB/T 25000.12-2017的CAD软件产品数据质量测评体系框架

2020-02-01 15:23乐亮
现代计算机 2020年34期
关键词:度量程度框架

乐亮

(工业和信息化部电子第五研究所,广州510610)

0 引言

随着信息技术的发展和制造业领域专业分工越来越细,产品要由不同的设计人员、制造商和零部件供应商合作完成。在这一过程中,必然涉及到不同的CAD之间、CAD与其他系统之间共享信息,交换数据的问题。同时还要求企业部门之间、企业之间,在交换CAD数据时对数据信息的组织和质量水平达成共同的理解和协定。同时,在数据的采集、输入、加工、转换的过程中,由于普遍存在的不确定性因素,造成数据对现实世界的描述不准确,产生数据误差或错误,因而无法达到数据使用的要求,或者不能完全满足数据应用的需求,这些都是CAD软件产品的数据质量问题。

因此,如何高效地检测出CAD软件产品数据质量问题并对其做出客观的评价,是关系到数据应用及决策的科学性和有效性的关键因素。为满足CAD软件产品数据质量测评的工程需求,本文基于GB/T 25000.12-2017标准,同时考虑CAD软件产品数据质量的基本内容及影响因素,对标准提出的15个数据质量特性进行分析、总结、归纳出一套适合的CAD软件产品数据质量测评指标,结合CAD软件产品实际应用,分析各指标对应的度量元及其权重,然后进一步对数据质量的检测方法和评价方法进行研究,从而提出一个基于GB/T 25000.12-2017的包含测评指标、检测方法和评价方法的CAD软件产品数据质量测评体系框架。

1 什么是数据质量

数据质量被定义为指在特定条件下使用时,数据的特性满足明确的和隐含的要求的程度[1],图1给出了数据质量概念提供的框架。

图1 数据质量概念框架

因此,数据质量信息能反映生产的数据集和现实世界中论域(即完全符合要求的数据集)之间的差异。从数据生产者的角度而言,数据质量指数据集符合产品规范的程度,即数据集与某一论域的接近程度;从数据使用者的角度而言,数据质量指数据集“适合使用的程度”,即产品和用户需求或期望之间的一致性水平。CAD软件产品数据质量也可以构建类似的框架。CAD软件产品数据质量可以理解为CAD软件产品数据或服务符合产品规范、满足及适应不同用户需求的能力。

2 CAD软件产品数据质量

基于用户对CAD软件产品数据的实际应用需求,CAD软件产品的数据质量内容[2]主要包括产品的描述与可靠性、模型复杂性、工程更改、几何明晰性、结构等,具体如表1所示。

表1 CAD软件产品的数据质量内容

针对上述数据质量的基本内容,影响CAD软件产品数据质量的因素包括:CAD设计方法、用户培训和用户知识、CAD系统程序、检查程序、数据交换和数据修复等。

3 数据质量测评体系框架

本文根据CAD软件产品特征及其数据质量相关内容,结合GB/T 25000.12-2017标准中提出的15个质量特性,提出一个可供参考的CAD软件产品数据质量测评体系框架[3-5],该框架包括数据质量测评指标、数据质量检测方法和数据质量评价方法,具体如图2所示。

图2 CAD软件产品数据质量测评体系框架

3.1 数据质量测评指标

首先,按照CAD软件产品的特征,基于GB/T 25000.12-2017提出的15个数据质量特性,通过分析,得出每个质量特性对CAD软件产品最终质量结果的影响程度和量化难易程度,如,基于用户对CAD产品数据功能、性能效率、易用、接口等较为关注,所以准确性、完备性、精度(涉及功能),效率(涉及性能)、一致性(涉及接口),可用性、可访问性(涉及易用性)的影响程度都为高,同时考虑到相关质量特性在数据质量模型中的度量元与产品质量模型中的度量元较为类似,测度数据较为容易获取,所以其量化程度为可量化;相反的,CAD产品作为桌面设计工具软件,用户对确实性、现实性、依从性、保密性、可跟踪性、可理解性、可移植性、可恢复性的关注程度相对较低,所以其影响程度定为低,同时,在度量元测度数据的获取上,较为困难,所以其量化程度为难量化,具体如表2所示。

如表2所示,各质量特性对最终数据结果的影响程度不同,量化的难易程度也不同。结合第2节CAD软件产品数据质量基本内容,进行指标的综合对比、筛选、归纳。具体办法如下:一是直接选取准确度、完备性、一致性、效率、精度这五个对质量结果影响程度较高、相关标准中出现频率也较高且易量化的维度。二是由于保密性、可跟踪性、可理解性与可访问性联系较为紧密,将其归入可访问性指标;确实性、现时性、依从性、可移植性、可恢复性是针对特定需求的,将其归入可用性。于是,选定准确性、完备性、一致性、效率、精度、可用性和可访问性等7个数据质量指标。同时,参考GB/T 25000.23-2019产品质量模型提出的度量元,结合CAD软件产品的实际,进一步提出上述指标的度量元及其权重(见表3)。

表2 数据质量特性对CAD软件产品数据质量的影响和量化表

3.2 数据质量检测方法

参考GB/T 18784-2002对CAD软件产品数据质量的分类,CAD软件产品数据质量主要可分为几何数据质量(包括曲线,曲面,有界曲面,组合曲面、曲面组及拓扑组合,边界表达实体和图样元素)和数据结构质量(包括模型名称、模型结构、工程图样、实体、精度、数据量、工艺信息),通过分析其组成、特征以及结构层次,给出不同检查对象、不同结构层次上的数据检测方法,具体如表4所示。

表3 数据质量指标及度量元

3.3 数据质量评价方法

在取得数据质量检测结果后,可依据实用性、科学性、全面性、易操作性和系统性等原则[6],按照3.1小节提出的测评指标对数据质量分别进行度量,其度量结果通常有以下几种方式表示:

(1)布尔变量,即包含两种逻辑状态的变量,其值域范围为{真,假}。对于某单项测评,将待检数据集与标准数据集进行比较,若二者在某个测评指标上结果一致,则在该项指标上质量结果为真,否则为假。

表4 CAD软件产品的数据质量检查内容及方法

(2)数量,即事物的多少,其值域范围为[0,+∞)。存在两种计数方式:一种是统计正确数据的个数,另一种是统计错误(缺陷)数据的个数。

(3)比值或百分数,比值的值域范围为[0,1]。百分数是一种特殊的比值,其值域范围为[0,100]。

在对测评指标进行度量后,可对度量结果进行数据质量评价,常见评价方法包括缺陷扣分法、加权平均法等。

缺陷扣分法是依据某个评分标准,通过给产品打分的方式来评价单个产品的数据质量。首先,根据产品缺陷的严重程度制定一个分级的评分标准,每个缺陷级别给定一个扣分值。然后,统计符合每个缺陷级别的缺陷数量,再与其对应的扣分值相乘即得到产品的扣分。最后,用满分减去扣分值得到产品的质量得分,作为最终质量评价结果。

设某CAD软件产品数据的缺陷分级标准为:严重缺陷扣α分,重度缺陷扣β分,一般缺陷扣γ分,则根据缺陷扣分法得出的产品质量得分为:

其中,X、Y、Z分别为产品中严重缺陷、重度缺陷、一般缺陷的个数,Q为产品质量得分。

加权平均法的思路是通过统计数据集各评价项在抽样检验中的正确率与为其分配的权重进行加权平均,来得到最终的质量结果。其优势在于考虑到了不同类型评价对象对最终质量结果的影响程度不同,于是给评价项赋权,权重越大说明该评价项越重要。但是,赋权的过程仍然没有详细说明,可能带有较强的主观性。其公式如下:

式中,Ci、Pi分别为第i个评价项的数据的度量值及其对应的权重,且Ci∈(0.0,1.0);Pi∈(0.0,1.0);R为数据质量结果,R∈(0.0,1.0);n为评价项数。

4 结语

本文在前人研究的基础上,基于GB/T 25000.12-2017标准提出的15个数据质量特性,结合CAD软件产品数据内容及其特征,构建了一个相对全面,包含数据质量测评指标、数据质量检测方法和数据质量评价方法的CAD软件产品数据质量测评体系框架,基于该框架,后续可针对CAD软件产品设计开发数据质量测评系统。

在针对具体CAD软件产品实施软件数据质量测评时,要衡量一个软件产品数据质量的好坏,其质量指标及度量元的合格与否要给出准绳,并给出其权重。这样的数据需要通过长期积累、总结获得,同时也需要经过专家的评估确定。因此,在使用基于本文提出的测评体系框架进行软件数据质量度量还需要做大量的实践研究工作,深入钻研。

猜你喜欢
度量程度框架
鲍文慧《度量空间之一》
有机框架材料的后合成交换
框架
男女身高受欢迎程度表
日语程度的类型与程度副词的对应关系
不欣赏自己的人,难以快乐
突出知识本质 关注知识结构提升思维能力
浅谈框架网页的学习
三参数射影平坦芬斯勒度量的构造
摩擦力的利用与防止