郑保卫 潘冲 温鲜阳 盛晶 黄加文 谭伊舒
(1.恩核(北京)信息技术有限公司,北京 100000;2.北京国际大数据交易有限公司,北京 100012)
在大数据时代,数据资产已成为国家和企业竞争力的关键组成,然而我国在数据资产领域的研究和实践都处于起步阶段,理论探索、制度建设和实践经验等多方面都存在缺失,没有一套贯通性的数据资产价值评估理论体系。本文通过对现有数据资产质量评估相关内容的梳理和研究,提出引入质量调整系数优化数据资产质量评估方法和模型,以提高评估结果准确性,为数据资产价值评估、促进数据资产流通提供参考。
数据资产质量评估关注数据价值和质量,是大数据和信息技术快速发展背景下的重要研究课题。国内已针对该领域提出一些相关标准,如《数据管理能力成熟度评价模型》(GB/T 36073-2018)[1]、《资产管理信息化 数据质量管理要求》(20220584-T-469)[2]、《信息技术服务 数据资产 管理要求》(GB/T 40685-2021)[3]和《信息技术 大数据 数据资产价值评估(征求意见稿)》(20214285-T-469)[4]等。研究内容主要涉及标准化、质量指标体系建设、评估方法与技术、实践应用与案例分析和跨领域融合。
国内虽然已提出一些相关标准,但现行标准体系中缺少针对数据资产管理体系的评估标准,因此需要针对数据资产管理全过程建立一整套管理体系指标。为了进一步推动数据资产质量评估领域的发展,未来研究需要在现有基础上不断优化评估方法、完善评估标准,并结合实际案例探讨跨领域的应用。
数据资产质量评估作为数据资产评估的一个关键环节,衔接数据资产登记与数据资产价值评估,通过面向数据提供方的评估,发现数据质量问题并形成数据质量的基线水平,提高参与交易流通的数据资产质量,并通过评估结果更准确地进行数据资产的估值和定价,从而推动数据资产交易市场的健康有序发展。
企业和机构合法拥有或者控制的数据资产。
开展数据资产质量评估工作,应遵循总体评估原则和评估机构选取原则,以确保评估结果的准确性和可靠性。
(1)客观性:数据资产质量评估应基于事实和数据,避免主观偏见。
(2)全面性:数据资产质量评估应全面覆盖数据资产的各维度指标。
(3)持续性:数据资产质量应随数据资产的变化而进行相应的调整和更新。
(4)专业性:评估机构应具有数据资产评估的专业能力和经验。
(5)独立性:评估机构应独立于数据提供方和数据交易平台,以保证评估结果的客观性。
数据资产质量评估的每个过程都可能涉及一个或者多个工具。其中,两大核心工具框架分别是数据质量检核框架和数据资产质量评估框架。数据质量检核框架可以帮助企业发现问题数据、解决问题数据,从而提高企业数据质量;数据资产质量评估框架可以帮助企业实现数据资产具象化,识别高价值数据,实现企业数据资产估值。
根据《DAMA数据管理知识体系指南》[5]中对数据质量管理的指导,目前数据质量管理的核心方法论是PDCA(戴明环)。
数据资产质量评估框架中的工具可以帮助企业发现、整改内部问题数据,从而提高数据资产质量;可以帮助企业进行内部问题数据的发现、整改,从而提高数据资产质量。基于数据质量检核框架提供的数据基础,数据资产质量评估框架包含评估模型管理器、评估规则管理器和估值报告生成器三大核心工具。
(1)评估模型管理器用于维护评估模型指标,包括指标名称、指标权重、指标定义和指标分值计算方式。
(2)评估规则管理器用于评估规则的维护,主要包括评估规则定义、评估规则执行等。
(3)估值报告生成器是一种自动化工具,可以提高资产估值报告的生成效率和准确性。
1.指标框架
参照《信息技术 数据质量评价指标》(GB/T 36344-2018)[6](以下简称《评价指标》)第3章,结合实际评估操作可行性、全面性、深入性,本研究所规范的数据资产质量评估三级指标包含6个一级指标、20个二级指标(包括《数据质量评价指标》(GB/T 36344-2018)中的16个二级指标,以及本研究扩充的 4 个二级指标)。一、二级指标框架详见图1所示。
图1 数据资产质量评估一、二级指标框架示意
为了便于对指标进行识别和管理,依据评价指标第5章对一级、二级指标、三级指标进行编号。指标编号及编码规则:指标编号是评价指标的唯一性编号,由一级指标、二级指标、三级指标共7位数字组成。编码规则详见图2。一级指标:由2位数字组成,01代表规范性、02代表完整性、03代表准确性、04代表一致性、05代表时效性、06代表可访问性;二级指标:由2位数字组成的顺序码,范围为01-99;三级指标:由3位数字组成,范围为001-999。
图2 指标编码规则示意
为了指导数据资产质量评估工作的可操作性,拟研究增设70余项三级指标,其目的主要考虑三个方面:第一,一级和二级指标具有较高的抽象性和概况性,不具有指导性和可操作性;第二,因一级和二级指标不够具体,不同的人对其理解存在一定程度的偏差,从而使执行的结果也存在较大差异;第三,三级指标是最终落地执行的规则类型,具有明确的可操作性,可直接将其转化为规则及程序,对评估对象进行检查。若三级指标缺失,对评估对象的检查深度和广度就不够明确,评估能否反映数据资产质量的真实情况则无从验证。
2.检测方法
为了确保数据资产质量,拟采用综合运用系统工具检测和人工检测的方法,根据选择的评估指标和质量规则开展数据资产质量检测。系统工具检测主要通过在数据资产质量平台等专业系统工具上部署相应的质量规则或直接在数据库中自定义检测语句来实施检测。这种方法可以确保检测结果的客观性和准确性。此外,人工检测通过对相关材料的审核以及与相关人员进行访谈等方式,对照所选数据资产质量指标和检测规则进行比对,并对检测结果进行客观记录,使检测过程更加全面和细致。进行数据质量检测时,应结合专业知识和行业数据流通特点进行详尽而系统的检测,以确保数据质量满足研究需求。
3.评估方式
根据评估数据规模,可采用全量检测或抽样检测两种方式进行数据资产质量检测。
全量检测方法将对目标数据集进行全面且详尽的数据资产质量检测,以确保获得最为准确的检测结果;抽样检测将运用随机抽样、系统抽样及分层抽样等多种抽样方法对评估数据进行抽样,并对得到的抽样数据开展数据质量检测,以便在更高效的基础上获得充分覆盖数据集的检测结果。
为确保数据资产质量检测工作不对数据生产和应用环境造成影响,同时保障检测工作的顺利进行,通常需要为检测数据准备库。这样可以对数据进行安全稳定的检测处理,减少检测过程中原数据环境的潜在风险,并在保证检测效果的同时满足数据管控的要求。
4.分值计算
参考数据质量评估方法,数据资产质量总体评分通过对一级指标分值加权平均计算得出。首先,根据三级指标对评估对象的数据资产质量进行检测,按照公式(1),计算每一个三级指标的数据质量分数 ;其次,计算三级指标平均值以得出各二级指标的数据质量分数 ,随后再次根据评估指标框架,按照公式(2),通过计算二级指标平均值得出一级指标的数据质量分数 ;最后按照公式(3)以及调研获得的一级指标权重,将一级指标分值通过加权平均,得出数据质量总体评分 。其中,数据质量各级指标及总体评分的满分均为100分,各一级指标数据质量分数的权重之和为1,权重的设置可以根据对一定数量的专家调研的结果进行计算平均值得出。通过此方式获得的一级指标权重具有一定的公允性,避免了人为因素的影响。详见分值计算公式:
式中:
j-代表第j个二级指标;
g-代表第g个三级指标;
i-代表第i个一级指标;
e-代表第j个二级指标下的三级指标总数;
m-代表第i个一级指标下的二级指标总数;
n-代表一级指标总数;
xi-代表第i个一级指标数据质量分数权重。
5.一级指标权重设置及计算
将一级指标的得分汇总为数据资产质量总分时,需要为6个一级指标设置权重,最终为了将质量作为一个调整系数应用到数据资产估值方法中去,需要将数据资产质量的三级和二级指标结果汇总到一级指标中,并将一级指标结果按照一定权重汇总为一个质量调整系数。为了达到此效果,需要对不同的一级指标设置权重。如果规范性设置20%权重,那么该20%权重设置的合理性比较难验证,对质量整体的影响比重是否真正是20%也很难量化,因此权重的设置须慎重考虑。
针对一级指标权重的设置更多依赖于专家经验,因此为了在一定程度上确保权重设置的合理性,需要通过调查问卷的方式,邀请至少10名甚至更多业内资深专家分别为指标设置权重,并计算出每一个指标的平均权重值,以此作为一级指标的权重进行使用。通过多人设置并计算平均值的方式可以最大限度地降低或者减少权重过度依赖某个或几个人的个人偏好,从而获得相对公允的权重,以避免权重倾斜。
研究过程中,本文通过问卷调研专家经验的方式形成调研问卷,并向DAMA中国区数据管理领域专业会员3000余人定向推广调研问题。
基于调研问卷的结果,对每一项调研获得一级指标的结果计算平均值,从而得到每一项一级指标公允权重。基于调研结果得到了数据资产质量一级指标权重平均值和各行业指标权重平均值可以作为实际计算过程中的专家建议以供参考。
对于一级指标权重的分配,调查报告显示,准确性、规范性、一致性和完整性被认为是最重要的4个指标,权重分别达到24%、20%、17%和17%。这一结果体现了这4个指标在数据资产质量评估中的核心地位,也反映了企业对这4个方面的关注度。此外,调查报告还显示,可访问性和时效性指标虽然同样重要,但相较于其他指标权重较低,不同行业权重占比也不同。
调查报告还显示,不同行业对一级指标的关注度不同,如金融行业对规范性、准确性指标的要求高于平均值。大数据行业对可访问性指标的要求高于平均值。IT行业对完整性指标的要求高于平均值。
1.数据资产价值评估方法
目前,正在发布流程中的《信息技术 大数据 数据资产评估》[5]定义了数据资产价值评估可以使用的收益法、成本法、市场法3种数据资产价值评估的方法。但是,这3种方法中都存在一定程度的评估合理性问题。因此,本研究为了增加评估的合理性,对3种方法的问题进行了分析,并提出将数据资产质量调整系数融入3种评估方法中。
在收益法的计算公式中并未引入质量调整系数,质量要素对收益法的估值结果未能产生影响。质量要素对数据资产价值具有重要影响已成共识,如在评估方法中缺失,易降低评估结果的准确性。
成本法在针对贬值率计算方法中的专家评价方法中提及需要考虑数据资产质量、数据应用价值和数据实现风险等贬值因素,但在其计算公式中并未引入质量调整系数,而质量要素对成本法中的贬值率具有一定的影响,进而会对利用成本法进行的数据资产估值结果产生一定的影响。因此,质量要素在评估方法中的缺失易影响评估结果的准确性。
市场法包括质量调整系数,且给出了质量调整系数的计算公式。与收益法和成本法相比,市场法在引入质量要素方面具有一定的先进性和完整性。但是,市场法在定义质量调整系数时,引入了参照数据资源集的数据质量评估结果参数,由于数据内容具有行业性和多样性,又会使参照对象只能选择相似或近似的数据资源集,而相似和近似的程度依赖所选择主体与评估对象主体的业务相似性。另外,即使选择了合适的参照数据资源集也不会改变这种状况,因为参照数据资源集的质量在很大程度上还依赖其所属主体在质量管理和数据治理方面工作的成效。
由此可见,参照数据资源集的质量结果受制于诸多因素影响,具有不稳定性、不确定性、无法验证性。这些特性在一定程度上会影响市场法中质量调整系数的准确性,进而影响数据资产价值评估最终结果的准确性。
2.数据资产质量调整系数的引入
当前,收益法、成本法、市场法中,仅市场法的公式包含了质量调整系数,而收益法和成本法均未考虑质量调整系数的因素。此外,市场法公式中的质量调整系数计算公式受限于对标数据集质量的参考,导致其在实际操作中执行困难。
因此,为了人们能更好地应用数据资产质量评估结果,数据质量调整系数应当被纳入数据资产估值的计算过程。这有助于提高数据资产价值评估的准确性和可靠性,进而为决策者提供更为有效的信息支持。
可采用收益法、成本法和市场法3种基本方法完成数据资产价值评估。
收益法引入质量调整系数:
式中,Q表示评估对象的数据质量调整系数资产。
成本法引入质量调整系数:
在贬值率计算公式汇总引入质量调整系数会影响贬值率。
市场法引入质量调整系数:
数据资产质量评估是企业数据资产参与流通交易的必要环节,数据资产质量的好坏直接影响数据资产的价值。通过质量评估,企业可以更好地了解自身数据资产质量情况,分析数据资产质量问题,逐步优化数据资产质量,提升数据资产价值。
为了验证本研究提出的数据资产质量评估方法及工具的实践可行性,本文选择交通行业国内某大型企业A作为数据资产评估试点。根据企业A已完成的数据资产登记信息,参考质量评估相关标准,结合数据交易所和参评方需求,以指导数据资产估值定价为目标,形成了数据资产质量评估方案,完成企业A包含260亿数据的数据表的数据资产质量评估工作,并发布数据资产质量评估报告,为企业A提升数据资产价值奠定了基础。
数据资产质量评估过程主要分为前期准备、评估实施、文本撰写和结果评审4个阶段。在前期准备阶段,研究调研参评方的基本情况、数据资源情况、数据来源情况、数据安全情况。在评估实施阶段,结合数据资产质量评估方法和工具对目标评估范围进行了评估。评估方根据评估结果详细计算了数据资产质量分数,并编制了数据资产质量评估报告,内容涵盖参评方、参评范围、评估方法、评估指标以及得分计算方法、评估过程、评估结果等。经评估,数据资产质量评估平均得分为79分,各一级指标得分:规范性是80分、准确性是69分、完整性是72分、一致性是91分、时效性是83分、可访问性是79分。在结果评审阶段,数据资产质量评估报告经参评方确认后,提交至数据交易服务机构进行评审。评审过程严格遵循相关规定和标准,只有通过评审的数据资产质量评估报告才能进行备案及发布,这一环节可确保评估结果的准确性和公正性,使数据资产评估结果更加客观、有效。
1.完善数据资产登记信息
数据资产质量评估结果可以作为补充信息,对数据资产登记信息进行更新和完善。这有助于使登记信息更为全面,并将评估过程中发现的问题与数据资产登记信息中的数据项进行关联。如此一来,评估结果和数据质量的整体状况能够得到充分反映,进而协助被评估方更好地了解和运用相关数据资产。
2.支撑数据资产价值评估
数据资产质量对数据资产价值具有显著影响,而数据资产质量评估结果可以作为数据资产价值评估的参考依据或调节参数。基于可供价值评估使用的质量要素,可采用收益法、成本法和市场法3种基本方法及其衍生方法来完成数据资产价值的评估。
3.提升数据资产质量
通过质量评估,被评估方可以更好地了解自身数据资产质量情况,分析数据资产质量问题,逐步提升、优化数据资产质量。高质量数据资产有助于增强业务决策的可信度,提升业务流程效率,降低企业运营风险及成本,同时还可以提升客户满意度,促进创新能力,增强企业竞争优势。
本文通过前期大量资料分析和调研分析,提出了创新性数据资产质量评估方法,设计了相应的评估模型与指标体系。同时,建立了全方位的管理体系与针对性的质量管理方案,以支持企业实施全方位的数据资产质量管理;设计了一套支持质量管理全流程的工具体系,包括质量检核框架和质量评估框架;通过应用案例验证了质量评估方法和管理框架在实际应用中的成效。这些成果有助于保障数据资产质量的稳定,促进数据交易的公平公正,推动数据要素市场的健康良性发展。