马星晓 卢艳芳 王敬 孙晓立
摘 要:本文为改进标准有效性确认工作,调查分析了标准有效性确认工作的现状,为解决等同标准替代关系继承性、替代关系排序不准确、无法直接定位最新标准、大批量数据响应时间长等问题,重建了替代关系遍历机制和替代关系存储结构,为标准有效性确认结果完整、准确和大批量数据秒级响应提供了数据支撑。
关键词:标准有效性确认,替代关系,穿透性
DOI编码:10.3969/j.issn.1002-5944.2023.10.002
Penetrating Study of Multiple Substitution Relationships of Standards
MA Xingxiao1* LU Yanfang1 WANG Jing1 SUN Xiaoli2
(1.Hebei Institute of Standardization; 2. China Standardization Press)
Abstract: In order to improve standards, and the present situation of the investigation and analysis of the effectiveness standard confi rmation work, to solve the problems such as equivalent standard instead of inheritance, inaccurate alternative relations, indirect positioning of the latest standards, long response time of large quantities of data, this paper rebuilds the substitution relation traversal mechanism and substitutional relation storage structure, and provides data support for the completeness and accuracy of the validation results of the standard and the second-level response of mass data.
Keywords: standard validation, substitution relationships, penetration
0 引 言
标准时效性是标准文献与其他科技文献最重要的区别之一。标准时效性是指标准在特定时段的有效性,一般随标准制修订公告的发布而发生变化,如:废止、替代、局部修订、转化等。
在很多场景,如企业使用标准组织生产、检验机构按照标准从事检验、科研单位运用标准从事设计、研究、政府部门应用标准进行社会治理及监督检查时都将涉及标准的时效性,使用过时的标准,对生产产品的合格性、检验结果的准确性、监督检查的科学性等判定及设计研究项目都会产生重大影响,因此,标准的时效性至关重要。
目前,国内很多标准化研究机构,拥有大量的标准文献资源,皆已为标准化工作者提供标准时效性相关的服务,但此类服务常常存在一些问题,主要问题表现为:
a. 历次替代关系复杂的标准,时而会出现无响应或替代关系错误的问题;
b. 提交大批量数据(超过2000条)时响应时间长;
c. 无法快速、直接定位最新替代标准;
d. 标准复审涉及调整或确认有效时,替代关系显示不完整;
e. 标准替代关系显示顺序不按实际发生时间顺序显示。
1 现状分析
笔者查看了目前标准有效性确认服务的实现方式,结合问题进行分析,发现:
问题a、b、c是由于目前数据库只存储直接相关的替代关系,当标准存在历次替代时,查询机制会在数据库中进行实时遍历,直到找到最新的标准为止,当标准进行批量有效性查询时,需对每一个标准都进行实时遍历,故而会出现大批量查询速度慢的现象,此外,中间环节的缺失或瑕疵也易造成死循环或循环中断。
问题d是由于存储结构和查询程序未考虑调整标准和确认有效标准替代关系的继承性问题。
问题e是由于存储结构不包含排序字段,查询程序直接按遍历层次的先后顺序进行排序。
综上所述,笔者认为造成目前有效性确认服务问题的根本原因在于:标准替代关系的存储结构不合理和实时遍历的标准查询机制不适用。
2 研究目标
基于上述分析得出的结论,计划通过对现有标准替代关系的存储结构进行优化,解决问题a、c、d、e,实现以下目标:
——大批量数据查询稳定运行;
——可直接、准确地查询到标准最新替代标准;
——涉及到调整和再次确认有效的标准的替代关系可完整、准确顯示;
——替代关系按分支替代时间顺序正序显示。
通过取消实时遍历的标准查询机制,解决问题a、b,实现以下目标:
——大批量数据查询稳定运行、秒级响应。
3 研究方案
3.1 标准替代关系的存储结构优化
3.1.1 增加“历次替代”字段解决替代关系准确排序问题
(1)标准的历次替代情况
以标准文本为依据梳理出GB 14869-1994的替代情况,如图1所示。
(2)现有存储结构的替代关系存储
现有存储结构无排序字段,GB 14869-1994的替代关系存储如表1所示。
现有标准有效性确认报告是按生成报告时实时遍历替代关系的层级顺序排序的,如表2所示。该排序是按所有分支的分支层级排序而不是按各分支时间顺序排序,当历次替代版本较多时影响用户对版本变更情况的理解。
(3)优化存储结构后的替代关系存储
优化后的存储结构增加了“历次替代”字段作为排序字段,该字段是以“查询标准”为初始节点,以“替代标准”为终止节点的所在分支的历次替代版本发布情况,GB 14869-1994的替代关系存储如表3所示。
表4为优化存储结构后的有效性确认报告,表4中的排序清晰地展示了GB 14868-1994的4个替代分支和各分支的版本变更,更方便用户理解历次替代版本的变迁。
3.1.2 增加“查询标准”字段可直接读取替代关系
“查询标准”为用户提交的标准清单中的标准号,是遍历关系中的初始标准号,也是所有“历次替代”字段中的首个标准号,如表3存储的是GB 14869-1994的所有直接替代关系,该表中所有“查询标准”字段值均为GB 14868-1994,用户可通过“查詢标准”字段直接定位该标准的所有直接替代关系,即可减少响应时间,又可以避免实时遍历出现死循环造成程序强退。
3.1.3 增加“是否最新”字段可直接定位最新替代标准
“是否最新”字段由“查询标准”“替代标准”“替代关系”3个字段通过固定的算法赋值,该字段可在众多的关联标准中直接定位“查询标准”的最新替代标准号。
如表4所示,GB 2763-2021是GB 14868-1994的最新替代标准。以DB13/T 1161.2-2009为例,如表5所示,DB13/T 1161.2-2009的最新标准为:DB13/T 5448.1~5448.14-2021。
3.1.4 重建替代关系遍历机制为新存储结构赋值
准确的遍历机制可解决替代关系的完整性缺失问题,解决该问题的关键在于解决等同标准号替代关系的继承问题,解决这个关键的关键是解决标准调整前有替代关系的情况,解决方案为增加被调整关系,把调整关系和被调整关系同时放入大池做遍历使得历次替代中出现调整关系和调整关系继承来的替代关系。
该方案的采用需解决的两个特殊情况:
(1)避免同一对标准的调整关系和被调整关系形成死循环,该问题已在遍历机制中解决;
(2)避免无需承担桥梁作用的被调整关系(即被调整关系是最终替代关系)的显示,该问题在“是否最新”赋值步骤中解决。
以QB/T 2784-2006为例比较,旧的遍历机制的结果如表6所示,新的遍历机制的结果如表7所示,表7不仅显示了QB/T 2784-2006的调整关系,还显示了它继承自它的调整前标准GB/T 13214-1991的替代关系,可为用户提供参考。
3.2 取消实时遍历保证大批量查询稳定迅速
取消标准有效性查询时的实时遍历,改为实时监控替代关系数据的增量更新,定时全量遍历为新的存储结构赋值,标准有效性查询时直接读取数据,从而保证大批量查询时系统的稳定性和秒级响应。
4 可行性验证
4.1 存储结构优化的影响
表8为随机抽取指定数量标准,在数据库分别使用新旧存储结构模拟有效性确认查询时,数据库的响应时间对比。由表8可知:数据量大小和替代关系复杂程度都无法影响新存储结构的优势。
4.2 实时遍历的影响
表9为随机抽取指定数量标准,在数据库使用新存储结构,分别采用非实时遍历和实时遍历模拟有效性确认查询时,数据库的响应时间对比。由表9可知,采用新的存储结构时,非实时遍历和实时遍历基本没什么区别。
4.3 验证结论
由上可知,不合理的标准替代关系的存储结构确实是现有标准有效性确认问题产生的主要原因,存储结构优化后,取消实时遍历虽然对响应时间的影响不太明显,但实时遍历会影响系统的稳定运行,故建议优化存储结构的同时,一并取消实时遍历。
5 项目实施技术路线
根据验证结论,项目可按图2所示技术路线实施。
6 结 语
该项目调查分析了标准有效性确认服务的现状,以解决现有服务存在的问题为切入点,优化了标准替代关系的存储结构,取消了实时遍历机制,重建了遍历机制为新存储结构赋值,经分类数据测试和历史有效性确认订单数据验证,取得了满意的结果。该研究不仅解决了现有工作中存在的问题,实现了等同标准替代关系的继承,保障了大批量数据查询稳定、秒级相应,还实现了最新标准穿透性直接定位的关键性突破,同时修改了排序方式提高了用户使用友好性,为标准有效性确认服务水平的提升提供了数据支撑。
作者简介
马星晓,通信作者,学士,工程师,研究方向为标准文献结构化。
卢艳芳,学士,工程师,研究方向为标准内容揭示与标准体系。
王敬,硕士,工程师,研究方向为标准评价与标准水平分析。
(责任编辑:张佩玉)