近些年来,中国电子技术标准化研究院一直在 研究标准数字化。我从三个方面进行说明,一是在 研究的过程中对标准数字化的理解;二是作为电子 信息领域标准化的比较权威的机构,在该领域进行 的标准数字化实践;三是在这项工作中遇到的一些 困难和瓶颈。
首先是对标准数字化的理解。标准数字化本身是 标准化工作数字化转型,这是一个不断迭代的过程, 需要在工作中不断地摸索。通过探索标准数字化如何 转型、转向什么程度、分几个阶段,大家的思路一直 在不断地迭代。在研究标准数字化转型的过程中,我 们发现标准数字化和机器可读标准之间的关系还不能 完全地画等号。有些标准可能天生就是可读的,比如 接口标准、数据字典标准等。这些标准天然具有机器 可读的属性,比如在写标准的时候就写成伪代码,或 是代码的形式,通过现有的新技术的加持,就可以实 现机器可读。但有些标准离机器可读的目标还需要很 大的努力,实践的可行性还需要探索,比如管理体系 的标准如何做到机器可读仍需进行研究。
2023年年初,我院在工信部科技司的指导下也 开展了主题为“标准数字化,助推新型工业化”的系 列调研活动,走访了中电标协等标准化协会,以及一 些工业集团和高技术企业,收集了关于标准数字化的 需求。通过调研发现,大家对标準数字化的理解及数 字化程度和共识方面还存在着一些差距,对标准数据 的价值挖掘还不够充分。比如,大型工业企业所开展 的标准数字化方面的研究以及应用工作,由于技术、 数据资源上的限制,对数据价值的挖掘还不够充分。另一方面是标准数字化应用模式多样化,各方都在探 索,因此产生了各种各样的应用模式。
因此,我们在基于标准数字化需求调研的基础 上,把标准数字化实践分成以下几个方面来开展工 作。一是公共服务平台的搭建。我们把4000多项国家 标准、3000多项电子行业标准做了全文结构化拆解, 并应用知识图谱、大语言模型、自然语言处理、大数 据技术等,实现了智能检索、智能问答和标准体系的 可视化。二是数据资源的积累。我们认为公共服务平 台最大的价值,就是在收集的数据上,所以标准数字 化最核心的工作是数据资源的积累。
此外,我们与WPS合作开发了智能编写工具,与 大数据公共服务平台相结合,除了把国家标准、行业 标准、地方标准、团体标准的格式集成到WPS以外, 还把数据和编写工具直接关联起来。比如,在写标准 的时候,编写工具的右侧栏可以显示相关的标准及图 片、表格、公式、术语和条款等;另外还有查新查重 工具,可以通过对比大数据平台的数据资源,对这个 标准的原创性进行打分。这两个工具很快会在工信领 域的标准化工作中进行推广和应用。
在开展标准数字化工作中,我们也遇到了一些困 难。一是标准数字化理论方面的研究,这一领域的理 论研究非常困难,形成路线方面也尚不明确。现在的 国际标准对标准数字化0~4级的分级仍然存在争议, 国内各个行业也未达成对标准数字化的共识。二是数 据资源的确权问题,包括知识产权问题如何解决。比 如是否可以免费向公众提供碎片化的数据服务、会不 会侵权、数据资源如何确权等问题尚未形成较好的解 决方案。三是生成式人工智能在生成标准的过程中的 应用,我们认为标准数字化本身要紧紧跟上技术潮 流,并把新的技术应用在标准数字化的工作中。我们 希望和各位同仁一起,把标准数字化工作向前推进!