王 昕等王 宏周育忠利国鹏甘克勤
(1.南方电网科学研究院,广东广州 510080;2.中国标准化研究院,北京 100191)
标准指标比对的方法与实践
王 昕等1王 宏1周育忠1利国鹏1甘克勤2
(1.南方电网科学研究院,广东广州 510080;2.中国标准化研究院,北京 100191)
总结了国外标准“国际化”和国内标准“走出去”的现状。重点考察“标准比对”的研究成果,基于语义网的理论,研究一种标准指标比对的方法,以“产品—体例—指标”三元组的方式将标准文献碎片化,对细粒度的指标碎片进行知识化组织,最终形成“标准指标比对”的应用系统并应用于电力行业。
语义网;标准比对;标准指标比对;电力行业
标准是为了在一定范围内获得最佳秩序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范性文件[1]。在标准中,尤其在数量众多的产品标准中,具体“指标”的描述和量值高低往往最能体现标准协商一致的特点,也是作为规范性文件最为核心的内容,直接体现产品的质量水平。
在涉外贸易中,标准的指标作为质量的直接体现越来越受到重视,标准比对工作逐步兴起。本文应用语义网的数据描述思想,建立适用于标准指标的RDF资源描述框架,形成以“产品—体例—指标”三元组的方式将标准文献碎片化,对细粒度的指标碎片进行知识重组,形成“标准指标比对应用系统”。最后,通过在电力行业的应用,直观地展现指标比对系统对业务问题的支撑效果。
(1)国外标准化工作现状
为应对国际市场的变化,提升企业实力,欧洲、美国、日本、韩国等政府采用多项措施推动本国标准“走出去”。欧洲等发达国家通过与国际标准化组织签署实施《维也纳协议》,使欧洲标准可以通过快速程序成为国际标准,确保欧洲在国际标准化组织中的地位和影响力。同时,通过鼓励企业直接制定国际标准,保持在国际标准化领域的话语权。美国协同组织社会标准化组织,保证在国际标准化活动中以一种声音代表美国,如美国试验与材料协会(ASTM)、美国电气电子工程师协会(IEEE)等发布的标准。日本政府建立了标准化高层协调机制,成立标准化事务战略本部,促进企业重视国际标准化工作。韩国成立了国家标准理事会,审查和协调与标准有关的重大事项,鼓励更多的人员参与国际标准化活动。
(2)国内标准比对工作现状
我国标准与发达国家标准存在很大差异,我国产品被发达国家召回或其他安全措施的情况正迅猛增加,仅2008年美国产品安全委员会(CPSC)就发动涉及中国(包括香港和台湾地区)生产的产品召回次数246次,占该年度总召回次数的63.7%[2]。自2015年以来,国务院印发《深化标准化工作改革方案》,以更好地发挥标准化在推进国家治理体系和治理能力现代化中的基础性、战略性作用[3]。推进“一带一路”建设工作领导小组办公室已发布《标准联通“一带一路”行动计划(2015—2017)》,将加快制定和实施中国标准“走出去”工作专项规划[4],标准化工作受到高度重视,“一带一路、标准先行”已经成为标准化工作者的共识和责任。从知网中检索篇名含“标准比对”的期刊论文,截至2015年,检索结果为328篇。在2000年以前,“标准比对”更多的是关于标准物质的比对,如:早在1979年,沈梓龙在《核化学与放射化学》中发表题为《~(60)Co标准溶液的国内外比对》的论文[5];在20世纪80年代和90年代,我国的“标准比对”论文主要针对电力、原子能、地质、光学、气象等行业的基础标准物质进行比对,体现出标准物质作为学科发展的基础性意义。2003年杨博辉等[6]首次针对标准文献开展比对研究;2004年丛佩华等[7]将“标准比对”研究开始从标准物质比对为主的学科基础演变为标准文献内容指标比对为主的质量基础,从而相关的论文数量呈现爆发趋势,如图1所示。
图1 “标准比对”相关论文发表数量变化趋势
随着研究的深人,人们不再满足于某个产品或领域的小范围标准比对,开始提炼标准比对的通用技术,力图覆盖全行业或重点行业,如:王益谊等[8]、蔡华利等[9]、计雄飞[10]等均着眼于“标准比对”的通用技术。
标准文献碎片化方法借鉴资源描述框架RDF(Resource Description Framework)三元组的资源描述方法[11],建立“产品—体例—指标”的资源描述框架。RDF将元数据描述成为数据模型:一个RDF文件包含多个资源描述,一个资源描述是由多个语句构成,一个语句是由资源、属性类型、属性值构成的三元组,分别对应自然语言中的主语、谓语和宾语。在标准文献碎片化的“产品—体例—揭示内容”的资源描述框架中,产品主要归纳本标准描述的标准化对象,体例则归纳同类标准(卫生、基础、管理、方法、安全、环保等)的体例结构,指标内容则为描述该产品对应体例的指标内容描述(包括指标的名称、量值、单位、范围、限定类等),分别对应标准文献内容的主语、谓语、宾语。
从标准比对的需求出发,“产品”的比对往往是一个产品族的比对,如“变压器”的概念就包括“自耦变压器”“恒压变压器”“增压变压器”等,针对“变压器”的标准比对需要包括所有“变压器”的下层标准,为实现这一需求,就要对文献碎片进行知识化重组。文献碎片的知识重组主要是针对“产品”的概念进行知识组织,通过上下位以及同义词的归纳组织,描述客观事物的关系。
“体例”是文献碎片知识重组的另一个维度,作为技术类规范性文件,标准的编写不仅要遵循GB/T 1.1-2009《标准化工作导则 第1部分:标准的结构和编写》[12],按照一定的体例结构编写标准,而且要遵循GB/T 13016-2009《标准体系表编制原则和要求》[13],按照一定的原则和要求,构建标准体系。标准文献具有书写规范、成体系的特性,因此,“体例”是“指标”最好的归纳方法。同时,由于不同标准“体例”写法的差异性,“体例”同样需要做同义词的归纳重组(如“范围”与“适用范围”的归一化等)。
“指标”是文献碎片的最小粒度,为了使单一的指标具有可比性,需要针对“指标”的名称和单位进行归纳重组(如m3与立方米的归一化等)。
标准比对一般分为两种方式:一是基于标准的比对(两个或者两组标准比对),二是基于“产品”的比对(跨标准比对)。基于标准的比对主要依托标准的体例,将相同体例进行对比阅读,基于“产品”的比对则是基于“产品—体例—指标”的三元组,全面比对同一“产品”在不同标准中规定的差异(国家标准与行业标准的差异或者国内标准与国外标准的差异)。
(1)硬件拓扑
硬件服务器拓扑包括3台服务器:数据库服务器部署SQLServer数据库、加工系统服务器部署标准指标加工系统、应用系统服务器部署标准指标比对的应用系统。普通用户与专家分别通过终端电脑,以B/S方式使用标准指标比对的服务与标准指标加工的服务,硬件拓扑如图2所示。
(2)数据模型
数据模型基于传统的关系型数据库,设计重点主要是实现文献碎片化,即“产品—体例—指标”的三元组结构,同时考虑文献碎片知识重组,即上下位与同义词的结构,核心数据模型为“产品—体例—指标”的三元组,其中产品和体例均需要建立同义词和上下位的关系,指标包括:指标项、指标值、计量单位、限定类等,如图3所示。
(3)开发框架
系统开发基于.Net Framework的技术路线,选择了Dotnetnuke框架,底层数据库采用SQL Server,各项技术简述如下。
.Net Framework 4.0:.NET框架(.NET Framework)是由微软公司开发的软件开发平台,本系统选择该框架作为开发基础。
Dotnetnuke:DNN(Dotnetnuke应用框架的简称)是一个免费、开源、可扩展的内容管理系统,本系统采用该框架作为基础的内容管理系统与用户管理系统。
图2 硬件拓扑图
图3 数据模型
SQL Server 2012:SQL Server是微软公司推出的关系型数据库管理系统,具有使用方便、可伸缩性好及与相关软件集成程度高等优点,本系统采用该数据库实现数据存储与部分数据计算的功能。
(4)关键技术
由于表结构较为复杂,标准的指标数据较多,“标准比对”在多表连查的情况下难以做到页面的及时响应,为解决该问题,考虑“空间换时间”的手段,在数据库里增加定时任务,每晚将多表联合到一个视图里(该表可以冗余),支撑系统所有查表需求。视图联合了8个表,包括标准信息C_StandrdInfo、本体信息C_Vocabulary、体例信息C_StyleMetaData、一级揭示指标C_FirstReveal、指标信息C_Indicators、限定类信息C_Limit、揭示内容信息C_RevealContents以及方便检索的其他字段,实现了由“数据加工友好”的表格设计转向“检索服务友好”的视图设计,不仅简化了程序编写,更解决了页面及时响应的问题。经测试,计算度最复杂的简单检索的响应时间由约60秒减至1秒以内(根据不同检索条件略有不同)。
对于百余项电力行业标准,包括国家、行业、地方、企业标准,整理出“变压器”“开关设备”“输电线路”等本体概念共计400余个,最深层级为7级;“试验”“技术条件”“安装验收”等50余类体例结构,通过3个实例,阐述标准比对的具体方式。
(1)同一设备产品,不同等级标准间指标内容对比
对比相同本体的相同技术指标在国内标准和企业标准中的不同规定,比如高级检索在主题词中输人“换流变压器”查类,然后在指标中选择“测量与试验”,在其后的指标列表中,选择“绝缘油试验”和“油样试验与色谱分析”(两个指标均有涉及对绝缘油的击穿电压值的规定),如图4所示。
检索结果说明,同一指标在电力行业标准与企业标准的内容存在差异:绝缘油的击穿电压值的要求不同,电力行业标准《高压直流设备验收试验》(DL/T377-2010),并没有规定直流电压等级,而电力企业标准《±800kV 直流输电用换流变压器》(Q/CSG 11602—2007)适用于±800kV 等级设备,按照电压等级不同,绝缘油耐压水平设置不同。同时还可查看到存在“技术规范”内容编写不规范问题,“击穿电压≥70kV”没写明标准间隙,如图5和图6所示。
图4 换流变压器的指标比对入口
图5 换流变压器的指标比对结果页面
(2)一类设备产品的同一指标的不同要求
在电力行业,变压器属于一类设备,包括电力变压器、换流变压器、配电变压器等。由于标准指标比对针对产品进行了上下位的知识组织,因此可以快速获得一类产品中,不同产品的相同指标的规定,比如:高级检索在主题词中输人“变压器”查类(包含下层标准),指标栏输人“温升限制”,如图7所示。
结果说明,通过“含下层标准”检索,从不同标准中得到同属于变压器的电力变压器、换流变压器、配电变压等产品的“温升限值”的一组数据,如图8所示。
图6 换流变压器的指标比对结果详细页面
图7 变压器类设备的温升限值查询入口
(3)同一设备产品在生命周期中不同环节的同一指标的内容对比
变压器在工程建设和运行维护阶段的相同指标的规定可能不尽相同。本文选取变压器的一项指标(长时感应耐压局部放电的试验条件)进行内容比对。比如:高级检索,“变压器”查类,依次选择“特性—试验—交接试验—绕组连同套管的长时感应电压试验带局部放电测量”和“特性—反事故措施—损坏事故—防止变压器绝缘事故”,如图9所示。
从结果界面可以看出,变压器在工程建设(交接试验)阶段与运行维护(反事故技术措施)阶段的标准内容差异,如图10和图11所示。两者对长时感应耐压局部放电试验进行条件的规定不同,但对变压器现场进行长时感应耐压和局部放电有助于发现变压器内部绝缘缺陷,需要统一意见。
在国内电力行业的标准检索的各种实践中,本文所述的电力设备标准指标比对工作具有行业创新性,率先采用了以本体技术为依托的内容指标检索,具有全新的数据检索体验,取得了良好的实用效果反馈。
此外,在标准比对的通用方法落地到电力行业的实际使用的过程中,出现了新的需求,如开发指标加工系统以提高加工效率,丰富成果展现形式等。
标准指标比对的方法与系统在电力行业的应用,其实现效果具有以下创新点。
图8 变压器类设备温升限值查询结果
图9 变压器生命周期中不同环节的同一指标的内容对比入口
图10 变压器生命周期中不同环节的同一指标的内容对比结果
(1)展现一个产品的所有限定指标,即跨标准检索。通过实现电网设备标准对特定产品和标准化对象的各个方面特征属性所反映的技术指标的检索,为设备设计、采购、运行、试验、生产及销售等提供依据。
图11 变压器生命周期中不同环节的同一指标的内容对比详细结果
(2)展现不同标准对一个产品的限定指标,即标准指标对比分析。通过国标、行标、企标对特定产品的同一技术指标的不同要求的对比查询,为分析电网设备标准体系、应对行业技术壁垒问题提供参考信息。
(3)展示某类设备的所有限定指标,即产品和指标的聚类。实现电网设备标准中对某一类设备中技术指标的成组查询,满足用户对某一类设备的技术要求的检索。
(1)标准指标挖掘加工工具研究。目前的标准指标挖掘的加工基于excel和access等通用工具,人工的工作效率较低, 出错概率较高,后续需要研究并开发标准指标挖掘加工工具,整合本文所述的理论方法与数据模型。
(2)丰富成果展现形式。针对国内外标准比对的数据成果的形式和特征,研究更具友好性的图形化检索手段和具有智能服务的推理功能;研究标准技术指标检索移动服务模式,提供更多的应用场景。
[1]中华人民共和国国家质量监督检验检疫总局, 中国国家标准化管理委员会.GB/T 20000.1-2014 标准化工作指南第1部分: 标准化和相关活动的通用词汇[S]. 北京: 中国质检出版社, 2014.
[2]王赟松, 冯蕾.2008年中国出口产品召回情况分析及其对我国的启示[J].标准科学, 2009(5): 47-52.
[3]新华社.国务院印发《深化标准化工作改革方案》[EB/OL].[2015-03-26]. http://www.gov.cn/xinwen/2015-03/26/content_2838703.htm.
[4]新华社.我国发布《标准联通“一带一路”行动计划(2015-2017)》[EB/OL].[2015-10-22]. http://www.gov.cn/xinwen/2015-10/22/content_2952067.htm.
[5]沈梓龙. ~(60)Co标准溶液的国内外比对[J].核化学与放射化学, 1979(1): 101-102.
[6]杨博辉, 刘国财, 梁春年, 等.羊肉国内外质量标准比对研究[J].中国草食动物, 2003(5): 36-39.
[7]丛佩华.我国梨标准的比对分析[J].果农之友, 2004(4): 39-41.
[8]王益谊, 王丽君.”我国标准与国际国外先进标准比对分析及对策研究”课题推介[J].中国标准化, 2011(7): 79-81.
[9]蔡华利, 施慧斌.国内外标准法规比对分析系统设计与实现[J].微型机与应用, 2011(20): 77-80.
[10]计雄飞, 张宝林, 李抵非, 等.标准文献内容挖掘与比对[J].标准科学, 2012(8): 16-19.
[11]AMERLAND David. Google semantic search[M].程龚,译.北京: 人民邮电出版社, 2014: 6-7.
[12]中华人民共和国国家质量监督检验检疫总局, 中国国家标准化管理委员会.GB/T 1.1-2009 标准化工作导则第1部分: 标准的结构和编写[S].北京: 中国质检出版社, 2009.
[13]中华人民共和国国家质量监督检验检疫总局, 中国国家标准化管理委员会.GB/T 13016-2009 标准体系表编制原则和要求[S].北京: 中国质检出版社, 2009.
Method and Practice of Standard Criteria Comparison
WANG Xin1, WANG Hong1, ZHOU Yuzhong1,LI Guopeng1, GAN Keqin2
(1. Electric Power Research Institute, China Southern Power Gird, Guangzhou 510080; 2. China National Institute of Standardization, Beijing 100191)
This paper summarizes the present situation of the foreign standards “internationalization” and of the national standard of “going out”, focusing on the research achievements of “standards comparison”, study a method of standard index comparison, based on the theoretical foundation of the semantic web. And then this paper organizes the fi ne-grained index based on the knowledge-based organizations, by mean of “product-styleindicators” triple method to the standard literature. Finally, this paper forms the “standard index comparison”application system and applies on the electric power industry.
semantic web, standards comparison, electric power industry
G250.76
A
10.3772/j.issn.1674-1544.2017.04.014
王昕(1986—),女,南方电网科学研究院工程师,硕士,主要研究方向:企业标准化与技术情报;王宏(1989—),男,南方电网科学研究院工程师,硕士,主要研究方向:企业标准化与技术情报;周育忠(1974—),男,南方电网科学研究院高级工程师,本科,主要研究方向:企业标准化与技术情报;利国鹏(1989—),男,南方电网科学研究院工程师,本科,主要研究方向:电力标准化与技术情报;甘克勤(1983—),男,中国标准化研究院馆员,硕士,主要研究方向:标准化信息化(通讯作者)。
2016年12月29日。