儿童用品化学安全知识图谱构建与应用分析

2024-07-04 17:33冀晓东孙高岭涂新雨郑怀城许应成
标准科学 2024年6期
关键词:决策支持儿童用品知识图谱

冀晓东 孙高岭 涂新雨 郑怀城 许应成

摘 要:为防范儿童用品化学危害可能造成的严重后果,有效支持儿童用品源头治理和过程控制,保障儿童用品安全,本文提出了儿童用品化学安全知识图谱构建框架,根据儿童用品化学危害召回数据,儿童用品化学安全标准文本数据特征和结构化程度,结合UIE模型和基于规则的方法对儿童用品召回数据和安全标准进行知识抽取,通过知识融合构建知识图谱。基于构建的知识图谱清晰分析了儿童用品的安全隐患、化学危害的识别和控制、质量安全监管决策支持。儿童用品化学安全知识图谱可以为儿童用品的生产制造和质量监管提供支持,降低儿童接触有害化学物质的风险,保障儿童健康安全。

关键词:化学安全,儿童用品,知识图谱,决策支持

DOI编码:10.3969/j.issn.1674-5698.2024.06.005

儿童是国家的未来、民族的希望,儿童用品的质量安全关系到儿童的身心健康和社会安定和谐。根据2021年第七次全国人口普查结果,我国14岁以下人口为2.53亿人,占全国总人口的17.95%。中国儿童产业中心公布调查数据显示,我国8 0%的家庭中儿童支出占家庭支出的30%~50%,家庭儿童年平均消费为1.7万~2.55万元。2018年10月30日,市场监管总局、教育部、工业和信息化部发布了《关于进一步加强儿童用品质量安全监管工作的通知》,强调要加强对儿童用品化学品和有关原辅料的质量监督检查,并将儿童用品纳入各地重点监管目录,加大对儿童用品的监管力度。国务院发布《中国儿童发展纲要(2021-2030)》中提出要持续开展儿童用品质量安全守护行动,加强对产品造成儿童伤害的信息监测、分析、监督检查和缺陷产品召回工作,杜绝“毒跑道”“毒校服”等事件。确保儿童用品质量安全可靠,让消费者放心消费,才能不断释放儿童消费市场潜力,促进和扩大消费,也是全面落实质量强国战略的迫切要求。

我国不仅是儿童用品的消费大国,也是其出口大国,儿童用品种类繁多。但儿童用品生产企业门槛相对较低,对标准中的各指标了解不深入,缺乏必要的质量管理措施和检验手段,产品质量难以保证[1]。根据近年来国内和欧美市场儿童用品召回信息统计,化学危害是导致儿童用品召回的主要原因之一[2 ,3]。儿童用品化学危害是指儿童用品含有的有害化学物质可能对儿童健康产生的危害,主要通过吸入、皮肤接触摄入或非饮食经口摄入等方式进入人体,造成过敏、特定器官损害、生殖毒性、致癌性等其他伤害[4]。相较于机械危害等,化学危害表现出更加隐蔽且长期的伤害特性,且影响因素复杂多样,包括暴露时间、化学物质的性质及其浓度等,伤害原因追溯较为复杂和困难。因此,源头控制对于有效预防化学物质的危害,保障儿童用品的安全尤为关键。由于儿童用品种类繁多,可能包含的有害化学物质范围广泛,且不同有害化学物质限量要求往往来源于不同的标准文件,需要借助知识关联方法将分散的信息关联起来,以有效进行风险控制。

知识图谱是一种结构化的语义知识库,将知识以“实体—关系—实体”的形式进行描述[5],能够清晰展示事物之间的关联关系,近年来得到学术界和工业界的广泛关注[6-10]。相关学者将知识图谱技术应用于领域知识的关联分析,Ding等[11]基于深度学习方法构建了产品制造过程的知识图谱,可以快速准确地为需求者提供制造知识。葛睿夫等[12]提出了基于深度学习的面向注塑产品缺陷的知识图谱构建方法,服务于智能制造。Zhong等[13]提供了一种基于消费者需求获取设计知识的方法,以促进产品设计创新,提升企业核心竞争力。部分学者将知识图谱技术用于风险控制研究,为智能决策提供支持,袁刚等[14]基于深度学习构建了食品安全风险知识图谱,为明确食品安全风险因素之间关联关系奠定技术基础。Janani等[15]构建了儿童用品中香料化学物质的图谱,描述其化学结构、儿童产品来源、化学来源和气味特征等,以便为儿童提供更安全的产品。赵敏等[16]构建了化妆品风险物质知识图谱,为化妆品风险物质监管工作提供数据基础与决策参考。上述知识图谱构建过程为儿童用品化学危害控制研究提供了重要的方法参考和范例。

综上,本文通过收集儿童用品化学危害召回数据和质量安全标准文件,基于儿童用品化学安全知识需求,定义实体类别、关系和属性,结合本领域文本特点,分别采用UIE模型和基于规则的方法进行知识抽取,通过知识融合建立儿童用品化学安全知识关联关系,构建儿童用品化学安全知识图谱,以显式化不同儿童用品、有害化学物质、可能产生的危害及其相关标准之间的复杂关联关系,为企业在儿童用品设计和生产过程中提供风险预警,辅助儿童用品质量监管,为保护儿童健康提供强有力的技术支撑和决策依据。

1 儿童用品化学安全知识图谱构建

1.1 知识图谱构建框架

知识图谱是由实体、关系和属性组成,用于描述知识之间的语义关联关系。儿童用品化学危害控制知识图谱构建的关键技术环节主要包括数据收集和预处理、知识抽取、知识融合和知识存储。针对儿童用品召回数据和安全标准文本特征,分别采用不同的路径和方法进行知识抽取,进一步通过知识融合消除冗余信息,完成儿童用品化学危害知识图谱的构建。儿童用品化学安全知识图谱构建框架如图1所示。

1.2 儿童用品化学安全知识图谱构建方法

基于儿童用品化学安全知识图谱构建框架,对儿童用品化学危害召回数据和安全标准进行数据收集和预处理,根据文本特征抽取出儿童用品化学危害信息和化学物质限量要求信息,建立化学危害信息与儿童用品安全标准中的有害化学物质限量要求的关联关系,完成儿童用品化学安全知识图谱的构建。

(1)数据收集与预处理

儿童用品化学安全知识抽取的数据集主要包括两部分,分别是儿童用品化学危害召回数据和儿童用品安全标准。其中,儿童用品化学危害召回数据主要来源于中国产品安全与召回信息网,选取产品类别为儿童用品,时间为20 08年7月至2024年1月,共爬取1304条数据,并进一步过滤出由于化学危害导致儿童用品召回的数据,作为儿童用品化学危害数据集,示例见表1。

儿童用品安全标准主要来源于全国标准信息公共服务平台,过滤出包含不同儿童用品各项化学物质的限量要求的标准文件,共获取标准17份。将获取的PDF标准文件转换为可编辑处理的word文件,其中,不同儿童用品各项化学物质的限量要求在标准中都是以表格形式存在,示例见表2。

(2)基于UIE的儿童用品化学危害知识抽取

由于儿童用品化学危害召回数据具有复杂的语义关联关系,UIE模型可以实现实体关系的联合抽取,并可以通过小样本微调快速提升模型知识抽取性能,具有较好的泛化能力,适用于儿童用品化学危害召回数据的知识抽取。基于儿童用品化学危害召回数据的内容特点,结合儿童用品化学危害控制知识需求,定义实体和关系类别,其中,实体类别包括儿童用品、产品部件、化学危害、化学物质、安全隐患和标准号,关系类别包括包含、存在、涉及、限量要求、造成、来源于,实体类别与关系之间的对应关联关系见表3。

基于定义的实体关系类别,将经过预处理的儿童用品化学危害召回数据以txt文本格式存储,导入文本标注工具doccano进行实体关系标注。采用PaddleNLP开源的基于ERNIE-3.0的中文通用信息抽取(universal information extraction,UIE)模型[17 ]作为基准模型。UIE模型充分利用了预训练语言模型的语义表示能力,借助Prompt将不同的信息抽取任务统一为文本到文本的生成问题,由此,UI E模型可以有效的学习和适应少量标注数据甚至零样本情况下的信息抽取任务,在实体抽取、关系抽取等任务上表现出较好的性能,UIE框架如图2所示。

对于模型超参数的设置,本文选择采用Adam优化器[18]对参数自适应调整;采用网格搜索对模型进行超参数调优,不同参数设置下loss值变化情况如图3所示。

由此得出3 个模型的超参数设置,学习率为3e-5,批处理大小batch_size为16,最大句子长度为512,训练批次epoch为30。模型实验效果评价采用常用的知识抽取评价指标,包括精确度、召回率和F1值[19],分别对零样本和小样本下UIE模型的知识抽取效果进行评价,两种情况下模型表现效果见表4。

从模型评价结果可以得出,在零样本情况下,UIE模型在儿童用品化学危害召回数据集上的F 1值为0.784,说明UIE模型具有较强的泛化能力,在没有针对特定任务的训练数据的情况下,也能表现出较好的适应能力;在对UIE模型增加训练数据后,模型效果F1值提升为0.965,模型效果有了显著提升,说明UIE模型可以基于小样本学习快速适配儿童用品化学危害知识抽取任务。

(3)基于规则的化学物质限量要求知识抽取

由于儿童用品安全标准中化学物质限量要求均以表格形式存储,表格数据属于结构化程度较高的数据类型,可以采用基于规则的方法实现表格知识抽取。对于表格知识抽取主要包含以下两个步骤。

1)表格标准化处理:通过合并和拆分单元格,对表格数据进行重组,确保表格的行列遵循一致的逻辑,将表格转换为易于解析的标准格式;

2)基于规则的知识抽取:对标准化处理后的表格进行分类,依据表格中行列的逻辑和语义关系,确定实体、关系和属性,导出三或多元组。结合表2内容,对其进行表格标准化处理,并采用基于规则的方法进行知识抽取,抽取结果以三或多元组进行表示,示例见表5。

通过将以表格形式存在的儿童用品化学元素限量要求知识转化为三或多元组,可以建立不同类型儿童用品与对应化学要素限量要求和来源标准之间的关联关系。

(4)知识融合

由于儿童用品化学危害召回数据中对于儿童用品名称、化学危害、标准号等的描述存在相同含义不同表述的情况,例如:童鞋、儿童鞋,甲醛含量超标、甲醛含量过高,甲醛项目不符合国家标准要求等,知识融合的任务是需要将同一含义的不同表述进行合并,消除冗余信息。实体之间的语义相似性是知识融合的依据,本文采用基于BERT模型[20]计算词向量,借助余弦相似度获取实体之间的相似程度,余弦相似度计算公式如下。

将计算所得的实体之间相似度阈值设置为0.85,过滤出具有高相似度的实体列表,依据儿童用品化学安全标准中所规定的术语和适用范围中涉及到的儿童用品名称,将相同或相近语义的实体进行统一,部分实体融合后的结果见表6。示例1借助标准术语对实体的不同表述进行统一;示例2整合了相同含义的不同表述,示例3纠正了实体抽取中存在的错误。

(5)图谱存储

为准确和清晰地表示儿童用品或产品部件中化学物质的限量要求以及知识来源,将化学物质限量值和来源标准作为关系“限量要求”的属性存储,确保儿童用品或产品部件与对应化学物质的限量要求只有唯一限量值和标准来源。通过知识融合和相同实体合并,建立儿童用品化学危害知识和儿童用品化学元素限量要求知识关联,采用Neo4j对儿童用品化学安全知识图谱进行存储和可视化。

2 知识图谱应用分析

对构建的儿童用品化学安全知识图谱进行有效分析和利用,可以为儿童用品设计制造和质量监管提供决策参考。在儿童用品设计制造过程中,基于知识图谱可以获取化学物质超标存在的安全隐患和化学物质在标准中的限量要求,为产品设计和制造过程中的材料选择和工艺调整提供支持,实现化学危害源头控制;同时,知识图谱中所包含的化学危害信息有助于监管部门更快速地识别潜在的风险,更精确地进行风险评估和管理,通过知识图谱可以快速获取对应化学物质的标准限量要求,提升监管效率和有效性,实现对儿童用品化学危害的有效控制,确保儿童用品安全可靠。

2.1 基于化学物质的儿童用品安全隐患分析

基于知识图谱可以清晰展示化学物质可能产生的化学危害,进而关联到造成影响的儿童用品类别、产品部件和存在的安全隐患,由此,可以基于化学物质进行儿童用品安全隐患分析。儿童用品化学危害控制知识图谱中包含化学物质20种,涉及化学危害频次较高的化学物质有邻苯二甲酸酯和甲醛等,在总召回数据中占比分别为39.8%和17.2%。其中,由甲醛造成的化学危害具有涉及儿童用品类别广泛、化学危害存在的状态不同、存在的安全隐患较大等特征。其中,不同化学危害状态包括甲醛含量超标、甲醛释放量超标、游离甲醛含量超标。甲醛含量超标是潜在的;甲醛释放量超标直接关联到室内空气质量;游离甲醛超标是实际可能被人体吸收,并对健康构成直接威胁;涉及的儿童用品类别包括童鞋、童装、玩具、课桌等;甲醛超标造成的安全隐患包括致癌、头痛、喉咙灼烧感、呼吸困难,触发或加重哮喘症状、导致严重的健康问题甚至死亡,具体如图4所示。

基于化学物质进行儿童用品安全隐患分析,可以帮助消费者识别化学物质可能存在的不同化学危害状态,明确有害化学物质的暴露途径,进而规避存在化学危害安全隐患的儿童用品;在儿童用品设计制造过程中,对于化学物质的不同化学危害存在状态,在质量控制时采取针对性的控制策略,消除儿童用品化学危害安全隐患;对于儿童用品质量监管,基于知识图谱可以快速获取关键化学危害可能波及的儿童用品类别,进行优先和重点质量检查,避免存在化学危害安全隐患的儿童用品流入市场,影响儿童健康安全。

2.2 儿童用品化学危害识别和控制

基于知识图谱可以清晰展示召回数据中的儿童用品及其产品部件存在的化学危害、涉及的化学物质和造成的安全隐患,由此,可以实现基于儿童用品的化学危害识别,儿童用品化学危害控制知识图谱共包含儿童用品实体239个,涉及儿童用品类别较多,其中,童鞋、童装、儿童玩具和儿童车是召回频次较高的儿童用品类别。童鞋是由于化学危害召回中频次最高的儿童用品类别,涉及化学危害类别较多,包括甲醛含量超标、邻苯二甲酸酯含量超标、重金属铅和镉超标。其中,帮面材料和外底主要涉及邻苯二甲酸酯含量超标、重金属铅和镉超标,鞋垫涉及甲醛含量超标;由于涉及多种化学危害,可能存在的安全隐患较为复杂,需要进行重点关注和质量把控,如图5所示。

通过识别儿童用品可能存在的化学危害,可以为儿童用品设计和制造过程提供决策依据。基于儿童用品中各产品部件或材料可能存在的化学危害数据,为儿童用品设计和制造过程中的各产品部件的材料选择、测试检验和质量把控提供参考,辅助儿童用品源头质量控制;同时,可以识别儿童用品或产品部件存在的化学危害可能造成的安全隐患的严重程度等,获取儿童用品监管重点和优先监管对象,实施精准防范,确保儿童用品的化学安全性。

2.3 儿童用品质量安全监管决策支持

基于儿童用品化学安全知识图谱,可以快速匹配儿童用品对应化学物质的标准限量值要求。儿童用品化学安全标准知识是儿童用品生产和质量监管的重要依据,基于知识图谱对儿童用品化学物质限量要求进行知识组织可以清晰展示限量要求的指标关联关系。将化学物质限量要求和来源标准作为儿童用品或产品部件对应化学物质之间关系的属性值,可以实现限量值和标准来源的唯一对应从而清晰描述儿童用品涉及的化学危害、可能存在的安全隐患、对应化学物质的限量要求,形成儿童用品化学安全知识链路。图6展示了儿童家具中各产品部件对用有害化学物质的限量要求,可为有害化学物质限量控制提供参考,并可以直接追溯化学物质限量要求来源标准。

基于知识图谱可以快速获取儿童用品对应化学物质限量要求,为儿童用品质量监管提供监管依据;通过整合儿童用品化学危害知识和化学物质限量要求知识,辅助质量监管人员更全面地了解儿童用品的化学安全性,更有效地进行风险评估和决策制定,提升儿童用品质量监管效率,确保儿童用品安全。

3 结 论

本文基于儿童用品化学安全需求,通过收集儿童用品化学危害召回数据和安全标准,结合不同文本特征设计知识抽取方法,构建了儿童用品化学安全知识图谱,得到以下结论。

(1)提出了儿童用品化学安全知识图谱构建方法。通过训练和优化UIE模型对儿童用品召回数据进行知识抽取,采用基于规则的方式对化学物质限量要求表格数据进行知识抽取,并通过知识融合建立两者语义关联,构建了儿童用品化学安全知识图谱。

(2)基于儿童用品化学安全知识图谱,可以实现基于儿童用品、化学物质查询化学危害信息和化学物质标准限量要求,清晰展示儿童用品、产品部件、化学危害、安全隐患、化学物质、限量要求之间的关联关系。基于知识图谱可以为产品设计和制造过程中的材料选择和工艺调整提供支持,实现源头控制;同时可以辅助监管部门更快速地识别潜在风险,提升监管效率和有效性,实现对儿童用品化学危害的有效控制,确保儿童用品安全可靠。

(3)基于本研究所提出的儿童用品化学安全知识图谱构建方法,下一步研究可以综合考虑进出口儿童用品化学安全知识,融入不同国家和地区对于儿童用品化学安全的要求和规范,为我国儿童用品相关政策和标准的制定提供参考。

猜你喜欢
决策支持儿童用品知识图谱
海关总署公布前5月进口儿童用品不合格情况:涉及乐高等品牌
我国将加快制修订儿童用品、玩具等一批强制性国家标准
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
商业智能分析模式在医保病人住院化管理当中的应用研究
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
秦山核电应急决策支持系统开发与研究
基于RFID的汽车零件销售策略支持模型