徐清越, 左 敏*, 张青川, 何思宇
(1.北京工商大学计算机与信息工程学院,北京 100048;2.农产品质量安全追溯技术及应用国家工程实验室,北京 100048; 3.食品安全大数据技术北京市重点实验室,北京 100048)
郭承站[1]研究表明核安全是核能与核技术利用事业的生命线,是国家安全的重要组成部分,是指对核设施、核活动、核材料和放射性物质采取必要和充分的监控、保护、预防和缓解等安全措施,防止由于任何技术原因、人为原因或自然灾害造成事故,安全监管工作是非常重要且必须的,因此通过时空分布建模为监管人员的工作安排与调度提供依据是一个值得关注的问题。
在核技术利用设备安全使用上,文献[2]运用中子噪声分析技术,对核电站堆芯吊篮梁型震动特性进行研究,为堆芯吊篮早起故障诊断奠定基础,能够有效避免因异常振动而导致的事故。
在时空分布模型方面也有一定的研究。文献[3]利用时空数据模型实现矿山开采的动态监管。文献[4]提出了改进停车生成率模型与不同建设用地停车时间长度的分布特性结合,描述某一地区总的汽车停放时空分布特性。文献[5]基于时空数据库对船舶系统进行时空建模,便于船舶系统中的空间实体在数据存储分析层中进行表达和处理。文献[6]从出租车形式轨迹中提取优质客源信息与时空分布规律,为提高出租车运营效率提供科学依据。文献[7]针对水资源时空分布不均匀度的定量描述难点,基于云模型对水资源时空分布特征进行了定量研究。文献[8]对太阳辐射的时空分布差异进行了研究。文献[9]提出了考虑最优时滞因子的高速公路时空模型,解决了高速公路短时交通流预测问题。
但目前在核技术利用辐射安全监管方面没有建立时空分布模型,这使得监管效率与核利用安全得不到保障。根据监管相关属性与数据建立核安全监管时空分布模型。
徐志立[10]研究表明,进行监管效果定量评估时,需要从不同层面描述监管风险等级。因此建立核技术利用设备持有单位风险等级划分模型,可为监管工作的合理安排与有效进行提供依据,为核技术利用设备的安全使用提供保障。
为保障设备的安全使用,核安全监管单位会在一定期限内,对拥有核技术利用设备的单位进行检查,检查内容包括辐射安全防护设施与运行情况、管理制度、法规执行情况等。监管不到位可能会增加设备使用风险;过度监管可能会影响设备的使用;监管时间过于集中(或疏散)可能会让不正当使用设备的单位有可趁之机。
王湘艳等[11]研究表明,单一类型的评价指标受其他不确定性影响较大,需采用多角度的评价体系才能全面准确反映核安全监管的制约因素。因此,研究将围绕检查工作的时、空两大方面设立监管合理性评价指标,即时间均匀度、空间完成度,并按照风险等级的不同在指标计算中适当加入不同的权重,增加模型的复现性与合理性。
定义1检查发生年总天数Y是指检查发生的这一年的总天数。
定义2设G为核技术利用安全检查机构集合,G={G1,G2,…,Gm}。
定义3设C为检查发生年总检查工作集合,C={C1,C2,…,Ck},|C|=k指该年内检查工作总次数,检查单位Gi检查发生年总检查次数为|Ci|。
定义4设K为检查发生年每轮计算的检查实际发生日期,K={K1,K2,…,K|C|}。
定义5设S为检查发生年每轮计算的检查应发生日期,S={S1,S2,…,S|C|},设S0为每年的第一天,第j次检查的应发生日期为Sj,Sj=Sj-1+hi,hi为期望间隔。
定义6时间均匀度是指检查机构执行检查工作在时间维度上的均匀程度(即工作密集或稀疏程度)。若检查工作过于集中在某些时期,可能会影响设备的使用,或导致部分核技术利用单位只在这一时期做形式化安全工作,让检查工作形同虚设;若检查工作过于稀疏,即监管不到位,会大大增加核技术利用设备危险使用的可能性,造成严重的后果。时间均匀度的具体计算步骤如下。
(1) 计算检查机构Gi该年检查工作次数,最均匀的期望间隔:
(1)
(2) 计算检查实际该发生日期与实际发生日期的第j次单次偏差率fj,循环迭代|Ci|次,得到检查机构Gi在这一年中所有检查工作的偏差率:
(2)
(3) 计算检查机构Gi在检查发生年中|Ci|次检查工作的平均偏差率:
(3)
(4) 计算时间均匀度Ui,并将其的值映射为[0,1]上的数,表达检查均匀程度:
(4)
(5)
定义10检查工作完成情况是指检查机构Gi在该检查发生年中工作的完成情况,即Di中的工作覆盖率,可表示为
(6)
定义11空间完成度Fi是指检查机构执行检查工作完成情况与完成合理状况的综合考虑,并将其的值映射为[0,1]上的数,反映检查工作的完成程度与工作合理程度,为工作安排与调度提供依据,检查机构Gi的空间完成度表示为
(7)
现采用CNN对核技术利用设备持有单位风险等级分类预测。
CNN是一种自动特征学习与分类的方法,基本结构为输入层、若干卷积层(convolutional layer)、若干池化层(pooling layer,也称为取样层)、全连接层及输出层[12],优势在于通过权值共享使网络中可训练的参数变少,降低了网络模型的复杂度,减少过拟合,从而获得了更好的泛化能力,使得网络更易于训练[13],相比于浅层分类器,这种含有多层隐含节点的神经网络能够更好地构建数据模型[14]。
结合核技术利用设备持有单位许可证种类(生产、销售、使用)与范围(Ⅰ类放射源、Ⅱ类放射源、Ⅲ类放射源、Ⅳ类放射源、Ⅴ类放射源、Ⅰ类射线装置、Ⅱ类射线装置、Ⅲ类射线装置),核素种类、在用放射源总数及各类放射源数量、在用射线装置总数及各类射线装置数量等属性训练网络,使其根据输入属性自动分类输出单位对应风险等级(高、中、低3类输出结果),分别对应年应检查次数——3次、2次、1次,即对应风险权重分别为3、2、1。
因此定义输出结果为一个二元组Rout=,s为被检单位风险等级,p为该单位对应风险权重。
各核技术利用单位风险等级分类后,按照对应风险权重值带入空间完成度的计算,具体计算步骤如下。
设立以下规则:①当αj>βj时,δj=βj;②当αj<βj时,δj=αj-βj;③当αj=βj时,δj=αj=βj。因此,
(8)
(9)
(3)计算合理系数σ。
(10)
(4)计算空间完成度F权。
(11)
本模型为开创式模型,根据核安全监管特性建立适应模型,为安全检查工作的安排与调度提供直观可视化与指标可参考化的决策依据。实验数据来自环境保护部核与辐射安全中心,以山西省运城市环保局开发科2017年数据为例。
为了更好地证明模型的有效与合理性,实验将模型输出指标值与专家评定值进行比较,得出在何种综合值计算系数下,该检查单位综合值与专家评估值最为接近。
定义14设q为实际输入的指标值计算出的检查工作指标综合值,λ1、λ2为综合值计算权重系数。
根据专家意见,时间均匀度对于监管工作的有效进行起到更加重要的衡量作用,所以在计算综合指数时,应加大时间均匀度的比重。为了方便后期的比对与统一化管理,将综合值计算结果归一化为[0,1]之间的数。综上,综合值计算公式如式(12),实验结果如图1所示。
(12)
图1 综合值对比专家评定值Fig.1 Comparison of comprehensive value and expert rating
结果表明,在综合值的计算中,λ1的取值在0.6附近(λ2的值在0.4附近)时,计算结果与专家评定值更为接近。
表1 各系数与权重方案计算结果
图2 各系数与权重方案对比专家评估Fig.2 Comparison of the results of each program with the expert evaluation
获取多地区多时间段的数据,由检查管理部门进行手动标注,标注出该时间段内的检查工作的合理程度,标注完成的数据用来作为判断指标合理性与有效性的依据,数据与标注人员均来自环境保护部核与辐射安全中心。
设定一个标准来体现本研究评价指标和传统时空指标及管理部门原本使用的基础指标之间的性能差异,即评价指标将合理的检查工作和不合理的检查工作所映射的评价值的分离程度。将该标准设为分离度(separation),具体地说,设数据集内有n份已标注是否合理的检查工作,如C合理={C1,C2,…,Ci},C不合理={Ci+1,Ci+2,…,Cn},C=C合理∪C合理。使用各评价指标对每份工作进行评价值的计算,每种评价指标能够得到一组对应的评价值:
a合理={a1,a2,…,ai},a不合理={ai+1,ai+2,…,an}。
(13)
为防止实验的偶然性影响,进行多次实验,最后取分离度的平均值作为实验结果。实验结果如表2所示。
表2 指标分离度对比结果
由表2容易看出,传统的评价指标没有考虑到特殊领域的特性,评价起来比较单一和笼统,分离度普遍不高,不适合作为核安全监管工作的评价指标;环境保护部核与辐射安全中心原本使用的基础指标在分离度上稍有提升,但没有考虑到各核技术利用单位的差异性,无法实现精准管理,不利于核安全监管工作的开展。本研究提出的综合指标,在分离度上有很大的提高,说明该指标能够全面地表示出监管工作现在的进行状况,能够准确地反映工作安排的时空性问题,能够帮助核安全监管工作的安排与实时调整,实现有效的量化管理。
针对核安全监管工作安排与调度问题,提出一种基于指标设立于风险等级划分的时空分布多维度分析模型。时空分布指标为核技术利用监管提供可量化管理手段,并整合企业多属性对不同风险等级单位采用适应的监管方式。实验结果表明,所建模型能够全面规避监管漏洞与片面性,产生直观易懂的有效工作安排与调度依据,保障核安全高效合理化执行。