关于数据采集分析的结构化思考

2019-12-02 07:35龚剑超徐国华戴建军
水电站机电技术 2019年11期
关键词:语义学系统结构语境

龚剑超,徐国华,戴建军

(华东桐柏抽水蓄能发电有限责任公司,浙江 天台317200)

1 前言

系统就是由相互作用和相互依赖的若干组成部分结合成的具有特定功能的有机整体[1]。电力系统是一个相对稳定的系统,其系统要素相对固定,系统关系相对明确,有关电力生产的全过程研究充分,相关技术规范也十分全面,在充分发掘数据内涵上具有良好的基础。但是如何通过数据表达电力系统,如何利用电力系统数据指导实际工作,需要一个便于利用的数据结构以及利用数据的理论和方法。

本文主要讨论电力系统数据的结构化和语义学对于电力系统数据应用的作用。数据的结构化与语义学结合,可以挖掘出数据在特定范围内的深度内涵,并提供智能化的策略指导。

本文所述电力系统预设为一个相对封闭的系统,一些对电力系统影响不大的系统外环境所对应要素和关系暂不讨论。

2 系统要素

根据哈蒙的概念作用语义学观点,思维的内容是由概念的组织结构所决定的,系统要素与结构的表达也存在类似情况,即采用概念化的系统要素提取方法,可以提高系统要素的表述适用范围,从而使系统要素的内容不仅包含实物设备类,还包含电力系统运营相关的概念内容[2]。

电力系统的系统要素包含实物要素(设备)和非实物要素(事件或概念),其数据化描述应能描述电力系统的系统要素,明确系统要素涉及的各类性质、状态信息。

电力系统的非实物要素一般指对应的电力生产经营的相关事件,如电力生产的具体检修、维护等工作内容,也可以指电力行业经营行为,如采购、交易等工作内容,甚至可以是执行某项工作的方法、标准。比如发电生产系统的继电保护校验工作可以是一个系统要素,继电保护校验工作中的安全措施恢复也可以是一个系统要素。

3 系统关系

在有限系统中,排除外部环境的影响,当系统要素全面了解时,各系统要素之间的关系可以最简认定为因果关系。

但是全因果关系是无法全面描述一个大规模的系统的。电力系统由于系统功能明确,系统结构的组成一致,系统要素间的关系可以在一定范围内近似简化描述为全因果关系统,但是在系统内多个分支之间有一定关联关系的子系统之间只能以对等关联关系加以描述,以简化非重点关注部分的系统结构和关系。单纯以因果关系来判断会产生大量变量分析,一方面消耗大量系统资源,另一方面由于部分要素缺失,很难得出有效结论。

4 电力系统数据的特征

4.1 电力系统要素相对固定,系统关系相对明确

电力系统的要素对应于发电生产的全过程,其生产过程结构严谨,科学规范,构成要素及关系相对固定,系统关系相对明确。

4.2 电力系统结构形式的简化表达

电力系统数据的相关内容众多,系统关系复杂,且由于不同分支设备系统的原理结构存在差异,其系统结构也存在多种类型。

根据电力生产的功能明确、测量量作用过程承续性强,设备工作条件(或工作环境)要求严格的特点,电力生产设备通常可以采用“输入→处理单元→输出”的结构给予简化表示。涉及反馈等环节的复杂系统结构,可以在系统结构层级中通过子系统间的关联关系来表达,从而简化系统关系。

高度可继承的数据可以为逻辑表达或语义学表达提供形式更为统一的表达形式。

4.3 电力系统结构具有高度一致性

电力系统电力运维部分各系统分支的构成在同类型的近似容量等级的电力系统厂(站)中基本一致;且各分支系统的功能、系统关系,甚至执行技术规范也具有高度一致性;其技术指标与电力系统厂(站)类型和容量等级相应一致,即系统要素和关系内容具有高度一致性。

系统要素和关系内容具有高度一致性的特点对于系统关系描述的封装比较有益,即只要形成一个典型的电力生产系统结构模型,就可以在大量同类系统中反复应用。

例如某电站主变保护系统结构模型建立后,有关此主变保护的所有系统要素和各要素间的系统关系描述已明确,则所有与此类主变保护配置情况一致的本电站或其他电站的主变保护系统的数据结构也可以参照此模型建立。

4.4 电力系统数据结构有关事件表达的形式语义学要求

根据形式语义学理论,“句子的语义从信息内容上看可以分成三种类型:真值条件义、表情感叹义和言语行为义。”[3]真值条件义描述现象、事实的真伪,表情感叹义描述价值观或主观意愿,言语行为义描述行为。这三类语义形式的表达可以代表对系统的状态判断、趋势判断和行为指导。相应的系统要素和关系的描述也需要就真伪、价值判断和事件等语义内容提供相应数据信息。

以某电压互感器为例,该电压互感器的状态是工作状态还是检修状态,是真值条件义描述范围,可以用表示状态的字段直接用真假来表示;其电压采样值的准确度可以在表情感叹义中描述,则需要相应的价值判断信息,可以用标准状态和最优状态对应语境下的标准数据来参照,通过对比计算得出价值判断依据,并得出结论;有关该电压互感器的检修工作则属于言语行为义描述范围,应有该行为(事件)的细节描述,以明确检修工作的工作目的、执行步骤、执行标准等具体内容。

真值条件义和表情感叹义的判断必然涉及语境、句义主体、判断属性或指标,在不考虑语句形式优美的情况下,可以忽略修饰用语,直接选定要素(实物或非实物)为主体,然后在此主体相关系统要素描述及系统基本信息(如时间)中选取语境,根据语境提取判断属性或指标内容,最终得出判断结果或价值评价结论。语境的形成与要素的描述信息、该要素的系统关系描述信息等各类基础数据的详细程度有关,数据内容越多,形成的语境越复杂,越容易表达电力生产的实际情况,并根据结论推出言语行为义句式。

以某电压互感器为主体情况下,有关电压互感器的要素描述中选择检修周期信息,上次检修时间信息,当前时间信息,形成检修是否超期的判断指标,并最终判断是否超期。当判断为超期时,推出检修计划要求的言语行为义句式。

言语行为义句式必然涉及语境、句义主体、行为(事件)内容。有关行为内容在系统要素的行为(事件)信息中应有详细描述。

由此,电力系统事件的表达可以简单统一为“语境+主体→判断(或语境+主体→事件)”的句式进行表达。注意,主体可以是实物要素,也可以是非实物要素。

这一系列的表达可以程序自主构建生成。但是随机自动构建的句式未必是有意义的,只有通过筛选,才能实际使用;当然也可以根据已有内容,人工构建句式。由于每个可用句式均包含一个结论或行为指向,数据内涵的可用性就得到了提高。

5 系统要素及关系的数据化结构描述

5.1 系统要素的数据化结构描述

系统要素的数据描述需要明确以下内容:

(1)系统要素的性质。指明本系统要素是实物要素还是非实物要素,或者其他特定的要素分类性质。

(2)系统要素在系统树型网状立体结构中所在结构位置的分支、层级和点位描述。

(3)系统要素的基本内容描述。

系统要素的基本内容是语境构成的重要基础,其构成与系统要素本身的特点有关,其详细程度与生成有效句式的可能性直接相关。但是这个描述是不可能一蹴而就的,因此要素基本内容的生成和维护需要一个过程,并且其数据的输入需要一个自动化的工作环境。

5.2 系统关系的数据化结构描述

对应系统关系的描述,应明确以下内容:

(1)系统关系的性质。系统关系性质标明是否因果关系。

(2)系统关系所对应的描述。对于因果性关系,可以因指向果加以描述,对于非因果关系,可以双向指示,分别描述。

(3)系统关系的基本内容描述。系统关系描述应介绍两个子系统(或要素)之间产生关系的原因,理论依据及相关标准等。

5.3 系统要素及关系的数据结构化描述对比

系统要素及关系的数据结构化描述对比详见表1。

表1 系统要素及关系的数据结构化描述对比表

由表1可以看出系统要素及关系两者是对立统一的,电力系统数据的结构化包含以下内容:

(1)数据所描述的对象的性质。

(2)数据所描述的对象的结构位置及关联信息。

(3)数据所描述的对象的基本内容,这个基本内容是可扩充的,可借鉴的。

同时可以看到通过系统要素及关系的结构位置的描述可以构建系统关系图。而通过系统要素及关系的基本内容描述则可以构建语境。

通过构建系统关系图及相关语境描述,对于电力生产可以:

(1)根据系统功能理清各系统之间及内部关系,促进实际设备智能化或工作的系统化和标准化[4]。

(2)由系统关系图列出系统分界点,构建关键点安全措施库和系统危险点预控库。

(3)通过软件可以重点突出系统关系图的关注部分,明确工作重点。

对于数据的应用,可以:

(1)通过电力系统关系图的构建,衍生出实时系统关系图,这个图及其相关的信息流代表着一个电力系统数据应用平台,只要做好信息网络分层控制和应用的权限管理,电力系统相关信息的记录、浏览、统计等一系列行为都可以在特定条件下开放给指定的不同类型的用户,从而实现大数据的实际应用。

(2)电力系统关系图直接与泛在电力物联网结合,由特定语境指导智能化电网设备按要求动作,完成特定指标。

6 数据内涵发掘的研究

语义学数据内涵发掘的关键在于生成一个个特定的语境,由此封闭语境,对特定事物进行描述,并最终形成判断和行为导向。

(1)通过结构化的电力系统数据,可以把各类数据以系统关系图的形式组织起来,为语境内容的充实和筛选提供方向。即解决系统到底需要什么数据,数据应当如何引用的问题。

(2)电力系统中任意实物及事件主体都可以描述为系统要素,当根据系统关系图标示的各要素被充分描述时,电力系统相关数据在有限封闭环境下是最接近事实的,且是最容易共享并引用的。

(3)系统基本信息包括系统时间(时序)、系统结构(系统关系图)等可全面应用于全系统的系统信息。要充分发掘数据内涵,系统基本信息必然作为系统特殊的要素或关系的基本内容在较大范围内被引用和对比。比如时间,时间是有关系统要素描述中极为重要的内容,时间轴是电力系统关系图按时间关系衍进的基础,是必须加以统一描述的系统信息。在语境应用中常会引用系统时间并与系统要素的时标对比,从而产生判断结果。

7 小结

当一个较为全面详细的系统关系图建立起来时,通过不断组合系统信息,形成不同封闭语境,可以组合出一定规模的数据内涵库,通过筛选,可得到有用的数据分析结果。这个过程一方面提高了数据内涵挖掘程度,另一方面也为数据需求规划提供了方向。

电力系统的数据化、结构化以及语义学表达,对于三型两网的数据应用具有重要意义。结构化的系统关系数据描述和语义学表达可以为三型两网所需的数据收集提供导向,并为数据内涵的发掘提供基础。因此结构化的系统关系数据的语义学描述,可以帮助衍进形成可广泛共享的数据应用平台,进而指导泛在电力物联网进行智能联动。

猜你喜欢
语义学系统结构语境
创作与做梦:精神分析语境下的“植田调”解读
论英国学者的语义学简史研究∗
条约演化解释:合法性、语义学分析及近似概念
主题语境八:语言学习(1)
主题语境九:个人信息(1)
事件语义学框架下“给”句式歧义的形式化描写
Hiddleston’s Causal Modeling Semantics and the Distinction between Forward-Tracking and Backtracking Counterfactuals*
分区域广域继电保护的系统结构与故障识别
论电力系统配网自动化技术与应用探索
观音岩水电站计算机监控系统结构与分析