胥林萱
(中通服网盈科技有限公司,江苏 南京 210000)
目前,用电信息采集系统在电网运行中占据着越来越重要的位置,其主要通过实时采集、处理用户用电信息,为电力企业运营决策提供有效的数据支持。数据库是其中的核心环节,其设计质量将直接影响电力系统的稳定性与安全性,而云计算技术的快速发展为数据库建设质量提升注入了新动力。以云计算技术为依托的云存储技术,促进电力企业的创新发展。
用电信息采集系统是一个对用户用电信息进行采集、监控、处理与分析的系统,具有用电信息自动采集、电能质量监测、计量异常监测以及用电分析和管理等诸多功能,可详细分为采集、通信、控制以及管理等不同层次。其中,采集层属于用电信息采集系统的基础层,主要负责从智能电表、传感器等设备中采集用电信息数据;通信层也可称为传输层,主要是将采集到的用电信息传输到数据中心,用于下一步处理和分析;控制层主要是用电设备的远程控制平台;管理层则发挥着对系统进行监督和管理的作用。
云存储技术是一种以云计算技术为依托的存储服务模式。远程服务器数据存储是云存储技术的核心,用户可以通过互联网访问相关的数据信息,同时支持被多个用户在不同设备上同时访问;分布式存储即将数据分散存储在多个节点上,极大提升了数据的可靠性与容错性,保障数据访问的安全性与可扩展性。此外,云存储技术采用虚拟化技术,可有效实现对数据的集中管理、动态分配。将云存储技术应用在用电信息采集系统的数据库设计中,可充分发挥其可扩展性、高可靠性、灵活性等优势。
在云存储设计中,数据分层存储是重要概念,主要是以数据访问频率、持久性需求和重要性为参考进行划分的。通常情况下,有3 种存储层级,即高速访问层、常规访问层、长期存储层,高速访问层主要是用于存储经常访问的数据,包括最近数据或实时数据;常规访问层中存储的大多为访问不频繁,但仍然需要快速访问的数据;长期存储层则主要用于存储归档数据或历史数据。在开展相关的设计时,需要充分考虑数据生命周期,即数据创建到废弃的全过程,以更好地采用数据支持完成运营决策。
用电信息采集系统中,数据库分布式存储应用的价值在于解决数据量大、数据可靠性要求高等问题,更好地满足电力企业用电信息数据的处理需求。在实际的设计过程中,采用分布式存储方式时可从以下方面进行设计。第一,数据分片,即将用电信息数据按照特定规则分为若干个数据片或数据块,分别存储在不同的物理节点上;第二,负载均衡,即确保不同的物理节点负载相对均衡,降低部分物理节点负载过重而部分节点空闲问题出现的概率;第三,应用数据冗余技术,有助于提升数据库的安全性与可靠性,即使某一物理节点出现故障,也能从其他节点获取到用电数据[1]。
数据加密是确保数据安全性的重要措施。首先,电力企业应明确需要加密的数据和加密强度,并以此为依据选择合适的加密算法,常用的有高级加密标准(Advanced Encryption Standard,AES)、数据加密算法(Data Encryption Algorithm,DEA)等对称加密算法,以及RSA、错误检查和纠正(Error Checking and Correcting,ECC)等非对称加密算法。其次,电力企业须根据实际需求,明确加密方式。目前常用有数据加密、文件加密两种加密方式,其中数据加密主要是对用电的数据流进行加密处理,而文件加密则是对相关文件进行加密处理,再依据应用需要进行解密。最后,密钥生成、存储、备份以及使用等环节的管理是数据加密的重要环节,电力企业需依据自身数据库建设需求,制定科学合理的密钥管理方案。
以云计算技术为基础的云存储设计方案,对用电信息采集系统的智能运维提出稳定性、可靠性、高效率的要求。在实际的设计过程中,电力企业需从自动化监控、智能预警与故障定位、自动化修复与优化等角度出发,引入大数据分析技术对用电数据信息进行实时的分析与处理,及时发现潜在的存储安全性问题。同时,采用机械学习技术,对数据库中的故障信息数据进行训练,实现快速定位与及时处理,并完成自动修复,提升数据库整体性能[2]。
在用电信息采集系统数据库的云存储设计实践中,选择云存储技术是关键环节。电力企业须考虑自身的技术水平和业务需求,综合评估云存储技术的数据可靠性、数据可扩展性、数据处理效率等诸多方面,以此为基础选择最合适自身运营发展的云存储技术。目前,常用的云存储技术有对象存储、块存储、文件存储等,其主要特征如表1 所示。
表1 常见的云存储技术
云存储虚拟化技术属于一种资源管理技术,主要通过软件实现,即使用虚拟化软件在物理服务器上创建虚拟服务器,也可通过带有虚拟化功能的芯片实现,其原理如图1 所示。在用电信息采集系统数据库可存储虚拟化技术应用的过程中,电力企业应充分考虑自身的运营需求,评估虚拟化架构的可扩展性、可靠性和安全性,选择主机虚拟化、网络虚拟化或者存储虚拟化架构,并不断优化。同时,采用虚拟化技术对中央处理器(Central Processing Unit,CPU)、内存、存储等硬件资源开展池化管理,实现应用程序资源的动态分配,提升资源利用效率与调度的灵活性。需要注意的是,采用虚拟化技术时应考虑异构平台兼容问题,为用电信息采集系统多种硬件平台和操作系统的集成与互操作提供支持[3]。
图1 云存储虚拟化的原理
在用电信息采集系统数据库的云存储设计中,分布式云存储技术发挥着高可用性、高可靠性、高性能等优势,能有效解决传统集中式存储架构问题,提升用户用电数据存储与处理的质量。分布式系统架构主要由多个存储节点组成,每个节点都具有计算与存储独立性,并通过互联网连接,组成一个具有一定规模的存储系统;分布式文件系统是其核心组件,主要负责文件的管理与访问控制,如Hadoop 分布式文件系统(Hadoop Distributed File System,HDFS)、Google文件系统(Google File System,GFS)和Ceph等。在用电信息采集系统中,分布式系统架构设计需遵循分层设计、模块化设计、松耦合设计原则,其中分层设计要求将系统划分为诸多层次,每个层次负责不同的功能,以降低用电信息采集系统的复杂性;模块化设计要求将系统划分为诸多独立的板块,发挥不同的功能,以提升用电信息采集系统维护和升级的便捷性;松耦合设计则是为减少各个模块之间的依赖性,提高系统的可扩展性[4]。
智能化运维管理平台是提升用电信息采集系统数据库应用成本、提高电力企业运营效率的重要途径。在实际的设计过程中,电力企业需依据自身发展需求与系统功能要求,明确平台建设的基本方向与目标,然后开展具体的建设工作。首先,智能监控。这是整个平台的核心部分,设计的目的是实现对用电信息采集系统数据库的实时监控、阈值告警、自动诊断等,全面了解数据库的运行状态,及时发现并处理潜在问题,可通过采用Prometheus、Zabbix 等开源监控工具实现。其次,故障诊断与定位。采用日志收集工具将用电数据信息收集到集中式日志存储系统中,利用关键词匹配、正则表达式匹配、日志挖掘等技术手段,从中提取有用的信息并识别异常数据,定位数据库中问题所在,及时处理问题,其实施步骤具体如图2 所示。最后,智能报表与可视化。在云存储技术中,采用Grafana、Tableau、QlikView 以及Zoho Reports 等可视化工具,帮助电力企业运维人员充分了解用电信息采集系统数据库的运行情况和资源使用情况,整体提升管理与决策的便捷性。
图2 智能化运维管理平台的故障诊断与定位流程
数据信息安全问题一直以来都是社会关注的重点话题,可应用数据加密、设置访问权限、数据备份与恢复等技术手段,提升数据库整体安全性与可靠性。首先,数据加密。采用高强度的加密算法、定期更改密钥、加强端到端的加密等方式都能达到数据加密效果,保障数据传输与存储过程中的安全性。加密技术的应用基础为对称加密技术、非对称加密技术。AES是目前实施的国际通用的加密标准,而以量子力学原理为基础的量子加密技术,目前在云存储数据加密中也占据一定位置。其次,数据安全性保护技术。校验和技术是一种将校验和与原始数据一起存储,用于检验数据完整性的技术手段,具有简单、高效的应用优势,适用于大规模数据的保护;哈希函数主要将任意长度的数据映射为固定长度的哈希值,确保数据完整,具有极强的抗碰撞性,但计算复杂程度较高,适用于小规模数据的保护。最后,云存储安全备份。将其应用到用电信息采集系统的数据库云存储设计中,可有效降低数据丢失与损坏的概率,提升数据的可用性与访问速度。电力企业需定期按照设定的时间间隔,对用户用电数据信息进行备份,保障数据最新状态被保存,同时全量备份与增量备份相结合,降低存储与备份成本,并在不同的物理位置进行数据备份,防止单一位置数据丢失,以确保数据的安全性与可靠性[5]。
信息技术更新迭代的背景下,电力企业对用电信息采集系统建设的重视程度不断提升。云存储技术作为一种新兴的数据存储和管理方式,为电力企业的高效发展注入新动力。在利用云存储技术开展用电信息采集系统数据库建设的过程中,电力企业需从数据分层存储、分布式存储、数据存储安全以及智能运维等角度出发,开展云存储技术的具体设计,并定期进行更新与优化,以确保用电信息采集系统数据库应用的安全性与高效性,从而加快自身可持续发展的进程。