基于权重优化复合聚类的空调控制研究

2016-11-18 08:26关珊珊管强刘艳
中国科技纵横 2016年18期
关键词:子集权值正确率

关珊珊 管强 刘艳

(青岛大学附属医院,山东青岛 266000)

基于权重优化复合聚类的空调控制研究

关珊珊管强*刘艳

(青岛大学附属医院,山东青岛266000)

为解决央空调控制过程中控制参数复杂,变量维数较高,多属性数据点集中包含数值型属性、类别属性和混合型等多属性结构的问题,本文针对工业环境下多属性和多变量的特点,将模糊聚类算法与属性加权优化相结合,进而推导出优化迭代公式并形成加权聚类算法,对于具体变量的相关属性进行数学描述。仿真结果表明,该算法可以很好的处理相关多属性约束条件下的变量聚类,结合模糊关系优化混合属性集的特征权重。和传统算法相比,具有良好的正确率和分类边界处理效果。

聚类属性权值迭代可变加权

1 引言

在进行数据挖掘分析时,对属性权值进行优化一直是十分重要的。常见的分析方法有过滤法[1]和包装法[2],前者根据一个可解析的函数子集分类判别函数寻求可行特征子集或最优特征子集,后者将分类算法的分类正确率作为目标子集的选择判断依据。

Matlin Sam uel[3]将特征选择方法集成到分类和聚类算法中,提出了一个框架型结构的方法,但对于具体分类准则没有界定;Xin Quan[4]对邻域算法中的特例赋一定的权值以区分重要性,以使所构造的分类器分类效果更佳,但针对复杂环境下的多属性变量没有进行分析论述。

2 属性权值优化的模糊C均值聚类算法研究

2.1属性权值的自适应配置描述

设多属性的m维空间R的某个区域内存在可构造C个聚类的数据集S={X1,X2,...,Xn},其中Xi={xi1,xi2,...,xim}∈R(i=1,2,...,n)描述第i个数据点在样本空间中的位置。定义一个带权值的"聚类"度量范数,表征某单一属性对聚类子集的不同反映和数据之间的差异性。即:

其中dk(xik,xjk)由第k个属性类型决定。若其为无序类别属性,定义为:

2.2基于属性权值优化的FCM聚类算法研究分析

[5]和[6],定义一个含有模糊隶属度的模糊准则复合目标函数:

从而复合目标函数为

可以看出,复合目标函数含有三个变量参数,下面分别对这三个变量进行相关优化计算。

2.2.1优化权值因子

定义上述附加约束条件的优化目标拉格朗日函数为

取其偏导数为0,可得

从而

2.2.2优化隶属度因子

定义带上述约束条件的拉格朗日函数为:

令函数对各变量的偏导数为0,得到:

进而得到:

从而:

2.2.3优化聚类中心

当属性是有序属性时,将目标函数改写为

令目标函数对各变量的偏导数为0,得到:

从而得到:

3 变精度权值修改复合模糊C中心聚类算法

条件:对于有序属性进行合理归一化的数据集S={X1,X2,...,Xn}和聚类子集个数c,初始化上述目标函数的特征权重向量W=(1,...,1,...,1)T(无先验知识)或者W=(w1,w2,...,wm)T(有先验知识),得到初始相异性度量d=(.,.)。

结果:数据点集S={X1,X2,...,Xn}的最终聚类结果S=C1∪...∪CK,最终的聚类中心点集V(0)={V(0)1,V2(0),...,Vk(0)}和最终的相异性度量d=(.,.)。

算法分析步骤:

Step1

初始化选取复合属性数据点集S={X1,X2,...,Xn}的c个中心点构成初始的聚类中心集V={V1,V2,...,Vc},迭代次数t=0,隶属度度量r设为2,特征权重度量q设为2,迭代终止参数设为ε。

Step2

Step3

对于有序属性,聚类中心点更新公式为:

图1 变量重要性分析结果

此时的时间复杂度为O(nmC)。

对于无序类别属性,对数据子集中的所有取值进行全域寻优,将当前聚类中心点选择为可使复合目标函数的最小化函数部分取得最小值时的极值,即

Step4

隶属度更新公式为

其中,i=1,2,...,n ,j=1,2,...,C 。这一步的时间复杂度为O(nmC2)。

Step5

令t=t+1,使用下式更新属性权值向量W=(w1,w2,...,wm)T。

其中,k= 1,2,...,m 。

这一步的时间复杂度为O(nm2C)。

Step6

4 仿真实证分析

4.1数据初始化

空调系统的精度取决于空调系统本身及自动控制两个方面。空调统本身主要是冷、热总量要能保证系统的要求,多采用集散控制装置。中央空调集控装置是用于监视和控制中央空调设备及其周边设备,如主机、空调箱、水泵、冷却塔,各种控制阀门等设备和零件的可视化智能控制器。

表1 聚类输入变量

本文针对主要参数对输入变量应用SPSS数据分析软件,进行神经网络和灰色关联度算法分析,挑选重要性高的变量进行聚类,图1是应用算法进行重要性分析的结果。

最终得到如下输入变量:(表1)

4.2仿真结果对比

通过传统FCM聚类算法和基于属性权值调整的聚类算法在正确率和迭代时间上的对比可以看出,新算法在迭代终止时间和聚类正确率方面具有相当的优势。

三维空间聚类结果对比可以看出,由于新算法充分考虑了聚类子集数据在空间上的分布情况,良好的改善了聚类边界的混叠问题。

5 结语

中央空调控制的过程具有大滞后、强耦合、评价指标多等特点,控制过程往往较为复杂。

本文将模糊C均值聚类算法和属性权值优化相结合,给出了相应参数的更新公式和相关算法流程,并应用生产中的实际数据进行方针对比,证明本方法的正确性和优越性。

文中算法考虑了控制过程中的高维度多属性数据点集进行聚类分析时属性权值对聚类结果的影响。通过仿真分析,看出新算法在迭代正确率和处理边界混叠方面具有一定的优势。

[1]Koleszar G E.A Description of the Weapon Optimization and Resource Requirements Model[R]INSTITUTE FOR DEFENSE ANALYSES:Report IDA D-2360,2009.

[2]Pawlak Z.et al.Rough stes[J].Communications ofACM,2010,38(11):89-95.

[3]Matlin Samuel.Review of the Literature on the Missile Allocation Problem[J].Operations Research.2010,18(3):334-373.

[4]XIN-QUAN CHEN,HONG PENG,JING-SONG HU.An adaptive optimization method of configuring feature weight group.Proceedings of the Fifth International Conference on Machine Learning and Cybernetics,Dalian,13-16August2006.pp1281-1286.

[5]Huan Liu and Lei Yu.Toward Integrating Feature Selection Algorithms for Classification and Clustering[J].IEEE Transaction on knowledge and data engineering,Vol.17,No.4,April2005. pp491-502.

[6]宇文,刘宏,查红彬.基于特征选择分组加权聚类的表情识别[J].计算机辅助设计与图形学学报,2005,17(11):2394~2401.

[7]江艳君,李柠,黄道.修正初始权值的BP网络在CSTR故障诊断中的应用[J].华南理工大学学报,2004,30(2):207-210.

关珊珊(1985—),女,满族,吉林珲春人,工程师,硕士研究生,医疗仪器设备验收、巡检、维修维护。

管强(1983—),男,本科,工程师,从事医院暖通空调系统设备管理工作。

猜你喜欢
子集权值正确率
一种融合时间权值和用户行为序列的电影推荐模型
拓扑空间中紧致子集的性质研究
CONTENTS
门诊分诊服务态度与正确率对护患关系的影响
连通子集性质的推广与等价刻画
关于奇数阶二元子集的分离序列
基于权值动量的RBM加速学习算法研究
生意
品管圈活动在提高介入手术安全核查正确率中的应用