改进的粗糙集方法与稀土产业可持续发展评价

2014-09-24 03:15王俊峰张丽
现代商贸工业 2014年14期
关键词:评价模型粗糙集可持续发展

王俊峰+张丽

摘要:针对稀土产业可持续发展,提出了一种新的评价模型。该模型的不同在于首先采用模糊C均值聚类算法对数据进行预处理,然后再基于粗糙集的属性约简以及属性重要度思想,做出改进,对现有指标进行精简并确定约简后各指标的权重,从而形成综合测评。最后还通过包头市高新区的稀土产业进行了实证研究,说明了该评估模型优于现有评价方法避免了主观性,同时相比原始粗糙集方法,进一步简化了评估过程,提高了工作效率,具有一定的理论意义与实践意义。

关键词:稀土产业;可持续发展;评价模型;粗糙集;FCM算法

中图分类号:F2文献标识码:A文章编号:16723198(2014)14000903

1引言

中国稀土资源得天独厚,是我国具有国际竞争力的优势产业之一。然而,我国开采水平较低,浪费十分严重,作为不可再生资源的稀土,它的储量已经在逐年下降。在此背景下,对稀土产业的可持续发展进行研究就显得尤为重要。目前,国内外学者专门针对稀土产业可持续发展评价的研究并不是很多,而且主要采用的是模糊综合评价法和层次分析法。二者在指标权重确定过程中都具有一定的主观判断与选择,导致结果存在很大的主观性;另外在建立评价指标体系时,选取的指标也比较多,难免出现冗余,从而加大了评价的工作量,降低了评价的准确性。因此,本文针对上述评价研究中的不足,尝试将改进的粗糙集方法运用于稀土产业的可持续发展评价,提出一种新的评价模型。该模型首先运用模糊C均值聚类算法对数据进行处理,然后一方面采用改进的属性约简思想对现有的指标体系进行精简,消除冗余信息,避免主观因素对指标选择的干扰,进一步简化评价过程,提高评价工作的效率;另一方面利用粗糙集属性重要度思想,确定指标权重,无须先验知识,具有很强的客观性。

2基于改进的粗糙集方法的稀土产业可持续发展评价模型的构建

事实上,可持续发展的核心基础就是循环经济。循环经济具有很强的操控性,经常将其度量指标视为可持续发展评价研究的评价指标,再加上稀土产业近些年来从资源到企业、产业链、贸易等的整合,在各个地区发展的态势表现为一个个综合全面的工业园区,因此对稀土的可持续发展研究完全可以通过对某个专门发展稀土产业的区域的循环经济发展的综合评价来实现。

2.1指标的确定

在国内已有学者的研究基础上,我们选择以下有关循环经济的比较全面的测量指标:经济发展,环境影响,科技创新以及社会贡献。具体每个大指标下又可以细分为很多更细的指标。如经济指标包含工业增加值C1、区内生产总值C2、人均工业增加值C3、引进国外资金实际到位额C4、出口外汇C5、工业主导产业增加值占工业增加值比重C6。环境影响包括每吨稀土氧化物产生尾矿量(以池浸法工艺来测算)C7、每吨稀土焙烧矿产生放射性废渣C8、年产废水C9、每吨分离厂氨氮废水C10、每吨稀土金属产生氟量C11、每吨稀土金属产生烟尘量C12。科技创新指标是指高科技技术企业销售收入C13、稀土产品企业工业总产值所占园区比重C14、企业数C15、研究开发人数所占比例C16、创业中心数C17。社会贡献评价指标则包含:稀土高新区生产总值占所在地区生产总值比重C18、利税总额C19、年末从业人数C20。

2.2综合信息表的设定

利用上述比较全面具体的稀土产业可持续发展指标体系来设定一个指标的综合信息表,对各个对象的各个指标以及指标值进行汇总。该信息表就是一张二维表,也就是所谓的知识表达系统。如表1所示。

表1评价指标综合信息表

指标(Index)C1C2……CnX1 ……X2 ………………Xm ……表1中的Xi表示第i年,i=1,2,3,…,m,m为年份总数;Cj表示第j个指标,j=1,2,3,…,n,n为指标的个数。

2.3利用模糊C均值聚类算法进行数据预处理

首先,需要对评价指标进行无量纲化。为了消除各项指标的单位不同以及它们数值数量级间的悬殊差别所带来的影响,本文采用一种常用方法极值法对指标数据进行标准化。

Cij=Cij∑5i=1Cij(j=1,2,3…,20)(1)

其次,需要处理的是连续属性指标的离散化。利用粗糙集进行数据分析必须是离散数据,而无量纲化后的信息表中的各指标值大多数都是连续的。因此需要对数据进行离散化。此处采用模糊C均值聚类算法来实现对信息表的离散,而原始粗糙集模型通常采用笔者主观划分类别范围实现聚类。模糊c-均值聚类是模糊聚类算法中非常有效的一种,它能给出每个样本隶属于某个聚类的隶属度,即使对于很难明显分类的变量,模糊c-均值聚类也能得到较为满意的效果。本文借助于Matlab7.0中的fcm工具箱及助findcluster函数,依属性逐一处理,即聚类的样本都是一列属性值,最后根据样本点在聚类结果中所属的类别序号作为它的离散值,一般根据类别个数赋予特征值1、2、3。

2.4基于粗糙集理论的启发式属性约简

通常为了更加全面地对某事物展开评价,在建立评价指标体系时,选取的指标比较多,导致出现冗余,从而需要进行一定的删减来减少不必要的工作。然而,基于粗糙集的评估研究问题,往往都是通过建立具有决策属性的决策表来进行指标的筛选。在这里,对稀土产业可持续发展的评价并不存在决策属性,所以本文提出一种基于粗糙集区分矩阵和逻辑运算的启发式算法。

设S=为一个知识表达系统,|U|=n,则对应的区分矩阵M(Xi,Xj)={c∈C|(f(Xi,c)≠f(Xj,c))}。在此,称Mij为区分对象Xi与Xj的所有属性集合。

基于粗糙集区分矩阵和逻辑运算的启发式指标体系筛选算法建立如下:

Step1:检查信息表中各属性的特征值,特征值完全相同的属性,每组只需保留一个。

Step2:计算区分矩阵,并将其中所有取值为非空集合的元素建立相应的析取逻辑表达式Lij=VCr∈MijCr。

Step3:将所有的析取逻辑表达式进行合取运算得一个合取范式L,即L=∧Mij≠Lij。

Step4:将合取范式L转换为极小析取范式的形式,得L′=VrLr。

Step5:得出结果,即每个合取项中所包含的属性组成约简后的属性集合。

2.5基于粗糙集理论的指标权重确定

通过属性约简后,得到约简指标集P={C1C2…,Cl},然而这些指标在整个指标体系中的重要程度可能不同。本文基于粗糙集中信息熵与属性重要度的权重测算方法来计算出各评估指标的重要度Sp(Ci)(i=1,2,3,…,l)。该方法完全由数据驱动,具有很强的客观性。

令约简后的指标总的信息量为I(P),那么将某个指标Ci移走后,剩下的信息量就是I(P-{Ci}),又信息量的计算公式为:

I(P)=li=1|Xi||U|1-|Xi||U|(2)

于是得到指标在指标体系P中的重要性Sp(Ci)=I(P)-I(P-{Ci})(3)

最后将的重要度作归一化处理即得各指标权重。第i个指标的权重为:

wi=Sp(ci)li=1Sp(ci)(4)

2.6综合评价的计算

Vj=liwiyi(5)

其中:Vj表示第j年稀土产业可持续发展综合评价值;表示第i个评价指标无量纲化后的数值。

3模型应用实例

作为粗糙集理论应用到稀土产业的可持续发展评价研究,本文就包头市稀土产业进行实证分析,因为一直以来存在“中国的稀土看包头”这一说法,同时包头市稀土产业主要集中在高新区。所以研究样本选择的是高新区连续五年的循环经济发展状况,设计的评价指标体系和数据来源于文献。然后按照2.2设定稀土产业可持续发展指标的综合信息表,如表2所示。

表2高新区连续五年的循环经济发展综合信息表

Index X1X2 X3 X4 X5C1138725917821162283207274898230960000C266460008099000145836521909000022740000C36.58%6.35%8.29%8.80%9.48%C412881076110012501346C54526745992531504533751236C678.10%79.40%85.50%84.40%87.30%C728002553264023862300C81.51.21.11.10.9C912321201115410051000C109391828075C119.29.08.88.48.5C121918151513C1322655433163018235560527301473045300C147.0%7.7%5.8%6.6%8.0%C1513451588185621262476C168.3%9.1%9.4%9.8%10.6%C173943505964C186.66.48.69.29.5C19305401504314423262419876536230C208445185544862008756489240按照公式(1)对信息表内各值进行无量纲化处理,并进一步利用Matlab7.0进行聚类。分别用特征值“1”、“2”、“3”表示离散值。见表3。

表3离散化后的综合信息表

C1C2C3C4C5C6C7C8C9C10C11C12C13C14C15C16C17C18C19C20X111222223222322222222X211222222222332222232X312222222222222222222X413222222222222323322X533322222222222323332按照上述模型当中的理论和步骤,我们对属性进行约简。

首先计算区分矩阵为:

hms

bhlblms

bhloblmosbo

abchlosabclmoabcosacs

按照上述步骤得到约简属性集o∧h∧(b∨l∨m∨s)∧(a∨c)。

最后综合各级指标我们选取p={C3C8C13C15}作为最后的精简指标。

接下来根据粗糙集中运用知识信息量对属性重要度进行测算的方法,计算各指标的重要度。

U/ind(P)={{X1}、{X2}、{X3}、{X4}、{X5}}

移走C3后,等价关系P-{C3}对论域的划分为:

U/ind(P-{C3})={{X1}、{X2}、{X3}、{X4X5}}

所以根据公式(2)(3)可知的属性重要度为Sp{C3}=0.08。

同理:Sp{C8}=0.08Sp{C13}=0.08Sp{C15}=0.08。

相应的由公式(4)将重要度归一化求出约简后指标的权重:

WC3=0.25WC8=0.25WC13=0.25WC15=0.25

约简后的指标根据权重及其归一化后的指标值代入公式(5),进行计算。

V=0.1666-0.25860.16810.1432

0.16-9-020690.233301691

02099-018970173701976

02228-018970201302264

02400-015520224602637×025

025

025

025

=0055

0089

0098

0115

0143

根据上述改进的模型的运算,我们发现中国稀土产业在连续五年里可持续发展能力是呈递增的,由综合测评值0.055提高到0.143。计算结果与文献的研究结果非常相符。同时通过约简后的指标可知人均工业增加值、每吨稀土焙烧矿产生放射性废渣、高科技技术企业销售收入、企业数这四个指标较其它指标更为重要,是影响稀土可持续发展的关键因素,通过这四个指标即可以对其进行较为合理的评价,当然这种更重要是相对性的,是反映指标间的相对重要性。所以今后为了实现稀土产业的可持续发展,我们需要加大科技投入,不断提高科技创新能力,减少开采生产过程中的污染,真正意义上实现为企业,为人民,为国家做贡献。

4结论

在分析现有评价方法缺陷的基础上,结合粗糙集自身的评估优势,建立了一套全面系统的稀土可持续发展评估数学模型。为当前中国稀土产业的可持续发展评价提供了一条新的途径。研究结果表明,改进的模型优于现有评价方法,避免了主观性,同时相比原始粗糙集方法,进一步简化评价流程,提高工作效率。具有一定的科学性和实效性,对今后有效的评估稀土产业的可持续发展以及提出相应的整改对策具有一定的参考价值。

参考文献

[1]白雪.稀土产业可持续发展评价研究—以包头稀土产业为例[D].秦皇岛:燕山大学,2011:4558.

[2]高永娟.包头稀土产业可持续发展研究[J].产业经济,2012,11(b):205206.

[3]李远远.基于粗糙集的指标体系构建及综合评价方法研究[D].武汉:武汉理工大学,2009:3436.

[4]Pwalka.Rough sets[J].International Journal of Computer and information science,1982,11(5):341356.

[5]李美娟,陈国宏,陈衍泰等.基于粗糙集的组合评价方法研究[J].中国管理科学,2005,(13):128131.

[6]付海艳,张诚一.基于FCM和粗糙集属性重要度理论的综合评价系统[J].计算机应用,2006,26(6):14791481.

[7]张文修,吴伟志,梁吉业等.粗糙集理论与方法[M].北京:科学出版社,2001:125.

endprint

表2高新区连续五年的循环经济发展综合信息表

Index X1X2 X3 X4 X5C1138725917821162283207274898230960000C266460008099000145836521909000022740000C36.58%6.35%8.29%8.80%9.48%C412881076110012501346C54526745992531504533751236C678.10%79.40%85.50%84.40%87.30%C728002553264023862300C81.51.21.11.10.9C912321201115410051000C109391828075C119.29.08.88.48.5C121918151513C1322655433163018235560527301473045300C147.0%7.7%5.8%6.6%8.0%C1513451588185621262476C168.3%9.1%9.4%9.8%10.6%C173943505964C186.66.48.69.29.5C19305401504314423262419876536230C208445185544862008756489240按照公式(1)对信息表内各值进行无量纲化处理,并进一步利用Matlab7.0进行聚类。分别用特征值“1”、“2”、“3”表示离散值。见表3。

表3离散化后的综合信息表

C1C2C3C4C5C6C7C8C9C10C11C12C13C14C15C16C17C18C19C20X111222223222322222222X211222222222332222232X312222222222222222222X413222222222222323322X533322222222222323332按照上述模型当中的理论和步骤,我们对属性进行约简。

首先计算区分矩阵为:

hms

bhlblms

bhloblmosbo

abchlosabclmoabcosacs

按照上述步骤得到约简属性集o∧h∧(b∨l∨m∨s)∧(a∨c)。

最后综合各级指标我们选取p={C3C8C13C15}作为最后的精简指标。

接下来根据粗糙集中运用知识信息量对属性重要度进行测算的方法,计算各指标的重要度。

U/ind(P)={{X1}、{X2}、{X3}、{X4}、{X5}}

移走C3后,等价关系P-{C3}对论域的划分为:

U/ind(P-{C3})={{X1}、{X2}、{X3}、{X4X5}}

所以根据公式(2)(3)可知的属性重要度为Sp{C3}=0.08。

同理:Sp{C8}=0.08Sp{C13}=0.08Sp{C15}=0.08。

相应的由公式(4)将重要度归一化求出约简后指标的权重:

WC3=0.25WC8=0.25WC13=0.25WC15=0.25

约简后的指标根据权重及其归一化后的指标值代入公式(5),进行计算。

V=0.1666-0.25860.16810.1432

0.16-9-020690.233301691

02099-018970173701976

02228-018970201302264

02400-015520224602637×025

025

025

025

=0055

0089

0098

0115

0143

根据上述改进的模型的运算,我们发现中国稀土产业在连续五年里可持续发展能力是呈递增的,由综合测评值0.055提高到0.143。计算结果与文献的研究结果非常相符。同时通过约简后的指标可知人均工业增加值、每吨稀土焙烧矿产生放射性废渣、高科技技术企业销售收入、企业数这四个指标较其它指标更为重要,是影响稀土可持续发展的关键因素,通过这四个指标即可以对其进行较为合理的评价,当然这种更重要是相对性的,是反映指标间的相对重要性。所以今后为了实现稀土产业的可持续发展,我们需要加大科技投入,不断提高科技创新能力,减少开采生产过程中的污染,真正意义上实现为企业,为人民,为国家做贡献。

4结论

在分析现有评价方法缺陷的基础上,结合粗糙集自身的评估优势,建立了一套全面系统的稀土可持续发展评估数学模型。为当前中国稀土产业的可持续发展评价提供了一条新的途径。研究结果表明,改进的模型优于现有评价方法,避免了主观性,同时相比原始粗糙集方法,进一步简化评价流程,提高工作效率。具有一定的科学性和实效性,对今后有效的评估稀土产业的可持续发展以及提出相应的整改对策具有一定的参考价值。

参考文献

[1]白雪.稀土产业可持续发展评价研究—以包头稀土产业为例[D].秦皇岛:燕山大学,2011:4558.

[2]高永娟.包头稀土产业可持续发展研究[J].产业经济,2012,11(b):205206.

[3]李远远.基于粗糙集的指标体系构建及综合评价方法研究[D].武汉:武汉理工大学,2009:3436.

[4]Pwalka.Rough sets[J].International Journal of Computer and information science,1982,11(5):341356.

[5]李美娟,陈国宏,陈衍泰等.基于粗糙集的组合评价方法研究[J].中国管理科学,2005,(13):128131.

[6]付海艳,张诚一.基于FCM和粗糙集属性重要度理论的综合评价系统[J].计算机应用,2006,26(6):14791481.

[7]张文修,吴伟志,梁吉业等.粗糙集理论与方法[M].北京:科学出版社,2001:125.

endprint

表2高新区连续五年的循环经济发展综合信息表

Index X1X2 X3 X4 X5C1138725917821162283207274898230960000C266460008099000145836521909000022740000C36.58%6.35%8.29%8.80%9.48%C412881076110012501346C54526745992531504533751236C678.10%79.40%85.50%84.40%87.30%C728002553264023862300C81.51.21.11.10.9C912321201115410051000C109391828075C119.29.08.88.48.5C121918151513C1322655433163018235560527301473045300C147.0%7.7%5.8%6.6%8.0%C1513451588185621262476C168.3%9.1%9.4%9.8%10.6%C173943505964C186.66.48.69.29.5C19305401504314423262419876536230C208445185544862008756489240按照公式(1)对信息表内各值进行无量纲化处理,并进一步利用Matlab7.0进行聚类。分别用特征值“1”、“2”、“3”表示离散值。见表3。

表3离散化后的综合信息表

C1C2C3C4C5C6C7C8C9C10C11C12C13C14C15C16C17C18C19C20X111222223222322222222X211222222222332222232X312222222222222222222X413222222222222323322X533322222222222323332按照上述模型当中的理论和步骤,我们对属性进行约简。

首先计算区分矩阵为:

hms

bhlblms

bhloblmosbo

abchlosabclmoabcosacs

按照上述步骤得到约简属性集o∧h∧(b∨l∨m∨s)∧(a∨c)。

最后综合各级指标我们选取p={C3C8C13C15}作为最后的精简指标。

接下来根据粗糙集中运用知识信息量对属性重要度进行测算的方法,计算各指标的重要度。

U/ind(P)={{X1}、{X2}、{X3}、{X4}、{X5}}

移走C3后,等价关系P-{C3}对论域的划分为:

U/ind(P-{C3})={{X1}、{X2}、{X3}、{X4X5}}

所以根据公式(2)(3)可知的属性重要度为Sp{C3}=0.08。

同理:Sp{C8}=0.08Sp{C13}=0.08Sp{C15}=0.08。

相应的由公式(4)将重要度归一化求出约简后指标的权重:

WC3=0.25WC8=0.25WC13=0.25WC15=0.25

约简后的指标根据权重及其归一化后的指标值代入公式(5),进行计算。

V=0.1666-0.25860.16810.1432

0.16-9-020690.233301691

02099-018970173701976

02228-018970201302264

02400-015520224602637×025

025

025

025

=0055

0089

0098

0115

0143

根据上述改进的模型的运算,我们发现中国稀土产业在连续五年里可持续发展能力是呈递增的,由综合测评值0.055提高到0.143。计算结果与文献的研究结果非常相符。同时通过约简后的指标可知人均工业增加值、每吨稀土焙烧矿产生放射性废渣、高科技技术企业销售收入、企业数这四个指标较其它指标更为重要,是影响稀土可持续发展的关键因素,通过这四个指标即可以对其进行较为合理的评价,当然这种更重要是相对性的,是反映指标间的相对重要性。所以今后为了实现稀土产业的可持续发展,我们需要加大科技投入,不断提高科技创新能力,减少开采生产过程中的污染,真正意义上实现为企业,为人民,为国家做贡献。

4结论

在分析现有评价方法缺陷的基础上,结合粗糙集自身的评估优势,建立了一套全面系统的稀土可持续发展评估数学模型。为当前中国稀土产业的可持续发展评价提供了一条新的途径。研究结果表明,改进的模型优于现有评价方法,避免了主观性,同时相比原始粗糙集方法,进一步简化评价流程,提高工作效率。具有一定的科学性和实效性,对今后有效的评估稀土产业的可持续发展以及提出相应的整改对策具有一定的参考价值。

参考文献

[1]白雪.稀土产业可持续发展评价研究—以包头稀土产业为例[D].秦皇岛:燕山大学,2011:4558.

[2]高永娟.包头稀土产业可持续发展研究[J].产业经济,2012,11(b):205206.

[3]李远远.基于粗糙集的指标体系构建及综合评价方法研究[D].武汉:武汉理工大学,2009:3436.

[4]Pwalka.Rough sets[J].International Journal of Computer and information science,1982,11(5):341356.

[5]李美娟,陈国宏,陈衍泰等.基于粗糙集的组合评价方法研究[J].中国管理科学,2005,(13):128131.

[6]付海艳,张诚一.基于FCM和粗糙集属性重要度理论的综合评价系统[J].计算机应用,2006,26(6):14791481.

[7]张文修,吴伟志,梁吉业等.粗糙集理论与方法[M].北京:科学出版社,2001:125.

endprint

猜你喜欢
评价模型粗糙集可持续发展
基于Pawlak粗糙集模型的集合运算关系
基于学业质量的增值性评价系统的分析与构建
基于产业集群的技术创新风险评价模型构建
基于熵权法的西安市外向型经济发展综合评价研究
多粒化粗糙集性质的几个充分条件
中小家族企业可持续发展的对策研究
全球资源治理中的中国角色与愿景
新型农村金融机构的可持续发展
双论域粗糙集在故障诊断中的应用
两个域上的覆盖变精度粗糙集模型