基于Python 与RSR 的不同登记类型建筑业企业经济效益综合评价

2023-11-14 13:46刘俊宸LIUJunchen刘宏LIUHong
价值工程 2023年30期
关键词:权法产值回归方程

刘俊宸 LIU Jun-chen;刘宏 LIU Hong

(①商洛学院,商洛 726000;②安康学院,安康 725000)

0 引言

建筑业是国家重要的生产部门,在国民经济发展中发挥重要作用。我国的建筑企业根据登记类型分为国有建筑业企业、集体建筑业企业、外商投资建筑业企业、外商独资建筑业企业、港澳台商投资建筑业企业及港澳台商独资建筑业企业[1],对于不同类型企业的经济效益进行综合评价是宏观管理的重要方面。如何对不同的建筑企业进行综合评价,对于建筑业的健康发展具有重要意义。目前常用的综合评价方法有逼近理想解排序法(TOPSIS)、秩和比法(RSR)、层次分析法(AHP)、模糊综合评判法、人工神经网络、灰色评价法及数据包络分析(DEA)等[2,3],本文利用RSR 方法对不同登记类型建筑企业经济效益进行综合评价研究。

RSR 方法,也叫秩和比法,是一种将古典参数统计和近代非参数统计进结合,并融其各自优点于一身的统计分析方法,1988 年由田风调教授提出,它是数量方法中一种广谱的方法,针对性强、操作简便、使用效果明显[4]。在公共卫生服务质量综合评价[5],城市宜居性评价[6],体育技术的综合评价[7],生态效率评估[8]、运营效率评价[9]、数控机床质量评价[10]等有广泛的应用。

Python 是现代使用广泛的高级语言,具有简单、易学、免费开源、可移植性好、支持库丰富等优势,在数据处理方面有广泛的应用。

1 开发平台、研究对象与方法

1.1 开发平台

本文使用Anaconda3 为开发平台,编辑器为Jupyter Notebook,Python 版本为3.9.12,使用的库有numpy、pandas、statsmodels.api 和stats.scipy。其中,numpy 主要提供多维度数组与矩阵运算,pandas 用于读取数据及数据处理与分析,statsmodels.api 用于拟合多种统计模型,stats.scipy 提供统计信息和概率分布函数等功能。

1.2 研究对象

为了对不同登记类型建筑业企业经济效益进行综合评价,选取国家统计局年度数据作为资料来源,国家统计局提供的数据中包含的评价指标为24 项,由于部分指标的数据不完整,经过筛选,确定了11 项分析指标,包括:从业人员、固定资产原价、建筑业总产值、房屋施工面积、房屋竣工面积、利润总额、税金总额、按总产值计算劳动生产率、房屋建筑面积竣工率、产值利润率及产值利税率。其中,从业人员、固定资产原价、建筑业总产值、房屋施工面积、房屋竣工面积、利润总额、税金总额为绝对指标,反映了企业的实力与经营状况;按总产值计算劳动生产率、房屋建筑面积竣工率、产值利润率、产值利税率四项指标为相对指标反映企业的管理能力、经济效益与社会效益。因此,这11 项指标均可认为是效益型指标,值越大,其编秩数也越大,表明企业的经济效益越好。

另外,在国家的统计数据中,每年仅有国有建筑业企业、集体建筑业企业、外商投资建筑业企业、外商独资建筑业企业、港澳台商投资建筑业企业及港澳台商独资建筑业这6 类登记企业,样本数较少,因此选取了2021-2019 年连续三年6 类企业的数据作为一批观察样本进行处理,这样就形成了18 个样本11 观察指标的矩阵。

1.3 研究方法

本文采用熵权法和RSR 法进行不同登记类型企业经济效益综合评价与分类。熵权法用来计算各指标的权重,RSR 法用于各登记企业的综合评价与分类。

1.3.1 熵权法 指标权重的计算方法。计算指标权重的方法有AHP、熵权法或是自定义权重。熵权法是一种客观赋权方法,在具体使用过程中,根据各指标数据的分散程度,利用信息熵计算出各指标的熵权,再根据各指标对熵权进行一定的修正,从而得到较为客观的指标权重。在分析中,当数据越分散时,熵值越小,则该数据包含信息越多,因此权重越大。

具体计算方法如下:

第一步是确定评价对象,建立评价指标体系,构造n行m 列的水平矩阵R′,R′的元素记为;

第二步是对评价矩阵进行标准化处理得到矩阵R,R的元素为rij;

第三步:计算每个指标的熵值Hj;

第四步:计算第j 个指标的熵权Wj;

1.3.2 RSR 法 具体计算步骤如下:

①编秩。编秩是根据每一个具体的评价指标按其指标值的大小进行排序,得到秩次矩阵R′′,用秩次R′′代替原指标值。编秩方法有整秩法和非整秩法。本文采用整秩法进行编秩。②计算秩和比RSR 值。在一个n 行m 列的秩矩阵R′′中,在本文中评价指标的权重不同,计算加权秩和比。③绘制秩和比WRSR 分布表。将WRSR 值按照顺序排列,计算各组的频数及累计频数,确定各组WRSR 的秩次RR 及平均秩次,计算向下的累计频率,最后一项用(1-1/4n)*100%修正。根据累计频率,查询“百分数与概率单位对照表”即可得到概率单位,在Python 编程中使用正态分布的scipy.stats.norm.isf 方法计算出概率单位(Probit),语句如下:Distribution['Probit']=5-norm.isf(Distribution.iloc[:,-1])。④回归分析与分档。在上一步得到Probit 值之后,将其作为自变量X,将WRSR 分布值作为因变量Y,生成回归模型WRSR,并根据回归模型生成Probit 的WRSR 的拟合值WRSR-Reg,并根据拟合值WRSR-Reg 和分档标准,对样本进行最终的分档排序。

2 处理与结果

2.1 熵权法确定的指标权重

经熵权法计算,各指标的权重如表1 所示。在11 项指标中,后4 项指标,即按总产值计算劳动生产率、房屋建筑面积竣工率、产值利润率及产值利税率相较于其他7 项指标由于数值过于偏小,指标的权重也非常小。

表1 不同登记类型建筑业企业经济指标权重表

2.2 不同登记类型企业的WRSR 值及概率单位值Probit

按照前面所述的计算方法进行Python 编程,计算不同登记类型建筑业企业的WRSR 值及概率单位值Probit,其结果如表2 所示。

表2 不同登记类型建筑业企业经济指标权WRSR 及Probit 值

2.3 回归方程建立

以概率单位值Probit 为自变量,加权秩和比WRSR 为因变量, 建立线性回归方程,WRSR =-1.1675 +0.3962Probit。经回归方程检验,R 方的值为0.959,接近于1,表明回归模型用于评估预测值和实际值的符合程度好;回归方程显著性检验F 统计值达到371.7,表明该模型构成因变量的线性组合是有效的。常数项与Probit 的系统项显著性检验t 值分别为-10.931、19.280,其概率值均为0,均小于0.05,说明回归方程显著具有统计意义。

2.4 分档与排序

根据各分位档对应的概论单位Probit 值,按照回归方程计算拟合值WRSR-Reg,根据田凤调教授推荐的合理分档标准[11],将分档数确定为3 档,其差、中、优的百分数为分别为P15.866以下、P15.866-P84.134之间及P84.134以上,其对应的概率单位Y 值分别为4 以下、4-6 及6 以上,因此使用以下Python 语句对样本进行分档:threshold=np.polyval(r0,[2,4,6,8]),其中r0 为多元回归的系数,并按照[2,4,6,8]计算差、中、优的WRSR-Reg 值。R_result['Level']=pd.cut(R_result['WRSR'],threshold,labels=range(len(threshold)-1,0,-1)),按照上步计算的WRSR-Reg 值对每个样本的WRSR 值进行分档,分档的标记为1,2,3,其中,1 取值为优,2 取值为中,3 取值为差,不同登记类型建筑业企业经济效益综合评价及分档结果如表3 所示。

表3 不同登记类型建筑业企业经济效益综合评价及分档结果

3 讨论

根据上面的分析,不同登记类型建筑业企业经济效益综合评价及分档结果显示,2021、2020、2019 三年国有建筑企业的综合评价为优,2021、2020 年港澳台商独资建筑业企业综合评价为差,其他企业的2021-2019 年综合评价均为中。以2021 年为例,从房屋建筑面积竣工率、产值利润率和产值利税率3 个指标来看,港澳台独资企业较其他5 类建筑业企业都要优秀,国有建筑企业是港澳台独资企业的0.98、0.42 和0.51 倍,是劣于后者的。但是,其他的8项指标中除按总产值计算劳动生产率指标为后者的1.27倍外,国有建筑企业最多是后者的265.96 倍,最少也是后者的92.78 倍。另外,WRSR 排名13 位外商独资企业相较于港澳台独资企业,除利润总额、产值利润率、产值利税率分别是后者的0.83、0.15、0.43 倍外,其他8 项指标中有2项指标是后者的1.38、2.65 倍,有3 项指标是后者的4-6 倍,有2 项指标是后者的9-10 倍。综上所述,国有建筑企业和外商独资企业是优于港澳台独资企业的,其他的15 类登记主体情况类似于国有建筑企业和外商独资企业,因此采用RSR 对不同登记主体建筑企业进行经济效益综合评价是科学有效的。

前文中把从业人员、固定资产原价两个指标作为效益型指标参与了综合评价,这是否合理?于是,把从业人员、固定资产原价不作为指标,或者说将这2 项指标删除,其他的处理方法不变,得到WRSR 值的排序及分类结果前后没有任何变化,因此,可以证明把从业人员、固定资产原价作为效益型指标是合理可行的。

前文中把概率单位Y 按照[2,4,6,8] 分为三档,其结果(即分档及登记主体企业数)为:一档(优)有3 个,二档(中)有13 个,三档(差)有2 个;若概率单位Y 按照[2,3.5,6.5,8]分为四档,其结果为:一档(最优)有2 个,二档(次优)有15 个,三档(较差)有1个,四档(最差) 有0 个;若概率单位Y 按照[2,3.2,4.4,5.6,6.8,8] 分为五档对数据进行处理,其结果为:一档(最优)有1 个,二档(次优)有4 个,三档(中)有9个,四档(较差)有4 个,五档(最差)有0 个。在以上三档、四档及五档三种分档方式中,三档分法确保每档都有相应的登记建筑业企业,四档、五档分法中最差分档没有相应的登记建筑业企业,说明从数据的内在逻辑上讲分为三档是更科学与合理的。

因此,基于Python,采用RSR 法对不同登记类型建筑业企业进行经济效益综合评价,其方法科学,结果可靠有效。

猜你喜欢
权法产值回归方程
基于熵权法的BDS钟差组合预测模型的建立
6口塘出虾43000斤!产值超100万元,“万亩虾塘”的成功密匙你了解了吗?
采用直线回归方程预测桑瘿蚊防治适期
2020年阿根廷大豆产值将达205亿美元
“一米菜园”有颜值更有产值
走进回归分析,让回归方程不再是你高考的绊脚石
BP神经网络结合熵权法优化甘草皂苷提取工艺
基于熵权法*的广西能源安全评价
我国循环经济产值已达2万亿元
基于改进熵权法的风电功率组合预测方法