席卫华
基于多因素Logistic回归分析的废旧物资处理系统设计与实现
席卫华
(江苏联合职业技术学院,江苏 无锡 214000)
废旧物资可以视为第二资源,废旧物资的合理回收利用可以大幅度降低生产成本,节约物资耗损,对构建环境友好型社会具有积极意义。本文针对目前废旧物资处理过程中出现的信息化水平失衡现象,综合权衡多个影响因素,设计并实现了一款基于多因素Logistic回归分析的废旧物资处理系统,采用多因素Logistic回归分析定量分析废旧物资处理机制与多影响因素之间的概率型非线性回归关系。该系统采用B/S架构,MVC 开发模式进行整体架构设计,采用ASP.NET语言实现动态Web网页,采用协同过滤技术和Apriori算法进行废旧物资处理个性化推荐和数据挖掘。平台设计完成后,实际运行表明平台整体运行稳定,对提高废旧物资信息化处理水平具有积极意义。
多因素Logistic回归分析;废旧物资处理;B/S 架构;协同过滤;数据挖掘
废旧物资具有可回收再利用的固有属性,是循环经济的重要组成部分,可以视为二次原材料,科学规范的做好废旧物资处理工作有利于提高人们的环保意识,符合可持续性发展战略,对形成集约型社会具有积极意义[1]。目前,由于没有形成完整统一的管理规范,缺乏信息化、一体化、系统化的管理系统,废旧物资处理过程中不合理、效率低下、信息化水平较低、专业人才缺失等问题凸显[2],很大程度上制约了我国废旧物资处理事业的良性发展。废旧物资处理事业是一个全局事业,涉及到的利益方众多[3],影响其发展的因素众多,必须综合考虑,系统分析,在此背景下,设计并实现了一款基于多因素Logistic回归分析的废旧物资处理系统,可以综合权衡多种影响因素,得出最佳处理方案。系统基于实际调研和查阅大量相关文献的基础上,形成了系统的需求分析,进而依次给出了系统的网络架构设计、功能模块设计、数据库设计等,在此基础上,遵循软件工程测试规范,对系统进行了测试,测试结果表明,系统工作稳定,实用性较好,抗压性等指标满足实际要求。
系统的需求分析是系统正常运行的基础和保证,因为需求分析指导研发方向,而研发方向对系统的设计逻辑、工作量、组成和设计方式有着极大的影响[4],对于基于多因素Logistic回归分析的废旧物资处理系统的需求分析从功能性需求分析和非功能性需求分析两方面分析。如图1所示,给出了系统各个功能模块及其内在的逻辑关系,系统的非功能性需求分析需要满足这几个方面:
①系统应该具有初始信息,提升信息打理的便捷度。
②通过各种方式密切相关角色的联系,实现其交换信息的目的。
图1 系统功能性需求分析用例图
③系统应该有较强的并发处理能力,要保证系统的稳定性,它决定了信息的安全性。
④要保证数据真实可靠有效。
⑤系统应该有较强的可扩展性,要便于后期的更新与维护。
由于废旧物资处理是一个系统工程,其信息化发展水平涉及到的相关因素较多,各个因素之间存在博弈关系,因此必须采用系统的方法分析,筛选出对废旧物资处理信息化水平影响较为重要的因素加以关注,进而在政策等方面予以扶持。与此相对应,多因素Logistic回归分析是一种常用的广义非线性回归预测模型,可以灵活的设置二分类或者多分类因变量,进而实现影响因素的多维度分析。选取政策扶持、政策宣传、团队管理、外在环境等四个因素作为多因素Logistic回归分析的四分类因变量,从定量角度分析废旧物资处理信息化水平与多影响因素之间的概率型非线性回归关系,引入了Logistic回归分析,建立了基于多因素Logistic回归分析的废旧物资处理信息化水平影响因素重要度模型,建模过程如下:
在样本经过LR分类器预处理的基础上,采用Sigmoid函引入非线性,有利于控制输出范围,确保数据在回归过程中不易发散,具体如公式(2)所示:
设定P为大学生创新创业相对于某个影响因素的成功概率,则对概率论中的概率比取对数可得:
在此基础上,采用极大似然估计求分类器的参数可得:
选取国内经济发展较好的10个二线城市,分别采集这些城市10年来的废旧物资处理信息化数据作为数据样本,考虑到由于政策的变更导致10年间上述城市的废旧物资处理信息化数据存在较大差异,对数据进行均值化处理,把处理后的数据带入公式(4)中,可以得出定量形式的废旧物资处理信息化水平与多影响因素之间的概率型非线性回归关系,具体如表1所示。
表1 废旧物资处理信息化水平与多影响因素 之间的概率型非线性回归关系表
Tab.1 Probabilistic Nonlinear regression relation table between the informatization level of waste materials processing and many influential factors
Apriori算法是由Agrawal等人设计和研发出来的,这一算法起初是基于在数据库中挖掘出对应的项目集格空间理论而产生的,从设计出来到现在[5],这一算法依旧是大多数新型频繁项集发现算法的研究基石,由于本文设计的废旧物资处理系统需要对政策的走向、政策宣传力度等数据进行挖掘预测,因此需要在平台中集成Apriori算法,此过程的主要工作在于寻找频繁项集,先计算所有的1-项集,记为C1,根据所给最小支持度,找出所有的常用1-项集,记为L1;然后,根据常用1-项集确定候选2-项集的集合C2,从C2找出所有的常用2-项集,记为L2;以此类推,找出Lk。针对废旧物资处理系统,该算法实现代码如下:
Li = {large 1-itemsets} : //表示的为全部的1-项S频集
F0R(k=2;k++) DO BEGIN
C^=apriori-gen{h^.) //表示的是由(k_l)-频集而得到的K-侯选集
FOR all transactions teD DO BEGIN
Ct-5wZ)5e/(Ck,t);//其中Ct表示为t中含有的全部候选集元素
FOR all candidates cg Q DO
cxount++;
END
Lk={ceCk |c.count>minsup一count}
END
L= uLk;
X={ (m-l)-itemsets Xm-i | Xn,.i in };
FOR each Xm.i in X BEGIN
conf = support (Ir) /support (Xm-i);
IF (conf ^minconf) THEN BEGIN
在上文确定的平台功能性需求分析和非功能性需求分析的基础上,本小节进行平台总体设计。上文已经指出,平台主要的功能模块包括废旧物资报废申报模块、专家审核模块、废旧物资处理管理模块、处理进度跟踪模块等,各个模块下面还划分为许多子功能,详细如图2所示。在此基础上,进行数据库总体设计,重点设计数据层,数据层是主要职责就是操作数据库里的数据信息,在此能够给予数据支持在其他层次上,即可以提供手段和接口与其它层连接,基于上述分析,本文采用数据库LDK模式,该模式有助于系统的实现。
由于废旧物资处理总体业务流程受诸多因素的影响,不同类型的废旧物资处理任务,业务流程有较大差别,本文以某发电厂废旧物资处理流程为例说明系统的总体业务流程。如图3所示,在确定好处理对象之后,进行系统初始化操作,主要完成平台初始信息的录入并对系统数据仓库写入初始值,进行初始化并审核初始信息的规范性;检测是否有废旧物资处理发起,如果有,启动处理文件审核机制[6],包括政策相关文件审核和处理方案计划提报等,是实际处理质量提供理论保证;如果文件审核通过,则按照处理方案文件进行实际处理,处理过程中严格按照处理规范进行,处理结束后进入处理质量验收子流程,相关验收人员根据验收规范对处理质量进行验收;如果验收通过,则进入完善移交子流程,否则提出整改意见,处理方进行完善处理。
图2 废旧物资处理系统总体功能框图
基于实际应用需求的考虑,系统运用多层体系结构,这一系统的架构由下至上来看,分别有数据访问层、业务逻辑层、表示层等,其详细结构图如图4所示。
(1)表示层这一层所显示的系统界面,是由浏览器完成的。同时表示层与使用者之间的联系也最为频繁。表示层囊括有登录、数据集管理、用户管理、动态链接库调用界面等等。使用者只需要按照一般方式,应用鼠标和键盘便能完成对这些界面的操纵[7]。
图3 系统总体业务流程示意图
(2)业务逻辑层这一层次,把现实世界的对象转化成为实体类。业务逻辑层这一层面中,囊括有该系统划分的基本类别,其分别是各类用户、软件测试规则、数据集优化和动态库扩展类等方面。业务逻辑层包括接口层,接口层的作用在于对逻辑层和数据访问层实施连接工作。这一系统内的逻辑层囊括有:SQL命令构造类Salting和获得安全数据类GetSafeData。
(3)数据访问层的位置处于这一系统的最底层,且其只拥有一个基础的单元数据库,也就是Database,然而数据访问层的作用却十分重要,原因在于数据库内容纳有该系统全部的数据信息,故而数据访问层的安全和整体系统的安全都是密切联系、息息相关的。
在充分调研用户需求和阅读大量相关文献的基础上,确定了系统的总体功能模块,系统总体上分为物资报废申报模块、专家审核模块、废旧物资处理模块、处理进度跟踪模块模块等,各个模块对自身要发挥的功能进行数据处置,不同的模块也能够进行合作交流,使系统运行的效率更高。根据本系统在实际操作实现阶段,当注册用户登录系统时,系统会对登录的相关角色进行特定的判断,同时根据角色的不同为用户展现出具有差异性的视图,借助此类方法能够使系统降低对于授权表的访问[8],而对于RBAC访问系统主要是作用于管理员以及用户之间展现出特定的功能。以此来减少了对数据库的访问次数。因此对于RBAC访问控制系统模型图如图5所示。
图4 系统层次架构
图5 基于RBAC的访问控制模型图
本文主要利用的是WindowsServer2008操作系统平台,采用的硬件设备 CPU为英特尔酷睿i5,主频3.0GHz。系统运行内存为16GB,存储空间8TB ,网络带宽20M独享。系统数据存储软件是MSSQLServer2015。环境和硬件的需要相对于用户访问端来说没有那么高,比如,对于环境来说需要在系统里安装相应的浏览器软件;而对于硬件配置来说,就需要CPU至少要在1GHz以上、大于100G的硬盘空间、至少2G的内存、网卡速率必须在ADSL以上以及1024*76 8的显示器分辨率,基于上述分析,废旧物资处理系统登录界面如图6所示。
图6 废旧物资处理系统登录界面示意图
性能测试,是对平台能否正常运行,在大量访问的情况,是否能满足用户需求的一种测试,一般通过并发用户来完成系统性能测试工作。本系统采用的是LoadRunner软件检测工具来完成系统一些性能的检测,同时设置两百个用户在线登录的情况下,所用参与体验的用户在同一时间段内反复进行系统页面的访问,如图7所示,从图中可以得出,检测的结果中可以看出两百个用户访问的情况都比较正常,并且系统没有出现一些不正常的情况,可以进行正常的运行和流程的访问,并且也能够实现用户的实践业务能力。系统的响应时间也比较符合用户所要求的那样,系统的响应速度也小于一秒。
针对测试的数据进行详细的研究能够明显的得出,在并发数量即使一直在提升,然而对于程序而言并没有太大的改变,虽然系统的用户数量能够超过规定的数值,对于系统响应造成的时间却非常短,可以忽略不计。同时,对于该系统而言,在其他功能上也趋于稳定运行状态。
图7 系统测试资源监控示意图
本文首先分析了提高废旧物资处理信息化水平的重要意义,然后分析了废旧物资处理信息化水平涉及多个层面,属于具有相当复杂度的系统工程,必须采用系统的方法分析,进而,本文提出了一种基于多因素Logistic回归分析的废旧物资处理信息化水平影响因素重要度研究方法,定量得出若干影响因素的重要度,为下一步政策的制定提供了数据支撑。在此基础上,基于协同过滤技术和Apriori算法开发了一款废旧物资处理系统,对提高我国废旧物资处理信息化水平具有积极意义。实际测试表明,系统运行稳定,实用性和功能性较强,可以较好地满足废旧物资处理对信息化的要求。
[1] 洪芳华, 施鸣达, 江辰, 等. 废旧物资报废处置智能监控预警系统设计与实现[J]. 科技创新与应用, 2017(35): 105-107.
[2] 王锡琳. ERP系统在废旧物资管理中存在的问题与解决对策[J]. 安徽电子信息职业技术学院学报, 2016, 15(5): 108-110.
[3] 王庆刚, 张林, 张剑. 基于移动互联网的农业电商系统设计与实现[J]. 计算机应用, 2016, 36(a01): 286-290.
[4] 赵鑫, 王亚刚, 王凯. 基于B/S模式的智能家居管理系统设计[J]. 软件导刊, 2018(2): 99-101.
[5] 聂松, 刘英. 基于C#的企业人事管理系统设计与实现[J]. 软件导刊, 2018(1): 126-128.
[6] 魏芳娣, 李德山, 李刚. 应用ERP系统处置电网企业废旧物资的探索与实践[J]. 电力信息与通信技术, 2017(8): 83-86.
[7] 赵强, 张红忠. 基于ASP.NET的网站系统安全性设计与实现[J]. 计算机应用, 2008, 28(s2): 271-273.
[8] 孟广燕. 利用ERP资源开发宣钢废旧物资转储管理系统[J]. 河南科技, 2013(11): 231-232.
[9] 韦杰, 曾萍. 基于R的有序分类资料logistic回归分析[J]. 软件, 2014, 35(6): 56-57+61.
[10] 司亚清, 孟亚楠. 基于Logistic模型的电信业务潜在用户预测研究[J]. 软件, 2012, 33(11): 218-220.
Design and Implementation of Waste-Materials Processing System Based on Logistic Regression Analysis of Multi-Factors
XI Wei-hua
(Jiangsu United Vocational and Technical College, Wuxi, Jiangsu 214000)
The use of waste materials can be regarded as the second resource, the reasonable recycling and utilization can greatly reduce production costs, saving material consumption, to build an environment-friendly society has a positive significance. According to the imbalance of information level in the process of waste materials processing, this paper designs and realizes a waste-materials processing system based on logistic regression analysis of multiple factors. Multi-Factor Logistic regression analysis was used to quantitatively analyze the probabilistic nonlinear regression relationship between waste-materials processing mechanism and many influencing factors. The system uses B/S architecture, MVC development mode for the overall architecture design, the use of ASP.NET language to achieve dynamic web pages, using collaborative filtering technology and apriori algorithm for waste materials processing personalized recommendations and data mining. After the design of the platform, the actual operation shows that the whole platform is stable and has positive significance for improving the information processing level of waste materials.
Multifactor logistic regression analysis; Waste materials processing; B/S architecture; Collaborative filtering; Data mining
TP311
A
10.3969/j.issn.1003-6970.2018.09.038
席卫华(1974-),工程硕士,讲师,研究方向:软件工程、网络。
本文著录格式:席卫华. 基于多因素Logistic回归分析的废旧物资处理系统设计与实现[J]. 软件,2018,39(9):188-193