融合LSTM神经网络的投资项目监测预测系统设计

2024-07-22 00:00:00周弘姚成武陈恒
电脑知识与技术 2024年16期

关键词:投资项目;监测;LSTM网络;经济预测

0 引言

甘肃省实现了投资项目在线审批监管,累计在线审批投资项目18.4万个,办理项目事项20.1万件,有力支撑了全省经济社会全面发展。但随着“放管服”改革和优化营商环境工作进入纵深,既有投资项目监控预测能力日益无法适应高质量发展的要求,亟须构建一套能够准确监测投资现状,有效预测未来走势的智能监测预测系统。

人工智能和大数据技术的发展为解决这一问题提供了新的思路,深度学习作为人工智能领域的重要分支,在处理复杂非线性问题和时间序列预测上展现出了显著的优势。徐映梅等人[1]对传统统计计量方法和深度学习方法的对比表明,针对结构复杂的非线性多变量数据,神经网络预测效果更为理想。长短期记忆网络(Long Short-Term Memory,LSTM) 是一种特殊的循环神经网络,因其独特的门控机制,能够在保持长期依赖关系的同时,有效避免梯度消失和梯度爆炸问题,从而在处理时序数据时展现出卓越的性能。朱青等人[2]通过实验结果发现,LSTM模型能较准确地反映GDP增长的变化规律,在宏观经济预测中具有较高的应用价值。王国金[3]对LSTM模型的初始权重及阈值进行了优化,提升了LSTM网络模型的经济预测效果。但运用深度学习进行投资项目预测的相关研究和实践还比较欠缺。

本文旨在设计并实现融合LSTM神经网络的投资项目监测预测系统,充分利用LSTM在网络建模与预测方面的特性,通过对投资项目的历史数据进行深度挖掘和学习,实现对投资项目数量的精确预测,为投资主管部门投资形势研判、经济调控和政策制定提供支撑,实现用数据说话、用数据管理、用数据决策。

1 相关理论与技术

1.1 Django 框架

Django是Python的主流Web框架之一,它通过减少重复的代码,使开发人员能够专注于开发中的关键事务,专注于编写应用程序[4]。Django提供了大量的开箱即用工具,使开发过程更加简单和高效,用来快速构建复杂和高性能的Web应用程序。Django采用MTV(Model-Template-View) 的架构设计,是MVC 模式的一种变体,强调模板在Web应用程序中的重要性模型负责数据处理和数据库交互,通过定义一系列的数据模型类来与数据库进行映射。视图负责业务逻辑处理,视图函数或类接收HTTP请求,处理数据并决定返回给用户的响应内容。模板提供友好的方式来定义HTML和其他格式输出,通过变量和模板标签动态渲染视图提供的数据。在典型的Django应用中,用户请求被Django的URL映射机制传递给相应的视图,视图处理数据操作等业务逻辑将数据传递给模板,模板生成HTML页面并响应返回给请求者。

Django的高效安全和可扩展kapRFsGsmDBHo+/kT8YkBQ==性源于其独特的内部机制,对象关系映射(ORM) 使开发者不必直接编写SQL语句而以Python对象的方式操作数据,URL分发机制通过URLconf文件简洁地映射URL到相应的视图函数,插件式中间件(Middleware) 允许在请求响应周期的不同阶段插入自定义功能,表单验证和生成机制简化了网页表单的处理过程,多级别缓存机制大幅提高应用性能,Django同时提供跨站脚本攻击(XSS) 和跨站请求伪造(CSRF) 等安全防护机制。

1.2 LSTM 神经网络

长短期记忆网络(Long Short-Term Memory,LSTM) 是一种特殊的循环神经网络(RNN) 结构,它能够有效克服RNN中存在的梯度消失问题,尤其在长距离依赖的任务中的表现远优于RNN,梯度反向传播过程中不会再受到梯度消失问题的困扰,可以对存在短期或者长期依赖的数据进行精确的建模[5]。

LSTM核心在于其内部的细胞状态和门控机制,这些机制赋予LSTM对长期依赖关系的强大建模能力。细胞状态使LSTM能对序列连续地存储和传递信息,从而使长期依赖关系得以有效地保留和累积。门控机制通过输入门、遗忘门和输出门灵活地控制信息的读取、更新和输出,确保模型能够在捕获短期动态变化的同时,充分理解和利用长期的历史信息。细胞状态(C) 是一个持续传递的信息通道,负责在时间步之间保持和传递信息,细胞状态能够保留长期依赖,不受输入门、遗忘门和输出门的直接影响。门控机制的遗忘门、输入门和输出门基于前一时刻的隐藏状态和当前时间步的输入。遗忘门决定细胞状态中哪些信息应当被丢弃,1表示完全保留信息,0表示完全遗忘信息。输入门的计算结果表示哪些新信息应被加入细胞状态中。输出门决定如何从当前细胞状态中提取有用信息用于生成当前时间步的隐藏状态,该隐藏状态将用于后续的计算或作为模型的输出。遗忘门与输入门结合形成了更新后的细胞状态。输出门与细胞状态相乘(经过tanh激活函数),将结果作为当前时间步的隐藏状态,隐藏状态不仅影响下一个时间步的LSTM单元,也是模型对外部世界的输出。LSTM 通过门控机制实现了对信息的精确控制,允许模型在处理序列数据时选择性地保留、更新和读取信息,适于需要考虑序列数据中长距离依赖关系的任务。

2 系统设计

2.1 系统架构设计

系统基于Django框架,采用三层架构设计,从上而下依次为应用层、业务层和数据层。应用层负责与用户直接交互,承担着界面展示、功能调用以及请求处理等关键任务,确保系统的可用性和易用性。业务层是整个系统逻辑处理的中枢,涵盖了业务规则定义、业务流程控制以及服务接口封装等多项重要职能。在业务层系统将复杂的业务逻辑进行了模块化、组件化的精细划分与实现,从而有效保证了业务处理的稳定性和可维护性。处于底层的数据层包括数据访问与操作、数据持久化等一系列与数据相关的处理工作,通过与上层业务逻辑紧密配合,数据层不仅提供了可靠的数据支撑,同时也确保了数据的安全性和一致性。

2.2 功能模块设计

1) 总量数据监测。对项目审批和事项办理数据进行分类、统计、排序,对疑似异常项目回溯到基本数据后进行人工处理,监测范围主要是一般投资项目、专项库和审批事项。投资项目监测交叉分析项目审核备类型、审批地区和机构、赋码日期、审核备日期、国标行业分类、发改部门行业分类、项目目录、开竣工日期等属性,黄河战略、生态产业、外贷、民间资本推介等专项库标识,值域为项目数量和投资额。分析结果以表格、热图等形式展示,便于快速计算和提取信息。审批事项监测交叉分析项目审批级别、审批机关、地区、事项名称、事项状态,申报、接件、受理和办结日期等属性,值域为事项办件量,分析结果以表格、热图等形式展示。

2) 专项库监测。主要是储备项目、黄河战略项目、重点投资项目和重大前期项目等专项项目的监测。储备项目监测分析储备项目类型、属性、属地、行业、投资、前期工作情况、建设性质、辅助标识等属性。黄河战略项目监测分析黄河战略项目类型、属地、行业、投资、开复工情况、责任人、包抓领导、辅助标识等属性。重点投资项目监测分析重点投资项目拟开竣工日期、类型、属性、属地、行业、投资、前期工作情况、开复工情况、责任人、包抓领导、辅助标识等属性。重大前期项目监测分析重大前期项目前期工作情况、类型、属性、行业、投资责任人、包抓领导、辅助标识等属性。

3) 投资项目预测。为了实现投资项目未来趋势的精准预测与高效自动化处理,构建基于LSTM网络的投资项目预测模型。该模型以2015年10月份以来的投资项目审批数据为基础,充分考虑训练集与测试集的时间序列特性以及样本长度的影响,将其作为关键参数加入模型构建过程中。在模型的具体实现上,优化了损失函数的选择与设定,旨在确保模型在学习历史数据规律的同时,能够准确捕捉到投资项目各维度指标间的复杂动态关系,并有效防止过拟合或欠拟合现象的发生,使得模型具备较强的泛化能力,对未来投资项目趋势进行科学合理的预测。将模型处理过程函数化,开发用户接口界面,实现投资项目预测自动化。

2.3 LSTM 预测模型构建

1) 数据预处理。本系统数据来源于甘肃省投资项目在线审批监管平台分析数据库,在项目审批过程中实现数据实时更新。截至2024年3月,在库项目18.4万个,基于项目数量平稳和月度预测业务需求等考虑,本系统将日数据转换为月数据,从2015年10月至2024年3月共102个月。按90%比例划分训练集和测试集,训练集91个月,测试集11个月。数据特征与预测目标均为投资项目数量。

2) 模型实现。本文基于Keras的深度学习框架搭建LSTM模型。Keras是模型层面的深度学习接口库,主要负责模型的构建、训练及预测等核心功能。Keras具有卓越的封装特性,能够便捷高效地搭建各类实验所需的网络模型,极大地提升实验效率。对于深度学习底层涉及的复杂张量运算,Keras 依赖于Theano或Tensorflow这样的后端引擎提供计算支持,自身并不直接处理。

3) 模型评价方法。采用时间序列常用的均方根误差(RMSE) 和平均绝对百分比误差(MAPE) 评估模型效果。RMSE通过计算预测值与实际值之间差异的平方,取平均后再开平方根得到评估模型的表现。其公式如下:

MAPE有效消除了数据规模的影响,使得不同规模或波动特性的数据集之间可以进行准确的预测性能评估,适合评估和比较具有显著差异性尺度或者波动幅度的数据集预测精确度。

3 实证分析与结果讨论

3.1 投资项目监测

通过系统监测近5年甘肃省投资项目数据可以看出,2019年至2023年甘肃省投资项目总体上呈增长趋势,如图1所示。分季度看,从一季度到二季度是投资项目的快速增长期;三、四季度是项目的实施期,新报项目较前两季度有所下降。但2023年一至四季度投资项目数量持续增长,展现出了较强的投资动力。

项目审批事项情况与投资项目数量分季度趋势基本一致。但2020年和2021年项目审批事项较2019 年有明显下降,主要原因是这一阶段项目立项阶段事项办理后实施阶段审批数量较少,也就是说有大量项目未落地实施。2022年至2023年情况有明显好转,项目审批事项数量显著增加。

从监测结果来看,2023年1—12月,甘肃省投资项目数量和投资额均保持高位运行,1季度项目数量和投资额均呈现明显的增长趋势;2、3季度保持平缓;3季度又有一轮显著的增长。

3.2 投资项目预测

采用本文模型对甘肃省2023年11月—2024年3 月投资项目数量进行预测,实际值与预测值见表1。

该模型预测投资项目数量的均方根误差(RMSE) 为937.012 4,平均绝对百分比误差(MAPE) 为0.254 6。

4 结束语

本文设计实现了融合LSTM神经网络的投资项目监测预测系统。本文立足现有投资项目信息化成果,通过业务流程梳理、系统整合、汇聚、集成,实现信息资源统一汇聚、分析应用和深度服务。采用大数据分析方法,实现投资项目数量和投资额的实时监测,针对不同年度、行业领域以及地域的投资分布情况,进行深度数据挖掘与精细化对比分析,为投资策略优化和资源配置提供了强有力的数据支持。构建LSTM网络投资项目数量预测模型,通过对2023 年11 月—2024年3月投资项目数量预测,达到了较好的效果,为投资发展趋势预测和促投资稳增长提供了有效的数据和方法支撑。系统有效实现了甘肃省投资项目的实时监测和智能预测,在政府投资决策和调控领域有重要的应用价值。同时,系统预测的准确率等方面还需要进一步研究提升。