基建项目投资市场趋势预测与应对

2025-01-13 00:00:00张乐
投资北京 2025年1期
关键词:数据挖掘预测

基础设施是为社会生产和居民生活提供公共服务的物质工程设施,是保证社会经济活动正常进行的根本性物质基础。基础设施作为产业导入与城市开发的基本前提,可以为企业生产和社会发展创造良好的外部条件、产生可观的外溢效应。一方面带动当地工业、零售业、旅游业等产业投资,持续性提高生产效率和产出水平,助推产业迈向中高端水平。另一方面完善民生领域公共服务设施,有效改善当地居民生活水平,提升城镇化质量。基建项目投资是我国提高全要素生产率、实现高质量发展的必由道路。

以大数据为基础,结合基建项目投资市场的特征,从基建项目业主(政府、相关行业主管部门或代表政府行使建设单位职责的城投公司)、基建项目社会投资人(基建投资类央国企)、基建项目实施主体(勘察设计、施工单位等)三个角度对影响基础设施项目的因素进行分析,可以看出他们之间的合作关系是十分必要且具有发展前景。对基建行业中不同阶段、不同年限性项目存在差异化趋势并有针对性地提供服务,能够有效降低成本费用支出和提高效益水平。

基建项目投资市场趋势预测方法

数据挖掘的对象是海量的历史数据,这些数据主要来源于相关的官方数据、行业报告、媒体报道等。大数据挖掘的主要任务是从这些海量数据中提取出对投资市场趋势分析有用的信息,并通过相应的统计方法和技术对信息进行分析和挖掘,从中发现隐藏在海量数据中的关联信息,并对这些信息进行有效整合和应用。数据挖掘可以有效地提高决策支持系统的效率和质量,使得企业能够更好地把握投资市场的变化趋势,并做出更加准确有效的投资决策。

在数据挖掘过程中,主要采用机器学习、统计学、知识发现等技术。其中,机器学习是当前主流的数据挖掘方法。在企业内部数据库中挖掘出项目信息,针对项目信息的挖掘,可以从项目立项、融资、招标、合同等阶段进行,在这一阶段主要是利用关系型数据库系统来进行数据分析。关系型数据库系统主要分为MongoDB和Spark两种。MongoDB是一种分布式数据库,可以用来存储各种类型的数据;Spark是一种分布式计算框架,它可以在一个内存中进行处理,在多个计算机之间进行数据交换。通过这两种框架的组合使用,可以大大提高数据分析和处理的效率。

基建项目投资市场趋势预测的应用

数据仓库是一个收集和组织数据的结构,数据仓库中存储的是在业务流程中产生的具有一定结构、有组织的、可检索的数据。通常将其描述为:存储在数据库中的所有数据;按时间顺序排列的记录;按主题划分的数据集合;有组织地使用数据库来存取数据。此外针对传统机器学习方法的缺陷,提出了一种基于贝叶斯网络的时间序列数据挖掘算法,在该算法中,贝叶斯网络通过节点和边的传递来计算节点与节点之间的关系,用来表达个体与个体之间的关系。模型中,通过设计两个特征来描述不同节点的不同属性,根据模型得出不同的特征值,从而得到与时间序列数据相对应的概率。通过贝叶斯网络可以将训练集上每个数据点的概率值组合起来形成一个新的数据集,也就是一组样本。利用这种方法,可以把数据集中每个点和对应数据点之间的关系表示出来,从而根据贝叶斯网络模型对时间序列数据进行建模。

从投资数据中提取的舆情分析与监测,其目的是通过对社交媒体平台上与基建投资相关的评论进行分析,来识别市场情绪。通过分析基建投资的主要社交媒体平台,并对相关新闻进行文本挖掘,可以挖掘出关于基建投资的正面评论和负面评论。对于负面评论,可以通过舆情监测来鉴别其来源并加以分析。

目前的舆情监测平台主要采用基于规则的文本挖掘技术进行分析,如百度、搜狗、360等。但这些平台的文本挖掘技术主要采用机器学习,依赖于对已有文本的训练。而在我国,自然语言处理技术仍处于初级阶段,因此这种技术方法在实际应用中有一定的局限性。直接利用互联网上已有的海量文本数据进行训练,包括中文和英文。在训练过程中,通过学习大量的样本,可以有效地减少人工标注带来的错误率和成本。

时间序列分析是一种统计学方法,其目的是确定数据的统计特性和统计特征,并将这些统计特征用来预测数据。通过时间序列分析,可以实现对数据的趋势分析和预测。首先,将项目投资数据分为序列数据和波动率数据。序列数据是指项目投资历史记录,包括已完成的投资和未完成的投资。波动率数据是指过去一段时间内发生的波动程度。序列数据可以通过对项目投资历史记录进行建模,得到历史时间序列;波动率数据可以通过对波动率进行建模,得到未来波动率。

基建项目投资市场趋势预测的挑战

数据质量指的是数据的准确性,主要有两个方面:一是数据格式的正确性,比如文件是否包含了所有关键字、日期格式是否正确等;二是数据质量,比如数据是否能完整地反映用户在某一特定事件发生时的真实行为。用户隐私则主要指用户的个人信息是否被收集、使用,是否会被用于非法目的等。

基建项目投资市场大数据的主要来源是政府网站、企业网站、行业网站、新闻媒体等。如存在数据缺失,则无法进行预测分析。同时,基建项目投资市场大数据存在一定的隐私泄露问题,例如客户信息和业务信息等,这些数据的泄露不仅会给客户带来不便,还会影响整个行业的发展。因此,对于基建项目投资市场大数据的采集与分析需严格遵守法律法规,并充分考虑客户隐私保护问题。

模型的准确性和稳定性是决定模型预测结果好坏的重要因素。模型通过采用多指标评价法,对三个评价指标进行了权重的确定,并采用加权平均法确定各指标的权重,最后结合灰色系统理论、BP神经网络和遗传算法对预测结果进行修正,从而保证了模型预测结果的准确性。在对市场走势进行预测时,分别利用三种预测方法进行了对比,结果显示三种方法均能较好地提高预测精度。其中采用BP神经网络模型预测精度最高,与其他两种方法相比其优势在于可以有效地避免神经网络容易陷入局部极小值和收敛速度慢的问题,使整个网络能够收敛到全局最优解。

目前,基建投资正处于高质量发展阶段。在结构上,更精准、更体系化地聚焦经济、社会、生态、安全等效益和功能;在模式上,基于严防隐性债务的大前提,更灵活、更高效益地发挥财政资金、社会资本、城投企业的组合效能。

在大数据的背景下,对基建项目投资市场进行深入分析,提出基于大数据技术的基建项目的可行性策略。通过对比国内外文献和实际案例,发现我国基础设施建设投资领域存在诸多问题需要解决与完善;同时目前国内对于投资产品市场还存在一些误区,并没有通过有效地整合资源、优化配置、提高效率等方面来实现对项目风险控制能力的提升。

(作者单位:中国城乡控股集团有限公司)

猜你喜欢
数据挖掘预测
无可预测
黄河之声(2022年10期)2022-09-27 13:59:46
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
探讨人工智能与数据挖掘发展趋势
不可预测
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
不必预测未来,只需把握现在
数据挖掘技术在中医诊疗数据分析中的应用
一种基于Hadoop的大数据挖掘云服务及应用