大数据技术在金融统计中的应用

2022-11-04 18:33张弘毅
中国管理信息化 2022年13期
关键词:血缘金融指标

张弘毅

(上海财经大学 信息管理与工程学院,上海 200433)

0 引 言

随着互联网时代的到来,金融统计领域出现了不少问题,特别是财务数据分析结果在满足全面分析和社会需求方面遇到的困难,统计数据只是一个简单的数据汇编,缺乏数据的直观显示,没有反映金融市场的未来发展趋势,也无助于金融统计的分析。所以,在分析财务数据时更多使用大数据技术,将有效提高金融统计提供服务的能力,并为金融行业宏观经济决策和趋势研究提供全面和可靠的信息。提升金融服务管理水平,需要金融统计分析工作给予支持和帮助,这样才能提升管理质量,优化服务模式。大数据技术具有的优势可以为金融统计工作提供巨大的帮助,促进其工作效率和工作质量不断提升,因此,需要对大数据技术在金融统计工作的应用策略和方法进行深入研究和探索。

1 大数据概述

大数据指的是信息量较为庞大无法应用传统的数据库来实现分析和管理功能的数据集合。普遍来说,大数据指的是巨大数量的数据集,无法使用传统的数据库工具进行分析和管理,大数据的概念分为三个层面,包括现象、理念以及技术。大数据体现了自人类社会进入信息时代以来大量数据积累的现象,这一现象有四个主要特点:数据量多;在数据非常多的情况下,处理速度快并且具备实时处理数据的能力;无法用传统信息处理或分析工具来处理数据,数据具有多样性与非组织性;数据的准确性很高,因为大数据更重视原始数据和非组织性的数据,而不是经过处理的结构性数据。

对于大数据的内涵可以通过以下三方面体现。第一,社会发展进入到信息时代以后形成的具有海量信息的数据集可以称之为大数据,大数据的优势往往体现在容量大、类型多、处理速度快、真实性和可靠性高。①容量大指的是数据体量庞大,形成了一个大规模的数据集;②类型多指的是大数据包括语言、文本、视频、音频、位置等多样化的数据类型;③存取速度快,在面对庞大的数据信息时,能够对这些数据进行实时处理,不仅可以快速存储大量信息,而且可以快速从海量信息中提取所需信息;④应用价值高,指的是数据具有极强的真实性和可靠性,大数据重视的是原始数据,并不是经过处理后的数据。第二,大数据指的是在上述基础情况之上形成的一种分析问题的范式和理念,例如大数据理念可以反映在重视对相关关系进行探索,并非对因果关系进行探求;重视混杂性高于精确性;重视对所有信息进行分析,而不是对随机样本进行分析等等。通过对这些理念进行分析可以看出,大数据分析与计量经济学和统计学的研究范式具有差异性,因此其成为当前时代统计决策的最新方法。第三,大数据是一种先进的对海量数据进行有效处理的方式,如常见的存储、分布式处理等等。大数据在这些技术的辅助作用下使其理念得到落实,并将大数据的真正价值充分体现出来。

2 大数据技术在金融统计中的应用策略

金融行业是一个典型的信息密集型行业,以各种数据形式记载、管理和流通大量信息。由于大数据具有可以采集、分析、储存海量信息的优势,所以,金融行业需要构建更加标准化、科学化的金融数据统计模式,完善基础设施建设。基础设施一般包括管理软件和运维、计算机存储硬件、网络、数据中心等。目前,我国金融部门正在进行金融信息的收集工作,这是一项艰巨的任务,需要使用大数据方法进行金融统计。

数据提取和应用的创新方法。中国银行的大数据来源包括半结构化和非结构化数据,例如文字和图像,要不断探究如何提取和使用数据,例如将传统银行家的数据转换为收集银行家的情绪,使用DATA 方法预知银行机构的工作。加强数据提取和分析应用能力,探索内部数据提取和利用外部资源安全整合数据的解决办法。

加强搜索技术的应用。例如,通过促进开发基本技术,如网站搜索技术、知识计算(搜索)技术和知识库技术,将多维关键词的搜索纳入经济和金融预测框架,提高预测经济和金融趋势的能力。

加强金融统计的标准化。统一的数据标准是数据处理的基本先决条件,不类似的数据无法合并和比较。目前,不同的金融机构之间的统计指标各不相同,应作出重大努力,实施金融统计标准化,统一有关金融基础设施、标准、分类、金融机构代码、金融工具和金融交易等基本统计要素定义的规则。

加强大数据应用中的隐私保护和信息泄露风险防护。保护信息安全是发展财务数据基础设施和使用大数据技术的先决条件。建立保护大数据隐私和信息安全系统,制定数据安全框架,涵盖数据收集、数据转移、数据储存、数据销毁的各个阶段,加强信息安全防护能力,并密切保护信息数据的安全。

3 在知识图谱技术基础之上开展金融统计指标血缘分析

3.1 知识图谱数据模型

知识图谱是Google 公司为了提升查询精准性以及搜索引擎的相应速度而在2012 年公布的一种新技术。在应用知识图谱技术之后,搜索引擎的速度得到了提升,不仅能够对用户查询隐藏的语义信息进行洞悉,同时还能更加精准地做出信息反馈,使得用户在查询过程中得到了极大的满足。所谓的知识图谱其实就是一种类型各异的图像,可以将知识的结构以及发展进程显示出来,在此过程中会借助可视化技术的优势来描述知识资源,同时还会深挖知识和相关载体的关系,并对这些内容进行分析,最后绘制出一种以“实体、关系、实体”三云组为表现形式的图像显示出来,其特点是赋予字串新的意义;根据用户的搜索次数来扩大范围,从而获得更多的信息和内容;具有搜索连贯性;有助于用户查找更加精准的信息;通过关键词找到相关的知识体系,并将其形成关系网络展示给用户。

3.2 金融统计指标血缘分析的可行性

第一,金融统计特点。一方面,数据规模大。以人民银行金融统计系统为例,其每年采集的各大银行机构的数据总量保持在十亿以上,可见数据规模如此庞大。与此同时,每月通过对标准化存贷款进行抽样调查以及对理财信息数据进行统计等都会获取庞大的数据信息。另一方面,金融统计还具有多维度的特点。金融统计数据体系具有多层次性,主要表现在金融统计层面(内容有精准扶贫贷款、金融市场统计、货币供应统计等)和制度性调查层面(内容有城镇储户问卷调查、银行家问卷调查等)。通过金融统计监测系统采集的数据来看,数据已经达到了八千多项,由此可见其数据维度较为广泛。

第二,金融统计分析的劣势。金融统计工作是一项复杂而系统的工作,需要统计人员能够从海量信息中快速准确地提取有价值的信息。金融统计分析的劣势往往集中体现在以下方面:数据分析中未能充分体现大数据思想、缺乏数据挖掘力度、未能合理利用先进的数据分析技术等方面,对充分发挥统计分析决策作用造成了巨大的影响。因此,必须要在创新统计模式的过程中充分发挥大数据的优势作用,只有这样才能帮助金融统计数据实现最大化的应用,有助于应用效果的提升。

第三,血缘分析具有的优势。血缘分析是一种借助历史记录来显示数据来源以及数据处理过程等,同时获得最终数据血缘关系的一种方法。对金融统计指标采取血缘分析法可以在指标数据出现变化的时候利用血缘关系来对数据来源进行快速定位,并对数据处理过程进行探究,以此来简化数据分析流程,降低其工作难度,同时还有助于提升数据分析的准确性。血缘分析具有的优势一般体现在:一是当数据库软件工具不能对数据量进行处理的时候,在超出自身能力范围之外以后,采用血缘分析来对数据来源进行追踪,最终确定问题数据的具体位置,并及时梳理数据之间的逻辑关联。二是在进行统计的过程中,如果人民银行和各银行在统计指标中使用的名称编码与名称不同时,就要利用血缘分析方法来判断他们之间的关联,这样有助于降低在标准统计中因为银行客户端而带来的工作难度。三是,在对大规模的数据进行波动分析时可以充分利用血缘分析法。通过此种分析方法不仅有助于提升分析水平,同时还有助于提升金融分析的全面性、真实性和可靠性。四是,血缘分析可以应用到多层级关联、股权结构、资金穿透管理等方面,并能实现更好的发展。

3.3 金融统计指标血缘分析

根据上述提到的知识图谱,可以结构其三元组来对金融统计指标之间存在的关系进行清晰的描述,并对指标之间产生的影响性进行分析,同时还要构建数据血缘关系。本文以人民银行金融统计月报资产表为例来对金融统计指标血缘进行分析,通过构建指标三元组,对各项数据指标进行了整体梳理,构建出大量三元组,其中有三分之二属于实体数量,只有三分之一属于主语数量。以金融统计月报表中显示的资产类指标和负债类指标为例,在Neo4j 的基础之上对他们之间的血缘关系进行查询,同样利用此方法也可以来刻画出不同的统计报表和统计指标,从而构建出可以体现金融统计指标范围的关系网络。这对于统计数据质量管理、统计指标识别以及统计数据分析而言具有重要的意义。在构建好可以体现金融统计指标范围的关系网络后,可以从中随意选取一个具有代表性的指标,然后对该指标的血缘关系进行查询,可以得到血缘关系图,并将其应用到如下场景中。一是,在通过对上述血缘图进行分析之后,根据图中的相关信息发现数据出现变化的环节,并对其进行分析,找到影响数据变化的真正因素,同时对最终的数据变化情况进行正确的评估,并确保数据分析工作具有全面性、可靠性和真实性。二是,统计人员要针对上报过程中金融统计数据出现的遗漏数据等问题进行修改和调整,同时还要结合血缘关系图分析需要修改的具体数据,无论出于何种工作环境中,这都是一项重要的工作。

4 结 语

综上所述,金融行业作为我国经济发展过程中的重要支柱产业,其发展速度和统计模式都对我国的经济发展产生了深刻的影响。为了使金融机构能够满足智能时代的环境发展需要并促进金融统计分析的完善,必须改变它们的思维方式,确保大数据分析的有效作用,并进一步优化金融统计服务。通过分析大数据,可以从大信息中获得有用的信息,确定金融行业的前进方向,获取关键信息,为金融行业的发展提供准确的数据信息,并全面发挥大数据分析在金融统计中的作用。对金融统计的分析具有一定程度的专门性和系统性,需要不断提高应用大数据技术的专业能力,并在实践过程中通过大数据技术更有效地进行金融统计工作。因此,要在智能时代背景下更好地发展金融统计,就必须在不断改进金融统计工作能力的基础上,对大数据技术进行更好的分析,并为有效开展金融统计工作提供必要的支持和保证。进入大数据时代之后,大数据技术的普及应用在很大程度上改变了金融统计模式,因此,金融业要想与时俱进,推动社会经济发展,需要转变思想观念,利用新技术和新方法来创新金融统计工作,并保证大数据技术的优势作用可以在金融统计分析工作中得到充分的发挥,促进金融统计分析工作能够实现快速发展。

猜你喜欢
血缘金融指标
一类带临界指标的非自治Kirchhoff型方程非平凡解的存在性
爱与血缘的较量
牛犊错牵难以要回 血缘鉴定确定归属
何方平:我与金融相伴25年
最新引用指标
莫让指标改变初衷
君唯康的金融梦
P2P金融解读
Double图的Kirchhoff指标
金融扶贫实践与探索