马荣昌 对外经济贸易大学
随着大数据技术向各领域的延伸,各领域业务范畴不同,技术应用方式也有所区别。大数据技术概念Apache Hadoop组织认为,在互联网普及的今天,大数据是处理大规模的数据集的一种技术形式。麦肯锡环球研究院认为大数据是打破传统数据库软件对数据集的获取和存储功能,实现智能管理和分析。李金昌认为,大数据建立在现代信息技术基础上,实现自动获取数据、存储和连续扩充的类型数据。其中大数据体现在形式上更加灵活、便捷等。
19世纪,我国金融领域的统计有了初步概念,MFS将金融机构和非金融机构的相关流量在整体经济体系中进行数据统计,诠释了社会货币资金的各种融通活动的统计内涵,其中除了融资主体以外还包括中介机构、形式、网络场所等,金融统计更加关注货币资金流动量、结构、余额和去向。金融统计监测管理信息系统目前运用COGNOS作为底层开发基础,确保数据CUBE实时更新,确保金融统计数据即时性,由于金融统计数据监测管理系统内部包含3 600种报表模板定义,根据数据使用者需求,可以生成不同组合形式。
金融统计属于统计学范畴,按照属性区分,首先,统计学着眼点趋于宏观的数理统计和经济统计,而金融统计更加注重实际操作,运用专业软件和数学模建等形式,推动金融领域更加快捷、高效开展工作。其次,发展方向区别,统计学重点对经济统计,更加注重学术研发等方向,而金融统计学是利用计算机软件在金融领域发挥实际作用,侧重运用统计知识来指导实际生产活动。
大数据对金融统计中的数据采集、处理、分析以及整体造成一定影响,相关领域人员应针对当前业务范畴不断获取最佳金融统计方案,避免大数据技术对金融统计产生负面影响。
大数据技术较传统统计数据提高了数据采集的难度,由于大数据技术的在金融领域的深入,非结构化数据量随之增多,较传统结构化数据相比占比逐步增加,非结构化数据在采集过程中由于缺乏成熟的技术采集手段,降低了各项参数的精准性。同时,大数据技术还降低了人工采集数据效率,在采集方法不变的情况下,提高了数据采集难度,部分企业还没有完全转换为大数据统计技术,由于人员有限,面对大数据呈现出的大量数据信息,直接影响数据采集效率,为了保持原有工作效率,还应增加人力成本,因此,还应不断优化人工采集方法,避免大数据技术的出现影响人工采集效率。最后,由于传统人工采集需要从各类数据中挑选出对应的参数,在互联网的作用下,大数据技术实现数据自动筛选功能,提高数据采集的时效性,运用先进的采集方法,促进采集效率的提升。
首先,大数据技术呈现出海量的数据信息,相关参数应从海量数据中妥善筛选,数据储存空间随着技术的发展不断更新迭代变得空间加大。由于金融统计业务开展离不开数据储存,传统数据储存空间较小,随着业务量的增加数据无法保存,随着大数据技术的发展和推进,对数据库存储空间要求也随之增加。其次,提高了数据检索、汇总的效率,由于大数据技术逐渐代替的传统金融统计工作,而半结构与非结构化数据占比随着大数据技术的深入数据体量加大,提高了数据处理工作量,有效数据筛选难度加大,且存在一定误差,影响数据处理的有效性。最后,由于大数据技术会产生大量数据信息,为了从中筛选有效的参数,剔除掉无价值信息,随着数据量的增加,大数据价值密度低的弊端,增加了有用信息的筛选难度,陷入无用信息干扰境地。
首先,影响了统计分析方法的有效性,随着大数据技术应用在金融统计工作中,非结构化数据的增加,致使传统数据处理方法处理非结构化数据,增加了数据处理难度,分析所采用的数据不完整,影响分析方法的有效性。其次,由于数据分析处理过程中的软硬件不能随时更新,处理方式固化,只能驾驭传统少量的数据分析,大数据技术生成海量的数据信息,一时间软硬件处理能力很难应对,降低了工作效率。最后,弱化了统计报表的作用。由于人们思维方式的转变,大数据技术背景下,需要全面掌握动态市场信息,对金融风险实行预警机制,传统金融统计工作不能满足当前报表使用者需求,影响分析效果。
大数据对金融统计整体影响正向分析,可以促进金融统计数据的精准性,虽然对数据采集、处理和分析环节分析多以负面为主,但随着软硬件设施更新到位后,相关技术措施准备充分,大数据技术可以从多个维度确保金融统计数据的系统性、全面性和精准性。我国各大银行金融体系运用大数据技术,规避了一些不良影响,扩大了优势范围,通过建立大数据平台,提高互联网技术水平,各类数据信息在数据库平台可以实时更新便于查找,非结构化数据的处理效率增加,运用新媒体信息技术、终端人脸识别技术、录音文本等,保障了数据安全,有效规避客户损失。
首先,大数据对金融统计数据采集的影响因素,一方面是提高了数据采集难度,增加了金融统计的即时性,降低了人工采集的效率。其次,对数据处理影响体现在存储空间加大,汇总、校验等降级了总有效性,数据清晰难度增加。最后,大数据对金融统计数据分析的影响,主要体现在软硬件的处理能力,降低了统计分析效果,弱化了统计报表的作用。
首先,数据收集与样本结构的说明,通过调查问卷的形式对相关数据信息做影响程度分析,其中包括基本信息和策略型的问项,通过调查样本可以清晰了解到被调查者的区域分布、单位分布、对大数据技术的认知程度、金融统计的认知程度等。结构较为适中,可以对总体实行有效估计和统计分析判断。其次,运用SPSS19.0软件做数据信度和效度检验,Cronbach's Alpha系数均大于0.6,结果表明具有较高的可信度。
通过问卷调查的形式搜集相关数据,根据比例对每个影响程度的模糊子集隶属度计算隶属矩阵,根据权重向量后,进一步做多阶层模糊综合变换。根据三个层次分类的公式为根据AHP方法,计算二级指标权重第三层模糊综合变换根据最大隶属度原则,金融统计每个维度和总体之间隶属度等级影响较大,并按照隶属度从大到小,分别为影响较大、影响较小和无影响,结果显示,虽然大数据对金融统计影响被调查者认为较大的对整体影响不大。
首先,应构建金融业综合统计系统,根据当前银行、证券、保险等领域运用大数据技术建立综合统计系统,确保数据采集实现平台统一,结构多样化,便于现代化采集工具和计算机系统结合。做好数据挖掘,规范工作流程和操作规则。其次,要推进金融统计标准化建设,随着数据类型增多,数据量的增大,数据口径存在不统一或者数据记录缺失等问题,针对这一现状首先应对金融机构信息做标准化管理,其次应对金融工具信息做标准化管理;最后对金融计值单位做标准化管理。
大数据背景下,金融统计工作离不开统计工作队伍,为了与传统统计工作有效结合,应加强人才引进,以便开展金融统计工作。同时还要加强人才培养,针对金融统计工作范围,培训大数据相关技术知识,培养工作队伍的基本素质和创新能力。聘请大数据领域专家、学者深入金融领域参与有关学术讨论,提升金融统计工作标准,打造专业金融统计人才。
首先,应加强计算机硬件升级,数据量的增加存储和分析功能带来重大挑战,为了提高计算机运行的速度和可靠性,应加强存储硬盘的升级,促进计算机存储和分析能力,从传统的集中式计算变更为分布式计算,实行多个任务同时在多个计算机上处理,提高运算速度和分析能力。其次,计算机的软件升级,软件包括R、Scipy、SAS、SPSS等,其中有的需要编程的解决方式,有的需要分析解决,有的具备可视化操作效果,大数据技术融入了非结构化的数据,原有软件无法胜任当前运行要求,但由于金融统计工作的特殊性质,还应不断完善和改进软件。
近年来,随着大数据技术的不断深入发展,大数据技术已被广泛应用与各领域。金融统计工作融合大数据技术可以提高数据采集、处理和分析的效率,并从三个维度分析出影响金融统计的相关指标,为新时期大数据背景下金融统计工作明确工作方向,为管理人员提供新的思路和工作依据。