基于大数据的支票储蓄在贷款审查过程中算法分析应用

2016-05-14 00:40崔慧于晓康
数字技术与应用 2016年8期
关键词:大数据

崔慧 于晓康

摘要:本文从大数据的发展现状分析入手,讨论了大数据的支票储蓄在贷款审查过程中的数据分析,分析了大数据经济学在贷款审查过程中的数据分析与研究,最后对贷款审查过程进行了展望。大数据,不仅将理论、实验、复杂现象统一在一起,而且将将理论与应用完美的统一在一起,本文利用大量的数据分析,阐释了微观变量对贷款审查过程中时的影响。进一步的将宏观经济变量纳入研究范围。一方面,可以研究宏观变量和微观变量如何共同决定住贷款审查过程中的问题;另一方面,可以研究在不同的宏观经济形势下,贷款审查过程中的决定因素和银行审查决定因素的规律和变化情况,从而为银行在不同经济形态结合大数据的特征,在分析研宄传统数据挖掘的基础上,将聚类算法与基于基层的聚类算法相融合,并且提出一种混合型聚类算法。该算法能够避免其他算法中心的问题,对处理后的数据进行从下而上的分,最后使用R语言工具对算法进行仿真,证实了算法的合理性与有效性。

关键词:大数据 支票储蓄 贷款审查

中图分类号:F832 文献标识码:A 文章编号:1007-9416(2016)08-0134-01

1 大数据给带来的影响

由于搜集数据的条件所限,大数据研究对象在总体传统经济学研究中,人们对数据进行抽样,再用少量样本来进行研究,这一传统一直延续至今,并且成为经济学研究中的主流做法.但是抽样的质量非常不稳定,异常情况较多。在大数据时代,很多场合下已经直接将总体作为研究对象,从而改变了数据来源方式,对数据的处理也产生了深远的影响。

1.1 大数据不需要基于假设检验的研究

在大数据时代,可以采用人工智能来得到的结论。大数据时代重在对数据处理的样化结果进行分析。此外,由于变量的完备性要求比较严苛,需要考虑的不仅仅是研发投入,还要考虑资本结构、竞争、人员、行业等诸多因素从而使研究重心不容易掌握。

1.2 大数据使得因果关系变得不太重要

传统经济学重在对经济现象进行解释,但在大数据时代,这样是不够的。大数据甚至可以发现事物发展潜在的规律,具有一定的“智能性”,超越了经济学研究关系。大数据并没有改变因果关系,而是使因果关系变得不太重要。比如经济学家在预测房价时,根据住房价格变化的因素来进行分析。但谷歌预测房价时,根据住房搜索查询量变化进行预测,结果比经济学家的预测更为准确及时。

1.3 传统的因果关系有时无法验证

弄清事物之间的内在联系,一直是传统经济学研究的重要范畴。便宜购买旧产品,短期内会造成旧产品供不应求,反而导致旧产品涨价。是涨是跌,要采用传统经济学研究方法,这样是难以验证这两种效应的,只能验证两种效应作用的综合结果。

1.4 传统经济学研究具有滞后性

传统经济学对于新生事物有不敏感的特性,须等事情发生到一定规模以后,才能搜集到足够数据再进行相关研究。在大数据时代,可以通过海量数据对经济行为进行分析,一旦有新情况、便立即予以关注,从而实现对新生事物的早期干预和分析,具有前瞻性。

2 支票储蓄账户现存问题

2.1 人们心理上的因素

在我国消费市场上,人们长期习惯于单一的现金结算,而个人储蓄支票的不断拓展使用,改变了传统的支付方式。这会在人们思想上产生多重顾虑,担心一旦出现空头支票、假支票等情况,会在银行企业、消费者三方之间引起经济纠葛。人们的这种心理因素是制约储蓄支票业务发展的主要障碍。

2.2 章则制度上的因素

现行个人支票的章则制度和管理办法是完全照搬对公存款的办法,由于对象不同,这种生搬硬套必然造成管理过死。

2.3 支票设计技术上的因素

目前,个人储蓄支票在设计技术上存在一些问题如支票上没有开户银行的地址及电话号码,企业不易查询、核对另外,支票背面也未写明使用要点,这些极容易使接受单位产生重重顾虑,担心是否空头支票。

3 审查过程数据分析与研究

3.1 数据挖掘算法的选择

数据挖掘算法的选择由于数据挖掘算法涉及的学科以及技术有很多,所以对数据挖掘算法的分类有多种不同的描述。根据挖掘任务的不同,可以将数据挖掘算法分为分类、预测、聚类、关联规则、异常和趋势发现等类型。

3.2 基于层次的聚类算法的研究

3.2.1 基于层次的聚类算法

基于层次的聚类算法是一种将原始的数据集合按照层次不停地分解的一种方法,基于层次的聚类算法又可以分为自下而上的凝聚的聚类方法和自上而下的分裂的聚类方法。分裂的聚类算法跟凝聚的聚类算法相反,在层次遍历开始前将所有的数据都归结于一个聚类当中,然后按照事先设定的分裂规则进行聚类的分裂,_所有数据都单独成为一个聚类或者满足终止条件为止。

3.2.2 基于层次的聚类算法的优劣

基于层次的聚类算法跟上文中介绍的基于划分的聚类算法有所不同,它起初是将每个数据结点都当作一个初始聚类,然后根据聚类间的距离依次进行合并,这样的好处是不用随机选取初始聚类中心,能够减少一定的聚类误差,但是合并之后的聚类将无法再分离,这样会降低聚类的灵活性,并且将在一定程度上大大增加程序的运行时间。

4 结语

大数据将是21世纪经济学的重大进展之一。它是随着大数据在人类经济社会中的应用而产生的,目前尚处于萌芽阶段,其实践远远超越理论,可以预见的是,不久的将来是大数据经济学的理论建构和高速发展期,大数据经济学理论可以随时得到检验和修正。目前,整个平台的任务流水线水平还有待提高,进一步提升平台的智能化与自动化。随着业务量与数据量的加大,普通的数据存储模式急需改变,引入相应的数据存储与替换规则都是需要进一步研究与实践的。目前,移动互联网还处于高速发展阶段,很多与移动互联网相关的技术还处于发展与探索阶段,而且随着移动互联网的继续发展,开展的业务必定会更加复杂,更加广泛,移动数据也将更加海量,更加多样。

参考文献

[1]库波,晁学鹏.一种用于网站用户行为分析数据的可扩展协同聚类算法[J].科技通报,2013,29(2):67-69.

[2]叶猛,胡凯.基于TD-SCDMA/WCDMA网络的用户行为分析系统[J].移动通信,2010(2): 80-83.

猜你喜欢
大数据
基于在线教育的大数据研究
“互联网+”农产品物流业的大数据策略研究
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路