刘有锦
【摘要】互联网金融新贵—余额宝的出现,立刻引起剧烈的社会反响,对金融也和互联网业有了一个新的诠释。在信息技术迅猛发展的今天,云计算、大数据处理等相关技术的出现,实现了互联网金融的良好发展目标。本论文结合余额宝大数据,提出了余额宝大数据挖掘模型,并分析了余额宝应用大数据成功应对单日申赎的状况发生,展示了大数据强大优势。最后对大数据发展趋势做了简要介绍,并分析了余额宝大数据发展。
【关键词】余额宝 大数据 数据挖掘 发展趋势
一、引言
信息技术的快速发展和升级,互联网技术延伸到人类社会各个方面,在此过程中积累了大量的数据资源,人们开始从大量数据的挖掘过程中获得收益,不断的推动了云计算和大数据产业的发展。互联网金融发展战略要从增长型战略、挽回型战略、攻击型战略和防范型战略等层面做工作。将这四种战略要联合起来结合企业自身发展战略而统筹思考,不能相互割裂。由于政策的有利性,推动了新型的互联网金融有效的同传统金融方式健康的开展竞争与合作。
二、余额宝的大数据优势挖掘
(一)数据挖掘概要
数据挖掘(data mining)是从较多的数据中搜寻出符合其发展现状的策略,这一策略综合运用了计量学、大数据和人工智能等相关的比较先进的技术。数据挖掘是自主的从大量的数据信息中选取形式、联系、变动、反常的架构;数据挖掘最重要的意义是采用数据搜集手段革新预测模型。数据挖掘基本工作步骤是:
1.明确问题:明确所需要解决的主要问题,规定数据挖掘的意义所在。
2.确定数据:这一过程主要有:筛选数据—在数据库中搜寻出需要用到的数据信息所在的位置;数据基本设置—对搜寻出的数据进行初步加工,既要确保搜集数据的完备性、还需要对有所缺失的数据进行补充、剔除没用的数据。
3.数据挖掘:按照搜寻到数据的类别以及数据的特征选用正确的计算方法,在数据挖掘过程中应该保证数据的完整。
4.数据分析:对搜寻出的数据要做出分析和诠释,翻译成可以被公众掌握的内容。
5.内容的使用:要把搜集并整理好的内容整合到可以被运用的信息框架中去。
数据挖掘通常情況下采用决策树手段、搜集手段、采取正例剔除反例手段、计量评价手段进行。
(二)余额宝大数据挖掘应用案例及优势分析
利用所分析的大数据,对余额宝在关键日期中的用户情况波动进行预测,保证基金安全和客户的收益。
2013年“双十一”狂欢节前,商家纷纷备货,买家摩拳擦掌。与此同时,受到大家广泛关注的我国出现的第一个网络基金来说,也是一大考验。
面对即将可能发生的史上最大单日赎回,天弘基金借力大数据优势,这给了天弘基金发挥自身优势的一个平台。天弘基金的库户数量巨大,交易次数非常多,每一个客户的参与两少,行为不统一,每一个参加人员都是独立的个体,由此形成的大数据,形成的未来发展方向相比较来说比较稳定。避免了传统基金出现的受制于组织资金的困扰。
其实自增利宝成立以来,天弘基金就一直在用大数据分析指导投资,实践表明预测误差很小。双十一有大量消费行为,这是已知信息,天弘的数据挖掘团队早已做好了充分预估并合理安排。
阿里的客户数据,有上千个维度,对这些数据的深入挖掘,可以对客户需求进行更加深入、准确地刻画,从而对基金的流动性做出更加长期、准确的预测,无疑将成为余额宝提升投资管理水平的利器。
对客户需求的充分挖掘、分析和储备,这对传统公募基金来说是盲点,但对天弘基金而言,大数据优势凸显。
三、余额宝的大数据发展趋势
(一)基于云的数据分析平台将更趋完善
企业越来越希望能将自己的各类应用程序及基础设施转移到云平台上。就像其他IT系统那样,大数据的分析工具和数据库也将走向云计算。
第一,大数据的发展依赖于云计算,扩充的范围比较大、所使用的存储范围相对廉价,很多的中小企业也能够实现大数据的运用。
第二,云计算所拥有的资源数量巨大、涉及的范围相对较广,能够帮助企业及时高效的对数据进行处理。
(二)数据分析范围扩展,以企业为单位的数据库为主
在人们意识到大数据带来的优势之后,数据分析的范围得到进一步的扩展。就当前来说,很多企业所选用的数据数量所用的基本单位是TB。如果保持当下数据的进步速率,在很短的时间内会完成向PB时代的迈进。尤其是在100-500TB和500TB以上的数据分析范围会出现3倍甚至4倍的增加。
由于数据分析范围的不断扩展,之前通用的部分级别的数据库已经无法达到要求,真能倍汇编入以企业为单位的数据库中。依据相关调查发现,到目前为止已经有超过60%的人使用这种数据库,在今后还会有更多的人加入到这一行列,传统的数据库只有进行适当的调整才有可能继续使用。除了数据库和操纵性的数据储存相应的减少,还需要提高原有商户的数据量,对数据进行细化并完善数据类型,来应对用户日益提高的需求。
(三)更多人使用大数据应用
大数据的价值在于应用和普及,而不仅仅是数据科学家手里的高深工具。未来越来越多的人都都将能够使用大数据应用,例如开发者。创业公司Continuuity、Infochimps甚至Precog(大数据BI引擎)都在开发面向开发者的大数据工具,使开发者能更容易地将应用与大数据后端对接,这方面的工作大大简化,有时候开发者只需要在程序中植入一个脚本或者一段代码。
大数据应用普及的另外一个趋势是产品化,针对特定应用场景开发出开箱即用的大数据产品,例如分析用户行为、网络安全、人工智能、客户服务等的大数据应用。最早采用大数据技术的公司如Google、Facebook等需要自行开发相关大数据应用,但是对于更多的企业来说,现成的产品才是引爆大数据商业价值的关键。其实今天很多移动或互联网应用中都已经有了大数据的影子,从用户购买决策到好友匹配等。
(四)移动数据将成为人工智能(AI)的引擎
在天网发动机器推翻人类统治之前,我们手里的移动电话已经比我们自己更了解我们的下一步举动。Google的Project Glass增强现实眼镜已经出炉,类似的移动应用将捕获和产生大量个人数据。而机器学习、语音识别等技术,则能帮我们充分利用这些数据。
如今,移动应用知道我们去哪,我们的朋友是谁,我们的日程是什么,我们在网络上搜索什么。新一代应用如Siri、Saga和Google Now都试图扮演智能个人助理的角色,我们的电话知道我们在说什么,了解我们常去哪家餐馆吃饭,知道我们何时回家,工作或郊游。这些应用的开发者声称这些应用能为用户选择最佳赴约路线,城里某处有家从未光顾过的餐馆有我们最喜欢的菜。
一场大规模竞赛已经启动,开发者比拼谁的应用最智能,整合的数据最全面,以及如何在四寸大的屏幕上交付最美妙的用户体验。
参考文献
[1]王璐.“余额宝”引爆互联网金融[J].投资北京,2014(2):90-92.
[2]刘源.余额宝的扩展解读及互联网金融展望[J].商业会计,2013(22).