◎汪涌泉
以Page Rank模型分析数据挖掘在金融领域的应用
◎汪涌泉
数据是金融部门的工作人员每天都要接触到的工作,金融部门的业务都会产生大量的数据,随着技术的不断的发展,利用数据库系统的管理可以有效的对产生的数据进行管理,但是却无法察觉到数据之间额关系以及规则,无法根据现在所存在的数据去推测未来的发展,更有可能会导致数据爆炸问题的出现,本文将通过对数据挖掘的简单介绍,简述数据挖掘技术在金融领域中的应用。
在金融领域当中,金融机构的运作存在着必然的金融风险。风险管理对于每一个金融机构而言都是一项必不可少的重要工作。一般的金融管理手段缺乏一些数据挖掘所隐藏的知识手段。在金融行业当中,有效的利益数据挖掘技术不但可以发现大量数据中所隐藏的一些必然关系,还可以很好的将金融风险降到最低。
数据挖掘的定义。近几年来,数据挖掘引起了信息产业的高度关注,这其中最主要的原因是其存在着大量的数据,可以被广泛的应用,并且还可以通过需求将这些数据转化为有用的信息和数据,获取到的信息和数据可以被广泛的应用的到各个领域。
数据挖掘主要是指从大量的数据中通过一定的算法查看到数据中所隐藏的信息的一个过程。数据挖掘技术主要包含统计技术、计算技术以及人工智能技术。可以把数据挖掘看作是统计技术的一个延伸。对于大多数的统计技术而言,基本上都是基于数学理论和技巧,它的预测度所达到的准确率可以在一定的程度上满足人们的需求,但是,这种技术对使用者具有较高的知识要求。但是,随着计算机技术的不断发展,数据挖掘技术可以通过相对简单的方法和技术来实现同样的功能。获得更好的分析效果和消息。
数据挖掘的方法。从数据挖掘技术角度来看,主要的方法包括:
决策树法:顾名思义,主要是利用树形结构进行决策的集合,这些决策的集合是通过对数据的分析而得来的规则。出现在国际上最早也是最具有影响力的是ID3方法,后来才发展的其他的方法。
规则归纳法:通过统计的手段对数据进行归纳,从中提取出有效的规则。规则归纳技术在挖掘技术的领域中被广泛的使用,使用最多的是关联规则法。
神经网络法:以模仿生物的神经网络为结构,构建三种神经网络的模型,这种方法可以完成多种类型的数据挖掘任务,例如分类挖掘、特性挖掘等任务。
遗传法:主要是通过模拟动物的进化过程而演变出来的算法,主要有三个基本的算法组成。为了更好的使用遗传算法,需要将数据挖掘的任务的表达进行转换,形成一种搜索的问题,从而发挥出遗传算法的优化搜索能力。
可视化技术:将信息模式、数据的关联或者趋势等通过直观的图形方式来进行相关的表达,使用者就可以通过对可视化技术的交互来对数据进行分析。可视化技术的使用,使得用户可以更清楚的对数据进行解析。
到目前为止,在很多的领域,数据挖掘是一项比较新鲜的技术,尤其是在银行、电信、保险甚至交通等商业领域当中。数据挖掘技术的使用可以很好地且有效的解决一些比较典型的商业问题。例如:客户群的划分、数据的营销、交叉销售等一系列的商业问题以及市场分析行为。
数据挖掘在银行行业的应用。银行在一天中就会产生大量的数据,银行业可以看作为是一个负债经营的商业产业,在获得大量的利益的同时,风险程度也会随之加大,两者是并存的。如何降低一个银行所存在的风险,就需要对账户的信用进行有效的分析。利用数据挖掘技术进行的信用评估最终的目的就是降低风险,提高收益。
以PageRank模型在银行的应用为例,PageRank对网页的排序具有三大优点:排序和特定的搜索关键的词没有关系;网页的排序和网页中的所呈现的具体内容没有关系;只需要知道网页所对应的图结构。例如在银行的汇入金额的排序问题中,我们不难发现随机冲浪的模型可以在一定的程度上有效的客服数据缺损等方面的困难。
类别PageRank算法,我们可以在综合方面考虑每项业务的等级划分,然后再根据等级划分来确定最后的排序问题。可能表中会包含非常大的数据量,从不同的层次进行最后的排序和分析,我们会发现在最后所建立的随机冲浪模型会很好的分析出数据中参数的稳定性是否良好。
数据挖掘在保险行业的应用。保险行业涉及到数据挖掘技术的主要是两方面:业务中保险金的确定和险种之间的关联关系的分析。
保险对每一个受险的人员的分类可以有效的确定保险的金额度。通过数据挖掘技术,业务员可以了解到对不同的行业、不同年龄、不同工作层次的人员的保险金的额度,从而更加方便的工作,提高工作的质量。
对于险种的关联关系分析而言,数据挖掘技术可以对已经购买过保险的人员进行分析,查看其是否还可以与此同时可以同时购买其他类的保险。
数据挖掘在证券行业的应用。证券行业中对数据挖掘的使用主要表现在分析客户、管理客户、分析交易数据以及分析交易风险等方面。
从证券营销的角度分析的话,证券主要是为了满足客户的需求而做出的一系列的金融活动,营销的战略会贯通到整个证券交易的过程中,而对客户关系的分析以及管理是国内的证券行业所比较关注的问题以及技术,数据挖掘技术在这其中占有核心的地位,业务人员是否真正的了解客户,是否能够准确的判断出此次的交易是否可以带来利益等等诸多的此类问题,都可以通过数据挖掘技术得到想要的答案。数据挖掘在改变看待客户的角度的同时,还为业务人员以及整个的营销部提供着可靠的依据。
信息技术的飞速发展,金融行业越发的繁重,作为一项先进的数据挖掘技术在金融行业的应用,促进金融行业发展的脚步,降低金融行业所存在的风险,对金融行业的发展起到保驾护航的作用,占有着不可忽视的核心地位。
(作者单位:天津水运工程勘察设计院)