周晶平
(中南民族大学 计算机科学学院,湖北 武汉 430074)
商业银行在经营过程中,获得了大量的业务数据和客户信息,如何利用数据挖掘技术在这些海量数据中进行高层次的数据分析,为银行经营提供科学的决策依据是每个商业银行面临的问题.对于我国的金融机构而言,数据挖掘项目不是一个新鲜的话题,却是一个缺少成功答卷的命题.文中在分析银行客户关系管理系统的基础上,研究银行分析型CRM的体系结构、主要功能,数据挖掘过程和挖掘方法.探讨数据挖掘在银行分析型CRM应用中存在的问题和解决办法.
图1 银行CRM系统结构
我国商业银行采用计算机化管理已有多年,多种业务系统遍及省、市、县各级业务部门,数据信息在物理上较为分散,历史数据也极为庞大.因此,银行CRM系统可以采用分布式数据仓库环境,即所有分行均拥有自己的CRM系统,并与本地综合业务系统及呼叫中心连接.在总行建有CRM中心数据仓库,提供面向全行的分析决策功能,并为网上银行业务提供数据查询支持.网上银行的客户信息直接在总行的CRM数据仓库中集成,各分支机构可以调用总行数据仓库中的客户信息,银行CRM系统结构如图1所示.
银行CRM系统由业务处理、客户联系和客户关系分析中心三部分组成.客户关系分析中心则以CRM中心数据仓库为核心,数据集成系统与业务处理部分连接,同时为银行的管理层和业务分析人员提供客户分析服务.
图2 系统体系结构
2.1系统的体系结构分析型CRM系统的设计主要利用数据仓库、数据挖掘、联机分析等技术,其主要原理是将交易所累积的大量数据过滤,抽取到数据仓库,再利用数据挖掘技术建立各种行为预测模型,最后利用图表、曲线等对企业各种关键运行指标以及客户市场分割情况向操作型应用发布,达到成功决策的目的[1].银行分析型CRM系统体系结构如图2所示.
2.2系统功能分析分析型CRM的目的是帮助银行了解自身经营情况,准确地发现赢利客户和具有赢利潜力的客户,分析客户的消费倾向,帮助银行开发适应消费者需求的新产品,为银行赢得客户提供有力的保障[2].其主要功能包括:(1)对客户进行评价.分析谁是银行的客户,谁对银行贡献度大,根据风险收益对应理论,严格控制风险,争取最大收益.(2)客户流失分析.挽留一个已有客户的成本要远远低于争取一个新客户.银行通过CRM系统分析客户的嗜好、兴趣和注意力,根据客户的爱好调整自己的产品和服务,通过分析客户的抱怨、建议、咨询等信息不断改进自己的服务水平,赢得客户的满意,防止客户流失.通过分析客户对产品的应用频率、持续性等指标判断客户的忠诚度,从而对忠诚客户提供优惠服务.(3)防范金融风险,提高经营效益.通过CRM对不断发展的客户市场进行研究和评价,找出潜在的大客户和风险较大的客户,适时地选择恰当的市场准入和退出策略,及时做出积极主动响应,控制金融风险,使经济效益最大化.(4)为银行创新产品提供依据.通过CRM研究银行的发展趋势和市场的发展变化,创新金融产品和服务,争取在竞争中立于不败之地.
图3 数据挖掘基本步骤
3.1数据挖掘过程在银行分析型CRM中,数据挖掘是从大量的有关客户数据中挖掘出隐含的、先前未知的、对金融企业决策有潜在价值的知识和规则.数据挖掘的实施并不能一蹴而就,是一个循序渐进、循环反复、不断调整的过程.一般来说,银行CRM中的数据挖掘主要包括[3](如图3):(1)确定分析和预测目标.CRM在进行数据挖掘时,首先需要明确商业目标,即你想通过数据挖掘解决的问题,达到的目的.还要将准备解决的问题转化为可以测量的目标,即数据挖掘的成功准则.(2)数据选择.对基础数据进行了解和选择.比如,数据从哪里获得?数据仓库是否建立?内部数据是否可直接使用?数据哪些字段是必要的?通过数据选择可以对基础数据建立基本的可信度.(3)数据准备.对选择的数据进行必要的预处理、转换,以消除数据噪音,提高数据的完整性、准确性和可信度.(4)模型构造.这是数据挖掘的关键阶段,这一阶段的主要工作有:根据挖掘的商业目标,选择相应的数据挖掘技术,建立培训数据和测试数据,利用培训数据采用相应算法建立模型和模型解释.(5)模型评估和校验.使用测试数据对建立的模型进行测试,计算误差率,如未达到预期目标,则根据误差原因,重新回到模型构造或数据选择阶段,重复相关过程,直至找到满意的模型.(6)部署和应用.建立满意的模型后,就可以在整个企业内部署和应用模型.另外,在应用的过程中还要不断的测试模型的成功概率,从而完善模型.
3.2数据挖掘的常用分析方法在银行分析型CRM中,金融客户数据挖掘中的常用分析方法包括:关联规则挖掘方法、分类方法、聚类分析聚类方法[4]以及神经网络分析方法等.
(1)关联规则挖掘方法.关联规则挖掘方法主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生.关联分析的重点在于快速发现那些有实用价值的关联发生的事件.其主要依据是事件发生的概率和条件概率应该符合一定的统计意义.(2)分类方法.分类在数据挖掘中是一项非常重要的任务.类分析就是通过分析样本客户数据库中的数据,为每个类别做出准确的描述,或建立分类模型,或挖掘出分类规则,然后用这个分类规则对其他客户记录进行分类.分类模型也可用于预测.预测的目的是利用客户的历史数据纪录中自动推导出对给定数据的推广描述,从而对未来的客户数据进行预测.(3)聚类方法.聚类是把一组个体按照相似性归成若干类别,即“物以类聚”.聚类将没有分类的记录,在不知道应分成几类时,按数据内在的差异性,合理地划分成几类,并确定每个记录所属类别.它的目的是使得属于同一类别的个体之间的距离尽可能地小,而不同类别上的个体间的距离尽可能地大.(4)神经网络的分析方法.神经网络具有良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性,非常适合解决数据挖掘的问题,能产生较好的预测效果.
对于我国的金融机构而言,数据挖掘项目不是一个新鲜的话题,却是一个缺少成功答卷的命题.数据控掘技术在银行分析型CRM应用过程中存在一些问题,影响了系统的运用:一是银行花了很大精力建设的数据挖掘系统,没有用户或很少有人使用,二是数据挖掘的结果不能让人满意;三是系统灵活性不够.数据挖掘作为非平凡的发现和探索过程,其需求具有很强的不确定性,需求变更相对频繁.需求变更会涉及数据准备、模型算法及前端应用的一系列调整,使系统陷入疲于应付的状态等.
为实现数据挖掘在银行分析型CRM中的成功应用,应从以下两个方面入手.
4.1应用层面(1)加强业务部门与技术部门的联系与协调.CRM是一项业务管理战略,但这一战略的实施离不开技术的支撑,这就意味着技术部门与业务部门间必须密切合作,共同确定满足业务发展战略需要的技术与架构.对现有业务的理解往往决定着项目建设的成败,所以信息技术部门在部署相关技术架构时,还需要明确业务部门的需求及业务处理的优先级.因此,如果双方缺乏必要的合作,势必会导致CRM系统不能很好地满足企业整体业务的需求,影响CRM应用的效益.在项目实施过程中,组建一个由技术部门与业务部门共同参与的项目小组非常必要,这样更有利于实现业务与技术的双向沟通.
(2)注重挖掘过程.在数据挖掘课题中,大部分时间都是对问题的理解及数据的收集、处理和整理,对数据挖掘过程的掌握很重要.因此,数据挖掘技术应用于银行CRM系统的实践中,应注意本3个方面问题. ①要有明确的挖掘目标.数据挖掘并非是万能的,它必须在确定的主题下才能发挥好的效果.银行首先应该对涉及CRM系统的各类商业问题进行分类,选定合适的商业问题来分别进行挖掘处理;其次根据商业问题,从大量的银行业务数据中选择和识别这些数据,便于对数据进行有效处理,使之更加适应挖掘工具. ②前期准备工作至关重要.在数据挖掘的过程中,大部分时间都花在对问题的理解及数据的收集、处理和整理过程中.数据的质量决定挖掘结果的正确与否,在采集数据时应特别注意数据的准确性.③挖掘结果及时试用并反馈修整模型.挖掘结果的解释十分重要,结果要及时反馈到决策人,为银行的科学决策提供支持.同时,结果使用后要及时反馈给分析人员,以便对模型进行修正,为今后的数据挖掘提供资料.
4.2技术层面在银行分析型CRM中,数据仓库是数据挖掘的基础,如果数据仓库的数据质量不能得到保证,会严重降低数据挖掘的使用率和可信度,还可能给决策分析带来灾难的后果.如果数据挖掘能力不强,则系统不能满足用户要求.数据仓库和数据挖掘是银行分析型CRM应用中的两个方面.
(1)数据仓库.数据仓库是企业信息系统中最为复杂的部分,特别是银行、保险等金融企业,数据仓库系统必须汇集来自众多业务系统的数据,支持纷繁的业务分析,而且它还必须随着业务需求的变化而不断调整.因此,在数据仓库建设中,要注意的方面有:①数据仓库规划.数据仓库工程是为了满足对经营管理决策支持的需要,在整个企业范围内,建立统一协调的全局信息环境的庞大工程,是一项复杂的信息集成工程.在数据仓库工程中,涉及的业务和技术面都比较广,参加的业务部门多,头绪繁杂.如果没有一个统一的规划,很难保证项目的成功实施.规划应体现超前性,具有超前性的系统才会长久,才会更容易体现技术的先进性和业务的预见性.②元数据管理.数据质量直接影响数据仓库系统的生命力.在数据仓库系统中,元数据机制监测每次从数据源抽取数据的过程中,记录有关错误的统计信息,从而为系统管理人员提供数据质量的信息,因此,必须重视元数据的管理[5].对元数据的管理,比较完备的方式是利用现成的产品工具进行管理.没有工具时,元数据的管理体现为文档管理,文档的内容就是元数据,文档应做到多样、齐全,才能应付后续不可预见的风险.③ETCL(抽取、转换、清洗和加载)过程,后台处理系统是数据仓库系统成功的基础,在金融数据仓库系统中,它从其他各个业务系统中抽取数据进行转换、清洗、汇总和聚合,并加载到数据仓库中,时间和速度在数据仓库的ETCL过程中非常重要[6].如果技巧和方法不当,则加载效率不高.对银行这样的企业,可用于加载的时间非常短,每天的后续加载压力会很大.因此,数据仓库设计就应充分考虑这个问题.另外,数据仓库无论从有储方式,组织形式还是数据类型,与源系统都是不一致的.在ETCL过程中,一方面,ETCL过程本身可能带来数据质量问题,要通过加强ETL阶段的测试工作进行排除;另一方面,ETL人员通过对源数据的详细查看,可以发现非常全面而细节的源数据质量问题.
(2)数据挖掘.数据挖掘是根据企业的既定业务目标和对大量的企业数据进行探索和分析、揭示隐藏的、未知的、规律性,或验证已知的规律,并将其模型化的一种先进有效的方法.在银行分析型CRM中,客户数据挖掘能力是CRM系统的主要技术要求之一,对数据挖掘,关键在于对数据挖掘的算法、分法和应用的理解和掌握.由于每一个问题常常有几种不同的算法可以解决,每种算法也都可以用来解决不同的问题[7].因此,对每种算法和应用的理解至关重要,需要非常熟悉,才能多方法融合,有机组合互补.
基于数据挖掘的银行分析型CRM的应用是一项复杂的系统工程,在应用过程中获得高层领导和管理层的支持及银行员工的理解、协作和共同认可极为重要.同时,还需加强员工培训和对最终用户的支持,使他们能够成功地应用这一系统,从而提升竞争力.
参考文献:
[1] 何荣勤.CRM原理设计实践[M].北京:电子工业出版社,2006.
[2] 张永虎.CRM系统及其在我国银行业的应用分析[J].中国金融电脑,2002(3):67-70.
[3] 董宁.数据挖掘技术在CRM中的应用[J].计算机工程与应用,2007(6):1429-1431.
[4] 刘同明.数据挖掘技术及其应用[M].北京:国防工业出版社,2001.
[5] 聂茹.数据仓库元数据建设思考[J].计算机应用研究,2005(2):57-57.
[6] 王克龙.数据仓库中ETL技术的探讨与实践[J].计算机应用与软件,2005(11):30-32.
[7] 邹志文.数据挖掘算法研究与综述[J].计算机工程与设计,2005(9):2304-2308.