□文/霍 亮 杨 柳 张俊芝
(1.河北金融学院;2.河北大学经济管理实验教学中心 河北·保定)
我们现在已经生活在一个网络化的时代,通信、计算机和网络技术正改变着整个人类和社会。大量信息在给人们带来方便的同时也带来了一大堆问题。例如:信息过量,信息真假难以辨识;信息安全难以保证;信息形式不一致等。面对这一挑战,数据挖掘和知识发现技术应运而生,并显示出强大的生命力。
1、数据挖掘的概念。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它利用各种分析方法和分析工具在大规模海量数据中建立模型和发现数据间关系,是近年来发展起来的一门涉及面很广的交叉学科,融合了人工智能、数理统计、数据库等方面的最新进展,它的应用遍及金融、零售、电信、保险等众多领域,发展前景十分广阔。
2、数据挖掘方法和技术。数据挖掘的技术很多,相应的实现方法也很多,总的来说,数据挖掘方法和技术可以分为以下八大类:
(1)归纳学习方法。是当前重点研究方向,研究成果较多,从采用的技术上看,分为两大类:判定树方法和集合论方法。
(2)仿生技术。典型的方法是神经网络方法和遗传算法。
(3)公式发现。是数据挖掘的一项重要内容,它主要是从数据中找出数据变量之间的函数关系,求得相应的数学公式。
(4)统计分析方法。它建立在传统的数理统计基础上。在数据库字段之间存在两种关系:函数关系和相关关系,对它们的分析可采用判别分析、因子分析、相关分析、多元回归分析及偏最小二乘回归方法等。
(5)关联规则。是发现一个事物与其他事物间的相互关联性或相互依赖性。
(6)可视化技术。是利用计算机图形学和图像技术,数据转换成图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。
(7)融合方法。是将不同算法或同一算法下使用不同参数得到的结果进行合并,从而得到比单一算法更优越的结果。
数据挖掘技术从一开始就是面向应用的,如在银行、保险、电信、交通、零售(如超级市场)等领域有着广泛的应用。
1、数据大集中。自上世纪九十年代以来,国外的保险公司为顺应保险业务和信息技术相融合的大趋势,斥巨资将过去分散的、功能较弱的、以业务自动化处理为主的单一计算机系统,改造为功能强大的集中式的计算机应用系统。国内的保险公司目前已经在探索集中式管理的模式,已经拥有比较完善的计算机通信网络,保险公司主机和服务器的处理容量也在不断增加,这就为数据大集中的实现提供了有力的物质基础。
2、建立数据仓库。保险业务数据大集中后,通过数据挖掘技术,可以有效地控制保险的信用风险,能够形成以客户管理为框架的成本控制体系,从而实现保险公司经营资源的优化配置等功能。更为重要的是,数据仓库可以为各级保险公司经营决策提供强大的可信赖的支持,减少决策的盲目性。
3、搭建多元化的综合业务平台。有了集中的数据仓库后,保险业务多元化,服务功能综合化、全能化,完成从分业经营到混业经营的转化将由设想变为现实,保险网络化的发展将改变传统的单一经营模式,实现保险业务综合化经营。
总之,保险业的信息化进程可以概括为:以数据大集中为前提,以完善的综合业务系统为基础平台,以数据仓库为工具,以信息安全为技术保障,打造出现代化、网络化的保险公司。
保险业是最适合推行知识管理与数据挖掘技术的行业,是典型的知识密集型行业。随着保险公司业务系统日趋完善,如何有效利用数据实现经营目标,预测保险业的发展趋势,在激烈的竞争中赢得先机是保险公司需要解决的问题。
1、客户关系管理。客户关系管理(CRM)是一个判断、获取、保持和增加可获利客户的过程。CRM在帮助鉴别、吸引和留住有价值的客户方面被广泛认同。CRM以客户为中心,简化了各种与客户相关联的业务流程(如销售、营销、服务和支持等),将其注意力集中于满足客户的需求上。CRM还将多种与客户交流的渠道,如面对面、电话接洽以及Web访问等方式融合为一体。这样,保险公司可以按照客户的喜好使用适当的渠道及沟通方式与之进行交流,从根本上提高与客户或潜在客户交流的有效性,使保险公司市场营销、销售管理、服务和支持等经营环节的信息在保险公司内部和客户之间流动,实现客户资源的有效利用,从而提升了保险公司的竞争力。
2、争取客户。争取客户始终是保险公司营销人员面临的头号问题。数据挖掘可以成为识别好的客户,完成市场划分以及改进直销活动的关键工具。以往,保险公司要想一次性地完成上述市场活动,不是将资料留给统计分析人员去处理,就是外包给其他机构。
在高度竞争的市场中,这种做法不仅使销售活动进行的过慢,而且显示的效果也往往过迟。此外,在给定的时间周期中,保险公司能够有效控制的市场销售活动的数量也常常低于所希望的数量。数据挖掘将能够有效地解决这些问题,使得销售人员能更好地驾驭市场。
3、客户保持。如何保留客户也是所有保险公司面临的一个主要问题。实践表明,与保持住现有客户相比,寻找新的客户总是要付出更多的代价,因此保持住现有客户对许多保险公司都是关键性的问题。客户流失往往由于事先没有任何征兆而成为一个难以控制的问题,一旦客户已决定要离开,就很难再说服其留下了。
数据挖掘使保险公司的预测能力得到增强,为控制客户流失带来了根本性的转变。通过使用数据挖掘对客户付费历史、人口统计信息及其他资料进行分析,并针对已流失客户的模式建立模型,最终的目标是预测用户的忠诚度。如果能够预测到这些行为,即可有更大的机会留住客户,减少用户的转向。有了这些信息的帮助,销售人员就可以通过主动的营销活动来保持其客户,而不再像以前那样等客户离开后才被动应付。
[1]陈永强,胡雷芳.数据挖掘技术在人寿保险CRM系统中的应用研究.成组技术与生产现代化,2004.1.
[2]吉根林,孙志挥.基于数据挖掘技术的保险业务风险分析.计算机工程,2002.2.
[3]陈文伟,黄金才,赵新昱.数据挖掘技术.北京工业大学出版,2002.