范建华 张肖
摘要:本文的研究的主要目的是将数据挖掘技术作为一种信息保护手段引入到信息安全体系之中,从全新的视角来找到一种信息保护方法。数据挖掘在当代信息爆炸时代可以说是一种的信息价值增值手段,但是同时它也是一种必要的信息保护方法。信息的泄露或者对所存在的有价值信息视而不见被竞争者利用就会是造成一定的损失甚至是灾难性的后果。特别是对于银行业,其信息具有真实性、实时性等特点,对于信息安全有特别高的要求,因此不能无视隐性风险隐患的存在,应该积极开发和利用数据挖掘技术来进一步完善信息安全风险防控体系。
关键词:信息安全数据挖掘流程
1.引言
从上世纪90年代中后期,我国各大商业银行都进入了数据化大集中的时代,数据集中是银行界对技术支持系统的一个改造,同时也是对传统银行业的整体管理理念的彻底再造。银行业经历了金融电子化时代,几乎各项业务都实现了数字化。多数的数据我们无法处理,因此可以说它是垃圾信息,但是并不能肯定它是没有价值的信息。那么许多有用的信息就被我们忽视或者丢弃在那些我们所认为的垃圾数据之中,这就给信息保护埋下了安全隐患。要保护大型数据和信息就有必要将数据挖掘作为信息安全策略的一个方面来进一步维护信息安全。
2.银行业需要重视和保护的信息内容
银行业信息可以认为是在银行的一系列业务发展过程中产生、应用和搜集的各类信息,这些信息是银行业经营和发展的基础。在银行业发展过程中信息安全情况决定其生存和发展的命脉,因此信息保护就成为各类银行发展中所必须重视的一项内容更。银行业信息可以划分为两大类:
2.1显性信息
显性数据主要包括由各类存储媒介保存的数据,包括软盘、硬盘、纸质等保存的文件,这部分资料可以占道银行信息的20%。这类是数据是业务发展所产生和存储的数据,包括账户的开立信息、个人储蓄记录、对公存款记录、贷款资料、贷款合同、还款记录等等。这些信息是可以随时调阅和查找使用的信息。
2.2隐性信息
隐性数据是相对于显性数据而言的,它没有具体的存储介质,比较抽象的但是实在存在的数据。这一类数据主要是柜员、客户经理、中层领导在日常工作中所掌握的隐性的没有量化的信息,这部分资料根据二八原则可占到银行信息的80%。柜员在储蓄柜台办理日常的业务过程中会直接接触到客户,柜员能够掌握经常办理业务的客户对不同产品的青睐和喜好,这也是一类重要的信息。
3.海量数据所造成的信息安全隐患
金融数据大集中之后,数据量增幅很大,以人民银行2009年对银行业务量统计作数据参考:
存储和保护所有数据,因此会有所删减和侧重。数据和信息的概念是不同的,数据是无规则、全描述性的、无具体指向的;而信息是有内容的可为做出经营决策提供参考的资源。银行业拥有的数据资源非常庞大,但是并不都是有用的信息,因此在处理和保存过程中就不会也不可能特别的保护所有的数据,大量的数据就会造成信息安全保护障碍。
3.1数据销毁不完全造成信息泄露
由于银行业的业务量非常大,同时每个工作日结束都会产生大量的垃圾文件及影印资料,在处理这些资料时就会有不同的处理方式,但多数是不会集中销毁。纸质资料是银行业务中必然会使用和产生的资料,在这些丢弃的废品中包含着大量的信息,有客户的存款账号以及存款金额、废弃客户资料、银行废弃报表资料等等。这些资料多数并不是错误的信息,相反这些是一些真实性相当高的信息,因此废弃资料的销毁和处理就有必要加以重视。事实上,通过对许多商业银行的调查与统计许多商业银行并没有制定具体处理措施规章制度,也没有指派专人负责处理,而是较随意的丢弃。从这些丢弃的资料中我们不难找到客户的存款资料,对公账户的基本信息,甚至是银行内部的经营状况等等。此类信息是银行非常机密的信息,泄露的损失会非常的严重。
3.2错误判断数据价值造成的信息安全威胁
在竞争如此激烈的银行业,当没有发展和改革是就相当于在退步,在失去竞争力。随着经济全球化和信息技术的发展,金融数据正在以空前的速度产生和累积。因此,迫切需要找到一种有效的方法从海量的金融数据中提取有用的信息以在银行制定战略性计划和投资时给予支持。由于银行业接触到的信息量相当大,因此会让领导人员对已有的数据视而不见。然而这些数据会提供很有用的决策支持,在拥有数据而不去利用就会造成利益的损失。由于贷款系统并不可能融入如此复杂的数据量,这些信息就容易被忽略,这样就容易造成错误判断,最终流失一个良好客户,也有可能会增加高风险客户。
3.3隐性信息价值带来的安全隐患
由于权限等级划分带来了权利和责任的高度集中,在多数银行都以授权与代办关系存在。往往代办员只是在办理业务过程中的操作者,而多数的信息是掌握在授权者手中。这些授权者一般属于银行的中层管理者,他们掌握的信息包括:大额存款户资料、贷款户的资信状况、营业网点的经营状况等等。这些都是整个营业网点经营命脉。根据二八原则的划分,20%的信息是组织运营中的存档信息,而大量的80%的信息是各个经营者所掌握的隐形的信息。这80%的信息安全就只能依靠职业道德规范和职业行为规范等制度对中层领导的约束来保证,存在着严重的安全隐患。
3.4金融欺诈
随着经济的发展,在金融领域的欺诈行为已经越来越多,形式也多种多样,有贷款、存款、银行卡等等。例如在银行业务发展过程中会考核信用卡的发卡量,为达到发卡规模就会盲目的发卡、放松发卡条件等等,大量的信用卡申请信息就会造成信息核实的时间和人力困难。调查表明[2]金融机构每年的欺诈损失占其年收入的6%,相当于美国每年的GDP损失数千亿美元。英国欺诈损失总额每年也达到了140亿英镑。欺诈行为会给银行带来巨大的经济损失,同时也会造成信誉和形象上的重大负面影响。欺诈行为也是多种多样的,主要类型有以下三种:一是由于业务量大而忽略银行柜员对信息的访问控制和跟踪,银行内部职员会利用系统漏洞,非法进入银行交易系统,直接获取不正当利益,或者为以后的作案做准备;二是由于信用卡等信用贷款量大,无法具体核实贷款人资信状况的真实性,造成以虚假的承诺和虚假的保证来骗取贷款额度;三是隐瞒重要的资信信息,避重就轻,造成银行的错误判断。银行可以通过建立自己的数据库,来跟踪核实此类信息,在大量的处理业务数据中对数据进行挖掘分析并找出相应的规则、规律、论断,再结合人工分析,达到有效检测金融欺诈的效果。
4.数据挖掘技术在银行业信息保护中的应用
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘,在人工智能领域,习惯上又称为数据库中的知识发现(KDD),也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。
金融机构收集到的金融数据通常相对完整、可靠并具有高质量,方便了系统化的数据分析和数据挖掘。同样数据挖掘也可以作为银行信息保护的一种方法为银行发展做出贡献。为保护银行信息安全,数据挖掘通常包含以下四个部分的应用分析情况。
4.1应用数据挖掘技术管理银行报表
银行报表是每天都会产生的报表,管理者会通过报表的数据来进行日常业务决策。根据调查显示,银行报表基本是由银行主管会计打印、输出、整理报送银行主管人员。在报送过程中就产生了多个信息安全的风险点:首先纸质打印就会有错误和多余打印的废弃资料;其次会计主管必然会掌握和了解各类数据;再次是整理好的数据资料的管理也十分必要。银行报表上的数据是银行需要保密的经营数据,它关系到一家银行的生存和发展,只有决策层和领导层有权限和有必要掌握和了解。因此要从根本上杜绝信息安全隐患就必须从报表的形式和报表访问权限上来加以控制。据分析阶段对银行业务中产生的庞大数据进行分类、识别、筛选和初步分析。从大量数据中挖掘出适合银行业务人员使用的信息模式和知识,从而产生出报表,以指导银行营销和竞争。
4.2数据挖掘提升客户关系管理
银行根据多个方面的数据内容建立客户资料数据库,来维护客户,全方位的描述和统计该客户的资金流量、信用度等。建立该客户的信息由有商业银行实施客户关系管理(CRM)的目标是充分掌握客户的需求,找出能盈利的客户。数据挖掘技术在商业银行CRM中具有广泛用途,它首先有助于银行客户资源的开发,有助于集成客户的各种信息,有助于银行进行市场细分、开发新产品、拓展新市场。从数据挖掘技术在CRM系统中的具体应用来看,可以分为以下五个阶段。第一阶段:建立客户信息数据库。数据库是数据挖掘的基础,这一阶段主要是进行数据清理,消除现有业务系统中数据不一致的现象,通过关联将有联系相互作用的数据建立索引,将其整合到信息库,建立以客户为中心的数据仓库基础环境。第二阶段:记录、更新客户交易信息。这一阶段主要是把客户与银行的所有历史交易数据加载到客户信息库。第三阶段:建立评估模型。为客户的每一个账号建立利润评测模型,以便了解客户对银行的利润贡献度,同时掌握模型的利润贡献。第四阶段:维护和优化客户关系。银行可以通过掌握客户在生活、职业等方面的变化及外部环境的变化,抓住推销新产品和服务的时机。这需要将账号每次发生的交易明细数据,加载到数据仓库,核对客户行为的变化。第五阶段:风险评估和管理。银行风险管理的对象主要是与资产和负债有关的风险,因此与资产负债有关文章都各自占一张表,并把所有论题表放入统一数据库中。
4.3建立员工工作日志,量化隐性信息
从上述的银行信息分类可以看出银行的80%的信息是隐性信息,是由一线员工掌握的。在银行内部网站中可以创立一个员工工作日志板块,它可以设置和微博一般,记录员工的日常工作中的点滴细节。当然这类信息只有管理层和本人有访问权限,这样员工掌握的信息就不会随着他的离职而带走。许多商业银行开辟一个新的市场所采取的策略之中都会考虑雇佣一位当地银行的中层领导,这样对于迅速打开当地市场会有非常好的效率,因为当地银行老员工对于当地市场、当地顾客都比较了解。这样一位员工的流失会给原商业银行带来巨大的损失,为了减少这方面的损失就需要将一线员工掌握的信息进行量化,变为银行内部可共享的资源。员工可以在工作日志中记录重要客户的生日、家庭住址、家庭成员等等,这对客户维护是非常有必要的。建立员工工作日志可以通过以下三个步骤实现:首先,开辟工作日志板块和服务后台;其次将工作日志平台作为信息发布、交流平台,促使员工习惯使用;最后对日志记录优秀者加以奖励。
4.4金融欺诈检测
金融欺诈的形式和主体都具有多样性,但是都是有规律可循的,针对上述出现的三种类型的金融欺诈,可利用数据挖掘技术进行欺诈检测。欺诈检测的基本流程包括数据比对和清理,数据预处理和转换,数据的模型套用和计算,人工判断等四个步骤,流程图如图2第一阶段,数据比对和清理。应用数据挖掘进行金融欺诈检测,首先要选择的是哪些数据是有用的,以及从获得这些数据的来源。也就是说在合适的地方选择合适的数据。第二阶段,数据预处理和数据转换。数据挖掘通常处理的是海量的原始数据。数据的预处理是指对原始数据进行同性化处理,使各项指标同趋势化。第三阶段,数据的模型套用和计算。这一过程,是通过运用数据挖掘对收集到的数据进行实时的欺诈检测,对欺诈的潜在进行定位,并找出隐藏的欺诈模式。第四阶段,人工判断。这一过程主要是人工核对生成的挖掘报告,对检测的结果做进一步的比对和判断,消除误判,对系统模型进行调整改进。这一步就是确认欺诈行为的对于金融欺诈检测来说是一个不可或缺的步骤。通过这一步骤可以提高数据挖掘的有效性和准确率。以上四个步骤是个循环反复的动态过程,只有在动态运行过程中,才有可能对数据,挖掘模式进行动态调整,从而有可能实现对不断变化的金融欺诈模式的预警。
5.结束语
商业银行的信息是其经营的主要内容,信息安全就成为其核心竞争力主要决定力量。根据数据挖掘的性质和特点,从信息保护角度出发,将数据挖掘急速引入银行日常管理之中,通过以上四个流程应用,改善信息形式、挖掘有价值信息、防止金融诈骗,达到更好的信息保护效果。数据挖掘是信息化的最高层次,是信息化最高应用点的价值所在,它可以将分散的信息变成集中的信息,使孤立的信息变成相互联系的信息,使无价值的数据变成有价值的信息,我国银行业要在激烈的同业竞争中立于不败之地,必须坚定不移采用数据挖掘技术,提高自己的核心竞争力。
参考文献:
① http://www.datamining.com.cn.
②张国荣.浅析数据挖掘中的隐私保护[J].福建电脑,2005(11).
③王越,曹长修.KDD方法在金融欺诈检测中的应用[J].计算机工程与设计.2002.(5).
④王实.银行业CRM理论与实务[M].北京:电子工业出版社,2005. ⑤中华人民共和国国家统计局.中国统计年鉴(2009)[M].北京:中国统计出版社,2010.
⑥李强.数据挖掘在金融业CRM中的应用[J].今日湖北理论版.2007.1(4):21-22.
⑦田小丹.数据挖掘在银行CRM管理中的应用研究【J】.商业科技,2006.
⑧丁宁,刘富星.数据挖掘在金融中的应用【J】.经济与管理,2009(7).
⑨胡,张徽燕.数据挖掘在银行业中的应用【J】.长春师范学院学报,2006(2).