摘 要:在信息化快速发展的时代,计算机的相关技术和功能得到了相应的拓展,数据挖掘也应运而生。数据挖掘就是利用各种技术对海量的数据进行采集、分析、转换及统计,并为各类决策提供技术支持,它能在各个行业领域中运用,具有很广阔的应用前景。详尽地概述数据挖掘的相关理论,并针对当前金融领域的热点研究,探讨数据挖掘技术在金融行业的应用主要表现为:风险控制、业务关联分析、客户关系管理、识别金融欺诈及洗钱等经济犯罪、企业核心竞争力、数据仓库的构造。
关键词:数据挖掘;金融行业;应用
中图分类号:F832 文献标志码:A 文章编号:1673-291X(2021)15-0057-03
引言
在当今信息化高速发展的时代,银行、证券、保险等金融行业每天都会产生大量繁杂冗余的数据,目前的技术只能解决数据的录入、查询以及统计等功能,但有很多十分有价值的信息由于其随机性的特征而隐藏在其中,并没有被人们发现。而如今金融市场行业迫切需要解决的问题就是,如何发现海量的数据中存在的关联关系,如何从现有的数据中充分发挥金融数据的商业价值,预测金融业未来的发展趋势。而解决该问题的有效手段就是数据挖掘技术,它作为一个新兴的研究领域,已经广泛地应用到了众多的领域。它可以从海量的数据中提取出潜在的有用且有价值的信息数据,以此帮助人们进行科学决策。
一、数据挖掘的相关理论
(一)数据挖掘的定义
数据挖掘就是对数据库中的庞大数据进行相应的处理,即提取和分类,从海量的、不完全的、模糊的以及随机的各种数据中能够提取出未知的、潜在的、预测能够对人们有用的信息。并且这些信息,能够为人们在金融领域的筹划、分析、决策和预测等方面提供参考依据。
(二)数据挖掘的主要方法
数据挖掘技术综合性强,并跨越各大学科和行业,不仅在IT行业有应用,在医学、数学、信息管理、金融、等多个行业领域都有较为广泛的前景。针对数据分析,数据挖掘的方法主要有分类、回归分析、聚类、关联规则、Web挖掘等,运用这些方法可以从不同的角度对海量数据进行挖掘。目前,运用到金融领域的数据挖掘相关技术主要包括:关联分析、聚类、分类、异常检测、估值和预测。
1.关联分析。该方法主要是研究数据库中各种数据项之间的关系,找出这些关系的某种规律性,即找出数据中可以隐藏的数据项之间的相关性。目前该方法已经广泛运用于多个领域,在金融行业可以成功预测银行客户需求,在新闻行业可以进行基于兴趣的实时新闻推荐,在交通行业可以进行交通事故成因分析。在金融领域,在进行股票投资选择组合时,可以根据相关度进行决策以达到在维持基本收益的基础上降低资产组合的风险系数,获得最佳投资组合。
2.聚类。该方法是将所要分析的数据信息按照相似性和差异性进行分类,使得属于同一类别的数据之间的距离较小,即相似性尽可能大;或使不同类别的数据之间的距离较大,即相似性尽可能小,形成不同的聚集,综合分析不同类型的聚集,得出企业需要的结果。该方法主要运用于对客户群体进行分类,分析客户的背景、分析预测客户的购买商品趋势、进一步细致地划分市场等。
3.分类。该方法是描述离散型变量的输出,并且类别是确定数目的,是从数据库海量离散的信息数据中筛选整理出多个信息数据训练集,然后按照分类模式通过数据挖掘技术对训练集进行数据分类,创建分类模型,对于那些没有分类的数据进行重新分类,并且这些数据类的类型和个数都是事先定义好的,只需要按照不同类的特性进行数据分类。比如,在金融领域可以将客户群体划分为普通、中级、高级等,该方法可以对客户群体进行分类,分析客户的属性和特点、分析客户的满意度以及对客户的选购倾向进行预测。
4.异常检测。该方法也被称为偏差检测和例外挖掘。异常数据主要来源于分类中的反常实例,自然变异,数据测量或收集误差,模式的例外,观察结果对于模型预测的偏差,以及量值因时间的变化等等。该方法在金融领域,可以识别出异常数据,可以查找出股市中股票的操纵和信用卡诈骗以及贷款欺诈等金融违规违法行为,可以有效地净化金融市场。
5.估值。该方法是用来处理连续值的输出,通过对所输入的数据进行估计,输出一些连续变量的值,然后根据预先设计好的阈值进行分类。比如银行信用卡就是运用估值得到的阈值,针对不同的客户进行差别设计额度。
6.预测。该方法是根据数据估值和数据分类,综合分析数据模型,利用数据模型来预测未知变量。然后根据数据的关联规则以及相关性分析,决定哪些数据集合会导致另外一组数据的出现,即合理分析事物出现的可能性。预测的目的就是通过分析变量预测未来变量,并且这种预测在一段时间后是可以得到验证的。
(三)数据挖掘的主要步骤
1.定义问题。要弄清楚目前需要解决什么样的问题,是属于分类问题或者回归问题,这个步骤决定了后续的分析方法和方向。相关人员需要根据相关部门的需求,切实了解和掌握好有关数据和业务的情况,能够清晰、准确地定义目标数据和业务,使得该目标具有可行性、可操作性和可评价性。例如,在银行投资理财业务中,储蓄用户的投资比例是在某个地区进行变动还是全部进行变动、提升多少比例等情况,需要进行清晰明确的定义,才能建立模型。
2.数据收集。该步骤是开展数据挖掘與分析的基础,根据确定的业务对象,搜索所有与之相关的内外部数据信息,抽象出数据挖掘所需要的特征信息,然后选择合适的信息收集方式,将其存入数据库。在研究分析金融风险时,数据可以来源于上市公司的财务报表,也可以是证券交易所每天对外公告的数据。
3.数据预处理。收集到的数据并不是完全的,有些缺失属性值,有些包含错误的属性值,有些是重复样本,有些是明显偏离样本数据的,因此需要进行数据的清洗处理,合并多张互相关联的表格为一张,去除特征间的量纲差异,通过离散化、哑变量处理等技术,得到完整准确的数据。从金融视角出发,需要确定影响金融风险的有关变量,确定金融风险发生的几率和程度以及要计量的损失额。
4.数据挖掘。采用回归分析、交叉分析等分析方法,以及聚类、分类、关联规则等方法进行建模,并进行不断的训练和测试,最终获得准确的数据模型。
5.模型评估和优化。数据挖掘的结果可能有很多情况,因此需要根据经验进行分析评估,或者用实际数据验证模型的可行性。对建立好的數据模型进行分析评价,评估风险的性质和程度,比较风险与风险评价标准。
二、数据挖掘在金融行业的应用
在当今的大数据时代,数据挖掘技术由于其极佳的数据信息提取能力,使得很多行业都有了较大的转型和改变,推动了各行业各市场经济体系的快速发展,并且朝着新的领域继续开拓新的业务。数据挖掘技术在金融领域得到了较为广泛的应用,从宏观经济到微观经济,从整体发展到局部发展,从现时分析到未来预测,数据挖掘技术在金融行业的具体应用都得到了很好的效果。
目前,数据挖掘技术在金融行业的应用主要表现为以下几个方面。
第一,风险控制。金融行业,在计算贷款偿还效能和客户信用等级时,受到不同因素的影响会产生不同的结果。数据挖掘的方法,比如特征选取和属性相关性计算,有助于识别相关因素和非相关因素。例如,与贷款偿还风险相关的因素有很多,但是其中主导因素是偿还与收入比率,银行可以因此调整贷款发放政策。同时通过分析相关资金数据,可以控制营业风险,以此改变公司总部原来的资金控制模式,并通过横向比较及时了解资金情况,达到风险预警的效果。
第二,业务关联分析。利用数据挖掘技术分析企业的大量交易数据信息,构建相关的数学模型,从中可以发现许多交易信息背后的市场走势、客户需求变化等趋势信息。企业可以利用这些信息,洞察金融行业的相关变化,及时调整企业经营战略,以此帮助企业做出正确的判断和决策。比如,银行存储了众多的客户交易信息,通过关联分析可以找出数据库中隐藏的关联网,可以挖掘分析客户平时的收入水平、购物水平、消费习惯等指标,发现客户的潜在需求。同时银行可以交叉分析各理财产品,寻找出关联性较强的产品,可对客户有针对性地进行营销。
第三,客户关系管理。它是指企业利用数据挖掘技术对客户进行整合营销,是以客户为核心对企业营销进行技术实现和管理实现,主要是为了吸引和留住有用的人才。客户关系管理主要分为四个方面,分别是客户获取、客户细分、客户盈利能力分析以及客户的保持。数据挖掘技术通过收集客户与金融企业互动过程中产生的常规信息,分析客户行为,以此来探索发现客户的行为规律,比如整体行为表现和群体行为模式,有关部门可以根据所发现的规律制定相应的个性化服务策略和特定的服务产品;企业可以通过这些信息找出客户的关注点及消费倾向,以此提高产品的市场占有率和企业的竞争力。企业可以通过自动探测聚类和购物篮分析,寻找数据库中客户的特征,将客户自然分群,通过对客户的相关特征进行分析预测,找到新的潜在目标客户,潜在目标客户能够给企业带来丰厚利润,对企业的进一步发展来说也至关重要。同时,企业通过挖掘流失客户的特征,能及时采取更多的措施来保留潜在流失客户。
第四,打击和预防金融欺诈、洗钱等经济犯罪。金融行业的业务一般都需要大量的货币流通,导致了很多金融欺诈、洗钱等经济犯罪的产生,包括盗卡盗取账户密码、恶意透支、伪造信用卡以及洗黑钱等。金融犯罪是如今业内面临的棘手问题之一,这就需要金融行业重点监管防范金融风险和识别金融诈骗。要侦破金融犯罪,最关键的就是要结合大量相关的数据,包括行业发展、个人信用等风险信息,然后通过多种不同的数据挖掘技术和工具寻找异常情形,包括在短时间内少数人员之间的频繁的巨额资金流动周转,预测其风险等级,为决策者防范规避风险提供可供参考的信息。同时,数据挖掘技术可以通过分析一些诈骗行为模式,挖掘出其中所隐藏的共性,能够及时给企业发出预警,提醒企业加强监管。
第五,增强企业核心竞争力。金融企业的实力,主要表现为其自身拥有的资本实力和企业整体员工的知识水平和素质,同时后者是金融行业的核心竞争力,数据挖掘技术可以帮助企业挖掘出员工的知识需求,包括其对企业绩效产生影响的隐性知识组合,可以帮助企业及时选择相应的招聘策略和培训方向。同时,企业可以通过数据挖掘技术分析研究企业的外部潜在影响因素,包括市场情形、潜在用户、供应商信息以及竞争对手的相关情况,这些外部市场信息对于企业的经营具有极其重要的意义,充分的市场知识能够帮助企业更容易地制定正确的战略决策。数据挖掘技术可以通过收集分析企业外部知识,得出对企业发展有潜在重大影响或者重大影响的外部信息,辅助制定合理的企业发展步骤,能够使企业抓住市场的机遇,调整经营策略,能够有效地增强金融企业的核心竞争力,最终实现企业的长远发展。
第六,数据仓库的构造。数据仓库是在数据模型的指导下,通过收集系统在内部和外部的数据信息,保证数据的一致性、准确性和时效性,以此实现数据共享和分析利用。在为金融数据构造数据仓库时,需要采用多维数据分析方法来分析数据的所有属性,企业可以按照部门、地区、月份以及其他一些因素,查看相关的负债以及收入的变化情况,同时补充完善总和、最大、最小、平均值等相关统计信息。数据仓库的设计和构造将会为数据挖掘以及金融数据的分析提供很大的作用。
结语
数据挖掘技术虽然出现的时间不长,但其已经在我国的金融业信息化建设中占据了举足轻重的地位,正不断地推动着金融行业的发展,并且在多领域被广泛应用,包括金融、电子商务、电子政务、证券、保险等等,能够快速帮助企业在激烈的市场竞争中取得优势地位,不断推进金融行业的发展,并且拥有很广阔的前景和未来。在日益开放的金融市场中,数据挖掘技术将成为分析客户数据的基础,在很大程度上为金融行业各级领导部门在相关运营决策方面提供切实可行的参考,以优化金融资源、提高金融质量,能够更加广泛地作用于金融产品的研发和变革,成为金融领域发展不可或缺的因素之一。最终,数据挖掘技术将为金融行业的未来发展发挥重要的作用,同时将创造一个更为广阔的平台,为金融行业的跨越式发展起到科学导向作用。
参考文献:
[1] 于晶.大数据时代的数据挖掘及应用探究[J].科技与创新,2018,(24):160-161.
[2] 李浩光.数据挖掘在防范金融风险中的研究及应用[J].计算机安全,2014,(2):48-51.
[3] 赫然,黄今慧.大数据背景下数据挖掘技术的算法[J].电子技术与软件工程,2019,(20):141-142.
[4] 杨玉珠.数据挖掘技术综述与应用[J].河南科技,2014,(10).
[5] 管刚.数据挖掘技术在金融领域的应用[D].武汉:湖北军事经济学院,2013.
收稿日期:2020-09-07
作者简介:杨婷婷(1997-),女,江苏南通人,硕士研究生,从事金融数据分析研究。