高艺萌 龚春燕 李仲良
(1.云南大学历史与档案学院 昆明 650000;2.楚雄师范学院图书馆 楚雄 675000)
大数据(Big data)是指所涉及到的数据量规模巨大到短时间内无法通过人工在合理时间内截取、管理、分析、挖掘并整理成为人类所能解读的信息[1]。随着大数据技术的不断发展,对大数据的应用已经从互联网行业逐步向金融、政务、工业等数据密集型行业渗透。金融档案是指金融类企业在金融业经营活动和业务服务中形成的具有保存价值的文字、图表、声像等各种载体形式的历史记录。完善金融档案服务,可以更好的发挥金融档案在维护金融企业利益、保护消费者权益、保障国家金融安全等方面的作用。大数据和档案都属于信息,金融市场活动中形成的档案与大数据都具有规模巨大、数据类型多,且信息集成度低,价值密度低的特点。传统的档案价值在于凭证性和参考性,大数据的最终价值在于预测行业发展规律和为管理者提供决策[2]。在大数据时代背景下,企业档案的管理模式已经从传统纸质向电子化、数字化发展,且数字化程度不断提升,数字化的金融档案可以作为一种大数据信息资源进行数据的采集、分析和利用[3]。形成的数字化档案资源为金融档案提供了数据基础,也为数据驱动金融企业的档案利用服务提供了契机。如何有效的采集金融档案中的数据并提取出有效信息进行分析,最终服务于企业管理成为企业档案开发利用服务的全新挑战。
利用档案大数据驱动金融企业管理,就是将从金融档案中采集到的海量数据,通过算法模型进行分析和计算,完成数据处理,并最终驱动企业管理决策和产品智能的过程[4]。当前企业创新决策与业务开展越来越依赖对数据的挖掘和分析,数据驱动金融档案服务,不仅能为企业的内部风险管理提供更好地控制手段,还能够延伸档案的利用价值,使企业档案管理能够为企业决策和业务开展提供服务。同时,也可以作为金融监管部门对金融市场交易和业务规范监管的先进手段,利用金融档案服务驱动金融监管,出现问题迅速进行定位和追踪,更好地保护金融消费者的利益和金融机构的权益,以及保障国家金融安全。
由于企业内部风险合规控制的需求,多数金融机构对档案管理工作比较重视,档案法治意识较强,基本能够按照《中华人民共和国档案法》、《中华人民共和国档案法实施办法》、《金融企业业务档案管理规定》以及各省档案管理办法等法律法规的要求进行档案管理,建立档案管理信息系统,对金融档案的数字化管理水平也在逐步提高。但部分金融企业存在档案分散于各个业务部门分别管理的现象,金融企业归档流程不够规范,金融档案外包服务存在信息安全隐患,中小型金融企业对业务档案管理重视程度不够等问题也时有发生[5]。2018年4月《关于规范金融机构资产管理业务的指导意见》发布后,金融行业面临的市场压力与日俱增,金融机构普遍经历业务转型,各种新型证券、服务型信托等业务推陈出新,相关法律法规也在不断完善,在各种交易过程中,形成的文件更加复杂多样,对档案信息资源的数字化开发和利用服务提出了更高要求。
目前我国企业的数字化转型处于起步阶段,存在转型意识薄弱、数字化系统建设滞后和数据质量不高等问题。截至2019年我国有超过80%的企业数据以非结构化为主,超过90%的企业内部存在数据孤岛,约80%的企业不认可自身数据挖掘能力[6]。就金融企业而言,各交易机构和金融企业的数字化水平不平衡,很多中小型金融机构除网上监管平台必要的信息报备之外,依旧沿用较为落后的归档办法手动生成卷内目录,未对交易文件进行数字化加工[7]。金融企业档案部门数字化水平仍滞后于业务部门,技术手段落后于业务部门。金融企业档案管理对信息管理软件的利用重点依然在于实现档案资源数字化和档案管理信息化方面,没有实现对金融档案大数据的数据挖掘[8]。
金融企业从思想上对档案部门的重视程度不够,尤其是小额贷款公司和融资担保公司等中小型金融机构,档案利用服务工作的开展十分有限。一方面,金融企业管理者往往是从业务或财务系统晋升,没有足够的档案意识,对公司进行管理时片面追求经济效益最大化,对落实和规范档案管理较为松懈,对档案管理的认识仅停留在将需要保存的文件整理归档。另一方面,随着近些年来档案服务机构的快速发展,金融企业出于节省人力和存放空间以及节约成本的考虑,选择将档案业务外包。但目前档案业务外包市场准入门槛较低,存在数据外泄的风险。且档案业务外包后仅能实现档案管理,无法开展档案利用服务[9]。
由于金融档案的档案管理标准不一致,金融企业存在着原始数据多部门管理的状态,如交易数据等信息在交易过程中由各交易机构备存,证监会监管备案,最后再由业务部门向档案部门移交纸质和电子版项目档案,导致归档文件的分散,造成重复归档,给金融档案数据采集造成困难,影响档案利用服务的开展。且目前金融监管的行政管理活动多存在事后性和盲目性的问题,抽检档案随意性较大,金融市场监管专业化、精细化不足,造成部分企业存在侥幸心理,放松档案管理工作,长此以往就会暴露档案工作缺失造成的各种问题。
我国国内目前有股票、基金、债券等多种金融产品,产品形式多样化,且规模庞大,积累了数量庞大的金融数据集。截至2019年底,中国证券投资基金业协会统计数据显示其资产管理业务总规模已达51.97万亿元,公募私募基金规模合计达33.5万亿元[10]。金融市场的快速发展促使国内金融体系不断完善,各项制度的确立也对各金融机构的档案管理等进行了规范。但长期以来,金融档案的载体形式以纸质和光盘为主,档案的数字化工作尚未形成完善体系。针对金融档案当前的传统纸质、光盘等档案进行数据驱动下的档案服务,要应对的不仅仅是“数字化”,还有更进一步的“数据化”,“数字化”仅仅是将纸质文档转化成信息化的电子文档,与实现信息化服务和大数据应用还有相当遥远的距离,且目前对纸质金融档案进行的数字化工作主要是将纸质文件扫描成PDF格式文件储存于计算机中,不能实现全文检索,无法从大量档案资料中提取信息进行数据分析和处理,数据驱动无法得到实际应用。
目前规模较大的金融企业基本实现了归档自动化,企业通过办公自动化系统和业务管理系统与档案管理系统对接,产生的文件可以自动归档到档案管理系统,也能够自动生成档案目录[11]。但“自动归档”和目录生成并不意味着实时归档,根据文件生命周期价值理论,文件和档案界限的划分在于归档这一步骤,而自动归档至档案系统的档案存在着无序的状态,在此过程中产生的垃圾数据也影响了数据质量。
由于企业信息化平台存在分阶段建设的现象,顶层设计缺失,企业内部业务系统、协同办公系统、档案管理系统相互独立,造成信息开发利用往往以一个部门为核心,而各个部门数据的获取都需要通过信息技术部门进行,整个系统分散又各自独立,各部门间不能实现信息联通。做档案数据分析需要档案部门、信息部门、业务部门协调沟通,等待数据获取权限审批等,获取数据的流程往往包括业务部门与信息部门沟通需求、信息部门与档案部门沟通获取档案信息资源、分析提取数据源、升级数据采集系统、开发程序,最后才能获取结果,信息获取效率低下,不能发挥数据驱动的真正用途[12]。且信息系统中的数据管理自成体系,尤其是一些集团化的金融企业信息孤岛现象严重,数据审批和统计数据的时间周期长,且并非所有数据资源都对外提供开放式数据提取接口,提供开放的数据提取接口的数据源也可能存在对外提取接口标准不一致的情况,信息部门实际操作时可能因为没有统一ID而无法打通接口获取数据,造成无法实现企业内外档案数据的共享[13]。信息部门的运行和维修人员如果想要拿到数据进行大数据分析,需要在多个系统间进行人工汇总和校对,耗时很长而且效率不高,只有消除企业部门间的信息孤岛现象,才能完成数据协作,实现数据驱动下档案资源的服务。
利用大数据进行金融档案管理服务过程中,档案的收集、整理、存储和利用方面都存在出现信息安全问题的风险,利用数据驱动推动档案服务,需要收集的档案信息呈现指数增长。目前业务端和档案部门交接以及档案部门进行档案整理多数依靠人工操作完成,进行信息采集的手段并不能完整而有效的采集全量数据。人工操作中可能出现的操作不规范或操作失误等情况也会影响金融档案的真实性和完整性。在档案存储方面,目前电子档案的存储介质对环境要求较高,多数企业也并未实现档案信息管理平台云备份,如管理不当会造成档案信息丢失。在档案利用方面,近年来金融企业对档案资源的利用逐渐呈现出多部门和多平台的趋势,访问接口和人员数量变多的情况也带来了更大的安全隐患。
除此之外,金融企业还存在着网络信息安全隐患,自用电子档案管理平台存在着防火墙访问安全性不高的问题,一般的防火墙都是通过网络途径下载,安全性没有保障。忽视网络入侵的检测也会使金融电子档案管理平台存在着黑客入侵和不法分子窃取信息等风险[14]。
各级档案行政管理部门应加强对所属地各级各类金融机构金融档案管理的检查,督促各企业严格按照相关法律法规规范企业的档案管理工作,对档案管理不规范的金融机构限期整改和复查。还可通过开展金融档案工作指导讲座、培训班等形式,分享先进经验,强化整个金融行业的档案意识,督促各企业结合自身发展特点完善档案利用服务。同时构建金融档案信息标准化机制,规范档案业务外包服务,引导企业加强金融档案的信息化建设,提高金融档案的数字化程度,提升金融档案利用服务水平。
金融企业要积极引入具备数据管理专业知识的档案人才,提升档案部门待遇,转变企业档案管理理念,档案部门应与业务部门和信息部门沟通,了解业务部门对档案资源的需求,参与企业内档案管理系统的建设,积极开展档案的利用服务。定期对业务部门进行档案管理培训,严格审核入库档案,提高卷宗质量,尤其对一些印鉴不清、非原件存档入库的档案予以特别关注。此外,要积极推动数据驱动下的金融档案服务于金融监管机构。金融档案是监管部门对金融机构进行现场或非现场检查的重要依据,金融档案的完整不但是企业进行风险控制的关卡,也是金融监管机构监督企业进行防范甚至化解金融风险的重要保障。运用数据驱动服务于金融监管,对金融监管需求形成反馈,实现金融风险的提前防范和预测,帮助监管机构对金融行业的发展趋势做出判断。
金融企业应转变工作思维和观念,将数据作为企业的核心资源,将对数据的收集、筛选、分析、利用作为企业核心竞争力的源泉来看待[15]。大数据之大是宏观方面的大,强调数据采集的全面,而不只是数据量的大。大数据需要多种形式的数据源,强调数据的及时采集和对数据进行实时分析的价值。对大数据这项信息化资产来说,最重要的是对海量信息的分析处理从而形成提供决策的依据,减少管理成本,提高数据利用效率[16]。《全国档案事业发展“十三五”规划纲要》中,提出了“全面推进档案资源存量数字化、增量电子化、利用网络化”的要求[17]。要想全面采集数据,进行数据的实时分析,一是要促使企业提升现有档案的数字化程度,建立对企业现存的以纸质、光盘为载体的档案通过数字化技术转化为存储在档案数据库中的数据。二是要实现数字化金融档案的实时归档。金融档案数据庞杂,有待挖掘的潜在信息价值较大,在大数据分析中,任何一种信息都可能是最终实现正确决策的关键,要实现对数据利用的实效性分析,捕捉档案中的核心数据,就必须进行实时归档。当前纸质与电子文件的“双套制”管理下,金融档案归档的实效性无法保证,应逐步实现电子档案“单套制”管理,使异地签署的合同文件同步归档,解决电子档案和纸质档案相分离的问题。利用大数据分析系统进行数据挖掘,高效检测出所需数据并且追踪其变化规律,定位行业发展趋势,建立档案决策数据库,捕捉市场动向,为企业决策提供数据支撑。同时要加强企业档案部门与信息技术部门的联通,针对电子文件自动归档后的无序性和垃圾文件问题进行系统优化,满足数据驱动对数据获取的及时性的需求。
企业内部信息孤岛的消除最终要通过数据标准化来解决,需要企业管理层统筹管理建立统一信息共享共建平台。由于企业管理是档案信息服务的服务对象,了解企业管理的实际需求,明确企业内部工作流程和各部门职能,才能使企业流程标准化和部门功能标准化成为可能。面对海量数据,金融企业的管理部门应该积极与档案管理部门和信息技术部门协作,完成各部门信息系统自查,确定信息资源的分类和元数据属性,列出数据清单,统一接入数据共享平台,进行系统化的数据管理。并且按照数据标准化思路进行企业业务流程重组,保证信息交流的一致性,避免信息的重复多次输入产生信息冗余,要利用企业档案信息,搭建跨平台和跨设备的金融大数据管理平台,以期实现真正意义上的数据驱动。
发展数据驱动金融档案服务,不仅要消除企业内部的信息孤岛,还要消除企业之间的信息孤岛,消除金融企业与金融监管机构间的信息孤岛,最终形成闭环,实现信息互联和资源共享[13]。金融业是高度重视信息保密和隐私保护的行业,应建立档案大数据国家安全系统,确保个人隐私系统的合理监管,在保护商业机密和客户隐私的基础上实现大数据档案平台共建共享。在构建档案大数据产业链时,采取监管部门统一构建平台和档案大数据采集标准的方式,通过核心企业合理引领,使上游和下游的金融企业积极互动,从而实现档案大数据平台的应用。
在推动金融档案服务的过程中,如何保障信息安全是一个很重要的课题,金融业对信息保密要求极高,无论是对传统模式下的纸质档案还是电子档案的安全管理来说都非常重要,因此要想完善数据驱动下金融档案的服务,保障信息安全是重中之重。金融业利用大数据化的金融档案为企业管理和金融监管提供服务必然会存在一定的风险。要想规避风险,首先要保障基础设施的安全运行,在档案库房建设、数据系统设备、网络安全等方面实施严格的技术安全管理,要根据业务的安全需求级别在内、外网络实施不同等级的安全防护,通过强化防火墙、建立病毒控制防御系统、补丁管理等措施对档案管理系统的软硬件基础设施进行全面保护。其次应该按照金融业务档案管理要求对电子档案进行备份,目前常用的电子档案异质备份和异地备份还停留在应用缩微胶卷的方式,与大数据档案的备份没有关联,大数据环境下的数据备份应采用云储存的方式,在保障安全存取的前提下将数据迁移到共享云中储存[18]。
在大数据时代,数据的质量十分重要。在金融企业运营中,结构化的档案数据每年增长量都在节节攀升,而金融机构日常办公和开展业务中会产生文档、图片、视频、音频等等各种非结构化数据,要对这些数据建立细化的归档标准。数据的处理需要层层分析,数据处理效率就是企业的生命,目前往往要花数小时进行TB级数据量的分析,且金融档案中有大量重复字段和结构一致的合同文件,档案的数据价值密度很低,数据质量很难控制,影响分析数据效率。企业档案部门应联通信息技术部门进行归档系统规划,进行详细的组织机构设计,实施统一的数据质量控制标准,并且通过在网络中设置自动预警装置和加密系统,进行数据的实时备份,保护数据流的上传和下载,预防数据损坏并及时恢复受损数据,避免数据库重复建设,提高档案存储的安全性。
金融档案的利用服务对金融企业发展至关重要,利用数据驱动进行档案服务创新是当前金融企业档案管理的全新方向和挑战。以大数据技术为工具挖掘金融档案的潜在价值,是每个金融企业都应密切关注的行业发展趋势。金融企业应提高档案管理人员的服务意识,转变档案服务理念,加强金融档案大数据化建设,建立完善的金融档案管理标准,统筹管理打通信息孤岛,构建金融档案安全存储系统,逐步实现数据驱动下的金融档案服务创新。