摘 要 随着社会经济的快速发展,传统的征信服务逐渐无法满足我国不断扩大的征信需求,在互联网技术普及的大环境中,大数据征信逐步发展壮大起来。由于我国大数据征信行业起步较晚,目前尚处于初步发展阶段,在其发展过程中还存在一些亟待解决的问题,因此,研究和探讨互联网环境中大数据征信行业的发展策略具有非常重要的现实意义。基于此,本文首先阐述大数据征信的出现及特点,然后分析互联网环境中大数据征信存在的问题,最后提出几条有效的发展策略,旨在为我国互联网环境中大数据征信行业发展水平的提高,提供一些有益借鉴。
关键词 互联网环境 大数据 征信
在互联网快速发展的今天,云计算、大数据等一些新兴技术逐步应用到人们生产生活的各个领域,使数据的产生和存储变得非常容易。数据挖掘、机器学习等算法技术的出现,进一步推动了对征信数据的挖掘和采集,由此产生了大数据征信,腾讯征信、芝麻信用等互联网征信企业也应运而生。目前,我国大数据征信行业尚处于起步阶段,在信息主体权益保护、征信数据真实性、征信机构独立性等方面还存在很多不足之处,有待进一步改进和完善。
一、大数据征信的出现及特点
(一)大数据征信的出现
在大数据征信出现之前,央行(中国人民银行)个人征信报告的覆盖率非常低,而快速发展的互联网给大数据征信机构提供了发展平台。据统计,截至2019年1月,国内个人征信系统的覆盖率仅为38%,而美国的覆盖率高达92%。随着互联网技术的普及,私营征信机构不断涌现,如腾讯征信、芝麻信用等,形成了与公共征信并存的发展格局。此外,金融科技的发展为征信行业带来了变革良机。金融科技的快速发展促使大数据开辟出个人信贷领域,征信机构得以利用智能手机和互联网设备,快速搜集、分析、挖掘大量多样化、分散的数据,通过机器学习算法对信用主体的还款能力和还款意愿进行预测,最终形成征信产品。
(二)大数据征信的特点
一是大数据征信的服务人群在央行个人征信中普遍没有信贷记录。二是大数据征信的主要数据来源为互联网浏览数据、消费数据、社交数据等,渠道很广。三是大数据征信的理论基础为神经网络、树类模型等复杂的机器学习模型。四是大数据征信的信用评价模型在参考传统信贷产品行为的基础上,还参考了互联网设备操作行为、浏览偏好等。
二、互联网环境中大数据征信的问题
(一)信息主体权益保护不到位
第一,我国法律对信息采集的边界未作明确规定,且个人隐私的范畴也不明确。征信机构通过数据挖掘和抓取技术采集海量的信息,不可避免地会对信息主体的隐私权造成侵犯。所以,就算征信机构通过设置隐私条款、授权信息采集等方式征得了信息主体的同意,但信息主体还是不能对个人数据信息被运用和采集的情况有充分掌握,同时这也弱化了征信机构保护数据的责任。
第二,在互联网时代,通过大数据采集的原始信息数据在经过进一步加工后会生成新的数据。同时数据会被多个机构处理和使用,如果出现信息泄露的情况,信息主体难以举证、追溯和维权,很难保障个人对信息的投诉权、异议权等。
第三,根据有关规定,征信机构应对超过5年的不良个人信用记录进行删除,而网络数据方便存储且易于传播,很难彻底清除相关数字信息,也难以保障信息主体的信用重建记录权。
(二)征信数据的真实性有待提升
第一,征信数据缺乏共享性。在我国,大数据征信业务存在“数据孤岛”现象。一是央行征信未纳入大数据征信机构,征信机构的大部分数据来源于自有数据渠道。在利益激励机制不健全的状况下,征信机构之间很难实现数据共享,这不仅限制了征信数据的维度,也对征信数据的效用造成了很大影响。二是各征信机构根据各自的标准采集和使用征信数据,因数据标准不一,对大数据的共享造成了一定影响。
第二,征信数据缺乏准确性。通过大数据可采集到海量信息,但采集到的数据信息质量往往不高,其中不可避免地会存在一些错误信息。例如,部分网络社交数据可能遭遇人为篡改,无法保证采集数据的准确性。
第三,社交数据是否有效存疑。社交数据不具有金融属性,与行为主体的还款意愿和还款能力之间缺乏关联性,这使得社交数据的价值存在争议。
(三)征信机构独立性不强
目前我国大部分征信机构都不是独立的第三方机构,其数据采集及使用行为均与自身利益有着密切联系。例如,芝麻信用利用阿里电商金融服务生态圈数据,同时为蚂蚁金服和阿里巴巴集团的商户、企业服务,可能会在无形中对征信机构产生市场影响力,扭曲信息使用者和提供者的行为。例如,用户有可能为了提升信用分而特意选择和征信因素相关的服务,从而导致征信产品缺乏有效性,其公信力受到质疑。
三、互联网环境中大數据征信的发展策略
(一)加强信息主体权益保障
第一,强化信息主体权益保护立法。抓紧制定和出台专门保护个人信息的法律法规,对个人隐私范畴进行明确,对征信采集信息的范围予以界定,严格落实信息主体对个人信息的知情权、所有权、控制权等。
第二,运用技术手段保护信息。深入研究并推广数据安全技术,促使有关机构加大对个人信息的保护力度,并严格监控征信机构的数据采集、运用等行为。
第三,严格落实大数据征信机构的数据保护责任。征信机构应充分向信息主体披露信息,告之其采集数据的使用情况,并在网络服务协议中增加数据安全保护条款。
第四,建立健全信息主体权益保障机制。对个人信息异议处理流程进行明确,拓宽异议处理渠道,建立个人信息侵权责任追究制度。
(二)提高征信数据可信度
第一,建立征信数据共享机制。政府部门应尽快制定和出台共享信用数据的管理办法,加大公共信用数据的共享力度。央行征信系统应将符合规定的征信机构纳入数据服务系统,还可以利用区块链技术,通过分布式账户形式实现不同大数据征信机构之间的数据共享和交换。
第二,提高征信数据的准确度。利用多维度交叉验证和数据清洗等技术甄别筛选数据,保证数据的完整性和真实性。
第三,对存在争议的数据要谨慎使用。征信机构应尽可能采集那些与信用风险相关性比较大的大数据,如支付数据、房租数据等,尽量避免采集和使用存在较大争议的社交数据。并对数据分析算法不断完善,在改进数据结构的基础上,不断提高信用评估模型的预测能力。
(三)保证征信机构的独立性
第一,采取独立公司治理模式,在公司人员、组织机构、财务、资产等方面实现独立,防止少数股东操纵公司的运作。
第二,保证数据分析模型和数据来源的独立性。利用拓宽数据采集渠道等方式保证数据的独立性和多元性,加大数据分析力度,同时禁止与信息使用者或提供者存在密切关系的业务介入,避免出现利益冲突,赢得征信产品市场的认可。
(四)加强对征信机构的监管
第一,尽快建立和完善征信法律法规。制定出台有关大数据征信行业的准入制度,建立健全有关数据管理和信息安全的各项制度,明确界定大数据征信机构的行为边界,对征信数据采集、运用的业务流程进行细化,并制定有关惩戒措施。
第二,不断创新大数据征信监管手段和方法。积极探索动态非现场监管模式,强化对数据挖掘、采集、使用等多个环节的监控管理。通过风险提示、信息披露等多种监管方法,构建信息公示平台,对征信机构的违法违规行为进行通报。强化对大数据征信机构的分层分类监管,制定有关措施和标准,加大对征信机构量化考核的力度。
第三,提高监管人员的综合业务能力。监管大数据征信行业,监管人员不但要具备征信业务知识,还应具备数据分析技术。因此,建议高等院校开设有关课程和专业,加大对高素质人才的培养力度,不断建设和充实大数据征信监管队伍,提升大数据征信监管水平。另外,大数据征信监管部门也要加强对在职监管人员的业务培训,优化监管人员的知识结构,不断提高监管人员的监管能力和水平。
四、结语
在互联网环境中,可通过采取加强信息主体权益保障、提高征信数据可信度、保证征信机构独立性、加强征信机构监管等多项有效策略,不断提升大数据征信管理水平,促进大数据征信行业的健康、可持续发展。
(作者单位为北京邮电大学)
[作者简介:赵子澄(1997—),女,湖北黄冈人,硕士研究生,研究方向:市场营销]
参考文献
[1] 张健.大数据征信的创新特点、问题及优化路径[J].电子商务,2018(1):17-18.
[2] 戈志武.大數据征信监管研究[J].西南金融,2017(4):13-18.
[3] 黄庆华,陈婉莹.基于互联网金融平台的大数据征信应用研究——以蚂蚁金服为例[J].科技与经济,2017(3):55-59.
[4] 陈璐,周桃云,任婧怡,等.互联网背景下大数据征信应用研究——以“蚂蚁金服”为例[J].市场周刊,2018(7):108-110.
[5] 崔立群.基于互联网金融平台的大数据征信应用研究[J].时代金融,2018(12):21.