整肃爬虫公司

2019-10-28 02:17杨群
中国新闻周刊 2019年38期
关键词:爬虫套路科技

杨群

近段时间,杭州市公安机关异常繁忙。

最近大数据风控平台魔蝎科技的高管以及新颜科技的高管相继被警方带走;公信宝运营公司亦被杭州市公安局西湖分局古荡派出所查封。

9月份,大数据风控行业迎来史上最严的查处,很多公司再次面临生存危机。

一个多月以来,杭州、深圳等多地公安出动警力,带走多家大数据风控平台高管协助调查。一时间,整个大数据风控行业風声鹤唳,从业者人人自危。

公信宝国际事务总监丁云鹏向《中国新闻周刊》透露,为配合警方调查其曾经服务的某公司,公信宝CEO黄敏强被警方带走协助调查,至今还没有消息。目前,公司已被警方查封,国内员工在家办公,海外团队暂时没有受到影响。

受此消息冲击,在魔蝎科技的高管被带走当晚,上海大数据风控平台聚信立随即向商户下发通知,表示将暂停对外提供用户授权的运营商爬虫服务。此外,鹏元征信、立木征信、白骑士等多家大数据风控服务商纷纷暂停部分服务。

源于清查“套路贷”

《中国新闻周刊》从多位业内人士处获悉,本轮公安机关针对大数据风控公司的行动源于催收公司拿到被害人定位信息上门催收,将人逼到跳楼自杀。这起命案让警方反过来追查数据公司倒卖个人隐私数据的责任。

与以往不同,此次集奥聚合、同盾科技等头部平台高管先后被多地警方带走。梳理最近波及的大数据风控公司名单,高管被带走的平台几乎都集中在杭州地区。

《中国新闻周刊》从警方内部人士获悉,目前相关案子杭州警方办得蛮多,具体案件主要是杭州市公安局西湖分局在办。“由于案件正在侦办过程中,具体细节都不让了解,也就是不能对外发声,领导也要求不要再问。”一位不愿具名的警方内部人士说。

不过,可以确认的是,这与杭州警方近半年对“套路贷”高压态势有关。今年,打击“套路贷”是公安部部署的重要任务之一,下达到各地公安机关情况各有不同。由于杭州是互联网金融“重灾区”,各种新型网络“套路贷”案件频发。

9月3日,公安部在河南郑州召开打击“套路贷”犯罪工作推进会。会议要求,要打掉“套路贷”团伙开发使用的非法放贷App、非法网络借贷平台,查扣银行账户及第三方支付平台的涉案资金,依法追缴,打掉专门从事非法催收业务的职业催讨团伙,依法处理。

世博会上的同盾科技展台。图/IC

浙江省刑侦总队总队长沈虹分析了“套路贷”犯罪新趋势。他认为,“套路贷”开始由传统的线下接触式转为网上接触式。以前的套路贷犯罪模式,都是和受害人有面对面接触的过程。但现在,发展迅猛的是以网贷为依托的“现金贷”,数额小、周期短、灵活性高、欺骗性强。

更早的时候,在今年3·15晚会上,警方提出了一个新词:“714高炮”。一般借款周期为7天或者14天,“高炮”是指其高额的“砍头息”及“逾期费用”。砍头息是高利贷放贷人放贷时先从本金里面扣除一部分钱作为利息。警方透露,这种“714高炮”网络套路贷已经在浙江出现。

据警方介绍,这种网络“套路贷”呈现新的特点,一是散布“无息无抵押”等信息引诱人;二是通过互联网借贷平台生成借条合同;三是违规收集借款人个人信息,尤其是手机和微信通讯录等社会关系资料;四是以借条合同为掩护,收取畸高利息;五是迫使借款人“体外循环”还债或虚增债务,骗取高额利息。

9月11日,杭州市公安局举行新闻通报会,今年以来有60个套路贷App被关停、19个犯罪窝点被端掉。7月份以来,杭州警方先后对多个“现金贷”类套路贷犯罪团队集中收网,捣毁“现金贷”类套路贷犯罪团伙8个,抓获违法犯罪人员300余名,其中采取刑事强制措施140余名,冻结涉案资金、资产7600余万元。

被查的这些大数据风控平台,有的为“高炮”平台提供风控服务、贷超导流服务,有些还亲自下场放贷。信用管家作为贷超为“高炮”平台导流。黑猫投诉显示,快钱也被多次投诉为“高炮”平台提供支付服务,沦为高利贷残害百姓的帮凶。

警方还发现,在用户下载这些借钱App时,系统会要求用户开放手机内的通讯录、通话记录等隐私信息。很多人为了几千块的借款,个人隐私完全暴露。此次,杭州警方的雷霆行动,足以让这些大数据平台胆战心惊。

实际上,监管对大数据风控行业一直保持高压态势,分别在2017年现金贷平台泛滥和2018年电信诈骗案件高发时,进行了两次大规模的打击,并且系统地调查了几十家大数据风控平台的真实情况。

“最近,警方调查大数据风控平台的起源,并非是保护个人信息,更可能是为了打击‘套路贷。”维信金科副总裁李宁对《中国新闻周刊》透露,当数据行业缺乏自律时,尤其是套路贷案件出现人命官司后,反过来警方就会追究,谁为“套路贷”平台提供了系统、数据和催收,这才会涉及数据安全。

P2P网贷等服务平台,是爬虫获取大数据的重要渠道之一。图/IC

爬虫高管被拘捕

随着互联网金融的兴起,大数据风控公司头部企业同盾科技、百融云创、聚信立、集奥聚合等平台在2013年前后成立。此次,这些头部平台均不同程度卷入调查,尤其是同盾科技两名爬虫业务负责人被拘捕更为引人关注。

9月27日,同盾科技相关负责人向《中国新闻周刊》确认,公司旗下爬虫业务负责人童保华、徐斐为配合警方调查曾经服务的某第三方单位,正在协助警方调查取证,具体被带走时间不清楚。

就在十天前,有消息传出“同盾科技爬虫部门已解散,该部门员工集体待岗,并被建议不要离开杭州,否则有被抓风险。由于局面失控,同盾科技实控人兼CEO蒋韬已出国避风头”。

针对网络传言,同盾科技发布蒋韬署名的《心存敬畏 向善而行》公开信,信中称“我在杭州,一切安好,欢迎来聚”,并表示要“宽容创新”等。

9月29日,同盾科技联合创始人兼技术副总裁张新波和同盾科技副总裁李伟东接受了《中国新闻周刊》的采访。

张新波是同盾科技四位联合创始人之一,主要负责底层技术。2009年,张新波比蒋韬晚大约一个月加入阿里巴巴,成为国际交易风控与反欺诈团队的早期成员。2009年至2011年,他全程参与阿里巴巴国际站风控与反欺诈系统的建设。后来,阿里巴巴成立集团安全部,蒋韬是技术总监,他是技术专家。

2013年,张新波与蒋韬、祝伟、马骏驱四人成立同盾科技。最初,同盾科技想从电商和支付的反欺诈切入。不过,由于缺乏品牌知名度、团队规模较少以及产品不成熟,迟迟打不开银行的业务。一直到2015年,同盾科技才有了第一个银行客户,替三峡银行做风控咨询的解决方案。

与银行业务不同,同盾科技的互联网客户发展却很快,尤其是互联网金融的客户。近几年,互联网金融业务占比在逐步下降,一方面是行业公司数量在降低,另一方面也是为了迎合监管不得已做的转型。

而在平安保险、外资银行和平安银行工作多年的李伟东加入,对同盾来说,则是更加增强了与持牌金融机构合作的能力。同盾科技方面透露,李伟东加入同盾后,同盾在银行方面业务翻了一倍。最新数据显示,同盾科技客户总数已突破一万家,其中50%互联网机构和50%金融机构。

同盾科技在声明中表示,信川科技是同盾科技旗下全资子公司,数聚魔盒为信川科技旗下的独立品牌产品。同盾科技相关负责人对《中国新闻周刊》表示,信川科技自2018年开始已逐步调整业务,至今年3月爬虫业务已经全部下线,原有部门员工也已经调整至其他部门正常工作。

徐斐曾就职于阿里巴巴6年,与蒋韬是老同事。2014年,她加入同盾科技后任副总裁,负责互联网金融、电商O2O、三方支付等领域反欺诈工作。另一位被查的童保华,曾经就职于另外一家头部大数据风控平台聚信立,2016年被挖到同盾科技出任数聚魔盒商务总经理。

企查查信息显示,信川科技成立于2016年5月,原来法定代表人为蒋韬,今年6月26更改为徐斐。一位业内人士向《中国新闻周刊》分析,同盾科技一开始将爬虫业务剥离出去单独设立信川科技,以及几个月前将相关公司法定代表人进行变更,就有着规避风险和“弃卒保車”的考虑。

图表制作:田昊

如何爬取数据?

数聚魔盒是信川科技的核心产品,主要涉及数据采集流程,支持爬取数据用作信用评估。

公开信息显示,数聚魔盒团队服务的客户主要来自互联网金融机构,包括了P2P网贷、消费金融、理财、保险、车房租赁等。成立仅仅6个多月,就已经有超过100家金融机构使用数聚魔盒产品,累积超过200万次数据调用量。

2018年8月,数聚魔盒举行产品升级发布会,推出全新产品“万象”系列,与之前的魔方系列、百川平台形成三大产品系列。其中,魔方是面向消费金融、信贷、汽车金融等客户提供魔方报告;百川是面向银行、政府、大型企业提供数据采集整体解决方案;万象是以多方数据沉淀为基础,数据分析及建模为核心,面向金融机构提供智能决策及欺诈风险判断。

为保证采集多维数据的基础上兼顾用户隐私,数聚魔盒采用“爬取互联网公开数据+打通同盾体系内数据+用户授权数据采集”交叉关联的形式,通过用户授权,利用网页极速抓取技术获取各类用户个人数据,通过海量数据比对和分析,交叉验证,最终为各类机构提供用户的风险分析判断。

在此三大产品体系下,数聚魔盒能够满足不同业务场景的需求,已经为银行、保险、汽车金融、小微企业、非银行信贷、消费金融、电商等多个行业客户提供基于大数据的智能决策服务。截至2018年,数聚魔盒已经服务了超过2000家海内外客户,累计超过亿的数据调用量,覆盖了超过8000万独立用户,连接了超过亿人的关系网络。

张新波将信川科技定位为一家技术公司,主要是通过数据采集工具帮助客户采集信息。对于爬虫技术,他认为是“技术中立”的,“原本这些信息就需要向金融机构提供,用户自己打印截图跟我们帮他爬虫是一样的。爬虫就是一个工具,帮他把数据自动采集下来,然后倒进去而已。”

为此,维信金科副总裁李宁特意区分爬虫和采集。他认为,爬虫是你到互联网上在别人不知情下获取数据;如果用户在某一特定情况下,授权你去访问,那就叫采集。爬虫和采集是两码事。当然,即便是采集完了也只能在授权范围之内使用,有限度地使用,而不能够将数据私自储存,稍微包装一下卖给第三方。

数据采集要如何做到授权和合规?张新波认为,第一,采集什么数据需要告知客户;第二,需要采集网站的用户名和密码需要客户自己填进去,经过授权。

对此,李宁认为当前很多大数据公司都做不到完全合规。首先,要求客户授权是一个强制措施,不授权不能使用;其次,没有告诉客户授权的具体内容,很可能过度采集客户信息;再次,让客户自己将用户名和密码填进去授权,其实是在打擦边球;最后,授权的文件十分冗长,大部分人都不可能从专业律师拟定的条款中挑出任何毛病,只能乖乖签字。

浙江警方抓获的一个套路贷团伙246名犯罪嫌疑人。图/视觉中国

因爬虫数据获刑

大数据风控行业再次遭遇监管打击,从业者从中感受到瑟瑟寒意。

大成律师事务所合伙人肖飒每天都要接待来自大数据行业从业者的来访和来电,大家关注的焦点话题是:什么情况下会被警方带走?怎样就算是涉嫌犯罪?哪些产品存在问题?

“大家关注的焦点就在于自己行为是否合规,而且更关心是否刑事合规。因为一般的合规而言只是罚款,而一旦刑事不合规,则会面临牢狱之灾。”肖飒对《中国新闻周刊》解释道。

肖飒认为,大数据行业是一个有风险的行业,从业者或多或少知道自己的业务有一定风险。但是一直以来,大数据行业刑事风险较少,个人信息泄露基本上还未和大数据行业联系的很紧密。所以,权衡之下,大部分从业者在利益诱惑下还是坚持做下去。一旦刑事风险出现,大部分从业者就很慌张。

长期以来,个人信息泄露归类到个人保护不当或黑客的原因。2016年,徐玉玉等一系列电信诈骗案出现,使得社会舆论集中关注到个人隐私信息被批量贩卖。一个纯真无邪的女生因为个人隐私泄露被骗身亡,引起全社会的极度愤怒,更是大幅度地推动《网络安全法》的出台。

2017年5月,在《网络安全法》正式实施前夕,监管针对大数据乱象出手,先后将30家大数据风控平台列入调查,其中就有几家估值高达数十亿元。

大数据行业因爬虫數据获刑的要算北京数据堂。在两年前那次监管打击中,北京数据堂的多名高管被带走,原因就是大肆买卖用户个人信息,其中涉及隐私性的数据。这家成立于2011年,2014年底在新三板上市的大数据风控公司,核心业务就是大数据的采集、处理和挖掘。警方在侦查中发现,北京数据堂在八个月内日均传输公民个人信息1.3亿条,数据大多是爬虫得来。

然而在李宁看来,真正运用《网络安全法》和《个人隐私保护法》进行精准判决的案子仍属少见。这也造成上轮监管打击,并没有产生足够震慑。于是时隔一年,大数据行业又迎来第二轮收网式打击。

2018年11月,针对大数据行业乱象,监管再次带走大量从业者调查。这一次监管针对的是公民信息泄露,其中数据不乏来自政府单位。甚至有的电信诈骗分子会伪装成公检法人员,利用的便是公众对公检法机构人员的畏惧和公安身份查询接口返回的高清网纹身份证照片。

时隔不到一年,2019年9月,大数据行业迎来第三轮整顿。此轮整顿原由,警方并未对外公布。不少业内人士表示,与第三方数据平台为“714高炮”平台、套路贷平台提供数据服务,非法倒卖个人隐私信息脱不开关系。

社科院金融研究所法与金融研究室副主任尹振涛认为,这次大数据风控行业整顿,主要还是与之前电信诈骗专项整治有关,当然也和互联网金融风险转向整治有关,主要还是个人隐私等问题,金融业务相对较少。

西南财经大学普惠金融与智能金融研究中心副主任陈文则表示,现在这些大数据风控公司被查大多是公安机关出动,并非监管出动。公安机关查处的部分大数据风控公司涉及现金贷业务以及暴力催收问题,属于打黑除恶行动的延续。当然,这个过程中也有部分公司是因为未经授权“爬虫”获得数据并违规使用带来的侵害个人信息隐私等问题被查处。

猜你喜欢
爬虫套路科技
基于Python的网络爬虫和反爬虫技术研究
Python反爬虫设计
谨防“套路贷”的这些“套路”!
Airbnb上的套路
基于Scrapy框架的分布式网络爬虫的研究与实现
谁抢走了低价机票
科技助我来看云
科技在线
不设套路,只为初心
眼下有套路