公开数据也是一门好生意

2017-12-27 19:57张睿
第一财经 2017年48期
关键词:天眼用户信息

张睿

“北京红黄蓝儿童教育科技发展有限公司,位于北京市丰台区科学城航丰路8号,于2007年注册成立,注册资本715万美元,公司董事长为曹赤民,其他高管包括胡文、张慧洁、邓燕玲、史燕来、陈永春、孙闻宇等。”

如果你关注最近的幼儿园虐童事件,大概会对上述信息感兴趣。每一家在工商局注册成立的公司都会公布相应的信息,如果继续深入了解,你还可以从其他公开渠道查到這家公司的股东信息、商标专利、诉讼纠纷等。

大多数人可能并不知道查询这些公开信息的渠道和方法。事实上,围绕数据这门生意已经衍生出大量创业公司,从行业来看,它们往往集中在金融、医疗、运营商等高价值属性的私有数据领域。

不过,成立于2014年的北京金堤科技有限公司(下简称“天眼查”)试图挖掘公开数据的价值。基于开放数据和共享的政府公共数据,该公司整理出包括上市信息、企业背景、企业发展、司法风险、经营风险、经营状况、知识产权等64种数据维度信息,开发了数据产品平台“天眼查”。

在上述红黄蓝虐童事件发生后,截至2017年11月29日,天眼查的数据已被第一财经、央视财经等媒体的1284篇报道引用。更早之前,麦当劳中国更名“金拱门”一事由天眼查官方微博率先公布,后获得上千家媒体跟进报道。

该公司CEO柳超认为天眼查不是一个产品,也不是一个产品体系,而是一个以公开数据为切入点、以关系为核心的的数据产品平台—通过庞大的数据库和自主研发的算法,天眼查快速计算出人和人、人和公司、公司和公司之间的关系,为用户提供“查公司”“查老板”“查关系”3个核心功能。除了基本的商业信息,天眼查还能提供不同实体之间的商业关系图谱。目前天眼查已经收录了全国超1.2亿家市场主体(公司、社会组织、律所等)的信息。

在柳超看来,公开数据挖掘能为个人和企业在商业调查过程中节省时间和沟通成本。比如,刚拿到Offer的大学毕业生可以通过天眼查,了解公司是否有拖欠工资等行为。此外,天眼查也为金融机构和政府机关提供数据支持,该公司的企业客户包括中国人民银行、重庆进出口担保、毕马威会计事务所、中征应收账款融资服务平台、中招联合等。

天眼查并不是没有竞争对手,类似的商业信息查询工具还有“企查查”和“启信宝”。从最近30日的百度指数看3家公司的活跃度,天眼查的搜索指数以整体日均值47118排名第一。2017年3月,天眼查获得国家中小企业发展基金领投的1.3亿元投资A轮融资,该基金由国家发改委和财政部设立。

但是在成立初期,天眼查抓取和挖掘公开数据的方式并不受认可。一些投资人对此的质疑在于:公开数据大家谁都可以连接,谁都可以查看,你的价值何在?尽管当时大数据创业是热点,和其他买卖私有数据且利润颇丰的公司相比,投资人认为公开数据挖掘的市场价值和商业模式并不明显。

学术出身的柳超一直从事数据方面的研究。2008年,柳超获得美国伊利诺伊大学计算机博士学位,之后进入美国微软研究院任职,主管数据智能团队。2012年柳超选择回国,先后担任过搜狗首席科学家、北京航空航天大学“大数据”特聘教授等职务。

从2010年开始,围绕大数据概念衍生出了大量的初创企业,但在柳超看来,“大数据概念”存在的一个严重问题是“数据孤岛”现象—企业或组织都不愿意分享自己的数据。“大数据的价值在于数据的连接,”柳超说,“很多时候,学术的进步就是靠对公开数据的分析比较来推进。一些很美的理论要能运用到现实,能够为用户创造价值的时候,才会发现它更美。”

由此,柳超选择流通性更强的公开数据领域创业。数据公开是国家倡导的方向,未来会有越来越多的数据公示出来,柳超判断其中存在巨大的商业价值。

天眼查最早的数据抓取从工商信息和司法信息开始。工商信息来自“全国企业信用信息公示系统”,该系统主办单位是国家工商总局,公示的主要内容包括市场主体的注册登记、许可审批、年度报告、行政处罚、抽查结果、经营异常状态等信息。司法信息则来自“中国判决文书网”,该网站属于最高人民法院,每日更新刑事、民事、行政、赔偿、执行文书等上万篇。柳超说:“这两个构建了中国社会实体的骨干网络,剩下的信息就是对这个网络添枝加叶了。”

其后,为了增加关于企业是“做什么的”的信息,天眼查整理了来自工信部的ICP(Internet Content Provider,网络内容服务商)备案信息,列出企业网站名称和域名,用户可直接点击域名跳转至企业网站。

再次,关于企业的竞争关系,天眼查的方法是通过国家工商总局商标局、国家知识产权局搜集知识产权方面的信息,再看有哪些公司与其发生或知识产权方面的纠纷,从而判定这些企业属于同类竞争企业。

在信息公开化的趋势下,天眼查可以利用的公开信息越来越多,及时更新信息,用柳超的话来说,是个“苦力活”。比如他们近期整理了企业资质证书,关于“是否具有开矿权、是否具有医疗资格、是否具有高新企业认证等”问题,每一个隶属于不同部委不同部门,数量达上百种。

究竟应该将哪些维度的信息放上来,除了团队自己的判断,天眼查还建立了两个用户反馈渠道,包括主动渠道和被动渠道。柳超称,用户会给他们一些反馈,比如诉讼数据,用户希望知道诉讼中的企业是起诉方还是被起诉方,这是主动渠道;被动渠道则是天眼查根据用户的行为数据分析用户需要哪些产品功能点。

从收集信息渠道,到设计爬虫抓取信息,再到整理汇总,完成的仅仅是最基础的工作,柳超将其比喻成从找矿到收集土钻,再之后才是钻石成型更关键的切割工序。

对天眼查来说,真正能体现技术和价值的是对数据网络的分析和利用。比如分析企业风险情况的“天眼风险”模块,除了企业自身的经济纠纷、合同纠纷,它周边的商业实体的风险同样需要被考虑进去。“就是你看一家公司,各个方面都很都很好,这只能说明它自己的风险为零,但是可能它其中一个股东投资的另外一家公司的股票已经质押了,那对这个公司也是风险。”

当数据采集覆盖了2000多个数据源网站后,天眼查推出了最具特色的功能“查关系”—两个看似毫不相关的企业,背后可能通过多层参股或者共同股东发生联系。

为了让用户一目了然地看清复杂的商业关系,团队投入了大笔资金在核心技术—ACID图数据库的研发上,“如果用节点表示公司或人,用边表示关系,目前天眼查数据库里拥有超过1.2亿个节点和1.8亿条边,”柳超解释道,“然后再经历数据清洗、数据聚合、数据建模等流程,包含数千项数据指标与上万个数据模型,最后可视化地呈现出来。”

当日访问量达到千万量级后,今年4月,天眼查尝试推出付费业务,个人用户支付一年360元的会费后,可以查看公司股权、商业关系、风险分析等方面更完整的信息。此外,他们向企业客户收取定制或者接口调用费,客单价达几百万元。根据柳超透露,付费业务推出之后,5月当月公司就实现了盈亏平衡。截至今年年底前的3个季度,其营收在6000万元以上。

猜你喜欢
天眼用户信息
天眼刷“锅”记
关注用户
高轨“天眼”诞生记
关注用户
关注用户
神秘的天眼
如何获取一亿海外用户