程梦瑶
在大数据发端之际,百分点集团抢占先发优势,并迅速成为中国本土大数据企业的佼佼者。7年时间,百分点集团从一家主要为电商企业提供个性化推荐引擎的大数据分析技术提供商,发展成为一家从大数据底层技术产品到大数据应用级产品的大数据全产业链布局的综合解决方案提供商。
纵观中国大数据产业的发展现状,大数据产业生态链正在不断构建并趋于完善。大数据的概念已经深入人心,数据正在成为认识真实世界的有效方法。
从电商到全行业
2009年,苏萌创办百分点集团,此时的大数据并没有引起广泛关注,在业界也没有得到认同。百分点起步后,陆续与活力达、果皮网等一些中小电商网站达成合作,并逐渐在电商行业获得了一些知名度。
在成功获取1号店管理团队的信赖之后,百分点的个性化搜索引擎在电商领域奠定了领导者地位。
在如今的市场认知中,百分点集团与电商似乎是密不可分的关系体。然而,这种认知却略显促狭。
2013年,苏萌做出了大胆的决定—让百分点转型,为传统行业提供全套大数据解决方案。苏萌为传统公司的数据转型,提出了一个“百思可”(BASIC)模型。
他提出,一个传统公司想要成功转型,必须具备五大要素:相信数据的价值(Belief)、面向数据的组织架构(Architecture)、擅长处理数据的专业团队(Staff)、完善的底层基础设施(Infrastructure)以及处理数据的机构能力(Capability)。
聚焦五大核心要素,百分点集团成功为传统企业提供大数据技术平台搭建和大数据驱动的SaaS应用。在电商之外,百分点集团为华为、TCL、长虹、中国建设银行、王府井百货、长安汽车、万科和中国电信等知名企业,提供大数据解决方案。
2015年9月,百分点集团宣布完成由光大证券领投的4亿元D轮融资。同期,百分点集团发布全球首款企业级大数据操作系统(BD-OS)。
BD-OS具备了大数据操作系统必需的五大要素,即:存储管理、资源管理、任务调度管理、人机交互界面、数据生命周期管理,实现了将繁复的大数据底层技术与便捷的大数据操作进行一站式对接。
BD-OS的诞生在中国大数据产业生态中,具有里程碑式的意义。以自主研发为基石,BD-OS填补了从繁复的底层技术到便捷的大数据操作之间的空白。
2015年12月,百分点集团发布了旗下的用户标签管理系统,这是一款生产用户标签,并管理标签生命周期的大数据工具,能够帮助企业精准预测和构建用户特征,搭建以用户为中心的大数据运营体系。
自此,在百分点集团的推动下,大数据“用户画像”逐渐成为企业营销决策的重要参考依据。
截至目前,百分点集团已经打通了从技术层的大数据操作系统到管理层的用户画像标签工场,再到应用层的推荐引擎、分析引擎和营销引擎等,覆盖大数据全产业链的实现路径。
“双引擎”打造数据基因
在苏萌看来,百分点集团做的每一件事都是在帮助企业搭建数据基因,无论是传统企业还是互联网企业。企业应该如何打造数据基因才能真正地融入数据世界,为自己的经营管理效能的提升带来实质性的改变呢?
对此,百分点集团董事长兼CEO苏萌的回答是:“企业必须具备由数据化(Datafy)、发现洞见(Discover)以及设计重构(Design)这DDD三要素打造的数据基因,进而让数据与技术实现流动和共享,成为推动企业不断循环进化的资源。数据作为一种生产资料,不但需要流通,并且还需要被交叉复用,以此来发挥更多精准的价值。但这种价值,在传统的商业模式里难以做到,其核心原因是数据通常是以孤岛的形式存在的。”
通过DDD三要素打造的数据基因,旨在实现数据的流通和交付。为此,百分点集团搭建了一套“双引擎”模式来实现。这套“双引擎”模式包括基础引擎和智能引擎,从而驱动智慧商业的落地。
基础引擎,涉及到大数据产业链上的全生命周期,其核心成果即为BD-OS。百分点集团的创新之处在于,BD-OS从理论上明确了大数据操作系统的概念和特征,作为首款拉通业务、数据、模型和技术的平台级产品,BD-OS同时具备了全可视化操作的特性。
智能引擎,以深度学习、感知技术和知识图谱为核心,以人工智能和商业智能融合为基础,可为各行各业构建大数据智慧商业,并实现与数字世界的加速融入。
在智能引擎中,深度学习是一种神经网络,运用到文本、自然语音识别等应用中后,可以极大地降低错误率。
百分点集团技术副总裁刘译璟,对于深度学习的应用前景有自己独特的认识。他认为:“有了深度学习之后,通过感知技术对文本类型的视觉感知,并与现实进行更多交互,就能构建知识图谱。有了知识图谱之后,就可以在知识图谱上做很多推理,或者说,做很多搜索的工作。今天很多搜索引擎会被推荐引擎所替代,未来可能会被知识图谱这样的智能分析所替代。”
据刘译璟介绍,百分点集团将卷积神经网络CNN(Convolutional Neural Network)与栈式自编码器等深度学习算法运用到了自然语言处理与语义分析、数字图像处理与识别、实体抽取与联想、关联挖掘与关系推理、知识图谱构建等方面,并对客户提供相关的API以及基于知识图谱的数据应用。
百分点集团已经在27%的项目中应用了深度学习。此外,深度学习在生产应用中还会继续增加,刘译璟估计,到2020年将有62%的项目会采用深度学习。
智能重构数据世界
如今,百分点集团已经逐渐积累了超过37PB的数据量、超过5.5亿的用户量,以及每天超过6TB的数据增量和每天超过5000万的活跃用户。
挖掘数据并对数据进行价值再造,这是百分点集团商业模式的成功之处。
回顾百分点集团的起步阶段,刘译璟谈及:“之所以在2009年开始做推荐引擎,就是看到,随着信息化的发展,每个人都将深度参与到信息社会中。面对近似于无穷的信息,如何将信息和人进行有效地匹配将是全社会的刚需和难题,如果解决不好这个难题,我们将深陷于信息的暗海中,社会运作的效率也将极其低下。”
7年时间证实,2009年的探索方向是正确的。“各大网站和企业纷纷将推荐系统作为标配,这也是旁证。可以看出,个性化技术以及基于个性化的服务,将会迎来更大的发展。”刘译璟补充道。
相对于推荐引擎,刘译璟更愿意用“个性化技术”来描述。
“个性化技术本质上是让机器理解人的方方面面。我认为,我们现在做的还非常初级。随着互联网和移动互联网、物联网、可见光通信、可穿戴设备、VR等技术的发展,人会越来越容易被‘感知和‘数据化。随着脑科学、人工智能甚至量子计算机等技术的发展,机器会越来越强大。届时,真有可能让人感叹‘机器更加懂我。”刘译璟所憧憬的明天,其实并不遥远。
7年来,百分点集团坚持自主创新,并沉淀了丰富和坚实的企业级大数据应用实践案例,软件著作、专利和技术创新超过了百项。在百分点集团现有650名员工中,有2位国家“千人计划”入选者、30多位博士和来自国内外一流大学和技术公司的300多人的研发团队。
2016年5月,Gartner将百分点作为唯一的一家大数据公司入选“2016 China Cool Vendor”,并给出评价—利用自身的超过5.5亿的用户全网画像,以及超过1亿的商品全网画像,帮助客户利用先进的算法技术、不同数据来源,开发出创新的业务成果、有效地管理数据资产,并实现数据价值。
正如刘译璟所言,大数据最核心的观点是利用数据化的理念和技术对现实世界建模,构建一个数据世界,基于这个数据世界再去构建相应的业务系统,从而实现智能化的应用。
智能重构数据世界,百分点集团正不断向前迈进。