文/高柳旭
分析能力构成大数据公司核心竞争力
文/高柳旭
随着互联网应用的日益深化,全球数据量正在呈现爆炸式增长,数据已经渗透到每一个行业和业务领域,并成为重要的生产因素。大数据的使用将成为企业成长和竞争的关键,人们对大数据的运用将支撑新一波生产力增长的浪潮。大数据时代对海量数据的积累、加工和利用能力将成为国力的新标志,大数据的深度分析和利用将对推动经济持续增长、提升国家的竞争力起到重要的作用。
为了使读者更进一步地了解我国大数据公司的发展现状,《中国商界》记者对易观国际产品中心总经理朱江进行了专访。
《中国商界》:易观国际成立于2000年,到现在已有16年了。多年来,易观国际一直是大数据行业的领跑者,目前的发展状况如何?
朱江:传统观念认为易观只是一个互联网分析公司,事实绝非如此。当然,我们在互联网分析上也拥有很强的专业能力。2010年以后,我们开始在技术与数据上投入更多精力,收集用户使用互联网的行为记录。通过这些监测数据,我们能够得到量化的数据,用以支撑分析师的观点与分析报告。易观的发展立足于分析师业务,这是我们的核心竞争力。2010—2012年,易观经历了一个快速发展过程,开始成为真正的大数据公司。我们基于收集到的数据与分析师的分析,对互联网企业和互联网产品做分析与评级的业务。另外,我们还对互联网用户的行为偏好做相关的分析。
目前易观的业务主要是传统的分析师业务与大数据产品。易观把大数据AI(人工智能)作为发展方向。随着互联网的发展,易观在2007年提出“互联网化”,2012年提出“互联网+”,去年又提出“数据是新能源”的理念。在未来,所有传统企业都会演变为数字企业,即互联网化的企业,用户数据将成为企业的核心资产。当然,仅仅拥有这些数据是不够的,只有分析能力强的企业才会在市场竞争中脱颖而出。数据分析会成为基础条件,并逐渐向人工智能方向发展。在未来,数据会成为“新能源”,在数字化企业的成长过程中,易观将为其提供“加油站”的服务。
《中国商界》:经过多年的发展,易观国际已经拥有了很多产品。请您介绍一下,易观国际目前拥有哪些产品?
朱江:开发者在开发应用时会嵌入易观的SDK,通过用户下载APP进入到移动终端。当用户打开应用时,用户行为习惯会反馈到数据库。易观会对开发者的产品运行状况进行分析,包括提供用户画像、应用评级的服务,这种服务产品我们称之为“易观方舟”,它是一种面向开发者的分析类产品,所有的数据源都源于“易观方舟”。“易观方舟”目前还是免费的,在未来,核心功能要收费。
易观另一个主要产品是“易观千帆”,它对整个移动互联网上的产品实施分析与评级。我们把收集到的数据,以APP作为聚合目标,得到若干指标,进行分类对比,得出某一应用在它所处的领域里面相对位置状况,领先它的竞争对手与落后它的竞争对手优势与劣势分别是什么,这样就得到了市场上不同细分领域下不同产品的竞争关系与发展潜力。“易观千帆”是对互联网企业和互联网产品进行分析,而“易观万象”则是与“易观千帆”相是对应的,“易观万象”是对用户的行为习惯进行分析,通过它,可以很清晰地看出互联网产品的用户特征是什么,用户在移动端的使用习惯是什么,以及使用习惯背后的人群特征是什么。通过数据分析可以使用户标签化,标签化以后可以把用户画像通过我们的产品呈现给用户。
另外,易观还有一个细分化的产品“广告万象”。目前,移动端吸引了70%左右的广告投入,这就需要知道投放在哪个APP上的广告受众最多、渗透率最高。易观依据用户的行为特征,为广告、媒体行业寻找精确的受众,制订投放广告或新闻的计划,比如可以对育婴阶段的女性用户准确投放母婴类广告,让广告实现最大价值。
“易观博阅”则是积累了分析师十几年来所有分析成果的报告库,用户可以购买账号,去查询所在行业的报告分析。
《中国商界》:易观国际一直充当着互联网行业观察者、分析者的角色。其技术优势在哪里?
朱江:“易观千帆”与“易观万象”是易观的大数据产品,传统的互联网监测产品一般都是采取统计、抽样的方式得到数据,这种样品池的方式收集的数据量比较小。易观的产品是通过海量的数据做出分析,所以结论的准确性会更高。今年第二季度末的时候,易观数据库覆盖的移动终端已超过10亿,每月活跃的用户达到2亿,这样的数量级别,为分析师结论的准确性提供了保障。
如何高效、快速地处理亿级别的数据量,考验着一个公司的技术能力,这对易观来说也是一项挑战。在中国,月活跃量达到2亿的APP不会超过10个,每天易观数据库接收到的数据量与活跃度前5名的APP规模是差不多的,这对数据的接入与处理能力提出了一个很高的要求,所以易观的数据处理能力是非常强大的。易观采用了业内首创的混合云架构,每天处理的数据超过100亿条(每个用户在移动端上的一个行为就是一条记录)。
易观分析师对互联网行业数据的分析有很深的经验积累与高超的分析能力,构造出了很多独有的数据分析模型,在市场中极具竞争力。
《中国商界》:据了解,TO B产品与TO C产品的区别是很大的。您能谈谈它们之间的区别吗?
朱江:现在大多数互联网产品是TO C产品,而我一直在做TO B产品。TO C产品能够很快上手,即使是一个刚步入职场的大学毕业生也能够做到。而要想做好TO C产品,没有3年至5年的从业经验是不行的。产品的好与不好,关键看能否满足特定用户群体的需求。TO C产品一般都是免费的,注重的是用户体验、界面美化、流程简便等,可以解决用户生活中特定场景下的某一问题,比如外卖软件,足不出户能够解决就餐问题。TO B产品是要满足行业中的业务需求、解决业务中的核心和难点问题,这就必须对产业的每个节点都非常清楚。相比较而言,产品的用户体验、界面美化倒是次要的。比如在广告投放过程中,需要了解受众对不同产品的需求,没有丰富广告从业经验的开发者,是很难做出用于投放广告的TO B 产品的。这就是TO B与TO C产品的差别。
《中国商界》:数据的准确性非常重要,大数据公司是如何准确获取数据的?
朱江:监测类产品一般采取两种获取数据的方法。一种是通过运营商的流量数据去分析,还有一种是嵌入式分析,易观使用的是通过SDK嵌入式方法获取用户在终端的行为数据。SDK嵌入式的好处是即使用户终端并没有联网,在玩一个本地游戏,依然可以获取到用户的行为记录,这是流量数据分析做不到的。不仅能采集到用户的操作行为,还能够采集用户的位置变化信息,确定用户连上咖啡馆的WIFI或者体育馆的WIFI,就可以推测出用户的生活习惯。
《中国商界》:信息泄露已经成为行业中饱受诟病的问题。易观是如何把握收集数据与保护用户隐私之间的界限的?
朱江:大数据狂潮如暴风般席卷了每个行业、每个人。随着成本降低、长期存储大量数据的技术和解决方案不断出现,越来越多的公司出手投资,使保存的数据量持续增大,时间也不断延长。在大数据渐成趋势的背景下,从保护用户隐私的角度做一番审视显得尤为重要。
美国在隐私保护方面做得很好。易观采用了美国公司的隐私保障机制。第一,采集之前要告知,如果用户不愿意可以拒绝。第二,设立安全保障机制,以加密的方式实施数据的传输和处理。第三,设立一个让用户可以“叫停”的机制,用户随时可以拒绝信息的继续采集。
先存储一切、以后再决定其用途的新时代已然来临。在不同数据隐私和保护框架下处理数据时,必须谨慎行事,确保遵守现行的成文法规(法律要求或监管条例)以及隐性规则。数据隐私及保护规则和监管条例必须不断更新才能符合大数据时代的要求。
《中国商界》:任何企业都是要盈利的,大数据公司的盈利方式是什么?
朱江:易观从成立到现在,一直都处于盈利的状态,之前我们主要由分析师服务与报告组成公司收入的主要来源。从去年开始,易观的大数据产品通过多次测试、运营,并且通过客户的试用,已经磨练得比较成熟,得到了市场的认可。目前40%左右的收入来自于大数据分析,50%左右的收入来自于分析师服务。易观的分析能力才是核心竞争力,大数据交易的收入不是很多,主要是通过数据分析产生报告,这已经成为可持续发展的主要盈利方式。大数据+分析,这两种盈利方式相辅相成,成为易观发展下去的动力。
《中国商界》:目前,大数据公司良莠不齐,只有可持续发展的公司才是最具前景的。易观未来的发展战略是什么?
朱江:简单的数据交易时代已经成为过去,数据分析能力才是一个大数据企业的核心竞争力。
投资机构在投资产品的时候,需要知道这款产品的竞争力是怎么样的,未来的增速情况如何,用户黏度会不会好,通过我们的分析,可以得知这款产品是否有投资价值,以及投资领域的整体发展趋势。
目前,市场上拥有数据的公司很多,有分析能力的公司也不少,但是既有数据又有分析能力的公司并不多。数据分析能力的高低,决定了价值发现过程的好坏与成败。获取的数据可能具有多种结构和类型,在数据抽取过程中,可以将这些复杂的数据转化为单一的或者便于处理的构型,以达到快速分析处理的目的。可以说,没有数据分析,“大数据”只是一堆IT库存,成本高而收益为零。另外,并不是所有数据都是有价值的,有些数据并不是我们所关心的内容,而另一些数据则是完全错误的干扰项,因此要对数据实行过滤“去噪”,提取出有效的数据。
但是国内的大数据行业,目前仍然停留在数据收集、整理、存储和简单报表等初级阶段。能够对大数据进行基本分析和运用的,只是少数企业。大数据规模庞大、类型多样、关联复杂的特点导致传统数据计算模式不再适用,大数据计算面临基本模式的挑战。如何对大数据的复杂性深入解析,并在此基础上构建高效的大数据计算模型,成为大数据处理的核心问题。
易观的最终目标是把现有的模型程序化,通过训练机器的深度学习能力,提高机器的分析水平,让机器发现更多的数据模型,这就是AI,即人工智能。这将打破人类思维上的局限性,也许会得出很多出乎意料的分析结果。
《中国商界》:基于互联网的大数据行业,前景是极其广阔的。您对这个前景怎么看?
朱江:我对大数据行业的前景非常乐观,在未来,数据会成为“新能源”,它在各个行业都会成为核心资产,所有的企业都会变成数字企业,每个企业都会拥有大量的用户数据资产,这也将成为最有价值的资产,挖掘用户数据对企业的贡献非常大。
大数据技术能够将隐藏于海量数据中的信息和知识挖掘出来,为人类的社会经济活动提供依据,从而提高各个领域的运行效率,并大大提高整个社会经济的集约化程度。随着大数据的应用越来越广泛,应用的行业也越来越普遍,我们每天都可以看到大数据的一些新颖的应用形式,从而帮助人们获取到真正有用的价值。