郭嘉凯
沧海横流方显英雄本色。越是在困难的环境下,越能体现一个人的特质。而在智慧星光公司总裁白剑波看来,李青龙身上最大的特质是他的坚持和执着。
说起进入大数据圈的经历,在智慧星光公司董事长李青龙看来,颇有些无心插柳的意味。
2012年时,国内大数据这一概念尚未兴起,但李青龙敏锐地捕捉到了一个业务场景。
“我们发现互联网和现实社会当中,存在非常严重的信息不对称问题,获取信息的方法只能通过百度搜索、各种新闻资讯,它是千篇一律的,用户只能被动地去看,不能获得自己想要的信息。”李青龙回忆道。
但用户对于信息的需求无疑是越来越迫切的,看到这一业务需求后,李青龙于2012年创立了智慧星光公司。当时,智慧星光的业务切入点是舆情分析。
冲在产品和业务第一线
之所以选择舆情分析作为切入点,是因为当时中国互联网的发展十分迅速,网络上每天充斥着各种各样的海量信息。因此,无论是政府还是企业,对于来自互联网的信息、数据的舆情分析都十分关注。
“那时虽然还没有大数据这一概念,但事实上,网络舆情分析和大数据之间有着天然的联系。”李青龙说道。
而在商业模式方面,智慧星光则选择了SaaS模式。这在当时而言,无疑是一个十分大胆的选择。众所周知,SaaS模式不仅对产品、服务有很高的要求,同时,企业必须达到一定的客户量才有可能生存。
李青龙坦言,在公司成立之初的两三年,确实经历了一段艰苦的岁月。不过,也正是由于有了那一段的艰苦时光,才使得公司在技术、业务上得到了磨砺和积累。
回忆起当时的经历,李青龙至今仍感触良多。李青龙说:“2012年一年才签了50个客户,可以说,大多数销售人员都基本挣不到什么钱。经常会有销售人员找我诉苦。”
面对这种艰苦的局面,李青龙并没有退缩和动摇。而是身先士卒,冲在产品和业务的第一线。
2012年,智慧星光签约的50个客户中,有近20个是李青龙亲自签下的。为了提升销售人员的业务能力,李青龙曾在连续半年的时间内,每天给销售人员做一个半小时的培训,告诉他们该如何去和客户打交道,如何来帮助客户找到业务痛点、解决问题。
沧海横流方显英雄本色。越是在困难的环境下,越能体现一个人的特质。而在智慧星光公司总裁白剑波看来,李青龙身上最大的特质是他的坚持和执着。
当时,通过朋友介绍,认识了一个客户,由于那时智慧星光公司在行业内还没有什么名气,所以和客户见了一面后,就没有下文了。但李青龍并没有就此放弃,而是在自己的手机上装了一套舆情分析软件,只要是和这个客户有关的信息,就通过手机短信发送给客户。这样坚持两三个月后,客户有了回复,有时会回信息说谢谢。坚持了六七个月之后,这个客户终于认识到智慧星光产品的价值,答应安装试用。在试用一段时间后,客户十分满意,很快就达成了合作,而且一直延续至今。
这件事情白剑波至今仍记忆犹新。“正是因为企业领导人身上具备这种坚持和执着的特质,才能让智慧星光不断发展、壮大。”
人工智能+文本大数据
经过两年多的积累和储备,2014年,行业迎来了快速发展期,智慧星光也由此驶入了企业发展的快车道。
李青龙的坚持还体现在对产品质量的要求上。众所周知,与项目制不同,SaaS服务模式对于产品质量、服务能力等都有很高的要求。因此,自公司创立以来,李青龙就对产品的质量提出了很高的要求,并且要求研发人员不断精益求精。
李青龙本人也亲自参与到产品的架构设计、流程制定等环节中。正是由于这种对于产品质量的坚持,使得智慧星光在面对用户时,有着足够的底气。
白剑波记得,当初在参加一个客户的项目投标时,总共有十多家企业参与。刚开始时,客户对于智慧星光的SaaS软件还有所质疑。“但当时,我们特别自信。”白剑波说道。
在十多家企业分别做完汇报后,客户突然提出要当场进行系统测试。由于事发突然,其他企业都没有答应。只有智慧星光进行了当场测试。测试完成之后,客户对于测试结果感到十分的吃惊和震撼,态度也发生了转变,由最初的质疑变为信任。
在白剑波看来,正是由于多年如一的坚持和积累,使得如今的智慧星光,在面对市场竞争和挑战时,要比别的企业从容很多。
时至今日,智慧星光SaaS平台的用户总数已经超过2万家,付费用户已有3000多家,可以说,在舆情分析这一领域,智慧星光已经成为当之无愧的领导者之一。
而比客户数量更让李青龙高兴的是,智慧星光在大数据领域的积累和创新。在数据积累方面,智慧星光的文本大数据平台,拥有800多亿条数据,日新增数据1.5亿条。“毫无疑问,星光大数据平台是目前最大的中文文本大数据平台。”李青龙自豪地说道。
以多年积累的文本大数据平台作为基础,再加上智慧星光独创的反向分词技术,智慧星光在文本大数据领域,已经成为国内领先的文本大数据服务商。
不过,李青龙的目光并不止于此。
“对于人工智能技术,智慧星光一直都十分关注,如何将人工智能技术和文本大数据的分析结合在一起,将是智慧星光后续要探索的方向。”李青龙说道。
为此,智慧星光专门聘请海外归来不久的黄铃博士为首席科学家,“黄铃博士在大数据、人工智能、机器学习等领域有着深厚造诣,智慧星光希望与黄铃博士一起在非结构化数据(文本/音视频)的人工智能开发方面有所突破。”李青龙坚定地说道。
访谈实录
Q:中国大数据产业生态联盟、《软件和集成电路》杂志社
A:北京智慧星光信息技术有限公司董事长李青龙
Q:智慧星光的定位是什么?
A:我们的主要服务内容有两个:
一是实现信息对称,这也是我创立智慧星光时的愿望。而要实现信息对称,首先要在第一时间获取数据,并且是全量的数据,才是数据挖掘的根本。再把文本等非结构化数据,通过数据化处理转为结构化数据,只有成为可统计、可计算、可分析的数据,才能实现信息对称。endprint
二是挖掘文本数据的价值。要做到这一点,就需要在技术上不断创新,同时要对用户的业务需求有深入的理解,在此基础上,才能够将海量的文本数据整合为有价值的分析结果。
Q:大数据技术的发展需要不断的创新,智慧星光是如何进行创新的?
A:智慧星光一直十分重视技术的创新。比如,我们独创的反向分词词库。随着文本数据的量越来越大,给计算机的处理能力带来了巨大的挑战。这让我们意识到,需要对文本处理的整个过程和逻辑进行全面创新。
大家知道,分词是文本大数据处理中十分重要的一个环节,而传统的分词方法在效率方面,已经无法满足行业发展的需求。因此,我们建立了一个以“效率优先,精准优化”为原则的反向分词词库。
与传统的分词方法相比,反向分词词库的效率提升超过1000倍,这样的效率意味着我们能够实现零延时,这也就解决了系统越大越慢的问题。
Q:您怎么看待国内大数据产业从2013年到现在的发展?
A:可以将大数据产业的发展分为三个阶段:市场培育期、快速发展期、成熟期。
我认为,目前国内大数据产业的发展仍处于市场培育期。不过,已经进入市场培育期的晚期,即将进入快速发展期。之所以做出这样的判断,是因为市场的需求。任何一个产业的发展,都离不开市场需求的推动。几年之前,谈到大数据,很多人还不了解。但如今,对于大数据的作用和价值,基本已经形成共识。
但为什么说还是处于市场培育期呢?
主要是行业的发展仍然存在一些问题。比如,用户对于如何应用大数据,大数据究竟能够给他们带来什么价值,还不是十分清楚。而如智慧星光这样的企业,就是来帮助客户研究、分析,在他的业务领域里,大数据到底应该怎么用?怎样做才能够给他的业务带来实际的价值。实際上大数据是给业务赋能的,并不是一个孤立的技术,是给各种商业模式、业务做赋能的。
再比如,数据的割裂和孤岛现象,原来谈数据孤岛,更多的是大家都不知道自己有什么数据,就相当于是未开发、未被人发现的海上荒岛。现在的孤岛则和之前不同了,现在有一个非常严重的问题:大家都认识到数据的价值,都觉得自己所拥有的数据太值钱了,都不愿意贡献出来,即使贡献出来了也都是天价,不可能应用。所以,现在面临的问题是,只要发现有价值的数据,就赶紧据为己有,这就是新的数据孤岛。而要解决这一问题,需要一个长期合作应用的过程。
Q:对于文本大数据未来的发展您怎么看?
A:文本大数据实际上是社会公众对自己想法的表达,以文本为代表的,可能还有语音、图像。社会公众通过信息会把他的意见、建议、情绪、思想公开出去,其实这也是舆情的概念。在表达之后,我们现在更关注的是国家现代化治理、社会治理。
说到舆情分析,可能很多人关注的是负面消息,但事实上,文本数据更多的应用点应该是各行各业,各个职能部门都需要,而不仅仅是公关宣传需要。职能部门通过这些数据,能够更好地进行社会的精细化定义,社会治理的精细化分析,最后使政策的制定、治理的手段方式更科学、合理、精确,这也是社会精细化治理当中必不可少的数据环节。
Q:您怎么看待机器学习技术在非结构化数据领域的应用?
A:机器学习对于非结构化数据意义非凡,大量的文字、图片、声音因为数量巨大不可能通过人工的方式进行整理和分析,而机器又看不懂,如何利用这些占总数据量80%的非架构化数据呢?
我们举个简单的例子,银行客服文本,其中蕴含着服务质量、流程合理性、客户关注点等很多重要信息,但是几百万条的文本数据不能人工处理,这些信息一直不为人所用,如今有了机器学习,机器通过一定的学习过程可以具备阅读、分析这些文本的能力,速度是人类的几千倍,从大量的客服文本中轻松获得有价值信息,帮助提高服务质量,优化流程,辅助决策。所以说机器学习、人工智能是非架构化大数据实现应用规模化的关键技术。
Q:您怎么看大数据给用户带来的价值?下一步的发展方向如何?
A:目前来看,大数据给用户带来的价值主要体现在两个方面,一是效率的提升,二是效果可查。而在未来的大数据分析技术中,非结构化数据分析将逐渐取代传统的结构化分析技术,通过海量的数据分析来为企业应对更为复杂的商业模型,从而替企业提高市场洞察力并创造价值。endprint