本刊记者|张鹏
Taste Analytics汪晓宇:中小企业市场才是大数据分析的“蓝海”
本刊记者|张鹏
在广阔的中小企业市场以及众多面向最终消费者的商业领域,大部分企业对于如何引入大数据分析依旧毫无头绪。
将大数据视为下一个市场风口,已经成为整个IT产业的普遍认知。
在美国,谷歌通过最新的大数据应用——谷歌趋势,帮助全美的孩子们如何不会在今年万圣节晚上与别人“撞衫”;在中国,马云旗下的“芝麻信用”依托阿里大数据勾画出了“个人征信”的雏形。与此同时,那些专注于大数据硬件设备的提供商也迎来了“旺季”,据悉在2014年,我国软件和信息技术服务业实现3.7万亿元收入,其中数据处理和存储类业务收入同比增长了22.1%。
不过,看似前景无限的大数据市场其实也有软肋。目前,业界率先试水“大数据”的企业基本分为两类:一是互联网企业(部分IT企业),具备完善IT基础设施和充足的IT人才资源,采用自建方式,最终形成可盈利的商业模式或是实现完整商业闭环的战略布局;二是政府或大型企业,他们手握海量数据且资金雄厚,通过第三方公司提供的完整解决方案,实现对自有数据的挖掘和分析。
然而在更为广阔的中小企业市场以及众多面向最终消费者的商业领域里,大部分企业对于如何引入大数据分析依旧毫无头绪。尽管这些企业对于从消费者数据中找寻商机充满了兴趣,但碍于企业IT程度有限、大数据人才缺失以及对前期大手笔投资硬件的顾虑,企业的管理者和CIO们依然没能将“大数据分析”提上日程。
“目前市场中很多大数据项目都是外包给第三方公司,从项目接手到最终完成往往需要几个月的时间,虽然能够将数据转化为有价值的信息,但却错过了宝贵的市场窗口,甚至在项目结束时市场风向已经发生了转变。”美国数据分析科学家、Taste Analytics创始人及全美“前五”可视化研究中心的Derek Wang(汪晓宇)博士告诉《通信世界》记者。
如何打破大数据在中小企业市场遭遇的僵局?汪晓宇有自己的想法。在他看来,强化大数据分析平台的“普适性”是切入中小企业市场的关键所在,大数据分析需要从初期的“手工定制”快速转换为规模化的“工业时代”,当然,这需要全新的数据分析理念与实践,以及“实时分析”、“数据驱动”和“人机互动”等一系列创新技术作为支撑。汪晓宇博士任职的北卡罗来纳大学(UNC)夏洛特图像可视化中心作为全美“前五大”的图像可视化中心,正是研究这一前沿技术领域的主要阵地。
2013年,汪晓宇与其他数据科学家们携其创新技术成果从学术界走到了工业界,创建了大数据分析服务公司Taste Analytics,并推出了实时动态、图像可视化兼具非结构化数据分析能力的综合智能数据分析平台The Taste Signals Platform,为美国的大数据产业带来了新气象。
汪晓宇告诉记者,尽管中国市场在云计算、大数据领域的起步较晚,但通过近两年的快速发展,中美市场对于大数据的概念认知和趋势判断,事实上并无差异。不同之处在于,美国大数据的技术走向更受市场需求的影响,面对着全球大数据市场普遍存在的几大误区,美国的大数据从业者们正在着力加以解决。
误区一:大数据分析多依赖于现有模型和先前经验。
目前市场中很多大数据应用都是通过套用固化模型和依据先前经验而设定规则,这种做法并不是从数据中挖掘信息,大数据分析应该具备“深度学习”的能力,也就是计算机应该从大量数据中自己寻找“答案”,而不是仅为了验证“过往经验的准确度”。
误区二:将大数据分析完全外包,浪费了企业内部人员智慧。
采用整体外包的方式虽然看起来简单,但却浪费了企业内部人员的价值;况且过度依赖外部的数据分析师,也不会为企业内部的数据人才培养和教育带来任何帮助,将那些真正了解市场、懂得企业运作的管理者和分析师的时间用在数据采集和表格处理等环节,对于企业本身而言就是一种损失。如果能将内部人员的智慧和对数据的理解融入大数据分析的过程中,那么最终结果将会“更快更好”。
误区三:大数据分析并不等于“海量数据”分析。
如何甄别有效数据是大数据分析的第一步,对于企业管理者而言,大数据分析并非意味着真的需要“大量数据”,选取真正有价值的信息源才是成功的开始。比如一家银行开展用户满意度调查,其数据源并不仅限于海量用户的重复交易比例和信息,更重要的是在只有几百兆存储量但却包含成千上万封的客户反馈邮件里得到更深层的原因及结果。
误区四:只抓取结构化数据,对非结构化数据“束手无策”。
非结构化数据恐怕是所有大数据分析工具的难题,但面对着网络信息的日益复杂化,能够反映企业运作情况和消费者意见的数据来源也越发多样化和碎片化,诸如来自社交网站、客服中心以及线上交流软件中的语音、图像、视频以及超媒体等信息,这些都应是大数据分析平台所能涵盖的数据源。
误区五:保证“时效性”,才能让大数据发挥“最大价值”。
大数据分析得到的结果经常用作辅助管理者的企业决策,或者用来指导企业下一步的市场行为,因此大数据分析需要具备时效性,甚至应该做到“动态实时”。尤其对于那些争分夺秒的“电商”而言,同样是消费者需求调查,花费数十个小时与仅需几分钟就能得到的分析结果相比,显然后者对于企业市场行为的参考价值更大。