杨光
第十一届开源中国开源世界高峰论坛近日在京举办。论坛有力促进开源社区、企业、院校、科研机构、用户之间的相互交流与合作,推动开源软件在中国及全球的发展。联想创投集团大数据业务在此次高峰论坛上展示了联想大数据平台如何协助企业应对全球化挑战和复杂的开源技术,探索出一条制造企业全球大数据方案之路,并运用开源大数据技术助力全球智能制造。联想集团副总裁、首席研究员田日辉受邀参加开源高峰论坛圆桌会议,联想大数据业务高级总监、首席研究员于辰涛在论坛上发表了主题演讲“开源大数据技术助力全球智能制造”。
推动联想的大数据转型
联想在2011年8月启动联想企业级大数据分析平台(Lenovo Enterprise Analytics Platform,简称LEAP)的建设,5年时间内基于开源技术推动联想的大数据转型,持续投入了300多名研发人员,并且在全球范围内部署超大规模集群,经过多年锤炼,现在已完全具备海量数据分析与持续性业务支撑的能力。
5年来联想大数据深度整合联想内部数千个来源和上万个不同类型的数据,包括消费者数据、零售商数据、运营和分销数据。
此外,联想大数据平台致力于推动大数据作为工具,推动联想以用户为中心提升整体业务效率。大数据技术帮助联想集团移动业务在发展中国家实现了快速扩张,仅一年时间从默默无闻进而成长为印度第三大移动设备供应商,而且打入了东南亚,非洲和拉美多个区域市场。
全球化大数据方案部署
联想大数据平台在全球多个国家与城市拥有中心部署,如德国、美国、以及中国的北京和香港等地,拥有12PB的总容量。联想大数据不仅具备支撑全球化业务同步运营的丰富实战经验,而且大数据运营体系完全合规各国数据保护和隐私保护法律。
不仅如此,联想大数据平台积极进行全球深度设备优化,支持全球1.5亿设备,包括产品退化、软件开发、质量保证等方面都得到深度优化,进而提升设备满意度。同时,联想大数据平台改善全球服务效率,并缩减成本,提升服务满意度。包括联想呼叫中心的优化和伪造维修单据识别,譬如可节约单个用户客诉20%的呼叫时间或智能化预测用户投诉问题,分析维修站的备件计划和准确识别伪造维修单据,为联想每年在发展中国家的维修系统节约了数百万至上千万美元,并且提升了客服效率和用户满意度。
基于开源技术的实战
联想大数据平台基于开源技术探索了一条制造企业全球大数据方案之路,大数据技术帮助联想各个业务价值链条带来数千万美金的成本节约,譬如设备分析方面进行了设备激活,用户行为跟踪,系统优化和设备画像;在舆情分析方面利用市场矩阵、渠道优化、公众情绪从各个评论网站获取手机的正面及负面评价;在市场分析方面从手机出货到渠道,渠道到客户,实现客户开机激活的监控;并对用户画像、设备画像、联系分析、用户反馈等方面进行收集。按照用户需求进行产品定制。
对于联想这样的复杂平台,开源技术仅仅是个开始,开源项目直接安装,其普遍性能和稳定性较差。如何优化部署和数据结构,并跟进补丁和引入创新,以及业务整合和数据整合都是开源技术所需解决的问题。
田日辉表示:“联想大数据平台基于开源技术规划出三个步骤,首先理解和吃透开源平台,从第一个开源版本开始,建立完备的性能评估和稳定性评价体系,并跟踪开源补丁,打入评测发现问题对应的开源补丁,开发提升平台稳定性的组件;其次,优化开源平台发挥硬件效能,保证其SQL的兼容性、编译与执行和资源分配的优化;最后,联想大数据积极扩展开源平台实现业务需求,发展一站式的大数据开发环境,建立了新的ETL工具、数据字典、SQL执行器、任务调度、可视化工具以及深度学习模块。”
未来联想大数据愿与中外开源社区和产业界同盟共同助力全球智能制造,深化开源交流,共同探讨全球合作之道,壮大开源平台,共建大数据技术与商业合作的全价值生态圈。