齐鹏
管理学大师彼得·德鲁克曾经说过,预测未来的最好方式就是去创造它。如今,当人们开始从TB/PB迈入EB/ZB的数据时代时,就需要准备好驾驭数据,创造未来。
近日,希捷科技联合研究机构国际数据公司(IDC)发布了报告《数据新视界:从边缘到云,激活更多业务数据》。该报告预测,到 2025 年,全球数据创建总量将大幅增长至175.8 ZB。分析其背后的原因是,物联网 (IoT)、边缘计算、边缘数据中心、人工智能 (AI) 等新技术的不断普及,消费终端设备数量的不断增长,以及全球人口数量的增长,新冠疫情带来的改变,等等,都带来数据量的激增。报告对全球1500名企业领导进行的调研完成,界定了当今最紧迫的数据管理难题,并找出其解决方案。
数据数量大、种类多、增长快,要想利用这些大数据,它们的存储问题必须先解决。所幸数据存储技术发展的速度相当之快,例如,希捷科技早在2000年就推出了世界最大容量的硬盘——酷鱼180 G硬盘,18TB和20TB的硬盘也即将推出。而当数据的“存储”的问题解决了,接下来就是该去“处理”数据了。
“当数据达到 ZB 规模时,我们需要一种简单、安全、经济有效的方式来管理数据。”孙丹认为,企业越来越意识到数据管理的重要性,并且也在提升数据管理能力,希捷科技将让他们的数据得到更可靠的存储、更合理的处理,最终实现数据价值的最大化。
“因为共同聚焦数据的增长,所以希捷与IDC的联合绝非偶然。2017-2018年,双方就联合发布了《数据时代2025》的报告,报告认为,抓住数据的来源是数据分析及利用极其关键的一步,根据报告,未来数据主要来自于三个方面:首先,企业数据中心或者企业云数据产生的大量核心数据;其次是边缘数据,它是相对于核心数据而言的,是指核心数据以外的企业级计算机或设备,其中包括服务器机房、小型数据中心等;最后是终端数据,指网络边缘的所有设备,包括 PC、手机、摄像机、智能汽车、可穿戴设备。
事实上,企业早期只能通过一些系统了解跟踪商业流程,现在则可以通过大数据分析描绘出用户的行为画像,而未来通过物联网技术还可以看到一些设备的画像,比如通过可穿戴设备了解个人身体信息,描绘出个人生理画像。与此同时,数据驱动工业也已经开始了,包括互联网应用,比如发动机上放一个传感器,不断把数据拿出来做分析,做效果图优化,数据将贯穿整个工业流程的生命周期。
到2018-2019年,希捷与IDC的调研聚焦在企业数据就绪指数,当时共同发布白皮书《数字化世界—从边缘到核心》,报告分析,金融服务、制造、医疗保健以及媒体娱乐等行业正在迎来重新定义数据增长的新纪元。该报告研究评估了几乎占全球企业数据圈一半的四个关键行业(制造业、医疗保健行业、金融服务业与媒体娱乐业)的数据就绪程度。DATCON(数据就绪度)通过多个指标计算得出,包括数据增长、数据重要性、数据安全、对数据的投资、管理、数据技能以及公司高层参与度。
如今,双方共同发布的《数据新视界》聚焦企业的数据管理难题,并提出数据运营的理念。报告对于企业不能完全利用数据而感到担忧。企业之所以难以全部释放数据潜能,主要来自五个方面:将采集的数据变为可用;已采集数据的存储管理;确保需要的数据得到采集;确保采集数据的安全;将采集的数据孤岛变为可用。
针对上述问题,孙丹表示,企业进行有效的数据运营,首先需要对于自己的数据有清晰的认识,包括数据访问权限、数据分类、存储存储位置、分析后数据的走向等等。对于数据治理及流程做出决策后,企业接下来要解决的不仅是技术工具的问题,更是人的问题:建立全局性的标准、架构、数据管理政策,并通过全局性的团队以相同的方式访问相同的分析工具,彻底打破数据孤岛,才能够突破障碍。
“在全球业务环境中,数据运营既是数据管理的缺失一环,也是解决企业主所面临的数据难题的重要解决方案。”孙丹表示,高效的数据运营需要将不同的数据系统引入一个易于理解的实体。企业必须建立全局性的标准、全局性的数据架构和全局性的数据管理,才有可能全面实施数据运营。
本次调研发现,在各个地区和行业中,平均只有 10% 的企业表示全面实施了数据运营。多数企业还存在孤岛式运作。
在孙丹看来,“数据运营的阻力与障碍并非总是技术,还有来自于文化和人员方面的挑战。如果企业以孤岛式运作,不同的部门朝着自己的目标努力。他们希望获得并保持对数据的控制,并且认为,一旦失去了对数据的控制,就会失去权力。因此,数据在不同的孤岛中被存储、管理和分析。”孙丹分析道,即便大多数人认为数据运营非常重要,但是却未能完全实施的原因。
不过,报告同时显示了中国市场的独特性,尤其是中国企业在应对数据管理挑战表现出积极的一面。“中国企业的数据管理能力正在快速提高,这些企业深知数据运营的强大力量。”孙丹认为,其背后原因是中国有几家大型云服務商,因此本地市场已经做好了采用云的准备,另外,大量数据是由物联网设备、传感器和人工智能算法的普及而催生的,而中国地区服务商提供的公有云Iaas资源日渐普及,也推动了数据向云端迁移,最后是中国政府对人工智能、5G、超大规模数据中心以及其他加速数据移动的关键技术的支持。
“中国企业最大的困难在于利用数据。这恰好反映了中国企业的积极进取,他们对于增长的高度重视,以及他们发现自己采用数据运营有困难这一事实。”孙丹客观地分析道,中国企业实现数据运营还有一个重要优势,由于中国 IT 成熟度的原因,中国企业的传统应用较少,不必顾虑更新传统应用的问题,他们的预算可以全部投资于数据移动(向云和边缘迁移), 并通过简化的数据运营来充分利用数据的价值。
在大数据时代,数据的来源越来越多,原始数据量越来越大,数据种类也越来越多,把数据原封不动地从源头运到指定地点再进行挖掘和分析既耗时又费力,边缘的重要性更为凸显。“希捷会根据客户的需求,为他们提供定制化的边缘存储解决方案,解决他们面临的数据管理难题,更快速有效地在边缘端处理关键任务数据。”孙丹表示,希捷一直以来非常关注客户需求,洞悉客户的需求变化,帮助客户搭建边端云解决方案,并且在边端云之间促进数据的有效流动。
比如,在自动驾驶领域,面对自动驾驶车队产生的海量数据,原有的公有云方案在成本和数据处理的效率方面都无法满足业务发展的需求。希捷和用户紧密合作,从用户的真正需求出发,为其规划和搭建私有云数据中心架构。通过搭建覆盖边端云的架构,自动驾驶数据可以在边缘的私有云数据中心进行一系列处理,其中包括数据清洗、数据标注、算法训练及推理,等等。越来越多的关键业务负载在边缘的私有云数据中心进行,原有的公有云仅负责数据的备份。这一优化的方案未来还会被用户在更多区域和场景中被复制。在这个案例中,希捷不仅仅提供了硬件,更多的是架构层面的规划与建议,切实帮助用户去有效应对动态数据的管理,并利用数据驱动业务层面的创新。
事实上,希捷正是数据运营的重要“推手”,希捷帮助企业洞悉数据时代的数据管理挑战,搭建最适合业务发展的架构,充分利用数据价值。“每家企业都是数据企业,如果对数据不加以利用,那么这些企业的数据就无法體现价值。”孙丹表示。
在数据运营方面,希捷自身也起到了示范效应。在希捷自己的制造工厂和运营基地,在覆盖全球的工厂中使用深度学习体系,使用人工智能架构提升制造效率与质量,其智能制造项目(代号:雅典娜项目)就是一个典型代表。该项目中,希捷应用了深度学习系统识别生产过程中的瑕疵,从几百万张照片中去检测磁头的异常,从而提升生产质量和效率。雅典娜项目已经发展为智能制造的一个参考架构,可部署于制造业,也可以应用于智慧城市、自动驾驶、智能制造等更多场景,为智能制造的更大范围的部署提供借鉴。
没有一个时代能像今天这样。这对中国企业来说是一个弯道超车的机会,全面实施数据运营的企业才能抓住机会,打造并重塑自己的竞争力,让数据成为企业下一个10年里前进的动力和赢得客户、占领市场、走向全球的法宝。