◎记者 郝 昱
2014年7月,巴西世界杯进入白热化阶段,与此前“预测全靠章鱼哥”不同,那年,谷歌通过大数据分析,准确地预测了世界杯16强比赛的胜利者。据了解,谷歌运用了实时体育比赛数据公司Opta Sports的数据,以及由Big Query工程师开发的实力排行榜,再加入观众热情度数据,最终计算出主队优势与战果。谷歌还使用这一系统来预测世界杯8强的比赛,结果也惊人地准确。
事实上,谷歌并不是唯一做出完美预测的公司,百度、微软也依据云计算数据系统的综合分析进行了赛果预测,结果同样精准。这无疑为2014年世界杯增加了不少技术乐趣。
回到今天的中国,从对概念的认识到技术应用,虽然只经历了十几年,但大数据技术的发展如火如荼。时至今日,很多工业企业家手中都不缺少数据,但他们想知道如何让数据“开口说话”。
对此,《网信军民融合》记者采访了航空工业信息技术中心(以下简称金航数码)副总工程师梁建交。在他看来,要让数据开口说话,数据治理是前提,数据安全是保障。然而,缺乏数据管理却是很多工业企业存在的共性问题,成了中国工业企业挖掘大数据宝藏的“门槛”。“信息化几十年,很多企业积累了大量的数据,却不知怎么用,说到底是数据管理体系缺失的问题。”梁建交直言不讳。
国务院2015年印发的《促进大数据发展行动纲要》和工信部今年1月发布的《大数据产业发展规划(2016-2020年)》分别强调,数据是国家战略性资产,是21世纪的“钻石矿”。对中国工业企业而言,大数据时代的到来既是机遇,也是挑战。
“十三五”期间,随着智能制造的加速推进和新一代信息技术的深化应用,工业企业必将迎来数据种类的增加和数据量的急剧增长,企业数据技术体系和数据治理范式也必将发生变化,该如何应对?据梁建交介绍,金航数码早在2009年就开始将EA(复杂组织体架构)和IRP(信息资源规划)相结合,研究企业数据分类与数据规划的方法。近几年,通过研究DAMA(国际数据管理协会)相关框架和DMM(数据管理成熟度)相关模型,在数据管理方面摸索出了一套体系化的构建方法。另一方面,将传统的BI(商务智能)相关技术和大数据技术相结合,提出了一套数据中心和数据资源开发利用的方法。所有这些,目的只有一个——让数据“说话”。
在为企业提供咨询服务的过程中,金航数码的顾问和工程师们发现很多企业在信息化方面投入了大量资金却收效甚微,想了各种办法信息化水平仍止步不前,其根本原因是始终没有迈过数据治理这道“门槛”。例如:国内某飞机制造厂构建了大量的信息系统,却竖起了一个个烟囱,面对此种情况,企业借助统一门户平台开发了异构系统之间的集成接口,建立了信息共享通道,但流程并没有实现贯通。金航数码的顾问们通过调研发现,根本原因是缺乏统一的数据标准,数据质量存在很多问题,也就说,“路”是修好了,“车”却跑不起来。
梁建交认为,要想全面、系统地解决企业数据问题,让数据“说话”,建议实施“三步走”策略。第一阶段,开展总体数据规划,建立或完善数据管理体系。主要工作内容包括对企业的数据资源进行分类、明确各类数据的责任主体、建立数据的标准规范、构建数据管理体系(组织、流程和制度)等。第二阶段,构建数据中心,加强数据管控。这里说的数据中心是逻辑上而不是物理上的数据中心,侧重于数据而不是硬件环境。本阶段主要工作是实现多源数据的集成、建立数据质量管理和数据安全管理机制,构建数据仓库。第三阶段,充分利用大数据与数据分析工具,做好数据资源开发利用。本阶段的重心是分析管理决策的信息需求,建立分析模型,按照不同的分析主题对业务系统数据进行重新组织,利用报表、查询、联机分析处理、数据挖掘等技术和工具,向不同层次的管理决策人员提供手段上的充分支持。
那么,是不是说企业推进数据管理和大数据应用,只有上述按部就班的“三步走”这一条路呢?梁建交表示,考虑企业信息化问题的轻重缓急和资金、时间等成本因素,可以选择不同的切入点。无非是沿着两个方向找切入点,一是自顶向下从总体数据规划入手,先建立完整蓝图,然后再分步实施,各个突破。二是自底而上,立足于解决实际问题,快速见效,如:编码问题、集成问题、数据分析利用等。但需要注意的是,很多问题之间是存在依赖关系的,数据标准问题不解决,集成就无从谈起。跨系统数据不集成,数据分析利用就会受很大限制。有些企业选择从建立数据治理体系入手,先建章立制,落实流程和责任,也不无道理。
在采访过程中,梁建交也提到一些让数据“说话”的例子。如,航空工业西飞的快响中心就是将大数据和数据分析技术应用于民机客户服务领域的很好的例子,“新舟”系列飞机运行数据管理平台通过对飞机设计、制造、销售客服、试飞以及维修等数据的采集和管理,可实现对各类服务请求的分类处理、处理进度的跟踪和监管,应急支援异地服务请求,对飞机的状态和故障进行快速预判和警示,对已经出现的排故请求能迅速通过分析和相关算法进行故障定位,取得解决方案,并推送到移动设备,帮助外场维修人员快速解决。美国派克汉尼汾公司,通过对其积累的100多万套设备的维修记录进行分析,发现某款干燥机产品常坏的贵重零件的寿命都与一种至六种便宜零件的磨损有关,由此对售后服务做出一项决定:提前换“齿轮组”、“轴套”等易损件,达到保护贵重零件的目的。仅在这一种产品上,这种做法每年为企业节省的维修费达上百万美元。
自动驾驶汽车在我们的生活中开始扮演着越来越重要的角色。信息技术研究和分析公司Gartner认为,到2030年无人驾驶汽车将会占据25%的汽车市场份额。电影《速度与激情8》中有这样一段情节:赛弗(Cipher)利用互联网入侵在路上行驶的私家车自动无人驾驶系统,通过控制这些车辆来制造交通事故,以夺取核潜艇启动密码。有人不禁会问:将来在现实中这类事件真的会发生吗?
据了解,自动驾驶是通过在汽车外安装感应器,以自动判断和感应道路状况,将这些感应数据传输到控制中心,通过控制中心对这些数据的计算来实现自动驾驶。会不会真的出现恶意网络攻击,导致数据中心内的自动驾驶的数据被恶意篡改?我们无法预测,但确保驾驶员免受网络威胁已成为汽车安全产业发展的重点和挑战。
同样,目前越来越多的工业企业将利用CPS(赛博物理系统)相关技术实现基于人-机-物互联的智能制造,在提高生产柔性、产品质量和个性化服务品质的同时,必将带来巨大的数据安全隐患。不论是工业大数据还是工业机器人被不法分子所控制,后果都将不堪设想。
全球顶级会计师事务所普华永道发布的《2017全球信息安全状况调查》显示,2016年,中国内地及中国香港企业监测到的信息安全事件平均数量高达2577起,是2015年的2倍多,较2014年上升了969%。除金融机构和互联网企业外,工业企业近年来也成了被攻击的重点对象。有互联网安全专家表示,由于金融、互联网和工业企业一方面服务广大用户,另一方面又和经济运行息息相关,因此,很容易成为不法分子攻击的对象。
梁建交指出,安全保密和业务便利永远是一对矛盾。数据安全涉及数据的保密性、完整性和可用性,大家对数据安全的理解不能局限于传统的保密,泄密对于企业是风险,数据不完整、不可用对于企业同样也是风险。数据的安全防范需要从应用安全、主机安全、网络安全、物理安全等多层次来共同保障,数据处于多层防护圈的中心。在他看来,万物互联势不可挡,企业不可能因噎废食,应积极研究未来新一代信息技术的广泛而深入应用所带来的数据安全新问题,了解相关技术,提前做好预案。互联网安全技术发展迅速,工业企业可研究借鉴,少走弯路。