大数据视角下的产业安全监管

2014-12-13 09:38:30刘永平
中国国情国力 2014年4期
关键词:数据中心

◎ 文/刘永平

大数据视角下的产业安全监管

◎ 文/刘永平

全球化背景下,竞争泛化遍及全球经济,时有竞争不可避免地演化为对抗,形成毒害世界经济的贸易摩擦现象。同时,产业的国际依存度日益提高,特别是金融危机尚未消散,全球同舟共济成为共识。如此,“竞合”成为全球化背景下产业竞争的总体走向。由于合作诉求的存在,抑制了竞争中的对抗,因而产业安全的基本特征就表现为低烈度对抗。对抗的早期发现,及时救助调整,快速达成新的平衡,甚至将对抗消弭于萌芽时期,使竞争各方获得最大公约数,减少对经济的冲击,被视为产业安全监管的最高境界。对抗的早期发现和控制属于政府产业安全的监管范畴。政府监管的效率则取决于监管系统的数据化水平,在数据爆炸的时代,则取决于对大数据的处理能力。

监管系统数据化现状

产业安全监管达到数据化水平的重要特征就是系统运行的自动化与即时响应。数据化的系统具有自动聚集信息、自动响应、自动反馈、自动解析问题、自主启动救助程序的能力。但目前我国的产业安全政府监管系统中实实在在存在着影响监管系统数据化的缺陷。

1.数据孤岛现象

个人、企业、政府部门在自我保护的目的下,或在技术约束下(结构和非结构),形成了一个个数据孤岛,孤立的数据自然减少了组合的总量,人们对数据间的关系没有了“联想”,数据价值就失去了升值的潜力。

我国与产业安全相关的数据类型多样、分布很广。笔者仅从其获取方式上,将其分为两大类,传统专业化统计类数据和公众活动聚集类数据。

(1)传统专业化统计类数据,由两大部分构成。其一是以政府部门为主建立的数据库,以政府部门主管的商会、协会、学会建立的信息数据库以及由政府主导的各产业自发建立的分布极广的大量数据库。其共同特征是政府背景,采用一致的统计制度,共享程度较高;其二是以企业为主建立的数据库,包括了企业内部统计数据和社会专业盈利机构收集加工的数据。其特征是信息庞杂,统计口径多样,受利益约束而共享化程度较低。

(2)公众活动聚集类数据,也由两大部分构成。其一是会议类数据,提供的是信息加工机构的解析信息。此类数据库常见于政府、学术机构、大专院校、公办研究机构举办的年度论坛和研讨会。其特征是方向上有连续性,内容上差异极大;其二是基于互联网的公众活动统计数据。其特征是数量巨大、结构多样,垄断性高。

无论传统和新型数据,在利益和管理惯性的作用下,都被分割成一个个数据孤岛。

2.数据单向输出

无论传统和新型数据,都是单向交换,为传统销售型交换模式,极大地影响了数据公益性的发挥。问题产生的根本原因就是利益,数据统计单位为了保障利益,只能选择一次性完成交易,这就形成一种守“数”待购的局面,影响了数据传播的速度与广度,数据的社会效益极低。问题产生的另一个原因就是安全,在安全的旗帜下,公益数据被利益化到局部。甚至在保密的要求下,需要用户到现场拷贝。

在数据单向输出的突破上,互联网的公众活动统计模式是个进步,能够从公众反馈中获益。如从点击率中发现客户的倾向性、潜在需求,但不是统计的彻底进步。数据交互式输出才是理念上的彻底突破,互联网的魅力就是多对多,通过交互挖掘,活跃创新。

3.计算低效运行

数据孤岛和单向输出形成的数据格局,从根本上造成了数据中心林立的后果。独立的中心,甚至只是一台个人计算机的运转,必然是效率低、效能低、投入高。

当今是数据大爆炸时代,大到现有存取、运算、传输设备以及数理模型不能处理的程度。大数据理论的诞生,为的是从结构和非结构化数据、逻辑和非表面逻辑的数据中发现规律、预测未来。产业安全监管数据依据的是大量经贸数据。大而言之,人类的所有活动几乎都商品化了,衣食住行、教育娱乐;小而言之,所有法人的经贸生产活动产生的数据,也都达到了大数据的量级,都是产业安全政府监管的题中之义。寻求低成本、高速度、绿色的计算手段,是大数据时代实现产业安全监管数据化的必然选择。

客观具备数据化条件

1.多快好省的云计算

云计算是基于互联网的超级计算模式,在远程的数据计算中心,散布在互联网上的成千上万台电脑和服务器连接成一片电脑云,实现了大规模资源整合。云计算具有计算速度快、专业水平高、一直在线、环保节能的优势。这些特征非常符合产业安全实时监控的技术要求。

我国的云计算已进入实质发展阶段,除北京、上海、杭州、无锡、深圳五个试点城市外,各地云计算建设风起云涌,云计算理念深入人心,推动云计算的有形建设已没有障碍。

云计算大开大合的数据处理特征,对中央政府在应用、示范引导方面十分依赖。企业的逐利本性和生存压力,决定了其无法完全开放自有数据;区域、部门的行政机构局限性大,一般收集不到海量数据来满足云计算的经济规模,即使数据规模够大,也无法构成的大数据,其权威性、安全性离不开中央政府的授权和监管。而产业安全政府监管的广泛性和安全性的高端特征,正好能满足云计算的需要。

2.已具规模的大数据

经过多年发展,我国建立了大量的数据中心。数据中心可分为部门级数据中心、企业级数据中心、互联网数据中心以及主机托管数据中心等。部门级数据中心以国家作后盾,实力最强。在中办发布的《2006-2020年国家信息化发展战略》中,专门强调重视数据中心灾难备份建设,增强信息基础设施和重要信息系统的抗毁能力和灾难恢复能力。电力行业、交通行业、保险行业、银行业等的信息化“十二五”规划当中,专门强调了要强化数据中心的基础设施。在这些数据中心沉淀了大量数据,特别是政府统计的数据含金量虽然较高,但开发不足。同时,公众活动聚集类数据不断生成,中国互联网2011年年底持有的数据量1.9EB(1EB约等于4462个美国国会图书馆的数据存储量),新浪微博每天上传量超过1亿条。另一个数据表明,截至2013年底,我国拥有6.18亿互联网用户,手机用户突破12亿,互联网和手机产生的数据正潮涌而来。随着国人数据收集意识的增强,数据量会日益庞大。我国大数据所具备的量级规模,为将大数据管理引入产业安全监管创造了条件。

3.成熟的数据挖掘术

大数据理论既是海量数据孕育的产物,又是海量数据的解决者。大数据挖掘术在提高计算速度、促进创新、提高预测水平方面,展现了无限的可能性。

常见的数据挖掘技术大致可归结为关联规则分析、分类和预测、聚类分析、推荐技术、链接分析、孤立点分析、数据演变分析等,这其中很多方法在大数据概念产生前使用已久,不仅在实践中得到广泛应用,也给应用方带来了收益。

数据化的实施路线

要想让海量数据对产业安全监管产生价值,先要把数据如水般蒸发到“云”上,“云”把数据带到需要的地方,再把数据在“云”里加工成需要的“雨”。实施起来大致要分成三个方面:上“云”要进行技术规范、下什么“雨”要明确监测对象,云来雨去要不受阻碍。

1.技术规范

要想大数据上“云”,统一技术标准是个基础。否则,分散的数据无法凝聚成“云”,也就更不能成“雨”。

(1)制定标准,由政府来规定,数据持有者来完成。建立标准这是必须首先完成的,以往的信息是多介质的信息,必须进行电子化,对入库数据必须标准化、制式化才能进行加工比较。标准化的数据上传,要由政府平台归集、调配资源。

(2)专业分类,由政府来规定,政府根据产业安全需要对数据进行理解。由数据中心进行归类,完成对数据的粗淘,保证后续精加工数据具有实用性。

(3)建立模型,用于精炼数据。政府建立基准模型,处理商业价值极高的机密数据;同时,政府免费提供工具或推荐模型引导社会从更广的视野挖掘数据,也接纳社会创新模型。

(4)扩散成果,对大数据挖掘成果实施知识产权保护。政府主要将上传成果用于公益事业,但无权对外发布;如果社会对成果有商业需求,需与成果产出者协议购买。

2.监测对象

监测对象是某一时期,政府在浩瀚的大数据里重点关注的目标。因为社会化的监测,热点可能十分散乱,政府必须划出一条主线,既是施政的目标,也是对社会挖掘数据的方向性指引。

当前产业安全监测的对象主要包括:

(1)幼稚产业,是经济增长的新动力,是后发国家追赶世界先进水平的加速器,重点要关注其价格、技术、专利方面的数据。

(2)战略产业,是经济实力的支柱,是稳定、支持其他产业发展的基础,重点要关注其规模、增速、竞争方面的数据。

(3)规模产业,是经济稳定器,重点要关注其就业、税收利润情况,特别监视该产业利润率与社会平均利润率的相对变化。

(4)跨国产业,是产业安全的敏感地带,需要全面关注技术、经济指标数据的变化,密切注意价格波动超过2%、数量波动超过3%时的情势演变。

3.开放数据

大数据只有“全”才能言其大。数据规模达到一定程度,似乎都可以称为大,事实则不然。大不一定容纳事物的全部关系,但是“全”必然包含全部关系,才最有可能在千丝万缕中揭示出事物的规律或作出预见性判断。要做到“全”,必须开放,充分的开放数据是激发社会强大创新潜力的前提。

虽然,数据安全让数据持有者很紧张,但大数据要做的是预测而不是保护本身。事实上,只要数据用于商业销售,其安全性就是个伪命题。与其积“数”不化,何如与人共享,广泛的参与度能够孕育无尽的组合潜力,产生比“数”更有价值的预测结果。

从系统论、控制论角度观察开放的另一层意义,由于公众参与,使单向信息扩散有了良好的反馈机制,形成信息交互往来、往复修正的机理,彻底改变了数据单向输出的低效率和被动性。2009年,门户网站Data.gov上线,旨在全面开放美国联邦政府拥有的数据。截至2011年12月,在这个政府主导的数据开放网站上,汇集了1140个应用程序和软件工具、85个手机插件。其中有近300个应用程序由民间的程序员、公益组织自发开发。截至2012年11月,Data.gov统计的访问客户来源国家中,来自中国最多。一方面反映出我国公众对大数据表现出的积极性,同时也说明我国对数据的开放程度还很不够。

开放数据必须进行资源整合。由国家安全委员会牵头,整合各部门资源,选择云计算服务商,将数据放置云端。

开放数据应是双向开放终端。大数据是终端取胜的机制,终端数据上传,会增加数据活性、及时性,通过建立企业报、行业审、国家规制的审查机制,入库高品质数据。云端数据下载,放手公众参与,能够最大限度获取多重组合的观察结果,将产业安全尚处萌芽中的隐患消弭于无形。

新技术革命的浪潮是实现信息化。只有对产业体系进行数据化,才能实现信息化。大数据、云计算、互联网为信息化时代提供了技术基础,产业安全监管的数据化居于社会信息化管理的塔尖,是信息化时代的缩影。推进产业安全监管的数据化,是全球化、精细化管理产业的要求,也是对国际竞争低烈度对抗的现实回应。

(作者单位:北京交通大学)

编辑:张涵

猜你喜欢
数据中心
酒泉云计算大数据中心
陇东能源大数据中心
数据中心ECC设计方案研究
关于建立“格萨尔文献数据中心”的初步构想
数据中心制冷节能技术及应用
电子测试(2018年11期)2018-06-26 05:56:38
民航绿色云数据中心PUE控制
电子测试(2018年11期)2018-06-26 05:56:24
大唐电信数据中心产品解决方案
现代传输(2016年5期)2016-12-19 08:58:40
10kV油机在大型数据中心的并机控制与切换方案探讨
浅谈云计算数据中心在沪宁高速公路中的应用
基于云计算的交通运输数据中心实现与应用