块数据的理论创新与实践探索

2015-01-29 01:59陈刚
中国科技论坛 2015年4期
关键词:理论与实践创新应用

块数据的理论创新与实践探索

陈刚

(中共贵阳市委,贵州贵阳550081)

摘要:本文从理论层面阐述了块数据产生的历史背景,创造性地提出了块数据的基本定义,重点剖析块数据区别于条数据所具有的高度关联性、立体性、强活性、主体性、开放性等特征,并分析了块数据在顶层设计、数据标准化、数据安全等方面所面临的挑战。从实践层面归纳了块数据在贵阳市的探索,对块数据引发的创新创业热潮、民生服务升级、政府自我变革等进行了初步展望。

关键词:块数据;理论与实践;互联共享;价值与挑战;创新应用

作者简介:陈刚(1965-),男,江苏高邮人,中共贵州省委常委、贵阳市委书记;研究方向:公共管理与服务创新模式。

中图分类号:G301

Theoretical Innovation and Practical Exploration of Block Data

Chen Gang

(The Municipal Party Committee of Guiyang,Guizhou 550081,China)

Abstract:This article expounds the historical background of block data from the theory perspective,and creatively proposes the basic definition of block data.It focuses on the analysis of different high connectivity,three dimension attribute,strong activity,entity features and openness compared with strip data,and it also analyzes challenges confronted with block data in top-down design,data standardization,and data security aspects.At last,it summarizes the exploration of block data in Guiyang city on the practice level,and preliminarily envisions innovation and entrepreneurship tide,upgrading of livelihood services,and government self-reform triggered by block data.

Key words:Block data;Theory and practice;Interconnection and sharing;Value and challenge;Innovation and application

1块数据的定义及特征

所谓块数据,就是一个物理空间或者行政区域内形成的涉及人、事、物的各类数据的总和。具体来讲,可以从三个层次理解:在前端,围绕人、事、物的各类活动产生数据;在中端,通过数据的开放和共享,聚集数据;在末端,以解构、交叉、融合等多种方式,依靠数据抓取、比对、封装等多种技术手段分析数据,寻找更高更多的实践价值。

一般来讲,块数据比条数据的4V即 Volume(大量)、Variety(多样)、Value(价值)、Velocity(高速)的特征更为明显[1]。它如同一个计算机的主板,建立起了一个开放、共享、连接的数据基地;各个行业和部门的条数据就如同一个个可插拔的板卡,它们只有融合并集成到主板上,才能发挥数据资产真正的功效。而在这种融合与集成的过程中,块数据表现出与条数据不同的特征和优势。

1.1高度关联性——彼此连接、相互交错,形成网络状数据连接格局

目前世界上大部分大互联网公司都是以各自企业能够掌控的条数据为主,更多的是局限在某一小圈子里,对事物预测、对规律的把握准确性还有进一步提高的空间。相比之下,块数据来源可能是一条街道、一片社区甚至是一座城市,人口的关联关系相对清晰,区域的资源整合相对独立,相互之间的关联性更高。特别是在此区域内,人、组织、物、空间等彼此关联,他们既是数据产生的源头,又是数据汇聚的平台,当这些平台汇集的块数据实现二次融合之后,将形成更加复杂、庞大的块数据。通过对块数据整合分析、交叉比对,就能够发现原来因为基础数据的局限而未能发现的规律和算法,进而对事物发展做出更加精准的研判。

1.2立体性——呈现多维度结构特征

从物理上看,由“条”到“块”本身就是一个维度增加的过程,这实际上就意味着数据结构的变化。主要体现在:①数据来源广泛。块数据不仅来源于传统的政府部门、商贸物流、工业企业,也来源于社交网络、设备传感器;既有对一般文本信息的记录,也有对时间和位置信息的记录。②数据模式跨界。既包括传统的二维数据表、文字文档格式的数据,也含有音频、视频等其他格式的非结构数据,要实现比对分析,就需要通过技术手段实现格式转化。③数据主体多元。由于块数据是基于一定区域内所有数据的累积,其数据内容非常丰富,既包括该区域内企业、人口、车辆等相对静态数据,又包括人员活动路线、消费记录、企业日常经营情况等动态数据,形成了一个立体化实时更新的数据网络。对数据来讲,每增加一个数据维度,就会影响所有原数据的分析和判断,甚至可能会带来颠覆性的结论。

1.3强活性——随时随地都在更新

数据的活性是衡量数据价值尺度的重要指标,这里的活性就是数据的更新率和鲜活度。与条数据更新更多发生在增量上有所不同,块数据的更新既发生在增量上,也发生在存量上。发生在增量上体现在不断产生新的大量数据,更新频率快、鲜活程度高,能够源源不断地形成新的应用价值。比如,在购物场景里,热门商品价格和库存变化之后,用户可能几分钟之内就下单,需要了解当前最准确的价格和库存信息,这就需要对数据进行实时更新。发生在存量上体现在通过对包括企业、个人的住址、收入、喜好等基本信息数据的变更,来确保数据的颗粒度。

1.4主体性——以人或物的活动为起源

条数据的产生是源自企业的“产品”,即关注某个点,并将所有点尽可能地集中起来,如关注消费者购物场景,将所有购买某一商品的行为集中起来,然后通过分析寻找价值。块数据关注的则是围绕“人或物”发生的各类事件的数据总和,强调的是对点、线、面数据的全面集成。比如,依托包括手机在内的智能终端设备,实现了对人基本活动数据的全记录,并在此基础上进行分析,对人形成全面、准确、精细化的勾勒,从而提供更加符合个人喜好和需求的各类商品。比如,依托物联网,将汽车、建筑、道路等物体上的传感器记录下来的数据汇聚起来,分析一个区域内的交通、能源使用等各种情况,进而寻找提升公共资源承载能力和运行效率的算法。

1.5开放性——打破目前以垄断为主的经营模式

在条数据时代,数据本身构成了互联网企业的核心竞争力,所以大家都在不断地获取数据、争抢数据、垄断数据。但是在块数据时代,更重要的能力在于对海量数据的聚合分析。通过在不同企业、部门、个人之间建立起数据交换与共享的桥梁和机制,特别是通过重点推动以政府为主体的数据开放和利用,让企业、组织、个人均能够以常态化、免费且便利的方式接近、读取并利用数据,数据的生命力将最大限度地发挥出来。

2块数据的价值

块数据本身在地域、行业、人员上的集中带来了更大的规模、更丰富的内容和寻找更多关联性的机会,让块数据成为大数据时代的“富集金矿”。

2.1商业模式发掘潜力巨大

人是市场的主体和所有商业活动关注的核心,而块数据一个重要方面就是对人活动的详尽记录,以人为主线,将以往那些分散化、碎片化的行业数据、领域数据等“数据孤岛”串联起来,连成一片,综合分析出个人的消费喜好、生活需求、收入水平等商业要素,特别是找准那些高度个性化、长尾化的市场需求,通过对这些需求的集成和满足,产生全新的商业模式。比如,围绕数据分析、数据买卖以及借助数据改造传统行业等都会产生大量新的商业机会。

2.2社会领域应用前景广阔

块数据基于对人口管理和服务数据,社会治安、城市管理等相关数据的集成,将带来全新的体验和变革,其应用价值与经济领域的应用价值同样巨大。例如,有城市将平台和智能手机连接起来,构建起了一个以地图为基础的可视化平台,实时反馈城市生活中的垃圾、治安、市政、交通等各类问题,并督促相关单位处理这些问题,使城市生活的安全性、便捷性、舒适度提高到一个新的维度[2]。又如,在舆情监控方面,通过网络关键词搜索及语义智能分析,能提高舆情分析的及时性、全面性,有效应对网络突发公共事件,打击违法犯罪。

2.3政府治理模式转型升级

政府作为重要的数据拥有者、规则制定者和大数据时代推动者,将扮演新时代的新角色。推动思维升级,即用互联网思维引领工作模式转型升级,加快数据交易、流通平台建设,建立规则、强化监管、科学引导,促进产业良性发展。推动服务升级,在确保数据安全的前提下,建设共享数据平台,为大数据产业发展提供资源、夯实基础。推进管理升级,通过建设成龙配套的法律法规体系确保数据安全、防止数据垄断、实现“O2O”即线上线下法规的有机衔接。

2.4社会公共文化增添新元素

块数据对社会成员活动轨迹的全天候、全方位记录和分析,将影响社会文化走向和社会公共价值形成,弘扬社会正能量。例如将形成诚信文化,数据的极大丰富使得以往不容易被发现的一些不讲诚信、不讲道德行为被记录、被发现的成本大为降低、可能性大为提高,诚信成为优质生活的必然选择。又如将形成共享文化,块数据将打破掌握不同条数据的企业、个人既有的数据垄断,通过共享来实现数据价值提升和市场潜力挖掘,共享成为全新的价值导向。再如将形成开放文化,以微博、微信等为主体的各大社交网络媒体为平台,公众对各类社会公共议题的参与程度、信息扩散的速度空前扩大。

3块数据的挑战

与所有新生事物相同,块数据在建设与发展的初始期面临诸多困难和挑战。

3.1顶层机制设计亟待破局

块数据的生命力在于整合,只有通过不断整合才能发挥其应有价值,可以说,整合领域的广泛程度与其价值实现大小成正比。然而,目前块数据缺失从安全监管、标准确立、技术支撑、开放体系构建等各个方面建立起的一套规则体系,使得数据整合中还存在通道、清洗、共享、利益分成、隐私保护等方面的问题,块数据发展缺少一个安全稳定的大环境。

3.2数据标准化任重道远

在块数据的应用中,实现数据标准化是一大难题。由于收集上来的数据来源是政府、单位、企业甚至是个人,数据格式呈现为音频、视频、文档等,这些不同格式、不同标准的数据挖掘分析的难度很大。目前,还缺少标准制定或数据接口标准转换等,且缺少以数据“录入、处理、结构化、清洗、组配”为重心的各类数据代工企业。数据的标准化、结构化还没有成为社会普遍追寻的目标。

3.3数据安全问题日益凸显

与条数据相比,块数据安全管控难度更大。块数据带来的可能是对整个地区、各个领域、全部行业、所有自然和人文现象的记录、分析、挖掘。这就意味着一旦发生数据泄露,对社会造成的危害会更大,将是对某些人、企业、单位乃至政府信息的全面泄露,对个人隐私、企业机密可能会造成重大伤害[3]。而目前,我们还缺少法律约束、道德自律、技术手段等方面的数据安全保护支撑。

3.4金融市场不稳定性将常态化

块数据是一种产生于互联网时代的特殊商品,其交易将更多地通过网络平台进行,数据确权、数据定价、数据保险、数据货币,以及数据的登记、交割等一系列新的金融业态将会产生[4]。由于数据价值的挖掘,面临着人类建立各类金融、证券交易市场以来最大的不确定性,失控和不均衡正在成为常态[5]。也就是说,数据货币可能取代实体货币,数据价值可能会成为衡量有价物的一般尺度。甚至在未来,不仅仅是货币,包括证券、期货在内的大量金融工具都将数据化,这使得主权国家央行系统发行货币的模式将受到挑战。

4块数据的贵阳实践

当前,为推动块数据的发展,贵州省贵阳市正在全力推动无线全覆盖城市项目,即全域公共免费WiFi城市与贵阳城市云计算中心和大数据总线项目,建立一张统一完整的城市全域互联网络。在此基础上,形成城市的互联网主入口,聚集访客量和浏览量,不断拓展规模,推动“块上”数据的快速积累,再通过政府数据开放和企业数据有偿共享,收集形成贵阳的大数据汇聚平台,通过分析用户行为和数据,挖掘提炼数据价值,最终形成可用于交易的大数据产品。

未来,块数据在贵阳将至少在三大领域进行大规模实践。

4.1创新创业

块数据将对贵阳市一、二、三产业产生变革性的影响。农业方面,通过地理信息数据、土壤培育数据、市场信息数据等的高度整合,精准农业将会得到大力发展,农业的产、供、销体系将实现一体化;工业方面,强化工业物联网建设、3D打印技术运用等渠道,使工业生产走向智能化和定制化;服务业方面,中介机构日趋消弭,“互联网+”的模式正在将传统的商贸、金融、娱乐等行业解构重整,经济活动的网络化、精细化、可预测性特征将更加明显[6]。

以贵州翰凯斯智能技术有限公司为例,该公司位于贵阳市国家高新技术产业开发区,整个团队只有十余人,但是他们却开发了世界上第一款3D打印的多旋翼飞行器。这家公司在借助3D技术实现生产自动化的基础上,创造了新的管理思路和生产方式:采用分布式制造的方法,在用户聚集的地方设立生产点,储备原料,启动制造,极大节约了运输等在途成本和时间;建立了用户社区,用户可以在社区分享自己的设计或者3D打印产品,和企业一起共享新思想,实现企业与用户的协同创新,从而将用户的参与感、产品的契合度和更新频率、产品的个性化都提高到了新的程度。

4.2民生服务优化升级

通过将城市地图数据、智能手机上传数据以及政府自身掌握的交通、医疗、教育、基建、商业等各类数据整合,贵阳市民生服务将至少在三个维度上实现突破。首先是问题发现的精细化。以往对民生问题的分析更多是基于调研基础上的某种估计,而块数据将有助于深入每一个社区、每一栋楼层甚至每一户家庭,精准地了解民生需求。其次是问题解决的人性化。通过将小至每一个人、每一家企业的数据,大到每一个社区、城市的各类数据整合共享,块数据将对贵阳就业、教育、医疗等重大问题提供个性化、在线化、定制化、综合化解决方案[7],让老百姓实现“花更少的钱,办更多更好的事”。最后是预判模式的普及化。基于对城市规划、交通、环境、气象等方面大量数据的分析,民生服务将进入可视化和智能化阶段,如对旅游、交通、消费等行为做出预判,大大提高市民的出行、旅游等活动效率。

以贵阳医学院附属医院(简称“贵医附院”)智能化门诊管理系统建设为例,贵医附院引入了智能化门诊管理系统,对门诊挂号、门诊诊疗、门诊缴费及医嘱服药等过程进行设计,实现了从挂号到服药的联网管理,减少中间环节人为纠纷,更大程度地为患者提供服务。当前,贵阳市正在尝试引入大型医疗服务供应商搭建综合医疗卫生平台,逐步实现医疗卫生数据的互联互通,并通过信息互惠、PPP等合作模式,将医疗健康大数据应用到医疗管理、疾病诊疗、健康教育、慢病养老等各领域,解决“看病难”问题。

4.3政府自我变革

块数据的发展将促使政府治理体系和治理能力发生重大变化。例如,在块数据要求下,贵阳市政府将自身掌握的重大政策出台的决策信息、交通医疗教育等民生信息、卫生安全监管及环境治理等执法信息全面公开,将自己真正置于全社会的舆论和监督之下,使相关部门顺势变革规章制度、改进工作方式、化解社会矛盾、解决实际问题[8]。再如,借助数据多维结构分析推动廉洁政府建设,无论是工程招投标与项目审批,还是专项资金使用与人员评价,都将被一整套完善的数据收集、公开、分析流程所取代,不仅其科学性、效益大为增强,而且任何不作为、乱作为及腐败行为的发现概率也将极大提升[9]。此外,社会舆论模式转变,网络社区、网上论坛、社交网站、微信朋友圈等新的平台将成为汇集舆论、传播声音的主渠道。在此背景下,政府将转变传统舆论应对模式,更多地通过块数据的分析和模拟,实现对网上舆情热点及老百姓期盼的全面透彻分析,来制定政府工作重点和改革方向。

以数据铁笼计划为例,2015年初,作为贵阳市首批试点单位,贵阳市住建局、交管局正式启动规范制约权力实施的数据铁笼行动计划,主要是以全行业业务办理过程管控、云计算的大数据应用、构建诚信体系三条主线,搭建大数据(共享交换)和业务信息平台,依托大数据产业优势,加快网上政务建设,通过大数据运用,实现网络办公、审批、执法,确保权力运行全程电子化、处处留“痕迹”,让权力在“阳光”下运行,接受社会公众的监督,更好地方便群众、服务群众。

总之,块数据的产生,打破了传统的信息不对称和物理区域、行业领域对信息流动的限制,通过对不同类型、来源信息的集成、挖掘、清洗,极大地改变了信息的生产、传播、加工和组织方式,进而给各个行业的创新发展带来新的驱动力,推动各类产业彻底变革和再造。人类将以块数据为标志,真正步入大数据时代。

参考文献:

[1]佚名.百度百科,大数据.2014-12-16.http://baike.baidu.com/link?url=PcRyEibbYPzOQh_Zzvxy-ZwL3wvIiYScGvDY1-gsEtmvSllJgm1CF6GTT04FfLeuxaQIeFuve1FZmaHlyIRuBM3cMucnusVLRnYkr2fahEq.

[2]涂子沛.数据之巅——大数据革命,历史、现实与未来[M].北京:中信出版社,2014:315-324.

[3][英]Viktoro Mayer-Schnberger.大数据时代[M].杭州:浙江人民出版社,2012:193-196.

[4]马梅,朱晓明,周金黄,季家友,陈宇.支付革命——互联网时代的第三方支付[M].北京:中信出版社,2013:270-279.

[5][美]Kevin· Kelly.失控——全人类的最终命运和结局[M].北京:新星出版社,2010:482-488.

[6]赵国栋,易欢欢,糜万军,鄂维南.大数据时代的历史机遇——产业变革与数据科学[M].北京:清华大学出版社,2013:154-160.

[7][美]Chris· Anderson.长尾理论[M].北京:中信出版社,2006:5-13.

[8]徐继华,冯启娜,陈贞汝.智慧政府:大数据治国时代的来临[M].北京:中信出版社,2014:197-202.

[9][美]Michael· Saylor.移动浪潮:移动智能如何改变世界[M].北京:中信出版社,2014:234-236.

(责任编辑沈蓉)

猜你喜欢
理论与实践创新应用
关于本科生纳米概念教育的探讨
传统编织工艺的时尚创新设计探究
中国现代工业设计中传统文化元素的创新应用
数字媒体艺术在虚拟展示空间中的应用探究
小学数学教育与信息技术的整合问题分析