马文强
(中共云南省委党校 信息技术部,云南 昆明 650111)
大数据是信息化发展的高级阶段,是信息价值的载体,是巨量数据资料的集合。作为现代信息社会最重要的一种战略资源,大数据正在对社会发展进步产生深刻影响,对人类历史进程谱写着新的华丽篇章。科学认知大数据,重视大数据建设,运用好大数据,对我们的社会、工作、生活等各个方面都具有重大而深远的意义。
大数据是一种能保护环境、取之不尽、用之不竭、成本低廉、可实现共享并循环利用的战略资源,须要建立科学、全面、系统、长远、开放、协作、共享的大数据意识,不断地思考、运用、创新、拓展、扩散,这是一个与时俱进的辩证的动态过程,所以,在看待大数据时需要全新的视阈。
1.容量的大。不仅要看到大数据物理量的大,也要看到大数据互连互通、拓展量的大;既要看到互联后物理量大,更应看到技术处理后虚拟增值量的大小。
2.效应的大。不仅仅要看到大数据在物理属性方面的“大”,更要看到大数据在创造社会价值、变革行为方式等方面社会效应的“大”。
3.作用的大。不应只看到大数据在政府社会治理、推进社会进步等社会效果的“大”,更强调政府对社会治理、推进社会进步等方面发挥的重要作用和影响的“大”。
1.技术创新价值。要注重大数据在开发、应用、推广、扩散等技术应用中创造的价值,更应看到技术创新的增量价值。
2.社会效应价值。2015年9月,我国政府公布了《促进大数据发展行动纲要》,标志着我国大数据时代的到来。《纲要》指出大数据在社会治理、经济运行、智惠民生、创新驱动、产业发展等方面具有重要作用和效果,为我国稳增长、促改革、调结构、惠民生及推动政府治理能力现代化提供了新思路、新方向、新动能。在看待大数据开发、应用、推广、扩散等技术价值时,更应注重其社会效应。
3.社会进步价值。大数据成为加速社会进步、促进经济发展、加快创新步伐和提升国家竞争力的新引擎,引起社会结构的重大变革。既要关注其社会扩散效果,又要关注其推进社会进步的价值。
1.独创思维。注重意识、理念、方式的更新,更注重思维模式、内容创新和技术革新,强调前无古人、后无来者的独创思维。
2.广泛思维。大数据鼓励自觉思维、善于思维、勇于思维等多态思维;也鼓励单向思维、平面思维、立体思维、棱形思维等多度思维;更鼓励联想思维、关联思维、想象思维等广泛思维模式。
3.科学思维。大数据主张互联、开放、共享、协作等为核心价值的思维理念,更重视活跃思维、细腻思维、独创思维、缜密思维、多维度思维、事实和证据思维等,没有科学思维,就没有智慧思维。
大数据不仅指数据量大,而且涉及关于数据的技术、方法、相关软件和设备等内容的巨量资料,所以,大数据是一个用常规思维方式根本无法理解的复杂的综合称谓。
1.应用技术。众所周知,1995年前,用DOS操作系统管理和使用计算机,系统所用的符号全是英文、数字和标点符号,难阅读、理解、接受和操作,是非英语民族的共同感受。因为DOS操作系统是以比尔·盖茨为首的美国人开发并推广全球使用的,英语是他们的母语。今天,我们使用的高效、易阅读、易接受、可视化窗口式的操作系统WINDOWS,是我国通过汉化、可视化、去功能化、窗口化等技术处理后才实现的,这样,英文操作系统才实现其为我所用。与此相仿,今天的大数据,要为我国的社会、工作、生活等服务,也离不开强有力技术支撑。
2.创新技术。党的十八大以来,习近平总书记多次强调科技创新的重要性,要掌握核心技术,市场换不来核心技术,有钱也买不来核心技术,必须靠自己研发;核心技术受制于人是最大的隐患。大数据时代,我国的建设和发展,离不开技术创新,特别是核心技术的创新。
3.综合技术。建设大数据,管理大数据,开发大数据,应用大数据,除高效的可视化分析技术外,还应具备数据挖掘算法、预测性分析能力、语义引擎和数据质量管理等技术支撑,实现对海量数据的云查找、计算、处理、挖掘和应用,才能找到并获得高价值数据信息。对具有高价值数据信息的挖掘、获取、分析、管理、应用等过程,就是大数据技术的综合表现。
大数据能力的彰显是通过对数据信息进行深度挖掘,复杂的重组,各种形式反复整合,价值充分利用等来实现的。
1.关联能力。将存储在不同媒体介质上,看似零散而不相关的数据进行各种可能的关系设计、整合、“重组”,寻觅数据间可能存在的某种关联,才能找到其价值所在并得到有效发挥。对数据资源的储备、高效搜索、查询及所进行挖掘、整合、“重组”,是一个复杂而繁琐的具有极大不确定性的关联过程。
2.创新能力。在找寻、整合、“重组”、挖掘数据资源可能存在价值的关联过程中,需要分析数据的作用,挖掘数据的潜在价值,进而才能实现数据价值的创新。这种创新可能对社会进步和人们的工作、生活、娱乐等产生一定的影响:催生新的产业或促进产业转型升级,如互联网安全产业;产生某种新产品或新行业,如机器人和智慧家政;引起部分失业和再就业,如电力公司抄表员消懈;提升人类生活品质,促进社会进步,如5G落地和8G全面体验。
3.创奇迹的能力。大数据为基础,人工智能为平台,云计算为工具,网络为中心,人类以此创造奇迹并不多见。被称为“新世界七大奇迹”之一的港珠澳大桥,[1]采用智慧设计、建造、运营、管理、维护、微控等方式建成,是我国运用大数据创造世界奇迹能力的展现。
1.关联思维。大数据是一种创新思维,是一种多维度思维,是一种对资源整合、重组思维,是一种解放人性、换位思考、放飞理想思维,是一种以“开放、共享、协作”为核心价值观的关联思维。
2.开放思维。大数据思维强调:从信息公开到开放数据,从开放数据到开放数据接口等跨界、跨行、跨区域的大众化、网络化、普遍性的开放思维,互联、互通、共享、协作等理念是对数据信息独占模式的变革。随着数据开放共享程度的提高,社会的开放共享程度也在提高,大数据对人类贡献也会不断提升。
3.创新思维。摄像头用于安保、交通、监管等方面是社会惯例、常规思维,而把摄像头用于管控、人文、定位、施救等跨行业或系统,实现资源共享,是对常规思维模式的变革和创新,表现出大数据创新思维具有的互联性、开放性和价值性。
1.数据性。大数据开启了一个以数据为基本元素、以数据为战略资源、以数据关联万物的时代。大数据时代,数据决策、数据管理、数据创新、数据驱动等作用彰显,颠覆性改变着社会经济形态、国防安全态势、维稳治理和资源配置模式,从这个角度讲,大数据的多寡是一个国家软实力强弱的重要标志,谁掌握了大数据,就意味着拥有了核心竞争力。
2.创新性。数据驱动树立的是基于数据、事实、理想等管理分析的创新管理理念,把数据转为经济增长方式,服务社会、工作、生活,惠及企业决策及国家治理,倒逼政府适应新时代需求的管理创新。
3.权属性。对大数据的拥有,意味着对资源的拥有,而资源是有价值和使用价值的,大数据也就有了归属权,所以,大数据具有清晰产权、增值效应、方便交易等时代特征。
4.关联性。社会已经进入一切让数据说话的时代,使得数据从样本数据转向全量数据,从精确性数据转向多样性数据,从因果关系数据转向相关关联数据,更加强调人、物与自然等相互间数据的关联与依存。
大数据作为一种绿色、环保、循环、可持续发展的战略资源,那么,建设大数据,就须从资源、安全、物理等方面进行全方位考量,使其形成长效、稳固、安全的战略资源库。
1.建设资源库。要把时效性强、数据量大、格式结构复杂、技术含量要求高、价值密度低的数据信息视为大数据。信息以数字形式进行收集、存取、加工处理、传输和管理。由于数据信息量大且结构复杂,为保证信息安全和方便管理,通常是分门别类集中存储和管控,须专用的设施和功能模块予以支撑。
2.壮大资源库。大数据是一个“无限穷尽”的资源库。用户因工作、生活、娱乐等需要,以费用低廉、灵活方便的方式对信息进行包租(流量或时段),通过网络实现信息传输和共享,利用终端使用数据资源。连接用户和数据资源库的网络,犹如连接湖泊、水库、海洋和自来水用户间的管道,彼此相连在一起形成的水系(网络)。资源库为用户提供象征生命的“水”的数据资源供给用户使用,用户把用过或生产的新的数据不断地“注入”资源库,库中资源越用越多,资源库就会不断地“壮大”。
3.利用资源库。数据库资源被用户利用,是一个“借取”的过程,而用户把使用过或生产的新的数据信息,作为资源无偿地“还存”到资源库中。通过“借取”与“还存”的关系,实现相互协作、共享、互补、动态的依存平衡,形成绿色良性循环。随着时间变迁和历史发展,利用价值俞高,作用更加彰显。
4.作用资源库。承载信息价值的数据作为资源,且具有核心竞争力的资源,当被拥有、开发和应用时,会对个人、国家和世界产生重大的深远影响。时至今日,当我们使用大数据资源并使其作用得到充分彰显时,会对我们的社会、工作、生活等产生多方面的影响。当然,无人能确切地感知或预测,只能对其未来作丰富而深远的想象。
1.独立型。据有关媒体介绍,受美国控制和主导的互联网根服务器全球共有13个,专门负责和管理互联网主目录,即互联网域名,亚洲唯一的根服务器设在日本。从国家长远战略利益考虑,有些国家拒绝美国控制,纷纷建立自己的独立域名系统,脱离美国主导的互联网,使美国以互联网控制全球的时代成为过去。世界互联网形势的变化,为我国建立自己独立汉化的网络系统和安全、保密、个性化的大数据资源库提供了可能性。
2.技术型。谁拥有高增值的数据越多,则意味着占有的资源越丰富,在战略视阈更具主动性和更大发展空间,是一个国家或地区具有核心竞争力的标志。实践证明,技术强,竞争力就强,靠核心技术支持的数据就更安全。建设强大、稳固、长远、丰富的具有优势竞争力的大数据资源库,已经成为大数据时代各个国家、地区、政府、行业、企业的迫切需求。为提升我国的核心竞争力,要通过强强联合,把世界纳入我国大数据资源库战略建设的视阈,建设安全型数据资源库。
3.环境型。人为的、自然的、国防的等安全因素,是大数据资源库建设过程中最重要的考量因素。2015年8月,天津高新区火灾,从根本上改变了腾讯建设大数据的基本思路。腾讯将大数据资源库建在贵州新安山中,且在全国多地设点布局并成网,是基于安全环境因素的综合考量,是一种具有全面安全战略视阈的正确选择。
1.储量型。我国IT界具有代表性的公司——腾讯,不断升级改造自有的数据存储中心,经传统方式的厂房改建——自建园区——模块化数据中心等三个阶段建设,已拥有自己第三代数据中心,即腾讯大数据资源库。腾讯公司董事会主席兼首席执行官马化腾认为,经过18年的艰苦奋斗,精心经营建立起来的数据中心,其存储总量才达到1000PB(1PB=1024TB),[2]仅相当于15000个世界上最大的图书馆的存储量,还有较大的拓展空间。
2.协作型。腾讯的容量很有限,仅靠腾讯独家储存大数据资源是远远不够的。同时说明,我国对未来全球可存储数据信息总量还缺乏强有力统一组织、筹划、设计、实施和管理机制。我国建设战略意义的大数据资源库,要在政府统一部署下实施,更需要IT界共同谋划、通力协作,彼此鼎力相助。
3.增量型。据有关媒体报道,以人类目前数据信息存储技术能力看,若把数字存储设备和模拟存储设备等全部计算在内,全球可存储信息为295艾字节(exabytes,EB),即295*(10)20字节≈295*(1024)11TB。若以腾讯现有信息存储量看,1000*1024TB/295*(1024)11TB≈3.389*(1024)-10,仅占全球可存储信息量的亿分之0.3389。由此可见,我国对数据信息存储、拥有量太少。
4.技术性。世界数据信息存储已以BB(1BB=10242ZB=10245TB)为单位,以2020年全球数据记录总量40ZB为基数,那么,1BB/40ZB≈2.62144万年,即1BB存储空间是2020年全球信息总量的2.6万倍。如果我国要容纳1BB数据信息量,则 1BB/1000*1024TB≈1*109,即要建设约1亿个现有的腾讯。若对大数据信息经过排查、删减、除垃圾,再通过高清压缩和虚拟等技术处理,则存储有用、具有高附加值的大数据信息,就更丰富庞杂,历史越久,数据越丰富,价值越高,就更具发展潜能。
1.价值性。维克托曾说过:“大数据是未来,是新大油田矿,是无污染的金矿。”2012年3月,美国政府正式发布国家大数据战略《大数据的研究和发展计划》。[3]2015年10月,党的十八届五中全会上首次将大数据提升为国家战略。随着大数据不断地向社会政治、金融经济、科技教育、文化宣传、医疗卫生、交通运输、设计制造、国防维稳、天文地理、自然环保等方面快速渗透,未来有价值的数据将巨量增长。
2.长效性。与时俱进,是我们不断进取、变革社会、促进人类进步的号角,在大数据资源库建设中,就应有与众不同的视阈和思考。战略型大数据资源库,要把人类发展历史长卷的“无限穷尽”大的数据信息记录在案,以供人类长期探究和发展之用。
3.技术性。绿色环保,可持续发展,节约资源,降低成本,是我国长期发展战略,需要可循环利用的大数据技术予以支撑,而建设大数据,利用大数据,创新大数据等都离不开技术,迫切需要核心技术服务大数据建设。
建好大数据,管好大数据,用好大数据,充分发挥大数据应有的潜能,要从思想上充分认识大数据,从实践中感知大数据,从作用上认知大数据,从效能上理解大数据,以新视阈思考大数据赋予我们的新思想、新思维、新理念。
1.政策开放。开放是大数据时代的最强音。在大数据时代,开放意识的缺失,将会使一个国家或政府处于“被淘汰”的境地。著名投资人孙正义认为,大数据时代,要么数字化,要么死亡。没有开放就没有发展。无数事实说明:闭关自守,只能使自己坐失发展良机,处于被动挨打境地,我国改革开放40多年伟大发展成就,就是对开放意识的最好验证。
2.思想开放。习近平总书记强调:中国改革开放之门只会越开越大,不会越开越小。大数据开放意识已在社会现实中有更多的体现,例如,“一带一路”建设包含着我国对大数据众多的研究成果,是我国把成熟技术、成果以开放、共享、协作等方式应用到友好国家建设,是思想开放的体现。
3.行为开放。大数据时代,我国大开国门、走向世界、拥抱地球,是行为开放的具体实践。我国以开放、协作、共享的方式,把数据、科技、成果等贡献给人类,和世界共同分享,表明我国是一个爱好和平、为人类负责、追求进步、民族平等、合作共赢、共享文明成果国家。
大数据强调开放意识,不仅仅是指数据、科技、经济等局部开放,还应包含更深层次的意识、理念、思想的开放,故不能以孤立、片面、狭隘、零碎的观点或方式看待大数据的开放,而应关联、全面、科学、系统地理解大数据开放的意义。
1.谅解。广纳天下,链接万物,包容一切,是大数据的一大特色。包容是大数据时代对误会、矛盾和隔阂进行调和、化解的良方,因为大数据的生命在于共享,基础在合作,力量源泉在共赢,这些都表现出包容所具有的文明元素,彼此间化干戈为玉帛,取得谅解和互通。
2.理解。当大数据被充分运用时,利益双方的目标或目的几近趋于一致,彼此间矛盾、分歧、误会、隔阂等几乎被抹平,使得国与国间的包容度不断地增强,政府与公众之间的包容度也在提升,人与人之间的包容度也在随处凸显,彼此理解得以落实,从而表现出对互谅、互让、互敬等大数据理解精神内涵的强烈需求。
3.信任。语言是国与国、人与人交流最大的障碍,双方因语言问题容易引起误解、产生矛盾和隔阂。准确畅快的交流,有利于拉近彼此间的距离,增强彼此间的亲近感,提高彼此间的信任度,提升彼此间包容心态。中国国防科技大学研发的讯飞输入法和翻译软件,已用于80多个国家和地区,促进了不同地域、国籍、民族、语言间的沟通、交流。从无数镜像可见,当领导人有外事活动时,在两国领导人间起“桥梁”作用的翻译和记录员,逐渐身影全无,却没有影响两国领导人间高效、畅快的交流和沟通,其原因在于人工智能和大数据在语言方面的运用,使得不同地域、国籍、民族、语言间的“代沟”或“隔阂”被抹平,语言不再是世界各民族交流、沟通的障碍,顺利实现互通有无,增进相互间的理解、信任、互敬和包容。
1.尊重的态度。尊重人才,尊重知识,尊重科学,尊重客观,是大数据时代的显著特点。大数据时代,数据的颗粒度在变小,政府所能获得和提供的数据更加原始与真实,政府决策过程在科技支撑下变得高效与可考证化,决策结果中不确定因素所带来的风险大大降低。
2.严谨的态度。利用大数据技术所从事的活动,都经大量的调研、考证,并进行反复求证、分析,最后才进行具体的实施,降低了风险,提高了效率。例如,具有大数据特征的C919大飞机研发,[4]充分体现出我国政府严谨科学态度。经60年风雨历程,2017年5月5日,我国自主研发的C919大飞机,才从上海浦东国际机场首飞成功,这个严谨、科学的漫长历程是任何一个国家、地区或任何一个产品所不及的。
3.负责的态度。到2018年12月,我国制造的C919大飞机已实现无数次试飞,获得大量有价值数据,改进了很多设计、制造、测试、飞行等初始数据和设想。这是为用户负责,为乘客负责,为至高无上的生命负责,这就是我国为人类不断进步所采取的科学态度的具体在现。
1.万物关联。大数据时代,认识问题、思考问题、分析问题、解决问题,都需要进行“关联”,人的关联、物的关联、人与物的关联、历史与时间关联、地理与空间的关联、多维度关联,世界万物无不因大数据而相互关联在一起。
2.立体关联。当月球背面第一张照片传回地球时,震惊世界,其中的功臣很多,但我们不应忽略以“海、陆、空”三方组成的大数据通讯系统所起的重大作用,就是无线通讯、有线通讯、检测、定位和收发等立体关联,在通讯、控制、遥感、检测、定位等方面的综合展示。据资料统计分析,空中景、地面物、水中游,静和动的物体,以及人们日常生活的衣、食、住、行等,都因大数据而关联在一起。
3.创新关联。脸是人具有的生物外型,一旦和大数据相关联,则对我们的工作、生活、娱乐等产生重大影响。我国IT界精英马云说:未来周游世界,可能不需要护照、身份证、钞票、通讯工具等身外之物,仅需要一张脸就能畅游世界,是人脸生物特征与大数据关联创新的结果。
1.价值分析。我们通过对数据搜索、查询,整理和梳理,归类关联、基础分析、深度分析、价值挖掘等步骤,获得数据有用价值。
2.关联分析。大数据时代,分析是深度的、实时的、个性化的。数据所承载的信息以形态各异的形式分散在不同的时间段、不同的地理位置和不同的网站平台,大数据要做的就是不停地分析,深入挖掘看似不相关的数据,找出数据间可能存在的关联和规律,挖掘出数据的潜在价值。
3.挖掘分析。阿里巴巴以虚拟经济为主打品牌,腾讯以创新应用而闻名,华为以基础通讯享誉全球,格力以制造为名片,他们是我国大数据价值挖掘的杰出代表,代表着我国大数据在不同行业、领域的发展方向。在大数据价值挖掘和应用中,各据所长,独具挖掘分析核心技术。通讯终端设备——手机能被用户青睐,需要具有速度快、容量大、外观美、个性强、功能多、兼容性强、使用方便等诸特点,才能占有一定的市场份额,最终走向世界,华为就是我国通讯领域价值挖掘分析的杰出代表。
4.核心分析。华为经过对大数据的深度分析,在核心技术开发、研制等方面,投入了大量的人力、物力和财力,经不断努力,才掌握了通讯领域的核心技术,能在一纳米空间内集成七个处理器,让同行望其项背,最终取得骄人的成绩站在世界顶峰。