云技术全面感知 未来的IT创新点在哪

2017-05-15 15:28佚名
中国信息化周报 2017年14期
关键词:海量网络空间分布式

佚名

云计算已经成为近些年我国科学技术领域高速发展的重要推动力来源,对于互联网科技、云技术以及IT通信领域来说,通过众多领域的不断云化,已经让很多应用开始变得更加灵活和高效。我们都知道,随着当前每日数据量的递增,用户对于海量数据的服务能力已经开始变得十分关注。与此同时也有一些业内专家表示,网络大数据带给我们机遇的同時,也带来了困扰。

网络大数据应用广泛,无论是经济发展领域还是军事、文化发展领域,网络大数据都发挥着重要作用。加强网络大数据研究对维护国家网络空间数字主权,保证经济、文化稳定持续发展,提高国民经济竞争力,实现科技突破等都有着至关重要的作用。无论是直接影响还是间接影响,加强网络大数据研究都十分必要。

大数据研究

助力数字主权保护

随着近些年我国逐渐步入信息化时代,我国综合实力的竞争也正在大数据的推动下加快了脚步。作为一个发展大国重要的博弈空间,若我国网络大数据应用落后,就会直接影响我国占领产业战略制高点,出现网络空间发展不足的情况,影响国家数据使用安全。

“人、机、物”三元世界的交互发展产生了大量的数据。为了充分实现对网络大数据的感知和利用价值,国民经济发展过程中必须有效地解决对大规模数据的测量和应用,以促进各行业数字化和信息化的发展,解决行业发展过程中出现的网络大数据爆炸阻碍。因此加强网络大数据研究,解决大数据基本共性问题十分重要。

信息时代背景下在科学技术上实现网络大数据的技术研究突破,能促进数据服务以及数据材料等相关战略性新兴产业的兴起与发展。实现网络大数据的技术研究和科技突破,能使人们更清楚地认识数据交互连接的复杂问题,并准确地把握数据冗余与缺失等不确定性特性,能够更好地实现对高速增长数据的驾驭。

网络大数据如何感知

这是一个令业界十分关注的问题。按照网络空间中数据的蕴藏深度,整个网络空间可划分为Surface Web和Deep Web(或称作Hidden Web)。Surface Web是指Web中通过超链接可被传统搜索引擎获取到的静态页面,而Deep Web则由Web中可在线访问的数据库组成。Deep Web的数据隐藏在Web数据库提供的查询接口后面,只有通过向查询接口提交查询才能获得。

与Surface Web相比,Deep Web所包含的信息更加丰富。与此同时,Deep Web具有规模大、实时动态变化、异构性、分布性以及访问方式特殊等特点。

网络大数据的复杂性使其诸多环节操作运行难度增加,包括数据存储、数据分析处理以及数据深度挖掘等。大数据的复杂性又包括其类型的复杂,如社交网络与传统文本数据的相互发展,使其类型更加丰富;数据结构复杂,包括移动技术以及社交技术发展下形成的结构数据流以及非结构化数据流,具体形式包括文本、图像等,这给网络大数据管理与分析带来了难度。

海量数据存储问题

就我们目前所掌握的数据处理规模和存储能力来说,我们已经实现了从TB级别到PB级别甚至是EB级别的跨越。在实现等级上升后,为更好地实现对数据存储成本的控制,实现计算资源优化利用,以及提高系统整体的并发吞吐率,要积极地探究出更加有效的存储模式,实现目前网络大数据分布式数据存储方式。

Hadoop系统在Yahoo、IBM、百度、Facebook等公司得到了大量应用和快速发展,但作为新兴的技术体系,分布式数据处理技术在支持大规模网络信息处理及应用等大数据计算应用能力方面还存在很多不足。

分布式数据存储是网络大数据应用的一个重要环节。但之前的研究工作仍存在着一些局限性。针对海量数据存储和处理所面临的数据总量超大规模、处理速度要求高和数据类型异质多样等难题,需要开发支持扩展度高、深度处理的PB级以上分布式数据存储框架,同时需要研究适应数据布局分布的存储结构优化方法,以提高网络大数据存储和处理效率,降低系统建设成本,从而实现高效、高可用的网络大数据分布式存储。

海量数据以及各种应用的全面云化已经正在成为未来IT信息化发展的必然趋势,同时从很多企业用户角度,我们也不难发现,通过云计算技术在应用端的不断壮大,已经使用户的感知程度大大提升,同时这对于技术的不断创新也具有重要的推动意义。

猜你喜欢
海量网络空间分布式
一种傅里叶域海量数据高速谱聚类方法
共建诚实守信网络空间
海量快递垃圾正在“围城”——“绿色快递”势在必行
网络空间并非“乌托邦”
分布式光伏热钱汹涌
分布式光伏:爆发还是徘徊
一个图形所蕴含的“海量”巧题
网络空间安全人才培养探讨
基于DDS的分布式三维协同仿真研究
西门子 分布式I/O Simatic ET 200AL