陆峰
(广西瑞豪科技有限公司 广西南宁 530022)
基于大数据时代下的计算机信息处理技术探析
陆峰
(广西瑞豪科技有限公司 广西南宁 530022)
在科学技术不断进步的背景下,各种计算机的信处理技术不断更新,并且互联网技术也迅速发展,使得人类社会开始进入大数据的时代。在大数据时代下,计算机的信息数据处理技术逐渐受到重视。本文分析了大数据概念、特点与影响,并探讨在大数据的时代下,计算机的信息数据处理技术,提出大数据下计算机的信息处理技术未来发展展望,以期为信息处理提供参考。
大数据时代;计算机;信息处理技术
随着计算机的技术出现,使得传统计算模式发生改变,给社会的科学技术发展与完善提供了一个新方向。近年来,计算机的技术逐渐广泛应用在各行各业中,在人们的生活与工作中占据着重要位置。但是在发展过程中还面临着诸多挑战,大部分互联网公司为获得更多的盈利,对于计算机的数据存储研究过于重视,而对大数据时代特点与发展趋势没有全面掌握,从而导致自身发展受到影响。因此,需要相关人员深入分析大数据时代背景下,可能存在的挑战与机遇,从而针对自身情况研究计算机的信息处理技术,进而给互联网用户提供最优质服务。
1.1 大数据特点
大数据主要特点就是多样化、数据量比较大、复查比较容易以及快速化等。其中,数据量比较大主要指大数据的时代计算机的信息数据处理量相对较大,并且呈现出与日俱增的情况,已经从原先TB的数量级转变成ZB数量级,1ZB等于10242PB;快速化主要指新时代网络的数据流中,大部分数据传输都比较高速与实时,在处理这类数据时需要持续、实时与快速,必要时还要对这类数据处理工具进行不断更新;数据复查主要指计算机中海量数据信息的处理难度比较大,很多信息处理的技术还需要不断完善;多样化主要指在大数据的时代背景下,数据的类型非常复杂,通常包含图片、文本、视频以及音频等,并且格式多种多样,这就加大了计算机的信息处理难度[1]。
1.2 大数据时代对信息数据处理的影响
物联网的技术与云计算的技术产生为大数据时代到来创造了必然条件,而大数据时代会对政府机关活动方式、计算机的用户使用以及企事业单位的运营有着直接性影响。此外,在大数据的时代背景下,其核心与重要内容内容就是数据,并且在大数据的时代下,网民、企业与消费者间界限变得越发模糊,界限不够明确,这在某种程度上严重影响了企业发展方向、运行、管理以及经营。
1.3 大数据下信息数据处理技术发展情况
大数据属于计算机的技术发展的阶段性产物,大数据时代则是IT行业第三次的技术性变革,在其开始诞生之时就对企业、国家管理以及人们日常生活、工作有着重要影响。近年来,随着大数据的理念逐渐形成,网民与计算机的网络消费界限越来越模糊,数据逐渐变成一种可以展现社会价值的重要资产,对于企业文化树立、组织结构调整以及运营模式创新都有良好推动与导向的作用,这表明大数据的时代背景给人才培养、企业文化与组织建设提供了挑战,同时也创造了机遇。当下大数据时代已经是时代发展典型的特征,其可以代表当今时代的信息技术发展态势。而且在大数据时代背景下,可以看出现今是信息的大爆炸时代,同时也是竞争和机遇共存的时代[2]。
计算机的信息数据处理流程从图1中可以看出,具体处理技术如下:
2.1 数据分析与可视化的技术
①数据分析的技术:数据的分析技术主要包含情感的分析、网络的分析、空间的分析、各种时域序列的分析以及回归分析等。网络分析主要指在网络的特征下所实施的分析技术之一;空间的分析主要是几何统计的分析、集拓扑分析与地理编码分析;而情感分析也就是自然语言的主观分析。②可视化的技术。应用可视化的技术可以创建图片、图形以及图表等,以便人们对数据结果进行正确分析与理解,同时应用可视化的技术可以帮助相关人员充分认识数据集。
图1 计算机信息数据处理的流程图
2.2 关联规则的学习技术、分类与聚类分析的技术
分类的分析技术主要是在数据点归纳基础上,给出新数据点,并在假设结构确定基础上,合理预测客户可能发生的行为;聚类的分析技术一般是在限制因素不明确情况下,将集合分成不同的对象组,然后对对象组进行分析与处理,这种技术分析比较详细,因此在数据的挖掘方面应用比较广泛。另外,在数据的挖掘中还会应用关联规则的技术与机械学习的技术,其中,关联规则的技术指在数据处理过程中,探索不同数据之间可能存在的关联规则;机器的学习技术属于人工智能中的关键性内容,主要目的就是对人们学习的行为进行模拟。近年来,计算机的网络技术开始向着云计算的网络方向进步与发展,换句话说,在今后计算机的信息处理不再只是依赖于计算机的硬件,其更重视网络的连接,即在计算机的网络技术基础上,对信息的处理技术进行完善,从而提高大数据的处理效果。
2.3 网络深层的空间技术与公布型的数据存储技术
①分布型的数据存储主要在可扩展分布式的文件系统技术(GFS)上所发展起来的新技术之一,这种技术在IBM与百度等公司都有着广泛应用。通常情况下,分布型的存储技术使用列存储的概念,列存储的概念则是把列当做基本的单位,从而对数据进行存储,与行存储比起来,列存储的技术主要优势是数据可以压缩与循环速度比较快等。而较为常用的一种技术主要是行列的混合存储,这种结构能够快速加工与处理海量数据,充分应用磁盘的空间,缩短搜索的时间。②网络深层的空间技术主要特点是信息的规模比较大、分布性比较特殊与访问的途径复杂等,这种技术可以集成处理海量数据,从而方便数据的整合。
2.4 遗传算法和数据的高效索引
①遗传的算法:这种计算方式是在生物书进化规律基础上发展而来,属于一种随机的搜索方式,并且随机该搜索方式可以自动调整搜索的方向,广泛应用在信号处理、机器学习以及物流选址等方面。②数据高效的索引:目前关于数据高效的索引研究重点主要是聚簇索引与互补型的聚簇索引两个部分,互补型的聚簇索引一般是将不同副本当做索引列,建立互补索引表;而聚簇索引则是与具体索引顺序相结合,然后存储数据。
2.5 在相关内容信息基础上挖掘数据
在相关内容数据的基础上挖掘数据的技术研究重点是:实体关联的研究技术和网络搜索技术。在网络搜索技术研究中,排序学习的算法是最重要的部分,提出排序学习的算法是为了方便海量数据处理。究其原因,各种社会媒体中关键资料存在的形式都是短文本,这在某种程度上就推动了排序的学习算法产生,通过这种主逐对、逐列与逐点计算,可以提高社交媒体海量数据处理的效率。
计算机的互联网主要是依托于相关计算机的硬件设施存在,在这某种程度上会造成计算机的信息数据处理技术发展存在一定局限性,致使计算机无法和计算机的应用软件发展同步,进而与网络发展需要不适应。因此,计算机的信息数据处理技术要想在今后获得更好的发展,需要彻底摆脱计算机硬件设施的限制,渐渐与互联网技术相接轨。①信息的处理技术渐渐朝着云计算的方向发展,因为云计算的技术属于新兴数据处理的技术,可以在处理数据时,彻底分离开存储空间与硬件设施,也就是在不依赖计算机硬件设施基础上,完整保留数据的信息。②计算机的信息数据处理技术传输方式需要转变成开放式,建立开放式的传输通道,可以割开硬件设施和数据信息。③需要不断完善与发展计算机的硬件技术,有机结合网络与硬件设施,将计算机硬件设施限制性削弱,进而推动计算机的网络技术发展与完善。
总而言之,在大数据时代背景下,虽然计算机信息数据处理技术获得一定发展,但仍然存在很多缺陷与不足。因此,为了完善计算机信息数据处理技术,需要深入探索与研究各种先进信息数据处理的技术,确保计算机互联网更好和为用户服务,进而推动社会进步。
[1]黄俊俊.基于大数据背景下的计算机信息处理技术探析[J].大科技,2016,16(03):256.
[2]杨曜宇.计算机网络技术在大数据时代的重要作用研究[J].中小企业管理与科技,2015,21(19):201.
TP274
A
1004-7344(2016)23-0256-02
2016-7-3
陆峰(1970-),男,汉族,广西南宁人,助理工程师,本科,主要从事计算机信息系统集成、计算机网络工程、机房工程、音视频会议系统工程、小区及楼宇智能化工程的设计与建设工作。