“大数据”时代背景下计算机信息处理技术研究

2018-11-07 03:06张书月
电子测试 2018年19期
关键词:计算机信息数据挖掘大数据

张书月

(广州工商学院电子信息工程系,广东广州,510850)

1 基本概念分析

1.1 大数据

大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。关于大数据,麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征[1]。了解大数据的具体定义,认识大数据的价值,在当前的社会背景下有重要的意义。

1.2 计算机信息处理技术

图1 计算机信息处理技术的基本操作原理结构

计算机信息处理技术具体指的是利用计算机对信息做处理的技术。对此种技术做具体的分类发现其主要有三类:其一是信息系统技术。信息系统技术是以计算机为中心,以数据库和通信网络技术为依托实现对信息处理的技术。其二是数据库技术,将信息进行整序是数据库技术的核心内容,它能将相关的信息集合,实现信息的有序存储和有效利用。其三是检索技术,检索技术的利用使得信息数据的查询与利用更加的便捷。具体来讲,计算机信息处理技术的利用极大的便捷了信息的处理,实现了信息数据利用的价值提升。

2 大数据研究的意义以及机遇和挑战

2.1 大数据研究的意义

大数据在当前的时代背景下具有重要的利用价值,具体研究大数据有三方面的重要意义:首先,大数据是一个国家的信息战略资源,其研究的深度对于国家信息安全的竞争力提升而言具有重要的帮助。其次,大数据的研究可以加速大数据的利用,而在大数据的利用背景下,产业发展的分析会更加的准确,这对于我国的产业升级和经济发展结构调整来讲有重要的意义。也就是说大数据的分析研究可以推进我国产业进步。最后是大数据引发了科学思维革命,所以研究大数据可以更好的实现科学研究。

2.2 大数据研究的机遇和挑战

大数据研究在当前的社会既有挑战也有机遇,从目前的分析来看,机遇主要表现在三个方面:其一是数据的发掘和应用能够产生更为显著的产业价值;其二是大数据时代带来了信息安全、云计算以及物联网的新形势;其三是大数据对信息安全的要求带来了信息安全的进一步发展[2]。有机遇自然也有挑战,具体的挑战体现在两方面:首先是大数据时代对数据挖掘的要求有了明显的提升。其次是大数据时代下的信息安全要求更高。

3 大数据时代下的计算机处理技术

计算机处理技术在社会不断进步的基础上其内容在不断的丰富。就大数据时代的计算即处理技术分析来看,其包含的内容更加的复杂,以下是技术的具体分析。

3.1 DEEP WEB数据感知与获取技术

首先,大数据时代下的计算机处理技术,比较重要的一项内容是DEEP WEB数据感知与获取技术。所谓的DEEP WEB技术实际上就是网络深层空间技术,此技术的数据量信息规模比较大,信息的动态变化、分布性和访问方式都比较的特殊。具体分析DEEP WEB技术的利用,其主要是对数据做充分的利用,然后将其进行高质量的集成,由此达到数据的抽取和整合。从具体的利用分析来看,DEEP WEB技术的使用可以将有用信息数据从大量的数据中进行抽取,实现对其的利用,所以此种技术的使用对于数据的准确利用具有重要的帮助。

3.2 分布式数据存储

其次,分布式数据存储是大数据时代下计算机处理技术的重要利用。从目前的分布式数据存储技术利用分析来看,其现实价值的发挥基于谷歌公司的GPS技术,此技术在IBM以及百度等企业中进行着大量的应用并获得了迅速的发展。具体分析分布式存储,其主要利用的是列存储的概念,而所谓的列存储,具体指以列为单位的存储形式,和行存储进行比较,这种存储方式在数据压缩方面的优势显著,循环更加的迅速。观察该技术在实践中的应用效果,发现其在海量数据的加载和磁盘空间的高效利用方面表现出了明显优势。

3.3 数据高效索引

其三,大数据时代下的计算机处理技术中,数据高效索引也是重要的一项。就当前的主流索引技术分析来看是谷歌公司提出的BIGTABLE技术。分析当前的索引技术,集中的焦点主要有两个:其一是聚簇索引,此种索引方式可以同时按照索引的顺序对全部的数据结构进行存储。其二是互补式聚簇索引。此种索引方式主要是利用副本为索引列进行互为补充的索引表创建。在此种索引方式的具体利用中,其还会与查询结果估算进行结合,从而实现最优的数据查询计划。

3.4 基于内容信息的数据挖掘

计算机处理技术在大数据时代的第四种重要利用是基于内容信息的数据挖掘。所谓的基于内容信息的数据挖掘,具体指的是网络搜索技术和实体关联的分析。研究当今的互联网现状发现排序学习算法是互联网信息搜索的热点,而此种算法的具体提出主要针对的是大规模的社会媒体信息量具有短文本的特征。基于此特征,利用排序学习算法可以很好的处理和分析数据信息。而对排序学习算法做具体讨论,其主要包含了逐点、逐对和逐列三项内容。

3.5 遗传算法和神经网络

遗传算法和神经网络也是大数据时代下计算机处理技术的重要技术内容。从具体的分析来看,遗传算法的提出主要借鉴的内容是生物界的进化规律演化的随机化搜索方法,而要利用遗传办法进行寻优,需要采用概率化方法,因为其能够对搜索的方向做自动调整。目前,遗传算法已经得到了普遍性的应用,具体表现在机器的学习、信号的处理等方面。模拟神经算法,其主要是在模拟动物运行神经的基础上形成的网络行为,是一种可以利用分布式并行信息处理的数学算法。

3.6 分类分析和聚类分析

在大数据时代,计算机信息处理技术的第六项应用体现在分类分析和聚类分析方面。所谓的分类分析,具体指的是对数据点进行分类,然后再做新的数据点确立,所以其具体的使用可以在明确假设和客观结构的前提基础上进行,从而对客户的行为做预测。聚类分析,其具体指在不明确限制的基础上对对象组做集合,然后对对象组进行分析的方法。具体讨论分类分析和聚类分析,其在数据挖掘方面的作用表现十分的突出。

3.7 数据分析技术

在大数据时代背景下,计算机信息处理技术还包括数据分析技术。做数据分析技术的研究发现其主要包括了情感分析、网络分析、时域序列分析以及回归分析四方面的内容。在具体分析中,情感分析主要是对自然语言做主观的判断,而网络分析则是基于网络特点的判断。空间分析主要是做点集拓扑的了解。总体来讲,在计算机信息处理技术的具体利用中,最为重要的便是对数据进行利用,而数据处理技术便是对具体数据的利用。

4 大数据时代下计算机信息处理技术的发展方向

大数据时代在当前社会的表现越来越强烈,在这样的大环境下,计算机信息处理技术的发展倾向也更加的明显。总结当前的技术利用实践和研究实践,发现技术进步再往三个方向发展:其一是计算机网络在向着云计算的方向发展,而且这种趋势在逐渐的增强。其二是计算机技术在向开放式网络传输发展。出于社会公共网络应用的要求,开放式网络的规模在不断的扩大。其三是计算机和计算机网络的融合性发展更加的显著,而这种融合性发展对于满足社会需要来讲意义显著。

5 结语

大数据时代背景下的计算机信息处理技术在不断的丰富和发展,具体的讨论相关技术内容并就大数据时代下的计算机信息处理技术具体利用做分析,这可以更好的认识技术,从而在实践中强化对其的应用。

猜你喜欢
计算机信息数据挖掘大数据
BIM时代计算机信息技术在建筑工程中的应用
探讨人工智能与数据挖掘发展趋势
上海万欣计算机信息科技有限公司
“大数据”时代的计算机信息处理方法阐述
基于并行计算的大数据挖掘在电网中的应用
计算机信息处理技术
基于大数据背景下的智慧城市建设研究
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究