许伦湘
中图分类号:TP334.8 文献标识码:A 文章编号:1004-0226(2021)12-0083-03
近年来,大数据得到了迅速发展。迄今为止,全世界各个领域中都有大数据的影子。当代社会是一个信息爆炸的时代,当前电子信息网络用户基数也越来越大,每天都会产生大量数据。在大数据环境下,对于电子信息应用、处理技术提出了新挑战,在大数据时代的发展下,数据的重要性日益凸显。
1对大数据的分析
大数据是电子信息、信息与通信技术的结合产物,发展至今。阿尔文·托夫勒提出:“大数据是现代社会变革和发展不容小觑的重要武器”,但是,截至目前为止,关于大数据还没有准确、统一的表述。
从字面意义来看,大数据即数据体量大、爆炸性增长的数据,大数据属于全新的信息资产,依托于数据处理模式,可以让各类信息资产发挥出惊人力量。根据麦肯锡公司的定义:“大数据是指在一定时间内无法用传统数据库对数据内容进行采集、存储、分析、管理的数据集合”。从哲学角度来看,大数据是人类社会发展的一个必然产物,在大数据时代的到来下,各类物质、意识、思维的呈现形式都发生了显著变化,这标志着我们迎来了“万物皆数”的时代,在大数据时代中,人们需要借助数据理解万物,任何一切都是基于数据从得出,最终也会演化为数据。在大数据时代,具有几个重要特征。
1.1结合了实体与信息
在大数据时代中,各类客观事物都可以利用数据来量化,如空间、时间、科学研究、个体行为、音频、视频和图像等。大数据的主要特征就是实体与信息之间的结合,信息与实体不同,大数据时代的数据实体,为信息的理解提供了必备条件,能够将万事万物转化为可以理解的语言,利用数据化的形式做到了人机结合。以银行大厅智能机器人助理为例,不仅可以进行简单的认知交流活动,还能够针对咨询客户的需求来做出数据分析,将客户需求转化为数字代码,利用大数据来判断其潜在需求,为其提供解决方案,不仅能够提高工作效率,也有效降低了人力成本。
1.2满足了独享与共享
大数据实现了线下、线上之间的融合,进一步扩大了信息圈,诞生了集体智慧,呈现出上升趋势。数据拥有者可以独享数据,也可以将数据上传到网络,让其他人一起共享,每个人都可以利用大数据来更新知识结构、完善认知,这类信息均是网络空间系统的重要组成,人们可以在生活中相互交流沟通,这不仅不会影响信息传递,反而能够扩大信息共享范围,构建出全新的知识体系。
1.3拥有与使用的结合
在信息社会的发展下,各类资源都表现出新的发展趋势,实现了拥有、使用之间的结合,在大数据时代到来前,人们习惯沿用传统的思维习惯,个人的信息所有权属于个人时,个人才拥有使用权,而在大数据时代中,不需要拥有就可以便利的使用,使用者、拥有者之间可以共享资源,颠覆了传统的思维方式。
2大数据时代下电子信息技术的应用特点
大数据、电子信息之间是息息相关的,电子信息的发展推动了大数据时代的进步。当前,电子信息信息处理技术也在更新迭代,在大数据时代下,对于电子信息技术的应用提出了更高要求。
首先,数据处理分析更加膨胀:大数据时代下,各类数据资源越来越复杂,每天都会生成大量的信息数据资源,给互联网运营商带来一定的数据管理压力,只是单一的信息量分析,那么电子信息的分析效率并不高,很容易出现错误问题。
其次,信息数据种类更加丰富:在科技的发展下,受众对于互联网的接受度越来越高,互联网中出现的大数据不仅涵盖电脑,也涵盖智能手机、移动平台终端,信息数据的来源更加多元,现有的分析技术很难满足信息处理要求。
最后,信息传播过程表现出快速化,即时性的特征,在信息技术的发展下,信息传输过程表现出了实时性、高速性的特点,受众对于信息数据的及时性要求越来越高,这对于电子信息信息处理技术的要求也显著提升。
3大数据时代下电子信息应用技术
3.1分布式信息处理技术
分布式信息处理技术是以GDS作为核心,应用分布式储存、分布式处理的方式来提升信息处理速度,优化读写结构。数据存储上,应用了阵列式存储方式,不仅能够对数据进行模块化管理,也能够对数据进行循环利用,提高了检索速度。
在这一技术的应用上,需要构建出科学完善的信息安全体系,其内容涵盖安全技术、安全管理、安全组织机构几个部分,安全管理是在平台架构中设置的安全管理流程和安全管理制度,同時,制定科学的安全风险分析模块,从管控方面着手,利用科学的技术和方法对其中的信息进行风险识别,根据风险评估结果来制定防控预案,避免受到外来因素的影响。在具体的操作方式上,需要科学制定风险评估范围,对各类业务内容进行细致调查,形成安全需求评估报告,并识别数据风险,对数据开展核实评估,将其整理为评估报告,应用科学的危险品安全威胁评估手段,对异常行为进行检测、扫描,通过渗透测试、手工检查等方式来制定风险计划,制定防控方案,让各类数据都能够处于安全环境中。
同时,对于信息的采集,也要高度重视。数据是在各类安全资源中采集而来,并按照安全事件转化为存储格式,再根据关联规则来进行分析,将信息预警时间显示在平台上,如果用户需要获取信息,直接点击按钮即可。另外,还要强化安全监控。安全监控是针对数据库、端口、服务器、网络设备应用进程进行的监控,以确保信息在存储传输中的安全,相关人员要对各类信息数据进行实时监控,构建统一的管理架构,确保符合大数据时代的信息安全管理需求,并进一步规范数据运维安全管理流程,设置接口层、业务逻辑层和采集数据层,发挥出每一层级的作用,为用户提供优质的信息服务。
3.2信息数据挖掘技术
信息数据挖掘技术是基于大数据信息搜索、数据结构关联技术对相关数据开展系统化分析、挖掘的过程,其主要流程如表1所示。
3.3分类与聚类分析
数据分类即针对数据内部节点开展分类,再借助数据分析技术,对节点做出假设判定、结构预测,预测出信息咨询方向。聚类分析、分类分析之间具有显著差异,前者是将数据划分为对象组,再以此作为基础,对数据进行快速分析。聚类分析、分类分析都会涉及语言编码技术、网络拓扑技术,因此,在数据挖掘、空间分析以及情感分析领域中,都有广泛使用。
聚类分析对象是示例集合,并非单一示例,也不是传统意义上的聚类任务扩展,具有特殊之处。分类分析的方式多种多样,单一分类方式如贝叶斯、决策树、K近邻、人工神经网络、支持向量机等,还有Boosting、Bagging等,各类算法的优缺点也不同,一般情况下,最为常用的就是SVM算法。
3.4关联规则学习
关联规则学习是针对大量数据分析、处理时,借助节点排序、数据对比等方式来分析数据关联规则,对复杂数据来筛选、规律的方式。在传统的二分类、多分类领域中,一个对象对应的是一个类别标记。在真实对象中,分析对象大多有着多义性的特征,以图像分类为例,一般图像常常会对应多个标记。在时代发展下,数据量越来越大,数据复杂性也更高,单一的标签学习难以满足技术发展的需求,多标签成为了目前的研究成果。如今,多标签被应用在音乐情感分类、文本分类以及图像视频等领域之中。
针对多标签学习算法,其研究重点主要在于算法适应、问题转换上。问题转换可以将多标签学习转化为单标签学习,代表性的有LP、BR以及CC。在社交网络、物联网快速发展的状况下,关于挖掘数据的关联性,也成为当前业界的研究热点。实践显示,在把控好置信度、支持度基础上,利用关联规则学习,能够保障算法的精准,且算法复杂度并不是很高。就当前来看,关联规则学习还是集中在多标签学习算法上,在下一阶段,还需要将多标签学习算法、关联规则挖掘算法之间结合起来。
4结语
在大数据时代背景下,电子信息技术的作用不言而喻,对于我国信息化建设的进程产生了直接影响。大数据环境下电子信息技术的应用,需要关注到诸多问题,强化信息采集、处理和应用,提供与之相符的信息安全技术,为大数据时代的发展提供更多便利。