文/商丘医学高等专科学校 孟祥富
大数据技术在计算机信息系统中的应用研究
文/商丘医学高等专科学校 孟祥富
本文在对大数据的定义及主要特征进行综合阐述的基础上,介绍了几种大数据的关键技术,并说明了大数据技术在计算机信息系统中的具体应用,以期为相关人士提供借鉴和参考。
数据备份;云计算;Hadoop
随着社会的不断发展和生产力的不断提高,大数据技术在计算机信息系统中的应用越来越广泛,成为一种必然的发展趋势。大数据技术的应用,使得人们可以通过计算机的信息系统,分析事物的发展趋势,从而不断提升自身的知识层次和价值观念。因此,大数技术在计算机信息系统的应用,具有十分重要的现实意义。
大数据指的是无法在短时间内进行捕捉、处理和分析的数据组合,通过运用崭新的数据处理模式,采用较为方便的算法,利用强大的洞察能力获取有价值的信息资产。大数据的来源较为广泛,例如,网上交易记录、监控视频等,都属于大数据的范畴。大数据主要有以下四个特征:首先,大数据具有多样性的特点,由于数据的来源渠道不同,数据的形式也多种多样,例如:图片、视频、音频等。其次,大数据的存储能力和计算能力都很强大,能够完成常规软件无法完成的数据计算和存储。第三,大数据的发展速度较快,目前已被应用于包括计算机信息系统在内的各个领域。最后,由于大数据的信息量巨大,导致了其实用价值降低,筛选真正有价值信息的难度增大。
(一)云计算技术。云计算技术是一种通过分布式、并行式的计算方法对计算机数据进行梳理,综合网络上的所有信息资源,包括数据、存储等相关计算资源都进行并行式网格化计算,以此来实现对各种资源的分配调度。通过云计算技术对大数据时代下的信息进行系统管理和处理。云计算技术不断发展的同时也推动着计算机处理数据的方式带来革命性的创新,将信息产业的模式推向一种全新的并行交互化发展模式。随着云计算技术的不断革新,数据处理过程中可以容纳的信息量不断增加,可以处理的领域不断扩展,云计算技术带来了第三次计算机数据处理的变革浪潮。
(二)数据备份技术。大数据时代下的信息保护也受到各界的重视,计算机信息数据备份的重要性日益凸显,数据备份技术可以帮助企业保护企业信息,为企业数据资源建立一个安全的储存环境。信息化的不断发展给全球带来巨大的技术进步的同时也造成了信息泄露、个人企业的私人信息受到极大的威胁。一份完整的数据可以保障企业业务顺利运作,有效避免因为突发意外情况而导致的数据丢失,数据备份系统一定要做到和企业的信息操作系统完全兼容,这样才能保证事故发生时,能够快速恢复企业信息。
(三)Ha d o o p。Hadoop系统是一个综合性处理信息资源的平台,可以综合多种信息处理技术工具,其中包括多种功能零部件,比如H D F S分布式文件系统、Ma p R e d u c e并行计算框架、H b a s e分布式N o S Q L列式数据库、H i v e数据仓库工具、F l u m e日志收集工具等许多关键技术工具。Hadoop系统中的每个相关技术工具都拥有高性能、高容错率这样的优点,可靠地对大数据进行管理和应用。
(一)云计算技术在计算机信息系统中的应用。想要应用云计算技术在计算机信息系统中进行数据处理,通过云计算的分布式网格计算,对整个资源进行数据处理,首先要构建相关模型。云计算模型的构建可以让全部数据都迁移到云端,合理有效地降低计算机系统在信息处理上的经济费用。在云计算下,技术服务软件利用无线局域网自动产生了相应的传输移动数据的网格,面向大数据信息构建出了一个的闭环反馈信息处理模型。在云计算处理数据的过程中,云计算又以一个有向无环的数据流图展示出来,流图为G=(V,E),在此基础之上根据云计算的并行式的计算方法,生成了由一系列的组和一系列的传输远程数据所用的隐性通道组成了云计算的计算服务模式,其中模式中组和隐形通道的公式分别为和此外还需要出口节点用来生成输出的对应数据。在C/S的架构下,如果云计算数据流模型的传输范围被控制在这个范围内:
在此范围内传输数据时,云计算技术处理大数据信息时所应用的数据流图上的关键组成部位也要采用有向图模型来表示,即为,云计算模式中最重要的交叉通道承载物理节点集和链路集在公式中分别以VP和EP表示,而公式中的S C AP则代表了不同组件中物理节点的不同数据单元的具体数量。另行设置输入数据所用的无向图模式,实现云计算对数据资源的动态资源配置管理处理,最终云计算的整体架构可以通过下式表示出来:
这种云计算的整体架构是结合多方信息进行数据整合加速处理的云计算技术,根据不断的应用模拟试验得知,将此种云计算方法应用到计算机系统中的数据处理中,可以大幅度增加数据的容纳量,减少数据处理的能量损耗和所需时间,并且由于其能够将数据上传至云端,还可以达到资源共享和提高计算机系统处理效率等目的。上述云计算的模型不仅能够进行多数据集中计算,还支持多个用户计算资源的共享,减少同类型数据的重复运算率,一套较为基础、普遍的云计算技术,可以在全国范围内进行推广,解决绝大部分数据计算问题,因此云计算技术在计算机信息系统中的应用具有极大的市场前景。 (二)数据备份技术在计算机信息系统中的应用。新时代背景下,商业环境越发复杂化,企业要从多种方面来加强对数据的保护,包括数据的备份恢复系统无休运行以及提高系统的容错率,在企业建立数据备份的同时,应该建立数据备份系统的容灾系统,建立对信息数据的最优备份方案,即“数据备份加数据保险库”。现阶段大部分企业对数据备份的重要性没有足够的认识,导致应用数据备份系统的企业只有20%,而被应用的数据备份系统中含有容灾系统的只有5%-6%,应该在国内大力推广实施数据备份技术,加强对企业信息的保护,让企业家认识到数据保护对企业的帮助。想要从根本上保障企业的信息安全,除了要做到对数据的定期备份之外,还应该强化备份细节,部分企业认为拷贝数据到移动储存就是数据备份,这样的观念,给企业信息资源留下了极大的隐患。
实现数据备份的方式多种多样,首先备份的存储介质要使用磁带、移动硬盘、U盘等设备备份,还要做到异地存放,在存放的地点安装完整的计算机、互联网等相关通信设备,确保意外发生后,能够立刻启动备份数据系统。再将备份数据系统与企业系统相连接,以此恢复企业本部系统数据。除了要将数据存储到可移动设备上,还要将数据传输至远程备份中心,制作成光盘,双重保证企业信息安全。企业都会建立相关企业信息数据库,因此,在做到信息详细内容备份的同时,还应该在备份机上建立对应的备份数据库,通过通信系统,保持主数据库和备份数据库同步更新,在事故发生时,备份数据库就可以立即代替主数据库,恢复企业相关信息,减少企业因为数据丢失造成的经济损失。数据备份还可以应用对主数据库和重要文件的监控和跟踪,在备份机中生成对应的更新日志,备份系统会根据更新日志,自动对备份磁盘进行数据更新。综上所述,企业可以根据企业的实际情况,按照企业的需求,制定出对企业最佳的数据备份方案,保证系统的可实施性。
(三)Hadoop在计算机信息系统中的应用。Hadoop系统由于自身具有的极高的扩展性能和低成本,被广泛应用在各行各
业中,并且对于Hadoop来说无论是怎样的数据都可以快速大量地储存信息数据,能够做到和绝大部分的数据仓库系统完美融合不出现排斥现象。以铁路货运为例,铁路运输存在数据类型多、数据资源难以进行整合、运用其他系统成本较高等诸多实际问题,而Hadoop则从根本上解决了铁路运输信息的问题,满足铁路运输中绝大部分类型的数据,Hadoop系统和铁路运输的数据仓库系统一起构成了货运信息的大数据分析平台,Hadoop系统在平台上对数据存储备份进行管理,两个系统互相配合,使得数据信息的整合和管理变得简单便捷。从铁轮货运系统对Hadoop系统的应用可以看出,Hadoop系统在针对复杂数据的整合储存、集中管理方面的优异性,Hadoop系统的各个零部件在运行过程中发挥各自功能的同时能做到相互协作,给数据资源处理提供所需的功能,目前Hadoop系统的开发逐渐步入完善阶段,各个功能部件的功能分工明确,细致划分,逐渐形成一套功能丰富、作用完善的大数据信息分析平台应用系统。
综上所诉,当今世界信息知识蓬勃发展,大数据技术已经被广泛应用到各行各业中去,随之带动相关信息行业规模扩大,给相关行业带去大数据中具有极高行业价值的数据信息,帮助行业解决实际问题的同时,因为行业需求不同,对计算机系统的要求也在不断提高,促进其快速发展,未来大数据技术会被更多地应用在计算机信息系统中。
[1]陈小莉.基于大数据的计算机数据挖掘技术在档案管理系统中的研究应用[J].激光杂志,2017(02):142-145.
[2]徐胜杰.大数据技术在指挥信息系统中的应用与发展[J].电子技术与软件工程,2017(06):168.
[3]李春林.大数据技术及其计算机信息系统中的运用探讨[J].科技经济市场,2016(09):42-43.