基于大数据背景下计算机信息处理技术的有效性应用

2019-07-17 02:31申妙芳
价值工程 2019年10期
关键词:信息处理技术云计算数据挖掘

申妙芳

摘要:随着网络技术的不断发展以及计算机硬件设备的不断更新,当前计算机信息处理技术也已经正式迈入大数据时代。处在大数据时代背景下,将为计算机信息处理技术的发展设定更为严苛的标准。本文首先分析了计算机信息处理技术处于“大数据”时代背景下所面临的机遇和挑战,继而提出了若干有效应用计算机信息处理技术的途径,同时设计了一套改进后的垂直搜索引擎,以供参考。

Abstract: With the continuous development of network technology and the continuous updating of computer hardware devices, the current computer information processing technology has officially entered the era of big data. In the context of the era of big data, it will set more stringent standards for the development of computer information processing technology. This paper first analyzes the opportunities and challenges faced by computer information processing technology in the context of "big data" era, and then proposes several ways to effectively apply computer information processing technology, and designs an improved vertical search engine for reference.

关键词:大数据;计算机;信息处理技术;垂直搜索引擎;信息安全;数据挖掘;云计算

Key words: big data;computer;information processing technology;vertical search engine;information security;data mining;cloud computing

中图分类号:TP274                                       文献标识码:A                                  文章編号:1006-4311(2019)10-0164-03

0  引言

计算机在全球领域的广泛应用,大幅度提升了信息数据的整体数量,为信息处理工作的顺利开展带来了很大阻碍和困难,因此发展并有效应用信息处理技术的关键在于高效处理大数据[1]。每个企业日常工作的重要组成部分包含了对数据的处理工作,因此为有效促使信息数据处理工作效率的提升,就十分有必要保证计算机信息处理能力的有效提升,为合理、科学应用各种信息数据提供良好的保障。因此,在开展计算机信息处理创新工作的过程中,需要将更大、更多的人力、物力以及精力投入其中,以有效解决因数据总量不断增长而产生的诸多问题[2]。

1  计算机信息处理技术处于“大数据”时代背景下所面临的机遇和挑战

1.1 面临的机遇

大数据时代的到来有效的解决了企业在常规模式下不能合理化、科学化读取以及管理大量数据的难题,同时解决了无法有效发掘数据规律并以最高效能发挥出数据信息作用的问题[3]。通过准确分析大量数据,借此促使企业管理人员工作效率的不断提高,并科学合理的对产生的不同问题加以解决,从而推动企业的不断向前发展。大数据时代背景下,企业充分整合各项高新技术并加以有效利用,同时将计算机技术、信息传播技术以及通讯技术各自优势充分发挥出来[4]。而云服务随着时代的向前发展,已经普及到了人们的日常生活以及企业的日常管理之中,云计算有效集中整个数据资料,通过相应的平台交换数据信息,为人们的日常生活以及企业的日常管理提供了越来越多的便利条件。云计算技术的飞速发展,如果将其同计算机信息处理技术有效的结合在一起,对企业的深入发展无疑是有助益良多的。

1.2 面临的挑战

大数据时代背景下,计算机信息处理技术的发展和有效应用所面临的挑战以几下几点最为突出:其一,分析以及处理信息数据所要求的标准更高。大数据时代最突出的特征之一是信息爆炸,处理数据信息的工作量骤然增大,这不仅对工作者来说是一个挑战,同时对使用者来说也是如此,怎样有效处理、汇总以及甄别各种信息数据,怎样将数据信息有效转化为有用的建议或者决策,这些都是目前迫切需要解决的难题;其二,在大数据时代背景下所面临的数据信息安全问题更为迫切,怎样将更加优化完善的安全屏障设计出来,并将其提供于对核心信息的保护也是面临的又一重大挑战。大数据时代信息安全战争在很大程度上取代了政治、经济等领域的传统竞争模式。人们往往会利用虚拟的数据库来储存种类不一的重要信息,互联网增加了数据交换便捷性的同时,信息安全同样也面临着想当的安全威胁,当收到病毒攻击或者黑客入侵时,信息安全往往成为了影响企业生存发展的关键问题[5]。近年间我国的计算机技术取得了卓有成效的发展,诞生了众多的自主研发能力突出的信息企业,同时越来越多的有志青年投身到了计算机领域中。但是不得不说,目前依然缺乏前瞻型、创新型的核心技术人才,这也是制约计算机信息处理技术快速高效发展的重要挑战之一。

2  改进后的垂直搜索引擎模型设计

2.1 模型概述

在现有模型基础上改进的垂直搜索引擎模型,融合了用户要求以及其相应特点,更加深入的对检索数据加以处理。首先是结构化处理非结构化数据,其次是分为不同的等级处理结构化数据,同时将更为专业、全面的词汇添加到专用领域词典。在网页抽取模块运行过程中先基本处理一次数据,直接将有用的数据存储起来,然后进一步抽取没有被爬取的信息,促使检索数据的有效性和全面性得以进一步提升。

2.2 模型分析

主要的改进方案是将二次处理模块增加到原有模型上(见图1和图2),结构化处理信息数据是二次处理模块的主要功能,包含分类及去重数据,通过对该模块的应用提升搜索及排序结果的准确度。

定向爬取模块在采集信息的过程中应用了爬虫爬取技术,继而在网页信息抽取模块上传所爬取的信息。网页信息抽取模块采用的网络抽取技术是可管理的、实时聚焦的专业技术,并在数据库中存入所抽取的元数据,最终达到更具价值性和针对性的信息抽取目的。该模块的重点在于分词模块和二次处理,数据调整以及模式分离已经存入的网页信息,分析相关链接,在结构化数据的基础上,进一步对网页信息加工处理(分类、去重)。将二次处理的信息提供给客户以实现特定服务,并按照用户要求将搜索结果成功的反馈给用户。二次处理结果在很大程度上提高了合法、有效数据的索引和相关性排序,以最为直接的途径促使检索结果准确性的有效提高。

比如,在搜索识别人名的时候,会因为高频字问题出现识别人名困难的情况,对切分准确度造成影响。中文名一般由姓、名、前缀或者后缀组成,组合方式为姓+名、前缀+姓、姓+后缀以及姓+姓+名等。相关统计显示,汉语姓氏的用字相对更为集中,总数量在1000个左右,更为稳定。“王”姓是其中使用频率最高的姓氏,“王、刘、张、李、陈”五大姓氏达到了32%的覆盖率,前14个覆盖率达到了50%左右,前400个则为99%左右。另外,中文名的用字也相对集中,前10个使用频率最高的字其覆盖率在14.936%左右,前400个则达到了90%以上。中文名从统计学角度分析是具有显著规律性的,利用分词模块和二次处理构建人名识别机制,能够更加准确的进行识别。

3  大数据时代背景下计算机信息处理技术有效应用的途径

3.1 推动计算机网络逐渐向云计算网络演进

大数据时代背景下计算机信息处理技术得以有效应用的必然途径之一就是将计算机网络与云计算网络紧密结合在一起,将两者整合后的作用充分发挥出来。其中对于计算机硬件设备的不断更新是保证网络发展的前提和保障,随着高新电子科技的不断革新和完善,计算机硬件设备的更迭也要与时俱进,否则将难以应对时代发展的需求,因此也就不能为计算机网络迅速发展提供可靠保障。在当前大数据时代背景下,传统的靠硬件更新来促使计算机网络的发展,已然无法满足其快速发展的需求,因此,出现了众多难以解决的问题[6]。而云计算的产生在根本上有效的滿足了网络发展的需求,云计算的产生也促成了开放式网络模式的建立,大众对于网络的使用摆脱了网络中心的局限,云计算的灵活性和开放性更强,并以其自有优势逐渐发展衍生出了互联网模式,云计算具备运转高速以及储存能力出众的特点,因而初始信息处理速率得以大大提升。

3.2 对数据挖掘技术加以大力发展

随着大数据技术的不断应用和完善,更多的数据信息经由大数据技术汇集到一起,不同数据之间往往存在着某些内在联系,对客户的需求能够真正有效的加以反应,但是,有部分数据属于冗余数据的范畴,不被企业所真正需要,如何在这样庞大的数据流中将真正的企业所需的数据找出来,就需要通过对数据挖掘技术的合理应用。该技术指的是利用综合性的技术对信息加以分析、加工等处理,找到不同数据之间存在的内部联系,从而将对企业发展有用的信息筛选出来。对数据挖掘技术进行大力发展和优化,不光有助于企业更高效、迅速的将所需数据信息整理出来,同时更加有助于节约企业搜索和处理信息的成本,可谓是一举两得。

3.3 大力发展信息安全技术,为信息安全保驾护航

互联网的首要属性是开放性,当大众通过互联网进行信息搜索和筛选的过程中,不可避免的会将与自己有关的部分信息暴露出来,而不法分子往往会利用这些漏铜窃取用户的私人信息或者企业的关键性行业信息,实施侵害行为,从而为用户带来程度不一的经济损失或者精神压力,为网络安全带来了很大的隐患[7]。互联网健康发展的关键所在就是绝对保障其安全性,因此网络安全问题要引起人们足够的重视。在大数据时代背景下,以往的信息管理系统很难高效的对网络应用过程中所出现的海量信息进行整理,因此,想要不断完善和革新信息管理系统,需要不断开发更具针对性的管理程序为信息安全提供可靠保障。面对当前花样繁多的恶意网络攻击、计算机病毒入侵以及非法捆绑软件等的威胁,现代企业如何有效规避这些潜在威胁对于保证自身信息安全尤为重要,对于此种情形,势在必行的途径就是大力发展防火墙技术。防火墙是一种结合了计算机软硬件的综合技术,通过紧密连接公共网与内外网,搭建出一个具备保护功能的完整屏障。通过对该技术的发展和应用,对诸多不安全的外界因素加以阻挡,避免种类繁多的病毒以及一些不法人员的非法入侵,同时限制未得到相应授权的外网人员的访问权限。防火墙构建好之后,所有的信息数据均会经由防火墙的安全监测,以此来提升企业内网安全性,因此,有待提高和大力发展应用该技术,促使信息处理技术的进一步完善。

3.4 积极发展计算机存储技术

处理分析计算机数据需在集中获取大数据的基础之上,有效集中收集好工作所需数据之后,计算机经由软件装置以及相应硬件设备科学操作处理大数据。收集获取大数据的过程,同时也是归类整理大数据的过程。经由计算机的有效整理,才能够合理调整组合庞大杂乱的数据流,继而通过符合标准的传输协议,将其上传到网络终端或者其他服务器之上。然而,从当前的发展现状来看,该技术还远不能满足规模日益扩大的数据流。相关统计显示,中央处理器运行速率的增长速度以每年70%的速度在增长,而其相应存储技术知识的发展增速仅为10%,大数据的发展因这两种技术不对称的增速发展而受到了很大阻碍[8]。因此,对于计算机存储技术的发展要加大投入力度,不断促使内存容量的增长,才能保障信息处理技术整体的健康发展。

3.5 引进并培养高端人才

计算机信息处理技术基于大数据时代背景下,获得了良好的发展,而在发展的同时相应的对专业高端人才的需求量也会大幅度增长。有很多企业的发展面临这样的窘境,虽然自身是大数据市场的一份子,搭建了各种媒体、网站平台,但是相应的后期维护工作缺乏必要的人才保障,一旦出现比较复杂的问题自己却束手无策,只好花更高的代价聘请其他专业人士加以解决,加大了公司资金的投入。从企业的长远发展看,这种方式无疑是不可取的。缺少专业人才来维护保障信息处理技术的正常运行,就等于没有了后勤保障,即使技术再先进也都成了摆设,无法发挥其更为全面的功能,因此,也不利于企业市场竞争力的有效提高。那么,对于专业高端人才的引进和培养就显得异常重要了,高端人才的引进不光可促使企业对核心技术的进一步开发利用,另外,从长远的战略发展层面来看,能够帮助企业降本缩能,促使其市场竞争力的提高,以高端技术制高点为依托,促使企业发展的经久不衰。

4  结束语

大数据是人类科技发展到一定程度必然出现的产物,因此我们需正视其在发展过程存在的挑战,抓住良好的发展机遇,以积极向上的态度应对挑战,以积极进取和持之以恒的理念把握住机遇。同时不断实施大力改革,对专业人才加大力度进行培养,推动信息技术的发展和完善,有效应用计算机信息技术,充分发挥其核心技术优势。

参考文献:

[1]高冲.“大数据”时代背景下计算机信息处理技术的分析[J].电脑知识与技术,2016,12(5):23-24.

[2]郑鑫淼.“大数据”时代背景下计算机信息处理技术的分析[J].科技创新导报,2016(17):72-73.

[3]李君芳,徐小亚.大数据时代背景下计算机信息处理技术分析[J].信息与电脑(理论版),2017(2):45-47.

[4]冷鹏.“大数据”时代背景下计算机信息处理技术分析[J].现代商贸工业,2016,37(33):388-389.

[5]梁丁一.“大数据”时代背景下计算机信息处理技术的分析[J].电子测试,2017(9):117-118.

[6]方海諾.“大数据”时代背景下计算机信息处理技术分析[J].科学中国人,2016(17):1-2.

[7]孙玲.大数据时代的计算机信息处理技术分析[J].科技展望,2016,26(26):48-48.

[8]吕晋俐.大数据时代背景下计算机信息处理技术的分析[J].信息与电脑(理论版),2017(10):179-180.

猜你喜欢
信息处理技术云计算数据挖掘
基于并行计算的大数据挖掘在电网中的应用
实验云:理论教学与实验教学深度融合的助推器
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究