大数据信息的挖掘和使用

2021-11-24 01:43郐媛媛
中学生学习报 2021年19期
关键词:计算技术海量图书

郐媛媛

摘要:本文主要叙说了大数据的处理技术、大数据信息的挖掘和使用。希望图书馆可以借助大数据技术对现阶段的工作和未来发展提供帮助。

关键词:图书馆;大数据

一、引言

由于大数据具有的特征与特性,这就导致大数据信息无论是在数量上,还是在种类上都是非常的多的。而这些大数据信息并不是每一个数据信息都有其应有的价值和作用的。而对于很多的企业、个人、政府而言,这些大数据信息当中很大一部分都是没有价值的数据信息,而真正有价值的数据信息它的密度是非常低的。这就需要要运用专业的大数据技术对所有的信息数据进行整合、统计、分析、挖掘,并且在做这些工作的时候还要进行高效合理的处理。这样才能够保证最终得到的数据信息才是有价值的数据信息。而这些有价值的数据信息才能够帮助各个企业、各单位来优化自己的业务、为产品和服务找到更具有创新性和创造性的方向。同时,为企业和单位的未来发展提供有效的数据支持。同时,对于企业单位和个人在为人们提供服务的时候,有了大数据技术的支持和有效的数据信息、有价值的信息,这样才能够保证当企业和单位在为用户提供服务的时候,才能够根据用户的个性化的需求和需要来为客户提供个性化的服务模式。同时,大数据技术在图书馆当中的应用,还能够帮助图书馆有效的对图书馆的现有数据资源和图书馆的建设提供数据支持。同时,当图书馆在对某一项工作和未来发展进行决策的时候,也能够根据使有效的数据信息来确定图书馆的管理模式,运行模式和未来发展的方向。因此,可以说大数据的特性决定了图书馆在面对海量的数据信息以及丰富的数据种类的时候,一定要通过有效的挖掘,才能够让海量的数据信息更有价值,才能够让图书馆的服务更具有精准化和个性化,能让图书馆无论是在现有工作上,还是在政策的制定和执行上才能够更好的根据大数据的特性来进行日常的工作和为未来的发展提供有效的决策。

二、大数据的处理技术

2.1云计算技术

目前,当人们提到大数据技术的时候,往往会离不开云计算技术,因为大数据技术主要是对于数据技术的存储工作和处理工作,然而在对这些海量的数据信息进行存储和处理的过程当中,需要对这些海量的数据信息进行计算,这样才能够通过计算结果来判断哪些数据信息是有价值的数据信息,而哪些数据信息因为没有价值需要被删除的信息,以免浪费资源和存储空间。再对海量数据信息进行计算的时候,就会运用到云计算技术。因此,这也就是我们常常看到的大数据技术不会单独的处理海量的数据信息,而通常会与云计算技术一起来共同的处理这些数据信息。因此,可以说在大数据信息对含量数据信息进行收集、存储,以及处理的过程当中,云计算技术将是对这些数据信息进行存储和处理过程当中不可缺少的一个重要的计算技术。而云计算技术以其快速的计算能力,体现出现代化的数据管理技术的先进性和智能性。因此,将云计算技术与大数据技术一起共同的来对于海量的数据信息进行存储和处理的方式是传统的数据管理技术无法能够面对海量数据信息的时候所进行处理的。因此可以说,当传统的数据管理技术在面对大数据技术与云计算技术联系在一起的时候,就能够真正的体现出传统技术在面对海量数据信息的时候的捉襟见肘。所以将大数据技术和云计算技术联系在一起,恰恰能够体现了现阶段数据技术和现代化信息技术的快速发展。这让人们在面对海量信息的时候,在面对对信息进行处理的时候,可以真正的做到全面性的、及时性的处理海量数据信息。而不是当人们在面对海量数据信息的时候出现束手无策,无从下手,或者无法真正的全面处理这些信息的情况。因此,当大数据技术在面对海量数据信息的时候,主要是通过分布式处理的手段将这些海量的数据信息全面及时的存储在大数据技术的平台上。而大数据技术与云计算技术联合在一起,共同处理海量的数据信息,主要就是因为云计算技术的核心内容就是对于海量数据的计算能力。因此,将两种技术联合在一起,不仅能够实现对于海量数据信息的存储工作,同时还让这些海量的数据信息经过计算后得到有效的处理。而经过处理后的数据信息能够更好的找到有价值的数据信息,这让海量的数据信息,通过处理后能够进行有效的筛查工作,让海量的数据信息当中的有价值的数据信息得到有效的体现。而这些有效的价值信息才是人们想真正要得到的数据信息,才是能够人们在生产、生活、学习,以及工作当中能够利用到的数据信息。而这些有价值的数据信息才能够为社会、政府、企业、个人提供有效的帮助,才能够为社会的生产和进步提供有效的数据依据。因此,当人们提到大数据技术的时候,往往会离不开云计算技术,也只有将这两种技术联合在一起,才能够共同的处理和存储大数据资源,才能够将海量的数据信息进行价值体现。这也是近几年大数据技术和计算云计算技术快速发展的主要原因。因为,每一个人,每一个事物,每一个系统,时时刻刻每分每秒都在产生的数据信息,而这些数据信息由于它的价值密度非常低,但是在这些数据信息当中还包含着有价值的数据信息,因此这就迫使人们必须要利用有效的技术来对这些海量的数据信息进行处理和存储,并且通过计算的方式来找到海量数据信息当中有价值的数据信息。并以此才能够将这些有价值的数据信息为社会服务、为企业和各个行业服务。同时,还能够起到为个人和团体服务的作用。因此,大数据技术的快速发展,同样迫使云计算技术也要紧跟随着时代的脚步快速的发展和更新,同时还要不断的提高计算能力,这样才能够让大数据技术和云计算技术联合在一起共同为人们所服务。

2.2数据传输及储存技术

众所周知,大数据就是众多数据汇集在一起,因此在面对海量数据信息的时候,无论是哪个技术,或是哪种软件都会涉及到如何将产生的这些数据信息进行很好的保存与传输。因为,人们在生产、活动、学习工作当中,所产生的海量数据信息,都得需要通过传输的方式最后传输到系统或者平台当中,然后给予保存。这样才能保证海量的数据信息能够被保存的很好,并且可以通过云计算的方式经过处理。然而,如何能够对海量的数据信息进行大量的传输与保存是很多技术平台面对的一个问题。因为,很多的技术和系统平台在面对海量的数学的信息的时候都会因为信息数据数量大,储存占用空间大,而导致储存的效率非常的低,或者在存储的过程当中会对数据信息造成一定的损害,比如数据信息减少,数据信息丢失等等。因此,人们需要另外一种技术来帮助大数据技术对现有的海量的数据信息以及随时产生的海量数据信息进行有效的传输以及很好的存储。因此,这就需要在进行大数据传输和存储的过程当中,应用到对数据进行压缩技术。目前,市场上的压缩技术有很多种,但是经常和大数据联合在一起使用的有Lemp eL-Ziv压缩技术,这种数据压缩技术可以实现海量数据信息的无损存储。这样就可以将数据信息通过压缩的方式来减少它所占用的空间,并且这种方式也是人们最常用的,是市面上最流行的存储方式。由于它不会对数据信息进行破损,因此人们在压缩数据信息,尤其是在压缩海量的数据信息的时候,常用这种压缩技术。数据信息在通过压缩处理以后,可以将大量的数据信息进行压缩,这样可以减少数据信息的数据量。压缩包的方式来对大量的文件进行压缩的方式,还可以提高传输和存储的效率。因此对于文件而言,人们常用打包压缩的方式进行处理,而对于数据信息在存储方面也会运用压缩技术为了能够保证收集信息得到有效的存储,通常会利用分布式文件系统。无论是哪种方式的数据传输和存储技术,都会面对两种数据性的模式,分别是实时性的数据信息和离线模式的存储信息。而当数据传输及传输系统在面对两种数据模式的时候,通常情况下对于实时的数据信息要求的技术更高、要求的场所更高。因此,为了能够实现实时数据的有效存储和无损存储,因此可以将实时的数据信息进行多级别的存储系统的搭建。这样可以保证海量的实时数据信息能够得到无损的存储算法,还能够保证这些实时的数据信息能够以快速高效的方式进行計算和处理。数据传输以及存储技术是大数据技术在面对海量数据信息的时候,能够进行有效的分析和计算的好方式。而将数据传输及存储系统应用在图书馆系统当中,是能够有效的帮助图书馆在面对海量数据信息的时候,所产生的对于系统平台带来的负担。图书馆系统平台当中每天都会收集和产生大量的数据信息,而这些数据信息由于数量多内存大会给图书馆管理系统的正常运行以及存储带来极大的负担。它不仅数量多而且会占用大量的空间,这样就会导致图书馆管理系统因为所占内存空间过大,而导致运行速度慢、计算能力差、存储效率低等情况。为了能够更好的解决这些情况,很多图书馆也都会运用数据传输与存储技术,这样能够极大的缓解和帮助图书馆管理系统,因为面对海量数据信息而导致的负担。

三、大数据信息的挖掘和使用

3.1图书馆对读者行为数据进行挖掘

图书馆的主要服务对象就是读者,图书馆的主要工作内容就是为读者提供服务。因此,如何能够为读者提供更精准化的服务,如何能够让读图书馆在读者心目当中的地位得到稳固并有所提升,是图书馆现阶段的主要工作内容和努力方向。因此,图书馆可以通过各种方式来收集读者行为数据,并且图书馆在收集读者行为数据的方式和来源有很多种。比如,当读者利用图书馆新媒体平台进行登录、浏览、查找图书时所产生的行为数据、读者的借阅图书的信息、浏览图书的信息,以及借阅的频次信息、读者参与到图书馆开展的各项活动信息、读者利用图书馆新媒体平台进行交互式行为的信息等等,都将是读者信息的主要来源方式。而图书馆主要做的任务就是要对读者的所有数据信息进行分析、整理、挖掘和处理。因为,这些行为数据信息都是由读者发出的,或者是与读者相关系的数据信息,因此当这些数据信息被图书馆进行深度的挖掘和整理后,能够将这些所有的数据信息进行统计,并找到有价值的数据信息。这样图书馆能够更好地了解每一个个体读者的阅读偏好,阅读喜好和阅读需求。这样图书馆可以根据对于这些数据信息的挖掘和整理后,能够形成一个统一的有效的分析结果,并且通过这个结果来制定每一个读者的不同服务模式。这样能够让图书馆的服务流程不再是一成不变的,而是根据不同读者的不同需要来进行相应的转变和转化。这样通过对于读者数据信息进行预测后,能够深入的了解读者的需求和需要,并在此基础上图书馆可以为读者提供读者需要的精准化服务。这样图书馆不仅可以借助大数据信息来了解读者的需求和需要,同时还能够在图书馆的日常管理和操作过程当中将读者的需要加入到业务流程当中,这样读者不再是图书馆的服务对象,同时读者也是图书馆业务流程当中的一部分读者的个人行为也将影响和主导了图书馆的业务模式和服务模式。

3.2图书馆利用大数据可以在定期的时间为读者生成个人的阅读数据报告

这个阅读数据报告都是通过读者日常在图书馆内借阅图书,浏览图书所产生的数据信息,以及读者在利用图书馆新媒体平台进行查找、浏览、借阅等操作时候所产生的数据信息来完成的。图书馆定期为读者的个人借阅行为进行数据报告的展示,是为了能够让读者更清楚的了解到自己在利用图书馆借阅图书、查找图书的过程当中都产生了哪些借阅的行为。这样能够让读者更了解自己对于图书的借阅情况,图书的使用情况,并且自己都产生了哪些敬业行为。因此,图书馆在为读者提供个人数据报告的时候,报告的内容主要包括读者在一段时间内在图书馆当中都借阅了哪些图书、都查找了哪些数据资源、读者借阅图书的时间、读者都参与到了图书馆开展的哪些读者活动,以及图书馆开展的各项培训当中。读者在收到这个个人数据报告后,就可以对照这些数据内容对自己所有的阅读行为和使用图书馆进行借阅图书,查找图书的所有行为进行了解,这样读者就能够通过这些数据报告,能知道自己在一定时间内都看了哪些图书,并且每一本图书自己都看了多长时间。这样读者就能够对自己的阅读情况做一个大致的了解,读者在借阅一本图书以后,每一本读书都阅读了多长时间。有的读书会阅读的慢一些,有的读书会阅读的快一些。这样读者在掌握这些信息以后,就能够很好掌握自己的阅读时间。如果读者日常的学习和空闲时间比较少,那么一本图书阅读的时间可能会长一些,如果读者在最近一阶段时间比较充裕,空闲的时间比较多,那么读者在阅读一本图书的时候,所用的时间可能就会相对短一些。這样读者也能够从自己的阅读图书所耗费的时间上来判断自己在近期的工作状态学习状态,以及生活状态。读者也可以根据这些数据的信息报告可以尽量的调整一下自己的生活时间,以及各个工作学习的时间安排。读者可以尽量的平衡一下日常的工作和学习,尽量让学习和工作以及生活琐事所占用的时间能够平均分配在每一段时间每一天。这样自己既然不会太劳累,也会每天按时的完成学习量和工作量,同时还能够抽出一些空闲的时间来陪伴家人、出去旅游,以及阅读图书。因此对于每一个读者而言,图书馆为读者提供的个人阅读数据报告,虽然只是将读者近期的阅读行为和阅读的数据信息,以及书单的信息展现在读者的面前。但是,读者可以通过这些数据信息来深层次的剖析自己,最近在生产、生活、学习、工作上所耗费的精力和时间,这样可以进一步帮助读者来调整自己的时间和精力。同时,图书馆还会为读者在个人数据报告当中展示读者近期所借的图书的书单,这样读者也能够很好的掌握自己在近一段时间内读了哪些图书?这些图书都带给了自己哪些知识的掌握和学习。同时,读者将这些书单收集起来,还能够很好的判断出读者近期都读了哪些书。因为,有很多读者都会表示自己时间比较忙,有的时候阅读完的图书,在过很长一段时间以后就忘了自己是否读过这本图书,而且这种情况发生情况还时常发生。有很多读者就表示,有的时候自己在图书馆借到纸质图书或者在图书馆新媒体平台上阅览电子图书的时候,可能在阅览的和阅读的时候,就觉得这本书的内容似曾相识,好像以前阅读到过,但是自己又不是很确定。但是,当这本图书阅读到一半的时候,才发现这本图书自己以前已经读过了,而这种重复性的阅读会浪费读者额外的时间和精力。还有很多读者表示自己以前看到某一本图书的时候,非常想阅读,非常想借阅,但是等真正有空闲时间来到图书馆去借阅的时候,却忘了这本图书是什么了。因此,图书馆为读者提供个人的图书数据就能够帮助读者更好的掌握自己在一段时间内都阅读了哪些图书,这样读者在借阅图书的时候,就可以将新借阅这本图书的书名与之前看过的图书的书名进行对照。如果书名是一样的,可能就会是这个读书以前已经阅读过,已经看过,这样读者就不用再去看了。同时,图书馆在为了给读者提供阅读书据报告的基础上,还会在系统当中进行设置,比如读者在一个月之前已经借阅过这本图书,当读者在第2次借阅的时候,系统就会自动的显示出这本图书读者已经借阅过一次或者两次。这种提示的方式也能够很好的提醒读者,这本图书读者曾经已经看过,读者是否还需要继续借阅它。如果读者想要再一次借阅再一次看的话,那么读者就可以点击“是”按钮,这样这本图书还会借阅到读者的借阅证当中。如果当读者借阅这本图书,在系统当中进行录入的时候系统提示出这本图书曾经自己已经借阅过一次,那么读者如果不想重复再阅读这本图书就可以点击“否”按钮,并且把这本图书归还给图书馆。这样就避免了读者重复借阅同一本图书。因为每一个读者的阅读喜好,阅读偏好是不同的,同时读者的阅读喜好和阅读偏好在一段时间内会相对稳定的。也就是说读者在一段时间内,他的阅读喜好和阅读需求大致不会改变的。因此,读者可能每次在查找图书借阅图书的时候,借阅的图书种类和内容都会大致相似或相同。这样很有可能就会出现,读者在一段时间内会重复的借阅一本图书,但是自己却不知道。因此,图书馆为读者提供个人阅读数据报告以及在系统当中设置,读者已经借阅过的图书的提示,都可以为读者提供一种提示,让读者知道自己现在借阅的这本图书曾经以前借过,并且可以由此判断是否还要继续再借阅一次这本图书。很多读者都表示这种方式能够很好的帮助读者,在借阅图书的时候进行挑选和筛选。因为,很多读者来到图书馆借阅纸质图书的时候,每次都会借阅很多本图书。这样就能够避免了读者多次来到图书馆去借阅和查找图书,也减少了读者再来到图书馆,以及在图书馆馆藏资源当中进行查找借阅所浪费的时间和精力。因此,很多读者每次都会借阅很多图书,但是由于时间限制和精力的限制,每次借阅图书的时候可能会借阅10本20本,但是每一本图书只是大致的翻阅一下,并不会每一本图书都仔细的看。因此,这样就很可能会出现读者这次借的图书和以前借阅的图书当中会有重复借阅图书的现象。这样不仅是浪费了图书馆馆藏资源图书的流通情况,让很多想要借阅这本图书的读者,因为这本图书已经被外借而无法正常借阅。同时,还影响了这个读者借阅图书的情况,因为这这本图书以前自己已经借阅了,这次还在借阅,不仅浪费了读者的时间和精力,还让读者想要借阅的需要的图书没有借阅到。

四、结束语

图书馆为读者进入到图书馆后,所有的行为信息进行收集,同时将这些信息数据进行整合分析后,能够从中了解某一读者群体或者某一读者的阅读倾向和行为规律,这样就能够了解哪一部分读者或者是哪一种类的读者,喜欢到哪一个借阅室借阅图书,并且借阅的图书种类和数量是什么情况。同时,还能够根据读者进入图书馆的个人行为信息来判断读者在图书馆范围内参与到图书馆的读者活动当中,以及大批量读者来到图书馆进行借阅的主要时间段。图书馆了解接待读者的高峰时间段后,就可以根据读者来到图书馆的数量和人数来安排和设置每一天的工作情况和对读者服务的方式。这样就能够为读者高峰时段来到众多读者所需要提供的服务模式,做好了提前的预警。这样可以在读者人数流量高的时间段内为读者提供更多图书馆工作人员的服务模式。而在读者人数相对来图书馆人数比较少的时候,就尽量减少图书馆工作人员的工作强度和工作量。这种提前预警的方式,可以帮助图书馆更好的调节每天的工作安排。这样就能够避免了在读者来到图书馆人数的高峰时间段内,图书馆工作人员由于人手安排的不够而导致为读者提供的服务不到位,不完善的情况。同时,也避免了当读者来到图书馆当中的人数由于人数过少,而图书馆工作人员安排的人数过多,而导致图书馆工作人员的工作出现额外的消耗和不必要的消耗的情况。因此,对读者行为数据的深度挖掘,可以更好的帮助图书馆开展日常的管理工作和读者服务工作,同时也能够更好的为读者提供服务。而对于读者而言,在大数据技术的挖掘和使用的过程当中,能够让图书馆更了解读者需求的需要,能够让读者更清楚自己的阅读行为和阅读的需要。这样图书馆在开展读者活动的时候,更加可以更加顺畅更完善,为读者提供的服务可以更加精准化和个性化。同时,让读者对于图书馆的服务模式更加满意,提升图书馆在读者心中的地位。

猜你喜欢
计算技术海量图书
新时期计算机网络云计算技术研究
班里有个图书角
值得孩子阅读的100种图书
计算机技术在通信中的应用研究
一个图形所蕴含的“海量”巧题
云计算及其在地理信息工程中的应用
从教材中突围,走课内海量阅读之路
粒子群算法在电力系统中的应用研究
Hadoop构建的银行海量数据存储系统研究
吃饭谁买单