大数据在图书馆服务提升与优化中的应用

2020-11-11 06:01张永宁徐晨辰
江苏科技信息 2020年27期
关键词:资料高血压图书馆

张永宁,徐晨辰

(南京中医药大学图书馆,江苏南京 210023)

1 大数据的特点

大数据是指数据量巨大以至于无法用传统数据处理方式进行处理的数据,大数据的技术路线包括了数据的获取、分析、搜索、分享、存储、转移、可视化、查询、更新以及信息的私密性等方面[1]。随着信息产业的突飞猛进,大数据具有非常多的优点,按照目前大数据技术的发展趋势,大数据的获取方式相比较传统数据具备以下特点。

1.1 大样本性

大数据最明显的特质就是数据量巨大,不再是传统的以书面材料为记录方式,而是以计算机存储为基本方式的机读方式来存储,数据量都是以TB 为存储单位来进行的,可以说数据量的大样本性就是大数据最为明显的优势,数据量越大,潜在的实际意义也越大。

1.2 多样性

大数据的样本已经不仅仅是传统的文字资料,变化为多样性,譬如音频资料、视频资料以及各种图谱资料。很多大数据是由专门的设备以及软件产生的,譬如浏览器、微信、科研设备等。对于多样性的资料,可以为不同的专业人士提供非常有意义的指导和建议。

1.3 快速性

大数据时代获取资料数据的速度非常迅速,达到了实时获取资料的速度,可以更好地反映事物变化的规律和潜在的发展趋势,譬如现在的医疗APP可以实时获取患者的心率、血压等数据,使医生可以及时获得患者健康信息,为诊疗提供了有效的依据。

1.4 真实性

相比较传统的数据获取方式和分析手段,大数据具有真实性的特点。大数据不再是数据收集者有目的地去采取数据,而是直接无差别地去获得所有的数据,这些数据无差异的采集可以更加真实地反映事物变化的规律,而且在后期进行数据处理分析时,也可以更加有效地分析出事物变化的真实趋势,这种数据的分析处理方式比传统用少量样本通过统计分析其变化规律更加实际。

1.5 变化性

数据的获得具有变化的特点,传统的数据处理方式不能很好地反映出数据的变化特点。譬如科研的过程中,为了研究不同药物和治疗方式对患者的治疗效果,只能采取不同时间点检测患者血液等方式来大致分析患者的病情变化趋势,这样的传统实验过程使得很多快速变化的病情无法被观察到,而且还会因此得到相反的结论。事物的发展都是处于一个动态的变化过程,所以大数据的出现有效地改变了这一现状,大数据因为几乎毫无差别地实时记录了所有的数据,所以通过有效地分析大数据可以看到事物变化的全过程,为决策者做出决定提供了非常有意义的指导[2]。

2 大数据对图书馆服务的影响

大数据时代图书馆不能再局限于单纯地提供学习环境和简单地提供学习资料,而是要通过利用大数据的优势转化为以信息服务和定制个性化学习方式为主导的新型图书馆服务为主,同时图书馆也需要开始向数字化图书馆转型,大数据对图书馆的影响有以下几点。

2.1 提升学科的相关性研究

大数据的一个优势就是把原本“风马牛不相及”的东西联系到了一起,一个明显的例子就是沃尔玛早期的啤酒和尿不湿的故事,在当今社会中这样的案例比比皆是。笔者在医学院校的图书馆工作,大数据信息在医学领域的应用更为广泛,譬如在早年的研究中很多疾病都是单纯以一个疾病来进行研究的,但是在大数据的指引下,通过数据分析发现了很多疾病和环境、心理等因素有着明显的相关性。大数据不仅在科学研究中起到了很大的作用,也给予了图书馆信息情报服务很大的启发,可以一方面将相关的信息资料结合到一起,方便科研人员进行相关性分析,为今后的科研和临床事业提供很好的指导建议,还能将不同的学科书籍和资料在整理摆放的过程中集合到一起,方便查找,建立一个彼此相关的专业数据库。

2.2 加快图书馆的数字化进程

早年的图书馆都是以纸质书籍为主,但是在大数据时代的影响下,单纯的纸质材料不仅难以整理和维护,也很难进行查找和编辑。以往为了一个简单的问题可能需要在图书馆花费很长时间去检索,这个过程还需要进行非常专业的训练才能胜任,大数据的一个特性就是把信息完全转化为机读化数据,这样大大地简化了整理编辑的过程,对于用户查找传输资料也极为方便。所以图书馆在服务过程中的数字化非常重要,通过建立图书馆的大数据库,可以便捷地满足用户的学习要求,还能简化图书馆管理人员的工作,降低了维护成本[3]。

2.3 提升信息咨询服务

传统的图书馆信息咨询服务往往是为读者提供具体书籍的位置和馆藏情况,但书籍的具体内容无法展现。随着社会进步,人们的生活节奏加快,时间也开始变得碎片化,很难有大把的时间花在寻找资料的过程中,但是单纯的网络检索,因为涉及版权和专业检索技术等限制,很多资料不能直接在网络上简单获取,所以这个方面将会是大数据时代下图书馆服务的一个重要的内容[4]。图书馆通过前面的数据化和交叉学科等工作,可以很便捷地把相关数据进行汇总,方便用户的咨询。比如现在中国进入了老龄化社会,老年人有着足够的时间和财力进行图书馆学习,其中老年人比较关心的往往是健康问题,如果可以将老年人比较关心的常见疾病相关资料数据汇总,就可以便于老年人学习,同时也可以给予老年人一定的健康意见。这方面的咨询服务也同样适用于专业的科研人员和在读大学生,通过不断积累图书馆咨询服务的大数据库,还可以为社会发现更多的新理论、新问题。随着图书馆大数据咨询服务的提升和强化,图书馆的地位将更加重要。

2.4 定制个性化学习方案

每个人的学习方式和学习曲线不同,加上时间精力工作等差异,单纯的“一刀切”式的教育学习模式已经不能满足当代读者的要求。早年的图书馆都是简单地摆上统一的报纸、杂志和书籍,读者被动地选择自己感兴趣的资料进行学习,在大数据时代下,读者的地位由被动转为主动,读者可以自由地选择自己感兴趣的资料进行学习[5],这也是很多图书馆读者大量流失的主要原因。图书馆如果通过读者的借阅和分享资料的大数据分析,便可以有效地分析出读者的学习兴趣和学习进程,可以更好地通过大数据来为读者提供更加适合读者的学习资料和书籍推荐,使得读者能够更加科学有序地进行学习。这也是目前很多商业机构分析用户消费习惯大数据的主要原因,这里面涉及部分读者隐私权的内容,不在本文的讨论范围之内。

3 大数据对图书馆信息服务的案例讨论

作者通过目前免费的大数据分析工具进行了对于疾病相关的大数据分析,旨在为医学图书馆的相关科研教学服务提供一定的参考。本文主要通过使用在线大数据分析工具Wolfram Alpha®(http://www.wolframalpha.com)和免费的商业大数据分析软件Tableau Public®对高血压的相关资料进行大数据分析,其中软件分析的数据资料源于美国政府数据开放门户网站Data.Gov。

在大数据网站WolframAlpha®录入关键词:高血压(hypertension),通过对大数据的计算,可以得到非常详尽的分析数据。其中不仅是常见的高血压病因病机,还有很多不曾被关注的信息,譬如表1 所示的高血压和医保的关系,不同疾病并发高血压的概率(见表2),以及不同身体条件状况对于高血压发病的影响(见图1)。大数据分析不仅可以在高血压疾病的相关咨询预防等资料上进行交叉汇总,还能对相关研究给予一定的信息支持。笔者还通过搜寻美国政府开放数据库的方式,检索并汇总了美国2005—2014年不同地区高血压并发眼病的患者发病率的大数据资料(见图2),通过这些医学相关的大数据分析,可以分析出不同地区、不同社会条件甚至不同性别的人患有高血压以及并发相关疾病的概率。这些大数据非常重要,因为医学图书馆的服务对象主要是医学学生和医学科研人员,这些数据一方面便于图书馆在工作中主动地将相关资料整理汇总到一起,方便读者阅读和查找,另一方面也可以为读者提供相关科研建议。

4 结语

大数据时代的到来是大势所趋,传统的图书馆工作受到了巨大的挑战,但是也为图书馆情报事业的发展带来了巨大的机遇,即向服务咨询方向转型的良好时机。大数据时代的图书馆将会改变以往被动服务的局面,转而在信息搜集和传播过程中得到更加积极主动的地位,通过大数据的支持,一个小小的图书馆将会焕发新的生机。

表1 高血压和医保的关系

表2 不同疾病并发高血压的概率

图1 不同身体条件对于高血压发病的影响

图2 美国2005—2014年不同地区高血压并发眼病的患者发病率

猜你喜欢
资料高血压图书馆
全国高血压日
Party Time
PAIRS & TWOS
JUST A THOUGHT
如何把高血压“吃”回去?
高血压,并非一降了之
图书馆
去图书馆
中医干预治疗高血压49例
资料哪去了/等