基于大数据的高校图书馆阅读推送服务创新研究

2023-01-14 09:00刘方荣童星玉何斌颖
云南经济管理学院学报 2022年4期
关键词:可视化书籍图书

刘方荣,童星玉,何斌颖

(云南经济管理学院,云南·昆明 650106)

随着大数据技术的快速发展,给人们的阅读方式带来了巨大改变,主动推送的阅读书籍不仅与读者的阅读兴趣吻合,而且极大的使图书馆的图书资源得到有效利用。基于大数据的精准推送服务一方面可以方便读者的生活,使读者可以不受地域和时间的限制便能获取到符合自己心仪的阅读书籍;另一方面,可以使读者节约大量的时间和精力以便获取到更多的知识和智慧。

一、绪论

(一)研究背景与现状

高校图书馆是一个庞大的“信息数据源”。数以百万计的馆藏能否为读者充分利用是目前高校较为关注的问题之一,随着大数据技术的快速发展和成熟,对海量数据的存储和分析已不再是难题,但是大数据技术在商业、交通以及旅游行业应用较多,对高校高校图书馆综合应用方面却不多,为此,将这一技术与图书馆阅读推送服务服务进行融合发展,不经能够发挥大数据在教育行业的价值,同时也能够让静态放置的书籍知识活跃起来。

(二)研究意义

随着大数据技术的快速发展,人们的阅读方式和阅读习惯发生着巨大改变,从传统的主动寻找自己喜好的书籍阅读到大数据主动推送服务模式的转变,由此可见,大数据阅读推送服务可以基节约读者寻找书籍的时间,更多的把时间运用在知识阅读上,同时,能够更高效的匹配到读者感兴趣的书籍,提高读者的阅读兴趣,从而能够更好的协助高校图书馆的发展,促进教育的发展,提高读者的社会认知和理论水平。

(三)服务创新

基于大数据技术的高校图书馆阅读推送服务主要利用大数据技术实现实现热门书籍的实时推送、图书馆藏及图书借阅情况等进行可视化展示,在图书阅读推广过程中,使用大数据技术快速地获取和分析读者的信息,进而准确了解读者的需求和阅读规律,然后对读者进行分类,并对不同的读者推送不同的内容,例如低年级学生推送英语四六级书籍,而高年级学生则可推荐就业相关或者考研考公等书籍。

二、理论研究

(一)相关大数据数据技术介绍

HADOOP 集群:Hadoop 是一个分布式计算平台。主要解决海量数据的存储和分析计算的问题。Hadoop由分布式文件系统HDFS、MapReduce和Yarn 组成,为用户提供了系统底层细节透明的分布式基础架构。

Hive:基于Hadoop 的一个数据仓库工具,能够将结构化的数据文件映射为一张表,并提供类SQL 查询功能。

Hbase:Hbase是一种分布式、可扩展和支持海量数据存储的NoSQL数据库。

spark:大数据处理集群计算框架,与hadoop紧密集成,能够运行在Yarn 上,Spark 项目包括用于处理的MLIib、GraphX、Spark Streamimg 和Spark SQL等模块。

大数据可视化:借助图形化手段,清晰有效的将数据中所蕴含的有价值信息展示出来,为决策者提供依据和帮助。

(二)大数据阅读推送流程

数据获取:首先获取图书馆的书籍数据、图书借阅与归还数据、各二级学院图书借阅情况等数据;

数据清洗:与读者个性化智慧服务决策相关性较大的诸如读者个体特征、阅读历史行为、阅读实时兴趣、个体移动路径、阅读终端模式、读者服务评价与满意度反馈、系统未来服务资源总量与服务负载等数据,才能在较小大数据清洗成本投入和降低清洗复杂度的前提下,大幅度提升图书馆大数据的价值密度与数据可用性。

数据存储:将清洗后的数据存储在HDFS 上,待数据分析时使用。

数据分析:使用Spaek SQL 或者Hive 分析函数等对数据进行分析处理。

数据可视化:有针对性的对目标数据进行可视化展示,可视化工具选择Echarts、FineBI等。

三、图书馆阅读推送服务开展

推送内容:基于高校发展需要,集合大数据分析结果,将热门书籍,借阅量排名靠前、专业书籍、新书等有针对性的推送给校园读者,任课教师主要推送所任课程书籍,高年级学生推送考研、考公等考试数书籍,低年级学生推送专业课、英语四六级、计算机等书籍。

四、图书馆数据可视化

可视化的内容:立足于云南经过管理学院图书馆,根据图书馆的馆藏资源,借阅数据等数据,采用开源软件FineBI 进行设计和制作,可视化内容由:log、标题、时间、4 个标签卡(图书总量/借阅量、今日借书/今日还书、本月借书/本月还书、本学期借书/本学期还书)、图书借还统计、学院借阅排行、图书大类借阅排行、专业借阅排行、图书馆藏可视化、借还率、新书推荐、图书借阅排行和读者借阅排行组成,充分利用高校图书馆的数据资源,借助图形可视化的手段,有效地分析图书馆各方面数据变化情况进行可视化的呈现以达到更好的进行图书馆的管理和优化师生的用户体验,从而促进大数据技术与图书馆综合事宜的融合发展。

可视化效果

五、结论与展望

高校图书馆阅读推送服务是在现有基础上融合了大数据等先进技术,是高校图书馆新的发展方向和趋势,在读者阅读服务及体验方面能够带来全新的满足感和体验感。基于大数据技术的高校图书馆阅读推送服务需要满足读者的个性化和主动性服务需求,但同时要解决大数据环境下图书馆数字资源海量丰富特性带来的挑战。

猜你喜欢
可视化书籍图书
鲁迅与“书籍代购”
基于CiteSpace的足三里穴研究可视化分析
中国书籍享誉海外
Chinese books find an audience overseas中国书籍享誉海外
思维可视化
图书推荐
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
欢迎来到图书借阅角
曹文轩主编的书籍