数据视角下山东省公共图书馆区域差异性研究

2024-06-20 14:24陈可生王彬
河南图书馆学刊 2024年5期
关键词:主成分分析法区域差异

陈可生 王彬

摘 要:为进一步了解山东省公共图书馆总体发展情况,文章收集整理了2021年山东省各地公共图书馆的从业人员、总藏量、每百人藏量等指标,采用主成分分析法和聚类分析法将山东省各地公共图书馆划分为4类,以分析各类公共图书馆存在的差异,从而得出全省各地公共图书馆的发展状况。

关键词:山东省公共图书馆;主成分分析法;聚类分析法;发展不平衡;区域差异

中图分类号:G258.2 文献标识码:A 文章编号:1003-1588(2024)05-0005-04

为更好了解山东省公共图书馆总体发展情况,笔者以2021年山东省地市公共图书馆报送文化和旅游部的数据为依据,选取代表性指标,包括从业人员、图书总藏量、每百人藏量、主馆建筑面积、读者活动、累计借书证、分馆及其他流动服务点、指导县级图书馆数、年文献外借量等,利用SPSS软件,采用主成分分析法和聚类分析法,对各地市公共图书馆指标的总体情况进行量化分析,以揭示山东省公共图书馆的发展现状及区域差异。

1 相关研究概述

笔者在中国知网以“图书馆+差异”“图书馆+不平衡”“图书馆+不均衡”为关键词进行检索,按文献引用和下载进行排序分析后得到以下具有代表性的研究成果:郑京华对31个省、市、自治区的公共图书馆进行主成分分析和聚类分析,把公共图书馆划分为8个类型,认为我国公共图书馆发展存在较明显的区域差异性[1];叶华等对浙江省11个地市公共图书馆进行主成分分析和聚类分析,将浙江省公共图书馆分为4大类型区,发现浙江省公共图书馆同样存在发展不均衡问题[2];宋振玲等对我国公共图书馆藏书量在空间上的总体分布情况进行分析后发现,公共图书馆藏书量在南北、东西两个方向上的分布呈现明显差异,东西方向上呈单调递减分布,南北方向上呈倒U形分布,认为区域经济发展水平和财政投入是影响藏书量最大、最直接的原因[3];王婷等采用DEA-Malmquist指数模型对2010—2017年我国31省、市、自治区的省、市、县三级公共图书馆面板数据进行了分析,发现各级公共图书馆效率总体呈上升趋势,其中省级公共图书馆效率最高,县级次之,市级最低,东部和中部普遍存在投入规模不合理问题,西部则面临运营管理落后的困境[4]。上述全国性公共图书馆研究及区域性公共图书馆研究对于了解公共图书馆的发展状况具有一定的借鉴意义。为更好了解山东省公共图书馆的总体发展情况,笔者选取山东省16家公共图书馆的相关指标,采用主成分分析法和聚类分析法对不同区域公共图书馆的发展情况进行研究,以期通过数据化方式呈现全省公共图书馆发展存在的差异。

2 研究方法

2.1 主成分分析法

主成分分析法(Principal Component Analysis,PCA)是在统计学和数据分析中常用的降维统计方法。PCA是将数据点投影到一个超平面,选取方差尽可能大、相互正交且互不相关的特征作为数据点的主成分,使数据点在超平面上的投影尽可能分开。该分析法的优势是通过PCA映射得到若干主成分特征,既能消除冗余数据又能最大限度地保留原始数据信息[5]。

2.2 聚类分析法

聚类分析法是一种进行区域差异分析和划分类型的数学方法,目的是把分类对象按照一定规则分成组或类,这些组或类不是事先给定或以经济确定的,而是根据数据特征而定的。

3 指标选取

本研究以2021年山东省各地市公共图书馆报送文化和旅游部的数据为依据,选取其中反映图书馆事业发展的9项代表性指标,通过这9项指标反映公共图书馆的空间、基础服务、拓展服务等内容,详见表1。

4 主成分分析和聚类分析

4.1 主成分分析

4.1.1 适用性检验。笔者采用社会科学统计软件(SPSS)对本次研究数据进行主成分分析,显示KMO为0.782,大于0.6;数据通过球形度检验,p<0.05,满足因子分析的前提要求,说明数据可用于主成分分析研究。因子分析共提取了2个因子,特征根值均大于1,前两个主成分解释了全部方差的73.279%,说明提取的两个主成分能够代表原来所有信息的73.279%,详见表2。提取主成分对于评价公共图书馆发展情况具有一定作用,本研究提取的两个主成分分别为Y1、Y2。

4.1.2 计算主成分系数。对表2的主成分分析模块运行结果进行分析,计算得到Y1、Y2的线性组合:Y1=0.41*从业人员+0.42*总藏量+0.31*每百人藏量+0.27*主馆建筑面积+0.34*读者活动+0.35*累计借书证+0.30*分馆及其他流动服务点+0.16*指导县级图书馆数量+0.37*年文献外借量。Y2=0.06*从业人员+0.01*总藏量-0.27*每百人藏量-0.13*主馆建筑面积+0.02*读者活动+0.11*累计借书证-0.04*分馆及其他流动服务点+0.38*指导县级图书馆数量。由此可知,主成分Y1是从业人员数量、总藏量、主馆建筑面积、举办活动、借书证、每百人藏量、年文献外借量等指标的综合反映,主成分Y2则是指导县级图书馆数量这一指标的单一反映,两个指标能够较好地反映山东省公共图书馆的发展状况。

4.1.3 主成分得分和综合得分。笔者根据主成分方程计算主成分得分,以各主成分方差贡献率占比为权重计算综合得分,结果显示,济南市图书馆、青岛市图书馆的主成分Y1、Y2得分和综合得分居于前列,而德州市图书馆、聊城市图书馆、滨州市图书馆的综合得分和主成分Y1得分较低。从因子分析得到的各因子得分和综合得分看,综合得分受主成分Y1得分的影响较大,说明主成分Y1对各地市公共图书馆的发展影响较大。从得分情况看,济南市图书馆无论是基础建设(馆舍面积、每百人藏量等)还是服务状况(读者活动等)都较好,在全省公共图书馆中处于领先地位;德州市图书馆、聊城市图书馆、滨州市图书馆的主成分Y1得分较低,亟须增加藏书量和活动举办次数,以吸引公众走进图书馆。

4.2 聚类分析

笔者将因子分析的结果进行系统聚类分析,区间测度采用平方欧式距离,根据聚类分析谱系图将图书馆分为4类,详见表3。

4.2.1 第一类:济南市图书馆和青岛市图书馆。济南市图书馆和青岛市图书馆作为两个副省级公共图书馆,各项指标均比较突出,尤其是济南市图书馆,无论是主馆建筑面积,还是从业人员数量、总藏量、举办活动次数、分馆数量以及年文献外借数量均处于全省领先地位。青岛市图书馆的累计借书证、从业人员数量、总藏量以及读者活动数量等也居山东省公共图书馆前列。

4.2.2 第二类:威海市图书馆、东营市图书馆、日照市图书馆、淄博市图书馆。相较于第一类图书馆,第二类图书馆除主馆建筑面积和每百人藏量外,其他方面都存在一定差距,特别是总藏量和累计借书证,第二类图书馆的总藏量平均值为114.6万册,与第一类的375.47万册差了3倍;累计借书证平均值为10.66万个,与第一类42.38万个的平均值相比差了近4倍。需注意的是,第二类中累计借书证数量最多的是东营市图书馆(14万个)、数量最少的是威海市图书馆(8.9万个),可见即便是处于同一类的图书馆其差距也是相当大的。

4.2.3 第三类:济宁市图书馆、烟台图书馆、临沂市图书馆、潍坊市图书馆。第三类图书馆与第二类图书馆相比差距不大,甚至在年文献外借量、累计借书证等方面略有超出。第三类与第二类的主要区分指标是每百人藏量,据《山东统计年鉴2020》数据显示,临沂、潍坊、济宁、烟台位于山东省各地市2019年年末总人口数的前几位[6],可见其每百人藏量低是由于人口基数大造成的,仅为第二类的34%,因而将其归为第三类。

4.2.4 第四类:滨州市图书馆、菏泽市图书馆、泰安市图书馆、聊城市图书馆、枣庄市图书馆、德州市图书馆。第四类图书馆的各项指标数据都比较低,其总藏量、读者活动、累计借书证分别为第一类的15%、19%、18%,差距极大,其他指标数据也都在第一类的23%~36%之间,可见第四类图书馆在山东省各地市公共图书馆中的发展相对较弱。

4.2.5 结论。第一类图书馆综合实力最强,在山东省公共图书馆事业发展中具有标杆示范作用;第三类图书馆发展情况与第二类图书馆总体差别不大,但人均方面存在巨大差异,应以公平性、普惠性、便利性服务为标准促进图书馆事业发展;第四类图书馆在各方面都比较薄弱,应继续完善基础设施建设,提升基本服务能力。

5 结语

本次调查显示,山东省各地市公共图书馆发展差异明显,亟须均衡发展,提高服务效能。全省公共图书馆要适应高质量发展要求,将图书馆建设成为滋养民族心灵、培育文化自信的重要场所,争取政府财政支持,保障建设资金和文献资源稳步增长,通过开展更多高质量的阅读活动汇聚读者,扩大服务覆盖面,逐步缩小区域间图书馆发展差异,推动图书馆事业健康持续发展。

参考文献:

[1] 郑京华.我国公共图书馆发展的区域差异分析[J].图书馆杂志,2006(5):36-40,43.

[2] 叶华,陈修颖.浙江省公共图书馆发展的区域差异分析[J].图书馆理论与实践,2009(1):94-96.

[3] 宋振玲,杨奎奇.全国公共图书馆藏书量区域差异与成因分析[J].图书馆学刊,2013(1):10-13,17.

[4] 王婷,李少惠.我国公共图书馆效率的层级差异及其动因分析[J].国家图书馆学刊,2020(5):11-20.

[5] 刘敬浩,孙晓伟,金杰.基于主成分分析和循环神经网络的入侵检测模型[J].中文信息学报,2020(10):105-112.

[6] 山东统计年鉴2020[EB/OL].[2022-12-13].http://tjj.shandong.gov.cn/tjnj/nj2020/zk/indexch.htm.

猜你喜欢
主成分分析法区域差异
区域差异的就业质量评价指标体系的构建与应用
我国城乡居民财产分配现状及区域差异研究
商贸流通业对经济发展贡献的区域差异分析
山东省旅游产业竞争力评价研究
中国装备制造业阶段竞争力研究
陕西省各地区人力资本水平综合评价与分析
基于主成分分析的煤层气赋存影响因素分析
我国工业资本配置效率的空间异质性分析研究综述
基于主成分分析法的高校财务风险评价指标体系构建
城镇化、商业化与农村金融