冉 娜
(北京科技大学图书馆 北京 100083)
知识、信息在人类社会中存在多种传播交流方式。随着信息技术的不断发展改变,信息的传播来源、传播技术导致信息获得的差距加大,甚至影响社会权力的分散等问题[1]。
图书馆是一个满足公众知识、信息和文件需求的组织机构[2],并提供参考和信息服务[3],是知识传播的主要机构。知识传播、信息服务的效果直接影响着区域的教育水平和经济绩效[4]。对知识传播行为及其效果的科学研究除了对组织、地区和国家的可持续经济发展有重要意义外,还对我们生活的方方面面都可能有影响。它是涉及社会学、经济学、数学、物理学、计算机科学与人类学等学科的多学科融合研究。但是,影响知识传播和信息服务效果的因素难以直接衡量[5]。
由于知识传播的主要载体是科技期刊,目前在知识传播的影响力评价体系中,科技期刊的发文数量和影响因子依然是主要评价标准[6],由于这一评价标准过于强调发文数量,使得一些研究人员投机发表大量论文,同时,对期刊影响因子过分强调传播载体,忽视了传播主体,也忽视了传播主体的服务行为对知识传播的影响,使得一些“掠夺性”期刊激增。强调发文数量和影响因子的标准对于图书馆的信息服务这一主体因素鲜有提及。这就反映了在科学评价中的各影响因素间的严重不对称性[7],现有的评价体系亟待进一步发展。
创立于1999年的亨氏美国公共图书馆评级系统HAPLR是目前国际上比较通用的对图书馆进行评级的系统,HAPLR由威斯康星大学密尔沃基分校的Hennen Jr研发。HAPLR评级系统通过对图书馆投入指标(人均支出,总预算中资料支出比例,人均资料支出,每千人全日制员工人数,每千人期刊种数和人均藏书量)和产出指标(单次流通成本,人均到访次数,馆藏流通率,全员制员工每小时流通量,人均流通率,人均参考咨询量,每小时流通量,每小时访问人次和每次访问流通率)一共15项指标数据的计算和分析,来评价图书馆服务[8]。
目前国内学者对图书馆的知识传播影响力评价主要借鉴美国HAPLR评级系统,如李丹对美国的亨氏美国公共图书馆评估HAPLR系统和美国星级图书馆评价系统LJ指数两大图书馆评级体系进行了详细介绍和对比分析[9];吴正荆等人应用HAPLR系统对我国31个省级公共图书馆进行了等级排名,并分析了该系统应用于我国图书馆评价中的局限与不足[10];韩靖对HAPLR系统在我国图书馆的应用也做了分析[11];李建霞运用DEA方法对HAPLR系统进行了本土化改造[12];胡雪环、曾建勋对中美公共图书馆评估定级实践进行对比分析[13]。以目标为导向对服务主体的服务效果做出评价的研究少有刊发报道。然而,HAPLR系统指标相对零散,和图书馆要达成的目标相关性不足,难以对图书馆的知识传播影响力的效果进行评价,也难以根据它的评级来对图书馆的发展给出针对建议和方案。从长远来看,评价和晋级不是图书馆存在和发展的目的,图书馆的使命在于“传承文明,服务社会”[14]。为大众服务,提供终身学习的场所,提高国民的文化素质;为社会服务,提供知识信息传承与服务,为经济发展和社会进步提供知识的阶梯。
因此,为了对图书馆的知识传播影响力进行综合研究,本研究在前人经验基础上,以目标导向为视角,以国内一所公共图书馆为例,通过相关性分析、主成分分析、线性回归分析对图书馆服务的各项指标进行评级,以此得到影响图书馆知识传播影响力的关键因子,为图书馆知识传播影响力评价提供参考。
知识传播最常用的研究方法是调查研究法、内容分析法、实验设计法和个案研究法[15]。在以往的研究中,对图书馆知识传播影响力的评价主要采用定性和定量相结合的方法,并以此结果为依据对图书馆进行评级。最有名的是HAPLR使用的数据来源于美国国家教育统计中心联邦与州联合服务机构公布的全国公共图书馆调查统计数据,2005年以后,由于该项工作改由美国博物馆与图书馆服务署承担,HAPLR改由IMLS 获取数据。为确保相同量级的图书馆之间具有可比性,HAPLR按照服务人口规模对图书馆进行了分组。通过对6项图书馆投入指标和9项产出指标及计算权重数据的计算和分析(如表1所示),经过加权求和等一系列计算过程得到相同量级规模的不同图书馆服务表现的比较排名。
表1 HAPLR 指标及其权重设置
这种定量分析方法只是对图书馆提供的服务进行了量化指标分析,并未对图书馆服务的目标即图书馆的知识传播的影响力做定量或定性研究,未对输入性指标和目标特性之间的相关性进行研究。作为知识传播的主体,图书馆的知识传播影响力是值得研究的。
本研究主要采用定量方法,通过基于目标导向的个案分析来探讨如何进行知识传播影响力评价。目标导向的评价方法具有客观性,要求参与评价的内容与目标之间存在必然相关性。本研究将这些知识传播的具体效果作为目标特性(类似产出指标),将图书馆的各类信息服务作为输入特性(类似投入指标),建构一种新型的目标导向视角下的图书馆知识传播影响力评价体系模型(见图1)。
图1 目标导向视角下图书馆知识传播影响力评价模型构建过程
这种评价方法的独特优点在于:由于知识传播的效果是复杂的,要想得到一个完美的评价指标体系是及其困难的,但是针对知识传播的某一具体效果展开评价,相当于将复杂的效果简化为一个效果,更容易得到一个较好的评价体系,且更容易看到不同的信息方式对不同目标的影响以及这些影响的量化和差异。此外可以在完善单目标导向的评价体系后,发展多目标导向的评价体系。
研究以中国国家统计局(http://data.stats.gov.cn)公布的2011年到2018年浙江省地区生产总值、劳动者报酬、居民人均可支配收入分别作为目标数据,以相应年份的浙江省公共图书馆的相关服务作为输入数据,以浙江省人口、投入教育经费作为对比输入数据。表2给出了目标数据(浙江省地区生产总值、劳动者报酬,居民人均可支配收入)和输入数据(年末常住人口,教育经费,图书馆相关服务)。
第一步:相关性分析。由于评价体系是目标导向的,对输入指标和目标数据之间的相关性研究是本研究需要做的第一步工作。本文采用Pearson相关系数来衡量输入数据和目标数据之间的相关性,其计算公式为式(1)。
表2 目标数据和输入数据的年度统计
上式中n为变量的数据总数,x和y为变量对应的值。相关系数大于0表明是正相关,小于0表明是负相关,等于0表明是无关,等于1表明是完全相关。
第二步:主成分分析。由于信息服务输入特性指标存在多个变量,而这些变量之间是很可能存在共性相关。但变量的选取又不能将这种相关的变量只保留一个,因为变量减少必然会损失很多重要信息,从而导致错误的结论。此外如果我们分别分析这一些相关的变量,那么结果必然是单独的,因此没有办法实现综合评价和对输入变量之间进行比较。而主成分分析正是解决变量之间存在的共性后展开探索性数据分析和建立预测模型的工具。
主成分分析主要存在两个计算步骤:第一,计算原始数据的数据协方差(或相关)矩阵;第二,对协方差矩阵进行特征值分解。定义点到直线的平均平方距离最小的直线为“最佳拟合”。依次计算多维中的每维的最佳拟合,这些最佳拟合直线是正交的,这意味新得到的数据是不相关的。这些基向量就被称为主成分,其计算过程就被称为主成分分析。
显然,用主成分分析方法来研究目标导向视角下的信息服务评价体系有利于解决输入数据中存在的共性或相关性,从而更好地理解输入特性的效果。与此同时,由于不同数据的计量单位不一样,需要在进行主成分分析之前,将不同输入指标调整到一个名义上通用的标度。本研究在进行主成分分析之前采用z-scores方法对输入数据进行标准化,从每个输入指标的数据值中减去其变量的测量平均值,同时让方差等于1,即让每个输入指标的数据平均值居中。
第三步:线性回归分析。既然目标数据和特性指标数据是关联的,经过主成分分析处理原始数据后得到的主成分与目标数据也必然相关。由于线性回归分析是分析因变量和自变量之间依存变化的数量关系的统计方法,因此多元线性回归被用来分析主成分和目标特性数据之间的线性关联。
在上述三个计算过程中,都将根据计算得到的P值或sig值进行显著性检验。P值或sig值是将观察结果认为有效即具有总体代表性的犯错概率,如0.05的P值或sig值表示观察结果的有效有5%的可能是偶然造成的。同时0.05的P值或sig值是通用研究中可接受错误的最大水平。
在采用0.05的P值或sig值为可接受错误的最大水平的情况下,从表3可以清楚得到如下结论:第一,公共图书馆累计发放有效借书证数和公共图书馆计算机台数与地区生产总值不存在显著的线性相关(因为其显著因子大于0.05);第二,公共图书馆累计发放有效借书证数、公共图书馆举办培训班数、公共图书馆参加培训人次和公共图书馆计算机台数与劳动者报酬之间不存在显著的线性相关;第三,公共图书馆累计发放有效借书证数、公共图书馆书刊文献外借人次、公共图书馆参加讲座人次和公共图书馆计算机台数与居民人均可支配收入之间不存在显著的线性相关。根据表3的结果,以上各种因素在下面的主成分分析中会分别被剔除。
表4给出原始数据归一化后,在不同的因变量(地区生产总值、劳动报酬和居民人均可支配收入)下特征值、方差和累积方差的计算结果。从表4可以清楚看出,第一主成分可以分别结束因变量为地区生产总值、劳动报酬和居民人均可支配收入的88.1%、95.5%和87.7%的变化量。由此可以明确因变量的变化主要受第一主成分影响。根据表4,可以清楚看见特征值大于1的成分已经解释了总方差的绝大部分的变化。因此我们只需要考虑那些特征值大于1的成分。
表5给出了成分得分系数矩阵。需要注意的是,因子得分实际上是表示偏离均值程度的一个相对值(正值说明超过平均水平,负值说明低于平均水平)。因子得分可以比较各因子对目标的贡献,作为目标导向下各因子的排名依据。在此基础上可以发展出类评价方法。第一直接比较信息服务各项内容的成分得分系数。地区生产总值导向的第一主成分的成分得分系数从高到低的排名如下:每万人拥有公共图书馆建筑面积,公共图书馆举办展览数,公共图书馆阅览室座席数,人均拥有公共图书馆藏量,公共图书馆电子阅览室终端数,公共图书馆参加讲座人次,公共图书馆书刊文献外借册次,公共图书馆书刊文献外借人次,公共图书馆参观展览人次,公共图书馆总流通人次,公共图书馆组织各类讲座次数,公共图书馆举办培训班数,公共图书馆参加培训人次。劳动者报酬导向的第一主成分的成分得分系数从高到低的排名如下:人均拥有公共图书馆藏量,公共图书馆书刊文献外借册次,公共图书馆电子阅览室终端数,公共图书馆总流通人次,公共图书馆阅览室座席数,公共图书馆举办展览数,公共图书馆书刊文献外借人次,每万人拥有公共图书馆建筑面积,公共图书馆参观展览人次,公共图书馆组织各类讲座次数,公共图书馆参加讲座人次。居民人均可支配收入导向的第一主成分的成分得分系数从高到低的排名如下:每万人拥有公共图书馆建筑面积,公共图书馆举办展览数,公共图书馆阅览室座席数,公共图书馆电子阅览室终端数,人均拥有公共图书馆藏量,公共图书馆书刊文献外借册次,公共图书馆总流通人次,公共图书馆参观展览人次,公共图书馆参加讲座人次,公共图书馆举办培训班数,公共图书馆参加培训人次。上述结果显示各类信息服务方式对不同目标的影响是不一样的。这种结果显然是合理的,这正如前言中提到信息传播的复杂性。上述结果暗示这种评价方式可能是更客观的一种方式。第二种方法就是,将人口或者教育经费作为参照,我们可以将其定为100分,然后以此为参照,对多目标进行打分,然后加权平均(满分为100分)。以教育经费为参照的三目标导向的第一主成分的成分综合得分从高到低的排名如下:每万人拥有公共图书馆建筑面积,公共图书馆举办展览数,公共图书馆阅览室座席数,公共图书馆电子阅览室终端数,人均拥有公共图书馆藏量,公共图书馆书刊文献外借册次,公共图书馆参加讲座人次,公共图书馆参观展览人次,公共图书馆总流通人次,公共图书馆书刊文献外借人次,公共图书馆组织各类讲座次数,公共图书馆举办培训班数,公共图书馆参加培训人次。
表3 目标数据和输入数据的年度数据之间的Pearson 相关系数r 和显著因子sig.表
表4 总方差解释
通过数据挖掘,在相关性的基础上利用主成分分析方法具体分析和比较了以浙江省公共图书馆的相关服务作为输入数据,以地区生产总值、劳动报酬和居民人均可支配收入为目标数据的知识传播影响力,并在单目标下和多目标下对浙江省公共图书馆的相关服务进行了排名。
研究结果表明:在单目标导向的知识传播影响力评价体系中,地区生产总值目标导向下每万人拥有公共图书馆建筑面积的评分最高,也即是说,每万人拥有公共图书馆建筑面积越高,知识传播影响力越大,对地区生产总值的贡献越大;劳动者报酬目标导向下人均拥有公共图书馆藏量的评分最高,也即是说,人均拥有公共图书馆藏量越高,知识传播影响力越大,劳动者报酬越高;人均平均可支配收入目标导向下每万人拥有公共图书馆建筑面积的评分最高,也即是说,每万人拥有公共图书馆建筑面积越高,知识传播影响力越大,人均可支配收入越高。作为个例研究对象,图书馆为了增加知识传播的影响力,必须要增加图书馆面积和藏书量。而增加图书馆面积和藏书量方面评分最高的定性也正符合人们学习知识需要更多的场所和更多的书籍的需要。
在多目标导向的知识传播影响力评价体系中,以教育经费为参照的地区生产总值、劳动者报酬和居民人均可支配收入三目标导向加权评分情况下,每万人拥有公共图书馆建筑面积的评分最高,也即是说,每万人拥有公共图书馆建筑面积越高,地区生产总值、劳动者报酬和居民人均可支配收入的总体加权效益也就越高。
研究结果表明了目标导向视角下知识传播影响力评价的多因素复杂性,而知识传播恰恰是以提高教育水平和促进经济发展为目标的。知识传播影响力的评价体系中,除了有传播载体的影响外,还应当加入图书馆这一传播主体。通过个案研究发现,目标导向分析法对于丰富知识传播影响力的评价体系是完全可行且必须的,它可以不受主观因素影响,在客观的基础上定量研究和评价知识传播影响力,给未来的更合理的评价体系的建立提供一种新思路。
表5 成分得分系数矩阵和以教育经费为参照的三目标综合得分
然而,本文研究所采用的数据有限,文中构建的模型分析得到的结果可能会存在一定的误差。这个目标导向的知识传播影响力评价方法是我们期望的一个例子,是未来展开新的评价方法的一种尝试,在未来研究中,笔者会进一步扩大数据源,尽量克服受限,对图书馆的知识传播影响力评价做进一步研究。