卢文辉 高仪婷
(南京大学信息管理学院,南京 210023)
随着互联网时代的到来,各大学图书馆纷纷建立校图书馆网站,以提高馆藏资源利用率及提升本馆服务能力。目前,研究大学图书馆网站建设的学者众多,网站建设也的确得到极大发展,但网站质量评价却并没有及时跟进。分析现有图书馆网站质量评价,可将其分为3类,分别是形式评价、内容评价和效用评价。目前大多数图书馆网站评价属于内容评价,一般采用内容分析法、问卷调查法、专家分析法等,通过对图书馆网站的布局结构、内容质量、界面设计等调查分析,构建评价指标体系,进而得出网站质量评价结果,如李璐[1]的研究。单独对图书馆网站形式进行评价的研究较少,一般都是与内容评价结合在一起。所谓效用评价是指对图书馆网站的价值、影响力等进行评估。其中,网站影响力是指网站的信息资源与服务通过网络实现传递、交流和被利用,从而改变他人思想和行动的能力[2]。网站影响力是最能体现一个网站质量高低的指标之一,因而对图书馆网站影响力进行评价很有必要。鉴于此,本文利用链接分析法,对42所“双一流”大学的图书馆网站影响力进行评估分析。研究目的与意义主要有两个:一是期望能够为被评价的图书馆了解自身网站实力提供参考;二是对目前大学图书馆网站的影响力进行分析,促进图书馆网站建设,以提高其使用率。
国内最先将链接分析法应用于图书馆网站研究的是强自力[3],他于2000年利用Altavista搜索引擎统计了国内9所大学图书馆网站的网页数量、被Web上其他站点链接的次数和被国内教育站点链接的次数,据此对这些大学图书馆网站进行评价。其后,黄晓斌等[4]对我国国家图书馆网站的链接情况进行分析,并将其结果与其他国家的国家图书馆网站进行比较,在此基础上对我国国家图书馆网站的影响力进行评价并提出相关建议。此后链接分析法在图书馆网站评价上得到广泛关注。从宏观上来看,相关研究主要取得了以下进展。
(1)评价对象发生了变化。一方面评价对象日趋多样化。早期研究主要以公共图书馆网站和重点高校图书馆网站为主。如王宏鑫[5]、刘文云[6]、任立肖[7]等对我国省级公共图书馆网站影响力进行了评价。又如姚湘中[8]、陈太洋[9]以“211工程”高校图书馆网站开展研究等。而后期研究则对各级图书馆网站影响力的关注度越来越高,评价对象类型也越来越丰富,如对国内高职院校图书馆网站[10]、体育院校图书馆网站[11]、某地区大学图书馆网站[12]的评价研究,以及对美国大学图书馆网站[13]的分析研究等。另一方面表现在评价对象逐渐由单一分析趋向于多元比较分析,评价从对某一类型图书馆网站评价发展为对多种类型多个地区图书馆网站的比较研究。如岳增慧[14-15]、杨石山[16]等对中美高校图书馆网站进行比较与评价,马洪亮等[17]对中日体育院校图书馆网站进行比较分析,丁楠等[18]评价并比较了公共图书馆和高校图书馆网站的网络影响力,张岗[19]对粤港澳公共图书馆网站进行了比较分析等。
(3)评价工具的使用日趋综合化。评价工具主要分为两类:一是数据获取工具,如搜索引擎等;二是数据分析工具,如SPSS等。从评价工具来看,以往研究由最初只使用单一的工具发展为同时运用多种工具,并在工具类型上有所拓展。如数据获取工具可以分为三类:第一类是利用商业搜索引擎,如Google、Altavista等;第二类是利用自制工具,如网络爬虫等;第三类是搜索引擎优化工具,如站长工具、Google PageRank查询、Alexa排名查询等。早期研究大都以第一类工具为主,后来逐渐演变为在使用第一类工具的同时结合第二类或第三类工具进行研究。如熊军等[12]在图书馆网站评价研究中率先采用Google和SocSciBot网络爬虫软件获取链接指标数据。又如数据分析工具,由最初的Excel进行简单的统计分析,发展为运用SPSS等更为专深的数据分析以及Pajek等可视化分析,不仅类型有所拓展,在分析能力上也有所深化。
虽然以往研究取得了较大发展,但仍存在一些局限,主要包括以下方面。
(1)评价指标方面的局限。尽管指标类型多样,数量众多,但有些指标内涵相差不大,所用术语却“别出心裁”,导致评价混乱,权威性不高。此外,有些指标的合理性和适用性还有待改进,链接分析法最初并非用于图书馆网站影响力评价,所以过去许多研究都是应用其他网站评价的指标,而这些是否真的适合图书馆网站的评价,是需要仔细衡量判断的。
(2)数据收集方面的局限。数据收集,即链接指标数据的收集。在以往研究中经常使用Google、Altavista和AlltheWeb等搜索引擎工具收集数据,此外某些研究也有结合其他工具(如Alexa、百度等)辅助收集数据。尽管利用这些工具进行数据收集有其可行性,但也存在局限性,如不同时间不同工具获得的数据不一致等。如何解决或者降低由于工具的局限性所带来的数据误差,目前还没有取得实质性的进展,结合网络爬虫等获取数据或许在一定程度上有助于减小数据误差。此外,由于国内外网络环境的变化,Altavista和AlltheWeb在被Yahoo收购以后已先后被关闭,停止提供服务;而Google由于某些原因也已退出国内市场,且其本身对中文网页收录也不够全面,由此带来链接分析数据获取的困难值得重视。国内的商业搜索引擎发展速度很快,但是否能够利用它们来代替以往的Google、Altavista和AlltheWeb 3种搜索引擎工具获取链接指标数据,或者是否有可能重新确立一些指标用以支持网络链接分析,这些都还有待探索。
(3)数据处理及其方法的局限。除灰色关联分析法外,过往研究很少使用其他方法(如社会网络分析法等)。但是利用链接分析法评价其他(如企业等)类型网站影响力时,使用的数据分析方法就有很多,如相关性分析法、描述性统计分析法、差异性分析法等。与之相比,图书馆网站影响力评价中类似的方法尚未发展起来,部分研究直接“挪用”他人研究方法,并没有思考是否可行,导致一些研究除具体数据有所区别外,创新性有限。也有部分研究对方法理解有误,所得结果并不科学。
(4)评价结果的应用存在局限。首先体现在评价结果的权威性和认可度普遍不高;其次体现在评价反馈缺乏,大多数研究只管评价,而不见评价的反馈,或者对评价结果的评价。
基于对上述诸如此类的局限性的认识,本文以42所“双一流”大学的图书馆网站为例,应用链接分析法,综合以往研究,对这些网站的网络影响力进行评价。
随着市场经济的不断发展,各行业的竞争也越来越激烈,在公路工程施工过程中,大部分企业都将成本作为工程管理的重点,对施工技术的控制与管理普遍不够重视,导致施工技术管控浮于表面,措施以及制度体系不完善,并且无法全面落实到整个工程施工过程中,施工技术的应用和操作缺少规范性,不仅难以发挥应有的效果,还会为工程进度和质量埋下隐患。此外,很多管理人员不具备基本的管理意识,不能积极主动地配合施工技术控制与管理工作,导致管理措施得不到严格的落实,造成公路工程施工过程中索赔和变更问题频发,增加了工程成本。
本文以42所“双一流”大学的图书馆网站作为研究对象,其中原因有两点。一是因为国内大学图书馆网站数量众多,且质量参差不齐。42所“双一流”大学因为各方面的原因,其图书馆网站的质量相对而言都比较高,基本上处于一个层级。且各自在网络中都具有一定的影响力,对其进行评价研究具有可比性、可行性和实用性。二是为了响应“双一流”大学建设的需求。图书馆在一个大学中的地位是非常关键的,而在互联网时代,图书馆网站对一个图书馆的作用也是至关重要的。为保障和助力“双一流”建设,对“双一流”大学的图书馆网站质量进行评价势在必行。
本文采用的研究方法是链接分析法,所谓链接分析法,是指一种基于引文分析法发展起来的,以网络链接为研究对象,利用搜索引擎、网络数据库和数学统计分析方法,对网络链接的分布规律和网络信息单元之间的链接规律进行分析研究的一种定量分析方法,是网络信息计量学的重要研究方法[21]。
链接分析法最先是由国外学者提出。1996年,美国爱荷华州立大学图书馆的Mckiernan[22]根据文献计量学中引文“Citation”率先提出“Sitation”一词用来描述网站之间相互链接的关系。同年,比利时文献计量学家Larson[23]首次将“Sitation”用于文献题名中,标志着网络链接分析法被学界正式认可为一种真正意义上的科学研究方法。1997年,Almind等[24]借鉴期刊引文分析法中的影响因子,提出网络影响因子,并对其进行实证研究,证明网络影响因子可以用来定量评价有关网站的重要程度。自此以后链接分析法在国外成为网络计量学研究的重要方法。而据邱均平等[21]的考证,国内较早对链接分析法进行讨论的是李彦宏,李彦宏[25]于1996年率先提出进行链接分析以优化搜索引擎排序。进入21世纪后,链接分析法在国内引起广泛关注。
链接分析法是以一定的链接指标数据作为分析基础的。回顾以往的研究,我们发现目前在运用链接分析法进行图书馆网站影响力评价的研究中,被采用的次数相对较高的指标有网页数、总链接数、内链接数、外链接数、总网络影响因子和外部网络影响因子这6项指标。表1中统计了以往应用链接分析进行图书馆网站影响力评价研究中采用的评价指标,为分析方便,指标名称已进行统一规范,如站外链接数、外部链接数在表格中均被统计为外链接数。在分析以往研究的基础上,并权衡考虑目前数据获取工具的功能,本文最终确定的评价指标汇总见表2,为便于后续统计,以a1到a9表示。本文在评价指标方面虽然并未设置新型指标,但指标的选取是在充分调研以往研究指标设置的基础上,在考虑其适用性与可行性的情况下择优选取的,研究将内链接数等有所争议的指标剔除在外,在科学性和客观性方面有所改进。总而言之,本文在评价指标确定上既以评价网站影响力为出发点,又综合了各家所长。
表1 以往研究中各指标利用频次
所谓研究工具,也称为链接分析工具,它主要包括两类工具,即数据获取工具和数据分析工具。本文选择采用Excel作为数据分析工具,较为方便,能满足研究需要。至于数据获取工具,基于以往研究回顾,发现各工具(如Goolge、Altavista、AlltheWeb、Hotbot和百度等)性能不一,很多学者曾对其进行过分析,如邱均平[21]、杨木容[28]等。
表2 评价指标
本文在综合这些研究的基础上,以能够获取本文确定的指标数据为目标,最终选择表3中汇总的各工具,对应的指标数据和检索式也列举在表中。以北京大学为例,各检索式是在参考以往有关研究与当前工具性能后确定的。值得注意的是,由于在检索时发现Google并不能获得外链接数,因此本文除网页数和总链接数仍采用Google获取以外,其余均采用国内的数据获取工具,以尽量避免国外工具对中文网页收录不全和获取的有关链接指标数据不准确的不足。
利用上述工具对42所“双一流”大学图书馆网站的链接分析指标数据进行收集,数据收集时间为2018年2月18日8:00~12:30。为保证数据质量,降低由于检索时间不同所带来的数据不稳定等影响,部分数据如总链接数,在2018年2月18日20:00~21:30再次搜索,以两次检索所得数据的平均值作为最终的样本数据。
表3 链接分析指标及其检索式
由于中国科学技术大学图书馆、国防科技大学图书馆、中国农业大学图书馆、北京理工大学图书馆的网站关注度、网站流量数据无法获取或未达计数标准;东南大学图书馆、北京航空航天大学图书馆、中央民族大学图书馆、郑州大学图书馆的网站PR值查询不到,或显示为0。因此,为保证评价客观、准确,故不再对以上8所大学图书馆进行评价。所以,本文实际评价的“双一流”大学图书馆网站只有34所,而非42所。
此外,仅以有效数据来看,可以发现42所“双一流”大学的图书馆网站各项指标数据之间存在明显差别。以每一项指标对其进行排序,可以发现所得排名结果各不相同,如表4就列举了以4项指标分别单独排序的前10所大学图书馆,如此分析,定然不太合理,故而需要采用一种综合分析的方法来对数据进行处理,依此得到综合结果。本文采用灰色关联分析法进行处理。
灰色关联分析法是20世纪80年代由我国学者邓聚龙[29]率先提出的灰色系统理论中的一种系统分析方法。以本文研究对象举例,该方法是以各图书馆网站各链接指标的最优值(一般是最大值或最小值,本文中的最优值为最大值)组成一个参考数列,然后将每个图书馆网站的各链接指标数据视为一个比较数列(本文可得34个比较数列),使该比较数列与参考数列相比较,从两者的关联度大小来评价各图书馆网站的网络影响力大小,关联度越大,影响力越高。
本文利用南京航空航天大学灰色系统研究所开发的灰色建模软件第七版对以上指标数据进行灰色关联分析,以灰色绝对关联度排序,所得结果如表5所示,为各大学图书馆网站影响力评价结果。
由表5数据可知,当前网站影响力排名前10的“双一流”大学图书馆网站分别为浙江大学、上海交通大学、复旦大学、北京大学、西安交通大学、南开大学、哈尔滨工业大学、清华大学、南京大学及厦门大学。而从关联度来看,影响力排名前10的大学图书馆网站中只有浙江大学图书馆网站的关联度达到0.9以上,为0.993 7;其余9所大学图书馆网站的关联度均低于0.6。从整体来看,大部分大学图书馆网站的关联度都在0.5以上,最低为0.500 8。这表示,从整体上看,我国“双一流”大学的图书馆网站影响力普遍较低,亟需改进。以下将从各个具体指标对34所“双一流”图书馆网站进行分析。
表4 单项指标排序举例
表5 分析结果
(1)网站建设规模总体来说较为完备,但各网站之间差距仍比较大。观察网页数,研究发现,当前网页数大于1 000个的有21所;网页数大于2 000个的有15所,其中复旦大学的网页数最多,为10 650个,即被Google收录的与复旦大学图书馆网站相关的网页数有10 650个。其后,上海交通大学、武汉大学的图书馆网站网页数也超过9 000个。网页数最少的为中国海洋大学,只有113个。由于网页数是指利用搜索引擎能够检索到的某网站的网页数量,可以表征网站建设规模大小,因此,从这点来看,可以发现当前大部分大学图书馆网站的建设规模较为完备,但是也有部分大学图书馆网站建设规模较小,与其他大学图书馆网站相比差距较大,发展有待完善。
(2)网站内部信息较为丰富,结构较为合理,但对外影响力还有待加强。从总链接数与反链接数来看,34所大学的图书馆网站总链接数都大于1 000,大部分网站的总链接数在2 000以上,总链接数大于5 000的有8所,其中上海交通大学、清华大学、复旦大学、武汉大学的图书馆网站的总链接数上万。不过,分析当前各大学图书馆网站的反链接数,研究发现,反链接数大于1 000的却只有14所,反链接数大于2 000的只有5所,其中北京大学图书馆网站的反链接数最多(4 762个)。与总链接数相比,各大学图书馆网站的差距较大。因为总链接数在理论上来说应等于反链接数与网站内部链接数的总和,因此,从此处可以发现,各大学图书馆网站的内部链接数相对而言都较高,说明网站内部信息及其组织等较为丰富和合理。而从总网络影响因子和外部网络影响因子进行分析,研究发现大学图书馆网站中网络影响因子最高的达到了18.27,最低只有1.01;外部网络影响因子最高的为4.66,最低的为0.2。网络影响因子最高的是中国海洋大学图书馆网站,其影响因子如此之高主要是因为其网页数太少,这一结果的出现,在一定程度上表明网络影响因子对于评价网站网络影响力有所局限,不够客观、准确。与此对比,外部网络影响因子用来评价网站影响力可能会更为科学。由于反链接数、总网络影响因子、外部网络影响因子的大小均能反映一个网站的对外影响力,而由上述分析可知,当前大部分大学图书馆网站尽管建设规模较大,内部信息组织及其结构布局较好,但是对外影响力还有待加强。
(3)网站整体质量较好,但用户关注度与利用率还需提高。分析PR值发现,34所“双一流”大学的图书馆网站的PR值分布在6~8之间。PR值全称为PageRank,是用来表示网页等级的一个标准,级别分别是0~10,它是Google用于评测一个网页“重要性”的一种方法。当某个网站的外部链接数越多,外部链接站点的级别越高,那么这个网站的PR值也就越高。当前“双一流”大学图书馆网站的PR值分布6~8之间,这表示34所“双一流”大学图书馆网站的整体质量还是有所保证的,其外部链接的站点等级与权威性也有所保障。不过,分析各大学图书馆网站的网站关注度,研究发现,当前关注度大于1 000的只有2所大学,大于500的有17所,其余网站的网站关注度都不足500,哈尔滨工业大学图书馆的网站关注度最低(156)。网站关注度表征的是网站在过去30天内被用户关注的程度,图书馆网站的网站关注度低,则表明该图书馆网站在网络中很少有用户关注。而从网站流量来看,大部分网站的整站日均IP都大于5万,大于10万的有5所,整站日均IP最高的是上海交通大学图书馆网站,有232 500。与此同时,大部分网站的整站日均PV数都在30万以上,浙江大学、上海交通大学、复旦大学的图书馆网站整站日均PV数已逾百万。以上数据表明,当前“双一流”大学图书馆网站的用户群体巨大,图书馆网站确实有其巨大价值。网站建设者应该提高网站建设质量,将图书馆网站的价值充分发挥出来,提高用户关注度与利用率。
总而言之,目前大学图书馆网站的网络影响力还有待加强。尽管当前图书馆网站建设取得了一定进展,如网站建设规模总体较为完备、内部信息较为丰富、整体质量较好等;但还是存在许多问题,如各大学图书馆网站质量差距较大,发展不平衡,对外影响力有待加强,以及用户关注度有待提升等。基于上述分析,本文对此提出相关的建议策略,以提高大学图书馆网站网络影响力。
(1)明确网站定位,理念上要坚持以用户为中心,提高网站内容建设质量。图书馆是以用户为中心的,图书馆网站也应该要以用户为中心。建设“双一流”大学,服务的提升永远是不能落下的,因而在图书馆及其网站方面的建设也不该松懈。用户作为图书馆网站服务的对象,其地位更应该得到加强。目前许多图书馆网站内存在很多与用户服务无关的内容,有些新闻动态也许必不可少,但是不能主次颠倒;有些图书馆网站将主力放在这一块,使得投入服务的精力大大减少,实在是本末倒置。图书馆网站要想提升网络影响力,就该明确定位,一切以用户为中心,以精准匹配用户需求、满足用户需求为中心,提升服务效率;同时也应加强网站内容建设,合理规划网站结构,尽可能地消除冗余信息,及时地更新信息,从而大大提高网站可用性、便利性,进而提高用户的满意度和利用率。
(2)丰富宣传手段,形成口碑效应,吸引并主动扩大服务用户群体。图书馆要“走出去”,图书馆网站就必须“先行一步”,而这一步如何迈出,积极宣传就是必须的。除了转变宣传心态,将其由被动转为主动以外,宣传还得有特色,要实际。此外,网络的快速发展,网络用户增加的同时,在网络社交媒体也得以繁荣发展。图书馆网站以用户为中心,其宣传也应以用户为中心,要走入用户之中。因此,图书馆网站的宣传手段也应有所改善,要充分利用各类社交媒体的优势进行宣传,进而形成口碑效应。图书馆不是私人藏书房,也不是“高校牌坊”,它是属于用户的,就该“取之于民,用之于民”,图书馆网站当然也不例外。尽管大学图书馆网站的主要服务对象是高校师生,但是也存在相当一部分用户是属于离校毕业师生或者社会人士,以及其他相关研究者。如何保证在为主要对象服务的同时,兼顾这些用户的需求,这是未来图书馆网站建设应当考虑的,毕竟共享俨然成为了一大发展趋势。由于用户类型多样,就必然会导致用户需求多元化。图书馆要想兼顾各类型用户,也必然要求图书馆网站提高其适应性。
(3)规范网站建设,力求标准化,以方便其他网站链接和搜索引擎等的收录。所谓标准化是指在文字、图片、界面设计、网站协议等方面保证符合网站建设的标准,这既是对网站形式的标准要求,也对图书馆网站内容质量的提升具有重大影响。目前正在建设信息资源共建共享,而要达到这一目标,信息资源的共通则是关键。而实现共通就要求信息资源在格式等方面具有一致性。鉴于此,图书馆网站作为信息资源建设共建共享的重要支撑平台,其必然要具备强大的兼容性,这是从宏观而言。而从微观来看,如果各大图书馆网站设计千奇百怪,网站建设标准“各执一词”,其必然会导致用户使用不便,且于管理者而言,这也会导致管理困难。统一标准,不是禁止个性,而是要保证真正的个性得以顺利彰显。规范建设,既能方便用户使用,减轻用户学习操作负担,也便于图书馆网站对外链接,进而扩大自身影响力。
(4)加强特色化建设,在保证共性的同时要具备自身特色。各高校和面向用户的要求不一,自然在其建设中会出现各种差异,但差异不是特色,特色是“我有你无,我有的你需要”,而差异只是“你无我有,我有你无,你我无关”,显然特色化要“技高一筹”。此外,像网站中的一些特色馆藏数据库等建设,也都是图书馆网站特色化常见的表现形式,要大力宣传、鼓励建设,以提高图书馆网站的影响力。总而言之,提高网站内容质量,保证丰富性、客观性、实用性、可用性、专业性、特色化,是网站扩大自身影响力的根基,只有提高内容建设质量,网站的影响力才会渐渐增强。
(5)加大资金投入,加强网站维护与管理,提高网站建设意识。任何网站的建设都离不开资金支持,图书馆网站也不例外。如何合理分配有限的资金,让图书馆网站建设不为资金所限制,仍然是图书馆网站发展亟需解决的问题。而这一问题的解决,最主要的在于网站建设者、管理者、维护者是否对网站予以足够的重视。充分意识到图书馆网站对于图书馆发展的重要性,是保障图书馆网站发展的关键。此外,及时对网站进行合理规划和维护,是当前网站发展的重要任务。聘用专业人才进行维护与管理,是提升网站维护与管理质量的基本条件。当前部分图书馆采取外包的方式进行网站建设、维护与管理,其合理性、可行性、可取性也值得关注。