我国公共图书馆数字平台的信息孤岛问题研究*——基于社会化网络的分析视角

2015-08-24 07:19霍朝光吴郁松武汉大学信息资源研究中心湖北武汉430072
图书馆建设 2015年11期
关键词:孤岛节点数字

张 敏 霍朝光 吴郁松 (武汉大学信息资源研究中心 湖北 武汉 430072)

我国公共图书馆数字平台的信息孤岛问题研究*——基于社会化网络的分析视角

张 敏 霍朝光 吴郁松(武汉大学信息资源研究中心 湖北 武汉 430072)

通过社会化网络分析可以发现,我国公共图书馆数字平台存在较为显著的信息孤岛现象,部分公共图书馆数字平台缺乏信息资源合作、协调的管理理念,甚至不与外界建立任何链接关系。同时,我国公共图书馆数字平台呈现出较为显著的地域差异性态势,东西部、沿海与内陆的区域发展不均衡。处于信息孤岛地位的数字平台可通过整合优化算法提供的馆际合作链路方案,选择入度、出度等指标上表现较为优越的市级或省级平台作为最佳合作链路对象,以此缓解信息孤岛现象。

公共图书馆数字平台信息孤岛 社会网络分析

1 引 言

互联网技术和信息技术的不断发展给予了公众更多的获取信息的机会,但因受到个人知识背景、地区经济发展水平、地区文化差异、地域信息发展水平差异的影响,现实社会中部分在资源获取等方面处于相对劣势的社会成员在虚拟世界中的信息获取及知识分享等方面也处于极端弱势的地位。公共图书馆是国家公共知识服务体系的重要组成部分,其基本要义就是保障社会中的每一个成员获取信息知识的平等性,进而维护社会信息知识的公正[1]。统计数据显示,尤其是在经济危机爆发的时期,经济实力不佳的社会成员往往会借助公共图书馆进行再学习进而掌握获取职位的技能,如英国Westminster图书馆在经济危机时借阅率与危机发生之前相比提高了35%[2]。在过去的几十年间,世界各国实体图书馆数字平台的搭建工作如火如荼,图书馆业务不断趋向数字化、网络化和社会化[3]。因此,公共图书馆在公众知识传播和知识分享中发挥着举足轻重的作用,全面提升公共图书馆的公共信息服务绩效具有重大的社会意义和文化价值。

信息孤岛是信息化时代呈现出来的一种独特的信息现象,它是指由于各系统、软件、数据库之间的格式差异、技术隔阂等造成数据共享性与交互率极端低下甚至无法联通的问题[4]。公共图书馆数字平台的信息孤岛问题不仅仅体现在微观层面数字平台系统功能不兼容、信息共享障碍、业务环节脱钩等问题,还体现在宏观层面不同平台群落之间或不同区域之间各自封闭、缺乏协作交流、缺乏资源共享、公共图书馆群落条块分割等问题[5]。从社会资本理论视角来看,社会资本是继经济资本、文化资本之后又一重大资本力量,如何投入最小的社会资本来获取最大的经济、文化提升是发挥社会资本优势的关键。对于公共图书馆数字平台如何同其他平台开展良好合作、发挥群体智慧的力量,在有限的链接空间设置最优的友情链接,以最优的社会资本投入获得最有价值的提升是其平台优化的关键。因此,本文从社会化网络的分析视角出发,对我国公共图书馆数字平台之间的链接关系进行定量研究,在构建链接关系共现网络的基础上,对共现网络的基本属性、凝聚子群及中心性等指标进行研究分析,之后基于分析结果探讨我国公共图书馆数字平台的信息孤岛现状和形成原因,进而提出弱化和有效规避信息孤岛现象的相关建议。

2 文献综述

目前,从网络计量学的视角展开分析,运用数学统计等定量研究方法来探讨网络资源间的引证数量特征和开发利用规律,从而为网络资源的配置提供依据,已经成为国际、国内学术界信息孤岛问题的研究热点趋势。社会网络分析法起源于社会关系学和社会心理学,主要用于研究社交网络的结构和社交成员之间的社会关系[6];邱均平等人基于链接分析提出了网络影响因子来分析网页间的链接关系,主要用于研究各科研组织和机构平台间的网络资源利用情况[7];蔡筱英和胡伟通过搜索引擎收集医学网站的链接数据,研究发现网站的外部链接数与网络评价中的排名显著相关[8];岳增慧等人基于对全球30个高校图书馆网站的共链数据进行分析,通过可视化技术揭示了各个高校图书馆网站的角色及其群落关系[9];刘伟刚通过对广东、山东两省的农业网站的链接对比分析发现,优化的网站链接可以使整个区域形成立体化的网站链,根据网站的链接数目分析可以量化信息孤岛问题[10];翟光勇从网络计量学角度根据网站之间的链接数据对政府网站的信息孤岛问题进行了实证研究[11];王雨通过对文献共引、作者关键词关系、作者的合作关系进行社会网络关系分析来论证资源聚合的过程,以期为解决信息资源的资源共享问题与不同数字图书馆之间的资源聚合问题提供借鉴[12];Barnett等人对全球1 000所大学之间的链接网络进行结构分析发现,大学网站之间的链接网络能够很好地展现各大学的学术科研关系及相应教学特征[13]。

上述研究从不同的专业视角和侧重点展开,极大地丰富了我国信息孤岛问题的研究。但通过文献综述不难发现,目前从网络的整体结构角度来细化研究信息孤岛问题,进而对如何有效缓解信息孤岛问题提出针对性方案的研究相对较少。相关领域的研究是实现资源聚合、发挥资源优势、创造良好外部环境,从而有效解决平台间的信息孤岛问题的必由之路。鉴于上述分析,本文采用社会网络分析法对我国235家公共图书馆数字平台之间的链接网络进行分析,从定量分析视角论证我国公共图书馆数字平台的信息孤岛问题,并通过量化的数据信息构建相对理想的链接网络,以期为我国公共图书馆数字平台解决信息孤岛问题提供借鉴。

3 我国公共图书馆数字平台的信息孤岛现象分析

3.1数据收集与处理

近十年来,虽然我国图书馆界在大力发展数字平台方面取得了重大进展,但因种种因素的限制,据笔者统计,目前在我国34个省和270个市中仍有69个市尚无公共图书馆的数字平台,全国图书馆数字平台覆盖率仅为77.3%。考虑到各个市级图书馆数字平台可能会依托各自的省级图书馆数字平台同外界开展信息共享、馆际互借业务,本文选取了34个省级图书馆数字平台和201个市级图书馆数字平台,共2 3 5个图书馆数字平台为数据样本,之后使用SocSciBot4.0获取上述平台网站的链接数据并应用Gephi软件构建网络结构图[14]。我国市级以上图书馆数字平台的网络链接结构如图1所示,将具有链接关系的节点进行过滤,剩下的无链接关系的节点如图2所示。

图1 我国市级以上公共图书馆数字平台网络结构图

图2 我国市级以上公共图书馆数字平台网络孤点图

从图1可以看出,浙江省、黑龙江省、湖南省、江苏省、福建省、内蒙古自治区等省级图书馆数字平台及成都市、济南市、四平市、菏泽市、桂林市、通化市等市级图书馆数字平台的网络链路连通性较好,表现出显著的平台聚集效应。从图2可以看出,235个图书馆数字平台中有53个市级公共图书馆数字平台和1个省级公共图书馆数字平台与其他平台之间不存在任何链接关系,它们游离在链接网络之外,处于信息孤岛状态。因此,上述数据和图形显示了高达22.9%的市级以上公共图书馆数字平台存在显著的信息孤岛现象。

3.2基本属性分析

本文利用Ucinet软件从宏观到微观对整个公共图书馆数字平台链接网络进行全面分析,形成的网络结构图形显示,我国公共图书馆数字平台中的233个节点之间建立了1 796条链接关系,网络密度取值为0.033,相对较低,在整个网络中只有3.3%的平台节点是相对密集的,表明只有很少一部分成员之间保持着较为频繁的信息交换关系;网络的平均路径为2.664,表示网络中任何两个节点之间平均需要2.664步,网络直径为6,表示网络中最远的两个节点之间需要6步,这两项数据说明网络中节点之间的路径比较长,不利于资源共享与知识传播;网络的聚类系数为0.297,显示该网络整体凝聚力较低,没有明确的组织关系或合作关系。

从密度、平均路径、网络直径、聚类系数等基本属性不难看出,现阶段我国公共图书馆数字平台网络系统整体结构比较涣散,平台之间尚未建立起良好的合作、共享关系,协同能力较为低下。上述现象说明,一些地区的公共图书馆管理方对协助建立起全国性的公共图书馆数字平台紧密合作关系的认知有待加强,尚未形成以资源共享为基本目标、以区域协同发展为基本手段的公共图书馆数字平台联动系统,这是导致我国公共图书馆数字平台信息孤岛问题的主要原因。

3.3凝聚子群分析

凝聚子群特指那些相互之间具有相对较强、直接、紧密、频繁关系的成员集合体。凝聚子群分析对于揭示子群成员间的社会结构、分析其内部关系、挖掘群成员之间的同质和异质性特征具有重要意义。基于关系互惠性、基于关系频次、基于内外关系密度以及基于关系可达性和关系接近性是最常用的凝聚子群处理方式,采用的指标主要有成分分析、K核分析、Lambda集合等[15]。本研究将我国公共图书馆数字平台中游离于链接网络之外的54个节点进行了排除,将剩余具有链接关系的节点网络依据Louvain[16]社区检测算法进行凝聚子群分析,算法原理如公式1所示:

分析子群1~6可以发现,上述6个子群依据河北、辽宁、四川、广西、江苏、云南6个省区形成了各自独立的小团体,各小团体在自身所处的政治区域内紧密互联,形成了局部链接系数较高的派系,信息交流与资源共享只限于各团体内部,说明在我国公共图书馆数字平台的建设大局中,小团体现象仍然存在,并且以区域性小团体为主,即使网络环境中地域上的差异仍然影响着网上数字平台的建设。

分析子群7~8可以发现,黑龙江、江西、湖南、湖北等省份在不断地突破地域限制,跳出局部,积极同整体网络构建良好的链接关系,而处于华中地区的湖南、湖北、江西等地的公共图书馆数字平台在全国的公共图书馆数字平台的建设中起到了很好的横贯南北、沟通沿海与内陆的桥梁作用。

表1 我国公共图书馆数字平台网络子群划分

分析子群9~10可以发现,乌鲁木齐、甘肃、青海、陕西等个别城市将西部区域的公共图书数字平台构架成一个整体网络,而北京、天津、辽宁、内蒙古、河南、福建、贵州等地将东部区域的公共图书馆数字平台构架成为一个整体网络。因此,无论是东部沿海还是西部内陆都存在积极的能动者,它们通过中部地区的一些节点将我国的整个公共图书馆数字平台链接成一个全国性的大网络,从而形成了平台整体架构良好、全局态势明朗的结构。但是在局部地区也客观存在一些消极现象。鉴于此,如何借助良好的整体网络构架带动局部地区发展,势必成为缓解信息孤岛现象的突破口。

分析子群11~12可以发现,哈尔滨、长春、沈阳、大连、济南、开封、合肥、长沙、杭州等中东部地区之间关系较为密切,整个中东部地区自成一体。此外,这些中东部优势节点以深圳为中介点取得同香港、澳门的良好互通效果,而在东部地区又进一步分化为以舟山、温州、泉州、汕头、河源、湛江为代表的东南沿海团体。由此可见,我国公共图书馆数字平台整体区域差异较强,区域抱团现象较为明显。

3.4中心性分析

点度中心性分析和中介中心性分析是衡量网络结构的两项指标,鉴于公共图书馆数字平台链接网络的实际意义,本文侧重对其点度中心性展开分析。在一个网络结构中,居于核心地位的节点往往与其他节点链接关系最多、链接强度最大、链接路径最短,它们在影响力层面上往往优越于其他非核心节点,在网络中显示了较强的中心性地位[17]。点度中心性可用于挖掘团体中的核心人物、团体和组织,在无向网络中用与该节点直接相连节点的数目来表示,在有向网络中又细分为外向点度中心性和内向点度中心性,即出度(Out-degree)与入度(In-degree)。在本研究中,公共图书馆数字平台被定义为有向网络,出度表示该平台主动链接其他平台的数量,入度表示该平台被其他平台链接的数量。将提取的有向网络结构数据依据出度和入度取值的大小分别进行排序,排序结果如表2所示。其中,入度较高的为江苏省图书馆、天津市图书馆、广州市图书馆、首都图书馆等数字平台,说明上述数字平台具有较好的资源优势或较高的建设水平,吸引其他公共图书馆数字平台与其建立链接关系,在结构网络中这些节点处于较为核心的位置,具备了较大的影响力;出度较高的有浙江省图书馆、黑龙江省图书馆、成都市图书馆、四平市图书馆、菏泽市图书馆等数字平台,说明上述图书馆的管理方采取了更积极的信息资源共享的管理策略,能主动与其他平台建立链接关系,在链接网络中起到了较为活跃的关联作用。

表2  我国公共图书馆数字平台网络入度与出度(前10)

4 馆际合作链路预测方案

通过科学的计算手段将合适的网络链接关系搭建在不存在链接关系的网络节点间是解决信息孤岛问题的一种有效手段,主要用到的技术为链路预测(Link Prediction),它是指根据已知的网络结构或结点属性信息对网络中两个结点间未知或者未来可能产生的链接的预测[18]。链路预测通常采用监督性和非监督性两类模型,监督性模型主要通过训练合适的分类器来预测链路,如k近邻算法、支持向量机、决策树和贝叶斯网络等算法[19];非监督性模型主要依据一些特定的规则或结点相似性等来预测链路,如共同邻居、Jaccard系数、加权Kazt和随机森林等算法[20]。

从表1中显示的12个子群分析不难看出,由于地方性经费来源和地方性政策保障机制的影响,我国公共图书馆数字平台表现出很强的地域特征,且地区差异较大,因此对处于信息孤点的公共图书馆数字平台在进行链路选取的时候势必要考虑到自身所属的省区等自身属性问题。因此,本研究将基于网络结构的传统链路预测方法和基于网络结点自身属性信息进行了整合,根据上文对我国市级以上公共图书馆数字平台链接网络的网络结构分析数据和各省区内各平台的自身属性特征,将235个公共图书馆数字平台链接网络加以优化,以形成较为理想的整体网络。

诸如广东省内的珠海市、肇庆市、中山市、揭阳市等处于信息孤岛状态的公共图书馆数字平台网络节点,它们最佳的链接与合作对象应该是广东境内的省级或市级公共图书馆数字平台,而广州市公共图书馆数字平台要比广东省省级公共图书馆数字平台在入度、出度等指标上表现更为优越,因此推荐最佳的合作链接对象应该是广州市公共图书馆数字平台,而非省图书馆或者其他市级的公共图书馆数字平台。同理可得其他省份孤岛节点的最佳链接选择,具体网络优化结果如图3所示。

图3 我国公共图书馆数字平台网络链路预测分析

5 研究结论

本文旨在全面剖析我国公共图书馆数字平台存在的信息孤岛问题,以社会化网络分析方法为手段将信息孤岛的表现形式进行了细化。现将研究结果概括如下:

(1)我国公共图书馆数字平台存在较为显著的信息孤岛现象。主要表现为网络整体链接较少,网络密度及网络聚类系数低,节点共现网络整体呈现出松散的星型结构。部分公共图书馆数字平台缺乏信息资源合作、协调的管理理念,只关注自身馆藏的建设,不与外界建立任何链接关系。导致上述现象的原因很多,一方面,许多公共图书馆的管理方缺乏利用其他平台补缺自身劣势的积极性,更深层次的原因是馆际合作由于不同数字平台处于不同发展阶段,不可避免地带来了信息鸿沟现象进而阻碍了馆际合作的顺利开展。为有效解决我国公共图书馆数字平台的信息孤岛问题,应该加强政府主导,加强区域共享型、区域合作型的公共图书馆数字平台建设,确立合理的共享机制。

(2)我国公共图书馆数字平台呈现出较为显著的地域差异性发展态势。上述数据分析结果显示,我国公共图书馆界在东西部、沿海与内陆的区域发展过程中呈现出了显著区域化差异。浙江、广州、福建、上海等沿海一带的公共图书馆数字平台关系较为频繁,占据整体共现网络的核心位置,而新疆、青海、内蒙古等西北一带与广西、云南、贵州等西南一带的地区游离在高连通性的核心组织之外,处于相对弱势地位。上述结果说明,在现实世界中,经济、文化、政治等方面发展相对弱势的地区在虚拟世界的信息沟通、交流方面同样处于弱势地位。某些省份存在一些具有突出绩效、高出入度的公共图书馆数字平台,这些平台应充分利用这些优势节点来强化本省与外省之间的关系,从而突破区域限制,与外界展开良性互动。因此,公共图书馆在建设数字平台时要注意发挥优势节点的带头作用,突出重点,以点带面地谋求全面发展。

信息孤岛现象严重影响社会信息共享的整体绩效,那些处于信息孤岛状态的数字平台更应加强自身建设,通过积极构建良性互动、协调发展的网络友好合作关系实现资源共享与信息便利。此外,由于中国特有的资源分配和财政政策,在发展过程中可根据地理、民族、语言、文化等特征因素建设区域性的数字图书馆联动平台,形成同种语言的或者文化相近的区域性公共图书馆数字平台联盟。

[1]范并思. 公共图书馆精神的时代辩护[J]. 中国图书馆学报, 2004,30(2):5-11.

[2]Rooney-Browne C. Rising to the Challenge: A Look at the Role of Public Libraries in Times of Recession[J]. Library Review,2009, 58(5):341-352.

[3]Chowdhury G, Poulter A, McMenemy D. Public Library 2.0: Towards a New Mission for Public Libraries as a "Network of Community Knowledge"[J]. Online Information Review, 2006,30(4):454-460.

[4]李希明, 土丽艳, 金 科. 从信息孤岛的形成谈数字资源整合的作用[J]. 图书馆论坛, 2003,23(6):121-122.

[5]王俊杰. 冲出信息孤岛, 实现数字资源共享[J]. 大学图书馆学报,2004,22(3):16-18.

[6]Freeman L C. Centrality in Social Networks Conceptual Clarification[J]. Social Networks, 1979,1(3):215-239.

[7]邱均平, 杨瑞仙, 陶 雯, 等. 从文献计量学到网络计量学[J]. 评价与管理, 2008(4):1-9.

[8]蔡筱英, 胡 伟. 网络计量学在医学网站评价中的应用研究[J].医学信息学杂志, 2010(3):28-31.

[9]岳增慧, 王 娟, 郑春厚. 基于共链分析的高校图书馆网络结构研究[J]. 图书情报工作, 2011,55(9):118-121.

[10]刘伟刚. 基于链接分析的山东、广东两省农业网站对比[J]. 经济研究导刊, 2014(29):42-44.

[11]翟光勇. 网络计量学视角下的政府网站“信息孤岛”实证研究[J]. 新闻与传播研究, 2011(6):9-44.

[12]王 雨. 基于社会网络分析的数字图书馆资源聚合研究[D]. 长春:吉林大学管理学院, 2014:40-59.

[13]Barnett G A, Park H W, Jiang Ke, et al. A Multi-Level Network Analysis of Web-Citations among the World's Universities[J]. Scientometrics, 2014,99(1):5-26.

[14]Barberan A, Bates S T, Casamayor E O, et al. Using Network Analysis to Explore Co-Occurrence Patterns in Soil Microbial Communities[J]. Isme Journal, 2014,8(2):343-351.

[15]刘 军. s整体网分析:UCINET 软件实用指南[M].上海:格致出版社, 2014: 153-178.

[16]Vincent D B A, Guillaume J L, Lefebvre E. Fast Unfolding of Communities in Large Networks[J]. Journal of Statistical Mechanics Theory & Experiment, 2008,30(2):155-168.

[17]Luo Qiuju, Zhong Dixi. Using Social Network Analysis to Explain Communication Characteristics of Travel-Related Electronic Word-of-Mouth on Social Networking Sites[J]. Tourism Management, 2015,46:274-282.

[18]吕琳媛. 复杂网络链路预测[J]. 电子科技大学学报, 2010,39(5):651-661.

[19]Ding Jingyi, Jiao Licheng, Wu Jianshe, et al. Prediction of Missing Links Based on Multi-Resolution Community Division[J]. Physica A: Statistical Mechanics and its Applications, 2015,417:76-85. Guns R, Rousseau R. Recommending Research Collaborations

[20]Using Link Prediction and Random Forest Classifiers[J]. Scientometrics, 2014,101(2):1461-1473.

张 敏 女,博士,武汉大学信息资源研究中心,副教授。

霍朝光 男,武汉大学信息资源研究中心硕士研究生。

吴郁松 男,武汉大学信息资源研究中心硕士研究生。

Study on Isolated Information Island Problem of Chinese Public Library Digital Platforms——From the Perspective of Social Network Analysis

Through the social network analysis, the results show an obvious isolated information island phenomenon exists in Chinese public library digital platforms and some public library digital platforms lack the management conception of information resource community and coordination, even construct few links with the outside. Meantime, it shows obvious region discrepancy tendency in domestic public library digital platforms. Imbalance widely exists between the east and the west, the coast and the inland areas. The digital platforms in insolated information islands might select platforms with better in-degree and out-degree as target node to relieve the symptom of isolated information island from city level or the provincial level by interlibrary cooperation link strategy provided by integration optimization algorithm.

Public library; Digital platform; Isolated information island; Social network analysis

G250.76

A

*本文系国家自然科学基金项目“Web2.0环境下基于社会化网络瓶颈限制的信息扩散最大化研究”,项目编号:71203166;武汉大学自主科研项目(人文社会科学)“危机伤害情境下网络声誉演化与修复机制研究”的成果之一。

2015-07-13 ]

猜你喜欢
孤岛节点数字
CM节点控制在船舶上的应用
不再是孤岛
基于AutoCAD的门窗节点图快速构建
《岛上书店》:与书相伴,没有谁是一座孤岛
概念格的一种并行构造算法
答数字
没有人是一座孤岛
数字看G20
抓住人才培养的关键节点
互联互通破“孤岛”