郑春荣俞红杰黄文涛
(1.浙江海洋学院图书馆,浙江舟山316022;2.浙江海洋学院数理与信息学院,浙江舟山316022)
图书馆自产生以来,走过二十多个世纪的风雨,载誉颇丰,被誉为是收藏各类书籍和出版物等资料的“知识宝库”。进入信息化时代以来,各类海量数据日新月异,传统意义上的图书馆日渐式微,以致于人们对图书馆未来的命运和发展模式产生诸多忧虑和深入的思索。悲观者认为图书馆在计算机和网络等技术猛兽的冲击下将走向消亡,或者被边缘化后在惴惴不安中苟活[1];但是,考虑到图书馆走过的历史,人们也有理由相信只要人类对信息和知识的需求没有停止,图书馆作为一个“生长的有机体”,能够吐故纳新,在“进化”中适应时代环境的变迁而生存下去。[2]毋庸置疑,图书馆只有主动乘信息的东风,满足人们日益增加的信息服务需求,才能体现当下的自我存在价值。一些图书馆与时俱进,取得相当不错的效果:如清华大学借助社会网络,开发一些定制工具使图书馆服务迈入一个新的发展阶段[3];曲埠师范大学在图书馆的借阅记录基础上,利用复杂网络里面的方法,经过数据分析后实现了个性化推荐服务。[4]在信息爆炸式涌现的当代,如何利用在各个领域得到广泛应用的复杂网络理论中的成果,加工提炼和挖掘分析图书馆已有的和即将产生的海量信息,来满足人们日益增长的个性化信息需求,是一个重要的课题和研究方向。
马丁·路德·金曾说,“我们身处在相互联系、不可逃避的网络中,……无论我们中的哪一个被直接影响到,终究会间接影响我们所有人。”我们生活的世界,不管是物质世界还是人类社会世界,都可以看做是一个个网络。目前,复杂网络(complex networks)理论已经成为一门横跨多个研究领域的新科学,通过探索节点和边的拓扑关系来探索所考察系统的各类特性。[5]复杂网络思想在社会科学中的探索肇始于20世纪60年代,美国耶鲁大学的心理学家米尔格伦做了一个有趣的信件连续传递实验,提出了“六度分割”理论,即只要通过大约六个人,你就可以跟任何一个陌生个体建立联系,以此来说明社会生活中普遍存在着一些潜在的却发挥着重要作用的“弱链接”关系。此处的人际关系网络把人看成节点,把人与人之间的关系看成边,从而抽象成可以进行探究的复杂网络。再如目前美国和欧盟比较重视的脑功能网络研究,一般把脑皮层区域作为节点,通过探索各脑区域之间的时间统计相关性,来探索脑的一些功能表现或异常。
1998年,Watts和Strogatz发现许多实际的演员合作网络、电力网和神经网等网络具有小世界网络特性,在这样的系统里,短程连接具有重要的功能,少量改变几个连接,就可以剧烈地改变网络的性能,如信息传递速度或传染病在人群中的扩散。[6]第二年,Barabasi和其学生Albert合作发现实际网络中,少数的节点往往拥有大量的连接,而大部分节点却很少连接,同时网络节点的度这一特征指标量的统计分布具有幂律分布的特征,优先连接在其中发挥着极其重要的机制性作用。[7]复杂网络这个特性的发现又加深了人们对实际网络的理解,如实际网络对随机性的攻击性具有健壮性和容错性,而对关键节点的蓄意攻击却具有脆弱性。自从Watts和Barabasi各自开创性的文章分别在《自然》和《科学》杂志上发表后,复杂网络逐渐跨越了传统学科的界限,在很多领域得到发展并应用,形成了一门新的科学。目前,复杂网络广泛地应用于信息学、管理科学、经济学、交通物流、生物学、社会学、生态学和生物医学传染病学等,也在图书馆相关领域得到了广泛的应用。
在复杂网络研究的早期,其研究对象已经涉及图书馆领域。复杂网络研究对数据要求很高,而图书情报领域天然地拥有高质量的数据集,比如科学家合作共同署名的合著网络,科研论文相互引用的论文引用网络,因此,这些数据被人们收集和整理后,用来探索实际网络具有哪些特性,是否支持复杂网络理论中的小世界和无标度等理论模型。
(一)文献引用网络。文献相互引用数据库历来被人们用来探索科研活动动态演化、引用模式以及评估确认科研人员、学术期刊杂志或者某个领域相对重要性的基本源泉。上世纪六十年代,Price在这个领域做了先锋性探索,他用有方向的图来描述刻画相互引用,与后来复杂网络中有向网络从本质思想上契合。直到后面随着信息技术的发展,文档普遍电子化,以Web of Science为核心的各类数据库得到快速发展,人们才能比较方便地收集、整理和从系统层次上分析互引数据库。当复杂网络方法被用于探索大规模引用数据后,人们对文献互引网络有了更新的认识,如其表现出小世界和无标度的特性。类似的,人们在专利互引网络中也发现类似的特性。由于文献引用包含时间因素,因此人们可以用来追溯某个领域的发展演化轨迹或者审视思想和知识的动向与趋势。如张勤和马费成对国内的知识管理领域的核心作者互引网络进行分析得到国内知识管理领域信息传播渠道不够顺畅,知识交流结构有待完善的结论。[8]
(二)论文合著网络。在当今科技迅猛发展的时代,知识变化日新月异,科研合作逐渐成为科研活动的普遍方式。科研合作发表论文网络属于特殊的人际关系网络,是科研工作者之间合作并创造性地生产思想和知识的重要外在表现。当然,广义的合著包括影视音乐艺术等合作,这里主要针对论文共同署名的科研合作。自从Watts和Barabasi等物理学家所谓的入侵社会学家传统的研究领域后,早先的Hummon和Carley等人开始的社会网络分析又获得长程连接和优先连接等新的视角。立足复杂网络的视角,人们除了关注跨学科合作、跨部门合作和跨国界合作等有利于创造性产生的长程合作外,更加关注论文合著网络在不同研究领域的拓扑模式和动力学演化。[9]国内在此领域也紧跟国际步伐,如王福生和杨洪勇对《情报学报》6年内的论文作者科研合作网络进行分析后,除了得到此合著网络具有小世界和无标度特性外,还发现此网络是非连通图,其论文产出最大的子图具有人员地域分布最广的特点。[10]晏尔伽和朱庆华以2002年至2006年5年间CSSCI收录的图书馆、情报与文献学期刊论文作者为数据源,发现与以实证性研究为主的学科相比合作率相对较低,但合作率逐年在增加且符合小世界特征。[11]谷瑞军等人基于Salton方法构建合著网络,使用加权的链接聚类算法实现社团的聚类划分,能够有效地发现合著社团的重叠部分,且社团的意义比较明确。[12]
(三)共词知识网络。共词网络指的是利用文献论文中关键词的共同出现关系而构建的网络,蕴含知识网络的结构特征与其演化规律。Mane和Borner首次将复杂网络的方法用于分析1982–2001期间在《美国科学院院刊》上发表的47,073篇文章,得到了各个学科研究热点的形成和演化轨迹。[13]王晓光梳理了共词研究的历史,简介了共词网络的方法和现状,肯定了复杂网络在共词研究中的价值。[14]刘则渊等和滕立等分别利用复杂网络具体应用于科学学和石墨烯研究领域进行共词网络构建和分析,从而得到了这两个领域学科的知识地图和其知识结构的演化[15-16]。彭陶等人以“图书馆”或“情报”字样命名的各自4个核心期刊来构建共词网络,得到了我国图情领域近30年的学科发展脉络,特别是各个时期这两个有交叉重叠领域的发展和侧重[14]。
在信息化不断加速的时代,人们能比较方便快捷和廉价地获取信息,不再满足于传统意义上的“知识宝库”,而对信息除了有广度上的需求外,更有细致化和个性化的需求外。图书馆不能再简单地等人们自己来寻找信息,而需基于信息用户的信息使用行为、习惯、偏好和特点,满足人们日益广泛的、细致的和个性化的各类信息需要。为此,图书馆可以利用复杂网络的信息处理能力提供个性化服务。
(一)新颖的文献服务。现存的多数文献信息服务系统仅对数据进行简单的处理,而忽视了数据之间的相互联系。利用复杂网络中的社团发现方法,能够在科研合作网中找出“一群有共同合作兴趣的学者”,在文献引用网中找出“某一研究方向的论文集合”,在共词网络中找出各学科领域间形成的科学地图。[17]比如一些高校的图书馆通过信息挖掘,能够为该校的重点学科建设提供该领域每年的研究热点及学科的变迁。当然还可以将学科地图可视化,使用户能够在较短时间内了解一些研究领域的方向,服务于学科交叉和学科间的合作。当用户检索某篇文献时,还能够向用户提供推荐这一领域的其它重要或相关文献等。
(二)个性化推荐服务。图书馆在日常的图书流通运转中,积累了大量的用户借阅信息。利用复杂网络方法对此进行分析,可以将其中隐含的丰富信息提炼出来,为用户提供个性化的推荐服务。如了解某个读者的阅读兴趣,进行图书馆新书或其它新信息的推荐;再如就某一书籍或文献的借阅和查询,构建具有相似阅读兴趣的读者社团,搭建实际或虚拟的讨论平台供用户相聚进行阅读讨论;或者建立院系文献推介服务合作,根据学院学科特色,定期为学院提供最新最前沿的文献资料。董娟等人就利用图书馆的流通记录,建立了读者与读者、读者与图书相互关系的网络模型,进行复杂网络社团划分,找出阅读兴趣相同的读者[4]。这样就可以在不要求用户提供信息的基础上,通过已有的日常流通数据,经过复杂网络方法分析,就可以实现个性化的隐式服务。
(三)科研决策服务。一些高校特别是一些地方高校资源有限,希望集中人力物力投入到少量学科或专业中,形成学校的特色或品牌。因此,图书馆可以利用复杂网络进行文献引用网络、论文合著网络和共词知识网络的综合分析,得到知识、学科和科学团队的关联图谱,结合学校的专业设置情况,为学校教师的基金和课题的申报,甚至是科研方向的确立提供信息咨询和参考。图书馆可以每年定期对SCI、SSCI等数据库的资料通过数据整理、计量分析等研究方法预测最新最热的研究方向,提供某一课题的研究进程,或者在教师申报课题时做好查新研究,以便于学校教师更好地开展科研。
(四)竞争情报服务。随着社会经济、网络技术的飞跃发展,社会逐渐缩小成为一个地球村,情报信息越发成为人们经济、生活不可分割的部门。图书馆中利用复杂网络,对社会人才需求信息、新科学技术的发展动态,建立专门信息数据库;整理、分析、加工所掌握的网络资源,形成系统化、科学化、个性化的竞争情报分析手段,为学校在专业设置、人才引进、学生就业等方面更有效地做好竞争情报服务。
综上所述,复杂网络方法在图书馆领域有着重要的应用价值,还有很多方面有待进一步发掘和展开。到现代信息化语境下,图书馆需由传统的坐等用户上门自我服务,转变成情报信息的再组织、加工提炼和个性化信息的服务者,从而才能实现自我的“进化”。
[1]李正祥.数字化时代的图书馆消亡论刍议[J].情报资料工作,2002(1):41-44.
[2]方胜华.大学图书馆未来发展模式探析[J].大学图书馆学报,2013(4):31-35.
[3]姚飞,窦天芳,武丽娜,等.基于社会网络理念打造泛在图书馆服务——以清华大学图书馆为例[J].大学图书馆学报,2013(5):68-75.[4]董娟,郑春厚,李秀霞.基于复杂网络的图书馆个性化推荐服务[J].高校图书馆工作,2012(3):82-84.
[5]方锦清,汪小帆,郑志刚,等.一门崭新的交叉科学:网络科学(上篇)[J].物理学进展,2007(3):239-343.
[6]Watts D J,Strogatz S H.Collective dynamics of‘small-world’networks[J].Nature,1998,393(6684):440-442.
[7]Barabasi A L,Albert R.Emergence of scaling in random networks[J].Science,1999,286(5439):509-512.
[8]张勤,马费成.国内知识管理领域知识交流结构研究——基于核心作者互引网络的分析[J].情报学报,2012(9):925-933.
[9]Scharnhorst,Borner,Besselaar.Models of Science Dynamics:Encounters Between Complexity Theory and Information Sciences[M].German:Springer-Verlag,2012:195-225.
[10]王福生,杨洪勇.作者科研合作网络模型与实证研究[J].图书情报工作,2007(10):68-71.
[11]晏尔伽,朱庆华.我国图书馆、情报与文献学领域作者合作现状——基于小世界理论的分析[J].情报学报,2009(2):274-282.
[12]谷瑞军,陈圣磊,陈耿,等.复杂合著网络中的重叠社团发现与可视化[J].图书情报工作,2012(12):72-76.
[13]Mane,Borner.Mapping topics and topic bursts in PNAS[J].Proceedings of the National Academy of Sciences of the United States of America,2004(101):5287-5290.
[14]王晓光.科学知识网络的形成与演化(I):共词网络方法的提出[J].情报学报,2009(4):599-605.
[15]刘则渊,尹丽春.国际科学学主题共词网络的可视化研究[J].情报学报,2006(10):634-640.
[16]滕立,沈君,高继平.共词知识网络中的认知结构:理论、方法与实证情报学报[J].情报学报,2013(9):976-989.
[17]彭陶,王建冬,孙慧明.基于关键词共现网络的我国图情领域近三十年学科发展脉络分析[J].大学图书馆学报,2012(2):29-34.