基于共链分析的科技情报研究机构知识交流状况分析

2020-02-19 04:48莫富传冯翠翠华中师范大学信息管理学院
图书馆理论与实践 2020年1期
关键词:科技情报研究所机构

莫富传,冯翠翠(华中师范大学信息管理学院)

1 引言

随着信息基础环境的变革和知识经济时代的到来,知识已成为数字化时代人类社会交流的主要客体。而网络作为知识的重要载体,也存在通过共链进行知识的沟通、交流的现象。共链是指两个网页同时被第3个网页链接或两个网页同时拥有指向第3个网页的链接。[1]共链分析来源于文献计量学中的共引分析,引文分析中的基本假设在网络环境下具有可推广性,“共入链”相对于“共引”,“共出链”相对于“引文耦合”。[2]共链分析的主要目的是使网络结构可视化以及挖掘网络群体间的相互关系。链接分析假设网页间链接的存在,则表明网页间必然存在如内容相关性、结构相关性、功能相关性以及其他相关性等某种内在相关性;且若链接形式一样,则网页间内容联系的程度一样,对于每种内容间的联系均可定义相应的计量单位。[3]因此,共链数据在理论上可以显示网站之间的主题相似性,具有共链关系的主体之间存在着知识交流,共链分析对学术共同体的发掘、知识交流网络的特点以及相关的引导促进机制提供一定的研究参考。本文使用Xenu下载30所科技情报研究所网站的内链数据,并运行R语言程序从内链数据中生成共链数据,运用聚类分析和多维尺度分析(MDS)两种方法绘制聚类图谱,分析具有共链关系的科技情报研究主体之间存在的知识交流状况,为相关的引导促进机制提供参考。

2 文献综述

链接分析法运用网络数据库、数据分析软件等工具,利用数学(主要是统计学和拓扑学)和情报学方法,对网络链接自身属性、链接对象、链接网络等各种对象进行分析,以揭示其数量特征和内在规律,并用以解决各方面问题。[4]目前,链接分析进一步从内链扩展到共链,共链研究发现了关于组织关系的丰富信息。例如,大学网站的共链研究示了学术信息,[5]而商业网站的共链分析发现了商业竞争信息。[6]共链分析也应用于政府网站[7]和政治性网站,[8]这些研究形成了对这些组织的洞察力。

1996年,美国情报学家Larson通过Web网页共链关系观察网络空间的结构,利用Altavista搜索引擎获取数据并分析了地球科学、地理信息系统、卫星遥感3个学科的相互关系以及发展趋势。[9]此后,对共链分析的研究与日俱增。1999年,Boudourides等通过研究10个子域级网络服务器之间的共链关系,分析了参加“欧洲信息自组织协会”的机构之间的关系。Heimeriks等对新环境下不同究网络中的交流与合作模式进行了研究,将目前的信息交流模式分为三个层次:基于学术期刊的常规学术交流模式、基于项目合作的信息交流模式、基于网络链接的信息交流模式。他们选取生物技术、信息科学、人工智能三个领域,就三个层次在大学、企业、非营利性组织之间信息交流中的不同作用与功能进行了分析。[10,11]2003年,Thelwall等利用共链和耦合理论进行了网络中相似学术网站的发现与识别研究。2004年,Lennart探索了利用网络中的共链现象,发现不同学科之间意想不到的关系。[12]2010年,Romero-Fras等探讨了利用网络超链接数据来研究欧洲政治网站的可行性、洞察欧盟政治局势的可能性,证实了Web超链接数据的丰富性及其在研究社会政治现象方面的潜力,[13]表明网络超链接数据确实反映了欧盟的一些政治模式,基于链接计数的统计分析进一步证实一个国家的政治历史沿线存在显著差异。Vaughan对一组专注于疫苗接种网站的共链矩阵和内链内容进行了分析,发现支持疫苗接种的网站往往与支持疫苗接种的网站共链,这种现状同样适用于反对疫苗接种的网站。[14,15]在国内,范静以医学网站为例,研究发现与同一学科中网站的总共链强度越大,网站在这个学科中的地位就越重要。[16]王伟军等归纳总结了学术博客中链接的类型及功能,认为学术博客中的链接除了发挥社交性功能,更主要的是学术性功能。[17]上述研究表明,共链分析具有重要的理论价值和实践意义。

3 共链数据收集和处理

3.1 研究对象和获取工具

我国的科技情报研究所属于公益类科技信息研究机构,主要从事以“科技决策支持”为特色的信息分析研究、科技信息服务、新技术研发推广和先进服务平台管理、科技信息领域高级人才培养和继续教育培训、社团管理、媒体出版等业务,同时肩负着科技管理信息系统、科技报告服务系统、科技信息资源综合利用与公共服务中心、工程技术图书馆建设与发展的重任;定位于为政府部门提供决策支持,为企业、高等院校、科研院所和科研人员等科技创新主体提供全方位的信息服务;目标是成为科技信息领域的共享管理与服务中心、学术中心、人才培养中心和网络技术研究推广中心,成为国家科技创新体系的重要支撑,并在国家科技信息系统中发挥指导和示范作用。Xenu是一款用于检测网站链接有效性的绿色软件,支持从待测网站的根目录开始搜索所有的网页文件,对所有网页文件中的超级链接、图片文件、包含文件、CSS文件、页面内部链接等所有链接进行读取,一直到该网站所有页面中的所有链接都测试完后结束测试,并输出测试报告。[18]本文共获取了30家科技情报研究所网站的内链,各研究所网址和内链数(见表1)。

表1 30家科技情报研究所网站的网址和内链数

3.2 基于内链生成共链矩阵

本文运行Xenu程序,逐一下载科技情报研究所网站的内链数据,下载的内链数据文件被输入为本研究开发的R语言程序,以生成基于内链数据的共链矩阵。表2是每个网站的假设内链列表。

从内链生成共链的过程如下。首先,将网站1的内链列表与网站2的进行比较,并找出它们有多少共同页面。本例中,有两个页面(即两个共链),它们是 www.sti.cn/index.html和 www.info.com/index.html。其次,将网站1的内链与网站3进行比较,发现存在一个共链www.info.com/index.html。最后,将网站2的内链与网站3进行比较,找到两个共链www.sti.cn/news.html和www.info.com/index.html。这个简单但繁琐的计数过程由R语言程序完成。最终得到30家科技情报研究所网站共链矩阵(见表3)。

表2 网站的假设内链列表

表3 科技情报研究所网站共链矩阵

表3显示:上海科学技术情报研究所(186个)、河南科学技术信息研究院(124个)、陕西科学技术情报研究院(123个)、中国科学技术信息研究所(105个)和河北科学技术情报研究院(103个)等科技情报机构与其他机构存在较多的共链;四川、重庆、北京、福建和江西等地的科技情报机构与其他机构的共链数在70以上;江苏、吉林、黑龙江、云南、湖北等地的科技情报机构与其他机构的共链数较少;海南和西藏两地的科技情报机构与其他机构不存在任何共链。

3.3 绘制多维尺度分析(MDS)图谱

将上述科技情报研究所网站共链矩阵转化为Pearson相关系数(Pearson Correlation Coefficient)矩阵,运用多维尺度分析(multidimensionalscaling,MDS)方法绘制聚类图谱。MDS方法解决的问题是:当n个对象中各对对象之间的相似性(或距离)给定时,确定这些对象在低维空间中的表示,并使其尽可能与原先的相似性(或距离)大体匹配,使得由降维所引起的任何变形达到最小;多维空间中排列的每一个点代表一个对象,因此点间的距离与对象间的相似性高度相关。[19]也就是说,两个相似的对象由多维空间中两个距离相近的点表示,而两个不相似的对象则由多维空间两个距离较远的点表示;越是接近多维空间中间位置的对象,其重要性就越高。借助MDS方法能够可视化地展示具有共链关系的科技情报研究所的网站机构及其相互之间的知识交流状况。

图 科技情报研究所共链多维尺度分析图谱

从上图可以看出:上海、山东、江苏、安徽、内蒙古、贵州、天津、广东、河南、陕西、重庆、湖南、四川、重庆、北京、福建、江西等地的科技情报研究机构在整个多维空间中处于中间位置,表明其在整个科技情报研究机构知识交流网络中有较为重要的作用,与科技情报机构存在较多共链的情况基本一致;浙江、吉林、广西、黑龙江、云南、湖北、海南、西藏等地的科技情报机构处于整个多维空间的边缘位置,表明其在整个科技情报研究机构知识交流网络中的影响力较弱,主要原因在于这些科技情报机构的共链数较少。

4 我国科技情报研究所的知识交流类型

4.1 基于同行机构的横向知识交流

基于同行机构的科技情报研究所横向知识交流是指科技情报研究组织内相同层次之间的知识交流。这种组织内具有相同地位、职能等级之间的知识交流是协调组织行为、解决实际问题的重要途径。其表现形式主要有情况通报、有关文件的同级抄送、职能团队之间的沟通、相似工作经验的借鉴等。

为吸纳、借鉴先进规划理念和管理经验,提升服务,争创“一流”,各地科技情报研究所积极切合开放程度高、社会性强的特点,以拓展服务能力为目标,以加强管理、转变思路、扩大交流、拓展合作为重点,努力实现所际协同共享化、服务理念协同化。各地科技情报研究所进一步加强与国内同行科技情报研究所及科普、研究机构的交流合作,就管理运行、科教活动形式及内容、科学研究、人才培养、多媒体手段及新媒体应用、文创产品研发等问题进行交流,并在科普资源共享、科普产品交流等方面达成共识,交流数量、规格和层次呈现逐步提升态势,全面提升、拓展服务能力。如表4所示,中国科学技术信息研究、江苏省科学技术情报研究所、上海科学技术情报研究所等在本研究中与其他科技情报研究机构属于同行机构,均与同行机构存在共链关系,表明同行机构之间的横向知识交流较为活跃。

表4 基于同行机构的科技情报研究所横向知识交流

4.2 基于监管机构的纵向知识交流

基于监管机构的科技情报研究所纵向知识交流是指科技情报研究组织内不同层次之间的知识交流,主要是不同的权力结构之间、不同等级职能部门的上下级之间的知识交流,是组织内有制度保障和一定规范的知识交流。在我国,各级科技情报研究所一般归属科技部、科技厅和科技局管理,是本区域科技部门直属的公益类科技信息研究机构。科技情报研究所间基于监管机构的纵向知识交流,即科技情报研究所与上级科技部、科技厅和科技局间的知识交流。

从知识交流的方向来看,基于监管机构的纵向知识交流又分下行知识流和上行信息流。下行知识流是指知识从科技情报研究所的高层向低层流动。这种从上而下的知识流在科技情报研究组织中占据主导地位,对保持组织功能、明确组织目标、维护组织正常运行起着决定性作用。其表现形式有通知、文件、指令、会议精神等。下行知识流是指知识从组织的低层向高层的流动,表现形式有工作报告、情况汇报、请示、申请等。这种从下而上的知识流是组织内部知识反馈的主要途径,对了解组织运作状态、组织功能实现情况、组织效益情况等起决定性作用。表5反映了作为科技情报研究机构的监督管理部门的国家科技部及各地的科技厅、科技局、科技委员会与所辖科技情报研究机构间存在共链关系,相关的监督管理信息与知识得到了纵向交流。

表5 基于监管机构的科技情报研究所纵向知识交流

4.3 基于学术文献的网络知识交流

文献是知识的重要表现形式,可以通过文献的引用和被引进行知识的沟通、交流。[20]随着互联网技术的发展,网络已经成为学术文献的重要载体。某一网站由于电子文献的引用和被引关系与其他网站相互链接,通过分析网站间的链接关系可以在一定程度上反映该网站与其他网站知识交流的情况。

常用学术文献类型包括期刊、专著、论文集、学位论文、专利、技术标准、报纸、科技报告等。电子文献载体类型包括联机网上数据库、磁带数据库、光盘图书、磁盘软件、网上期刊、网上电子公告等。表6中,中国知网、万方数据知识服务平台、维普资讯中文期刊服务平台、EBSCOhost、SpringerLink等是面向海内外读者提供学术文献、外文文献、学位论文、报纸、会议、年鉴、工具书等各类资源统一检索、统一导航、在线阅读和下载服务;国家科技图书文献中心、各图书馆是是搜集、整理、收藏图书资料以供人阅览、参考的机构;国家科技报告服务系统、Orbit Intelligence专利检索与分析系统、国家知识产权局、中国标准服务网等则是提供科技报告、专利和标准等特殊文献资源的文献载体和来源。科技情报研究所大多通过馆藏或图书馆、文献中心等机构的馆藏资源为各领域的科学研究、科技创新和科技决策提供数据支撑。

表6 基于学术文献的科技情报研究所网络知识交流

4.4 基于服务的全方位知识交流

科技情报研究所主要从事以“科技决策支持”为特色的信息分析研究、科技信息服务、新技术研发推广、服务平台管理、人才培养、协会管理、文献出版等业务,同时肩负着国家科技管理信息系统、国家科技报告服务系统、国家科技信息资源综合利用与公共服务中心、国家工程技术图书馆建设与发展的重任。

各科技情报研究所基于自身角色定位和公众需求,以先进的技术、丰富的资源、科学的态度,持续提升科学研究、公益服务、决策支持和技术研发能力,以更加开放的理念,为各级政府、科研院所、各类创新企业、个人提供及时、准确、公正、客观科技信息及技术服务。如表7所示,各科技情报研究所虚拟的互联网空间里提供科技情报分析所必须软件的研发与下载、科技情报查新与咨询、科技新闻报道、技术交易、企业服务等科技信息服务。在服务过程中,注重携手国内外同行,与科技情报网、相关科技情报质询公司、科技咨询协会等社会组织,开展全方位的交流合作和对外服务。

5 我国科技情报研究所的知识交流的特点

(1)从整体上看,我国科技情报研究所秉持开放办所的理念,积极开展国内外交流与合作。各科技情报研究所与国内同行科技情报研究所在科普资源共享、科普产品交流等方面达成共识,全面提升、拓展服务能力;与同专业和地方科技情报服务机构开展了广泛而深入的交流与合作,共同提供战略研究、科技咨询及科技评估等服务。此外,还与开设图书情报与档案管理学科的高校在人才培养、学术研究等方面建立了常态交流机制。

表7 基于科技信息服务的科技情报研究所全方位知识交流

(2)从科技情报研究所的共链矩阵分析可以看出,知识交流网络的核心主要集中在少数几个科技情报研究所,上海科学技术情报研究所、河南省科学技术信息研究院、陕西省科学技术情报研究院、中国科学技术信息研究所和河北省科学技术情报研究院是科技情报研究所内部知识交流的核心。科技情报研究所共链数和类型结构差异较大,网络中大多科技情报研究所不具有控制其他机构知识交流的能力。

(3)科技情报研究所知识交流类型和程度差异较大,同行机构内部知识交流较为集中。上海科学技术情报研究所、河南省科学技术信息研究院、陕西省科学技术情报研究院、中国科学技术信息研究所和河北省科学技术情报研究院的共链数均大于100,其他大多数机构的共链数在20-80之间,黑龙江科技情报研究、湖北科技信息研究院、云南科学技术情报研究院、西藏科技信息研究所和海南省科学技术信息研究所的共链数小于10,表明各机构之间的知识交流呈现明显的两极分化。同时,机构间的知识交流以上下级的纵向交流和同行的横向交流为主,对外的知识服务和以学术文献为载体的知识传递相对欠缺,表明科技情报研究所内部知识交流较为集中,对外辐射能力不足。

(4)科技情报研究所在机构内部知识交流中的位置和整体状况与该机构的社会影响力大小无绝对的关系,科技情报研究所网络刊文质量、办所规模以及跨行业程度都会对其产生影响。

6 结语

总体来说,我国科技情报研究所积极开展国内外交流与合作,知识交流类型和程度差异较大,同行机构内部知识交流较为集中,机构内部知识交流中位置与该机构的社会影响力大小无绝对的关系。因此,本文提出以下建议。① 对于共链数较多科技情报研究所,为更好促进自身发展、提升本机构在整个科技情报知识交流中的地位,可以适当扩大科技情报服务规模和业务范围,增加与其他科技情报研究机构、服务机构以及企业、高校进行知识交流的机会。② 对于共链数较低的科技情报研究所,应该根据当地实际和社会需求,调整机构规模和业务范围,同时注重网络服务平台的建设和网络链接质量的改善,提高知识服务质量,提升知识交流水平。

猜你喜欢
科技情报研究所机构
基于数据工程的国防科技情报生态体系构建
睡眠研究所·Arch
睡眠研究所民宿
未来研究所
铜陵市科技情报工作存在的问题与发展对策
试论市场经济条件下农业科技情报自动化发展策略
昆虫也会便便吗?
加强科技情报档案管理工作的建议
一周机构净增(减)仓股前20名
一周机构净增(减)仓股前20名