周文博 傅荣贤
(1.黑龙江大学信息管理学院 黑龙江哈尔滨 150080;2.黑龙江大学信息资源管理研究中心 黑龙江哈尔滨 150080)
随着信息时代的到来,中国目录学正处在从古典目录学向现代目录学迈进的初期阶段。〔1〕近年来,有关目录学研究回顾和展望的定性分析论文屡见不鲜,但定量分析论文却寥寥无几,而且在为数不多的定量分析论文中,研究方法也仍停留在文献计量学的相关领域,由于文献系统的高度复杂和不确定性,其分析结果的准确性和实证性也有待加强。而信息计量学作为文献计量学的发展方向〔2〕,在计量对象的广泛性和计量结果的准确性方面都有很大提高。本文通过信息计量学中作者共被引分析(Author Co-citation Analysis,ACA)的相关方法,运用信息可视化技术绘制出作者共被引图谱,在直观形象地揭示目录学研究的学科结构、学科力量分布及研究热点的同时,将定性分析具体化,从而以更新的角度更科学深入地反映出目录学的发展现状,并进一步预测其发展趋势。
高影响力作者的选择是ACA分析的关键一步,目前尚无统一的选择方法。为了更突出所选作者的高影响力,本文采用h指数这一国际上学术评价的新指标,即“h篇论文分别被引用了至少h次”作为统计标准,这不仅表明评价对象的发文质量高,也表明其发文数量多。〔3〕
在数据库选择上,为了使检索结果更全面,我们选择了中国学术期刊网全文数据库(CNKI)中的中国学术期刊网络出版总库(CAJ)作为数据来源。首先,以“目录学”为检索词,时间跨度为1950~2011年,分别按题名、关键词和主题,以精确匹配方式进行检索,再通过阅读标题、关键词和摘要,排除不相关文献、重复文献及书评、人物传记等,得出有效文献4236篇。检索时间为2011年11月30日。同时为了更好地反映作者的学术关联程度,又剔除了10篇可能对作者共被引分析结果造成影响的综述性论文,如文献〔4〕。然后将剩余4226篇文献的题名、作者、被引次数信息导入Excel表格,计算每位作者的h指数。经过统计,h指数为3及以上的作者16人,占总作者人数的4.34%。另外为使分析结果更加精确,笔者将h指数为2且总被引次数较多的头两位作者也划入高影响力作者群体中。由此共检索出高影响力作者18人。如表1所示。
表1 高影响力作者分布
对表1进行分析发现,18位高影响力作者中有17位分布在高校,其中有11位教授,并且有半数以上为博导,除此之外还有5位来自高校图书馆,他们凭借丰富的理论知识和实践经验构成了目录学研究的核心群体;同时从作者的教育背景看,有11位毕业或就职于武汉大学,4位毕业或就职于北京大学,可见武大和北大是我国目录学研究领域的两支主要力量,这主要因为两所高校均是百年学府,为目录学兴盛奠定了深厚的文化基础。
高影响力作者选择后要建立共被引矩阵。为此,本文采用了在CAJ下载文献集合,进行逐篇统计作者共被引次数的方法。这种方法虽然繁琐,但经过多次排查可以提高统计结果的准确性并能有效降低漏检率。但应该注意两点:1、部分文献对高影响力作者的论文多次引用,要避免重复统计;2、要确保每篇被引用的高影响力作者的论文满足检索条件,即在目录学范围之内。将统计完的共被引次数输入矩阵,共得到(18 17)/2=153组不同的数据。该矩阵为对称矩阵,对角线取该作者和其他作者共被引次数最大值+1来表示〔5〕。如表2所示。
表2 作者共被引矩阵(部分)
共被引矩阵建立之后需要对其进行标准化处理,以便更好地观测相似性。但可以将其作为输入矩阵在SPSS(Statis-tical Product and Service Solutions)软件的聚类和多维尺度分析中自动实现,无需把转化后的矩阵作为输入矩阵。〔6〕
本文采用的聚类方法是分层聚类,其原理是将每个作者看成一类,然后把距离最近的两类依次合并,直到把所有作者归为一类。这种聚类方法可以获知同行作者的数量、构成、活动规律等多方面情况,若把某专题研究的同行作者联合起来,加强学术交流,开展联合攻关,将大大促进目录学研究的深入和发展。〔7〕将表2导入SPSS17.0,采用组间平均链锁法(Between-group Linkage),不相似测度方法选择平方欧氏距离(Squared Euclidian Distance),标准化方法选择Z得分,以减少计算误差,得到聚类分析树状图。如图1所示。由树状图可直观看出18位高影响力作者被分成四类,这也是目录学研究的4个主要团体。如结合作者的发文情况,可进一步归纳出这四类研究团体的主要研究方向。第1类主要是古典目录学方面。第2类主要是国外目录学和近代目录学家研究方面。第3类主要是目录学基础理论方面,即目录学定义、研究对象、研究方法等问题的商榷与探讨。第4类各方面均有涉及,尤其在数字目录学、书目情报等前沿问题上有较深研究。
图1 聚类分析树状图
第1类研究群体中有傅荣贤、王国强、程焕文和乔好勤,后3人均毕业于武汉大学,说明武大在古典目录学研究方面处于重要地位。
第2类研究群体中作者的共被引次数相对较少,这主要因为他们的研究方向虽大致相同却各有侧重,在国外目录学研究中,王京山侧重英美、王锦贵和陈光祚侧重苏联(俄国),司莉则侧重西方描述目录学;在对近代目录学家研究中则包括康有为、梁启超和王重民。
第3类群体人数最多,共有6人,说明这一群体的研究内容是当前整个领域的热点。其中刘国华、李志来自湖北经济学院图书馆,张洪元、王友富和黄先蓉毕业或就职于武汉大学,这也显示了学术群体的地域性和学术思想的传承性。
第4类只有彭斐章、柯平和王新才,其被引次数分居前三位,共被引矩阵也显示出三人共被引次数最高,可以说是目录学研究领域的学术带头人。他们的研究方向为数字目录学、书目情报等前沿问题,同时对整个领域内的各个研究方向均有涉猎,与每个研究群体都有交叉,说明三人在目录学研究领域处于核心地位,影响最大。
多维尺度分析是分析研究对象相似性或差异性的一种多元统计方法,在多维尺度分析图中,各点之间的距离显示了作者的相似性的高低。〔8〕将表2导入SPSS17.0,测度方法选择平方欧氏距离,标准化方法选择Z得分,分析结果如图2所示。
图2 多维尺度分析图
Stress和RSQ是多维尺度分析的信度和效度估计值,Stress是拟合量度量,其值越小说明拟合度越好,一般在0.2以内是可接受的;RSQ值越大越好,在0.6以上是可以接受的。〔9〕在本次多维尺度分析中,Stress=0.12651,RSQ=0.92468,说明分析模型的拟合度较好,能反映出目录学领域作者的学术关联。
从图2可以看出,第1类作者分布在第三象限,除傅荣贤和王国强外,其余两位均不够紧密,结合发文情况可以发现,4人研究方向虽大致相同,但程焕文对英美目录学有所涉猎,乔好勤对目录学理论、专科目录学和目录学教育都有所分力〔10〕,而傅荣贤和王国强聚类紧密,还因为二人都对出土简帛有所关注,这表明古典目录学的研究对象有所拓展。第2类作者较为分散,大都分布在一二象限,由于作者研究内容差异,所以作者间交叉力度不大。第3类群体之间距离较小,说明他们的关联程度较大,而且这个群体处于Y轴最右方,说明其研究内容是整个目录学研究领域的基础。第4类群体处于整个象限的中心区域,周围各群体均有向其靠拢之势,说明该群体在整个领域中处于核心地位,其研究内容对整个领域具有指导作用,其中第3类群体与之最近,说明受其影响最大。这与聚类分析所得结果基本一致。
多维尺度虽然可以较好地观察到变量之间的关系,但只能体现相似性,无法显示变量之间的强弱关系。〔11〕因此将表2导入社会网络分析软件Ucinet6中,得到作者共被引网络图谱(如图3所示),可以很好地展现各作者间的联结关系。图3中圆点代表各高影响力作者,连线代表他们之间的共被引关系,其中线条越粗代表两位作者共被引次数越多,其研究领域也越相近。〔12〕从图3可以看出中间部分作者连线较粗,表明共被引强度大,研究方向相似。其中彭斐章、柯平和王新才处于中心地带,且三人之间连线最粗,说明其共被引强度最大,对其他作者影响也最大,这与以上分析结果相符。
图3 作者共被引网络图谱
通过上述分析可以获知我国目录学研究的一些基本情况。首先,作为一门古老的学科,我国目录学正在与时俱进,处于从古典时期“辨章学术,考镜源流”向现代书目情报服务拓展的过渡时期,群体4主要引领整个领域的前进方向,其作者论文被引次数较高,利用率高,但由于人数较少,说明尚处于现代目录学的发展初期。同时整个领域的研究热点仍集中于基础理论研究,说明学科发展尚不成熟。其次,目录学领域研究已形成核心研究群体和研究方向,这些核心群体对其他研究群体和个人影响很大。再次,研究群体有明显的学术带头人,其被引次数相对较高,同时该领域与其他学科有一定的交叉和融合,不但有其他学科的作者在进行目录学的研究,如司莉研究方向为知识组织与知识管理,而且从发文情况看,越来越多的研究者也将注意力放在与网络、信息和计算机相关的书目情报上。最后,可以看出,今后一段时间内我国的目录学研究仍会以数字目录学和书目情报为前沿,这也体现了信息化、数字化的时代要求。
1.王新才.中国目录学:理论、传统与发展.北京:国家图书馆出版社,2008:98-99
2,7.邱均平.信息计量学.武汉:武汉大学出版社,2007:9-408
3.刘圣君,屈宝强.我国图书馆联盟研究的作者共被引分析.新世纪图书馆,2011(8):67-68
4.郑永田.2000年以来我国目录学研究综述.图书馆杂志,2008(1):2-7
5,6.邱均平,马瑞敏.网络环境下ACA方法的应用研究.图书情报工作,2008(2):85-87
8,9.谭荣波,梅晓仁.SPSS统计分析实用教程.北京:科学出版社,2007:145-166
10.郑永田.试论乔好勤目录学思想.图书馆论坛,2008(2):97-100
11,12.邱均平,马瑞敏,李晔君.关于共被引分析方法的再认识和再思考.情报学报,2008(27):69-74