网络资源类别体系构建分析

2009-07-07 10:02
现代农业科技 2009年21期
关键词:分类法网络资源评价

王 琛

摘要分析了网络信息的分类方法,并对比了不同分类设置的优势及不足,提出借鉴传统分类法的优点并结合网络信息资源的特点,对网络信息资源进行有效组织,构建分类目录体系。

关键词网络资源;分类法;分类目录体系;评价

中图分类号TP393文献标识码A文章编号 1007-5739(2009)21-0304-02

网络中的许多站点都有网络分类目录供用户查询,它往往是一种浏览型目录,使用自然语言作标识,这种信息辅助查询方式由专家从茫茫网海中挑选出质量较高的网页,依照某种分类法进行组织,并和检索法集成在一起。网络目录具有浏览方式直观、查准率高等特点,尤其适应检索目的不明及网络新手的网络信息检索。网络的使用对象涉及所有的终端用户,这就要求网络的类目体系简明、易于使用,使用户不经过预先了解,就可以通过类目表进行查找。因此,类目体系应具有更强的通用性、直接性,并且能满足从各种不同的角度查找的要求。

1网络信息分类方法

1.1网站自行设计的分类法

一是主题分类法。主题分类法的特征是1个主题充当1个类目,类目像主题词表一样按字顺排列,而不是依逻辑顺序排列。1个类目又可以分为若干细目,同位类的细目也是按字顺排列,这种分类法实质上是分类法和主题法互相融合的产物。大多数网络目录只选取一些热点事物作为主题类目,如汽车、房地产、计算机、因特网、教育、健康等。主题分类法一般设置14~18个一级主题类目,层次多为4级,最末一级就是列成表的超文本链接点,每个链接点伴有编辑对网页的简要介绍。主题分类法将与该事物相关的内容全部集中在一起,如汽车大类下包括汽车制造、交易、维修、博览会、汽车书籍和杂志、各种汽车、赛车、高速公路、运输等子目录,它以事物为纲,而不以学科为纲,适应交叉学科的主题。但主题分类法容量太小,对网络资源的覆盖率极为有限,如Yahoo、Lycos、Infoseek、网易等。二是分面组配法。分面组配的原理是,首先确定几个分类标准,即分面,再确定每个分类标准中的若干特征值,即类目,每一个分面的类目与其他分面的类目分别组配,形成许多组配类目,达到细分的目的。中华搜索引擎“中华网目”采用了分面组配分类法。系统设计了2个分面,第1个是地域分面,分为2层,一级类目为省、市、自治区,二级类目为城市。第2个分面是主题分面,一级类目有政府/组织、财政/工商、旅行/观光/旅馆、媒体/出版等几个主题类目,各类目又可分为若干子类目,共有2层。查询时,2个分面的类目以及细目可以两两组配,组成细目分类。如查询有关西安市旅游景点的网页,从地域分面进入类目“陕西”,再进入子类目“西安”从主题分面进入“旅行/观光/旅馆”,再进入子类目“观光景点”,系统自动将“西安”与“观光景点”组配,输出相关的网页链接点。分面组配法专指度高,因而具有较高的查准率,但要提高分面组配法的容量,需要进行分面分析,编制周密的分类方案,才能获得良好的效果。对于庞大的、瞬息万变的网络资源来说,编制一个大型的分面分类方案是很困难的。

1.2套用图书分类法

为了提高分类方案的容量,对网络信息资源进行大规模的组织与整序,网络目录的设计者将目光投向大型图书分类法,也就是体系分类法,如DDC、UDC、LC和《中图法》等。

2网络分类体系大类设置

基本大类的设置在整个分类体系中占有十分重要的地位。它是分类体系的一级类目,是分类法基本框架的体现,也是所含信息内容范围的划定。基本大类的设置与检索工具的性质、学科发展水平及信息资源的数量密切联系,通常应做到类目划分均衡、涵盖面广。传统的文献分类法一般以学科为中心设置基本大类,从学科角度来展开类目。早期的文献分类法,如杜威法,由于当时学科门类不多,基本大类仅设置了10个,比较概略。尔后编制的分类法逐渐增加了大类数目,一般以传统学科领域为基础,基本大类保持在20个左右,如《国会法》21个、《布立斯书目分类法》22个、《中图法》22个、《科图法》25个。与传统分类法不同的是大多数网络分类工具的大类设置放弃了以学科为中心来确定类目结构的传统,而采用以主题为中心或主题学科相结合的设类方式,形成与传统分类法不同的直接性、通用性相结合的类目设置方式。大类的数量一般保持在14~18个。另外,这些分类法还着重考虑信息量、信息内容的重要性及使用频率。表1为2008年4月所查6个国内外比较典型的分类搜索引擎的大类体系。

从表1的大类体系的划分来看,国内外网络分类目录在类目设置方面有以下特点:一是采用以主题为中心或主题与学科相结合的2种设类方式。该方式直接性和包容性好,使用十分普遍。从表1可以看出,除Magellan的大类基本以主题、对象为中心设置外,其他搜索引擎在不同程度上采用了主题对象与学科相结合的设类方式。二是突出热门类目。将那些重要的、信息量大的、用户感兴趣的、访问频率高的类目设为一级类目,突出其类目级位,方便用户检索。如搜狐主页将“新闻媒体”、“卫生健康”、“社会文化”、“娱乐休闲”等设为一级类目,与“社会科学”并列。相反地,大类的设置弱化了科学技术、学术性类目的设置。三是提供多维检索入口。除按主题、学科设类外,一般还从地区、资源类型、机构等角度设类,便于用户从不同角度检索,如Yahoo、Hotbot、搜狐等都提供从地区和资源类型检索的入口,网易还直接将个人主页、公司企业等设为一级类目。

3网络分类法的评价

3.1网络分类法的优势

(1)类目收录范围宽泛。类目体系展开时,其下位类不仅收录该类的从属类目,而且收录各种相关类目。例如在舞蹈类下设“舞蹈家”,在娱乐类下设“书商”,从而使得一些类目的下位类数量大大增加。如Yahoo各大类下,除区域类比较特殊、二级类目较少外,其余二级类目远远高于传统文献分类法同级类目的数量。

(2)以事物为中心设置类目。绝大多数网络分类体系为便利用户使用,极少按学科来设置类目,而主要以检索的事物为中心来设置类目。以中文搜索引擎为例,如搜狐“电脑网络”中的“软件”、“游戏”、“下载”、“壁纸”,又如在“娱乐休闲”中的“影视”、“音乐”、“写真”、“明星”等,都是根据用户的需求,按事物组织相应资源的类目设置架构。

(3)多重列类,重复反映。由于网络信息资源的易重复反映性,网络分类体系也形成了该特点。采用多重列类方法组织网络信息资源,便于用户从不同角度进行检索。多重列类通常是通过采用多个分类标准,同时还可以在多个划分标准的基础上,根据不同类目的特点,采用不同的引用次序列类。如新浪“社会科学”类下采用“主题对象”、“学科”、“资源类型”3个划分标准,方便用户选择自己最适当的检索途径。国内搜索引擎对文学作品类的设置,大都采用不同的引用次序组织类目:体裁-国别-时代-题材;国别-体裁-时代-题材;时代-国别-体裁-题材;题材-体裁-国别-时代。

(4)直接以语词组织信息。网络分类法放弃了传统分类法以标记符号表达主题的方式,直接以语词表达类目体系。这是由于传统分类法的主要作用之一是便于文献的分类排架,方便读者查找,而采用链接技术链接网络文献,比使用分类标记更为直观,易于理解。

(5)动态设类。根据使用需要组织和显示相关资源,使分类体系能及时反映用户需求与资源的变化。如通过设置镜像类目,以链接的方式,在春节、圣诞节、重大事件前提前设置有关类目(如奥运会期间,可将“奥运赛事”等类目突出反映),事后可取消该镜像类目。网络分类法的动态性是传统分类法无法比拟的。

(6)结合屏幕特点进行智能化显示。搜索引擎系统一般都会结合屏幕特点,排列同位类,揭示类目间关系,排列检索结果,方便用户使用。搜索引擎对同位类的排列是依据名称顺序,或者依据用户检索频率排列。在显示查询结果的时候,搜索引擎会按其相关度计算法计算出目标文献与用户检索词的相关度,然后按照这个标准进行排列。这样显然大大减少了用户二次手工筛选命中文献的工作量。

3.2网络分类法存在的不足

(1)缺乏系统性和完整性。一个完整的综合分类法在划分基本大类时应该全面涵盖所涉及到的知识领域,而目前的一些搜索引擎往往只从商业角度来吸引用户,增加点击率,缺乏从知识体系的角度来分类,许多重要的知识领域没有涉及,使体系的系统性与完整性大受影响。如悠游未设置自然科学和政治大类;雅虎基本大类中没有工业类和农业类等基础性类目,而作为二级、三级类目或分散到其他类目中,这就加剧了集中与分散的矛盾,也造成知识体系的混乱。

(2)类深度把握得不恰当。在目前的网络带宽和速度下,如果分类级别过深,虽然会使整个系统逻辑性更强,但是会浪费用户大量的时间,可谓得不偿失。减小分类深度必然是以扩大宽度为代价的。如果用户查找一个主题到第5级子类目时仍没有结果,就会放弃本次查找而转向别的类目;如果类目划分得过简,则会在查找专业信息时感到茫然。考虑到大多数用户的心理,网络信息资源分类的深度以4级为宜,最多不超过5级。当然,解决网络分类中的级别问题须视类目情况而有所不同。如医学类经过多年的发展,其学科分类已经比较成熟,原则上可以沿用,而经济类和计算机类等处在高速发展时期,其类目分级不断出现新情况,则应更多地考虑到类目的扩充性。

(3)目归属存在不合理现象。主要表现在:类表在确定类目下位类时,相关类收录范围太宽,又没有必要的解释,用户无法判断其外延。如Infoseek中出现按“儿童和家庭-教育-图书馆-大学图书馆”展开的序列;有的类名不确切,不能概括类目的内涵。

(4)类目划分随意性大。多重列类、重复反映是网络信息资源揭示的特点,也是网络分类体系的优势所在。但是目前的网络分类法在类目的排列上缺乏适度控制,随意性大。如在同位类排列时采用多重标准,而每一种标准使用时又不完整,有时还同时列出不同等级的类目。例如:雅虎大类中“艺术与人文”、“社会与文化”、“社会科学”三者并列;搜狐中将“动物医学”重复反映在“卫生与健康”类下。此外,单一的重复反映并不就能代替相关关系的揭示,将具有相关关系的类目过度集中在1个类下,虽然可以提高检全率,但会大大影响检准率。因此,如何借鉴传统分类法的优点,结合网络信息资源的特点,对网络信息资源进行有效组织,是值得深入探讨的问题。

4参考文献

[1] 马费成,李纲,查先进,等.信息资源管理[M].武汉:武汉大学出版社,1997.

[2] 周带娣.农业科技创新与文献信息开发利用的机制分析[J].湖南农业大学学报(社会科学版),2003,4(1):88-90.

[3] 孟祥红,孟祥云.河北省推进区域创新体系建设的思考[J].中国科技成果,2004(11):14-16.

[4] 梁春阳.中国西部地区信息服务业发展研究[M].银川:宁夏人民出版社,2002.

猜你喜欢
分类法网络资源评价
Algoblu发布NEV网络资源虚拟化平台
利用网络资源学习日语的现状及分析
基于网络资源的《物联网工程导论》课程教学改革
2006—2016年度C—NCAP评价结果
2006—2015年度C—NCAP评价结果(3)
2006—2015年度C—NCAP评价结果(2)
2006—2015年度C—NCAP评价结果
《中国图书馆分类法》
《中国图书馆分类法》
《中国图书馆分类法》