朱海燕
(安徽大学管理学院,安徽 合肥 230601)
朱海燕 女,1988年生,2010级图书馆学研究生。
随着计算机技术的迅猛发展,网上信息急剧增长。面对海量无序、内容繁杂的网络信息,如何对其有效地进行组织,成为网络信息使用者关注的重点。在目前网络环境下,采用分类法进行信息组织主要有两种方式:一是人工标引方式的传统文献分类法,二是以人工标引或自动标引方式采用自编的网络信息分类法[1],如搜狐网。笔者以搜狐网和《中图法》为例,对网络信息资源分类法与传统文献分类法进行比较,并分析其特点,指出其不足及完善之方法。
网络信息分类法是按主题为中心或按主题与科学相结合为立类原则,从方便用户使用的角度出发,采用自然语言来命名类目。通过层层划分,逐级展开类目。例如,搜狐网根据网站的主题,首先把网站分为18大类,再按细分主题层层分下去,从而形成一个“树技状”分类结构,再根据不同用户的使用习惯,以及不同的分类方式,把不同类目下“相关”的类目“链接”起来,从而形成搜狐的“网状”分类体系。其中以主题分类为主设立了娱乐休闲、新闻媒体、工商经济、公司企业、电脑网络、教育培训、文学、艺术、体育健身、卫生健康、科学技术、生活服务、旅游交通、社会文化、政法军事、社会科学、个人主页17个大类[2],另外结合分面组配的方法设立国家与地区,把其他17个大类下的所有网站又按所属地域进行分类。
传统文献分类法是等级列举式结构的分类体系,以学科和逻辑划分为标准展开严密而深细的类目划分,并以高度规范化的代码和语词为标识来揭示和组织信息,用等级体系以及参照、注释、互见、交替等方法来直接显示类目之间的知识关联,比较全面客观地反映了知识全貌及其内在的逻辑关系[3]。如《中图法》以自然科学、社会科学、哲学作为人类知识领域的基本构成建立基本序列,并将作为社会主义分类法编制指导思想的“马克思主义、列宁主义、毛泽东思想、邓小平理论”和结合文献特殊性设置的“综合性图书”作为部类,形成5个部类的基本序列,22个基本大类。其中按学科立类的有17个,按主题立类的只有5个:A马克思主义、列宁主义、毛泽东思想、邓小平理论;T工业技术;U交通运输;V航空、航天;Z综合性图书。
网络信息分类系统分类标准较传统分类法更加多元化。它采用以主题为中心或者主题与学科相结合的两种方式立类,类目之间逻辑关系不够严密,不需要以标记符号来表示类目之间的关系,主观上不存在分类标准的使用数量问题,客观上每一等级的划分都使用了多重分类标准,划分后子类之间的内涵是相互交叉的。例如在搜狐网的新闻大类中,将其划分为国内、国际、社会、军事、财经、IT、体育、娱乐、教育、文化、旅游、健康等这些二级类目。其中,国内、国际是根据新闻发生的地点进行的划分;军事、体育是按照学科进行的划分;娱乐、财经等是根据主题进行的划分。而在国际和国内新闻中也包括有军事、财经、娱乐等多种类型的新闻,财经、娱乐等也囊括有国内和国际的新闻。因此,其各子类之间的内涵是相互交叉的。
传统文献分类法是将知识的学科范畴属性层层划分,以代码为标识对信息分门别类地予以揭示和组织成系统。在分类标准的使用数量上,一般要求一次划分采用一个分类标准,必要时再采用两个或两个以上标准。如《中图法》主要是从科学分类和知识分类的角度来解释文献内容的区别与联系,按学科和专业集中文献,提供从学科和专业角度检索文献的途径,如I24小说,就是按照小说的题材,将其划分为革命斗争小说、军事小说、史传小说、经济政治小说、科学科幻小说、惊险推理小说、社会言情小说等。
网络信息分类法采用的类目名称比较随意,多采用自然语言命名类目,旨在便于用户理解和使用。不少类目名称不够科学,没有准确地表达类目的内涵和外延,多是网民常见的俗称、简称、习惯用语。
传统文献分类法所使用的类目名称能够确切表达类目的实际内容范围,内涵、外延清楚,通常采用科学、规范、通用、稳定性高的术语或译名。如《中图法》一级类目中的“政治法律”、“军事”、“经济”、“文学”、“艺术”等,让用户能够清楚明了地知道各大类的主要内容。
网络分类法类目展开主要是结合超文本技术的应用,采取多维结构,从多个角度设置类目、展开类目体系。如搜狐网提供了从地区和资源类型角度的检索入口,是一种不同于传统线性序列的网状结构,从不同角度对主题关系进行揭示。如检索娱乐方面的信息,可以从国内、国外地区开始检索,同时也可以从电影、电视、音乐、戏剧等多个角度进行精确全面的检索。搜狐网中,对于子类目同属于几个大类的类目,使用链接方式,将其在相应类下重复反映,使其同时成为有关类目的有机组成部分。如搜狐网中新闻、体育等大类中都包含国内、国外二级类目,都在其大类下列出。
传统文献分类法类目展开基本上采用线性序列。如《中图法》分类体系中采用的是从属关系、并列关系、交替关系和相关关系4种关系类型。从属关系、并列关系是类目体系展开的主要线索,反映了类目的纵向联系;交替类、类目参照则是对类目体系主要关系的补充,揭示被类目体系分散了的横向联系。通过二者的结合,文献分类法按照类目之间的关系建立起了纵横交叉、严密而又实用的分类体系。
类目交叉关系的处理是指涉及多个学科或主题的类目在不同学科或主题下的揭示和反映。网络信息分类系统对类目交叉关系的处理采用类目重复反映的方法,也就是涉及多个学科的主题在多个类目下重复设置。如搜狐网中“体育”、“财经”等既作为一级类目,同时又是“新闻”中的二级类目。
传统文献分类法对类目交叉关系的处理有3种手段:一种是设置交替类目。对于与两个学科有关、可以隶属于两个科学部门的学科或类目,根据需要将一个类目设为正式类目,将另一个类目设为供选择使用的交替类目。其次是作注释说明。对于一类事物的总论和分论,一般在总论的类目下说明“总论入此,专论入有关各类”,或注明总论与分论的关系。第三是设参见项。对具有交叉关系的两个类目,互设参见。《中图法》运用组配技术主要有3个方面:一是编制各种类型的复分表,作为全表或某个局部组配复分的依据;二是采用部分类目仿照已列出的类目进行细分;三是主类号之间使用冒号直接组配,合成新主题。
网络信息分类方法是直接面向用户的,没有注释,类目间的横向联系采用交叉列类,类目的内容注释则以有选择的列举下位类方式为主,便于链接[4]。在搜狐网中可以在主页中看到各大类,然后直接选择各大类进入新页面,进行下一步选择。
传统分类法的类目注释是标引人员的重要参考,也是读者使用分类目录的参考。除了说明类目含义的注释外,还有大量的归类方法注释、组号方法注释、参照注释等。
网络分类搜索引擎能提供多个检索入口,适应各种类型终端用户的需要。它不同于传统分类法的线性结构,网络信息分类法从多角度利用文本技术和链接技术进行全方位的分类揭示,为其大类体系提供了多维检索入口。如搜狐网除从信息资源的主题角度设类外,一般还同时从地区、资源类型、机构等角度设类。如设立“国家与地区”大类提供了地区检索的入口,设立“视频”、“博客”、“图库”等提供了资源类型的检索入口,设立“公司企业”提供了机构检索的入口。
网络信息用户主要是通过类名来识别和选择检索途径。网络信息分类法采用自然语言标引,简单易懂。用户可以根据类目直接进行检索。如用户登录搜狐网后,在主页上可以直接选择“娱乐”、“体育”、“健康”等类目,进行信息浏览。
网络分类法采取以主题为中心或按主题与学科相结合的类目设置方式,增强了类目的包容性。从便于用户使用的角度出发,根据用户使用需要列类,突出了与用户生活息息相关的如教育、娱乐、旅行、生活等普通用户感兴趣的类目,弱化科学技术、学术性类目的设置,便于用户检索。如搜狐网将“娱乐休闲”、“旅游交通”、“卫生健康”等用户需求量高的类目单独设为大类,置于首页之上,极大地方便了用户查找。
由于网络信息具有高度的动态性,各种信息处于不断更新的状态中,它所链接的网站、网页也处于变化之中[5]。所以要求网络信息分类体系具有跟踪动态发展的能力。网络分类引擎利用超文本技术,根据需要动态调整类间关系,这种类间关系一旦不需要,可以随时取消,出现新的类目关系也能够及时添加。
一个完整的综合性分类体系在划分基本大类时应将所涉及到的知识领域全部涵盖进去,而目前的搜索引擎往往只从商业角度出发设置类目,因此体系的系统性和完整性受到很大影响。从类目设置情况来看,搜狐网有18个基本大类,涵盖的知识不够全面,也没有形成较为完整的科学体系,有些信息难以归类。如教育大类中,有高等教育,无中等和初等教育;有国内院校,无国外院校。
网络信息分类采用自然语言设置类名,虽然直观易懂,但是大量口头语言、网络语言的使用使得类目名称不规范,有时给用户查找带来困难,难以查到真正需要的东西。如搜狐网一级类目中的“女人”、“原创”等,不熟悉的话不能准确地查找出所需信息。
目前许多网络信息分类法未能严格地按照概念的内涵和外延科学归类,以用户感兴趣的内容设置类目,对于用户使用较少的信息没有设置类目。因而,这种分类法不是科学的分类法,并未从知识领域、知识体系的角度分类。如《中图法》中“工业技术”、“语言文字”等一级类目并没有出现在搜狐网的类目中。搜狐网的大类设置使用了主题对象、学科、地区、文献类型等多个标准但其类目之间逻辑性不强,类目归属存在不合理的现象。这种分类使得类目层次不一,破坏了分类的等级结构和系统性,影响了类目体系的清晰度,在一定程度上干扰了用户的检索,降低了查准率。
网络信息分类法普遍存在着分类体系不统一的问题。在类目的划分、排列上都存在很大差别。类目采用多重列类使得同一个子类目出现在不同大类下,类目划分层次也参差不齐,有的类目划分为两三层,有的类目则多达十几层。用户从分类途径查找某个类名,往往要链接10多个页面,既费时又费力。最常见的是逻辑关系比较混乱,常出现隶属关系不清的现象。例如搜狐网中,从“文化”大类入口查找小说,需再选择“读书”大类,在“读书”大类中可以看到“小说”子类目,可是该“小说”子类目属于“听书”上位类,检索出来的小说不是文本格式的,而是音频格式的,这样用户花费时间找到的并不是自己所需要的信息,而文本格式或在线阅读的小说应该从“文化”大类下的“原创”子类入口查找。
分类法中基本大类的设置应将稳定的、较为概括的学科或知识领域作为一级类目。网络信息分类法的基本大类除了要考虑网站的商业性,还必须考虑知识的完整性与稳定性。因此,设计基本大类时,应尽量采用按学科进行分类,一级类目数量控制在15~20个为宜。如将哲学、社会科学、自然科学等学科分明、较为稳定的类目设为一级类目;二级类目的设置可采取按主题分类,如娱乐休闲、生活服务等,类目划分一般控制在四~六级左右,不宜过多。二级以下类目可采用“多重列类”等方法合理立类。类目内容应科学完整,既有学术信息、新闻信息,又有专业信息、个人信息等。
网络信息类名的设置既要符合大多数用户的使用习惯,同时要科学、准确、规范,涵盖的知识领域要全面并且应采用规范语词,不使用复杂的标记制度,以便各种各样的信息都有类可入。可以通过对类目进行科学注释的手段来帮助用户了解类目的含义,提高网络信息的查全率及查准率。可以采用以下两种注释方式:一是通过精炼的文字,指明该类包含的内容范围;二是用列举下位类的方式揭示本类的内容范围。
网络信息分类法应建立在科学的知识分类的基础上,按照各学科之间的内在联系和相互关系并结合网络信息资源的特点,形成一个科学的检索系统。类目的设置与排序必须遵守基本的学科划分和逻辑划分原则[6]。由于类目的排列次序对用户使用和检索速度会产生一定的影响,所以确定合理的排列次序是分类体系建立的一个基本内容。首先,应按照知识的逻辑次序和重要程度排列,共性区分的问题集中排列,采用相同标准区分的类目使用相同的次序排列。其次,对无明显逻辑联系的类目,可按照字顺或网站信息点击率排列。
网络信息分类法的体系要统一,类目层次不宜过多,要突出重点类目。在编列类目时,要符合网络信息的实际情况,以足够的信息内容作为保障。信息内容多,类目就分得细;信息内容少,类目就分得粗。对于一些类目在其上位类或其他类目中能明确反映出来的同时又不影响整个体系编制的情况下可以不单独列出。如在网页中可将热点问题单独列出。
网络信息分类与传统文献分类法各有所长。随着网络技术的不断发展及人们越来越多地利用互联网,网络分类法势必要不断完善。充分吸收传统文献分类法的优势来弥补其不足,是网络信息分类体系趋于完善的必由之路。
[1] 钟永萍.传统文献分类法与网络信息分类法的比较研究[D].福建师范大学,2008.
[2] 搜狐网.搜狐首次对外展示搜索引擎网站分类法[EB/OL].[2011-11-27].http://it.sohu.com/77/81/article16718177.shtml.
[3]郭晓兰.网络信息分类方法与传统分类法的比较研究[J].图书馆建设,2003(3):48-50.
[4] 宋蓓玲.浅析构建网络信息分类体系[J].情报杂志,2004(8):110-111,114.
[5] 王丽瑜,李梅娟.网络信息分类法与传统文献分类法的比较分析——以Yahoo!和《中图法》为例[J].中国成人教育,2007(2):56-57.
[6]邰峻.从搜狐分类引擎分析网络信息资源的分类组织[J].新世纪图书馆,2006(1):52-53.
[7] 王巍.搜狐分类体系初探[J].图书馆建设,2001(1):72-74.