刘延章的网络信息分类思想

2012-04-13 09:12王建娟王海霞
河南图书馆学刊 2012年6期
关键词:中图法分类法类目

王建娟,王海霞

(郑州大学信息管理系,河南 郑州 450001)

刘延章是我国当代的文献分类学家。1966年毕业于武汉大学图书馆学系,1985年至2000年在郑州大学信息管理系任教。曾任郑州大学信息管理系教授,综合教研室主任,《河南图书馆学刊》副主编。

刘教授自1966年大学毕业以来,长期从事图书资料、情报、档案的实际工作;在教学工作中积极开展学术研究,治学严谨,在文献信息分类和网络信息分类方面的研究成果颇丰。白国应先生在《刘延章的文献分类思想》[1]一文中,对刘延章教授在文献信息分类方面的研究成果和贡献,作了全面的总结和评介,这里不再赘述。笔者只对刘教授在网络信息分类方面的研究成果作以简介。

从上一世纪末,刘教授就开始从文献信息分类转向网络信息分类方面的研究,并在研究生授课中讲解各大中文网站的分类体系。进入新世纪之后,刘教授更是著书立说,把全部精力都倾注在网络信息分类研究方面。其代表著作有:《面向网络信息:数据库与搜索引擎》。其代表论文有:《<中图法>组织网络信息的可行性、不适应性及其现代化改造》、《关于网络信息分类组织研究中的几个问题》、《网络信息分类组织问题讨论》、《“搜狐”与<中图法>分类体系之比较》、《网易分类体系探析》、《新浪分类体系的特点、问题及其改进》、《中文搜索引擎分类体系的特点、问题及其改进》、《差异与改进:两种分类体系》、《近5年网络信息分类组织研究述略》、《近五年来网络信息分类组织研究的现状及其展望》等。

从他主编的著作和撰写的论文中,可以看出刘教授研究网络信息分类的脉络是:以《中国图书馆图书分类法》不适应性研究为切入点,以研究中文搜索引擎分类体系为基本点,运用调查分析和比较分析方法,系统研究中文网络信息分类体系,处处彰显他的网络信息分类思想。

1 关于《中国图书馆图书分类法》的不适应性研究[2]

《中图法》是《中国图书馆图书分类法》的简称,是我国目前通用的类分图书的工具,《中图法》组织网络信息分类有一定的可行性。刘教授指出,《中图法》的学科性和专业性、隶属性和层累制、单维性和复杂性等都不能适应网络信息分类组织的需要,应对其进行现代化改造。

1.1 指出《中图法》的不适应性

《中图法》特点突出,使用面广,具有一定的基本条件和社会基础,但它面向网络信息分类时,不适应性明显:①结构庞大,缺乏简明性;②划分太细,缺乏实用性;③操作复杂,缺乏易用性;④体系僵化,缺乏灵活性;⑤单线排列,缺乏多维性。所有这些都不能满足网络信息分类组织对分类法的主题化和生活化、便捷性和及时性、智能化和多媒体化等的要求。

1.2 提出《中图法》的现代化改造方案

鉴于上述,《中图法》用于组织网络信息时必须对其进行现代化改造。刘教授提出的举措有:①改细密分类体系为粗略分类体系。即对《中图法》简本进行增、删、改,或编制《中图法》的网络版。具体则可考虑铲除形式主义类目和空头类目,淡化政治性类目和纯科学性、纯专业性类目,提高生活性、时代性、社会性类目的级别,吸收国内著名搜索引擎分类体系的特点,借鉴世界各地改造DDC(《杜威十进分类法》)的经验;②改单纯分类体系为分类主题一体化。类目的层层逻辑划分所产生的层层隶属体系,是分类法复杂、细密、僵化的根本原因。具体可严格控制类目体系的深度、建立友好界面;③加强标引深度,改进组配功能。即将凡具有参考价值和检索意义的标引词标识出来,增加通用复分表和专用复分表,提供多途径、多类型检索;④加强横向联系,改进参照系统。即用交替类目方法反映两个学科相关的主题,用参见方法反映两个概念内涵交叉的主题,用注释方法揭示类目之间的各种关系,用超文本链接方式重复反映关系复杂的类目,将参照系统改为多维、网状的体系等;⑤简化标记符号,改进复分技术。即将原有复分、仿分、组配、多重列类等要素改进成为各自独立的检索点,以便实现计算机组配检索。

2 关于中文网络信息分类体系从单个到整体的研究

刘教授一直关注并跟进研究各大中文网站的分类体系。以研究单个、权威的中文网站信息体系为起点,在分析多种国内中文网站分类体系基础上,刘教授从整体概述了中文网络信息分类体系的特点、缺陷及改进措施。

2.1 关于中文网络信息分类体系的单个研究[3][4][5]

刘教授于2002—2003年发表3篇关于解读“搜狐”、“网易”、“新浪”分类体系方面的文章,在其编著的书中更是详细分析“雅虎中国”、“搜狐”、“新浪”、“网易”、“百度”等五大中文搜索引擎类目设置、分类体系展开的层次、同位类排列、聚类标准选择、重点类目显示、类目命名等方面,并就其表征的分类体系的实用性强、易用性好、多维性高等特点,科学性、逻辑性、准确性欠缺等问题及改进意见进行梳理。

2.2 关于中文网络信息分类体系的整体研究

以分析、解读“搜狐”、“网易”、“新浪”、“雅虎”、“百度”等中文搜索引擎分类体系为基本点,在调查分析名捕、搜星、搜鼠、北极星、白垩纪、焦点搜索、FM365、秀佳、1972s、中华网、263 在线、亦凡搜索、广州视窗、无名网络、搜豹、木子网(中文)、联合搜索、智星酷搜、国信、天网搜索、TOM搜索、网天、来克思中国等50余种中文网站分类体系的基础上,刘教授系统研究了中文网络信息分类体系。[6]

2.2.1 中文网络信息分类体系的特点

鉴于中文网络信息分类体系是根据网上信息的特点和类型及网民的需求设计的,因而具有很多优势,具体表现为:①简洁明了、便于操作;②主题聚类、突出反映;③重复列类、多元化分;④类名时尚、有吸引力;⑤及时增删、随时维护;⑥体系多样、主次分明;⑦链接无限、任意切换;⑧界面友好、多路检索。

2.2.2 中文网络信息分类体系的缺陷

由于中文网络信息分类体系设计时随意性大,因而存在先天性不足。刘教授将其缺陷细分为:①覆盖不全、过于简单。几乎所有的中文网站的分类体系都存在着知识残缺不全、体系设计粗略的通病;②归类不当、随处可见。许多中文网站的分类体系未能按照类目的内涵和外延进行归属,归类不当的现象在中文网站的分类体系中随处可见;③划分失误、为数不少。中文网站分类体系的划分失误主要表现为划分过宽或过窄、划分出的子类级别过高或过低、划分出的子类相互包容;④排类无序、过于随意。违背逻辑排序原则,大多存在类目排列无序的通病;⑤界限不清、影响检准率。类目之间界限模糊,类名内涵和外延多有交叉,相互包容现象时有发生;⑥类名有失规范、缺乏准确性;⑦变幻莫测、缺乏稳定性;⑧体系不一、缺乏一致性。目前所有的中文网站的分类体系还没有达到统一和一致,还处于各自为政的阶段。

2.2.3 中文网络信息分类体系的改善

在整体上分析、评估中文网络信息分类体系特点、缺陷的基础上,刘教授指出,中文网络信息分类体系应从完善类目体系、科学编排同位类、规范类目名称等方面着手改进,具体改善路径有8项:①全面覆盖、保持相对稳定;②严密划分、明确隶属关系;③逻辑排序、要有规律可循;④规范类名、作好类下注释;⑤净化界面、建立帮助系统;⑥优化体系、创制统一大法;⑦体现特色、建立多种体系;⑧正确标引、作好后台工作。

3 关于网络信息分类体系与传统分类体系的比较研究

网络信息分类体系是有别于文献分类体系、书目分类体系、学科分类体系等传统分类体系的一种崭新的分类体系。通过运用比较分析方法,刘教授指出二者的优点与缺陷、差异与借鉴所在。

3.1 突破与背离[7]

刘教授指出,网络信息分类体系,就其优点来说,是对传统分类体系的一种突破;就其缺陷而言,也是对传统分类体系的一种背离。网络信息分类体系突破学科聚类的传统方法、学科类目不可动摇的思想理念、人工语言的束缚、单途径检索的局限,背离体系的完整性和逻辑性、稳定性和一致性、严密性和科学性。而作为与传统分类体系突破与背离的统一体,网络信息分类体系的出发点则定位在人本位思想。

3.2 差异与借鉴[8]

刘教授指出,两种分类体系既存在差异,也有相互借鉴的必要。网络信息分类体系与传统分类体系存在以主题聚类为主与以学科聚类为主、突出生活性类目与突出学科性类目、以使用频率为序与以逻辑关系为序、同位类的包容性与排斥性、采用自然语言与人工语言等五方面的差异。

上述1.2所提及的传统分类法现代化改造就是在借鉴网络信息分类体系的基础上提出的五项方案,而网络信息分类体系借鉴传统分类法具体表现在:①借鉴传统分类法基本大类,完善分类大纲。利用传统分类法基本大类的设置,充实和完善中文搜索引擎分类大纲的不足和缺陷;②借鉴传统分类法概念划分和分析原理,改进搜索引擎分类体系。借鉴传统分类分类法概念划分的基本原理,按照类目的内涵和外延来划分和归属类目,以保持一定的清晰度;③借鉴传统分类法序类原则,科学编排同位类。根据类目性质和多寡确定同位类类目排列次序,可借鉴传统分类法重要性及相关度排列方法或使用汉语拼音字母顺序排列;④借鉴传统分类法对类名的要求,适当规范类目名称。借鉴传统分类法的类目命名确切、科学和简洁等特点,减轻网民认知负担;⑤借鉴传统分类法修订原则,保持稳定性和一致性。传统分类法虽经多次修订,但都坚持“三不变”,即:基本大类不变、体系结构基本不变、标记符号和标记制度基本不变。中文搜索引擎分类体系应借鉴传统分类法的修订原则,保持其分类大纲、体系结构基本不变。[7]

比较分析两种分类体系存在的特点、缺陷,肯定两者的相互借鉴,进而提出完善的措施,是预测网络信息分类体系发展趋势的重要依据,也是网络信息分类体系标准化建设的重要内容。

4 关于网络信息分类工具发展趋势及标准化建设的研究[7]

当前已开发的网络信息分类体系各具特色,都面临着改进和完善。刘教授认为,网络信息分类工具发展趋势呈现出较大的一致性,并因其趋向确定有关网络信息分类工具标准化建设方向。

4.1 关于网络信息分类工具发展趋势的研究[7]

刘教授指出,当前网络信息分类工具的发展趋势是一致的:①众多体系统一化:各中文门户网站分类体系、类目命名各异,通过编制全国通用的网络信息分类法,达到众多体系统一化;②分类主题融合化:目前的中文门户网站向用户提供分类检索和关键词检索两种检索途径,既保留分类检索的系统性,又体现主题检索的直观性;③体系组配一体化:即先体系后组配。具体操作是二级以上类目采用等级分类系统,二级或个别的三级类目以下采用分面组配检索,实现先组式检索语言和后组式检索语言的有机结合,把二级类目作为菜单在视窗上列出,实现可视化检索;④同位类排列规范化:同位类排列首先按照类目之间的逻辑次序排列,只有当同位类无法使用逻辑次序排列时才可采用字顺排列法;⑤自然语言受控化:编制后控制词表规范自然语言的同义多义和模糊现象等不规范性。

4.2 关于网络信息分类工具标准化建设的研究

鉴于网络信息分类工具发展的上述趋势及其存在的知识覆盖不全、归类不够科学、类目排列随意、大纲缺乏稳定、类名有失规范等缺陷,刘教授提出网络信息分类工具标准化建设应改善的7个方面:①知识覆盖的全面性:分类大纲及其层次展开的设计上都要体现知识的全面性,知识的范围及信息类型要涵盖人类的全部知识领域及各种需求、各种内涵、各种载体;②体系结构的完备性:标准化的网络信息分类表应具备完备的体系结构。它包括分类大纲、主类表、从类表、类目注释、类目索引、后控制词表、使用指南等;③类目组织的科学性:纵向关系类目应体现类目之间的从属等级关系,以便鸟瞰全貌,进行缩检和扩检,横向关系的类目则体现类目之间的并列相关关系,以便触类旁通,进行转向检索和相关检索;④基本类目的稳定性:基本类目的数量、类名及其次序保持一定的稳定性,不能随意改动,但除基本类目以外的各级类目,应及时进行增、删、改,以适应组织动态信息的需要;⑤类目名称的通用性:类名词语的通用、准确、规范化,以便表达具有某种共同属性信息的集合性概念;⑥用户界面的友好性:用户界面要求类目清晰、路径明确、跳转便捷、帮助切实;⑦检索功能的齐全性:标准化的网络信息分类表应具有组织、过滤、检索信息的功能。

参见上述七个方面的标准化建设方面,根据评价项目的重要性,刘教授还设计了知识覆盖程度、结构完善程度、类目组织程度、体系稳定程度、类名规范程度、界面友好程度、功能发挥程度等7项网络信息分类表评价指标。[7]

5 关于创建我国统一的网络信息分类法的研究[7]

由于《中图法》组织网络信息的不适应性,对其进行现代化改造又困难重重;各大网站及其搜索引擎的分类体系随意性大,极大地影响了对网络信息的利用;但网络信息分类工具发展趋向呈现较大的一致性,且随着网络信息分类法的标准化建设的推进,刘教授多次振臂高呼,倡议创建我国统一的网络信息分类法。

5.1 设计原则

由于网络信息、网络信息用户、网络信息技术等特点,决定了网络信息分类法的编制原则有别于传统分类法。他认为,网络信息分类法必须遵循下列原则:①以人为本原则。网络信息分类表的设计要体现出以人为本的思想理念;②实用性原则。在整个网络信息分类表的设计与编制中,实用性都应该是第一位的;③全面性原则。设计的网络信息分类表信息覆盖面要全,也要考虑不同层次网络信息用户的需求特点;④通用性原则。中文统一的网络信息分类体系要有普遍的通用性和最大的兼容性;⑤自然性原则。整个网络信息分类表的设计要贴近网民、贴近网络、贴近时代、贴近社会、贴近自然;⑥规律性原则。编制网络信息分类表的过程中应遵循事物发生、发展、变化的客观规律,特别是类目的序列应有规律可循;⑦易用性原则。作为网络信息分类工具使用的网络信息分类表,检索入口词的直观性、检索过程的简明性、检索结果的快捷性是其易用性的重要表现;⑧目的性原则。根据个性化的服务原则,应为普通网民和专业人员编制不同特性的分类表。

5.2 二级类目的组织

根据上述网络信息分类表的设计原则,参考《中图法》和部分中文网站的二级类目组织方法,借鉴《冒号分类法》(Colon Classification)关于分面分析的基本原理,刘教授提出了《中国网络信息分类表》(草案)二级类目组织序列,且该草案对二级类目的组织突出了类目排列条理性、类目排列规律性、多元化分、突出列类、设置交替类目、设置推荐类目、增加类目注释、增加大类说明等方面的工作。

6 关于网络信息分类组织的综合研究

刘教授发表多篇关于网络信息分类组织的综述性文章[9][10][11],阐述 1998 年 -2002 年网络信息分类组织研究现状,总结归纳网络信息分类组织研究中的重点、热点,多角度、多层次概括网络信息分类研究中的前沿课题。

在统计分析1998-2002年国人关于网络信息分类组织研究论文的基础上,刘教授把五年来网络信息分类组织研究的现状归纳为8个方面:①关于网络信息、网络信息用户、网络信息技术环境特点的研究;②关于网络信息分类体系与传统分类体系的比较研究;③关于传统分类法应用于网络信息分类组织的研究;④关于现代技术应用于网络信息分类组织的研究;⑤关于中文网络信息分类体系特点、问题及其改进的研究;⑥关于统一的中文网络信息分类法编制的研究;⑦关于中文网络信息分类工具标准化的研究;⑧关于网络信息分类工具发展趋向的研究。

刘教授的网络信息分类研究涉及上述②、③、⑤、⑥、⑦、⑧六个方面,研究范围几近覆盖网络信息分类研究热点。在其资深研究的基础上,总结了国人关于网络信息分类组织达成的共识与分歧。刘教授的观点明确[12]:《中图法》不适合用于组织网络信息,即使是对其进行现代化改造也不可能取代目前各种自编的网络信息分类体系;建立全国统一的中文通用的网络信息分类法是当务之急,是解决目前许多中文搜索引擎分类体系存在的问题,从而提高检索效果的最好措施和唯一途径;不能再走以科学分类为依据编制传统文献分类法的老路,编制网络信息分类法必须把实用性和易用性放在首位,以人本位思想为其出发点和归宿;把自然语言与人工语言有机地结合在一起,才能编制出高质量的网络信息分类法。

以《中图法》不适应性研究为起点,经历单个研究(如搜狐、新浪、网易等)、整体研究(中文搜索引擎分类体系特点、问题及改进)、比较研究(突破与背离、差异与借鉴)、系统研究(中文网络信息分类工具发展趋势、标准化建设及编制统一的网络信息分类法等)、综合研究(综述网络信息分类组织研究等)五个阶段,刘延章教授构建了较为完整的网络信息分类思想。此外,刘延章教授对文献分类学的研究形成了一套完整的理论体系。可以说,刘延章教授是世纪之交文献信息分类与网络信息分类研究学者的一个缩影。其生平简介和学术成就已被《中国图书馆学情报学档案学人物大辞典》和《中国当代知名学者词典》收录。

[1] 白国应.刘延章的文献分类思想[J].重庆图情研究,2009(4):1-6.

[2] 崔慕岳,刘延章,张中秋.《中图法》组织网络信息的可行性、不适应性及其现代化改造[J].郑州大学学报(哲学社会科学版),2001(6):137-140.

[3] 刘延章.“搜狐”与《中图法》分类体系之比较[J].图书与情报,2002(2):29 -32.

[4] 刘延章.网易分类体系探析[J].图书馆学研究,2002(2):5-7.

[5] 刘延章,蒋廷芳.新浪分类体系的特点、问题及其改进[J].图书馆,2003(6):34 -36.

[6] 刘延章,谢琳惠.中文搜索引擎分类体系的特点、问题及其改进[J].郑州大学学报(哲学社会科学版),2002(6):146-148.

[7] 刘延章.面向网络信息:数据库与搜索引擎[M].西安:西北工业大学出版社,2007.

[8] 刘延章.差异与改进:两种分类体系[J].图书馆论坛,2002(5):91-94.

[9] 刘延章.近5年网络信息分类组织研究述略[J].图书情报工作,2004(1):99 -101.

[10] 刘延章,余义芳.近五年来网络信息分类组织研究的现状及其展望[J].情报学报,2004(2):173-178.

[11] 刘延章,余义芳.网络信息分类组织问题讨论[J].图书馆论坛,2003(6):146 -147.

[12] 刘延章.关于网络信息分类组织研究中的几个问题[J].中国图书馆学报,2003(5):16-19.

猜你喜欢
中图法分类法类目
本期练习题类目参考答案及提示
分类法在高中化学中的应用
K 近邻分类法在岩屑数字图像岩性分析中的应用
基于贝叶斯分类法的股票选择模型的研究
ABC分类法在介入耗材库存管理中的应用
《中图法》第5版交替类目研究综述
黄三角、长三角、珠三角明、清及民国通志一级类目比较*
知识图谱视角下《中国图书馆分类法》研究演进与思考
DDC22与CLC5化学类目映射分析
《中图法》与《中分表》修订信息(连载3)