《中图法》最终用户版体系结构及可视化研究

2015-08-31 07:58:56卜书庆国家图书馆北京100081
图书馆建设 2015年6期
关键词:中图法分类法类目

卜书庆 (国家图书馆 北京 100081)

《中图法》最终用户版体系结构及可视化研究

卜书庆(国家图书馆 北京 100081)

为学术资源导航浏览服务的《中图法》最终用户版是从资源主题揭示特点以及国外分类法分面体系演变特点出发,基于对《中图法》体系结构分析及其分类标准优先使用和引用次序对资源聚类结构的影响剖析而提出的。其将资源分类排架与分类检索功能分离,对原体系改造建立相互联系的分面结构,并对其可视化进行探讨。

《中图法》分面体系可视化

1 《中图法》最终用户版研制意义

1.1研制目的

随着信息技术的飞速发展,纸质资源出版周期与电子化资源发布周期缩短,资源量迅速积累并突飞猛进地增长。面对大数据的环境,图书馆及信息组织机构对各种资源的描述与内容揭示出现顾此失彼的信息组织现象,在组织方法上趋于简单化、大众化,强调效益化、速度化、市场化。然而在学术领域,被广泛应用及形式多样化的学术资源也不可避免地融于简单大众化的信息组织中,尤其学术资源所含内容不能被全面准确地揭示,揭示途径与角度也很难与学术研究用户的多样化、专业化需求一致。因此,近些年来,学术资源的深度组织和挖掘越来越多地被研究者及各国信息资源研究机构提出,出现了自建学术资源门户及学科资源导航平台,或研究者利用概念模型自拟标签、自拟知识组织工具整合各类资源等资源组织方法。无论哪一种方法,其主要研究问题在于建立符合用户浏览习惯的、系统的学科资源分类导航体系。即该问题研究的关键点在于如何通过适用的知识组织工具对学术资源内容进行深度挖掘与知识组织,以便在大数据环境下使学术资源能够被有效检索与应用以及良性地增长。

《中图法》最终用户版研制的出发点就在于利用我国长期广为应用的、业界权威的学术资源组织工具即《中图法》的最终用户(读者、研究者)分类检索体系进行研究,通过分面分析、多体系的创建以及对《中图法》列类结构的改造,来满足多角度、多属性的资源内容揭示,以及网络环境下可视化的多样形式的学术资源服务需求,为学术资源用户提供各学科资源的深度挖掘及多途径导航浏览体系。同时该版应对《中图法》分面结构的检索服务体系与原线性结构的标引体系建立映射,即同一主题不同划分标准的类号建立关联索引,解决大数据环境下,我国100多年以来图书馆信息机构已分类组织的中外文各类型学术资源的深度浏览与检索问题。

1.2研制价值

《中图法》最终用户版研制的学术价值在于能从理论与技术上解决网络环境下资源分类体系展开方法与分面显示(可视化)的现实问题。这与20世纪UDC(《国际十进分类法》)、BC2(《书目分类法》第二版)等非网络环境下的改造体系分类法的方法也将有所不同,该版需探索网络环境下如何利用分类法机读数据开展计算机辅助分面分类的编制,如何在《中图法》类目体系基础上实现分面改造,解决网络环境下适用学术研究用户浏览习惯的分面体系及其电子化展示问题,即分类法可视化应用方法;同时将为自拟学科资源分类体系的用户提供理论与实践基础、可行的构建方法和模型。

《中图法》最终用户版研制的应用价值在于将为我国学术资源深度挖掘与揭示带来便利,不再需要对资源所有属性通过人工一一标引组织,只需按《中图法》原体系及规则标引,最终用户将通过类目体系浏览触发类号索引,检索到相关分面类号的标引资源,间接达到自动分类的目的。因此,该版可直接降低资源信息组织的劳动强度,提高标引效率、工作效率与检索准确度,即只通过单线组织与多面映射体系的兼容方法实现多属性知识资源的关联检索与浏览问题,从而为学术资源发现、知识发现系统提供不可缺少的知识体系。所以说该版将具有广泛的应用前景。

2 国外典型分类法体系结构的演变与应用

图书分类法历史悠久、使用广泛,至今仍为全球范围内构建有序化不同语言的资源内容组织系统的常用方法。19世纪末到20世纪初,国际上曾产生一批分类法理论家与编制家,他们提出了著名的分面分类理论,并在应用与完善该理论基础上来编制或修改分类法,在世界范围内形成三足鼎立的三大分类体系,即体系式分类法、体系-分面组配结合式分类法、分面组配式分类法。

1905年,比利时奥特勒首先在《论数字分类法结构》中提出概念分析组配的分面思想,在此基础上,与拉封丹对《杜威十进分类法》(以下简称DDC)第五版的等级体系结构进行了分面改造,出版了UDC。该法成为世界上第一部半分面分类法,即体系-组配式分类法。该法比较全面地揭示了各学科类目间的相互关系与联系,弥补了体系式分类法单线列举排列、反映类目相互关系上的不足,可使类目加深加细,适合深度分类揭示学术文献资料的内涵。UDC至今应用于西方各国科技资源与专利文献等信息机构,用来组织传统与非传统媒介资源。该法至今应用广泛,有英法德荷俄日等40种语言版本及电子光盘和Web版,成为事实性的国际标准分类法。因此,在网络环境下,该法也仍然是学术信息资源组织的主流,广泛应用于各学科门户网站或主题网关等资源发现工具,如英国著名的SOSIG(Social Science Information Gateway)、PORT(Maritime Information Gateway)等主题网关对其的应用[1]。

UDC编制同期,很多图书馆学家不断提出分类主要原则并继续完善分面分类理论,编制或改造修订出版了一系列体系-组配式分类法。例如,英国分类理论奠基人布朗应用主题分析方法和组配原则,提出“一个主题,一个位置”的分类关联集中思想,编制出版了《主题分类法》(简称SC),被世人称为分面分类法的萌芽。其分类理论和独特的分类系统在20世纪以来的分类理论和研究中具有深远的影响。

1933年,印度图书馆学家阮冈纳赞在布朗等前人分类思想的基础上,系统提出了分面分类理论,编制出版了世界第一部分面组配式分类法——《冒号分类法》。《冒号分类法》依据概念分析与综合原理建立各类型分面体系,通过各面类目之间的组配来揭示文献主题。该法主题表达性、容纳性、适应性等揭示能力较强,能及时反映新学科、新主题并能为最终用户提供多途径类号检索,但分面组配规则及分类号极其灵活复杂,而且分类体系系统性较差,尤其在网络环境下很难广泛应用于学科资源浏览导航[2]。

自1969年始,以英国分类学家米尔斯为代表的布利斯分类法协会对美国图书馆学家布利斯出版的《书目分类法》(BC)的体系进行研究并分面改造,于1977年编制出版体系-分面组配式的分类法,即BC2。采用分面分析方法,在BC基本序列不变的基础上,有助于对基本大类以及传统学科展开分析,建立明确的等级分面结构、统一的组配规则以及较实用的类号体系。BC2则继UDC之后又一次突破了传统分类法修订方式,为等级体系分类法做分面分类改造提供了成功模式。该分类法在英国、澳大利亚等许多国家被图书信息系统尤其专业学术资源的图书信息系统所采用[3]。

进入新世纪后,在资源发现领域的很多研究者考虑开发自己的分类系统和支持工具。例如,伦敦大学学院(University College London,简称UCL)图书馆、档案和信息研究学院于2002年开展FATKS(Facet Analytical Theory in Managing Knowledye Structure,分面分类法在知识结构管理中的应用)研究项目,他们利用分面分析理论,综合三部体系-分面分类法[即BSO(Broad System of Ordering,《扩展式体系分类法》)、BC2、UDC]的分类数据创建了“人文科学领域的分面分类法”模型,即FATHUM原型。其目的是为资源发现领域提供可行的分面分类法及其编制经验[4]。

3 《中图法》体系结构及应用发展问题

在国内,《中图法》拥有适合中国文献资源组织的、良好的知识分类基础和众多的长期用户,拥有权威的管理机构以及电子化、网络化、专业化等多种用户版本,也是中国传统的图书资料分类法经过百余年发展的结晶,因此成为众多学术资源组织的首选工具。

但在互联网与计算机应用的大数据环境下,很多学者就《中图法》单线主题揭示体系不能满足最终用户多需求问题,曾多次提出对其分面改造的思路。例如,《中图法》编委会在20世纪90年代曾就《中国图书资料分类法》(以下简称《资料法》)分面改造召开研讨会,探讨其改造方法,之后在1999年出版的《资料法》第四版中略有实践,增加个别复分表等,但没有解决实际问题[5]。

进入21世纪之后,在全国第三、四、五次情报检索语言学术研讨会等相关主题的研究中,又有很多学者探讨同样问题,但研究思路略有不同,另辟蹊径,如以陈树年为代表的学者提出面向21世纪《中图法》及其标引技术改造研究和提高分类法描述文献主题的能力,改造《中图法》体系及标引规则,使之适应计算机检索思路,其理论思想在《中图法》第四版修订以及分类标引规则的国家标准制定中也有一些应用实践[6];还有以侯汉清为代表的学者提出对《中图法》进行脱胎换骨改造的思想等[7]。但是,以上研究成果均未得到完全应用,主要存在以下问题:

(1)希望通过多途径多类目的标引来解决多面体系结构检索不足的缺陷,从编目时间、成本以及每个标引员的专业信息素养等因素的要求,在编目标引社会化且追求市场化的环境现状下,标引规则改造方案不完全符合当今“快餐文化”的现实,因此很难达到多类号分析揭示主题标引的目的。

(2)即使标引人员改变标引规则而采取后组标引模式,提供两个以上的类号,也需要检索平台组合检索类号的技术支持,而且类号直接组合检索也不适用于网络环境下任何用户的检索习惯,同样也不能解决多属性资源复杂主题的等级浏览导航问题,只能满足类号检索资源方式的部分需求。

(3)《中图法》之所以不能脱胎换骨地被改造,重要原因在于其需承担实体文献分类排架与各资源分类检索的双重功能,二者功能目标相互矛盾,且在一部分类法中不可兼得。同时旧分类体系结构改变,对业界用户使用将有“牵一发而动全身”的影响。

因此,本文提出将资源分类排架与分类检索功能在一部分类法中分离的思想,专门编制为资源检索浏览服务的《中图法》最终用户版。该版需建立在用户熟知和广泛应用的《中图法》分类体系上,但与《中图法》原结构既相对独立又相互关联。即其在《中图法》一、二级大类基本不变的体系基础上进行改造,建立体系-分面结构,同时机助建立新类目与《中图法》旧类目相映射的类号索引,旧类目体系重点满足实体排架与资源标引需求。通过两个关联版本的不同功能来解决长期以来《中图法》体系分面改造的困扰问题,有助于解决数字资源等更多形式的学术资源的深度挖掘与揭示问题。

4 《中图法》最终用户版建设初步构想

《中图法》最终用户版建设主要包括《中图法》体系结构的改造与类目呈现的可视化方法两方面内容。二者与资源主题要素,分类揭示方法,用户浏览检索需求、规律、习惯及便捷性检索密切相关。

4.1《中图法》体系结构的改造与分面组配体系的建立

4.1.1《中图法》类目划分标准的选择与聚类特点

类目划分标准的选择和引用次序,决定了资源聚类的次序和某种属性类目集中的层次及排列特点,即决定着分类法的类目体系结构。类目划分标准选择由资源主题要素决定,即构成主题或类目的属性。它包括事物及其构成,事物种类,事物方面(过程、现象、性质、状态、作用、影响、意义),事物与其他事物的关系,对事物的研究(角度、目的、措施等)或产品的制造(工艺、设备)及机构、人员,客观环境(时间、地点、条件),资源类型。以上要素也可以粗略概括为事物及其构成、事物剖面、事物种类、形式要素四方面[2]。

《中图法》对大类进一步划分时,通常是把类列的子目分为两大部分,第一部分是总论性或理论方法性子目(事物及其构成与事物方面性类目),第二部分是专论性或具体问题子目(事物种类性类目)。例如,G4教育类,第一部分:G40/57(教育学/各国教育事业);第二部分:G61/79(各级各类教育)。

同时《中图法》为文献分类排架规定了专指性分类规则,能归入专论性或具体问题类目的,则不能入总论性或理论方法性类目,如G42教学理论(注:各级各类学校教学理论入G61/79有关各类)。在G40/57类列不再选择“事物种类”作为划分标准,即不集中G61/79各级各类教育方面的属性,分散在G61/79下的方面属性类。因此,《中图法》聚类特点与各体系分类法是相同的,“事物种类”类列与“事物及剖面”类列存在一边得到集中而另一边却被分散的聚类现象,即“集中与分散”的矛盾,如中学教学理论在G42类下是无检索途径的,只能在G63中等教育类下查找。

以此类推,在《中图法》中,当某一主题具有几组属性,若只采用其中一组属性作为分类标准,其他属性则无检索途径或设置交替类弥补;若几组属性全被用作分类标准,一般遵循“事物方面”下总论、“事物种类”下专论的聚类及划分标准的引用次序。

4.1.2非首选划分标准的分面组配体系的建立

针对《中图法》“集中与分散”的矛盾体系结构特点或弱点改造,在二、三级大类或四级(工业技术类)“总论性”类目建立“种类”属性为划分标准的分面体系,有助于弥补种类方面属性分散的类列。类号采用冒号联合类号的编辑制度,冒号后类号则为原体系类号,即索引类号。例如,在G42类下展开与“方面类”并列的类列:G42:G61/G42: G79,即定位类号,对应指向G61/G79的标引类号。交替类目也可采用同样办法展开交替类列。但是任何分面划分展开,均需遵循文献资源保障原则,包括已作为首选标准划分的类列和即将展开的交替类列等[8]。

4.1.3《中图法》复分组配体系及改造

为了增强主题揭示能力、类表细分专指深度,压缩类表篇幅,《中图法》对通用或专用的共性区分类目设置了通用复分表”、专类复分表或“一般性问题”类列,作为全表或有关类目组配复分的依据。除此之外,《中图法》还规定部分类目可仿照已列出类目进行细分或使用冒号直接组配,合成新的类号。以上5种复分号类目均不能提供入口检索及浏览合成号的主题资源。

这些共性区分类目,如理论、过程、现象、性质、状态、作用、工艺、设备、机构、人员、时间、地点(自然区域、行政区域)、民族、文艺体裁、资源类型等类目,往往会成为一些学科用户常用的入口检索途径,也是分类法常用的学科进一步划分标准,但在体系分类法中一般不能独立使用也不可能提供入口检索,即均为复分主题或类目[9]。

因此,《中图法》最终用户版需针对复分类目展开首选划分标准或事物种类方面划分,形成共性类目的学科或专类分面体系,同时使其成为入口检索途径。该分面体系的定位类号与索引类号相同,则为复分合成号。这样,可使主附表体系转向多表多面入口体系的揭示。但此类型改造要充分依据原体系复分注释展开,要避免“一般性问题”类列、专类复分表、通用复分表、被仿分类列下新建的分面体系与主表总论性类目的主题重复列类及无资源保障的类目划分。

4.1.4简化等级体系划分深度

根据资源保障原则,以及结合主题词揭示方法,《中图法》最终用户版应简化无文献保障类目的划分,取消等级较深且类名主题词化的类列,即简化纵深树形体系,转向横向划分展开的多入口“卧倒的”树形体系。例如,取消生物学类下的动、植物及昆虫分类学的4~5级“门”或以下类目的划分,改用主题词分类体系。

4.2《中图法》体系结构机助改造及可视化

4.2.1计算机辅助生成分面体系

《中图法》最终用户版需基于机读数据(如SKOS数据或MARC数据)建立分面体系,依据计算机软件生成第二或第三分面的类列数据,包括类号与类名(含上属类)的数据。

例如,G42类下新建的各级各类学校的教学理论,通过软件辅助生成机读数据,在此数据基础上展开形成可视化等级树界面,但可省略显示组配类号及索引类号为后台数据(见图1)。

图1 G42各级各类学校的教学理论的分面类列

后台数据:G42:G612 学前教育、幼儿教育G42教学理论,索引号G612;

G42:G622 初等教育G42教学理论,索引号G622;

G42:G632 中等教育G42教学理论,索引号G632;

G42:G642 高等教育G42教学理论,索引号G642;

……

再如:I3/7各国文学类下的专类复分表,根据“依世界地区表分,再依下表分”注释,改造为文学面、体裁面、地区面甚至时代面的划分。后台数据如下所示:

I31 东亚文学I3/7各国文学

I313日本文学I3/7各国文学

I313.3 日本戏剧文学I3/7各国文学3戏剧文学

I313.5日本小说I3/7各国文学3戏剧文学

……上例组配类号既为定位类号也为索引类号。

4.2.2分面体系可视化展示

《中图法》最终用户版将在二、三级类目展开多面等级体系,即在树形体系增加多个树杈体系。如何呈现简单易用(既可一目了然的“显现”又可简化“隐身”)的等级浏览体系呢?这个问题值得计算机应用研究探讨,即通过可视化技术平行展开来降低知识固有的层次等级数。在分类可视化研究中,除分类等级树形图应用较广外,其他图形等形象图也为等级展示的手段,如地理图、地形图、区域图、植物图、气候图、地质图、民族图、概念太阳图等都可应用到分类等级展示中,以代替层层展开的树形结构,如《中图法》的地区分类表或民族分类表的可视化等(见图3、图4)。

图2 I3/7各国文学类下的专类复分类列

图3 利用中国地区平面图展示K29地方志的区域划分

图4 利用树形抛物线图展示“ 饲料”分类

5 总 结

《中图法》最终用户版总体构建思路总结如下:

首先,从资源主题揭示特点出发,对《中图法》体系结构进行分析,提出各大类在集中某些主题的同时造成另一些主题分散的矛盾的解决办法。从解决“集中与分散”矛盾出发,来改造、弥补体系结构的不足,建立多属性划分的分面体系。

其次,从学术资源用户检索行为、习惯以及学术资源内容与形式特点出发,确定分面结构体系的改造重点。从分面理论与机助复分技术出发,解决网络环境下机助新体系的建设方法。

第三,从类目等级树状显示与图形化显示结合的角度,提出分面体系可视化展示方案。从地理信息图形可视化角度,研究《中图法》具有地理信息属性类目的等级可视化显示技术的应用,提高《中图法》地理复分、民族复分等深度揭示主题的直观性,简化复杂主题揭示的等级层次,实现一站式检索服务目标。

第四,《中图法》最终用户版应为Web版,需确定《中图法》类目体系的定制服务技术,解决资源应用与相关主题资源的关联导航发现方法。

总之,《中图法》最终用户版的分面体系,需从资源主题揭示理论与学术资源保障的角度来选择分面建立标准,研究分面体系改造的深度与广度。该问题将关系到《中图法》最终用户版建设的成败与其是否具有应用推广价值。

《中图法》体系结构的可视化技术应用的实现,将需从有效的可视化技术出发,把复杂主题的揭示以简单化、方便化与电子化的方式呈现。它将直接关系到《中图法》浏览服务体系的直观性、简捷性、关联性服务的应用问题。

[1]戴维民. 信息组织(第三版)[M]. 北京:国家图书馆出版社, 2014: 37-42,404-406.

[2]张琪玉. 张琪玉文集[M]. 北京:国家图书馆出版社, 2014:247-249;365-368.

[3]马张华. 从等级列举式到分面组配式_布立斯《书目分类法》分面改造初探:下[J]. 图书馆学研究, 1989(4): 17-19.

[4]Broughton V, Slavic A. Building a Faceted Classification for the Humanities: Principles and Procedures [J].Journal of Documentation, 2007(5):727-754.

[5]侯汉清, 周冰. 从列举式分类法向组配分类法的转变——试论新版《资料法》的修订特色[J]. 图书馆杂志, 2002(2):35-38.

[6]陈树年. 基于计算机检索,对体系分类法改造的探讨[J]. 图书馆建设, 1998(5):40-42.

[7]国家图书馆《中图法》编委会. 分类法研究与修订调研报告[M].北京:北京图书馆出版社, 2007:1-65.

[8]卜书庆. 基于《中分表》的国家数字图书馆知识组织思考[J]. 图书馆论坛, 2009(6):196-197.

[9]薛春香, 侯汉清. 面向数字环境的《中图法》通用复分表修订思考[J]. 中国图书馆学报, 2009(6):61-65.

卜书庆 女,现工作于国家图书馆,研究馆员,从事情报检索语言研究。

Research on the Architecture and Visualization of the End User's Version of Chinese Library Classification

From the characteristics of revealing the resource subject and the evolution characteristics of foreign classification's facet system, based on the analysis of the architecture of Chinese Library Classification(CLC), and the anatomy of the influence of priority and citation order of classification criterion on the resource clustering structure, the end user's version of CLC for the academic resource navigation service was proposed. The version will separate the resource classification arrangement and classification retrieval functions, reform the original system and establish the facet structure interaction, and discuss its visualization.

Chinese Library Classification; Facet system; Visualization

G254.1

A

2015-04-10 ]

猜你喜欢
中图法分类法类目
本期练习题类目参考答案及提示
分类法在高中化学中的应用
K 近邻分类法在岩屑数字图像岩性分析中的应用
录井工程(2017年1期)2017-07-31 17:44:42
基于贝叶斯分类法的股票选择模型的研究
ABC分类法在介入耗材库存管理中的应用
《中图法》第5版交替类目研究综述
黄三角、长三角、珠三角明、清及民国通志一级类目比较*
图书馆论坛(2015年2期)2015-01-03 01:43:00
知识图谱视角下《中国图书馆分类法》研究演进与思考
DDC22与CLC5化学类目映射分析
《中图法》与《中分表》修订信息(连载3)