王昕若
摘要 文章论述了以检索率作为《中国大百科全书》第二版精粹本设条重要原则的依据和必要性;探讨了百科全书条目检索率的界定及操作;论述了与检索相关的种种因素;探讨了检索率与系统性的关系及检索效果等。
关键词 检索率 系统性 检索效果
《中国大百科全书》(以下简称《大百科》)第一版因为是从无到有,为了便于编纂,所以采取的是按学科分卷出版的方式,属于第一版系列的共包括74卷。第一版的一个显著特色就是系统性,各个单卷是按学科系统划分的,单卷本内部也是按系统性原则设条的。这种系统性可以说是《大百科》与生俱来的特性。
及至《大百科》第二版,由于采取的是按汉语拼音顺序统排的形式,故设条和释文的撰写更多强调的是综合性。第二版是在第一版的基础上编纂的,而不是另起炉灶,通过“留”“增”“删”“合”“分”“移”“改”等方法对第一版进行改造,从而实现向综合性的转型。如一些较冷门学科的条目数量不再维持其原来的系统性而做了较大压缩。由于第二版规模仍较大,故可以容纳较多学科相对系统性的内容,但第二版简明版由于规模已缩小,“大而全”的系统性进一步有所减弱;到了第二版精粹本,由于规模更小,无法容纳太多学科系统性的条目,加之出版行业早已跨入市场化时代,出书不能不面向读者,而读者需求首先体现在检索率上,故提高条目检索率的要求被提上了议程:社领导就精粹本的设条原则提出了应更多地注重“检索率”这样一个理念。就精粹本而言,系统性和检索率的此消彼长可谓形势使然,势在必行,是完全必要的。所谓“突破”,系指打破固有的系统性的束缚,更多地注重检索率,但又不是要抛弃系统性,而是要使二者兼顾,达到一种新的平衡。
一、条目检索率的界定及操作
检索性是作为工具书之一的百科全书的固有属性,即百科全书是供读者检索知识信息用的。如果一部工具书不具备可检索性,也就算不上工具书了。至于《大百科》精粹本,则不光需要具备检索性,还需具备较高的检索率。究竟什么叫检索率?笔者目前尚未见到有现成的定义。至于百科全书条目的检索率,就笔者个人理解,它指的是在百科全书的实际使用中,被检索的条目数占全部所设条目数的比率(检索率:被检索条目数/总条目数×100%)。所谓检索,按照《现代汉语词典》第6版的释义,就是:“查检寻找(图书、资料等)。”在单位时间内检索的次数则称为检索频率。就检索行为本身来说,它有一个突出的特点,这就是知而后检。人们对于自己根本不知道的东西是无从检索的。要检索就必须能够称名,然后“按图索骥”,按名索条。由此可见,条目的检索率与知名度是成正比的。但它与系统性却往往成反比。因为条目的系统性越高,就会趋专趋细,从而降低了非专业读者的检索率。提高条目检索率的目的就是要让全书所设的条目更多地被读者检索。当然,不同条目被检索的频率是不同的,有的条目经常会被检索,有的则很少有人检索,甚至无人检索。我们应努力避免这种设置了条目而无人检索的情况,避免条目变成“死条”。如第二版简明版原有人才部分的“阶梯原则”,管理学部分的“模拟模型”,旅游部分的“旅游”,舞蹈部分的“堆谐”,教育部分的“普及教育”“民办教育”“贝尔一兰卡斯特制”“实科学校”“文科中学”“奖学金”“助学金”“教科书”“教学大纲”“考试”等条目在精粹本中就都被删除了(或因其一般无检索的必要,或因其过于冷僻,当然删除的条目远不止这些,这里只是略举一二)。
就纸质百科全书检索率的操作层面而言,获得检索率的方式主要是读者调查和在此基础上出版社编辑的评估。为了获得关于条目检索率真实可靠的第一手数据,可根据目标读者群做一次到几次调查,既可以采取问卷的方式,也可以采取召开读者座谈会的方式,以便了解读者最需要检索的是哪些条目。1995年,为编辑和出版《大百科》第二版,编辑部曾召开过两次座谈会并做过问卷调查。调查的内容包括读者的文化程度、所学专业、购买情况和用过的分卷、使用方式、条目设置能否满足需要、检索性评价等。但就纸质百科全书的检索率问题召开座谈会这种调查方式也存在短板和操作上的困难:如果是在图书出版前调查,得到的只是一种可能性,而不是该书的实际检索率;如果是在图书出版后调查,又很难集中所要调查图书的实际使用者。对于没有购买或使用过该书的读者来说,也就不存在检索的问题。纸质百科全书的检索率不同于电视节目的收视率,因为它的主要功用是供检索用的,而不像电视节目那样是要天天看的。读者遇到不甚了然的问题,就检索一下,这种检索从技术手段上说是难以统计的。将来《大百科》推出第三版网络版时,其检索率就会变得很容易统计,因为网络版条目的检索率可以通过条目的点击率反映出来,点击量依靠网络技术手段是可以做到自动、实时统计和显示的(包括有没有人点击以及点击的次数)。
二、影响条目检索的因素
一个条目会不会被检索,会有多少人检索,能否被检索到,这都会受到诸多因素的影响。这些因素主要包括以下一些方面:
读者方面的因素 读者的家庭和社会背景不同,学历和文化程度不同(其中还包括文、理科的不同),兴趣爱好不同,“一千个读者就有一千个哈姆莱特”,一千个读者也会有一千种检索偏好,这就使检索的具体情况非常复杂,具有很大的不确定性。不过,应该看到,即使在这些千差万别的偏好之中也会包含共性。这种共性就是:做学问的境界,总是遵循“阳春白雪,和者盖寡”,“险以远,则至者少”的规律,条目的检索规律亦莫能外。
学科本身的因素 同是一级学科,从受关注的程度来说,也有“冷”“热”的差别。有的学科如文学、艺术、历史类一般说来总会比矿业工程、纺织、畜牧、兽医等受到更普遍的关注,“显学”相比“冷门”会受到更多的关注。
知名度的因素 知名度是同检索率关系最为密切的一个因素,两者是成正比的关系。因此知名度是设条时应考虑的一个重要因素,但并不是唯一的因素,还要与其他因素比较平衡。名垂青史的知名度与名噪一时的知名度是有本质不同的。追求检索率也不能绝对化,有的人成就很大,但在一般人中知名度并不高,故检索率可能就低,但却不能不收录。
时代背景的因素 随着时代的变化,人们的思想观念、生活内容和方式等也会发生变化,社会的流行语和关注点也会随之变换。至于科学技术的进步则更是日新月异。这就要求我们应处理好历史积淀性与时代性的关系。要使百科全书不陈旧过时,就要除旧布新,做到与时俱进。
突发事件的因素 突发事件包括自然的和社会的,国家的或地区的等,它们也会引起关注的热点,甚至一部电影的上映或一部电视剧的热播都会引起人们某些检索的兴趣。如“科索沃战争”一下子使“科索沃”成了热词,而“汶川地震”又一下子使“汶川”成了热词,这就大大增加了它们被检索的可能性。由于突发事件具有不可预料性,故应对的办法只能是以不变应万变,条目当设则设,有备而无患。
稳定性的因素 百科全书作为工具书,所设条目要求具备一定的稳定性。有些词语虽然流行一时,到头来可能只是昙花一现,不会在历史上留下痕迹。应该看到,历史演进的过程就是一个大浪淘沙的过程,越是有历史积淀性的内容越不会过时,就像唐诗宋词不会过时一样。虽有一时的检索率却缺乏稳定性的词是不在百科全书设条之列的。
标引词的因素 要使读者能够检索得到想要检索的条目,不仅取决于是否设条,还取决于如何设条、取决于条目标引的规范性(即所谓的“条目化”)。标引词的不规范也会直接影响到检索性,即会降低易检性。
三、条目检索率与系统性之间的平衡
《大百科》第二版精粹本在编纂时从增强实用性和贴近读者的角度提出条目的设置必须注重检索率这样一条原则,为了很好地贯彻以检索率为重要标准的设条理念,必须处理好检索率与系统性的平衡关系。精粹本的容量不同于第一版、第二版和简明版,更无法与我社即将打造的网络版的海量空间相提并论。海量设条,检索落空的可能性就会减小。精粹本的规模有限,已容纳不下第一版、第二版和简明版那样的系统性,这就要求在有限的宝贵空间内对条目的设置做更为合理的取舍和安排,在保留相对系统性的同时,给予综合性和检索率以更多的关注。但强调检索率并不是要完全抛弃系统性,精粹本由于没有分类目录,故其条目的系统性是潜在的、隐含的,虽不能一目了然但并非不存在。没有这种潜在的、隐含的系统性,条目的设置就会流于一种“大杂烩”,变成“捡到篮子里就是菜”。反之,如果只强调系统性,一些构不成完整系统性或无法归类而又有检索率的条目(如娱乐、旅游、休闲、家政、烹饪等方面的一些条目)就无法收入。所以检索率和系统性二者必须兼顾,而不能偏废。
根据上述对于影响检索率诸多因素以及检索率与系统性关系的分析,笔者以为要落实好注重检索率的设条原则,应解决好以下几个方面的问题:
首先,要解决好精粹本目标检索人的定位问题。因为所谓检索率主要是针对所定位的读者而言的,所以先要解决适合谁来检索的问题。其次,要明确精粹本本身的定位。这一定位是由其规模和综合性决定的。精粹本是一部综合性案头本百科全书,在这样的工具书中读者不能期望检索到像百科全书学科单卷本中所收那样系统、那样过专过细的条目。这也就是解决可以检索到什么的问题。再其次,要处理好文科和理科、不同学科之间以及同一学科内部三个层面条目设置的比重和平衡关系。从大的方面来说,先要根据注重检索率的原则处理好文科和理科两大板块设条数量的比例划分:不管是文科还是理科,哪个总体上检索率高就应占有较大的比重。然后要处理好不同学科之间设条数量的平衡问题。应对不同学科、不同领域、不同行业间的条目进行比较、平衡和取舍:属于热门学科、“显学”的条目因其检索率高故可适当多保留或多增设,冷门学科条目的数量则可适当压缩,在这两个层面的平衡工作做好以后,才可进入对同一学科、领域、行业之内条目间的比较、平衡和取舍。没有学科间的比较就确定一个学科、领域或行业的设条数目,就可能造成一个学科删掉的条目比另一个学科保留的条目检索率还要高,或一个学科本身可能保留了检索率并不高的条目而删去了检索率比较高的条目这样的结果。就学科内的设条而言,虽然可以打破学科的完整性和系统性,但打破不等于抛弃,保持相对的完整性和系统性仍是必要的和可行的。系统性的内容也有检索率的不同。我们删去一些学科的过专过偏过细的条目就是在系统性之中落实了检索率。
在遵循按检索率原则设条的同时,除了维持一些基础性学科条目的相对系统性以外,还应尽可能兼顾设条的局部系统性。这种局部的系统性主要表现在同类条目的处理上。如中国文学部分的“敕勒歌”一条,虽然有知名度,但我们还是把它删除了,原因是缺乏系统性:孤零零地设“敕勒歌”一条,那么别的同类条目要设吗?为什么单单“敕勒歌”要设条呢?而且这样设条也未免过于琐细了。同样检索率的同类条目,如果数量不大,最好做同样处理。又如中国文学的“前七子”和“后七子”两个条目,在选条处理上要保留就都保留。对待这种有相互关联性的条目不能保留一个而删去另一个。这也可以说是一种局部的系统性。
四、追求理想的检索效果
百科全书的功能主要是供检索,而不是备阅读,当然也不排除个别人会把百科全书作为阅读的对象。百科全书的检索方式或路径是按名索条,按条索文。就百科全书的条目设置和读者对知识信息的检索效果来说,不外乎这样几种情况:①条目设置了,也有人检索且能检索到所需内容,只是不同的条目被检索的频率会有所不同。我们所追求的正是这种“所设即所查”的效果,所设条目一般读者有检索的可能性、必要性而且可以检索到所需的内容。②条目设置了,但有人却检索不到,这又可分为两种情况:一种是因为标引词设置不当而造成的检索者不得其门而入,另一种是因为释文内容方面的某些缺失而导致读者想了解的内容查不到,这两种条目其实都是形同虚设,近乎“死条”(或称之为“准死条”)。所以设条不但要解决好设什么条目的问题,还要解决好如何设条的问题。如要让读者在按汉语拼音次序统排的百科全书中很容易地检索到“刘备”,最简单的办法是直接用“刘备”作为标引词,而我们却把刘备条设为“汉昭烈帝刘备”,以致完全改变了检索的路径,按汉语拼音的顺序是查不到的,读者可谓“不得其门而入”。为了使读者能方便查检,只好又设了一个参见条“刘备”,这样做本身就是放着捷径不走,兜了个圈子,实属多此一举。更进一步来说,仅仅设置了读者可能会检索的条目仍是不够的,还要设身处地地为读者着想:他们检索一个条目究竟想了解哪些内容?要知道,检索性的实现最终会延伸到内容层面。比如有关疾病的条目释文,如果没有介绍病因及防治方法方面的内容,读者可能就会大失所望,因为这可能正是其所欲了解的。③条目设置了,却没有人检索(不可能检索,也没有必要检索),这就是所谓的“死条”。拿教育卷所设的“助学金”一条来说,在要求完整性和系统性的专科卷里设此一条无可非议,但在精粹本中再保留此条就未必合适。一是因为这一概念本身是不言自明的,一般缺乏被检索的可能性;二是因为没有检索的必要,助学金的发放因国家和学校的不同而异,需到具体学校去咨询。④条目没有设置,造成检索落空,这种当设而未设的条目不妨姑且称之为“空条”。这种情况则是我们应当努力避免的。⑤条目没有设置,也无人检索。这种情况看似无所作为,其实有些可能正是将无人检索的“死条”删除后的结果,是经过编辑的劳动而留下的空白。
条目检索率的高低实际反映的是全书为读者服务到位的程度、贴近读者需求的程度、版面利用率最大化的程度和图书使用价值实现的程度。提高这种种程度正是提高《大百科》第二版精粹本检索率的目的和意义所在。通过提高检索率可以实现较好的检索效果,而理想的检索效果就是:条目的设置既无“空条”(漏设),也无“死条”(白设),所设即所查,而且容易检索到(具有易检性),从检索到的条目中也能查到所需的内容。经过《大百科》编辑们的“精心设计,精心施工”,删除一批检索率低的条目,又增补一批新学科、新理论、新知识、新概念、新方法、新人物等检索率高的条目,理想的检索效果是可以实现的。
(责任编辑 郎晶晶)