1958—1965年中国图情领域穿孔检索技术进展

2020-03-14 09:25吴稌年
高校图书馆工作 2020年4期
关键词:穿孔检索资料

●吴稌年

(江南大学 江苏无锡 214122)

1 穿孔卡的早期研究与应用

在国际上,于19世纪30年代提出了用穿孔技术控制机器运作的设想。1832年,巴贝先生设想用一种一般记号来操作一种广范围的计算机器,他于1834年去巴黎参观世界博览会时,发现了由约瑟夫·雅各发明的穿孔卡织布机,使他深受启发,他兴奋地想到穿孔机正好可以作为输入装置[1],并于1837年提出了分析机概念。这是一部有弹性且由穿孔卡控制的数字计算器,内中几乎有着现代计算机中的每一个要素[2]。

穿孔技术最早应用于人口普查的数据统计中。19世纪后期,美国每十年进行一次人口统计。由于人口的自然增长、搬迁、移民的增加等因素,使统计工作面临着很大的困难,“1880年做的调查到1887年还没有统计完毕”[3],美国人霍莱瑞斯通过访查、研究,明确了利用穿孔卡帮助统计的想法,并制作出一台利用穿孔卡和弱电流技术的制表机,应用于1890年的人口调查中,获得了巨大成功。在这次所有的统计资料汇总到华盛顿一个月后,就通过这台机器完成了统计工作。此后,西欧许多国家和加拿大等国的人口调查都逐步使用了这种机器。这一技术在财务统计、病历统计等许多领域广泛应用。1930年代开始,英美等国的一些专家开始在图情领域应用穿孔卡技术,试图对图情业务进行有效的管理。

1950年代,电子计算机的诞生为文献检索的发展翻开了历史性的一页。美国利用计算机技术开始了在文献检索方面的试验工作,除了军队系统、图书馆系统外,科技情报界亦大力开展研究,如美国金属学会于1955年开始一项新的实验,“实验的目的在于研究是否可能使用机器来查找冶金学方面的资料”[4]。前苏联图书情报界也不示弱,全苏科学技术情报研究所在1954年装配了一部实验资料检索机,“机器的工作原理和普通分析计算机相同,使用80行列穿孔卡片”[5]。此时,穿孔技术已被运用到计算机应用中。

2 我国对穿孔卡片的介绍

我国对穿孔技术较为集中的介绍始于1958年。随着我国科学技术发展的突飞猛进,对文献资料的需求越来越紧迫,能否及时查询到相关资料,成为是否能更好地“向科学进军”的前提。能够全、准、快、便地为读者提供所需文献资料,成为图书情报界为读者服务工作中的时代要求。在这方面,情报界比图书馆界更具紧迫感,他们要更好地为“五年计划”“十二年科学规划”和科技创新工作服务,从而掀起了一个介绍、引入、试验和利用穿孔技术的高潮。是年11月,《科学情报工作》杂志刊出了一期有关穿孔技术的专号,载有7篇文章。在本期之首,刊有“编者的话”,认为“穿孔卡片和机械检索是一种新的情报技术,它们的发明为分类编目工作开辟了新的发展方向,提高了科学技术文献资料的利用效率”[6]。是期所刊载的内容,主要有:第一,提出了穿孔技术的核心问题,认为穿孔卡片应用于资料工作,在我国还是一件新鲜事,穿孔卡片和机械检索的核心问题是代号系统的创制,而代号系统是因学科而异,亦是穿孔卡片研究之难点,从而指明了在研究工作中的重点方面的工作。第二,较全面、简洁地介绍了穿孔技术的内容与特征,认为“穿孔卡片的种类很多,但大体可分为手工检索和机器检索两种”[7],从而为我国研究和应用穿孔技术指明了方向。第三,介绍了“孔”的含义,每个孔或几个孔的组合代表一个专类或一个专门概念,每个孔和孔组相当于分类法的一个类或索引的一个标题,或某一个文献的特征等内容。同时指出了因为手工检索的简易性,是各个单位都可应用的,而机械检索则只能具有这类机器的单位使用。并且还介绍了手工检索的方法和类型,以及相关设备的代购处等信息。手工卡片在当时应用范围较广,无论是编目、编文献索引、登记出借文献、文献保藏等都可应用。第四,穿孔卡应用的经验介绍。在一个原来完全陌生的领域进行开拓性的工作,其难度是很大的。冶金工业部钢铁研究院于1958年下半年,开始调研穿孔技术的文献加工与检索问题,通过对科学院情报研究所、出版社、医院等系统的调研,了解到在卫生部门已经有了穿孔卡片的应用,这是作为统计相关数据而使用的,对管理资料方面的应用,“经过我们一个多月的刻苦钻研和摸索,终于设计出了符合我们工作需要的穿孔卡片”[8]。

与此同时,中科院机械研究所为了尽快编制出文献索引,亦大胆试制穿孔卡,这种穿孔卡要达到的要求是:用一套目录达到分类、篇名、著者等三种目录的作用。并要求同一种卡片格式能适合于俄、英、德、法等若干种文字的需要,“适合这样要求的穿孔卡图样在文献中是找不到的,而我馆自行试制的穿孔卡便完全解决了这些问题”[9],从而破除了穿孔技术的“神秘感”,为广大图情部门的使用增强了信心。此外,通过介绍前苏联的相关情况,以便使我国在这一工作的起步阶段能有一个较为全面的认识:“选择或设计资料检索系统,是根据工作性质、资料数量、要求条件、和检索系统的运用方式决定的。”[5]还介绍了针对学科较窄、内容较为简单的和学科较宽、内容较多且较为复杂的多种不同穿孔卡的制作方法,以及使用机械检索所要解决的主要问题,一是创制“机器语言”;一是研究出检索技术,主要的是要创制分类资料的代号体系,如名词的标准化、建立分类所用的词与词间的联系,标题索引的编制等等问题。

从开始研讨穿孔技术之时,至“17年”(1958—1965年)时期结束,可以看到《科技情报工作》杂志在图情领域中对穿孔技术的宣传与研究方面起了引领与关键作用。其一,在图情领域中,相关内容的文章主要刊登在这类杂志上,在这项工作研讨之初,除了以“专号”形式发刊外,还针对“专号”内容,刊发了“编者的话”,将这一领域的研究要求、期望写入其中,成为引领之始。同时,通过整理该刊编辑部的资料,刊发了《穿孔卡片和机械检索》一文,综述了穿孔技术相关问题。这种又是刊发“编者的话”,又刊发由该刊编辑部拥有的资料而整理出的文章,二者并举,在笔者所查阅的资料过程中还是首次遇到,足以显示出该刊对传播这一技术用力之深。为了更好地满足运用穿孔技术在检索过程中的要求,该刊编辑部经过整理,又于1959年第2期上刊发了《标题卡资料管理法》一文,重点介绍了标题卡问题,即在前文中所称的“重叠比孔卡片”,主要是“谈为什么要用这种方法,用它能解决什么问题,这种方法根据什么原理,有何优缺点,使用时应注意哪些问题”[10]。除了在理论上加以介绍外,还介绍了该刊编辑部用这一方法所做的小规模试验,从而将理论结合实践,并有实践范例,为推广这一工作起到了较好的作用,既宣传了主题卡的特征,它打破了体系分类系统的拘束性,又消除了复式标题索引名词的排列组合问题,可使文献的分析编目和检索达到前所未有深度,提高了文献检索效率。“根据理论上的计算,标题穿孔卡可减低一般索引的卡片用量50%~90%”[10]。

3 我国研究穿孔卡片应用之起始

1959年上半年,在石油部办公厅档案科工作的朱振庭开始了对穿孔卡片的应用研究,但是遇到了代号体系上的困难,于是大胆去信《科学情报工作》编辑部,要求有关人员解答这一难题:“我们正在筹备使用这种卡片,但关于号码定类方法还不了解,因此请求你们给予帮助”[11]。很快,该编辑部在该刊上作出了指导与解答:“你们的号码‘1’,事实上应读为‘0001’,轧孔时,在个位‘1’处用深轧,另外还必须轧出0位的‘3’,以表示号码中有三个零……”[12],从而通过该刊进一步宣传和指导了穿孔卡片的应用。

这一时期主要开展的是手工穿孔卡的应用研究问题,一些单位通过成功的事例,迅速介绍经验,以示推广。中国科学院财务部门在1959年开始在发薪工作中使用了穿孔卡片,他们把人员的分类、工种、工资级别、性别、参加工作时间、进入本馆时间、文化程度、离馆时间等信息反映在一张卡片上,“通过穿孔分别汇集,工作可由多人同时进行,由过去送工资需8、9小时的工作时间缩短到只需3、4小时”[13],减少了三道工序且保证了质量。他们通过10个月的使用,体会到了这种方法在管理上的优越性,同时认为在人事档案、统计工商企业的产品、医院病历的统计、图书资料的分类等管理工作中,可以推广使用。

长江流域规划办公室技术情报科及时介绍了他们通过穿孔卡片检索水工、水电资料的经验。在实际运用中,采用边缘轧孔的形式,并根据资料室特征,采用了自订分类法,参考水电工程分类办法,将资料初步分为勘测、气象、水文、水工设计、建筑、机械、电气、施工、科学试验研究等9类。在各类下再根据实际情况划分二、三、四级类,“但这些分类分项不能分得过细,否则代号太多,容纳不下”[14]。这一经验,对于当时我国刚起步的情报界十分有效,适合于在一些小型资料室中应用与推广,对于专业图书馆而言,在进行专题揭示与检索工作中同样具有参考价值。这种“手工边缘穿孔卡”在较多单位得到应用。例如,湖北省农业科学研究所情报资料室1962年从日本购买了南江堂印刷的卡片,这种卡片的上方有2列小圆孔,其余3方有一列小圆孔,从而可将分类号、登录号、地区号等内容对应于各小孔,检索时只需通过对应所需信息的小孔进行“穿孔”即可获得所需信息,“我们初步试用了少量的‘手工边缘穿孔卡’,效果很好。因此,我们准备从今年10月1日开始正式试用”[15]。

这一时期,在我国主要推广的手工穿孔卡,其原理与作用属于并行式检索设置。从卡片本身所载内容特征,分为资料卡和主题卡两种。每一张资料卡代表一个信息单元,可载不同的信息特征。每张主题卡代表一个主题特征,可载包括具有这一特征的资料号码等内容。在文献检索过程中,采用穿孔卡方法,具有检索中的快与准的特点。但在加工过程中由于工作量相对较大,而且局限于“孔系”的设置,不可能在大范围的巨量信息检索中应用。因此,利用手工穿孔卡处理信息,通常都是针对那些利用率较高的文献资料,适用于较窄小的专业、试验室及相应的情报机构及专业学科文献等。根据国外应用手工检索穿孔卡的经验,它适用于处理资料的数量在1万件左右[16]。若超过这一范围,应将资料分成若干专业或学科,根据不同的性质设计穿孔卡的代码系统,编制穿孔卡目录,从而使我国图情界清楚地认识到了手工穿孔技术应用的适用范围。

4 对机械检索的关注与研究

从60年代起,我国情报界进一步关注机械检索问题,开始译介国外的相关信息。《机械与检索》一文的文摘,简述了英国使用机械检索的情况,如打孔卡的使用、应用计算机设施、文献检索中机械化程度等。作者认为在机械检索过程中,“主要应着重于情报贮存方面而不是情报检索方面”[17],核心是人的问题而非机械设备问题。这一观点,指明了检索系统应建立在精细的标题分析和编码之上,由此才能发挥出检索系统良好的作用。1961年初召开的“第二次全国科技情报工作会议”,把机器检索列入全国科技情报工作的发展规划,1963年召开的“第三次全国科技情报工作会议”,把研究新型复制方法和设备、情报检索机械化、机器翻译和电子情报逻辑机等4项任务列入“全国科学技术情报工作十年发展规划”。在机械化检索方面,聂春荣主任委员在中国国外科技文献编辑委员会第二次年会上号召:“积极开展机械化检索方法的研究和试验,特别是索引机械化编制方法的研究与试验。”[18]这是对文献信息检索需求不断扩大的必然结果。

为使我国图书情报界更好地了解穿孔卡机械检索问题,1962年《科技情报工作》杂志上刊载了贡光禹先生的《科技情报的机械检索》一文,该文较详细地介绍了相关内容,使我国及时了解了这一技术的进展和发展趋势。机械检索技术在国外已较为成熟,其检索系统和工具有边缘穿孔卡片、重叠比孔卡片、利用分析计算机检索的中央穿孔卡片、采用缩微胶片或胶卷的光电系统及采用快速电子计算机的检索系统等。“目前国外用简单的振动检索装置每小时可检20 000张穿孔卡片”[16]。如果采用由磁式分类机,每小时可处理2.4张万穿孔卡片,采用电子式分类机,每小时可处理4.8万张穿孔卡片。整个机械检索系统所需的设备包括打孔机、验孔机、查对机或分类机、打印机等,以查对机、分类机和打印机为要。在我国不断深入穿孔卡技术的应用过程中,对这一技术的本质特征也有了不断深入的理解,“研究与应用边缘穿孔卡片时,重要的问题是检索语言的编码问题”[19]。而且需要有标准的、适用的主题词表及较完善的参见与互见系统,通过编码较好地表示文献的主题特征,并在穿孔卡上严格地、单义将这些主题表示出来。鉴于当时我国对检索语言的研究情况,专家们认为必须尽快研究出适合我国国情的主题词表,以填补我国在这方面的空白,为机械检索、计算机检索的研究工作奠定检索语言方面的基础。为此,一些专家建议先从译编主题词表入手,并大力开展图情领域的合作:“情报部门负责标题的翻译,图书馆方面负责主题表的编辑。编成的主题表,可以作为我国科技文献的统一主题引得工具。”[20]同时,开始宣传和推广“概念组配”的应用。在重叠比孔卡中,代表主题的孔不是预先加工好的,而是在登录资料时进行穿孔,“这种检索系统是以‘概念组配’的原理组织的,是一种检索速度快、索引深度大而又经济可行的检索装置”[19]。

对于主题词表的自主研究及编制,我国是在1960年代开始的,我国首部自编的标题表《航空科技资料主题词表》1964年由三机部第628所编制成功,它标志着我国在检索技术领域的词表编制上有了突破。1965年5月,中国科学技术情报研究所开始了“机器穿孔的情报检索研究”,同年还首次从法国进口了一台布尔穿孔卡片输入计算机,“准备试验用这台机器通过叙词法加工输入来存储、管理和提供馆藏文献查询服务,从而最早开创了我国情报工作计算机化的尝试”[21]。是年12月,该所的理论方法研究室试验成功穿孔卡片检索,并小批量生产推广,这是我国情报自动检索道路上迈出的历史性一步,但这一良好的势头,被“文化大革命”的开始而完全中断。

猜你喜欢
穿孔检索资料
Party Time
PAIRS & TWOS
JUST A THOUGHT
鼻石致鼻中隔巨大穿孔1例
专利检索中“语义”的表现
手术治疗胃十二指肠穿孔效果研究
老年急性胃十二指肠穿孔的治疗分析
自发性乙状结肠穿孔7例诊治体会
国际标准检索
国际标准检索