王英学
摘要:从清水江文书数据库建设的角度,探讨了清水江文书数字对象描述无数据核心元素的选择和定义,并形成标准框架,同时用实例论述了清水江文书各元数据项的著录规范。
关键词:清水江文书;描述元数据;著录规范
中图分类号:G250.74
文献标识码:A
文章编号:1674-621X(2015)03-0059-04
清水江文书是流传于黔东南清水江流域苗族侗族地区特有的古代乡村文献,数量巨大,据有关专家保守估计散藏在乡村村民家中的清水江文书约30万件。对清水江文书这类多以纸质单件留存的古文献,最有效的保护方式是进行数字化保存。清水江文书数字化,需要建立系列标准和规范。目前有多家收藏单位分别在建设清水江文书数据库,如不规范建设,会导致开发的数据库不能兼容和正常使用,并会带来管理的新问题,还会造成人力和物力的大量浪费。清水江文书整理与开发研究团队为了建立一个通用并可实现异构多级管理的数据库,特探讨清水江文书数据库建设的系列标准,其中包括清水江文书数字对象描述元数据标准。清水江文书数字对象描述元数据,是指用来描述或标识清水江文书信息资源的数据,用于描述或识别清水江文书内容和外观特征,对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体位置与获取方式、制作与利用方法等。元数据标准是数据库建设的重要标准。为了满足我国数字图书馆建设规范的要求,清水江文书元数据设计特参考我国数字图书馆规范建设研究项目“专门数字对象元数据标准规范”系列成果,并结合清水江文书的特有属性,探讨和研究制定清水江文书数字对象描述元数据标准和著录规范。
一、清水江文书描述元数据基本框架的设定
作为一个数字对象描述元数据的设定,首先要明确其描述的对象和著录单位。本标准描述的对象即是清水江文书。清水江文书产生于明清至民国,主要包括卖契、财产析分合同、佃契、典契、借契、拨约字、宗族与婚姻文书、政治与法律文书、土地管理与赋税文书、军事与治安文书、民间信仰习俗、教育与科考、山场座簿与田土清册以及杂类。清水江文书的著录单位为每一份契约合同或文告。其数据信息的描述元数据应由核心元素、资源类型元素、个别元素三部分组成。
我国数字图书馆建设标准的数字对象描述复用Dublin Core的15个元素做为核心元素集,清水江文书描述元数据复用7个核心元素(Core ele-ment),它们分别是:题名、主要责任方式、其他责任方式、日期、出版者、附注、主题,由于清水江文书的特殊性,在复用这7个核心元数据时,变异调整为:文书题名,文书主体责任人,文书其他责任人,契约日期或文告时间,文告发布者,附注为对特定文书信息的附注,主题为文书类型的关键词。
清水江文书类型核心元素(Local Core ele-ment)参照我国数字图书馆建设标准设计为:载体形态,即为文书的物质载体、色彩、尺寸;收藏历史,包括获得方式和印记;馆藏信息。
个别元素作为清水江文书中的扩展信息进行记录。
二、清水江文书描述元数据设置及著录定义
1.题名
名称:题名;标签:Title;定义:契约文书的正题名及说明;术语类型:元素;元素修饰词:自拟题名、其他题名。
(1)自拟题名(文书签订时间+文书主体+文书类别)。名称:自拟题名;标签:Self;定义:文书不具有题名时,标引人员根据具体文书自行拟定的题名;术语类型:元素修饰;修饰:题名;注释:从文中拟定题名,按照(文书制定时间+契约文书主体+文书类别)拟定。
(2)其他题名。名称:其他题名;标签:Other;定义:清水江文书题名的其他替代写法或规范名称之外的其他名称;术语类型:元素修饰词;修饰:题名。
2.主要责任者
名称:主要责任者;标签:Creator;定义:契约主体人(卖方,其次买方)、官府文告发布者、文书责任实体;术语类型:元素;元素修饰词:责任者说明、责任方式。
3.其他责任者
名称:其他责任者;标签:Contributor;定义:契约签署的中人、凭中、担保人;术语类型:元素;元素修饰词:责任者说明、责任方式。
4.日期
名称:日期;标签:Date;定义:立契时间或文告时间;术语类型:元素。
(1)年号纪年。名称:年号纪年;标签:LunarDate;定义:明清皇帝年号纪年,且年号纪年前加上朝代:如“清”;术语类型:编码体系修饰词;修饰:日期。
(2)公元纪年。名称:公元纪年;标签:Grego-rian Calendar Date;定义:以耶稣诞生元年的太阳历纪年法;注释:国际通用的纪年法;修饰:日期。
5.出版者
名称:出版者;标簦:Publisher;定义:契约文告的发布者或发布主体;术语类型:元素。
6.附注
名称:附注;标签:Description;定义:契约文书中需要说明的问题。
(1)缺字附注。名称:缺字附注;标签:Description Quezi;定义:记录和描述扫描的契约文书缺少的文字描述;术语类型:元素修饰词;修饰:附注项。
(2)责任者附注。名称:责任者附注;标签:Description Creator;定义:对签约责任人或公告的实体需要进行的说明;术语类型:元素修饰词;修饰:附注项。
(3)相关文献附注。名称:相关文献附注;标签:Description Relation;定义:与契约文书有关联的文献说明。
7.关键词
名称:关键词;标签:Keyword;定义:不同种类的契约、文书;术语类型:元素。
8.载体形体
名称:载体形态;标签:Physical Description;定义:契约文书的载体形态;术语类型:元素;注释:此项著录契约文书的载体、色彩、开本或规格。
9.收藏历史
名称:收藏历史;标签:Collection History;定义:清水江文书的流传历史以及相关的内容;
注释:此项著录契约文书的收藏沿革、获得方式、购买价格等。
10.馆藏信息
名称:馆藏信息;标签:Location;定义:资源所属机构或提供资源的机构信息;注释:该项著录契约文书的收藏机构,如契约文书典藏号。
三、清水江文书描述元数据著录规范
为了准确地描述清水江文书,课题研究组拟定了《清水江文书数字对象描述元数据及著录规范》,其规范注释为:
1.清水汪文书题名无数据著录规范
清水江文书题名元数据是核心元素中的第一个。清水江文书的题名著录原则为:文书如有题名原则上照录;文书没有题名时,拟定题名。题名拟定的规范按照“契约文书签订时间+契约文书主体+契约文书类别(事由)”原则拟定。其中立契人为契约的主体,契约的种类按契约分类标准:卖契、佃契、典契等拟定。契约文书签订时间,按原契或文告时间照录。以下面的契约为例。
契1.立卖鱼塘人橱朝旺、朝举兄弟二人,夸因家下要钱使用,无从得处,自愿将到庙皆祖遗鱼塘二大房分落,外一边分为五股,自己出卖问到本房杨含珍兄弟二人承买为业,五股卖自己面分一股一半,议定价钱伍佰文正,其钱亲手领明,并无包卖他人分寸在内,自卖之后不得异言,如有不清,自前理落。今欲有凭,立有卖字为据。
亲笔 杨朝旺
凭中 龙广书
道光二十九年十一月十五日立卖
这份契约没有题名,按“契约文书签订时间+契约文书主体+契约文书类别(事由)”原则,拟定的题名为“道光二十九年十一月十五日杨朝旺、杨朝举立卖鱼塘契”
2.主要责任方式元数椐著录规范
立契人或文告人是契约文书的主要责任人,并进行元数据著录,符合数字对象描述的元数据著录规范。清水江文书的主要责任者可以是个人、家族、团体,或者官府文告发布者。同一责任方式著录不超过三个,多余三个著录为“某某等”。不同责任方式之间用分号。
如上契约为例:责任主体为“杨朝旺,杨朝举卖方”
3.其他责任方式元数据著录
在清水江文书数据库元数据著录规范中,是把契约文书中的“凭中”等作为其他责任人,有其特殊的意义。契约的签订,必有中人,曰“凭中”。清水江流域,民间各种契约活动的签订一定有中人参加,并在他们的介绍和参与下,当事者商定契约的内容,确认各自的意思并写下契据、文书。在契约文书签订中,中人有不可替代的作用,在交易双方中起中介,包括寻觅适当的交易伙伴,参与议定价格,监督和证明契、价的两相交付以及不动产中的临场踏清界址等。被选着中人的人在家族中是有一定的地位和声望,当事的各方都信任,并且大部分中人在契约签订过程中还分取定的担保金。所以在拟定的元数据著录规范中,把“凭中”作为责任人著录,在数据库中提供检索。上例中的其他责任人著录为“龙广书凭中”。
4.日期元数据著录
日期元数据是清水江文书数字对象描述的核心元素,每份契约文书都书写有日期。清水江契约文书中书写的日期除民国后期有些采用公元纪年的外,明清时期书写的日期一般是使用年号纪年时间或农历时间。契约日期在文书中起作重要的作用,清水江文书中的契约既是长期有效契约、同时又有时间段的限制。例如典契、佃契、杉木买卖契等。特别是“佃山栽种林木契”,林木从栽种到发卖,周期很长,契约中除了规定双方的权益外,还明确标注木质长大发卖后,土地要归还原主。像这样一类的契约,时间就有一定的约束力。所以契约文书日期是契约文书中的重要内容,在元数据著录规范中明确规定契约文书日期采用照录的原则,同时设立公元日期对应参照,并作为检索项。
5.出版者元数据著录
清水江文书对此项的元数据进行了变通,并且是作为一个可选择的著录项。因文书中的绝大部分是私人契约,并大量由个人收藏,一般是不被公开和发布的,也就不存在出版者这一项的内容。但清水江文书中有定量的官府文书,官府文告的发布者应可作为出版者著录,对此项元数据核心元素进行了保留和变通。
6.附注项元数据著录规范
附注项是清水江文书元数据中的核心元素,对于附注项的著录规范是,凡契约文书需要说明的都加以说明。例如文书缺字附注的说明、文书释义说明、红契白契的说明、官契或私契的说明、单契或粘连契的说明等等。契约文书的附注项是一个非常灵活,并且提供大量信息的特殊项。例如下面的这一张契约:
契2.立典柴山沙(杉)木人扬俨然,今因要银取用,无从得处,自己将魁杞屋背柴山沙(杉)木壹块出典,问到岳寨秦现澋承议作价银壹两伍钱铜钱整。山内除有沙(杉)木陆根、南(楠)木壹根、青岗木壹根不典,大小沙(杉)木细柴任从典主,日后欲禁伍年,不限远近俻得原本价赎约,夸欲有凭,立典是实。
于飞代笔
道光十二年七月初四
同治二年二月杨大吉照契转典与杨业兴耕种,立转典是实。
同治三年扬业兴照契转典扬事权耕种是实。
大吉笔
这份契约现保存在杨事权后人手中。从契纸字面文字可看到,立典所指的魁杞屋背柴山沙(杉)被两次转典,什么原固原土地权人没有赎回这块杉山,笔者不得而知。但从对契约的著录来讲,这张契纸实际是三份典契,且地产权最后属于杨事权。所以附注项就要对三次转典进行说明。
7.关键词
关键词的著录采用抽取文书种类进行著录,每份文书选取2-4个关键词不等。例如:契2关键词:柴山杉木契,土地契,典契。
8.载体形态元数据著录规范
载体形态是清水江文书类型核心元素。“清水江文书”按载体区分,有纸契、布契、石契、皮契。在数据库中的扫描件基本上是纸契扫描件。对于纸契在载体形态项标注是:纸契;多少页;长X宽cm;毛边纸或绵纸或别的材质。石契是以照片的形式在数据库中呈现,对契约文书载体的描述,首先指明载体的类型:石契;碑文的长宽厚度;碑文位置。
9.收藏历史
收藏历史著录文书收藏沿革,注明获得方式。在元数据著录规范中,明确著录契约文书的收藏沿革、获得方式、购买价格;如果是扫描件,需著录从何处对原件进行扫描。
10.馆藏信息的著录规范
对馆藏信息的著录规范,著录原件现收藏地、馆藏号或收藏农户姓名。
清水江文书数字对象描述元数据的设计和著录规范,对元数据集的核心元素进行了定义和规范,并实际运用于数据库建设中。在实际著录时,清水江文书是一个较为复杂的复合对象,需要利用大量的地方知识,才能进行完整的描述。同时该文由于篇幅的关系,对清水江文书中数字对象描述的扩展元素没有论及。