基于GIS的中国古籍地理信息系统研究

2017-01-16 08:40王大学杨光辉
复旦学报(自然科学版) 2016年6期
关键词:刊刻古籍检索

王大学,陈 熙,杨光辉

(1. 复旦大学 历史地理研究中心,上海 200433;2. 复旦大学 中华古籍保护研究院,上海 200433)

基于GIS的中国古籍地理信息系统研究

王大学1,陈 熙2,杨光辉2

(1. 复旦大学 历史地理研究中心,上海 200433;2. 复旦大学 中华古籍保护研究院,上海 200433)

“基于GIS的中国古籍地理信息系统”是通过GIS手段构建的一个集成化的大规模中国古籍资源库及古籍研究数字保障体系,开放给学界和大众使用.该系统借助中国历史地理信息系统(CHGIS)平台已有数据,通过建立Web GIS的方式,表达古籍基础地理信息的空间分布及演变,为用户提供便捷的数据查询、检索、编绘专题地图和连接用户数据等功能.本系统不仅可以为古籍保护、学术研究提供大数据平台,提高古籍利用效率,并推动中国书籍流通史的研究,同时也将成为全新的传统文化传播方式,促进与古籍相关知识和文化的社会化推广.

古籍; 地理信息系统; 中国历史地理信息系统; CHGIS

数字化时代的中国古籍书目网络检索比传统时代借助卡片和纸质书目查找方式方便了许多[1-2].目前,全球许多中国古籍的收藏机构推出了各自的书目数据库,使人们可以借助网络方便地查找自己感兴趣的古籍书目方面的内容[3-4].这无疑为推进相关学术研究和社会推广提供了较大的方便,但是在面对以下问题时仍有诸多不便[5-6]: 如何能够通过一个集成全球中国古籍书目数据库的系统,方便、快捷地查找自己需要的书目及其相关信息;如何把某一部或一批古籍,放在其刊刻或写作的时代来看其中相关的空间信息及时空变化等,例如作者的籍贯、书籍的成书地、古籍后来的流通过程等;如何借助古籍书目系统拓展中国古籍历史研究的领域和范围等等.为此,学界已就如何利用GIS技术对古籍资源的整合问题进行了初步研究[7-8].为了更好地利用已有的各种分散的古籍书目数据库,推进提供中华古籍的利用效率并推进相关学术研究,“基于GIS的中国古籍地理信息系统”有必要提上议事日程[9].

1 系统目标

基于GIS的中国古籍地理信息系统是利用基于GIS技术存储、管理和更新古籍书目数据库,并在GIS的数据操作及空间分析技术的辅助下,将古籍相关的图像、影像、文字、古纸(年代、原料、纤维、菌群等)等多种数据汇集起来,构建可视化的古籍时空分布系统,并形成一个数字化、集成化的大规模中国古籍资源库及古籍研究数字保障体系,完整有序并且永久地储存这些资源,开放给学界和大众使用,实现以古籍为核心的相关数据的存储、检索、展示和推广.

本系统也提供传统的中国古籍检索系统所不具有的功能: 第一,展示古籍的时空演变历程.借助GIS技术,展示古籍历史地理信息的连续性变化.该系统不是描述一个或多个时间截面的空间信息,而是描述这些信息在时间上的连续变化.第二,成为高效的研究平台.借助该系统,可以方便地查询和检索用户需要的有关古籍的基础地理信息.显然这样一个系统和数据将为研究工作带来很大方便,这是从事基于GIS的中国古籍揭示系统研制工作的第一个目的.从信息角度看,该系统是把有关中国古籍空间信息描述方法和内容转移到历史变迁地图上,大大方便了阅读和研究与中国古籍有关的历史地理信息,提高了中国古籍历史地理信息空间位置的准确性、检索和研究的便捷性.第三,创新古籍社会推广模式.系统将以二维、三维的方式静态、动态展示古籍的产生、流转、保存等相关信息,并展示相关作者和历史人物的空间分布和迁徙过程,以及相应的时代背景.系统将成为不同年龄层次、不同人群获取古籍相关知识的重要渠道,推动古籍知识的社会普及.

该系统可以为用户提供多种关键词检索,满足用户不同需要,并根据检索结果生成相应专题历史地图.例如,用户可以用某一种“书名”作为关键词进行检索,看历史上该书先后刊刻次数、刊刻时间、刊刻者或单位、刻工、收藏地及其变化等内容,借此研究该书传播的时空过程.同理,研究者还可使用作者、刊刻者或刊刻单位、刻工、成书时间等作为关键词进行检索,并展开相关研究.

随着数字化时代的到来,很多原先用一般印刷手段保存的信息将转变为数字信息,中国古籍也将如此.数字化的历史空间信息有一个重要的前提,即信息的空间可比性.如果人们用不同的标准编制了各自的专题历史地理信息,那么在对这些信息进行比较时,就会出现空间数据不能很好地叠加甚至无从比较的问题.因此,在历史地理信息方面需要有一些技术标准或数据平台,以便不同历史地理专题信息之间可以进行准确地叠加和相互比较.基于GIS的中国古籍地理信息系统的另一个重要目的就是希望搭建这样一个平台,为中国古籍信息化的发展打下坚实的基础.

任何专题历史地理信息系统建设的目的还在于提供方便的检索,并深化与此专题相关的研究.自1997年以来,国际古籍学界开始探索印刷文化这一多侧面且复杂的社会现象的研究路径.印刷品的流通,不仅包含印刷文本本身,而且也涉及到流通中所有的参与者以及相应的政治、社会与经济因素.国际上有好几个国家的印刷史研究计划在进行,但只有加拿大的项目首次包含历史GIS的因素[10].基于GIS的中国古籍提示系统的长期目标是,利用GIS并借助CHGIS来多视角探索中国书籍史及相关的社会文化史.

利用GIS建设中国古籍地理信息系统的最重目标是允许学者检索、可视化并研究与古籍有关的时空模型.使用标准资源数据,并且利用GIS来对古籍在全国或者区域尺度上进行可视化,以便对它们进行跨越时空的比较.古籍的写印和传播会随着时间出现地理变化,这一地理变化又与科举考试、政治变革、经济发展、交通条件、城市化进程、气候环境变化等因素密切相关.

2 系统建设的可行性

GIS不仅是制图工具,更重要的是数据库技术,它能够解决数据“是什么”和“在哪里”的问题.GIS能够将空间信息与其他各种信息整合在一起,在此检索平台基础上可以详细研究各种专题.GIS运用到史学研究有三大优势: 第一,数据的有效整合,看似不兼容的材料能够被整合在一起;第二,数据可视化,利用二维、三维或虚拟景观技术展示数据并激发出新的灵感,拓宽研究思路;第三,空间分析.在20世纪90年代历史GIS开始初步发展阶段,遇到的一个主要问题是历史统计数字的自动制图.实现自动制图取决于两个条件: 第一,需要海量数据;第二,要有精确的点、线、面[11].这是历史地理信息系统的核心与关键,因为历史地理信息往往用人文要素表示其所在的地名或者政区位置,这需要转换为精确的经纬度并投射在现代地图上.但问题在于,地名、行政隶属及其边界在不同历史时期均会发生变化,这就为历史地理信息的空间定位、可视化与空间分析造成无法回避的问题.

为了解决上述问题,包括中国在内的国际学界不约而同开始了各自的国家历史地理信息系统建设[12].中国历史地理信息系统项目(CHGIS)试图建立一套中国历史时期连续变化的基础地理信息库,为研究者GIS数据平台、时间统计以及查寻工具和模型.CHGIS的基础地理数据包括连续的时间序列,描述地名、行政建制和其他基础地理要素.这一套灵活的工具和数据可以方便检索和查询中国基础历史地理信息.每一个随时间变化的独立地理要素记录拥有一个唯一的ID号,它可以用作相关数据库中的关联编码,也可以此连接相应的地理要素释文,同时用户还可用此ID号把自己的数据连接到CHGIS数据中,按不同历史时期和不同数据集的方式,查寻、检索和显示用户数据[13].

无疑,中国历史地理信息系统的设计理念、数据库结构和数据内容等都为中国古籍地理信息系统的建设提供了良好的平台和可能性.

3 系统的核心内容

建设世界一流的大型数据管理和发布平台,必须采用国际标准和建库方式,为所有的数据和文件设置符合规则的标引和链接,包括数据结构标准、数据值标准和数据格式标准等.在基于GIS的中国古籍地理信息系统中,元数据的标准化问题最为关键.无论书名、人名和地名均会出现诸如同名而含义不同、不同名而所指相同等复杂情况,加上时空变化的复杂因素,必须对所有相关要素标准化处理,否则可能会出现人名、书名和地名无法精确匹配的现象,从而导致检索结果混乱.需要说明的是,数据库本身的结构设计需要不断改善和更新,以方便容纳新的数据.作为属性数据的中国古籍元数据主要包括下列要素:

作者: 主要包括姓名、字号、籍贯、生卒年月等.对于古籍作者的数据进行如此详细的记录,目的在于避免因重名重姓而导致检索结果出现偏差.某些作者的生卒年月无法准确到公元纪年,可以用生活年代的皇帝年号来表示.

书名: 书名需要注意同书异名问题,因为某些古籍在历次刊刻过程中可能会出现这一现象.至于书名相同而内容不同的问题,结合古籍作者和写作年代不难作出准确的判断.

版本类型: 按成书方式分类标注为刻本、稿本、抄本、写本等;按刊刻者标注为官刻本、家刻本、坊刻本等;按成书地标注为浙本、闽本、建本、蜀本、平阳本、高丽本、日本本等;按印刷材质分为: 影印本、石印本、铅印本、铜版印本、珂罗版印本、泥活字本、铜活字本等等.选取主要版本特征进行标注.

分类: 按经、史、子、集、丛、新学归类.

刊印时间: 古籍首次刊刻印刷时间、卷数和册数等.刊印时间精确到公元纪年,无法精确的用年号或朝代表示.

刊刻人、刊刻机构: 古籍刊刻者多用自己的字号或者室名,在记录古籍刊刻者信息后,需根据文献材料准确判定刊刻者的具体名字.刊刻单位包含书坊或者官方书局,关键是要弄清楚它的流变.同一古籍在不同刊刻人或者刊刻单位处的刻本会有不同,也需要专门记录.唯有如此,才能对某一刊刻人或者刊刻单位刊刻的所有古籍进行有效检索.

刊印地点: 古籍刊印地点的精确定位,是本系统的关键.数据库中地名元数据的制作包括两个方面: 用拼音统一拼写地名和增加所属省份.对于任意一本古籍的刊印地点,在有条件的话需要记录刊印时候的乡村、市镇名称、州县、府州、省级政区等政区各个层级的情况,并要增加刊刻地点的精确经纬度.此处的难点在于,刊刻地点如果是市镇以下的历史地名或者目前CHGIS尚未完全收录的地名的话,这些地名与历史地名词典之间无法准确一一对应,需要查阅地名词典并借助“谷歌地球”或者“天地图”确定坐标.

有关刊印地点的多级政区地理信息的录入,目的是让使用者可以将今天的地名和其行政区划与古籍成书时代的情况相对照.本系统所显示的古籍的刊印信息不仅包括历史地名的古今对照,也包括成书地所处的行政区划.这将成为研究以下问题的基础: 第一,某种书何时、何地刊刻过;第二,特定地区古籍的流通过程与当前存储位置的空间分布;第三,某一历史时期全国范围内刊刻单位或者刊印者的空间分布及刊印书籍类型等.

现藏地: 主要记录古籍现收藏单位的名称和地点.

书影或全文: 每一古籍书影或全文制作成PDF文档,可以实现古籍数据库与作为历史图片的书影之间的关联,也更便于线上利用古籍.此处主要是做好与已有各单位数据库的关联工作.

流转情况: 该专题主要包括古籍中的藏书印、主人、收藏时间等.古籍上面的藏书印,需要所有照片信息扫描并制作专门的数据库.藏书印主人的鉴定需要借助专门的文史知识和古代人物、藏书家词典.一本古籍在不同藏书家之间的具体流转时间很难确定,除非是藏家得手之后有专门的记载、题跋或者其他相关的文字记录.如果不能确定现代公元的具体纪年的话,也可以考虑用年号来代替,作为一个大致的时间参考坐标.

刻工: 这一专题主要包括刻工的姓名,生卒年月或时代,出生地、工作地点、工作时段、所刻书目等.刻工数据库建立过程中要注意历史上的重名现象、同名而个别异体字的情况.该专题数据库的建立可以深化对中国古籍社会文化史中这一特殊群体的研究.以往中国古典文献学或者历史文献学的研究多关注文献作者、藏书家或者刻书者,对刻工关注少.因存世文献对刻工的记载很少且很不详细,对于单纯个体刻工的研究自然无法进行.根据学界前辈已有成果,对宋元明时期古籍刻工的数据库建设相对容易操作[14-15].清代古籍数量大,有关刊工信息的数据库建设将是一个艰苦而漫长的工作.在中国古籍刻工数据库的基础上,借助大数据技术与古籍提示系统平台,可以对历史上刻工群体进行时空分析.

图1展示的是数据库的基本结构.书名和作者是两个核心要素.通过书名可以检索到卷数、成书方式、成书时间、保存状况、版本、内容提要、关键词等相关信息.依照成书时间、成书地、馆藏地等信息,在历史地图上进行显示.通过作者可以查询相关的生平、简介等信息,并与古籍进行关联检索.按照作者的籍贯和生平活动地点在地图上进行显示.

此外,该系统还可设置专题功能.一是以古籍分类为中心的专题.如史部古籍分为正史、地方志、家谱、私人日记等,并设置专题,实现对特定类型古籍的专门性浏览和检索.二是以载体为中心的专题,如古纸的类型与空间分布专项.建立以古纸为核心的子数据库,包括纸张的类型、出现的时间、地点、流传的区域、主要用于何种类型的图书印刷等.按照时间和空间维度,展示不同古纸在不同年代的使用范围,从而直观显示特定古纸在古代的使用范围和空间分布.三是以知名历史人物为中心的专题.以历史人物为中心,显示特定历史人物的活动时间和空间范围、重大历史事件、相关人物等,以及著作的空间分布和流转状况,进而评估其在后世不同时代的影响力.

在技术上,系统主要运用Web GIS相关技术,搭建学者和普通民众可以便捷浏览和使用的信息系统.Web GIS是GIS技术与Internet技术相结合的新的发展趋势.GIS经历了单机环境应用向网络环境应用发展的过程,网络环境GIS应用从传统的局域网内客户/服务器(C/S)结构向互联网环境下浏览器/服务器(B/S)的Web GIS发展.系统的发布主要使用ArcGIS Server进行.通过ArcGIS Server构建的高级GIS应用与服务能够对空间地理信息数据进行集中管理,同时支持多用户在线并发访问,可实现多种地图服务和复杂多样的数据编辑及空间分析.基于Web服务的GIS可以同时访问不同服务器上的最新数据,充分扩展GIS数据的管理功能,保证数据的实效性;无论何种操作系统,只要是支持通用的Web浏览器,用户就可以访问系统数据.

4 系统建设及应用可能的困难

和其他所有大型历史地理信息系统数据库建设一样,基于GIS的中国古籍地理信息系统的数据库建设,将会是整个研究计划中最花费时间和成本的阶段,常常因缺乏学术上的认可与肯定而难以获得学术经费和资源.从国际学界的普遍情况看,过去认为这种工作有学术贡献,但是,现在已经很难获得学术上的认可.这是必须解决的问题,唯此才能鼓励研究人员投入更多的时间和精力来建设并分享历史GIS数据,以确保这种昂贵的数据能被广泛且长久地被使用.历史GIS数据库数据源的多元化,需依靠适当方法整合并用数据和档案加以诠释.

基于GIS的中国古籍地理信息系统可以在CHGIS的基础上添加数据,并利用互联网进行公开的检索和展示,更重要的是在此基础上进行深化研究.用户下载CHGIS数据后,可按中国历史上任何时间检索行政单位和聚落,并创建特定时间和特定地区的电子地图,也可以加入用户自己的数据进行空间分析和专题制图,或按自己的兴趣建立特定的统计模型.

问题的关键是,基于GIS的中国文史研究尚未在国内学术界引起足够的重视,传统文史研究者对这一研究路径和方法的重要性还不是太了解,对于历史GIS的研究理念、GIS的使用技术和方法急需加强推广.

致谢: 感谢国家古籍保护中心张志清先生和复旦大学历史地理研究中心葛剑雄先生的提倡与关注,使本课题的研究得以展开.复旦大学中华古籍保护研究院的龙向洋先生、复旦大学历史地理研究中心的吴松弟、侯杨方、李晓杰、路伟东、孙涛诸位先生亦为本课题做出了贡献.

[1] 梁爱民,陈荔京.古籍数字化与共建共享.国家图书馆学刊,2012,21(5): 108-112.

[2] 刘伟红.中文古籍数字化的现状与意义.图书与情报,2009,(4): 134-137.

[3] 刘家真,陈 美.中华古籍数字化的国际合作.图书情报知识,2013,(5): 46-55.

[4] 毛建军.国外中文古籍数字化资源概述.当代图书馆,2006,88(4): 30-34.

[5] 高 娟,刘家真.国际学界国家级历史GIS项目建设情况的回顾与反思.中国图书馆学报,2013,39(4): 110-119.

[6] 陈 力.中文古籍数字化方法之检讨.国家图书馆学刊,2005,14(3): 11-16.

[7] 余传明.基于GIS的数字图书馆: 原理及应用.情报理论与实践,2004,27(6): 651-653.

[8] 朱锁玲,王明峰.GIS在方志类古籍开发利用中的应用初探.大学图书馆学报,2013,31(5): 118-121.

[9] 吴 茗.GIS技术在古籍数字化资源建设中的应用.图书馆学刊,2016,38(4): 55-58.

[10] BLACK F A, MACDONALD B H. HGIS of print culture in Canada, reports on national historical GIS projects.HistoricalGeography, 2005,33: 154-156.

[11] KNOWLES A K. Special issue: Historical GIS: The spatial turn in social science history-Introduction.SocialScienceHistory, 2000,24(3): 451-470.

[12] 王大学.国际学界国家级历史GIS项目建设情况的回顾与反思.江苏师范大学学报(哲学社会科学版),2016,42(3): 98-104.

[13] 复旦大学历史地理研究中心.中国历史地理信息系统项目介绍[D/OL][2016-08-12].http: //yugong.fudan.edu.cn/views/chgis_data.php

[14] 王肇文.古籍宋元刊工姓名索引.上海: 上海古籍出版社,1990.

[15] 李国庆.明代刊工姓名全录.上海: 上海古籍出版社,2014.

The Research of Chinese Ancient Books Geographic Information System by GIS

WANG Daxue1, CHEN Xi2, YANG Guanghui2

(1.CenterforChineseHistoricalGeographicalStudies,FudanUniversity,Shanghai200433,China;2.ChineseAncientBooksPreservationandConservationInstitute,FudanUniversity,Shanghai200433,China)

The aim of The Chinese Ancient Books Geographic Information System is to set up a large-scale integrated Chinese ancient books web library and research digital security system by the GIS technology. Through the CHGIS platform and Web GIS technology, the system have a series of powerful functions, such as expression of ancient geographic information based on spatial distribution and evolution, providing the most convenient data query, retrieval, compilation of thematic maps and so on. This system can not only offer a big data platform for the study of protection of ancient books, improving the utilization efficiency, propel the research on the China history of books, but also become a new way of diffuse the traditional culture and knowledge related to ancient books.

ancient books; GIS; CHGIS

0427-7104(2016)06-0684-05

2016-10-15

开化纸传统制作工艺的科学研究(WDH6004004),上海市浦江人才计划项目(15PJC010),复旦大学亚洲研究基金项目(2013)

王大学(1977—),男,副教授;通讯联系人: 杨光辉,男,教授,E-mail: yanggh@fudan.edu.cn.

K 901.9

A

猜你喜欢
刊刻古籍检索
中医古籍“疒”部俗字考辨举隅
清代私家藏书开放流通思想研究
CNKI检索模式结合关键词选取在检索中的应用探讨
宋人對三蘇文章的選編與刊刻
西藏大批珍贵藏文古籍实现“云阅读”
瑞典专利数据库的检索技巧
2019年第4-6期便捷检索目录
论王先谦《骈文类纂》的刊刻传播
英国知识产权局商标数据库信息检索
我是古籍修复师