张文军,黄海霞,侯娟娟
古籍通常是指1912年以前,具有传统的装帧样式的存世纸质文物、文献、书籍、资料的统称。古籍作为人类记录文明和传承文化的重要载体,是不可再生性的文献,它们承载着不同年代和历史时期的发展脉络和文化,在传承过程中,古籍难免受到灰尘、水渍、蠹虫、紫外线以及人为使用过程等多种外在的环境因素的侵袭,也有自身内在的酸化、老化、霉蚀等造成的破损,要延续这些珍贵文化遗产的生命力,就必须遵循“以藏为主,藏用结合”的理念[1]。虽然古籍最终难逃彻底灭失的厄运[2],但是尽快对古籍实施有效准确的保护和修复工作,延续古籍存世的时间是每一位从业者应有的责任和担当。
在古籍保护和修复的过程中会产生相应的各种各样庞大而系统、丰富而实用的大数据。这些数据能够反映古籍的实际保护情况、修补材质选用、修复方法选取、修复过程记录、修复结果展现等,这些数据具有不可再生、不可重复、不可逆的特征,然而这些数据又都有留存的必要和利用的重大价值,这就需要古籍保护和修复者对其进行收集、组织、存储、利用,以达到后续古籍保护与修复过程中参考借鉴的依据。
大数据时代,对于传统的古籍保护和修复所产生的数据类型、数据规模等,成为行业发展的重要参考和借鉴因素,从事古籍保护和修复的从业者应充分认识数据价值的重要性,积极开展数据标准、数据质量、数据模型、元数据等存储与管理,力求发现古籍本体、古籍保护、古籍修复内在的关联关系,寻找更为稳妥、安全、有效的方式方法和工作管理模式[3]。遵循纸质文物文献的本体特性和各种干扰性作用规律的科学研究,是图书馆及其他收藏机构的管理工作,都需要有较高质量的数据,并将数据转化为重要的信息交流和参考借鉴的平台,以推动古籍保存、护理、修复、应用的数据体系。因而将古籍与修复形成的数据进行体系构建,使得古籍保护和修复者、从业者、数据利用相关者,探索建立古籍安全和延长其存世性工作的数据运用模式,促进古籍保护与修复活动行为的规范性、准确性、可证性,挖掘出其中潜在价值,以满足古籍保护与修复工作整体的发展目标[4]。
古籍是一种不可再生,并在不断消亡之中的纸质文化载体。古籍的保护是针对各个不同历史时期,不同存世形态,分属于不同自然与人文客观环境条件内古籍实施保障技术,由此产生的各种技术信息,即为古籍文献的数字化提供现实与可行性,又能为推动图书馆及相关领域数字化建设的进程起到积极作用。古籍修复的行为与技术是基于对古籍充分认知的范围内,提出能满足于以保护为前提的修复行为技术。对古籍历史文化、艺术形态信息完整记录,对古籍书叶纸张的物理性基本数据信息采集,对古籍纸性的化学分析数据采集,在实施保护与修复行为过程中各个步骤与环节的静态图像、动态视频的摄取,从而形成实时统计、存储、调用的大规模数据。
古籍包含深厚而特定的历史文化信息,从它们的本体特性角度,可看到关于造纸历史文化,地域性材料材质,特有的工艺特征,人类文化生活的发展轨迹等因素;从各种干扰性作用的角度,又可感受古籍的装帧演变,在自然不可抗拒环境条件下不可逆转的老化,在人为使用过程中的磨损、折裂、涂改等致损作用;从图书馆及其他收藏机构管理工作的层面,分析判断所进行的工作的科学性、系统性、可靠性、安全性,古籍自身社会与人文价值的表述性及合理的实际应用性等,对以上内容展开有效、有力、务实的工作,立足于数据体系的构建,以古籍文化的整体发展为大背景,“弘扬古籍文化,提升古籍社会人文价值,延长古籍存世时间”为服务理念,运用古籍保护与修复工作过程中产生的综合信息,围绕着工作的技能、工具等,形成采集、分析、组织、整合、存储、利用的数据管理流程。在保障数据真实、安全的基础上,将数据转化为有效信息,以此推动古籍保护、修复、应用的整体策略与行动。
古籍保护与修复工作是在以人为主,在自然与人文客观环境下,展开并发生的工作过程。古籍保护的复杂性,涉及自然存在的诸多因素的破坏和人为致损,涉及温度、湿度、防火、防虫、防光、防尘等,更涉及图书馆、博物馆、档案馆、私人收藏、相关研究单位的各自为政,保护措施各有不同。古籍保护修复中从业者职业素养、认识水平、工艺技术能力,直接导致被修复物的结果和状态。古籍修复坚持“最小干预”“过程可逆”等基本修复原则,但是修复过程本身就有对被修复对象原始信息不可避免的干扰,被修复对象完成修复工作后的不可重复性,修复工作过程的唯一性。因而古籍修复数据化过程中形成的文本、档案、图像、音频、视频等数据,能够使人与工具设备更加相辅相成,使管理者和实施者更加统一协调,对工作的步骤和方式方法建立起具有规范性、标准化、准确性、可证性的保护与修复数据规模体系。同时对于不同从业人员针对不同古籍的保护与修复工作具有参考性、应用性、可证性等现实价值。
(1)文本类数据。在古籍保护和修复领域,已经制定了相应的规范体系和制度,这在保护和修复前需要熟悉和参照的文本,这些包含《古籍保护修复档案记录规范》、古籍保护与修复规范体系、古籍保护与修复流程体系、古籍保护与修复安全体系、古籍保护与修复组织体系、古籍保护与修复管理制度等。
(2)图像类数据。图像数据的管理通常采用文件管理方式和数据库管理方式。在古籍保护和修复过程中,对古籍整个修复过程中获取不同阶段的图像进行存储。
(3)音视频类数据。在古籍保护和修复过程中,为了更好地展示保护和修复的过程,再现修复流程,对修复人员的讲解、展示、操作的音频和视频进行录制,形成规范化的音频或视频文件,以便更好地让其他人员学习、演练、模拟、交流古籍的保护和修复。
(4)材质类数据。古籍修复过程中,选取修补古籍的纸张,是至关重要的,首先要注意纸张的酸碱度,不能用酸性纸张去修补古籍,以免引起或加速古籍纸张的酸化;其次,如果选用旧纸修复古籍,要注意旧纸的纸张强度不能太低;同时,还要注意所选纸张的纤维组成应该与古籍的纸张相近,厚薄相近,颜色相似但不能相同,纸张帘纹的横竖宽窄也要相近。在修复过程中,针对不同的古籍选用的修补材质也是各有差异,如竹纸、藏经纸、毛边纸、棉连纸、官堆纸、毛太纸、白棉纸、皮纸、开化纸等数据,这些材质需根据古籍不同情况选取相适应的纸质。
(5)方法类数据。根据古籍保护要求、古籍破损情况、古籍修复原则需要选取准确和采用合适的修复方法和技术,才能达到古籍修复的安全性原则、真实性原则、最少干预原则、可逆性原则、可识别性原则、适宜性原则、相似性原则、规范性原则等。
基于大数据、云计算、互联网、人工智能的古籍保护与修复数据信息技术,力求做到行为一致、风险可控、运行合规、绩效提升原则,针对以古籍为主体、责权分配、规则约定、业务流程等关键域,完善古籍保护与修复数据的收集、组织、存储、业务评估等,形成数据集成,融合存储,交换共享的流程与规范标准技术体系。
(1)根据元数据标准,利用资源目录元数据库提供元数据管理,依据资源分类标准和资源编码规则构建和维护古籍信息资源数据库,从组织和应用的角度建立古籍资源目录和古籍检索目录,为古籍数据资源的共享与应用提供标准化的数据基础,根据古籍描述元数据规范,可将其分为16个元素:题名、责任者、日期、出版、附注、相关资源、主题、时间范围、语种、类型、标识符、权限、版本类别、载体形态、馆藏信息、收藏历史。
(2)对外实现古籍保护和修复的数据资源注册、登录、查询、获取、推送等功能,对内实现古籍保护和修复数据资源的编目、维护、统计、监测等功能。
(3)功能层面。支撑古籍保护和修复数据资源目录管理系统提供数据共享、信息查询和辅助修复等服务,通过内部管理系统实现对古籍保护和修复数据资源的全方位管理和对目录检索系统的优化配置。
(4)大数据工作规范与流程体系。古籍大数据工作规范与流程从5个层面进行构建,即基础设施层、基础数据层、数据规范层、数据管理层、数据应用层。其中基础设施层包含工作室设施、实物、存储资源、数据网络;基础数据层包括古籍保护与修复业务系统数据、古籍状态数据、互联网数据、古籍档案;数据规范层包括图像识别、视频数据、文本表格智能检索、古籍知识图谱;数据管理层包括数据获取图像视频采集、数据安全、数据整合、数据内容管理、数据质量管理;数据应用层包括古籍服务平台、保护与修复推荐、保护与修复辅助决策、影像数据智能管理平台、古籍老化损伤趋势预测。
建设管理制度是保证古籍数据资源目录体系持续、有效、规范运行的基础,内容包括:
(1)古籍保护和修复数据资源管理与共享相关的行政制度如数据资源注册登记制度、分级管理制度和共享规则等,根据用户等级设置用户使用权限,贡献越大,使用权限越大。
(2)古籍保护和修复数据资源目录体系的专项管理制度,古籍保护和修复数据资源目录体系的统筹规划管理、测评管理制度。
(3)古籍保护和修复数据资源目录和编目的标准体系。从数据资源目录的总体框架、技术标准、数据分类、数据编目等多个层面,提出数据资源目录标准体系并制定相关标准。
(4)古籍保护和修复数据标准体系。在我国古籍保护和修复标准体系和内容框架的基础上,依托我国古籍数据资源标准化方面取得的诸多成果,参考借鉴我国制定的古籍普查标准体系框架,提出古籍数据资源开放共享和深化应用的需求,有序研究制定古籍数据标准体系框架和具体标准,以数据标准为抓手,从数据、技术、安全、管理等多个角度规范古籍保护和修复数据的发展。
新的概念和技术的出现,对于多以传统思维层面和生活工作方式进行的古籍保护和修复行业,会带来基于数据平台基础之上的业务和管理创新型发展新契机。伴随着古籍保护、修复行为内容的数字化,数据治理可以图书馆为中心,兼及其它各级各类专业收藏单位或个人的古籍存藏、诊治、科研、管理、使用等诸多方面提供更多、更准确、更安全的数据,利用数据科学信息方法,揭示数据的价值,推动古籍保护与修复事业发展。