以汉代“图、文、物”数据库建构多维历史的研究方法

2020-02-21 08:24刘冠
画刊 2020年12期
关键词:检索维度文献

“维度”本是数学中一种基本的参数系统概念,将之应用于物理学领域,它便成为人类理性认知和描述现实物理世界的基础性结构。维度之间相互独立且同时并存,所以物理世界中的任何一个(量子层级之外的)实体,都会在三维空间中有一个对应的位置,它的运动过程就是我们一般所理解的时间,其结果就是事件。而它运动(或事件变化)的轨迹,在某种意义上就是一种“历史”。

但是,这种“历史”并非真正学术意义上可被研究的历史,而只是一种理论上潜在的客观素材;其绝大部分在完全不为人所知的情况下自生自灭,如“岩中花树”般不停地发生并消亡;历史研究所能够触及的,其实也仅是其中极少量可被古人或今人感知并发现的人物、器物、现象、事件和意义的部分。更重要的是:历史的存在本质上就是人对往昔“器、事、意”诸层面对象主动观察、记录、追溯及理解的思想成果;其中包含的出自人之个体与群体的主观意识,和客观历史素材发挥着几乎同等重要的作用。因此,历史研究中各类主客观范畴之间的独立与并存关系,遂成为笔者提出“多维历史”[1]概念的基本前提。

在此概念之下,任何一个理想化的历史问题研究框架,理论上皆可以包含文献、实物和图像三种基本维度。文献是指当时之人、后代之人,以及今世之人对历史的记载、编辑、注疏和研究论述,并可以进一步划分为古代文献和现代(或今人)研究文献两大类;而古代文献则还要再细分为来自“时人”的出土文献和代表“后人”的传世文献两个子类。尽管上述这些文献的内容与形式千差万别,但其根本性质都是以语言文字为载体的,关于历史对象的认知和理解;或者说是用被“规范化”了的语言符号所进行的主观记录与解释(任何语言文字皆可视为一种被规范化的主观符号,即使假定我们能以尽量客观的态度用语言来描述客观事物,但其结果必然还是语言,所以便又回到了主观符号的维度之中)。实物则是指古代遗留至今并发掘出土的各种文物和遗迹,它们本身就是研究对象,同时也是“穿越”时间,将过去事件的片段或侧面呈现在研究者面前的真实历史证据。但无论出自古人有意识地保存还是无意识地遗留,实物中所携带的直接信息,以及作为构成事件和意义的道具、载体和场所包含的间接信息,都会是受到局限且不完整的。图像的情况则要更复杂一些,因为其中既包含了客观写实性再现的成分,也存在掺杂着主客观因素的夸张与虚构成分,以及完全诉诸主观的“心象”与幻念成分,并可进一步细分为八种不同的作用[2]。所以图像是人在摄取外在信息的基础上,再以内在精神世界返照于外部的投射,也是一种介于主客观之间的存在。

事实上,文献、实物、图像这三大类材料在传统的历史研究中,已经构成了三个学科的基本范畴:历史学注重文献,考古学侧重实物,而图像则是艺术史学的主要研究对象。并且学科之间的某些跨领域联系和比较,的确曾为学术研究的发展进步起到了重要的作用。例如在中国古代史领域,王国维先生曾在1913年《明堂庙寝通考》初稿中,基于出土的甲骨文、钟鼎铭文与传世典籍相对应,首次提出了“二重证明法”的观点[3];又在1925年《古史新证》书中,针对当时以顾颉刚、胡适等学者为代表的“疑古派”(或称“古史辨派”)思潮,将之调整为旨在“运用地下之新材料,补正纸上之材料”的“二重证据法”[4];其后饶宗颐先生将考古和历史材料进一步细分,杨向奎先生則在出土文献和传世文献之外加入民族学(实质上即文化人类学)的口传、仪式等旁证因素,分别提出了各自的“三重证据法”;再到后来学者又将古代物质文化(实物)和图像资料纳入历史研究,而提出了更具“立体化”特征的“四重证据法”[5],并在某种意义上具有了多维历史观的基本雏形。

但本文所要探讨的多维历史研究方法,即将文献、实物、图像划分为三种基本维度的概念,与上述提法的差异并非仅仅是名称角度的故弄玄虚或标新立异,而是有着观念和做法等方面的具体考量。首先,上述“n”重证据法在逻辑上隐含着一个基本前提,就是各重证据必然皆指向(一个预先假定的)共同历史事实,于是文、物、图等各类材料之间常以层层“加持”的方式来证明巩固既有观点,从而导致研究者容易陷入“虱轮效应”或“疑斧效应”[6]的误区。因此,这种方法虽在王国维先生(以出土文献和传世文献两类同性质材料相互对应为主的)二重证据法中应用无碍,但随着后续材料差异性跨度的加大,其间实现可信“互证”的难度也随之增加;而且在学理层面上材料之间的互证,如“图像证史”问题的有效性和弊端[7],本身就是需要谨慎对待的问题。与之不同的是:数学中“维度”概念的重要特征之一,就在于维度内部参数的独立与维度之间的连通关系是统一并存的。所以在多维历史的概念中,文、物、图等各类材料各处于自身所属的维度之中,对同一课题的相互印证并非是一种逻辑必然,而更多地体现为维度间“投影”式的相互参照,从而使证据之间摆脱了“非黑即白,非是即否”的简单对应关系。其次,“n”重证据法基本上是以不同类型的材料应用于狭义的中国古代史学范畴,但多维历史的方法则更适于从不同的维度视角,即历史学、考古学、艺术史学,以及文化人类学等领域展开研究;而且它更强调诸学科之间以多维度方式,保持相互间的平衡并存。因为在(尤其国内目前)现实的学术格局中,历史学和考古学作为历史研究的主体,尽管有着深厚的学术传统积淀,却也面临着新时代、新方法的机遇和挑战。而艺术史在此三个维度中间,暂时仍略显薄弱,长期以来仅被作为艺术学门类之下,以“艺术作品的鉴赏和评价”为基本功能的边缘性二级学科;并且被局限于各地美术学院的“小天地”之内,无法在当代社会趋向“图像转向”[8]的重大变革过程中,发挥其以“图”为核心的、不可替代的独特认知作用。所以笔者提出多维历史模式的初衷之一,便是希望为相关学科之间的平衡发展提供新的思路。第三(也是相对更重要的一点),历史研究中由于年代久远或文献缺失等各种主客观原因所限,在具体问题的探讨中,“材料不足证”是一种学术常态。近现代中国史学“n”重证据法的提出和应用,在某种程度上就是通过扩大资料采纳的范围,使研究推测由之更为深入的一种应对之道。不过,伴随着范围扩大与类型的增加,材料间的关联亦随之产生了更多的推测成分,也就更加不宜过分演绎或定论。而在多维历史的模式中,材料之间并不一定要求完全自洽,某些关键环节资料(具体每条材料皆可理解为各自维度中的“坐标”)可能会缺失,但文献、实物、图像材料所属的维度框架依旧保持稳定,从而使研究结论更容易保持有所分寸(或曰待补充)的开放和悬置状态。

综上所述,以文献、实物、图像为基础的多维历史在学理和概念等方面都具有自身的特色,但其相较传统历史研究方法而言,结构略显复杂,并且需要学者掌握各个方面的海量资料信息才能发挥其效力。但这种研究方法对信息存储(记忆)和查询的要求,普通人即便皓首穷经也未必能及;或有学界先贤如陈寅恪先生般,具有过目成诵的超人记忆力,也仅能掌握某一时代的一部分主要文献而已。因此,具有相应分类资料数据库的构建和使用,就成为多维历史研究方法得以实施的核心性支撑因素。

笔者所在的北京大学汉画研究所,长期以来不仅致力于汉代基础性图像志的编撰出版(图2),而且始终关注相关网络数据库资源的建设。在其20余年的发展历程中,研究所在朱青生教授的领导下,已建成包括全汉文、全后汉文、全三国文、全晋文在内的“古文献数据库”;包含各类期刊、文集、学位论文和专著等在内的“研究文献数据库”(目前共收录文献14000余篇/部,并定期更新);包含陕北、南阳、苏鲁豫皖地区多县市在内的“汉画图像数据库”,已完成陕北及南阳汉画像石图像整理上线(图3),苏北及鲁南部分正在建设中;包含各地汉代考古发掘材料的数据库(尚处于起步阶段)。即已涵盖文、图、物三个基本维度的,共4个相对独立的网络数据库。

在此基础上,近年来研究所将数据库的智能化检索,以及探索文献和图像数据库之间相互连通(跨库关联结构)作为工作重点,从而在客观上为多维历史研究方法的具体建构进行了初步尝试。结合目前计算机(含AI)技术水平与前期的一些尝试,我们始终将汉代历史研究“术语”作为数据库内检索,以及文、图、物数据库间连通的枢纽(Pivot);即从多维历史角度,将术语视作各维度中既独立又可互为参照的坐标参数(Coordinate),进而展开对研究课题的多维立体化的界定和分析。这种术语应用在文献数据库中相对比较简单(现已完全可实现全文检索),但在处理图像方面则需要一定方法的转换。具体而言,我们通过人为图像内容的描述,使得图像转换为一段可供检索的文字,而实现文字匹配式的检索。只是这种方式又会面臨两个技术性问题:一是人为描述过程中的主观性,将不可避免地出现对相同物象不一致的名称(这一问题可通过规范的术语来解释,如同我们在《汉画总录·南阳卷》中进一步规范使用的,来自相关研究文献的术语表);另一则涉及图像与文字的根本区别问题,及艺术史研究中“图与词”层面的问题。因为本质上人的语词是“单意”的,否则会造成歧义与误解;而图像则是“多意”的,任何形象都可以从多个不同层面来理解,且相互间并不构成可比性(这也是两个维度之间有必要独立存在的根本差异性),并且图像的意义还会受到所处环境和位置关系的影响而发生改变。所以对画面的文字描述往往只能片面地表述图像的某一部分典型特征,而同时舍弃大部分潜在的其他信息。

另一方面,语言作为艺术史研究的主要工具,本身是由语词(约定代码)和语法(逻辑关系)组成的结构。这两部分中,前者在目前检索应用中发挥着绝对主导作用,即基于字符的“语词匹配”。但是这对于图像中丰富的信息显然过于简单了,因为(以汉画为例的)图像中各种基本元素,往往在不同层级的组合关系中才能够呈现特定的意义,单一层次的术语字符匹配检索显然过于片面。因此,朱青生教授在研究中将纷繁复杂的汉画图像,以“形·相”关系[9]作为原则,确定为“七层意义”[10]的基本构架:从而一方面使术语检索画面内容由单层简单配对,向“多层次复合检索系统”推进具备了潜在的可能(图1);同时,也使得文献和图像(并可扩延至实物)在不同的维度之间,建立了复合性的(既可以之具体化、精确化,也趋向可模糊化、悬置化)多维历史“立体”结构。

不同维度间复合性检索系统的建立,尽管能够使得文、图、物三类材料获得更为广泛深入的关联和比对机会,但(至少理论上)也增加了“无效或不相干”信息混入的概率,因此还需要有相应维度之间信息筛选、分类和过滤机制的设计。在汉画图像数据库检索设计和完善的过程中的确就面临这样的困境,因为越向高阶复杂层级发展,检索就越会受到非术语控制的语法因素干扰。这种语法因素是人在描述事物时将词语连缀成句的主观逻辑必要,但它既非画面原本所采用的“语法”(如果有的话)结构,也非计算机所使用的逻辑语言,因而应在描述和检索中剔除。具体而言:各地各类汉画虽然在画面的表现方式方面多有不同,但其具体形象无非皆可归结于“实词”和“虚词”两类(图4)。这里实际上继续借用了语言学的概念(或曰文献维度)对汉画进行类比(投影式)解释。所谓“实词”主要是指名词和动词等直接参与叙事的语素,在汉画中则主要包括具体的人神景物等形象和行走坐卧等动作,以及两者结合所构成的叙事“短语”;而“虚词”则是指连词、介词、助词和语气词,甚至一些非必要的形容词和副词等修饰性语素,其貌似并不重要,实则控制并塑造了语言的节奏、风格和整体氛围,并构成所谓“文采”。但在汉画中,这类“虚词”的情况比较复杂,其中最典型的是画面周围的边框与纹样,以及一些穿插于画面之中的装饰性图案;但还有一些原本作为“实词”出现的形象,在特定语境下被作为虚词来使用(例如常见于画面底部的“车马出行”形象),它们并不参与画面的叙事,而只是作为渲染气氛而出现。若进一步推论,在整体墓室和丧葬环境中,甚至一些明显叙事的情节性画面,也很有可能整体作为“虚词”性质的元素而被使用,从而构成了具有一定程度非逻辑性的“铺陈”语法。而且更为重要的是,不同于文献中实词叙事(根据内容而来)的千变万化,装饰性虚词往往会由个体习惯或特定风格而呈现出某种规律性特征。那么汉画中的“虚词”性元素是否也应具有一定程度的规律性呢?就目前我们比较有限的实验性探索来看,的确不能排除这种可能性。

简言之,从多维历史的视角探索汉代文献、图像和实物数据库之间的连通和检索,尽管目前尚处于十分初步的尝试阶段,暂时还存在着一些技术性的困难和复杂的结构问题,但这一方向却是以蕴含更多可能性而面向未来的学术态度。同时,多维历史的观念虽然会在一定程度上掩盖文、图、物等不同性质史料之间的客观差异,但也由此为原本存在技术性壁垒的各类数据库之间,提出了一种连通检索的新思路。所以,只要能够有意识地扬长避短,保持对史料间差异性的自觉意识,多维历史作为一种伴随着计算机时代而提出的研究理念,也会有一定探索的价值;并且其自身的观念和方法也将伴随着这一过程逐渐完善,从而对国内外历史研究的其他领域形成有益的参考和借鉴。

注释:

[1] “多维历史”这一概念笔者最早曾于2018年提出,但在同年发表的一篇相关短文中,囿于其所属专栏既定主题和文章本身篇幅所限,尚未及深入展开。具体参见:刘冠. 2018. 图像中的“多维”历史[J]. 美术观察. 9: 26-27.

[2] 图像的八种作用包括:建造空间、塑造物体、添造质感、分析形体、分割平面、建立结构、意义表达、情绪表现。参见:朱青生. 汉画作为“图”的八种意义[A]. 巫鸿 朱青生 郑岩 主编. 古代墓葬美术研究[C]. 长沙:湖南美术出版社,2013:377-399.

[3] 陈荣军. 2008. 二重证据法考论[J]. 求索. 4: 205-207.

[4] 李锐. 2012. “二重证据法”的界定及规则探析[J]. 历史研究. 4: 116-133, 191-192.

[5] 叶舒宪. 2009. 国学考据学的证据法研究及展望:从一重证据法到四重证据法[J]. 证据科学. 4: 389-404.

[6] 所谓“虱轮效应”和“疑斧效应”是北京大学朱青生教授对学术研究方法和态度问题提出的两种比喻。“虱轮”典出《列子·汤问·纪昌学射》中“昌以牦悬虱于牖,南面而望之。旬日之间,浸大也;三年之后,如车轮焉”之说,从而比喻研究者对自己所关注的事物或理论,常非理性地无限放大。“疑斧”典出《列子·说符》之“人有亡鈇者,意其邻之子:视其行步,窃鈇也;颜色,窃鈇也;言语,窃鈇也;动作态度无为而不窃鈇也。俄儿掘其谷而得其鈇,他日复见邻人之子,动作态度无似窃鈇者”,以此比喻研究者因内在固有观点的影响,对客观材料产生不自觉的成见问题。但“虱轮”和“疑斧”是人之本性,几乎不可能完全避免,因而朱青生教授常以此二例在教学研究中提醒包括笔者在内的学生,要对自己所研究的材料以及秉持的观点抱有谨慎和警惕的态度。

[7] 具体有关这一命题的学术渊源、发展脉络、常见利弊、内在规律等问题,参见:曹意强. 论图像证史的有效性与误区[A]. 曹意强 、[英]麦可尔·波德罗 等著. 艺术史的视野——图像研究的理论、方法与意义[C]. 杭州:中国美术学院出版社,2007:3-14.

[8] 1992年,托马斯·米歇尔在《艺术论坛》中首次提出“图像转向”(pictorial turn)。1994年,他出版了《图像理论——视觉再现与语言再现文集》,其中“图像转向”作为开篇第一章,既为后文开展元图像、图像与文本、图像与公共领域等研究做了铺垫,又使文集形成一个图像理论的研究体系。引自:郑二利. 2012. 米歇尔的“图像转向”理论解析[J]. 文艺研究. 1: 30-38.

[9] 此处“形·相”关系源自朱青生教授提出的“形相学”理论:“形”指研究图像的形态与样貌;“相”指图像与图像之间的相位,即位置关系。因此“形相学”认为中国古代艺术,尤其汉画中的图像,必须在特定的位置才能显现其特定的含义。

[10] 即:1.基本符号“纹”——笔画或部首;2.图形(该层又可进一步分成图形/图案两个层级)——字;3.形象——词(这一层目前为术语描述和检索主体);4.图画(形象组合)——词组短语;5.一幅画面(段块)——句子;6.画面组合——段落(至此处可归为底层研究);7.画面/器物共同构成的形相结构——篇章(至此处可归为中层研究)。参见:朱青生. 汉画研究:在形相中發现事实[A]. 朱青生 主编. 中国汉画学会第九届年会论文集[C]. 北京:中国社会科学出版社,2004:1-18.

猜你喜欢
检索维度文献
Hostile takeovers in China and Japan
基于知识维度和认知过程维度的古典名著整本书阅读教学课型探讨
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
瑞典专利数据库的检索技巧
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
多媒体情境下培养学生阅读素养的三个维度
幼儿教师专业成长的三个维度
英国知识产权局商标数据库信息检索
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges