郭晓然
摘要:为实现唐卡数字资源的共享和重用,建立用计算机语言来表达的唐卡领域知识系统,从现有的本体相关理论出发,使用本体的形式化定义形式,对唐卡的概念进行语义形式化描述,利用七步法构建了唐卡领域的核心本体,对唐卡分类、唐卡知识库构建、唐卡信息智能检索等方面的进一步研究具有重要意义。
关键词:唐卡;本体;七步法;领域本体
中图分类号:TP311.5 文献标识码 A 文章编号:1009-3044(2014)21-5090-03
唐卡以各种象征性的图像符号传达着藏传佛教神秘又深奥的教义,是千百年来藏民族在文化、历史的发展中积累的重要遗产,为实现唐卡数字资源的共享和重用,建立用计算机语言来表达的唐卡领域知识系统显得尤为重要,不仅有利于唐卡知识的共享和交流,为博物馆、图书馆、寺院、藏学研究者、唐卡绘画者、唐卡收藏爱好者等提供唐卡知识学习和研究鉴赏等服务,而且对唐卡文化遗产的保护具有重要的促进作用。
本体(Ontology)这个概念最初起源于哲学,是关于存在及其本质和规律的学说,后来被广泛引入到信息技术、知识工程、人工智能等领域。目前,本体还没有一个既准确又公认的定义,广泛使用的定义是由Gruber在1993年提出的“本体是概念化的明确的规范说明”,后来Studer等人又作了补充:“本体是共享概念模型的明确的形式化规范说明”。根据本体研究的主题及层次,将本体分为:知识表示本体、通用或顶层本体、领域本体、语言学本体、任务本体等五大类,其中领域本体是一种新兴的领域知识表示和共享的方法,能详细描述特定领域的概念及概念间关系,消除领域内部概念和术语上的分歧,提供对该领域知识的共同理解,实现领域知识的共享和重用 [1-4]。将本体论思想引入唐卡领域,建立唐卡领域的本体模型,实现唐卡领域知识的形式化描述,这对唐卡分类、唐卡知识库构建、唐卡信息智能检索等方面的进一步研究具有重要意义。
1 唐卡领域本体的构建
目前,本体构建并没有统一的方法,常用的方法有:SENSUS法、骨架法、评估法、七步法等等。参考斯坦福大学医学院开发的领域本体构建七步法,提出了适合唐卡领域本体的构建方法[5-6]。
1.1 确定本体的专业领域和范畴。
唐卡题材广泛、种类繁多、形式多样、颜色复杂。内容涉及历史事件、宗教、人物、风土人情、民间传说、神话故事、建筑布局、天文历法和藏医藏药等多个方面。构建一个完整或完善的唐卡领域本体是一项极其浩大的工程,其工作量也是非常巨大的。为保证研究工作顺利进行,该文尝试缩小范围,将宗教肖像类唐卡作为研究对象,进行唐卡领域本体的构建。
宗教肖像类唐卡中央一般绘有主尊造像,即信徒供养膜拜的对象,如大日如来佛、四臂观音、莲花生大师、白度母、护法神等,主尊是宗教类唐卡的核心内容,全面揭示藏传佛教信仰的主体,代表了藏民族宝贵的精神文明。根据主尊在西藏佛教文化中的具体地位与身份特点,通常将主尊分类为:佛 —“觉悟者”,佛是指所有修成正果的大觉悟者,如释迦牟尼佛、阿弥陀佛、药师佛等;祖师—藏传佛教徒对自己导师的尊称;菩萨—“觉悟的众生”、“有广大爱心的人”。此外有佛母、罗汉、空行、护法和地方神等类别[7]。
1.2 列出本体中的重要术语和概念
通过阅读大量唐卡方面的专业相关书籍、画册,同唐卡领域研究专家交流等方式获取唐卡方面的领域知识,列出宗教肖像类唐卡领域涉及到的重要术语清单,并尽可能详细地对它们进行含义界定。通过语义分析和概念的合并,汇总整理出核心概念集和术语如下:
①唐卡主尊名称
实例:释迦牟尼佛、燃灯佛、弥勒佛、四臂观音、狮吼观音、文殊菩萨、尊胜佛母、大白伞盖佛母……
②描述主尊的主要画面元素
实例:面相(愤怒、半怒、寂静等),面数(一面、两面、三面等),肤色(白色、红色、黄色、蓝色、绿色等),手印(无畏印、与愿印、禅定印、说法印等),法器(法轮、钵净瓶莲花宝镜、琵琶等)……
③所属教派
实例:宁玛派、萨迦派、噶当派、噶举派、格鲁派……
④制作材料
实例:纸、布、酥油、木料、金属、石材……
⑤制作方法
实例:绘制、堆绣、刺绣、缂丝、贴花、打籽绣、版印……
此外还有作者、唐卡作品风格或流派、制作时代、收藏地等通用概念。
1.3 定义类和类的等级体系
上一步骤中产生的大量概念是仅仅一张毫无组织结构的词汇表,还需建立该领域本体的框架。建立一个类的等级体系结构常用的有两种方法:一是自顶向下法,首先确定一个领域中最大的概念,然后将这些概念逐步细化;二是自底向上法,从底层最小类即最小概念出发,将它们加以组织、概括,放在更加综合的概念之下。该文结合两种办法,利用综合法构建宗教肖像类唐卡领域本体,期间通过查阅大量资料,向领域专业请教等方式,对每一个概念的重要性进行评估,筛选出关键性概念,去掉那些不必要或者超出领域范围的概念,尽可能精简的表达出领域的知识,最终形成一个系统的框架体系。
本文所开发的宗教肖像类唐卡领域本体主要包括4个大类:唐卡图像文本信息类、唐卡主尊名称类、描述主尊的主要画面元素类、相关信息类。每个大类下面继续划分成不同的子类,子类会自动继承父类的属性。
唐卡图像文本信息类用来描述唐卡图像文件属性,包括图像的编号、图像占用存储空间的大小、图像的存储格式、图像的存储位置,创建该类是为了与唐卡的图像数据库相对应。
按照唐卡中绘制的主尊不同,将唐卡主尊名称类分为佛、菩萨、佛母、度母、空行、金刚、护法、罗汉、祖师、地方神和历史人物10个子类。每个子类下面再继续细化,例如佛类包括:释迦牟尼佛、燃灯佛、弥勒佛、不动佛、三世佛、强巴佛、大日如来、五方佛、无量寿佛、药师佛等[8]。
唐卡图像构图复杂、组成元素较多,如图1所示。通常描述和识别中央主尊的主要画面元素有:面相、面数、头饰、肤色、左手印、右手印、姿态、法器、头光、背光、座台等等,因此定义描述主尊的主要画面元素类与之对应。
此外还有与唐卡有关的相关信息类,例如,根据所属教派不同将唐卡分为:宁玛派、萨迦派、噶当派、噶举派、格鲁派;根据颜色分为:黑唐、红唐、彩唐、金唐;根据制作方法可分为:绘制、堆绣、刺绣、缂丝、贴花、打籽绣、版印。还可以按照作者等其他方式进行划分,以上这些都作为相关信息类的子类。
1.4 定义类的属性
在本体中,类仅仅描述了一个框架,还不能确切地描述一个领域。因此,需要继续定义这个类的内部结。Protege中常用有两种类型的属性:Datatype Properties 和Object Properties 。Datatype Properties(数据类型属性)代表了个体实例和基本数据类型的关系,使用时需赋予一个具体的属性值,常用有字符型、数值型、布尔型、日期时间型等。 Object Properties(对象属性),用于建立两个类的实例之间的关系。例如:唐卡主尊名称和描述主尊的主要画面元素之间定义一系列的对象来连接,如表1所示。此外,唐卡作者和唐卡之间是绘制和被绘制的关系,唐卡和唐卡作品风格或流派之间是隶属关系。所有属性都具有继承性,即父类的子类都具有该父类的所有属性。
1.5 定义属性的取值
属性的取值又称属性得分面,用来描述取值的类型、容许的取值以及取值的个数等其它特征。如描述唐卡主尊的主要画面元素中的面相取值类型是字符型,取值范围是愤怒、半怒、寂静;手印取值类型是字符型,取值范围是:无畏印、与愿印、禅定印、说法印、触地印、智拳印、辩法印、礼供印、定地印、期克印、合十印、殊胜三界印、安慰印、拔济众生印、弥陀定印等。
1.6 创建实例
创建实例是完成上述定义后的一个阶段,即将类进行实例化。方法是先建立一个类,然后创建这个类的实例,添加这个类的属性值。例如:一幅唐卡名称为释迦牟尼佛、面相是慈祥、面数是1、头饰是发髻、肤色是黄色、左手印是禅定印、右手印是触地印、姿态是金刚跏趺、持物是钵盂、头光是圆形、背光是马蹄形、座台是莲花座、所属教派是同属四大教派。
通过以上步骤,可不断丰富和完善宗教肖像类唐卡领域本体库,使领域中的概念以及概念间的关系更加规范描述,为构建层次清晰、内容丰富、体系完善的唐卡领域知识库做重要铺垫。
2 讨论
利用本体思想,结合领域知识,初步构建了宗教肖像类唐卡领域本体的模型,阐述了构建的方法和步骤,为基于本体的唐卡知识库构建、唐卡语义检索等其它的应用性研究做有益的尝试。
在唐卡领域本体开发过程中,发现存在以下问题,需要在以后的研究中作更加深入的探讨:
1)唐卡堪称是融会佛教精神、世间技术和个人创造力的“百科全书”,知识丰富,涉及方面众多,因此需要不断完善唐卡方面的领域知识。
2)描述唐卡概念的数据模型需进一步完善。每一幅唐卡,除了描述主尊本身的主要画面元素外,还应考虑其他一些重要信息,如:伴神、贡品、自然界景物、图案装饰、主尊上下界的背景等,以及唐卡构图各元素间的空间关系,这样才能较全面的描述一副唐卡的详细语义。
参考文献:
[1] Gruber T R.A Translation Approach to Portable Ontology Specifications[J].Knowledge Acquisition,1993,5(2):199-200.
[2] 张福男.打印机领域本体的创建及应用研究[D].大连:大连理工大学,2009.
[3] 贾雪峰.基于林业主题词表构建林业领域本体的研究[D].北京:北京林业大学,2010.
[4] 李丽莎,夏利民,王正武.基于本体的图像自动标注[J].微计算机信息,2012,28(4):150-152.
[5] 彭勃.领域本体构建方法研究[J].电脑知识与技术,2009(10):610-611.
[6] 杨海艳.本体的相似性关系的研究[D].南京:南京航空航天大学,2007.
[7] 杨蔚.宗教类唐卡图像知识库的构建研究[D].兰州:西北民族大学,2011.
[8] 吉布.唐卡的故事[M].西安:陕西师范大学出版社,2004.