信息依存模型的结构及其应用

2022-11-21 02:04赵林畅马惠铃顾大刚李良炎
无线互联科技 2022年17期
关键词:预设符号事物

赵林畅,马惠铃,张 牧,顾大刚,李良炎

(1.贵阳学院 数学与信息科学学院, 贵州 贵阳 550005;2.贵阳市观山湖区大数据发展管理局, 贵州 贵阳 550081;3.重庆大学 外国语学院,重庆 400030)

0 引言

人类创造和使用语言是为了表达意义,如果将语言和意义剥离开来,语言仍然是一种意义,它通常由人的意识产生和激活。例如:我们用语言“苹果”表达头脑中的意义“苹果”,这是在意识中完成的,因为“苹果”和“苹果”都属于意义。

正是从这个角度出发,对意义的研究是基础,即对语言文字和语音形式的研究也属于对意义的研究。因此,句法形式化和语义形式化从根本上都属于意义形式化。

意义形式化的目标是探索意义的基本结构,并表示为数学模型,这是一项极富挑战性的工作。该研究以二元组为数学工具,综合多门学科概念和原理进行分析,探究意义基本结构的形式化描述——信息依存模型(Information Dependency Model,IDM )。该模型最初由李良炎于2009年给出定义,并在《信息依存句法标注模型》中进行了论述[1]。本文在其研究基础上,进一步探究信息依存模型结构并论述其应用。

1 模型图式结构

1.1 意义

意义是什么,是自古以来人类一直在苦苦探索的奥秘,不过意义总是与人有关,从不同观点出发对意义有不同的认识。李良炎教授在初期探索中给出:“意义是人对主客观世界中特定现象的意识”,从心理学角度给出了“意义”定义,并指出:人总是处于一定的物质世界中,并以大脑为物质依托,具有意识和复杂的内心世界。物质世界总是在不断运动变化,产生纷繁复杂的物质现象,人的内心世界也随着人的意识而不断发展变化,产生纷繁复杂的心理现象。

因此,意义不属于物质,它是人对主客观世界中特定现象的意识,而人的意识就是意义发生器。它只存在于人的内心世界中,人的大脑就是意义的物质载体。

1.2 图式

图式是人对预设与突显的整体意识,属于意义,具有预设的意义称为突显。图式强调具有条件关系的不同意义在意识上构成一个整体,它属于意义。而主客观世界中的特定现象并不是孤立存在的,总是以其他特定现象为条件时才能被人所意识[2]。人对主客观世界中特定现象条件的意识又被称为预设,有了预设和突显,进而得出图式定义。

图式中突显属于前景,预设属于背景,客观上前景不可能脱离背景而存在。即使是主观世界也存在预设,在主观世界上以人为预设的成分。而人从根本上以客观世界为预设成分,即:“人的预设是一切社会关系的总和”,若没有这一预设,“人”就不能成其为“人”,要认识一个“人”,就要充分地认识其预设的成分“社会关系”。

由于任何意义都存在预设,因此在形式上,任何意义既可以记为突显,也可以记为图式。突显是意义的待证明形式,即假设;图式为意义的已证明形式,即结论。假设用来表示预设未知的意义,结论用来表示预设已知的意义[3]。假设与结论具有相对性。假设等价于预设为空的结论;相对于结论的预设,结论也只能是假设。这里的假设与结论是仅仅从表达式的形式特征而言的。

综上,从意义的定义出发,本文分析了由预设、突显及其条件关系构成的图式结构,并得出图式结构本质上是一种条件关系的信息结构,接下来就信息结构进行分析。

2 模型信息结构

2.1 事物

事物是人对主客观世界中特定现象的整体意识,属于意义。如:物质现象之间存在物质作用现象;心理现象之间存在心理作用现象。在人的意识中,作用现象本身与发出或接受作用的特定现象之间存在区别[4]。通常情况下,如果将发出或接受作用的特定现象视为事物,事物之间的相互作用现象就是事物之间的关系。由于在人的意识中,关系之间还可能具有关系,因此关系还可以视为事物。

此外,一个尚未与其他事物建立关系的孤立事物也是事物,因为事物是意义在人意识中的一种整体呈现,其本质与作用无关,而与整体有关。这里的整体就是心理学中的格式塔。由此,基于整体给出事物的定义,基于作用给出关系的定义。因此,由心理学的图形背景理论和格式塔原理给出了整体事物定义[5]。即从事物在意识上的整体来看,一方面明确了该事物与其他事物的边界;另一方面暂时忽略了该事物各部分之间的边界。从图形背景理论来看,边界以内为前景(事物)、以外为背景(其他事物)。

由于边界具有主观性,在同一事物的边界内再分出边界则可以分解事物,融合不同事物的边界则可以组合成一个整体的事物。因此,人对多个事物的整体意识称为复杂事物,在人的意识中不是复杂事物的事物称为简单事物。复杂事物与简单事物是相对的,复杂事物中包含的多个事物相对来说就是简单事物。

2.2 关系

关系是人对主客观世界中特定现象之间作用现象的整体意识,属于事物,具有方向性和层次性。由于关系之间还可能具有关系,因此根据事物的定义,关系也可以视为事物,多种关系可以形成关系层次结构。

从客观角度分析,特定现象之间的作用具有方向性,因此关系也具有方向性。例如,苹果在桌子上面的同时就不可能桌子也在苹果上面。而有些关系似乎没有方向性,或者说是双向的,则必然是一种复合关系,属于关系的集合[6]。例如,朋友关系就是两个人分别把对方当作自己的朋友。从主观角度特定现象之间的相互作用具有层次性,一方面与关系有关的两个事物不可能具有相同的地位;另一方面关系具有统领两个事物的核心地位。这在语义分析中表现得十分明显。

一个意义的预设就是由该意义与所有其他事物的预设关系构成,任何意义必然存在预设,因此事物不可能脱离关系而存在。当然,由于认识不足的原因,主观上预设可能为空,因此,事物相对关系来说又具有一定的独立性。但关系则很难独立于一定的事物。例如,没有具体事物的上下关系只是一种抽象的意义,人除了借助“上”或“下”这些符号以外几乎无法把握[7]。

综上,由事物及其关系构成了信息结构。信息结构虽能描述信息的方向性和层次性,但不够准确,为更加准确地描述信息的方向性和层次性,接下来进一步分析信息、信息依存以及信息依存模型。

3 信息依存模型

3.1 信息

从意义的语言表达来看,语言要表达的意义是事物及其关系,若孤立地表达事物或关系是不够的,只有将事物及其关系作为整体表达出来才有具体的意义。用语言以外的其他表达方式表达意义也同样如此,因此,有必要将事物及其关系视为一个整体。一般情况,若一个事物及其关系被视为一个整体的意义,则称为信息,属于复杂事物,可以用二元组表示。其中r为关系,e为事物,称为前向信息,< r, e>称为后向信息。仅以这种单层二元组表示的信息为不完全具体意义——始终只包括一个事物及其关系。

由于关系属于事物,信息也属于事物,如果在事物层面上对二元组进行嵌套操作,即可表示完全具体的意义以及由信息及其关系构成的复杂意义[8]。因此,对于两个事物及其关系可以视为一个整体的意义,称为完整信息,属于信息,其实质是二元组的嵌套。

信息及其关系可以视为一个整体的意义,称为组合信息,属于信息。其实质是用一个信息置换另一个信息中的事物得到的嵌套二元组。完整信息是用新信息对信息中关系进行扩展,组合信息是用新信息对信息中事物进行扩展,两者的基础结构均为前向信息或后向信息。

3.2 信息依存

根据关系的层次性,在信息中,r是e与另一事物的关系,因此r与e的地位是不同的。r暗示了一类完整信息<, e>或>,e是r涉及的事物之一。离开了e、r的暗示就无法形成具体的信息实例,而离开了r、e是否具体取决于e是否为信息。从这个意义上讲,r依赖于e。

信息中关系对事物的依赖称为信息依存。信息依存是融合关系的方向性和层次性得到的一种新型关系,便于准确而简洁地形式化描述信息。从数学的函数表达式来看,关系是函数,事物是参数,函数规定了对特定类型和参数进行计算的过程,但计算结果却依赖于具体的参数输入[9]。参数是相对独立的,同一个具体参数可以输入不同的函数得到不同结果。函数是相对依赖的,特定函数只依赖于特定类型和数量的参数,否则无法计算。

3.3 信息依存模型

二元组属于序列结构,因此只能表示关系的方向性,无法同时表示关系的层次性。例如,在二元组<苹果,在上面>中,谁是关系谁是事物从结构上无法判定。组合信息与完整信息之间也无法从结构上进行区别。但是信息依存本身就是一种关系,因此可以考虑嵌入二元组,构成嵌套二元组后再予以简化,从而准确地表示关系的方向性和层次性,实现对信息的准确形式化描述。

在信息中,r信息依存于e,可记为嵌套二元组<, e>,其中%为依存关系,简化记为层次结构r>e,>称为向右信息依存符。ee这种表示信息依存的信息层次结构称为信息依存模型,简称信息模型。显然,这种模型比嵌套二元组更简洁、更直观,且能够准确地表示各种信息中关系的方向性和层次性[11]。

在信息<%, r>中,%作为关系仍然信息依存于r,还可以表示为<<%, %>,r>,信息依存模型为%>r,简化并默认为r;在信息中,%作为关系仍然信息依存于r,还可以表示为>,信息依存模型为r<%,简化并默认为r。这种默认处理是为了终止不必要的信息依存递归。

根据信息的定义,ee可以进行嵌套操作以表示完整信息和组合信息,不过在嵌套时,子信息需要用[ ]进行明确标记,表示为[ee]。信息依存模型(Information Dependency Model,IDM)即表示信息依存的信息层次结构,简称信息模型。<为向左信息依存符,>为向右信息依存符。如:%>r和r<%记为r;的IDM记为e的IDM记为r>e。

3.4 信息依存图

IDM用一种特殊的层次图进行表示,称为信息依存图。信息依存图作为IDM的等价表示,能够准确无误地表示关系的方向性和层次性。用结点横向的前后关系表示关系的方向性,用结点纵向的上下关系表示关系的层次性,并将信息前项或信息后项与信息接口联通,则前向信息e>r和后向信息r>e的信息依存如图1所示。

图1 前向与后向信息依存

复杂信息由简单信息嵌套而成,其本质是用子信息对父信息的e或r进行置换扩展。组合信息是用子信息对父信息的e进行置换扩展。以[e

图2 组合信息依存图构造

4 实际应用

4.1 应用于符号学

语言常用于表达意义,各种各样的符号也能表达意义。相对语言而言,符号更一般。符号学是专门研究符号的学科,被公认的现代符号学之父是瑞士语言学家索绪尔和美国哲学家皮尔斯。索绪尔在由其学生整理出版的《普通语言学教程》中预言了符号学的建立,并将语言学归属于符号学。皮尔斯从哲学角度对符号进行了逻辑分析,认为符号具有三元性,即由代表者、对象和解释项构成。本文从信息依存角度对符号进行了认知分析,提出了异议表达的四元观,即符义、信号、信映、符号。符义表达意义,信号表达符义的物质载体,信映是人感知信号的直观映像,符号是人泛化信映获得的相似结构。在具体的符义记录和交流过程中,接收者通过被信号激活的符号来理解要表达的符义,拥有情境解释性。

信映中记映和信映的组合方式称为信映结构,信号中记号和信号的组合方式称为信号结构,符义中符号的组合方式称为符义结构。但记映是记号的直观映像,因此信映结构也是信号结构的直观映像,两者具有结构同一性。而符义是人主观赋予信号的,符义结构决定于意义自身的结构[10]。信号是物质,符义是意义,因此符义结构与信号结构具有质的区别。符号结构既是信映结构的泛化,同时又能够激活符义结构,因此符号结构必然是在信映结构和符义结构双重制约下形成的一种复合结构。

记映属于事物,人由记号感知到记映就是将记号与其他记号区别开来作为一个整体,因此只有先认识这个记号,才能认识下一个记号。人获得不同记映的时间先后关系称为顺序关系,如果记号之间存在动态空间关系,则这种顺序关系被其客观性决定。反之,如果记号之间存在静态空间关系,则这种顺序关系由人的意识主观性决定。

顺序关系是时间上的先后关系,因此是不可逆的。客观上,一个运动状态发生在另一个运动状态之后就不可能是发生在之前。主观上,人先获得一个记映再获得另一个记映就不可能是相反的顺序。信映结构是两个记映及其顺序关系,可以用前向完整信息表示,即IDM为b0<[》b1],简化为b0b1。其中B0为t0时刻出现的记映,B1为t1时刻出现的记映,为顺序关系,即t0< t1。这种表示两个记符及其顺序关系的序列结构称为符号序列模型(Sign Sequence Model,SSM ),而基于IDM的嵌套序列结构是可以扩展的,如3个记符的序列结构为b0b1b2,其IDM为b0<[〗>[b1<[〗>b2]]]。

符义属于意义,符义结构属于意义组合。根据IDM,意义只能通过关系组合在一起,也就是必须以信息为单位,信息可以用IDM表示,因此符义结构可以用IDM表示。表示符义结构的IDM称为符义依存模型(Signified Dependency Model, S' DM )。由于子符号都有对应的符义,如果用子符号取代S' DM中的对应符义则得到一个与S' DM有相同结构的符号IDM。这种表示符义结构的符号IDM称为符号依存模型(Sign Dependency Model,SDM ) 。SDM与SSM的区别在于前者的单位是子符号,后者的单位是记符;SDM是一种嵌套结构,SSM是一种线性结构;SSM只与信映结构和信号结构有关,SDM只与符义结构有关。由于存在这些根本差异,一个SSM可能对应于多个SDM,但一个SDM只能对应于一个SSM。SDM基于子符号S' DM构造,SSM基于记符及其顺序关系IDM构造,本质上都属于IDM,它们都以IDM为基础,因此SSM和SDM统称为信息依存符号模型(Informat-ion Dependency Sign Model,IDSM )。

4.2 应用于语言学

个人赖以社会化的文本符号和语音符号统称为语言符号,简称语言,文本符号简称文本,语音符号简称语音,文本和语音是语言的基本构成。文本和语音作为符号,必然由对应的记符构成,文本记符称为字符,语音记符称为音节,字符和音节统称为语符。文本由字符序列构成,语音由音节序列构成。语言构成的符号称为语言系统,文本构成的符号称为文本系统,语音构成的符号称为语音系统。人类有很多符号系统,但语言符号系统对人的重要性更大,已经成为人类最基本的思维工具。在一种成熟的语言中,文本与语音通常具有对应关系,即在表达确定语义前提下,文本总是有对应的语音可读,语音总是有对应的文本可记录。语言对应的符号序列模型称为语言序列模型(Lansign Sequence Model,LSM),语言对应的符号依存模型称为语言依存模型(Lansign Dependency Model,LDM),语言对应的信息依存符号模型称为信息依存语言模型(Information Dependency Lansign Model, IDLM)。

语言属于符号,语符属于记符,元语言属于元符号,因此语符组合成元语言、元语言组合成更大的符号以表达语义。元语言是具有语义的最小语言单位,它可以按语言序列模型LSM组合成语言。元语言按语言序列模型组合而成的称为语素,单个元语言也是语素。判断语素的依据是能够分析其LDM,也就是说,语素的意义可以理解为LDM构成成分。语素按语言依存模型组合而成为语块,判断语块的依据是能够分析其LDM成分。完整的语块应当表达完整信息,这样才能满足人们语义记录和交流信息需要[11]。LDM是从符号依存关系出发,LSM是从符号序列关系出发,均是在符号系统进行研究。以信息依存符号IDSM为基础,对自然语言的基本性质、单位、句法结构、优化与不确定性进行研究,将信息依存符号模型扩展到信息依存语言模型IDLM,简称语言模型(Lansign Model, LM)。

信息依存语言模型IDLM以一种面向语料库建设的句法标注为理论,该理论是以认知语法基本原理为指导,在融合短语结构语法和依存语法基本结构的基础上创建的一种面向语料库建设的形式化句法理论。它在整合短语结构语法和依存语法基础上,注重语言描写和解释,具有句法、语义一体化的特点。相对信息依存符号IDSM来说,信息依存语言模型IDLM增加了语素前缀、编码前缀和寄存器结构,从而提高了对语言的描写能力。

5 结语

本文从意义的定义出发,分析了由预设、突显及其条件关系构成的图式结构,由事物及其关系构成的信息结构,分析了信息、信息依存以及信息依存模型。并在剖析信息依存模型IDM基础上,将其应用于符号学和语言学,并提出了面向语料库建设的句法标注模型信息依存符号模型IDSM和信息依存语言模型IDLM,这类模型融合了认知语法、短语结构语法和依存语法等知识,为语料库句法标注提供了一套解决方案,为语言学研究提供了新视角。也是对语料库句法标注的规范和知识的完善与补充,为人工标注提供了一套相对合理的规范与参考。意义的形式化描述作为语料库建设的核心知识,是计算机自动标注程序实现的基础,是自动化语料库建设的基础研究。因此,对意义基本结构的探索,不仅有助于意义的形式化描述,还能更好地促进语料库的建设与发展。

猜你喜欢
预设符号事物
美好的事物
“+”“-”符号的由来
变符号
奇妙事物用心看
问题是预设与生成间的桥
图的有效符号边控制数
论幽默语境中的预设触发语
预设留白 生成精彩
作为预设触发语的重动句
春天来啦(2则)