基于产生式规则的藏语存在句的识别研究

2022-02-24 00:08尕藏卓玛安见才让
计算机时代 2022年2期
关键词:人工智能

尕藏卓玛 安见才让

摘  要: 通过对藏语存在句的分析和研究,实现藏语存在句的识别。借助产生式的正向推理作为藏语存在句识别的知识表示方式,并用产生式规则搜索和匹配。从人工角度构建的一种基于产生式规则的藏语存在句的识别系统,以利藏语存在句的识别。该研究为实现藏语存在句的识别提供了基础。

关键词: 人工智能; 藏语存在句的识别; 产生式规则; 正向推理

中图分类号:TP391.1          文献标识码:A     文章编号:1006-8228(2022)02-15-03

Research on recognition of Tibetan existential sentence based on production rule

Gazang Zhuoma, Anjian Cairang

(School of Computer, Qinghai Minzu University, Xining, Qinghai 810007, China)

Abstract: A recognition system of Tibetan existential sentences based on production rule is constructed from the artificial point of view to facilitate the recognition of Tibetan existential sentences. It uses the positive inference of production as the knowledge representation and inference algorithm of Tibetan existential sentence to search and match rules. The experiment has achieved the recognition of Tibetan existential sentence.

Key words: artificial intelligence; recognition of Tibetan existential sentence; production rule; forward reasoning

0 引言

識别藏语存在句,简单的说就是以藏语句子的系统知识和理论为基础,准确,有效,简便,适当地从中识别藏语存在句。从信息角度看,识别藏语存在句实质上是一个在读者和句子之间的信息运动过程。在这个过程中主要包括两类信息,一是藏语理论知识及学习经验等藏语知识信息,二是句子的基本结构,包括句子的信息和应用信息情况等。因此,在识别藏语存在句的信息化过程中如何准确的表示并实现这两类信息之间的理解就成为了关键。

产生式系统是人工学科中的一个重要概念,它是构造知识型系统和建立认知模型时常用的知识表示的形式系统。它不仅用来对人类的问题求解方法建模[7],而且已经在多个领域得到了广泛的应用,本文将产生式规则与藏语存在句的结构结合,提出基于产生式规则的识别藏语存在句的研究方法。

1 识别藏语存在句

即便藏语句子的数量是上千万,但其中蕴含的最基本的规则是相对稳定的,所以可以把上千万的句子用有限的句型去表示。对基于规则的藏语句法分析方法做了研究之后,按照句子的结构模式,把藏语句子归纳到了六种句型,有及物句、不及物句、存在句、特征句、一体句和神态句,这六种句型在藏语中是最常见的,也是十分重要的句型[1]。本文根据藏语句子的结构及藏语句型,对存在句进行了推理研究。

1.1 存在句的定义及结构

藏语句型存在句是表示某物依存于某地的表示方式,它的句型一般由依体(རྟེན་གཞི), 拉格助词(ལ་དོན་གྱི་ཕྲད་དེ། སུ་རུ་ར་ལ་སོགས།一般用CP表示),被依体(བརྟེན་ཆོས)和谓语(གསལ་བྱེད་ཀྱི་སྒྲ)组成,被依体是可选项。这些成分,分别由下列词性担任[1]:

1.2 存在句的推理

存在句中的依体是用一个名词或方位词等组成的。依体和拉格助词(ལ་དོན་གྱི་ཕྲད་དེ། སུ་རུ་ར་ལ་སོགས།一般用CP表示)形成名词性短语np 。被依体是可选项,如(རྩྭ་ཐང་དུ་ཡོད། རྩྭ་ཐང་དུ་མེ་ཏོག་ཡོད།)第一个句子中没有被依体,第二个句子中有被依体,但这都不会影响整体去理解的句子的内容,我们还是能知道这是个存在句。还有(སློབ་གྲྭ་རུ་ཡོད། ཆུ་ནང་དུ་ཡོད།)存在句中的谓词也扮演着重要的角色,因为后面谓词的存在,能尽快的判断该句子是一个存在句,一般常见的谓词有“ཡོད། མེད།”等。被依体和谓词形成存在性短语。在该实验中存在句中的词性以常见的词性为研究对象。根据存在句常见的词性结构,知识库中只包含以下23条规则:

r1:IF 句型中有词性nj    AND  cp  THEN  np

r2:IF 句型中有词性nds  AND  cp  THEN  np

r3:IF 句型中有词性f    AND  cp   THEN  np

r4:IF 句型中有词性nd  AND  cp    THEN  np

r5:IF 句型中有词性nj   AND  aq   THEN  vp

r6:IF 句型中有词性nj   AND  dd   THEN  vp

r7:IF 句型中有词性nj   AND  vae  THEN  vp

r8:IF 句型中有词性nd   AND  aq   THEN  vp

r9:IF 句型中有词性nd   AND  dd   THEN  vp

r10:IF 句型中有词性nd  AND  vae   THEN  vp

r11:IF 句型中有词性nj   AND   cpANDaq  THEN  S

r12:IF 句型中有词性nj   AND   cpANDdd  THEN  S

r13:IF 句型中有词性nj   AND   cpANDvae THEN  S

r14:IF 句型中有词性nds  AND  cpANDaq   THEN  S

r15:IF 句型中有词性nds  AND  cpANDdd   THEN  S

r16:IF 句型中有词性nds  AND  cpANDvae  THEN  S

r17:IF 句型中有词性f    AND   cpANDaq   THEN  S

r18:IF 句型中有词性f    AND   cpANDdd   THEN  S

r19:IF 句型中有詞性f    AND   cpANDvae  THEN  S

r20:IF 句型中有词性nd  AND   cpANDaq   THEN  S

r21:IF 句型中有词性nd  AND   cpANDdd   THEN  S

r22:IF 句型中有词性nd  AND   cpANDvae  THEN  S

r23:IF 句型中有词性np  AND   vp          THEN  S

名词中有nj(随立名),nds(地名),f(方位词),nd(随欲名)。用cp表示拉格助词。谓语中有aq(形容词),dd(否定词),vae(助动词)词性。np表示名词短语。vp表示存在性短语。S表示存在句,如图1所示。

2 产生式规则系统

2.1 组成

一个产生式系统包括以下三部分(图2):综合数据库,知识库(规则库)和控制系统。综合数据库(database)用来存放与求解问题有关的各种当前信息的数据结构。知识库及规则库用来存放与求解问题有关的所有规则的集合,它包含了将问题从初始状态转换成目标状态所需的所有变换规则。控制系统(control system)也称推理机,是由一组程序组成,用来控制整个产生式系统的运行,决定问题求解过程的推理线路,实现对问题的求解[2]。

2.2 产生式推理方法

控制系统对产生式规则的使用主要有两种方法:正向推理和反向推理。指的是从现有事实出发,搜索知识库中的规则并检查事实是否与规则的前提条件相符,不断进行直到预期目标实现。反向推理,即从目标出发,寻找以此目标为结论的规则,并对该规则的前提进行判断,反复直至能够对某规则的前提进行判断。若是既为正向推理又为反向推理方式,则称为双向推理,它综合了正向推理和逆向推理的长处,并克服了两者的短处。

3 基于产生式规则的识别藏语存在句

3.1 识别藏语存在句的产生式规则表示

知识库是产生式系统的核心,识别藏语存在句的系统中,知识就是存在句的使用方式,存在句的组成包含相应的词性信息,词性是识别藏语存在句的重要知识来源。而在识别藏语存在句中,存在句的基本结构和词性是主要知识来源。

在词性识别中,其原理是根据输入的词性同输入的词性组在结构组成上是否具有规则,如有则形成存在句。主要从句子的组成部分及内部结构的词性来判断输入的句子是否是存在句,当输入的词性有(སློབ་གྲྭ/njརུ/cpསློབ་མ/njཡོད/vae)时判断是存在句类的,输入的词性有(སློབ་གྲྭ/njརུ/cpཡོད/vae)时也会判断是存在句类。

3.2 识别藏语存在句的系统的推理机制

⑴ 把用户提供的初始证据放入综合数据库。

⑵ 检查综合数据库中是否包含了问题的解,若已包含,则求解结束,并成功退出;否则执行下一步。

⑶ 检查知识库中是否有可用知识,若有,形成当前可用知识集,执行下一步;否则转⑸。

⑷ 按照某种冲突消解策略,从当前可用知识集中选出一条知识进行推理,并将推出的新事实加入综合数据库中,然后转⑵。

⑸ 询问用户是否可以进一步补充新的事实,若可补充,则将补充的新事实加入综合数据库中,然后转⑶;否则表示无解,失败退出。

3.3 实验结果

在该实验中主要以常见的存在句为研究对象的,并从抽取了90个存在句。这些句子分成三部分,第一部分是(nj/nds/f/nd+cp+nj/nd+aq/vae/dd)词性结构组成的,第二部分是(nj/nds/f/nd+cp+aq/vae/dd)词性结构组成的。表1是产生式规则的藏语存在句识别的结果。

实验结果表明,语料中的句子的形成结构的不同,对实验的准确率各不相同,这主要原因是藏语句子结构的复杂度。另外,存在句的规则库的不完整和词性结构不齐全因素,所以还需要进一步完善规则库和丰富词性结构。

4 结束语

从人工的角度实现了识别藏语存在句推理,基本达到了设计目的,但由于藏语句型对识别藏语存在句知识的确定性和准确性要求较高,因此该研究未能实现推理知识的更全面的知识内容,同时由于藏语句子结构的复杂性,识别藏语存在句的知识表达也有待进一步完善。

参考文献(References):

[1] 安见才让.藏文信息处理原理与技术实现[M].青海民族出版社,2017.12

[2] 王万森.人工原理及其应用(第三版)[M].北京:电子工业出版社,2012.9

[3] 李雷,高铁曼.产生式规则专家系统的原理与实现[J].微计算机应用,2006,27(5)

[4] 格桑居冕.实用藏文文法教程[M].四川民族出版社,2004.11

[5] 袁国忠.python基础胡教程(第3版)[M],北京:人民邮电出版社,2018.2

[6] 刘颖.计算语言学[M].清华大学出版社,2014

[7] Luger GF. Artificial intelligence: Structures and strategiesfor complex problem solving(6th edition)[M].Boston: Addison-Wesley,2008

猜你喜欢
人工智能
我校新增“人工智能”本科专业
用“小AI”解决人工智能的“大”烦恼
当人工智能遇见再制造
2019:人工智能
AI人工智能解疑答问
人工智能与就业
基于人工智能的电力系统自动化控制
人工智能,来了
数读人工智能
人工智能来了