面向语句成分的英语语义分析智能算法探讨

2021-06-04 03:09苏楠
微型电脑应用 2021年5期
关键词:智能算法词义语句

苏楠

(陕西能源职业技术学院 教务处, 陕西 咸阳 712000)

0 引言

随着计算机技术的不断成熟和人工智能的不断推进,计算机已经被广泛应用于英语辅助教学中,各层级的学校也逐渐用线上考试代替了传统的考试措施[1-2]。当前智能算法在诸如选择题、填空和判断等客观题中应用较广,而在作文等主观题中的应用偏少,主要是因为客观题的答案唯一,计算机算法的实现较为简单,而主观题的算法相对复杂[3-5]。为了减轻教师阅卷的工作量,并较少因教师主观因素而导致的学生得分不一致性,利用一定的算法实现智能主观题目的计算机阅卷是非常有必要的[6-9]。本文从语义成分分析的基础理论入手,对基于英语语义分析的智能算法进行了探讨,旨在为人工智能在英语中更深一步的推广和应用提供理论和技术支持。

1 语义成分分析介绍

语义分析(Componential analysis)是20世纪40年代,丹麦构建主义学家L. Hjelmslev和布格拉学派代表 R. Jakobson 在其著作中初次提及,他们认为词义可以分解为最小的语义成分[10-12]。经过20余年的发展,该理论逐渐被完善,并于20世纪60年代正式被应用在语言学中。近年来,语义学家认为相比于词义,意义单元是最小的语义组成单位,并称其为语义成分(Sense components))、语义特征(Semantic features)、语义标识(Semantic makers)或义素。这也就是说任意一个实意词,我们都可以拆分出其语义成分,以下以英语单词BOY举例。针对BOY这个单词,我们可以将其拆分为human、young和male三个语义成分,而不再认为该词汇是一个不可拆分的整体。这一拆分为语义分析在基于计算机的智能分析中提供了极大的便利,可以根据不同的语境,为该单词提供不同的意思,从而实现对语义的分析。

上述思想为语义成分分析提供了基本思路,词义分析法具备很大的优点,其中最为突出的是它将每一个单词不再固定地认为是一组意译的组合,而是分解为很多个词义并将这些词义放在不同的语境下供学习者理解和使用,能改善学生以往死记硬背的学习习惯并激发学生对语言的探索和热爱[13]。但要实现语义分析的智能化,我们仍然面临着几个问题。

(1) 语义分析的基础资源库建立困难。和任意一种语言一样,英语语义中也存在着极大的文学、宗教及其它因素,而且词汇数量基数庞大,但要基于计算机技术实现英语语义分析智能算法,则需要为常用词汇建立语义资源库。

(2) 语义分析很难满足语言的多彩性。计算机算法具备“两分法”的特征,对于设定的语义成分会根据语境予以判断,但这种具有两分法色彩的分析方法无法满足实际语言中多姿多彩的修辞手法;

(3) 语义分析无法完成抽象词汇的分析作业。如kindness等虚拟词汇,其用途广泛,在口语和书面语言中,我们都能感受和理解其表达的意思,但当使用语义分析手段对其分析时会发现无从下手。

2 智能算法结构

面向语句成分的英语语义分析的智能算法结构如图1所示。由图1可见,基于语义分析的智能算法结构首先需要将一个句子中所包含的英语单词分解为单个的词汇,然后调取每一个词汇的词性及相应的词义,最后结合语境去分析该单词在句子中的含义。以句子“I drew a picture yesterday.”为例,对结构的每一块进行分别介绍。

图1 语义分析智能算法结构

3 系统数据库

系统数据库依赖于教师和教材的汇编,从业者根据不同学习程度的学生、教学大纲,将学生所需学习的词汇进行汇编。其中主要包含词汇的基本信息表和相对较为特殊的词汇信息。

词汇基本信息:根据教学大纲,将所需词汇的词性、不同环境下的发音音标等信息储存至数据库中。以示例语句中的drew(draw的过去式)为例,其基本信息,如表1所示。

表1 数据库中词汇的基本信息(以draw常用词义为例)

特殊词汇信息:在英语中,大多数名词的复数、动词的过去式及过去分词和现在式、形容词的比较级和最高级等都具有一定的形成规则,但有一些词汇的上述信息却与常见的不一致,具有特殊性,仍以drew为例,如表2所示。

表2 数据库中特殊词汇信息(以draw常用词义为例)

由表2可知,单词“draw”作为动词时,现在分词和第三人称单数符合一般的英语词汇变形规则,但过去式和过去分词明显与常规有差别,为了更精确地实现语义分析智能算法,数据库中应该对此类词汇进行单独储存。

4 系统模块介绍分析过程示例

以句子“I drew a picture yesterday.”为例,对系统的每一个模块及实现方法进行分析。

4.1 词汇分析

词汇分析是将一个句子中每一个词汇单独拆开,并分析其词性、词义等的过程,如图2所示。

图2 词汇分析流程图

以句子“I drew a picture yesterday.”中,首先将其分为以下几个词汇:“I”、“drew”、“a”、“picture”、“yesterday”。并在数据库中调取每一个词汇的所有含义。如“picture”:n. 照片,影片,描述,图画;vt. 想像,画,拍照。调取完成后为下一步语句词性分析做好准备。

4.2 语句词性分析

语句词性分析主要是在词汇分析的基础上,首先获取每一个单词的词性及词义,然后根据获取的数据和该词汇前后词汇的词性,确定该单词在本语句中所扮演的词性。句子“I drew a picture yesterday.”中所有单词词性分析结果,如表3所示。

表3 语句词性检索及分析结果示例

4.3 语句语义分析

语句分析是基于词汇和语句的分析结果,确定句子的主语、谓语、宾语等主要成分和状语等其它组成完整句子的成分。系统以英语的语法规则和对语句的分析结果,借助于英语语法的正则表达式,首先确定完整句子的谓语部分,然后根据主谓宾关系确定句子的主语和宾语部分,剩余的作为其它部分,并根据所处位置判断其在句子中充当的角色。其中英语语法的正则表达式见文献[14]所示,兹不赘述。本文仍以上述例句为例,对语句语义进行分析,如表4、表5所示。

表4 语句语义分析

表5 考生答卷结果与标准答案对比

5 总结

本文从既有英语单词形态变化及英语语法正则表达式出发,首先对语义成分分析的基本理论进行了分析,然后对语义分析智能算法结构进行介绍,最后通过举例,对算法结构中各部分进行了研究。研究成果表明:面向语句成分的英语语义分析的智能算法在英语主观题目批卷等工作中能起到非常好的作用,不仅能减轻教师的工作量,还能避免因教师主观认知不同而造成的学生主观题目得分不一致;同时该算法依赖于对英语词汇及语法等的正则表达式的完善和词汇数据库的搭建,这些部分均已经受到广大从业者的关注。语句语义分析结果表明,限于计算机算法的认知程度和语言的复杂性,目前对除主谓宾等主要成分外的其它句子成分,不能实现很精准的识别,这有待于我们展开更多的探索和研究。

猜你喜欢
智能算法词义语句
神经网络智能算法在发电机主绝缘状态评估领域的应用
“诛”的词义演变及其在古籍中的释义
重点:语句衔接
西夏语“头项”词义考
词义辨别小妙招——看图辨词
从鸡群算法看群体智能算法的发展趋势
改进的多目标快速群搜索算法的应用
基于Robocode的智能机器人的设计与实现
我喜欢
《诗经》词义考辨二则