王飞,谭新,易绵竹,李健
(1.信息工程大学洛阳校区 语言工程系,河南 洛阳 471003;2.91709部队,吉林 珲春 133300)
本体语义将表示意义的概念和描述用法的词汇分开,形成了独立于语言的本体和依赖于语言的词典。基于本体和词典(包括专名对象)知识对文本进行语义分析,就能获取文本意义表征(TMR)[1]作为概念实例,建立本体语义知识源。知识源中不同类型的知识通过与概念相互映射,结构化的文本数据就被广泛地连接起来建立语义关联数据,为用户提供知识查询服务与支持[2]。在一个建立好的本体语义系统中,名词对象作为事件的参与者相互关联,基于语义关联数据就能够查询文本中提及的对象以及涉及的事件,并识别它们的语义关联性。例如在文本(1)和(2)中,
(1)TheDalaiLamahasvisitedMr.ObamaattheWhiteHouse.*文中的文本示例来自China Daily和美国政府网站。http:∥www.chinadaily.com.&https:∥obamawhitehouse.archives.gov
(2)ThePresidentmettodaywithHisHolinesstheXIVDalaiLama.ThePresidentemphasizedhisstrongsupportforthepreservationofTibet'suniquereligious,culturalandlinguistictraditions.ThePresidentencouragedmeaningfulanddirectdialoguebetweentheDalaiLamaandhisrepresentativeswithChineseauthoritiestolowertensionsandresolvedifferences.
如果两个文本来源不同,如何判断两种不同的指称指向同一对象,例如The Dalai Lama和“His Holiness”(西方媒体称),Mr. Obama和the President of United States,如何建立起两个指称之间的语义联系,让计算机识别为同一对象;如何确定两段文本所描述的是同一事件,第二段文本就是第一段文本中“窜访”事件的主要内容。离散的数据无法产生更多的知识,数据需要语义将其关联起来,才能够产生更多更重要的知识。本体语义系统可以将两段文本中不同称谓的人物关联起来,并且根据人物在事件的语义角色将对象与事件关联起来。如果系统包含足够多领域背景知识,以及所涉及的时间地点信息,还可以在已有知识的基础上根据语义关系进行推理和预测事件发生的可能性[3]以及更多的隐含知识。
西藏领域涉及国家安全,西藏领域文本以事件描述为主,具有对象众多,并且对象之间的关系错综复杂的特点。例如,人物对象参与事件的情况,事件与事件之间的联系,数据背后蕴含着丰富的语义关联。本文采集了西藏领域的新闻数据资源,按照本体语义所定义的语义描述框架,从数据源中抽取知识建立西藏领域本体知识库,以表示对西藏领域主要事件和对象的语义关联,在此基础上设计本体语义查询系统进行知识的检索和推理,就可以有效地发现对象与主要事件的关联关系,对于西藏领域信息自动分析、识别,辅助决策有重要意义。查询系统通过调用本体和词典中的知识分析查询请求,从存储在事实数据库和专名库的结构化数据中检索答案。如果存在能够直接匹配的答案,则返回用户;如果没有直接匹配问题的答案,则需要一定程度的本体语义推理,通过概念属性的链接找到关联知识;如果推理无结果则需要从开放语料中获取结构化数据,采用语义分析和数据驱动相结合的方法共同完成查询检索任务,并补充完善知识源。因此,基于本体语义的知识查询主要有以下三个任务:
1)处理领域文本,将其转换为TMR,并记录在事实数据库中以备查询;
2)理解用户提出的查询问题,将其转换为语义查询语句;
3)检索问题的答案,分为在事实库中检索和在开放文本中检索。
这些工作的基础包括基于本体语义的知识表示,语义分析、查询和推理的方法,以及开放领域中数据驱动的辅助查询方法,在此基础上查询系统可以推理和预测文本中没有直接陈述的事件和状态[4]。
早期的检索方法很少对意义进行分析,更多的是以关键字匹配进行查询,这样检索出的信息关联性较弱,经常会出现查不全和查不准的问题,不能给用户提供语义关联的知识。现在较为先进的数据驱动方法在训练中加入了更多的语义信息,取得了较大的进展,但是其准确率仍然受到一定的制约。由于具有较好的概念层次结构和逻辑推理能力,本体在信息检索中的应用比较广泛。词汇具有多样性,模糊性,而本体表示可以根据查询者的意图适当地调整词的语义范围,将词汇映射到概念,根据本体进行语义的垂直搜索或者层次化的扩展查询,提高查询的准确率[5]。本体根据词汇之间的语义关联性挖掘与查询词相关的信息,包括词汇本身的属性和具有语义关联的其他实例,由此扩展了查询词的语义范围和深度[6]。为发挥本体语义的优势,Li等人[7]研究将本体语义理论用于信息检索系统的工程实现,Kuznetsov等人[8]研究基于本体语义的文本分析和自动问答系统开发。本体语义知识源为查询系统提供了所需要的理论、形式语言、规则集等资源,系统的推理能力来自基于本体语义理论所构建的知识源以及各个知识类型之间的链接映射关系。本体语义的知识源[9]包括:
本体,描述语言中词汇单元的含义以及TMR意义的规范,建立了现实世界的概念模型。本体语义是事件驱动的,大多数动词对应于事件概念,名词对应于对象概念,分析文本中的动词和专名,就能得到领域中的主要概念。事件概念中,语义角色构成其属性,如agent(施事)、theme(受事)等,属性值用其他概念表示其语义选择限制;对象概念中属性为通常所说的数据属性,描述对象的基本特征,例如词汇urge所具有的含义是通过概念inform表示的,概念inform在本体中记录如下:
(1) inform-1
is-a assertive-act
agent sem human
relaxable-to Social object
theme sem human
relaxable-to event
object
instrument communication-device
beneficiary human
en-lex urge
在本体语义框架中,is-a指示了概念之间的上下位关系,sem表示基本语义限制,relaxable-to表示语义放宽的范围,en-lex表示概念所映射的英语词汇。
词典,本体概念在特定语种中的词汇表示,不仅包含词的形态和句法信息,还包含语义信息。语义上,词被映射到本体中定义的概念,并对概念的属性规定了取值范围,在TMR中被实例化以确定词汇的具体含义[10]。例句(3)UnitedStatesaskedtheUNtopaycloseattentiontothehumanrightsissues.中的动词ask在本体语义词典中表示为如下形式:
(2) ask-v
cat v
syn-struc
subj $var1
dobj $var2
pp (opt+)
root “to”
sem-struc
map request-action
agent ^$var1
theme ^$var2
其中,syn-struc表示词汇的句法结构,sem-struc表示语义结构,$varN(N=1,2,3,…)代表句法变量,^$varN表示变量$varN的意义,通过变量把词汇的句法和语义信息建立了对应关系。“request-action”表示“ask”所映射到的概念,通过概念对词汇含义进行解释。
事实数据库,记录了本体概念的实例,主要包含动词事件和常识事实的TMR,通过对文本的语义分析获取。本体概念属性值为概念约束,而在TMR中,则需要根据文本内容按照本体定义的语义框架填充为实际值。例句(3)的TMR表示如下。
(3)SPEECH-ACT
agent United States
theme PERCEPTUAL-EVENT
beneficiary UN
source-word ask
PERCEPTUAL-EVENT
agent UN
theme human rights issues
source-word pay attention to
专名库,文本中的专有名词被记录在专名库中,专名是本体中对象概念的实例,专有名词的属性可以借助现有的百科知识获得,例如在专名库中“Obama”词条表示如下:
(4)Barack Obama*专名词条来自英文维基百科。https:∥en.wikipedia.org/wiki/Barack Obama.
INSTANCE-OF PERSON
ALIAS
Mr. Obama,
President Obama,
the president of the United States,
the US president
SOCIAL-ROLE President
GENDER male
NATIONALITY USA
BORN August 4, 1961
SPOUSE Michelle Robinson(m. 1992)
本体语义理论提供了构建本体知识库的语义关联模式和概念框架,本文在此基础上结合应用需要对框架进行一定的修改,构建西藏领域本体知识库,并在此基础上研究设计查询系统。
本体语义分析模拟人类理解的过程将文本转化为语义关联数据,使其具备自动表示文本意义的能力,分析的过程离不开构建好的本体知识源提供的概念、词汇和实例的知识表示[11]。语义分析也成为本体语义系统的主要应用,文本经过语义分析得到TMR是计算机理解语义的过程,既可以理解查询语句又可以从开放文本中不断学习新的知识。
当有文本输入时,本体语义分析模块设计如下。
(1)预处理。分析器线性地读取文本中的句子,按照NLP工具的步骤逐句分析,识别出其中的动词,在词典中查找动词条目,检查动词的用法是否符合SYN-STRUC部分,如果符合则根据句法和语义的对应关系为句法成分分配语义角色,并根据词汇与概念映射关系得到相应的本体事件概念。
(2)语义分析。根据动词识别出的事件概念,按照概念的属性约束对句子中的语义成分进行匹配,专名库中的对象在匹配中完成部分消歧,概念的属性值匹配成功即获得正确的TMR,建立起句子基本的语义依存关系。实际处理中,如果遇到复杂的文本,除了基本属性外还需要添加共指、情态等信息。
(3)选择限制。如果对句子的语义分析没有产生候选TMR或者TMR多于一个,则放宽或者收紧语义选择限制选取满足限制的最佳匹配。如果缺乏关于特定对象的领域知识,则为知识库自动创建新的概念或词汇,并增加其属性。
(4)数据存储。将所得到的TMR存储在实例数据库中,为查询等应用提供支持。
按照以上步骤,在句子(1)中,主要动词为visit,作为political-event概念的一个窜访实例,主语TheDalaiLama为施事,宾语Mr.Obama为受事,地点状语WhiteHouse为处所。这样,通过语义角色标注,就把句法论元同深层的语义角色联系起来了。句子(1)的TMR如下所示:
(5) visit
agent value The Dalai Lama
theme value Mr. Obama
location value the White House
有时一个复杂事件中包含了多个子事件,有的事件作为主要事件的预设,有的事件作为结果。复杂事件中具有一个核心的动词概念,这个动词概念会将子事件关联在一起,获得该主题更完整的关系,它的语义表示被称作框架[12],模型[13]或脚本[14]。下面的例句来自文章起始第二段文本。
(2)ThePresidentmettodaywithHisHolinesstheXIVDalaiLama.
句子(2)的主要事件是meet-with,它是本体概念communicative-event的子事件,围绕这个主要事件,首先要具有会见的前提,会见的双方都要到达某一地点,还包括会见的时间,地点,会见的主题,结果等信息。所有的会见相关的信息共同组成了meet-with脚本,表示如下:
(6)meet-with
agent value The President
theme value Dalai Lama
location value White House
time value $var1
preconditions
and
location
domain value The President
range value White House
time value $var1
location
domain value Dalai Lama
range value White House
time value $var1
effects
speech-act
agent value The President
beneficiary value Dalai Lama
come
agent value Dalai Lama
destination value White House
事件发生的时间未在文本中提及,参数$var1表示同一时间。文本分析既需要借助本体相关知识源的支持,同时也为知识源增加新的知识,二者是一个同步的、相互促进的过程。
一个完整的查询系统,需要对用户的查询进行分析,理解查询的内容;检索知识库中的结构化数据;获取开放文本中的结构化数据;向用户反馈查询结果等。本文在西藏领域本体知识库的基础上提出基于本体语义的知识查询方法,设计基于本体语义的知识查询系统,由四个主要模块和一个辅助模块组成,如图1所示。
Fig.1 Knowledge query system based on ontological semantics图1 基于本体语义的知识查询系统
本体语义知识源包括本体、词典、事实数据库和专名库,还包括由多个命题构成的复杂事件脚本。在信息检索应用中,领域知识必须是可扩展的,这就要求知识资源不断地动态更新,而通过语义分析模块自动化获取结构化知识(TMR)也是本体语义的目标之一。本文从中国日报和美国政府新闻网等网站按照领域专家给出的相关主题词采集西藏相关新闻数据,时间跨度从2010年1月至2017年4月。对采集到的领域文本清洗后得到规范化文档,经过预处理、词向量聚类和去重筛选,并根据领域特点和应用需要选择了具有典型意义的动词和名词,适当修改了本体语义框架,出于方法研究的目的,为方便构建和存储知识库,最后得到领域数据及筛选后的知识规模如表1所示。
表1 西藏领域数据及知识规模
本体语义查询系统的工作流程是,用户向本体语义查询系统提出自然语言形式的查询语句,查询分析模块对语句进行本体语义分析,把动词映射到词典中,转化成意义唯一的概念,再将其实例化,得到表义准确的查询TMR;查询解释模块根据查询类型将其转换为对事实数据库或专名库的形式查询,查询事件或者对象实例。为了在整个查询工作中保持一致性,查询TMR和事实数据库中存储的事件TMR,包括本体中的概念描述框架都是相同的。查询检索模块接收查询TMR后在事实数据库或专名库中搜索相关事件或专名,若检索到相关内容则返回结果,如果找不到答案,则基于事件或对象的属性进行语义推理,查询相关事件或对象间关系。如果查询仍无结果,系统调用辅助的语义分析模块对开放的领域数据进行搜索,对答案相关内容语义分析并生成新的TMR,将其返回并不断更新事实数据库[15]。辅助模块还可以提供数据驱动的解决方案,调用多关系数据训练模型TransE[16]将领域数据转化成向量表示,计算出实体和实体间的多种语义关系,在更大的范围内输出结果,对现有知识进行补全或发现。查询反馈模块实际上是本体语义框架中的生成器,负责将填充后的查询TMR或者是事实数据库和专名库中的记录片段在TMR的基础上生成自然语言,并返回给用户,完成自动化处理、分析、查询和生成流程。
在整个查询流程中,系统必须分析、处理和产生自然语言文本的含义。TMR在本体语义处理系统中处于核心位置,它来自于本体和词典的实例化,又是构成事实表示的基础[17]。在如下例子中:
(4)Mr.ObamametwithDalaiLamaatWhiteHouse.
(5)DalaiLamaarrivedinWashintononThursday.
(6)LobsangSangay*所谓的“西藏流亡政府”负责人。cametoWashintononJune13.
用户若查询Dalai Lama,可以从专名库中得到Dalai Lama的个人信息,同时可以获取关于人物对象的两个事件,come事件和meet-with事件;如果查询Dalai Lama和Mr.Obama之间的关系,就会在事实库中查询到meet-with事件,两人作为施事和受事参与了同一事件;如果查询Dalai Lama和Lobsang Sangay之间存在的关系,而事实库中未记录关于此问题的事实,这时就需要本体语义的推理,或者辅助于数据驱动的方式,通过实体关系的相似度计算得到他们之间的关系,并预测将会发生的事件。
查询分析模块实际上就是本体语义分析模块,与本体语义知识源构建使用相同语义分析模块、相同的知识表示基础和本体知识库。接收用户输入的查询文本,基于本体语义分析生成TMR模板,然后将文本中的其他成分对TMR模板进行填充,无法填充的成分在查询解释模块中处理为形式化查询。查询分析模块产生查询语句的TMR,作为查询实例库的基础。
查询解释模块将语义分析得出的查询TMR作为输入,对TMR进行解释,识别出TMR中包含的事件或对象,根据映射到的本体概念将文本中的事件或对象实例化,最终确定要查询的事件要素或对象名,某些情况下需要用到共指消解、歧义消解等具体解决方案。
解释模块根据用户需要重新组织查询语句,例如查询$var1是否具有属性$var2?查询$var1和$var2共同参与的会议,或者查询更具体的作为人名为$var1的agent与人名为$var2的theme的会面事件,以及查询人名为$var1的agent所参与的会面事件。这样的查询语句目标明确,在检索中更易于查询系统理解。例如对查询文本(7)Who is Mr.Obama?进行语义分析,得出疑问词who与Mr.Obama是共指关系,TMR映射到human概念上,对(7)的查询解释表达为:搜索名为Mr.Obama的人物信息。在本文设计的查询系统中效果如图2所示。
Fig.2 Query result of object图2 对象查询结果
对(8)WhodidMr.ObamameetwithatWhiteHouse?转换成查询TMR后,映射到事件meet-with上,meet-with的theme为空,查询解释表达为:搜索作为agent的人名为Mr.Obama与作为theme的$var2所参与的会面事件,事件的location为WhiteHouse,结果返回$var2。在系统中查询meet-with事件,效果如图3所示。
Fig.3 Query result of event图3 事件查询结果
查询location为WhiteHouse的事件具有两个“meet-with”事件,分别索引为meet-with1和meet-with2,如图4所示,进一步根据语义搜索事件的关系,就可以得到更多的信息。
Fig.4 Query result of events encompassed same location图4 包含同一地点的事件查询结果
查询检索模块对查询解释模块中构造的查询请求进行处理。首先,检索模块尝试直接查询,如果在事实库或专名库中检索到匹配的事实,则直接返回结果;如果没有直接匹配的事实,则需要激活事件脚本,进行一定的推理,形成事实推理链。这需要系统对更多参与者或事件的背景知识有额外的了解,以本体事件概念为中心考虑语义预设,解决复杂情况的查询推理。在脚本中,语义预设包括了一些前提条件,如果满足事件的前提条件,则可以推断事件本身可能发生。如果推理再无答案,需要调用语义分析模块从开放文本中提取事实,继续获取新的TMR,产生结构化知识添加进事实数据库中。为了实现良好的查询效果,系统必须维护一个足够大的知识库,至少是对领域内知识覆盖率较高,其中应包含关于人物、地点、组织和事件实例的大量事实集合[18]。
对象和事件的查询,系统首先检索到本体概念,然后在专名库或者事实数据库中检索概念的实例项。对事件属性的检索,查询文本中的动词指向了本体中的事件概念,需要在事实数据库中查询相关事件的实例,而查询的具体内容反映在事件概念的属性值中。根据算法描述,可以直接在事实数据库中进行检索,匹配相应的事件TMR。对于复合句的TMR,会产生递归检索,逐层返回结果,最终得到从目标变量开始并以框架中最后相关要素结束的依赖链。
对于没有可以直接匹配的TMR查询,就需要进行本体语义推理。此时,算法将搜索TMR中更多语义属性信息,建立precondition-set。算法检测并补充查询TMR中的语义角色属性和上下位关系,相应的属性关系被记录在precondition-set中。例如要查询Dalai Lama和Lobsang Sangay是否会面meet-with事件的预设要求两个参与者必须同一时间出现在相同的地方(参见meet-with脚本)。根据例句5和6,通过对脚本中come事件效果来推断附加事实,可以得出他们两人在某个时间段内在相同的地方,仅从文本中来看,两个看似不相关的人物因为事件而联系在一起,由此可以推断他们可能会面。语义推理是存在一定概率的,最后推理的概率等于原始查询中概率的数量积。当有新的事实输入时,系统将会更新前提集,修改答案概率。两个人是否会面的判断还需要对参与者的背景有所了解,而这种计算应当来自于更加全面的领域数据或者开放数据。扩展搜索得到的语义属性都被记录在前提集中作为推理的依据,并且更新事实库。例如检索与Dalai Lama有关的信息除了专名库中Dalai Lama的属性信息,还包括他参与的事件,查询效果如图5所示。
Fig.5 Query result of events linked with persons图5 与人物关联的事件查询结果
Fig.6 Query flow chart图6 查询流程
本体语义理论并不反对数据驱动的方法,相反,在一定程度上二者的融合更能够促进语义的发现和推理。数据之间依靠丰富的语义属性建立了联系,从而形成了知识丰富的语义网络[19]。为了获取更多网络实体间的关联关系,需要从大量的领域文本中进行训练推理获得。数据驱动的方法为从大规模语料中学习语言规律提供了支撑,神经网络和分布式词向量较之以前更有利于语义的表示和计算。TransE模型能够直接建立实体向量和关系向量之间的对应语义关系,在给定的实体关系基础上通过TransE训练,可以做知识推理,关系发现,知识补全等应用。通过知识库中大量定义好实体间关系的RDF三元组作为TransE训练数据,TransE基于三元组已有的语义关系,将实体和关系训练成低维实数分布式词向量,这样在向量空间中通过向量间的运算就可以发现隐含的实体和关系。辅助查询模块将新发现的实体和关系作为查询结果反馈给用户,同时对本体语义知识源进行补充,不断丰富知识源,在未来的查询中逐步完善性能。
例如从开放语料中可以获知Dalai Lama是达赖集团的主要领导人,实体关系表示为三元组为(Dalai-Lama,leaderof,Dalai-Group),而Lobsang Sangay是“西藏流亡政府”的噶伦*所谓的“政府总理”。,表示为三元组为(Lobsang-Sangay,leaderof,“Tibetan-Government-in-Exile”),通过TransE训练后Dalai Lama和Lobsang Sangay两个实体向量的语义相似度较高,由此可以看出两人关系密切。如果两人在同一时间段出现在同一地点,则可以推理两人会面的概率很高。
数据驱动的推理过程需要根据查询问题决定推理的概率,控制推理的深度。如果推理太浅,只是一些常识性内容,得不到用户想要的结果;如果推理太深,则会超出预期,反而效果不好。推理的深度需要控制在一定步数以内,即可获得较好的结论。图6描述了本体语义系统查询检索的流程。
查询反馈模块实际上是一个本体语义生成器,作用是将查询返回的TMR生成自然语言文本,返回给用户。它基于TMR对内容进行规范,确定必须表达的内容;根据目标语中的语义依存关系和词汇搭配关系从词典中选择词汇;对句法结构、词汇形态等进行处理;最后对候选语句进行排序,从而生成连贯文本。在生成器未完全实现之前,向用户返回TMR也是可接受的,因为TMR中包含了用户所需的语义要点。
本文为验证查询方法的有效性,在小规模的西藏领域本体库上用本体语义和数据驱动的方法进行查询部分典型知识,对TMR的查询是基于语义信息和语义关系规则的,只要存在于库中的知识就能够得到准确反馈,但是查询算法复杂,受限于知识库的规模,需要进一步开发,不断补充知识;辅助的数据驱动方法能够从大规模数据中获取简单三元组,查询效率较高,平均Hit@10(%)值如表2所示。虽然具有一定的误差,但对于知识库提供了辅助查询作用。
表2 查询数据规模及结果
以Dalai-Lama+visit查询为例,距离最近的China和Beijing是包含在给定的一组输入三元组中的,而US是根据Dalai-Lama与Obama会面等事实推理出来的。Taiwan、France、Canada经查询并未出现在训练集给定关系的三元组中,它们的出现是通过大量的语义计算推理出来的,说明Dalai-Lama与这些国家和地区都有勾连。
基于本体语义的西藏领域知识查询系统完整地设计了从查询、分析、解释、检索和生成的各个模块,包含了基于共享语义知识和数据驱动的推理相结合的方法。整个系统以TMR为意义转换的核心,作为语义分析结果和查询推理的基础,它连接着系统中的每个环节。同时,本体语义查询系统共享语义分析模块和本体语义资源,有效发挥了本体语义系统的作用。数据驱动辅助推理模块能够处理大规模关系数据,并扩展知识资源。基于西藏领域本体的知识查询系统经过部分查询实验,验证了其有效性,并得出结论:(1)对于简单事件、对象的查询基本满足需要,但对于复杂事件的状语成分尚不能做到准确的语义分析;(2)已有知识的检索通过算法可以实现,隐含知识的推理过程比较复杂,而数据驱动的方法效果比较明显;(3)领域内的常识知识对查询有较大影响,应当更多地补充常识。因此,对于典型事件可以获取其TMR存储于知识库中,而对于大量的常识性知识,则可以通过数据驱动的方式获取并选择性地补充进知识库。基于本体语义和数据驱动的方法各有优势,相互补充,既能够比以往的关键字查询包含更多的语义性,又能够克服单一方法的不足,做到有效查询。基于本体语义的查询系统能够对领域内数据自动分析、存储、查询和推理,清晰明确地为相关分析人员提供知识。在大数据条件下,通过知识积累,更能有效地预测人物的动向,事件的发生和人物与事件的关联,这些信息对决策辅助有重要意义。
[1] Nirenburg S,Raskin V.Ontological Semantics (Language,Speech,and Communication)[M].Cambridge:The MIT Press,2004.
[2] Sowa J F.Ontological Semantics by Sergei Nirenburg and Victor Raskin[J].ComputationalLinguistics,2005,31(1):147-152.
[3] Raskin V,Malaia E,Triezenberg K,etal.Ontological Semantic Support for a Specific Domain[D].Columbus:Ohio State University,1994.
[4] Taylor J M,Raskin V,Petrenko M S,etal.Multiple Noun Expression Analysis:An Implementation of Ontological Semantic Technology[C]∥International Multiconference on Computer Science and Information Technology.IEEE,2011:517-524.DOI:10.1109/imcsit.2010.5679858.
[5] Rogushina J.Use of the Ontological Model for Personification of the Semantic Search[C]∥International Journal of Mathematical Sciences and Computing(IJMSC),2016,2(1):1-15.DOI: 10.5815/ijmsc.2016.01.01.
[6] Chiatti A,Dragisic Z,Cerquitelli T,etal.Reducing the Search Space in Ontology Alignment using Clustering Techniques and Topic Identification[C]∥International Conference on Knowledge Capture,2015:1-4.DOI:10.1145/2815833.2816959.
[7] Li Z,Raskin V,Ramani K.Developing Engineering Ontology for Information Retrieval[J].JournalofComputing&InformationScienceinEngineering,2008,8(1):504-505.DOI:10.1115/1.2830851.
[8] Kuznetsov V A,Mochalov V A,Mochalova A V.Ontological-semantic Text Analysis and the Question Answering System Using Data from Ontology[C]∥International Conference on Advanced Communication Technology.IEEE,2016:651-658.DOI:10.1109/icact.2016.7423588.
[9] Hempelmann C F,Raskin V.Semantic Search:Content vs.Formalism[C]∥Rome Proceedings of Langtech,2008.
[10] Nirenburg S,Mcshane M.Computational Field Semantics:Acquiring an Ontological-Semantic Lexicon for a New Language[J].LanguageEngineeringforLesser-studiedLanguages,2009:183-206.
[11] Spartz J M,Malaia E,Falk C.Methodology and Tools for Ontological Semantic Acquisition[C]∥Proceedings of Midwest Computational Linguistics Colloquium,Columbus,CERIAS Tech Report,2005:32.
[12] Fillmore C J.The Case for Case[M]∥Universals in Linguistic Theory.New York:Holt,Rinehart & Winston,1968:1-88.
[13] Johnson-Laird P N.Mental Models:Towards a Cognitive Science of Language,Inference,and Consciousness[M].Cambridge:Cambridge University Press,1983.
[14] Schank R C,Abelson R P.Scrpts,Plans,Goals,and Understanding[J].ReadingsinCognitiveScience,1988:190-223.
[15] Skillen K L,Chen L,Nugent C D,etal.Ontological User Modeling and Semantic Rule-based Reasoning for Personalisation of Help-On-Demand Services in Pervasive Environments[J].FutureGenerationComputerSystems,2014,34(4):97-109.DOI: 10.1016/j.future.2013.10.027.
[16] Bordes A,Usunier N,Garcia-Duran A,etal.Translating Embeddings for Modeling Multi-relational Data[C]∥Proceedings of Conference on Neural Information Processing Systems.Cambridge,Massachusetts: Massachusetts Institute of Technology(MIT) Press,2013:2787-2795.
[17] Beale S,Lavoie B,Mcshane M,etal.Question Answering using Ontological Semantics[C]∥The Workshop on Text Meaning and Interpretation.Association for Computational Linguistics,2004:41-48.DOI: 10.3115/1628275.1628281.
[18] Chiarcos C,Hellmann S,Nordhoff S.The Open Linguistics Working Group of the Open Knowledge Foundation[C]∥Eight International Conference on Language Resources and Evaluation,2012:3603-3610.DOI: 10.1007/978-3-642-28249-2_15
[19] Wood D,Zaidman M,Ruth L,etal.Linked Data:Structured Data on the Web[J].ComputerStandards&Interfaces,2014,36(1):256-262.