袁小群 孙梦婷
[摘 要] 指出出版内容重组是系统根据用户信息需求,从已有的经过碎片化处理的信息资源中选择相关内容组织成符合特定篇章结构的内容产品的过程;目前出版内容动态重组工作尚停留在对碎片化内容资源的关联聚合上,未实现基于篇章结构的重新组织,最终呈现的内容产品缺乏可读性,无法直接服务于用户。因此设计出版内容重组系统,将基于篇章结构的内容组织环节融入动态语义出版当中,对出版内容动态重组的整体工作框架进行完善;设计内容组织模块的功能,通过挖掘更深层次的用户需求和引入文本篇章结构,实施以下内容组织策略:根据深层次的用户意图构建篇章意图结构,将其映射为篇章修辞结构,以此作为出版内容资源组织的框架。
[关键词]出版内容重组 篇章结构 修辞结构理论 篇章组织框架 数字出版
[中图分类号] G237[文献标识码] A[文章编号] 1009-5853 (2019) 02-0098-08
1 引 言
出版内容重组是指系统根据用户信息需求,从已有的经过碎片化处理的信息资源中,选择相关内容并组织成具有特定篇章结构的内容产品的过程。与一般的数字出版相比,出版内容动态重组属于深层次和高级阶段的数字出版:一般的数字出版强调数字化内容加工,而出版内容重组则是对一般数字出版产品进行知识碎片化加工后的按需重组和复用。通过出版内容重组,内容服务提供商可以从已有的出版资源中选择用户需要的内容进行动态组织,如此不仅能实现数字出版物的实时生成,还能为用户提供定制化的内容服务。
出版内容动态重组是对出版内容资源“分解—重组”的复用过程,一般可分为以下几个步骤:出版内容资源的数字化和碎片化处理;碎片化内容的结构化加工;基于用户需求的内容聚合;基于篇章结构的内容重组;内容产品的最终呈现。目前,出版内容动态重组工作主要集中于前期出版内容资源的碎片化加工以及对碎片化内容的关联聚合[1],比较忽视对相关内容基于篇章结构的重新组织,即语义出版物内容与传统叙事性内容的协同工作问题[2]。以英国广播公司为例,其实现按需重组的机制是根据用户的查询式获取语义相关内容,包括利用SPARQL查询调用RDF三元组形式存储的内容、利用推理功能对相关内容进行扩展、调用关联数据并返回相关联内容等[3],但尚未实现对所聚合内容基于篇章结构的重新组织,而这一环节正是生成符合用户阅读习惯的内容产品的重要一步。
内容重组不只是重组内容的简单堆砌,而且需要将其以符合自然语言组织规则的方式呈现给用户。内容重组和内容聚合的区别在于:(1)内容聚合环节所生成的聚合内容需要根据一定的篇章结构进行重新组织,才是内容重组的结果;(2)内容聚合环节基于主题关联方式对用户需求进行表示和挖掘,缺少对更深层次用户意图的表示和追踪,无法满足根据用户层级化的信息查询意图构建长篇幅结构文本的需要。因此,本文借鉴认知科学对“用户需求”这一概念的定义和内涵描述,将用户意图进行分类表示,并给出对应于用户意图的系统任务,在此基础上构建由意图结构及修辞结构组成的篇章结构,作为出版内容资源重组的指导框架。
2 出版内容重组系统架构
出版内容重组本质上需要解决两方面问题:一是重组内容的选择,二是对所选择内容的重新组织。对于前者,一般采用的方案是利用数据关联技术或聚类等方法,根据用户的信息需求,从领域知识库中匹配得到相关的主题知识网络。后者则是目前数字出版和语义出版领域比较忽视的一点,也是本文论述的重点,即如何对上一步得到的相关内容进行基于篇章结构的组织,以为用户提供具有可读性的长篇幅内容产品。从这两方面的功能需求出发,本文设计了如图1所示的出版内容重组系统。
该系统分为3个功能模块:(1)用户模型:通过对用户数据的分析和挖掘,识别用户所处的信息搜索阶段及其对应的用户意图;(2)内容选取:根据用户模型模块分析得到的用户查询主题和用户已有的领域知识水平,通过相似度匹配或数据关联等方法,从领域知识库中匹配得到符合用户需求的主题知识网络;(3)内容组织:根据用户模型模块分析得到的用户意图类型,确定系统目标,据此选择对应的篇章结构框架,并利用所抽取的重组内容对该框架进行实例化,得到初步的文本规划结果。最后,对该结果进行语法、版式等方面的进一步规范,得到最终的内容产品。
2.1 用户模型
阅读是一个解码过程:读者通过识别字母和单词,从底层的最小文本单位(字母和单词)到顶层越来越大的单位(短语、从句、句间连接)进行解析,重建作者的意图和想要表达的意义[4]。出版内容重组则是一个逆向过程,需要从用户意图入手,基于用户意图来抽取用户感兴趣的重组内容、构建对应的内容组织结构,对两者进行融合才能生成最终的内容产品。因此,本文从用户所处的信息搜索阶段和用户意图两个维度对用户需求进行表示:首先通过用户检索式和用户领域知识的挖掘,对用户所处的信息搜索阶段进行分类表示,据此从领域知识库中匹配得到符合用户需求的重组内容;其次,通过用户所处的搜索阶段判断用户意图,将其分解为一系列系统任务,以此作为设计篇章结构框架的依据。
2.2 内容选取
内容选取模块的设计参考了目前发展较为成熟的内容推荐方法[5][6],采用基于语义相似度的知识网络扩展方法:首先,通过聚类、数据关联等方法,将用户查询式所反映的用户查询需求和领域知识库进行匹配;其次,将匹配结果进行排序去冗,得到与用户需求高度相关的主题列表;最后,将用户模型中的用户领域知识水平作为约束条件,对相关主题知识网络的边界进行进一步约束,由此获取符合用户需求的主题知识网络。需要指出的是,这一模块获得的主题知识网络是依据领域知识逻辑组织的,并不符合自然语言组织规则,需要进一步基于篇章结构的重新组织。
2.3 内容组织
在内容组织模块,本文引入修辞结构理论(Rhetorical Structure Theory,RST)[7]这一经典的篇章结构理论。该理论通过描述文本各部分的修辞关系来分析篇章的结构和功能:功能语句(span)是最基本的篇章单位(Elemental Discourse Units,EDU),篇章整体结构可以通过EDU及连接EDU的修辞关系所组成的层级结构进行表示。EDU又可分为核心(nucleus)和衛星(satellite)两种,前者是表示中心信息的单元,具有相对完整的语义;后者则是次要内容,作用于核心部分。本文采用RST理论的原因有3点:(1)RST是一个拥有丰富注释的框架[8][9],也是一个为数不多的对给定文本的意图、修辞关系和层级关系进行统一刻画的篇章结构理论;(2)已有的利用修辞结构树对篇章结构进行分析的研究以及基于RST理论构建所得的结构树库表明,不同主体在RST理论框架下进行的注释保持有较高的一致性;(3)基于RST理论的篇章结构树已经在信息检索[10]、文本摘要[11]、情感分析[12][13]等多个领域得到广泛应用。
本文沿用RST理论对篇章结构的表示思路,即通过描述文本各部分的修辞关系来表示篇章结构和功能。在此基础上,通过两方面的内容来定义篇章结构框架:篇章意图结构和修辞结构。前者是对用户意图的层级化推导,用于增加篇章的连贯性以及篇章组织的可解释性;后者则对应于框架的实例化等操作层面的工作,修辞结构中的最小组成和操作单元是RST理论所定义的修辞关系(Rhetorical Relation)。
虽然数字出版模式早已实现了对出版物内容与形式的分离,语义出版进一步推动了数字出版向内容资源碎片化加工和关联聚合服务模式的转变。但从本质上来看,出版内容资源仍然被封装在以本和篇为单位的文本载体中。受此局限,系统即便能够准确推断出用户需求,其所推荐的内容产品也无法直接服务于用户,用户仍然需要对系统提供的结果进行进一步的筛选和组织。对此,本文提出将基于篇章结构的内容组织引入到语义出版当中,进一步推动个性化内容产品的动态生成。具体来说,本文设计的出版内容重组系统在接收用户请求之前,并不存储完整形态的出版物。只有在用户发出请求后,系统才会根据用户需求选择相应的碎片化内容资源并对其进行基于篇章结构的重新组织,以此生成个性化定制的内容产品。为实现上述功能,上文提及的内容组织模块担负着关键作用,其功能的实现需要重点解决两方面问题:一是对更深层次用户需求的挖掘;二是对文本篇章结构的设计和利用。以下将针对这两方面的功能设计展开更加详细的论述。
3 用户查询意图的表示和识别
针对处于不同情境、面对不同问题、拥有不同目标的用户,识别其信息需求,是内容重组工作的起点。然而在现实中,显式的用户需求信息是稀缺的,用户通常不会也不能准确传达出个人的信息需求。因此,系统需要对隐式的用户行为数据进行挖掘。在此之前,首先需要确定如何对“用户需求”这一泛化概念进行形式化表征,为此本文引入“意图”这一概念。
3.1 信息需求与查询意图
信息需求是指个人或群体定位和获取信息以满足有意识或无意识需求的期望[14]。这一概念最早由罗伯特·S·泰勒(Robert S. Taylor)于1962年[15]提出,他为了回答“一个具有信息需求的人是如何从信息系统中获得答案的?”这一问题,将信息需求划分为4个层次:(1)本能需求(Visceral Need)。对未知信息最高层次的需求,是用户的真实需求,但是往往无法精确表达。(2)意识需求(Conscious Need)。在头脑中对问题有意识的描述,是本能需求的具体化;(3)形式需求(Formalized Need)。对问题合理的、无歧义的、规范的描述。(4)妥协需求(Compromised Need)。提交给信息系统的问题,是用户在与系统交互中受到多种限制而做出的对真实信息需求的简化。这4个层次刻画了用户从本能信息需求出发到最终形成问题,并将查询提交给系统的全过程。用户最终提交的查询并不能代表用户的真实需要,而是用户的妥协需求。因此,系统需要对查询背后的用户信息需求进行推断,即从用户的妥协需求向更高层次需求的探究。“查询意图”就是近似表达用户高层次信息需求的用于机器理解的明确形式,是介于本能需求与妥协需求的一种中间状态,并不断逼近本能需求[16]。
3.2 信息搜索过程阶段模型
遵循泰勒对用户信息需求4个层级的划分,本文引入卡罗尔· C ·库尔梭(Carol C. Kuhlthau)[17]信息搜索阶段模型对“查询意图”进行层级化递进的分类表示,并针对各阶段的用户意图设计相应的系统任务,作为篇章意图结构的顶层构成。
库尔梭将信息搜索过程分为6个阶段:(1)启蒙(Initiation)。认识到对信息的需求:思考问题,理解任务,并将问题与先前的经验和知识联系起来。(2)选择(Selection)。选择和确定要调查的一般主题或要采取的方法:根据个人兴趣、任务要求、可用信息和时间等标准来权衡各个主题,选择最佳主题或方法。(3)探索(Exploration)。调查关于一般主题的信息:扩展个人理解,对主题形成足够的了解,以产生重点关注的焦点或个人观点。需要指出的是,在这一阶段,那些有助于提供新的知识结构的策略(如罗列相关事实以扩展思路)是最有帮助的,而一些急于求成的指示性策略(如针对某一个细节问题进行详细的记录)可能会使信息搜索者产生挫败感而阻碍进程。(4)形式化(Formulation)。根据检索信息形成一个重点关注的焦点主题:从信息中识别和选择观点,形成对主题的聚焦视角。(5)收集(Collection)。收集与关注的焦点主题相关的信息,以定义、扩展和支持焦点主题。(6)呈现(Presentation)。通过对主题的个性化综合来结束搜索,并对结果进行呈现。
3.3 基于任务的用户意图表示
信息搜索阶段模型为识别用户意图提供了初步的分析框架,针对不同阶段任务的特征,本文将各阶段用户意图进一步分解为一系列系统子任务,并将其对应关系罗列如表1所示。
在不同的信息搜索阶段,对应于知识储备不一、信息需求各异的用户(?c),系统需要实现不同的任务,如:让用户知晓(KNOW/KNOW-ABOUT)关于某一主题(?topic)不同层次的信息,包括典型描述方式(?description)、涉及的学科领域(?DISCIPLINARY)、典型研究視角(PERSPECTIVE-OF)、研究方法(METHODS-OF)、关键概念(KEY-CONCEPT-OF)、主要概念(?concept)或命题(?proposition)之间的区别或联系(DIFF/RELA)等。以(KNOW ?c (REF ?topic ?description))为例,该语句表示以下系统任务:让用户知晓(KNOW)关于某一主题(?topic)的典型描述方式(?description)。
3.4 用户意图识别
大量研究表明,通过挖掘用户行为数据可以对用户所处的信息搜索阶段、用户的领域知识水平进行判断。如佩尔蒂·瓦克里(Pertti Vakkari)[18]、佩尔蒂·瓦克里和南纳·哈卡拉 (Nanna Hakala)[19]的研究表明,用户行为在检索的不同阶段不同:检索开始时,用户更多地只使用单词片段;随着检索深入,用户会使用更多同义词和平行概念。赖恩·W·怀特(Ryen W. White)等人[20]指出,用户隐性反馈更可能出现在检索中期,而显性反馈则更可能出现在检索后期。张向敏等人[21]利用多元回归分析方法建立了用户领域知识的预测模型,通过比较发现利用到保存的文档数、检索式平均长度和所打开文档的平均排位这3种变量的模型效果最佳。
总结来说,目前对用户信息搜索状态的预测模型在输入特征项的选择上,最常使用的是时间、检索式、收藏点击保存等行为数据;在预测方法上,普遍采用回归分析方法、贝叶斯模型、决策树模型等。在用户意图识别过程中,本文系统采用类似的预测方法,通过对用户行为数据的挖掘,对用户所处的信息搜索阶段进行识别,以此判定用户信息搜索的意图。
4 篇章结构框架
篇章结构是文本宏观结构的一部分,用于表示包含有作者预期表达意义的文本的逻辑组织形式[22]。当前领域知识库通常采用学科知识逻辑来组织碎片化的内容资源,但系统呈现给用户的内容产品并不符合自然语言的组织逻辑。随着聚合内容体量的增加,缺乏可读性的内容产品不能被用户有效地理解吸收。为此,本文引入“篇章结构”这一概念,对主题知识网络进行重新组织。在上文对用户意图进行形式化表示的基础上,本文设计了用于内容组织的篇章结构框架,包括意图结构和修辞结构两个部分。前者用于增加篇章的连贯性和篇章组织过程的可解释性,后者用于对接框架的实例化等操作层面的工作,由RST关系作为最小单位组成。
针对6个信息搜索阶段,本文设计了相对应的篇章结构框架。如表2所示,该结构包含6个部分:框架名称,框架信息,用户意图,系统目标,由系统目标分解得到的篇章意图结构,由意图结构映射所得、由RST关系组成的篇章修辞结构。以“启蒙”阶段为例,其篇章结构框架如表2所示。
4.1 篇章意图结构
凯瑟琳· R ·麦克考恩(Kathleen R. Mckeown)[23]指出,自然语言在实现某一交流目的时往往遵循特定模式,如说话者在描述一个对象时通常采用以下策略:(1)将该对象归为某一类别,提供该类别成员典型的属性和功能信息;(2)提供该对象的类比、成分、属性等额外信息;(3)通过举例进行说明。本文对该种策略进行形式化表征,将其定义为篇章的意图结构。在具体操作层面上,本文将系统目标分解为对篇章核心和卫星片段的任务要求,并引入目标增长点(growth point)[24]对其进行任务的层级分解,将最终形成的整体层级结构作为语义约束条件来增加所组织篇章的连贯性,该整体层级结构即为篇章意图结构。
以表2的“启蒙”框架为例,为了实现“明确信息需求”这一用户意图,系统需要实现“给出不同学科领域(?DISCIPLINARY)对该主题(?topic)的概念化表述(CONCEPTUALIZATION)”这一系统目标。该系统目标可进一步分解为“对该问题的形式化表达:(KNOW ?c (REF ?topic ?description))”“该问题涉及的学科领域:(KNOW ?c (DISCIPLINARY-OF ?topic))”“某一个领域对该问题进行概念化的操作方法:(KNOW ?user (OPERATIONALIZATION-OF(CONCEPTUALIZATION ?topic ?DISCIPLINARY)))”这三个核心片段的子目标。子目标进一步衍生出更为细节的目标增长点,包括:该领域对该问题操作化方法的情况说明、成分、属性、目的等任务。最终形成“用户意图—系统目标—目标增长点”这一层级树状结构,即为对应于该信息搜索阶段的篇章意图结构。该结构中的节点表示子目标或目标增长点,节点间的连接表示目标间的层级关系。
4.2 篇章修辞结构
篇章意图结构各层级的系统任务体现了系统和用户交互过程中的交流目的,不同交流目的又可映射为不同的修辞模式。篇章的修辞结构由RST关系组合而成,是篇章结构框架的操作化接口。RST關系作为连接篇章核心和卫星片段的连贯关系,可从4个方面进行表示:(1)对核心片段的约束(constraint);(2)对卫星片段的约束;(3)对核心片段和卫星片段联结(combination)的约束;(4)效果。以“总结关系(Summary)”为例,它的定义如下:(1)核心(N)受到约束:N的单位必须大于1;(2)卫星(S)无约束;(3)核心+卫星的约束:S复现N的内容,但更简短;(4)效果:读者识别出S是对N的简要重述。
通过篇章意图结构节点与RST关系“效果”部分的匹配,可将篇章意图结构映射为修辞结构。同样以表2的“启蒙”框架为例,其篇章意图结构中的核心片段目标增长点可映射为Circumstance、Elaboration、Purpose、Antithesis、Cause等RST关系,即通过调用Circumstance、Elaboration、Purpose、Antithesis、Cause等RST关系,对某一领域某一问题的操作化方法展开环境及情况说明,属性、成分等子信息补充,目的阐述,带有情感偏向的案例对照说明,原因阐释等。
5 基于篇章结构框架的文本规划
本文设计的内容组织策略是根据深层次用户意图构建篇章意图结构,将其映射为篇章修辞结构,以此作为框架对出版内容资源进行重新组织。在上文对篇章的意图结构和修辞结构进行定义的基础上,本节将对基于框架的内容资源组织环节的具体步骤进行说明,即图1内容组织功能模块中文本规划器的具体工作机制。
文本规划器担负着将重组内容和篇章修辞结构进行融合,以生成初步成型的内容产品的功能。这一过程首先需要对篇章结构框架进行选择,通过不同框架和用户所处信息搜索阶段之间的匹配来实现。其次,需要对这一篇章结构框架进行实例化,即从相关主题知识网络中搜寻符合条件的输入元素,对篇章修辞结构的信息槽(slot)进行填充。文本规划器的工作机制可表述为如图2所示的步骤:(1)根据篇章意图结构各层级的子目标节点,利用SPARQL查询从相关的主题知识网络中调用以RDF三元组形式存储的内容作为文本规划器的输入元素;(2)根据RST关系和篇章意图结构之间的映射關系,将篇章意图结构转化为篇章修辞结构;(3)文本规划器检查输入元素和篇章修辞结构中各层RST关系的核心约束及卫星约束的匹配情况,以深度优先或宽度优先的方式对修辞结构树的节点进行扩展;(4)重复第3步,实现每个新激活的增长点目标,并将实例化的RST关系添加到目标篇章树结构当中;(5)在所有输入元素都被使用,或所有系统目标都得到满足的情况下,目标篇章树的结构化过程结束;(6)以深度优先、从左到右的方式遍历树,将关系的特征线索词或短语添加到适当的信息槽中,并将结果传递给语法规范器和版式规范器进行进一步优化。
综上,在本文第4部分所定义篇章结构框架的基础上,系统根据篇章意图结构从相关主题知识网络中匹配得到文本规划器的重组内容输入量,通过将篇章意图结构映射为篇章修辞结构得到文本规划器的篇章组织结构输入量。文本规划器在得到输入量后,基于RST关系的约束条件将两者进行匹配,对RST关系进行实例化并添加到目标篇章树中。满足终止条件所得到的目标篇章树结构即为符合特定篇章结构的内容重组形态,对其进行语法和版式优化,即可得到重组后的内容产品。
6 总 结
出版内容动态重组不仅是对相关内容的简单聚合,而且需要将重组内容以符合自然语言组织规则的方式呈现给用户。本文提出的出版内容重组系统,旨在实现对一般数字出版产品知识碎片化后的按需重组和复用,将目前数字出版和语义出版领域对内容资源的碎片化加工及聚合工作,进一步拓展至基于篇章结构的内容组织,实现出版内容动态重组整体工作框架的进一步完善。文本重点论述两个关键的系统功能设计:一是对更深层次用户需求的挖掘;二是对长篇幅篇章结构的表示和操作设计。对于前者,本文借鉴认知科学对用户需求的内涵描述,将用户需求、用户意图和系统目标进行关联,实现对用户意图的形式化表示;对于后者,本文引入计算语言学领域面向文本自动生成系统的篇章结构理论,从意图结构和修辞结构两个方面对篇章结构框架进行定义,并在此基础上对文本规划的工作机制进行说明。
注 释
[1]李楠,孙济庆,马卓.面向学术文献的语义出版技术研究[J].出版科学,2015,23(6):85-92
[2]王晓光,宋宁远.语义出版物的内容组织架构研究:基于纳米出版物和微型出版物的比较分析[J].出版科学,2017,25(4):20-27
[3]王莉莉,栾冠楠.英国广播公司(BBC)动态语义出版模式研究[J].图书情报工作,2017,61(8):126-132
[4]Zhang X Y. The Effects of Formal Schema on Reading Comprehension:An Experiment with Chinese EFL Readers[J]. Computational Linguistics and Chinese Language Processing, 2008, 13(2):197-214
[5]李吉,黄微,郭苏琳.一种基于相似度和信任度融合的微博内容推荐方法[J].图书情报工作,2018,62(11):112-119
[6]梁婷婷,李春青,李海生.基于内容过滤PageRank的Top-k学习资源匹配推荐[J].计算机工程,2017,43(2):220-226
[7]Mann W C, Thompson S A. Rhetorical Structure Theory: Toward a functional theory of text organization[J]. Text & Talk, 1988, 8(3):243-281
[8]Prasad R, Dinesh N, Lee A, et al. The Penn Discourse TreeBank 2.0[C]// International Conference on Language Resources and Evaluation, Lrec 2008, 26 May - 1 June 2008, Marrakech, Morocco. DBLP, 2008:2961-2968
[9]Zhou Y, Xue N. The Chinese Discourse TreeBank: a Chinese corpus annotated with discourse relations[J]. Language Resources & Evaluation, 2015, 49(2):397-431
[10]Kuyten P, Bollegala D, Hollerit B, et al. A Discourse Search Engine Based on Rhetorical Structure Theory[C]// European Conference on Ir Research, ECIR 2015, Vienna, Austria. 2015:80-91
[11]Ibrahim A, Elghazaly T. Improve the Automatic Summarization of Arabic Text Depending on Rhetorical Structure Theory[C]// Mexican International Conference on Artificial Intelligence. IEEE, 2014:223-227
[12]Chenlo J M, Hogenboom A, Losada D E. Rhetorical Structure Theory for Polarity Estimation: an Experimental Study[J]. Data & Knowledge Engineering, 2014, 94(PB):135-147
[13]Fu X, Liu W, Xu Y,Yu C,Wang T. Long Short-term Memory Network over Rhetorical Structure Theory for Sentence-level Sentiment Analysis[C].JMLR: Workshop and Conference Proceedings,2016, 63:17-32
[14]Baeza-Yates R. The intention behind web queries[C]// International Conference on String Processing and Information Retrieval. Springer-Verlag, 2006:98-109
[15]Taylor R S. The process of asking questions[J]. Journal of the Association for Information Science & Technology, 1962, 13(4):391-396
[16]宋巍. 基于主題的查询意图识别研究[D]. 哈尔滨:哈尔滨工业大学,2013:4-7
[17]Kuhlthau C C.Inside the search process: Information seeking from the user[J]. Journal of the American Society for Information Science & Technology, 1991, 42(5):361-371
[18] Vakkari P. A theory of the task‐based information retrieval process: a summary and generalisation of a longitudinal study[J]. Journal of Documentation,2001,57(1):44-60(17)
[19] Vakkari P, Hakala N. Changes in relevance criteria and problem stages in task performance[J]. Journal of Documentation, 2000,56(5):540-562
[20]White R W, Ruthven I, Jose J M. A study of factors affecting the utility of implicit relevance feedback[C]// ACM, 2005:35-42
[21]Zhang X, Liu J, Cole M, et al. Predicting users' domain knowledge in information retrieval using multiple regression analysis of search behaviors[J]. Journal of the Association for Information Science & Technology, 2015, 66(5):980–1000
[22]Sharp A. Chinese L1 Schoolchildren Reading in English: The Effects of Rhetorical Patterns[J]. Reading in A Foreign Language, 2002, 14(2):111-135
[23]Mckeown K R. The TEXT system for natural language generation: an overview [C]// The Proc. of the Meeting of the Association for Computational Linguistics. 1982:497-511
[24]Hovy E H. Automated discourse generation using discourse structure relations[M]// Natural language processing. MIT Press, 1994:341-385
(收稿日期: 2018-11-15)