张 莉
(北京外国语大学,北京 100089)
对日语自由会话中谈话结构的预测
——以表因果关系的接续词为中心
张莉
(北京外国语大学,北京100089)
摘要:以”だって”“から”等接续表达来明示在会话中有因果关系的前项和后项的情况为研究对象,探讨这种因果关系在会话中一般会伴随什么特征出现。通过探讨得到几个观察结果,然后用自由会话语料库进行验证,最后确认的确存在这些特征。此研究得出因果关系的原因项和结果项的顺序关系是依赖接续助词来表示,以及原因项和结果项是有邻接性的结论,这将成为通过机械处理来理解谈话的一个线索。
关键词:自由会话;谈话结构;因果关系;接续词
一、序论
对于如何理解日语会话,上下文关系的认识是一个重要因素。一般在日语中,为了明确表示上下文关系,多用表顺接、逆接、话题转换、因果关系的接续(助)词。因此,认清包含接续(助)词的发话和与其构成对话的发话之间的关系,是理解谈话的基础。
在论说文等书面语中,有使用由接续词和指示代词等构成的接续模式进行文本结构分析的方法[1][2],还有关于会话中表示提问-回答的发话组的认识的研究[3]。本研究将以“だって”“から”等接续表达来明示在会话中有因果关系的前项和后项的情况为研究对象,探讨这种因果关系在会话中一般会伴随什么特征出现。然后把探讨结果用语料库(未设定主题的自由会话语料库)来进行验证。这种和句子的意思相关的连接关系,Hobbs对除因果关系及其他几种情况进行过论述,本研究以由接续表达明示了原因项和结果项的连接关系的情况为主要研究对象。另外本研究使用的会话语料主要利用语料库(图1),此语料库为把大学里社团聚会时录下的闲谈(未设定主题的自由会话)改写成的文本,共包含1980个发话。在改写时进行了(1)说话断开处的标示①,(2)会话内容的切分,(3)对说话人和听话人信息的追加,(4)对说话结束时的语调信息的追加。例如:在「O→Pあのね、これでもいいじゃん↘」这句话,表示说话人是“O”听话人是“P”,句末的语调是降调的发话。另外,在这个语料库中使用了表示因果关系的接续词“だから/だって”及接续助词“ので/から/のだから/のだもの”,本论文将以此为焦点进行考察。以下为语料库的示例:
会话24
(1)O→Pあのね、これでもいいじゃん↘
(2)P→Oわかった↘
(3)O→Pえ―、嘘で言ったんだよ↘
(4)E→O何↗
(5)O→Eだって、牛乳入れろって言ってたらさ↘
(6)G→G何か酒飲みたいな―↘
(7)K→Gあっ、ありますよ。↘
(8)G→Kそれ何↗
(9)E→Gモルツ↘
(10)P→Gウイスキー↘
(11)E→Gうまいよ↘
二、表示因果关系的发话性质
(一)接续表达对发话顺序的影响
在本研究使用的语料中,把表示因果关系的接续表达,包括接续词“だから/だって”,接续助词或其相当的表达“ので/から/のだから/のだもの”②作为研究对象。首先看这些词在谈话中如何表示前后项的因果关系。
例(1)是使用了接续助词类的一个发话。
(1)a.A→Bこのお酒、とてもおいしいんだから↘
b.A→Bとりあえず、飲んでご覧なさいよ↘
此例显示,接续助词类表示含此类词部分的发话是因果关系的前项。与其对应的结果在例(1)中是在原因的后面。但其顺序也能如例(2)颠倒过来也可以。
(2)a.A→Bとりあえず、飲んでご覧なさいよ↘
b.A→Bこのお酒、とてもおいしいんだから↘
在表示因果关系的复句中,主句和复句的倒置现象会频繁发生,上述现象也属于此类。(1)(2)都能表示因果关系。
以上的考察可以总结如下:
总结1由接续助词类表示的因果关系中,表示原因的发话和表示结果的发话的顺序关系既有可能是(1)原因→结果,也有可能是(2)结果→原因。
接下来我们看使用接续词的情况。用接续词表示关系的发话,基本上是含有接续词的发话和位于其前方的发话[4]。例如含有“だから”的发话例(3),含有“だって”的发话例(4)。
(3)a.A→Bとてもおもしろい落語だったのよ↘
b.A→Bだからすごく笑っちゃった↘
(4)a.A→Bすごく笑っちゃった↘
b.A→Bだって、とてもおもしろい落語だったのよ↘
这样看来,含有“だから”的发话表示结果,含有“だって”的发话表示原因。但无论哪个都能体现出含有此接续词的发话和位于其前方的发话的关系。发话顺序的话,“だから”是不能颠倒的。如果把(3)的发话顺序颠倒改为(5),就不能得出(5)a的原因是(5)b这个结论。
(5)a.*A→Bだからすごく笑っちゃった↘
b.*A→Bとてもおもしろい落語だったのよ↘
但含“だって”时,如(6)所示,原因和结果的顺序即使颠倒也仍可以表示因果关系。
(6)a.A→Bだって、とてもおもしろくって↘
b.A→Bすごく笑っちゃった↘
这种情况,可以解释为(6)a作为原因,(6)b作为结果的因果关系。这也是受以下因素影响。
①“だって”是表示因果关系中原因的标识。如(6)一样交换顺序后,就变成“原因→结果”的发话顺序。
②含有“だって”的发话以连用形结束,可以解释为“由连用接续表示的因果关系”。
关于前者,和含“だから”的情况相比,(3)使用“だから”表示的因果关系像(5)一样交换顺序后,就会变成“结果→原因”的发话顺序而解释不通。“だって”并不是如此。关于后者,如(7)一样使用接续助词类就更加清楚了。
(7)a.A→Bだって、とても面白いんだもの↘
b.A→Bすごく笑っちゃった↘
这种场合,在表示前项和后项的关系上主要发挥作用的是连用接续和接续助词类。可以认为“だって”发挥了强调含有“だって”的发话是因果关系中原因项的作用。另外由于含有“だから”的发话是因果关系的结果项,因此(8)中即使使用了连用接续,也不可能把两个发话理解为因果关系。
(8)a.*A→Bだから、すごく笑っちゃって↘
b.*A→Bとても面白い落語だったのよ↘
通过上述考察,就接续词表示的因果关系,作如下总结:
总结2接续词“だから”表示的因果关系中,按“A.だからB”的顺序发话,A是原因,B是结果。此顺序不能颠倒。接续词“だって” 表示的因果关系中,按“A. だってB”的顺序发话,A是结果,B是原因。如果此顺序是以B的连用形结束,或者以表示因果关系的接续助词类结束时,可以颠倒成“だってB.A”的顺序。这时因果关系主要由连用形或接续助词类表示,“だって”起强调含有“だって”的发话是因果关系中原因项的作用。
(二)原因项和结果项的邻接性
接下来探讨因果关系前项和后项的距离以及各自发话人的关系。首先,发话间的距离中最基本的情况是前项和后项邻接的情况,例如:
(9)a.A→Bこれ、飲んでよ↘
b.A→Bおいしいから↘
(10)a.A→B飲みすぎてしまった↘
b.A→Bだから、頭が痛くてたまらないんだ↘
此时两个发话的发话人没有必要是同一个人。例如(9)像(11)那样发话时,可以解释为“A和C劝B”的情况。
(11)a.A→Bこれ、飲んでよ↘
b.C→Bおいしいから↘
而且,在(12)中可以理解为有“A和B一起喝了酒”的前提。
(12)a.A→B飲みすぎてしまった↘
b.B→Aだから、頭が痛くてたまらないんだ↘
作为结论,对于前项和后项的发话间的距离,可以总结如下:
总结3在表示因果关系的原因项和结果项的发话,在谈话中是相邻出现。此时各发话的发话人可以是同一人也可以不是同一人。
但是含有接续词或接续助词类的发话与其对应的发话不邻接的情况也是存在的。大致可以分为以下几种情况:
①前项或者后项或者两项都是由多个发话组成的情况;
②表达前项和后项的发话之间,存在提问或者表示同意的发话;
③虽然不存在直接对应的发话,但从发话的意义和前提可以间接判定因果关系的原因项和结果项的关系。
先举代表①的一例。
(13)a.A→B飲んでみて↘
b.A→B美味しいんだから↘
c. C→Bそんなにアルコール強くないから↘
(13a)和(13b)是表示因果关系的邻接发话组,但(13a)和(13c)虽然没有邻接,但可以解释为因果关系。这是因为(13b)和(13c)是表达原因项的一个发话组。此发话组和表示结果项(13a)是处于邻接位置。
另外作为①的例子,(14)是结果项由多个发话组成的情况。
(14)a.A→B後片付けは我々がやっておくから↘
b.c→B心配しなくていいよ↘
c. A→Bもう帰ってもいいよ↘
这种情况可以理解为(14b)和(14c)一起表达结果项,原因项是(14 a)。
再看代表②的一例(15)。
(15)a.A→Bもう帰る↘
b. B→Aどうして↗
c. A→Bだって、もう疲れたよ↘
在此例中,表面上(15a)和(15c)表示因果关系,之间的(15b)是对(15a)的提问。这是省略了“B→Aどうしてもう帰るの↗”后半部分的提问。因此(15c)可以看作是把(15b)省略部分作为结果项的原因项。即对于作为因果关系原因项的(15a)(15b),(15c)是结果项。
另外,②在形式上的特点是“提问句后邻接含接续表达的发话”,但也存在例外。在含有“だから”的发话前方邻接表示提问的发话,如例(16)。
(16)a.D→A明日は打ち合わせがあるんですよね↗
b. A→Dそうだよ↘
c.C→Aえっ↗
d.A→Cだから、明日は打ち合わせだってば↘
在和表示提问的发话邻接这点上(15)和后面的(18)一样,如果假设(16)是表述因果关系时,含有成为(16d)原因项的发话就不会出现,从(16c)也不可能进行推测。实际上在这个例子中(16d)是对(16c)的发话人表示责怪的态度,含有“之前应该说过,难道你不记得了吗?”的意思。因此可以认为不是关于因果关系的发话[5]。对此可以总结如下:
总结4对表示提问的发话,含有“だから”的发话与此邻接时,含有“だから”的发话有时也和因果关系没有关系。
再来看②的另外一种情况。
(17)a.A→Bもう疲れた↘
b.B→Aそうだね↘
c.A→Bだから、帰るよ↘
在此例中,表面上(17a)(17c)表示因果关系,(17b)是对(17a)内容的同意。此发话可以改说成“B→Aそうだね、私ももう疲れた↘”,可以看成含有(17a)的意思。因此因果关系的原因项内容在(17a)(17b)中都含有,其结果项内容在(17c)中被表述。
因果关系的原因项或结果项内容包含在多个发话中时,我们把其定义为发话群,即:
定义1因果关系的原因项或结果项内容包含在多个发话中时,我们称其为发话群。此时发话群中表达原因项或结果项意义的发话一定含有1个以上。
在上述例句中,(13b)和(13c)是表示原因项的发话群,通过双方的发话原因项的意义内容被明示。另外(15a)(15b)是表示结果项的发话群,(15a)明确表示了结果项的意义。(17a)(17b)也是表示原因项的发话群,(17a)明确表示了原因项的意义。通过上述考察,我们可以把总结3换成如下说法:
总结5因果关系的原因项及结果项在谈话中明确表示出来时,有以下几种构造的可能性。
(1)原因项和结果项分别用一个发话表示,且邻接。
(2)原因项或结果项用一个发话表示,另一方用发话群表示,且邻接。
(3)原因项和结果项都用发话群表示,且邻接。
另外所有情况中,对原因项和结果项的发话人没有限制,原因项和结果项的发话人可以是同一人也可以不是。
与此相对,如③所说,虽然不存在直接对应的发话,但从发话的意义和前提可以间接判定因果关系的原因项和结果项的关系。例如(18)中,通过(18a)可以推导出“Bが飲んでいない”或者“ Bが飲むことをストップしている”的前提。以此为结果项,可以解释为(18b)叙述了因果关系的原因项。
(18)a.A→B今日はもう飲まないの↗
b. B→Aだってもう眠いし↘
这个是对提问的回答,在这点上和(15)相似;但(15)中(15a)明示了因果关系的结果项内容,(18)中(18b)的结果项的内容没有明确表示出来,在这个不同点上应该区别对待。另外在此例中通过“提问-回答”这一形式,比较容易成为理解前项和后项关系的线索的发话。但是对“周囲の人はお酒を探している”等这类发话,会产生“ここにお酒がたくさんあるから”这类发话。这种情况有必要通过发话场景和上下文关系推测因果关系是否存在。
如上,接续词或接续助词类运用在谈话中,并由此明示了因果关系的原因项和结果项的情况,可以观察到总结1-总结5的现象。对此,在下节中将用语料库进行验证。
另一方面,对含有接续词或接续助词的发话,有时也要根据发话的含义或者前提推测与其对应的原因项或结果项。此现象在本论文中不作为研究对象。
三、运用语料库的验证
本节在前面论述的基础上,对实际会话中出现的发话组用语料库进行调查。此语料库由1980个发话构成,含有表因果关系的接续词“だって”“から”,接续助词类“ので/から/のだから/のだもの”的发话有121个。除去“頼むから、もう撮るのをやめてください”这类平常的复句16例的105例中,因果关系的原因项和结果项明确表示出来的有61例。我们把这61例进行如下分类。
根据总结1和总结2,原因项和结果项的位置关系有以下几种:
(a1)原因项.だから―结果项.
(b1)原因项―接续助词.结果项.
(a2)结果项.だって―原因项.
(b2)结果项.原因项―接续助词.
(a3)だって―原因项.结果项.
根据总结5,原因项和结果项及各自发话人有以下几种情况:
(A)原因项和结果项都是用邻接的一个发话发达,且发话人为同一人。
(B)原因项和结果项都是用邻接的一个发话发达,发话人为不同的人。
(C)原因项或结果项是一个发话群。
而且(C)还可以做如下细分:
(C-α)原因项或结果项由多个发话构成。
(C-β)在表原因项和结果项的发话之间,存在提问或表同意的发话。
分类结果总结为表1。
表1 存在因果关系的发话的分类
从统计结果来看,我们可以得出以下结论:
第一,根据总结1和总结2,对原因项和结果项的位置关系分类的结果,用例最多的是(b2),有32例;其次是(a2)有15例。表示因果关系的复句中,结果项一般由主句表达,在这里为了突出重点可以看到主从句倒置的现象,即(b2)。另一方面,由接续词表达的因果关系中,接续词位于原因项和结果项之间的(a1)(a2)是最普遍的现象。与此相对,接续词没有明确出现在原因项和结果项之间,仅仅满足原因项→结果项这一顺序的(a3)类只有一例(19)。正如在总结2所述,因果关系主要在(19c)的「「ちくしょう、ばれたか」って出てきて、『は↗』って」部分的接续表达被表述。
(19)a.B→Eあ、テッチャンその場にいたか↘
b.B→Eなんだ↘
c.E→Gだって、だれも気づいていないのに、いきなり平賀電信柱の陰から「ちくしょう、ばれたか」って出てきて、『は↗』って↘
d.E→Gすっげー面白かった↘
第二,关于原因项和结果项的邻接性,根据总结5进行分类后,(A)有33例(B)有12例(C)有16例。即“两个发话邻接,且发话人为同一人”这种有助于认识到因果关系因素重叠的情况是最多的。另外,61个用例中,虽然因果关系被认识,但原因项和结果项位置上不邻接的用例可以全部分到(C-α)和(C-β)中。而且根据定义1中说到的发话群的因素,如果因果关系的原因项或结果项在发话或发话群众明示,那么从实际的语料库来看也可以说是属于邻接关系。
我们对上述分类排除在外的44个用例也进行了大概的分类。
(1)根据发话场合或前提,可以推定为因果关系的情况:18例。
(2)不可能推定或认定为因果关系的情况:26例。
这里给(1)的一个用例。
(20)a.J→B柿だけ食べてるの↗
b.B→Jいや、向こう豆ばっかあるからさ↘
此例和(18)一样,从(20a)可以推导出有「柿だけ食べている」这样一个前提,对此(20b)在叙述理由。
另外属于(2)的用例中,总结4被确认的用例有4个,这里举其中之一(21)。
(21)a.F→A肝試しとか騒いじゃいけないって意味じゃないんですか↗
b.A→Fそうそうそう↘
c.M→Aはい↗
d.A→Mだから、肝試しとかうるさくするなってことだと思う↘
在本次运用的语料库中,表示提问的发话后邻接含“だから”的发话的情况,全部属总结4,且被确认。
以上研究结果总结为表2。从此表可以看出在本次运用的语料库中,以含有接续词或接续表达的所有发话为对象,总结1、总结2、总结5所述的所有情况占50.4%。
表2 语料库中发话例的分类
四、 结论及今后的课题
本研究以通过接续词或接续助词明示了因果关系的发话为研究对象,对谈话中原因项和结果项明示的情况会出现什么样的语言现象,进行了观察和探讨。得出总结1-总结5的结论。特别是在总结5中,导入定义1中的“发话群”,指出因果关系的基本构造是处于邻接关系。随后,用语料库对上述考察进行了验证。另外,虽然本次验证工作时纯人工作业,但它对最终构建自动谈话理解系统是有帮助的。
但由于存在不能直接推断为因果关系的情况,而仅通过发话表面信息很难锁定这些情况。这在构建综合性谈话理解系统时是有待探讨的问题。
注释:
①说话的断开处原则上是和说话人交换角色时。会话参与者,如果判断发话断开了,那无论有没有说话人角色的交换都认为是说话断开处。此时,发话之间平均有0.5秒的停顿。
②此后把这些词统称为“接续助词类”。
参考文献:
[1] 福本淳一,安原宏.文の連接関係解析に基づく文章構造解析[J].情報処理学会研究報告,1992,92-NL-88:9-16.
[2] 田中智博,林良彦.文のパターンに基づく日本語テキスト構造の解析[J].情報処理学会研究報告,1992,92-NL-89:1-8.
[3] 高桥敦子,柏岡秀纪,平井城,北桥忠宏.発話対の認識手法について―質問とその応答[J].情報処理学会研究報告,1993,93-NL-94:17-24.
[4] 三上章.現代語法序説[M].日本:くろしお出版,1972.
[5] 白川博之.理由を表さない「カラ」[C] .複文の研究,日本:くろしお出版,1995:189-219.
(责任编辑:寇晓辉)
A Method of Discourse Structure Prediction in Japanese Task-Free Conversation for Causal Conjunction
ZHANG Li
(Beijing Foreign Studies University,Beijing100089)
Abstract:When we have a conversation,we often use conjunctions such as the words “an intention of utterance” or “a stream of discourse” as a sign of causal relation,change of topic,etc.Here,we discuss a case where causal conjunctions are used in Japanese task-free conversations by examining our corpus of causal conversation, and show how to identify relations, represented by these conjunctions,among a few adjacent sentences systematically.
Key words:Japanese task-free conversation; discourse structure;causal relation; Japanese conjunction
中图分类号:H369.9
文献标志码:A
文章编号:1009-2080(2016)01-0055-06
作者简介:张莉(1983-),女,土家族,湖北宜昌人,三峡大学外国语学院讲师,北京外国语大学在读博士研究生。
基金项目:三峡大学2012年青年科学基金项目“高级日语学习者在口语中对日语接续表达的使用实态考察研究”(项目编号:KJ2012A010)。
收稿日期:2015-12-07
doi:10.3969/j.issn.1009-2080.2016.01.014