郭 喨
[提要]性别是否会影响人类的意图和道德判断?为考察性别、意图与道德判断的关系,通过218个样本的实验,发现:(1)“危害”与“改善”的意图之间存在显著的不对称。在统计学意义上证明“诺布效应”在中国文化语境中依然成立。(2)无论被试具体性别如何,都存在将结果的道德性纳入到意图中进行考量的特点。(3)男性、女性在意图相关的道德判断上有所不同,无论是“危害”还是“改善”情境,男性对“有意性”的判断均显著高于女性,男性可能对“意图”的认定有着更为宽松的标准。可见,至少男性和女性的部分“道德判断”不尽相同,“性别”在我们的道德判断中扮演了一个不容忽视的角色。
意图与责任之间有着怎样的关系?这很早就引起了人们的兴趣。
责任(Responsibility)通常被视为伦理学的核心概念。从词源的角度看,它源于拉丁语中的respondere,本义为“回应”或“回答”。[1](P.24)不过,从日常生活经验的角度合理推测,它应该很早就在我们人类祖先的部落生活中扮演着重要角色:失手放走了合围的兔、怎样分配打到的鹿,“责任”必然要出场。“意图”(Intention)则是哲学中另一个经典的主题。在此,我们暂不关心意图被“加括号”悬置的方式,只在一种“民间心理学”(Folk Psychology)的意义上使用“意图”一词。①我们将报告公众对特定行动的“有意/无意”之“意图”的判断,它对“责任”的归属和道德判断具有重要影响。
实验哲学家约书亚·诺布(Joshua Knobe)在2003年率先提出了人们对“有意行动”的判断不对称的现象[2][3],这引起了哲学界广泛注意,以致于该现象在后续研究中也被称作“诺布效应”(Knobe effect)②。诺布效应是一种“道德效价影响行为意图判断的现象”,一般被视为“道德判断对意图的反作用”即“坏结果的有意性”规律:
当结果是好的时候(help condition),人们倾向于认为实施者是无意而为的;当结果是坏的时候(harm condition),人们倾向于认为实施者是有意而为的。
诺布效应自提出以来得到了多重验证,“有更多的研究利用与Knobe该研究类似的材料证实了该现象的稳定性和显著性”:从发生学角度看,人类儿童4岁就开始表现出这种判断的不对称性;从跨文化角度看,印度人也具有此种不对称判断。[4](P.92)就整体而言,中国文化之外的实证经验证据广泛支持了这一结论。
由于意图与道德判断的密切关系,我们决定在东方文化环境中对道德判断相关要素进行实证考察。此前国内杨英云等曾进行过一次考察,并且获得了一些有益的结论:
(1)诺布效应也适用于中国语境,行为的性质会影响人们的道德判断;(2)“坏的结果”情况下,道德义务和道德责任起主要作用;“好的结果”情况下,出生地、专业、道德义务等起主要作用;(3)道德责任判断影响意图判断,道德责任判断视角可以解释诺布效应的产生。[5](P.34-36)
同时,我们也发现该研究存在一些明显的局限。作者“采用当场发放问卷并回收”的方式(推测应为纸质问卷)获取数据,全文未交待对问卷内容进行随机化处理,因此几乎不可避免会受到顺序效应的影响。特别是作者全文分析未报告样本具体数量而只报告了“总量”(“问卷共分为六种”,被试“共480名”),可能导致推出关键结论的具体样本量偏少而影响信度。③另一方面,选择出生地等因子略显随意,“出生地”的影响几乎可以确定为假阳性结果。以上那些操作不符合严格的统计要求,可能也不满足实验哲学的实证标准。
因此,我们决定另行展开实际样本容量更大的实证,对中国语境中的效应进行符合统计标准的考察。我们进行了样本总量为218的实证研究,样本中性别分布为:男性71名,占比32.57%,女性147名,占比67.43%;年龄分布以青年为主,19-25岁的居多数,共188名,占比86.24%;被试学历背景以本科或在读本科为主,计152名,占比69.72%;被试的高中知识背景中,文科、理科正好各占一半,各有109名占比50%。为了便于与西方语境的实验直接比较,研究采用的案例是诺布效应经典版[2]。所有被试同时参与了两个测验(“危害版”与“改善版”),实验中对两个版本中的选项进行了随机化处理以避免“顺序效应”的影响。实证通过“问卷星”(www.sojump.com,当前网址已更改为www.wjx.cn)具体实施。除了以更大的样本检验诺布效应在中国语境中是否成立这一“定性”之外,也进一步定量了考察对应主体需要“负责”或者“载誉”的强度——这是诺布效应的“定量”维度;还将考察性别对意向性的影响,后两者此前未见文献报道。
具体问卷如下:
危害版(版本A)
一位公司的副总裁到董事长面前,说:“我们正在考虑开始一项新的计划。它将帮助我们增加利润,但它也会危害环境。”
董事长回答:“我才不管什么危不危害环境。我只想获得尽可能多的利润。让我们开始这项计划吧。”
他们开始了这项新的计划,环境果然被破坏了。
改善版(版本B)
一位公司的副总裁到董事长面前,说:“我们正在考虑开始一项新的计划。它将帮助我们增加利润,还会有益于环境。”
董事长回答:“我才不管什么有益于环境。我只想获得尽可能多的利润。让我们开始这项计划吧。”
他们开始了这项新的计划,环境果然从中受益了。
对危害版(版本A),我们的提问是:“这位董事长是不是有意危害环境的?”对改善版(版本B),我们的提问是:“这位董事长是不是有意改善环境的? ”这是对“意图”的考察。除此之外,与国内外其他研究不同的是,我们还增加了“定量考察”的部分,即分别要求“认为有意危害环境”的人判断“如果是有意危害环境的,那么这位董事长应该为此负多大的责任?”要求“认为有意改善环境”的人判断“如果是有意改善环境的,那么环境的改善应该在多大程度上归功于这位董事长?”量表采用likert 7点制量表。危害版(版本A)中,数字即星星的个数(为对被试更加友好,采用了可视化的方式即将责任点数与对应五角星个数并列,被试直接点选星星个数即可)越大,代表所需要负的责任也越大。数字“1”和“7”分别代表“无需负任何责任”与“需要负全部责任”,从“2”到“6”的数字代表所需负的责任逐渐成比例提升。改善版(版本B)中,数字“1”和“7”分别代表“无需任何归功”与“需要完全归功”,从“2”到“6”的数字代表所需归结的功劳逐渐成比例提升。
在此我们考察:在中国文化中,“诺布效应”是否依然成立?结果非常有趣。
图1 “危害环境”的意图
图2 “改善环境”的意图
由图可以直观看出,“危害”与“改善”的意图之间存在着显著的不对称,“危害环境”的意图明显大于“改善环境”的意图。换言之,“诺布效应”在中国文化环境中依然成立。不过,有趣的是,两种情况下,持“有意”判断的公众都没有超过总体的一半。事实上,这一结果是启发我们获得一个重要发现的关键。
此外,即使都是“有意”的,危害版(版本A)与改善版(版本B)意图的程度也有所差别。董事长需要“负责”的程度大于他应该“载誉”的程度。在7点制likert量表中,前者的均值为5.76 而后者的均值为4.86,差异明显。因此,“诺布效应”不仅有定性的维度,还有定量的维度,而后者为本文首次报道,值得引起重视。
我们注意到关于性别与道德判断之间关系的复杂有趣图景。在目前可见的不少实验研究中,无论中外文献,多数场景都得出了“性别对于道德判断无重要影响”[6]的结论。④例如,徐迪在一项样本量为150的2×2水平的实验中指出,“本研究中,男女大学生道德判断取向不存在性别差异。”[7](P.31)邢强在更早的一项研究中认为,男女两性的道德判断“大同小异”,认为性别相关的道德判断差异可以归结为情境因素,[8](P.69)试图将这一差异淡化或者抹煞。此说法的问题在于,首先没有确切的数据的支持,其次逻辑上也不连贯:无论道德判断存在性别差异还是跨性别一致,都是由“研究所假设的情境引起的”——要么承认这一事实,要么就连其主张的“道德判断的跨性别一致”也要一起否定掉。在一些具体的场景中,性别对于道德判断的影响证据是确切的,难以否认——本文将呈现这类证据。
关于道德判断性别差异的原因,研究指出,可能是男性更关注“公平”而女性更注重“关怀”。女性更偏向于“关怀推理”,而男性更偏向于“正义推理”。进一步的研究指出,这种差异受到文化的影响[9]:在一种男性更多将自己视为“独立个体”而女性将自己视为“广泛联系的一部分”的文化背景中时,这种差异就会出现。⑤因此,尽管不少场景中的道德判断缺乏“肉眼可见”的性别差异,然而众多场景中这一差异的确存在。
实际上,“道德判断”经常是复杂的,不仅仅体现在性别方面。“评价自己与评价他人、自己决策和为他人建议、与自身相关和自身无关等不同的条件下,道德判断明显存在差异。”[10](P.1,P66)由于注意到性别属于基本的人口统计学变量之一,且越来越多的实证研究表明,男性与女性甚至存在大脑本身构造(如脑区面积、神经元密度、连接性等)和认知上的根本差异⑥;因此,我们重点考察了性别变量对有意性和归因强度的影响。
实验中我们没有人为控制性别比例,问卷回收完成发现218个样本中女性占据了147名而男性仅有71名;不过这一性别差异不会对数据分析产生危害,只会对一些描述性统计(descriptive statistics)结果带来影响——例如前述的“危害环境”意向没有超过半数就与男性样本偏少有关;根据数据分析,更多的男性样本存在会使“危害环境”的意向超过半数。
在“危害环境”和“改善环境”的意图上,存在显著的性别差异。
表1 这位董事长是不是有意危害环境的?
表2 这位董事长是不是有意改善环境的?
交叉分析结果如下:
(1)被试内效应显著。即无论性别如何,公众都存在将结果的道德性纳入到“意图”中进行归因考量的特点。前文表明,诺布效应在中国文化的整体人群中成立;而本处则进一步表明:诺布效应对中国文化环境中的男性、女性均有效。
(2)被试间效应明显。即男性、女性在与意图相关的道德判断上存在显著不同。F(1,16)=7.141,P<0.01(P=0.007⑦)。容易看出,无论是“危害”还是“改善”,男性在“有意性”的判断上均显著高于女性;在“危害环境”的有意性判断上是女性的1.46倍,而在“改善环境”的有意性判断上是女性的2.07倍。(提请注意,这是相对强度,不是绝对强度。)这一“有意性”上的差异是同类研究中的首次报告。对此,一个可能的解释是,较之男性,女性更擅“移情”(empathy)且更具“亲社会性”(prosocial),毕竟,“女孩在移情及亲社会行为表现上明显优于男孩。”⑧将带来不良后果行为的意图判断为“非故意”显然是一种“亲社会”的做法。我们推测,男性可能对“意图”的认定有着更为宽松的标准。实证支持的性别相关的“有意性”差异将是对思辨哲学“意图”问题上大量思考的一个有益补充,同时也表明,简单地将人群集合起来讲“集体意图”的习惯做法可能是有害的,这一“传统方法”获取的某些结论可靠性存疑。
(3)认为“危害环境”和“改善环境”情况下都需要董事长负责/载誉的群体中,性别无差异。F(1,29)=5.044,P=0.033。即,无论男性女性,都存在一定比例的“强负责”观(可以近似理解为“偏极端”)人群,此类被试对他人有着较严格的要求,同时在中华文化环境的人群中占比稳定。公众中稳定存在着一定比例的偏极端观点的人,这是一个合理外推。
前述的发现此前未见哲学研究者报告。我们认为,其中最值得关注的一点是,“性别”在我们的道德判断——至少是某一具体的判断中扮演了一个重要的角色!这表明,男性和女性的“道德感”不尽相同,“道德哲学”局部可能是性别相关的——这些部分可能比我们此前预计的更加广泛。⑨其主要动因包括如下两点。首先,一项对儿童的实证研究表明,“道德判断、移情和性别也存在着交互作用,经分析,当道德判断、移情水平都较高时,女孩的亲社会行为表现显著多于男孩。”[11](P.79)换言之,性别对人类的道德行为存在影响(而且多数研究表明,女性是更加“亲社会”的)。其次,相关实验指出,男性与女性在知识广度、言语抽象、概括、理解能力方面,以及空间知觉、知觉运动速度、视觉空间理解、分析综合的能力等方面均有所不同。[12](P.416)由于责任归因与道德判断涉及基本的认知、理解和价值判断,因此,存在性别对意图与道德判断的效应是很自然的,不存在反而是奇怪的。
当然,我们也有理由认为,其他一些因素特别是社会经济地位(social economic status)如经济收入、教育水平和职业状况,以及年龄等要素也会在人类的意图判断中扮演各自的角色。社会经济地位对人类道德判断和道德行为的影响被严重低估了,值得进一步研究。在这个学术资料获取异常便利的时代,无根的“哲学思辨”、虚浮的“哲学想象”实在是太多了——多到理论赖以建立的哲学事实严重短缺。我们对责任归因和道德判断的“实然”问题——这些基础的道德哲学事实,[13][14]非常感兴趣——这乃是“应然”的必要前提。进一步的探查将有助于我们收获更加精细的道德判断地图,不过就本文而言,我们的目标已经达到了,即向伦理学和道德哲学的研究者如实汇报:性别在道德判断至少是意图问题上扮演着重要角色,男性和女性在意图相关的道德判断上显著不同。其哲学意蕴在于,某些关于“人类”道德判断的全称命题至少需要改写为“X%的男性/女性认为……”这样的方式才能继续保持其真值;同时也把一些虚浮无根的“哲学想象”拉回地面——这是一个虽然很小然而扎实的道德哲学进展。
注释:
①“民间心理学”(Folk Psychology,又称“常识心理学”)与采用具体的理论或系统地实验的“科学心理学”(Scientific Psychology)有所不同,然而两种心理学都主要地服务于帮助我们正确地预测和解释行为。参见:Knobe J. The concept of intentional action: A case study in the uses of folk psychology[J]. Philosophical studies, 2006, 130(2): 203-231.在“民间心理学”的意义上使用“意图”并不是要采用一种非科学的方案,而是采取一种“大众理解”的方式使用“意图”概念,即关注“有意/无意”性。这也是关于“诺布效应”考察的常规做法。
②“诺布效应”(Knobe effect)有时也被称作“副作用效应”(side-effect effect),包括发现者在内起初都试图如此解释(可能也有谦虚的成分在内,毕竟作者一般不以自己的名字命名自己的发现)。但是随着研究的深入,人们发现,“副作用效应”仅仅表达了研究者对诺布效应原理的早期理解,而且不够全面。因此除早期外,近年来的研究已不再使用“副作用效应”这一提法。
③例如,为了有效地说明一所有2000人的学校的“一般状况”,在95%的置信水平上,以±10%的估计精度,也至少需要取样92人。文中作者对取样的描述较为复杂,6个问卷总量为480,由于“问卷3”“问卷6”与其他问卷具有包含关系,推测单一问卷样本量可能超过80但依然偏少。样本偏少容易导致随机误差渗入结果中,获得的结果归于随机误差的概率比较大。
④在一个评述中,通过元分析(metaanalysis),Walker的结论是:“the overall pattern is one of nonsignificant sex differences in moral reasoning. ”
⑤在这篇影响巨大的论文中,作者指出,美国的男性被认为可以形成和维持独立的自我建构,而女性则被认为可以构建并维持相互依存的自我建构(an interdependent self-construal)。
⑥参见VanRyzin J W, Marquardt A E, Argue K J, et al. Microglial Phagocytosis of Newborn Cells Is Induced by Endocannabinoids and Sculpts Sex Differences in Juvenile Rat Social Play[J]. Neuron, 2019.论文指出,大脑性别差异在胚胎发育的早期就已出现,雌雄小鼠出生时大脑杏仁核存在差异,同时会受到雄性激素的影响,进而影响到小鼠的行为控制与社会活动。
⑦“只关注P<0.05的时代应该过去了。”为响应APA的号召,在此我们同时报告具体的P值。
⑧参见丁芳:《儿童的道德判断、移情与亲社会行为的关系研究》,《山东师大学报(社会科学版)》2000年第5期,第80页。“移情是个体由真实或想象中的他人的情绪、情感状态引起的并与之一致性的情绪、情感体验,是一种替代性情绪、情感反应能力。”
⑨“不尽相同”意味着我们承认还存在着相当广泛的部分是一致的,然而我们反对对性别差异的刻意无视。实际上,哪怕只有一个可靠的反例存在,我们就只能拒绝“道德判断无性别差异”的结论。