社会工作研究中的定量方法及其应用

2022-02-18 02:04郭申阳
关键词:循证定量研究者

彭 瑾,李 娜,郭申阳,2

1.西安交通大学 人文社会科学学院,陕西 西安 710049;2.圣路易斯华盛顿大学 布朗学院,圣路易斯 63130

近年来,一些杰出的社会工作研究者和倡导者在全球发起并推动了社会工作科学化运动。1955年,美国社会工作协会(national association of social workers,NASW)成立,将七个不同的社会工作组织整合到一个专业组织中[1],成为美国社会工作专业化的起点。虽然加强社会工作实务科学性的呼声在60多年前就已经出现,但遗憾的是,直到今天社会工作还是没有成为科学的实践,或者被看作一门科学。2012年,美国社会工作与社会福利科学院院士Brekke[1]提出,社会工作对于科学知识的贡献是相对有限的。他运用“期刊数量”和“影响因子”两项指标比较了社会工作和临近学科,并得出社会工作在扩展科学知识方面的贡献落后于护理学、临床心理学、精神病学等临近学科的结论。他还指出,“科学”一词在美国社会工作协会《伦理准则》的序言中并没有被提及,“研究”也只出现过一次。而在美国心理学学会(American psychological association)和美国精神病学学会(American psychiatric association)的类似文件中,“科学研究”得到了更多的重视。

中国的社会工作研究者也在积极倡导社会工作科学化。吴帆[2]从研究方法的视角对2014—2016年发表的社会工作论文进行了系统分析,发现我国社会工作研究方法的使用在很多情况下还处于初级水平,与国际上社会工作的研究相比更显落后,呼吁中国的社会工作研究提高科学性。拜争刚等[3]对2015年以前中国的社会工作论文进行了系统分析,认为2009年起循证社会工作文献数量的增多,体现了社会工作迫切需要有助于中国实际问题的决策和证据。但社会工作领域尚未形成系统的循证方法体系,循证社会工作在理念、方法、服务团队、监管力度等方面仍然存在挑战。倡导的同时,研究者们也在积极进行社会工作科学化的研究实践。笔者以“循证+社会工作”为关键词在中国知网(CNKI)检索发现,循证社会工作研究从2011年起不断增加,2016年起呈快速增长趋势;同时社会工作领域有关干预研究、循证研究、实践研究的讨论也日益丰富[4]。这些都说明,社会工作科学化在中国越来越成为一个被广泛认可的发展方向。

在上述社会工作科学化的背景下,本文主要讨论有关“科学”的一个关键性问题:研究的方法论。这一问题是在全球社会工作发展的背景下展开的,立论基础是中国和美国社会工作的研究现状与发展趋势。旨在回答以下问题:定量研究方法在社会工作科学化中应当起到什么样的作用?在提升社会工作研究科学水平方面,定量研究者应当做些什么?

一、定量方法在社会工作科学化中的意义

Weber率先提出了社会科学与自然科学的本质区别,认为“无论是否清楚地表达出来,也无论是有意还是无意,并不存在绝对客观的对文化或社会现象进行的分析,它们无论在内容的确定、分析的过程或组织方面,总是受到特定的或者片面观点的影响”(1)HEYDEBRAND W.Max Weber,defination of sociology[EB/OL].1998.http:∥www.marxists.org/reference/subject/philosophy/works/ge/weber.htm.。1972年,瑞典著名经济学家Myrdal在哈佛大学的演讲中总结了自然科学和社会科学的主要区别:第一,社会科学家从来未能探索到一些最基础的常量(如特定媒介中的光速、声速或原子与分子的重量),也没有通用的测量标准(如对能量、电压、安培等的测量)。第二,语言在社会科学中有着非常重要的作用,某项贡献的影响往往很大程度上取决于作者的表述能力。这一点在自然科学中很少见。第三,社会科学的理论往往非常抽象,这可能会使社会科学家失去对人类行为更深层次的探索。第四,价值判断影响着社会科学研究。研究者的价值观常常包含在他们的观点及问题中,这种研究者视角的介入是社会科学方法论的一个主要问题。第五,在几乎所有社会问题的研究中,永远存在不同学派的不同观点,这些观点也会被政治家或公众根据需要有选择地使用。第六,偏差的空间。潜在的价值判断不会公开,这为研究的随意性提供了空间[5]。

以上观点对社会科学与自然科学区别的审视提供了进一步的思考,即社会科学究竟有多大的科学性?Brekke有关社会工作研究非科学性的质疑其实根植于所有社会科学之中。这种思考推动了包括社会工作在内的社会科学各领域的“科学化运动”。其中,经济学领域有关数理经济学的辩论是最具启发意义的现象之一。

(一)经济学科学化运动

经济学科学化运动发生在19世纪最后几十年,要比社会工作领域早得多[6]。在推进经济学科学化的过程中,经济学家们与Brekke感到类似的挑战和需要。为了提升经济学在科学体系中的地位,当时的一些经济学家发起了一场名为“边际革命”(marginal revolution)的运动,高瞻远瞩地将数学引入经济学分析。他们想要借鉴物理学的方法创造“经济学科学”,将经济学提升到和物理学类似的地位[6-7]。Mirowski在其著作《作为社会领域物理学的经济学,作为自然领域经济学的物理学》中对现代经济学进行了历史回顾,这一书名本身就很好地概括了这场运动的目标。

随着数学越来越多地被运用到经济学中,经济学家们在20世纪40—50年代开始意识到数理经济学的优缺点,进而开始讨论数学在经济学分析中的应用程度问题。这场讨论持续至今,与提升社会工作研究科学水平密切相关,即经济学家们的讨论能够启发社会工作研究者认真地考虑方法论的问题。

数理经济学的支持者认为,任何科学发展的要素都是对定量方法使用的提升和加强。Koopmans[8]指出,20世纪40—50年代的经济学和20世纪30年代的物理学非常类似。他发现当时的物理学家也曾讨论过物理学界对于数学方法的强调是否过分。但是,物理学的争论很快平息,因为物理学家认识到,量子力学已经成为广泛接受的“富有成果”的物理学理论,而量子力学的主要工具是数学[8]377。诺贝尔经济学奖获得者萨缪尔森是数理经济学的提倡者,他发表了一系列文章推动数理经济学的发展[9]。综观萨缪尔森所著的经典教科书《经济学》及其他经济学教科书,都清晰地体现出当代经济学家对数学方法的大量运用,如矩阵代数(matrix algebra)、集合论(set theory)、微积分(calculus)、差分方程(differential equations)、概率论(probability)、随机理论(stochastic processes)、统计推断(statistical inference)、博弈论(game theory)、拓扑学(topology)、公理方法(the axiomatic method)等。萨缪尔森对在经济学领域运用数学方法的原因进行了解释:“数学是一种语言,演绎方法与归纳方法同样重要,但是使用数学符号进行演绎更加方便。”[9]

数理经济学的反对者则认为,过度使用数学已经减弱了当代经济学与社会问题的联系,而这些社会问题正是经典政治经济学的主题。他们还认为经济学的范围变得日益狭窄,很大程度上是因为技术统治论影响着整个经济学[10]。Beed等[11]对20世纪20—90年代批判数理经济学的文献进行了系统检索,归纳了如下几个方面的批评意见:第一,数理经济学的公理与现实世界的行为不符;第二,数理经济学提出的可以通过实证检验的假设太少;第三,很多经济学现象是不可量化的,所以无法对这些现象进行数学表述;第四,对许多经济过程的描述,从日常语言(如英语)转换成数学语言,可能是幼稚或不合理的;第五,在数理经济学与更少使用数学方法的经济学之间,没有一种客观的方法去测量哪一种更精确;第六,不存在一种“最好”的数学逻辑体系;第七,由于以上种种问题,数学方法通常变成了探讨现实世界经济行为的一种不必要的装饰,服务于与经济学科学探讨无关的其他目的。

上述有关数理经济学的辩论从根本上使经济学家重新思考“社会科学究竟具有多大的科学性”这一根本问题[11-12]。尽管自然科学和社会科学存在很大区别,但是经济学家认为,两者也存在着可以共享的领域,这就是研究方法。研究方法的改进可以作为增强一个学科科学性的重要路径。如Mack认为:“什么使我们将特定的知识界定为科学?那就是这些知识获得的方式,科学性来源于方法。通过这种方式得到的知识被看作是科学的,使用这种方法去增加知识的人我们将他们称作科学家,通过这种方式得到的知识体系被称作科学。”[12]201

正因如此,尽管当代经济学存在对数理经济学的不同看法,但也的确形成了一定的共识:应该放弃的是对数学的误用、过度使用或滥用,而不是对数学的使用。Quddus等[6]251认为:“在过去的30年里,这个领域(指数理经济学)的快速进步已经非常显著,以至于有时候它已经统治了整个专业。最初数学只是被人们关注,如今它已经成为首选的承载知识的工具。早期数理经济学仅仅是现代经济学的支柱之一,如今有些人已经将它看作经济学的基础了。”

为了说明这一点,Quddus等[6]广泛引用诺贝尔奖获得者对于错误运用数学的批评,这一回顾被称作“诺贝尔的抗拒”(Nobel resistance)。如1988年诺贝尔奖获得者Maurice Allais严厉批评了现代经济学文献中对统计工具的滥用:“然而不幸的是,对于数学的滥用不是当前文献中唯一的失败。这种频繁的滥用已经产生出了一大批‘伪理论’,它们来源于脱离现实的思考与理解,对计量经济学和统计学技术的机械运用,所有这些理论具有相同的特点——精致的相关线性模型。它们在现实中只是虚假的模型,伴随着数学统计学的华丽装饰,这种装饰其实只是一种粗糙的不合理的数理经济学。对于科学理论来讲这种科学是幼稚而空洞的。”[13]13-141973年诺贝尔奖获得者Wassily Leontief也强调,经济学模型不能够取代对于真实经济系统运行及结构的全面理解,“经济学理论年复一年地持续生产出大量的数学模型,去做一些形式上的工作。计量经济学家尽可能地使用代数函数去处理实质上同样的数据,而这种数据的处理方式并没有增加人们对于现实经济系统运行及结构的全面理解”[14]。1970年,诺贝尔获奖者萨缪尔森对于推动数学在经济学分析中的应用做出了重要的贡献,但是他依然警告经济学家永远不要高估方法的作用。通过对诺贝尔获奖者观点的回顾,Quddus等认为,这些杰出的经济学家都“认可数学扮演着重要角色,但是坚持数学必须服务于经济分析的目的,而不是去控制后者”[6]256。

(二)社会工作科学化对经济学的借鉴

对经济学领域提高科学研究水平历史的回顾,可以帮助我们理解所有社会科学家面对的一些基础性挑战。总体来说,在推动社会工作科学化的努力中,至少有如下观点是社会工作者可以从经济学领域借鉴的。

第一,方法论是增强科学探究水平的核心,无论这种探究是定性的,还是定量的[12]。在社会工作科学化的过程中,研究者应当努力去改善研究方法,增强获取知识的严谨性(如观察、测量、量化、分析以及对社会工作现象进行理论化)。这一点是通过经济学领域的辩论形成的共识。

第二,所有科学家面临的共同任务都是对经验现实进行描述和概括,定量方法是完成这一任务的有效工具[9]。当前,社会工作研究领域对定量研究方法的使用主要集中在统计分析领域,而丰富的统计方法也只有一部分被用到。事实上,社会工作领域对数学的应用不是过多,而是太少。社会工作研究者有很大空间去使用更多的定量研究方法。当然,定量研究方法的使用要服从于问题的解决,要为有效达到研究目的而服务。

第三,定量研究方法只不过是帮助研究者量化和检验理论假设,不应该取代其他科学方法(如理论发展、定性方法、混合方法、干预研究等)。借用Quddus等[6]的观点,定量研究方法只是社会工作科学的工具之一,目的是完成研究社会工作现象,回答研究问题,它不应当成为统治学科的唯一方法。

第四,社会科学学科具有一些基本的特征,如缺乏基本常量、高度依赖语言、高度抽象、受到价值观影响、观点多样、被人们主观选择等[5]。社会工作作为一门社会科学,必然具有这些特征,进而承载了社会科学不可回避的问题——研究偏差的存在。社会工作研究者应当认真、不懈地努力减少这种偏差对学科发展的影响。

第五,放弃对数学方法的错误、过度使用或者滥用。这一观点在有关数理经济学的辩论中反复出现,同时也被一些杰出的经济学家所认可。虽然社会工作研究者目前并没有像经济学家那样过多地使用数学,但还是要对此保持警惕:在运用数学加强社会工作研究时,要用经济学家的经验加以引导。

第六,消除方法论者和实证研究者之间沟通的障碍。Clark[15]提出,数理经济学对经济学有着独一无二的贡献,首要的问题是怎样利用这个贡献。他进一步呼吁要消除沟通的障碍:对一般的经济学家来说,应当对于结果证实感到满意;对于方法论者来说,应该将结果以一种可以被理解的方式呈现出来,使得一般的经济学家有可能去评价结果。在社会工作科学化的视角下审视这一点,可以看到增加实证研究者与方法论者之间对话的需要:使技术导向的工作更容易被大众理解和接受,同时有必要加强定量知识和技能的持续教育。

二、定量研究推动社会工作科学化的基本原则

结合对美国和中国社会工作研究的分析,本文提出定量研究者推动社会工作科学化、开展社会工作研究的三个基本原则。

(一)依循实证研究的传统:使用经验数据去检验理论假设

定量研究出现于19世纪20年代,根源于实证主义传统。实证主义最重要的原则是使用经验数据去检验理论。这些原则早在实证主义传统的倡导者Comte那里就得到了清晰的表述。根据其观点,社会科学和自然科学在基础方法上没有区别,社会科学家在解释社会现象时,应该和自然科学一样,运用观察、实验以及比较的方法。这些方法都要求使用经验数据验证理论,并且在自然科学中已经得到了成功的运用。虽然实证主义从19世纪开始已经取得了瞩目的进展,同时对于经典实证主义的批评和修正推动了所谓后实证主义的出现,但这个基本原则没有改变,即在客观地使用经验数据这一目标上,后实证主义与实证主义的立场是相同的。后实证主义与古典实证主义的区别在于,对于研究者角色的理解不同。后实证主义认为,研究者与研究主题无法分开,理论、背景、知识、研究者的价值观念会影响他们观察到的内容[16]。而Popper[17]发展的证伪主义(the approach of falsification)实际上是使用同实证主义同样的假设演绎路径,强调用经验数据检验理论。Popper所做的修正,只是使用证伪或者拒绝错误观点,去取代实证主义直接证实的方法。

科学研究的“实证原则”意味着如果没有被经验数据验证,任何理论只能停留在假设的状态,不能够被称为理论。从最初实证主义的先锋到当代社会科学家,这个原则一直没有改变。例如Durkheim为了确定自杀这一社会现象受到社会互动的影响,比较了城市和农村地区、夏季和冬季的自杀率。虽然他只是使用了一个简单的列联表,但是自杀率支持了研究的核心目标——数据确认了理论假设。没有这些简单的百分比,Durkheim的理论不能被看作是“事实”或者被接受。从Durkheim时代的简单百分比到今天建立在各种统计理论基础上的证伪模型,“检验研究假设”的方法已经取得了很大的进步,但上述原理一直没有改变。无论研究者的统计学分析多么复杂,检验理论假设都在科学的探寻中扮演着核心的角色,引导着研究的始终。

综上所述,实证原则应当成为社会工作研究的重要基石。一方面,社会工作干预要基于有关社会现象、人类行为与心理的理论解释,寻找“改变”的路径与方法。这些理论解释,必须是由经验数据所证实的。社会工作者要具备寻找“证据”、检验“证据”的能力。另一方面,循证社会工作本身就包含对实证原则的遵循。循证社会工作是循证实践的理念和方法在社会工作领域的应用[3]。循证实践(evidence-based practice)(2)evidence-based practice又译为“证据为本实践”。源于临床实践领域对实务工作有效性的诉求[4],其理念始于20世纪末发展起来的循证医学,其后迅速延伸到医学以外的应用社会科学各领域[18]。循证社会工作被认为是“推动社会工作在中国发展并推动社会认同的一个有效策略”,逐渐得到社会工作界的普遍认可[3,18-19]。

需要指出的是,中国循证社会工作研究在数量与质量上仍有很大的提升空间。拜争刚等[3]分析发现,2015年前“符合循证理念与方法在我国社会工作领域应用的文献”共27篇。由于2016—2017年是循证社会工作研究迅速发展的起始,本文以“是否遵循实证原则”“是否研究与社会工作实践直接相关问题”为标准,对《社会建设》《社会工作》两本社会工作期刊2017—2019年的发文进行了统计分析,发现遵循实证理念开展的与社会工作实践直接相关的研究共120篇,占期刊总发文量的34%。虽然此类研究占比呈逐年上升趋势(2017年28%,2018年35%,2019年39%),但总体来说还是较低,实证原则在中国社会工作研究中远没有占据其应有的位置。

在推进社会工作科学化的过程中,定量研究者应当更多地贯彻实证传统,为理论与方法的发展提供科学的证据,并坚持如下原则:任何未经经验数据检验的所谓理论都不能视为理论;任何不使用经验数据来检验理论假设的定量研究新方法都是有问题的,不应被视为科学。

(二)吸收邻近学科的最新方法

许多强大而有效的统计学模型在相关学科中得到了发展,包括计量经济学、统计学、生物统计学、计量心理学。其中许多模型都来自严格的数学理论,并且被证明在增加基础知识方面非常有用。为了增强社会工作定量研究的水平,研究者们应该考虑借用这些进展,吸收邻近学科最新的发展成果。

本文对2012年1月1日—2013年12月16日美国五个重要社会工作期刊(3)这五本期刊分别为Social Work、Social Work Research、Research on Social Work Practice、Social Work Review、The Journal of the Society of Social Work and Research。发表的文章进行了分析,分析聚焦于研究方法的使用。从472篇文章中筛选了213篇报告研究成果的文章,文献检索流程如图1所示。

图1 文献检索流程示意

通过文献分析发现:第一,到2013年,定量研究方法已经成为美国社会工作研究的主要方法。在213项研究中,24项(11.3%)使用了定性研究方法;16项(7.5%)使用了混合研究方法,173项(81.2%)使用了定量研究方法。这些数据表明,越来越多的社会工作研究者意识到使用定量方法的重要性并开始在研究中运用。这一发现与经济学家的主流意见是一致的,即定量研究在科学研究中扮演着重要角色,这是实证主义和后实证主义都认可的基本原则。

第二,所有的定量研究都运用统计方法去生产知识或进行假设检验。213项研究中没有一项像边际经济学家那样使用数学方法去形成发展宏观或微观的理论。除了回归模型(regression or regression-typed model)、拓扑学(topology)等之外,没有社会工作研究使用博弈论(game theory)、差分方程(differential equations)的方法。换句话说,社会工作领域的研究目前远远未涉及对于数学过度使用的问题。

第三,在社会工作研究中,定量/统计学方法已经得到了较为广泛的运用,包括一些高级模型,表1展示了运用定量研究方法的分布情况。在189项使用定量或混合方法的研究中,22项(11.6%)只使用了描述性统计或双变量分析;167项研究至少使用了一种多变量统计模型;在167项研究中,使用频率较高的方法包含回归分析(16.8%)、Logistic回归或Probit模型(16.8%)、因子分析(包含探索性或验证性因子分析)(15.6%)、单变量或多变量分析(12.6%)。此外,研究中也用到了一些高级统计方法,如结构方程模型、分层线性模型和倾向值分析,但这些方法使用的比例相对较低。而这些高级模型已经被证明对于解决挑战性问题非常合适,如数据聚类、选择性偏差有助于解决结果变量随时间变化带来的统计问题以及忽略结果变量的非正态或非连续性带来的不利影响,等等。因此,社会工作研究在使用高级模型(特别是那些使用频率少于10%的方法)方面有着很大空间。

表1 使用定量方法的研究中运用的主要分析方法分布情况

2017—2019年,中国社会工作研究中关于定量方法的使用情况如下:2017年循证社会工作研究中使用定量方法的共7篇,其中描述性统计2篇,使用回归模型2篇(其中1篇用到因子分析),同时使用T检验和方差分析1篇,系统评价和Meta分析2篇。7篇混合方法的研究中,6篇使用了描述性统计,1篇使用T检验。2018年使用定量方法的共6篇,其中1篇使用描述性统计,2篇同时使用相关分析和回归模型,1篇同时使用方差分析、T检验、相关分析和路径分析,1篇使用了探索性因子分析和路径分析,还有1篇使用了Logit模型。5篇混合方法的研究均使用了描述性统计方法。2019年的8篇定量方法研究中,1篇使用模糊综合评价法,2篇同时使用描述性统计和T检验/方差分析/卡方检验,1篇使用因子分析(包括探索性因子分析和验证性因子分析),1篇使用多元回归模型,2篇使用结构方程模型,还有1篇同时使用Probit模型和倾向值匹配(PSM)。混合方法的6篇研究中,5篇使用描述性统计,1篇使用文献计量法。上述分析结果表明,使用定量和混合方法的研究在逐年增多,但所占比例仍较低;虽然2019年出现了结构方程模型和倾向值分析方法的使用,但仍以描述性统计分析为主,对于解决因果关系和因果机制问题的研究仍然缺乏;借用计量经济学和统计学方法最新成果的研究已出现,但数量仍较少。综上,中国社会工作研究在运用适合的统计方法或发展独特方法解决问题方面还有很大空间。

(三)解决社会工作研究与实践中最紧迫和最具挑战性的问题

在社会工作各个研究领域中,定量方法的应用是不平衡的。在前述对美国研究的分析中发现,虽然高级统计模型的应用已经增加,但不是所有社会工作领域都在相同的水平上使用了这些模型,一些领域本应使用更多的高级方法,表2展示了对美国社会工作研究检索中定量方法在各个领域的分布情况。其中,14个领域中只有3个较深入地使用了高级定量方法,分别是健康与精神健康(50项)、社会福利与贫困(35项)、儿童福利(30项)。这些领域中定量研究方法使用数量较多,也基本使用了所有的定量模型;其他领域仅有少量研究是定量倾向的,或者缺乏高级方法的运用。

表2 定量研究方法在社会工作各研究领域的分布情况

中国社会工作研究的情况更为紧迫。在2017—2019年社会工作期刊发表的论文中,循证社会工作共涉及24个研究主题,发文排名前5位的研究领域分别为社区治理(12%)、儿童社会工作(1%)、社会组织(12%)、医务社会工作(9%)、贫困治理(7%)。其中社区治理、社会组织、贫困治理领域的研究均使用定性研究方法,儿童社会工作11篇研究中有5篇使用定量或混合方法,医务社会工作10篇中有4篇使用定量或混合方法,且均以描述性统计为主。可以说定量研究方法在中国社会工作重要研究议题方面的应用亟需增强。

此外,中国特色社会工作理论与方法的知识生产也是社会工作研究面临的紧迫问题。但是研究发现,无论使用定量、定性或混合研究方法,中国近期的研究在这一方面没有体现出明显的贡献。对于中国特色社会工作发展的呼吁近年来与日俱增[20],其要点是理论与方法的知识生产。针对2017—2019年发表于《社会工作》与《社会建设》期刊上的循证社会工作研究,本文还从研究类型视角进行分析,并划分出8种类型:“对已有实践案例的定性分析”“使用横截面数据对社会工作实践进行的描述性/解释性研究”“基于实验或准实验的干预研究”“基于文献的对干预研究结果的系统评价”“对其他学科研究成果的讨论与应用”“政策评估”“行动研究”“测量工具的开发”。这8类研究都应指向中国特色社会工作理论与方法体系的发展,尤其是干预研究、系统评价、行动研究。但事实上,这8类研究的比例非常不均衡,“对已有实践案例的定性分析”占比最高(40%),“使用横截面数据对社会工作实践进行的描述性/解释性研究”次之(28%),占比第三的为“基于实验或准实验的干预研究”,其余5类占比不相上下,均在10%以下。干预研究、系统评价、行动研究比例远低于国外社会工作研究。笔者在这一分类的基础上进行逐篇阅读,发现无论使用的是定性、定量或混合方法,这些研究中试图在理论上(包括有关方法的理论)有所发展的研究不足。以占比最多的“对已有实践案例的定性分析”为例,只有少部分研究在案例经验总结的基础上开展与已有理论或方法对话,并试图验证或发展既有理论。可以说,在运用科学方法解决重大问题、发展中国特色社会工作理论方面,社会工作研究还存在很大发展空间。

三、定量方法在社会工作研究中的应用

作为社会科学研究的一部分,社会工作研究可以在多个维度使用定量研究方法。本文仅依据对中国社会工作研究的现状与发展方向的分析,从以下几个方面讨论社会工作研究中定量方法的应用。

(一)使用结构方程模型发展“问题理论”

社会工作的核心是改变,需要有效的“改变方法”。干预研究是以科学方法探索有效“改变方法”的科学研究过程。干预研究已成为国际上社会工作学、心理学、医学等领域广泛运用的一种重要研究范式,也是“现阶段我国社会工作领域内亟需开展和实施的专业实践行动”[21]。要发展出有效的干预项目,需要一系列相关的研究活动。根据Fraser的观点,干预研究的五个基本步骤可以分为“生产性的”和“评估性的”两种类型,这两种类型的研究活动贯穿于一系列干预研究活动的始终。其中,“生产性”是指这类研究的目标是对干预项目的设计、构建与完善[22]。

社会工作项目的设计往往源于对一个社会或健康问题的关注。项目设计建立的重要基础是对问题如何产生的理解,包括去理解引起这个问题的风险因素和可能的保护性因素。也就是了解我们关注问题产生的“风险链”,形成干预研究所说的“问题理论”。“问题理论”解释项目设计者希望解决问题发生的原因与机制,包含对社会或健康问题的结构化理解。发展“问题理论”,可以帮助项目设计者识别干预的“杠杆点”,发现干预中或许可以改变的风险因素和保护性因素。因此,确定“问题理论”是建立某一干预之因果逻辑的第一步[23]55。结构方程模型(structural equation model,SEM)可以对潜变量进行测量,对中介机制展开分析,是非常适合发展“问题理论”的研究工具之一。

图2 递归路径模型(因果链模型)示意[18]

上述只是SEM的基本原理,具体到社会工作研究的应用中,结构方程模型具有一定的优势:首先,结构方程模型可以用于分析不易观测和测量的变量,即潜变量。这在社会工作研究中非常重要,如在分析社会现象以及个体的心理和行为问题时,均不能直接用某个指标来测量,需要通过多个指标来反映,结构方程模型可以实现同时对潜变量因子结构和潜变量之间因子关系的分析。这也就体现了结构方程模型的第二个优势,即解释变量之间的因果机制:结构方程模型不仅可以分析变量之间的直接效应,还可以分析其中的中介效应。以基于社会信息加工理论来提升儿童社会能力的干预项目为例,结构方程模型不仅可以分析干预对儿童社会能力提升的直接影响,还可以进一步分析儿童社会信息加工能力在干预和儿童社会能力之间的中介作用,这样就可以更加深刻地理解其中的因果机制,同时还能分析这种因果机制在不同组间的差异。这两个特点可以帮助研究者更好地了解社会/健康问题产生的复杂因果机制,从而建立良好的“问题理论”。假设研究者对儿童发展有兴趣,并想开发一个干预项目,那么Gershoff[25]的研究就有可能成为干预项目的问题理论。研究者研究了家庭收入与家庭物质匮乏对儿童认知发展、社会情绪能力的影响,以及家长因素(家长投入、家长压力、家长积极教养行为)的中介效应。基于结构方程模型的分析,研究发现了两条路径:一条指向儿童认知发展,家庭收入对父母投入产生积极影响,进而促进儿童认知发展;另一条路径指向儿童社会情绪发展,路径是家庭收入—物质匮乏—家长压力—积极家长教养行为—儿童社会情绪能力。该项研究为项目开发者提供了理解儿童认知或儿童社会情绪能力发展问题的证据基础,从而对干预的“杠杆点”做出选择[23]51-53。

(二)在干预项目测试中使用倾向值分析

因果推断是所有科学的核心兴趣,社会工作研究也不例外。如前所述,干预项目的有效性测试和效果测试是干预研究的“评估性”阶段。这些“评估性”研究本质上是因果推断,即评定干预(原因)是否对服务对象的结果产生预期的改变。这里,最关键的工作是撇除一切与结果变量有关联但与干预无关的协变量的影响。迄今为止,能够达到这个效果的最佳方法就是由费雪创立的“随机实验方法”,即用随机方法将研究对象随机分配到实验组和对照组(也称控制组)中去。但在现实中,实验设计常常是不可能、不现实、有违伦理甚至不值得的。这就使得准实验设计在行为和社会科学领域成为主要的研究设计方式。但准实验设计在项目效果评估方面的确存在固有的问题,这成为其面临的一个挑战。

在过去的30多年,研究者不断寻找更好的方法去改善准实验设计项目的评估,从而应对这种挑战。在这一背景下,越来越多的工作聚焦于基于各种假设去估计干预效果。Rosenbaum等[26]统计学家以及Jams Heckman等[27-28]计量经济学家发展和完善了通过观察数据估计因果效应的方法,这些方法被统称作倾向值分析(propensity score analysis,PSA)。在干预项目的评估中,倾向值分析方法可以应对干扰变量或协变量的影响,在准实验设计或随机实验设计平衡检测不通过,即实验人群与控制人群在关键变量中存在系统性差异时使用,以提高分析的内在有效性。

作为一种新的、快速增长的评估方法,倾向值分析并没有被看作随机实验的最好替代,对于它的优势和劣势有着持续的争论。然而,重要的是研究者们都认为倾向值分析已经达到了一个成熟的水平。倾向值模型的发展是定量研究方法总体发展的一部分。在倾向值分析出现的过程中,行为与社会科学也见证了其他统计方法的发展。例如等级线性模型(hierarchical linear modeling)、稳健标准误(robust standard error estimation)、运用结构方程模型对潜变量的分析(SEM analyzing latent variables)、时间数据的分析(time-to-event data)以及集群事件(clustered event data)的分析,研究者常常需要将这些新发展的模型与倾向值分析方法结合起来。同样地,成功地使用倾向值分析也常常需要对数据分析中其他问题仔细检视,包括处理可能出现的对于统计假设的违背。在过去的35年里,经济学和统计学已经产生了可应用的8种倾向值分析方法:Heckman的“样本选择模型”(sample selection model)和Maddala的“干预效应模型”(treatment effect model)、倾向值贪婪匹配(propensity socore greedy matching)和最佳匹配(optimal matching)、倾向值分类(propensity score subclassification)、倾向值权重(propensity score weighting)、匹配估计量(matching estimators)、以非参数回归进行的倾向值分析(PSA with nonparametric regression)、剂量分析(dosage analysis)以及解决隐藏抽样偏差的敏感分析(sensitivity analysis to address hidden selection bias)。此外,Rubin[29]的反事实模型(counterfactual framework)和Heckman[30]的因果性计量经济学模型(econometric model of causality)也可以帮助研究者解决有关因果关系的挑战性问题。同时,统计学家和计量经济学家发现,关于干预分配的强忽略假定(the strongly ignorable treatment assignment assumption)和稳定单位处理值假设(stable unit treatment value assumption)对于所有的因果性探寻至关重要。一些统计学软件包提供了一系列的程序,让使用者执行上述所有模型。Guo等[31]提供了一个对于倾向值分析的全面回顾以及逐步的说明(4)这本书示例涉及的所有数据以及Stata语法都可以在其配套的网页上找到,网址为http:∥ssw.unc.edu/psa/.。

倾向值分析在因果推断方面的作用应当在社会工作领域得到重视。例如,干预研究的目标就是回答“干预结果与接受干预之间是否存在因果关系”,从而对干预效果做出因果推断。“让我们做朋友”及其原始版本“做出选择”,从开发至今经过了多次测试[32-34]。2018年的“让我们做朋友——陕西”因为具备良好的实验条件,使用了随机控制实验(RCT)[35]。但大多数的测试采用准实验设计,其中包含了对倾向值方法的使用。例如在天津对“让我们做朋友”的一项干预研究就使用了倾向值分析方法。该研究使用准实验设计,通过数据分析研究者发现实验组与对照组绝大部分的观测协变量统计有着显著不同,因此通过倾向值加权和最优完全匹配法平衡了这些协变量,提升了研究的内部效度[36]。

(三)使用元分析方法综合评价干预方法的有效性

元分析是用来汇总经验研究结果的一种方法,应用于行为科学、社会科学和健康科学领域。元分析方法一般可以应用在以下几种研究结果的综合分析中:(1)集中趋势描述,即汇总那些报告了某个变量集中趋势的研究发现,通常汇总的是均数、中位数、众数、比例等统计量。(2)前后对照,即汇总那些对同一变量进行前后对照所得到的研究发现。这些研究对同一个变量在不同时间测量其集中趋势并进行比较。通常,此类研究发现或者以前后两次测量的集中趋势之差来表示,或者以每个回答者两次取值之差的集中趋势表示。(3)组间比较,即汇总那些针对两个以上回答者群体,测量一个或多个变量并进行组间比较。元分析者感兴趣的组间比较通常包括对实验性或临床试验研究或非实验条件下根据特定属性分组产生的组间差异。(4)变量之间的关系,即汇总那些探索两个变量的协变关系的研究发现,此类研究结果常用相关系数、卡方系数等报告。元分析者通常感兴趣的问题包括个体差异研究或测量研究[37]14-16。

循证实践强调基于证据的有效实践,循证社会工作也不例外。证据有不同的类型,根据产生证据的研究设计可以将不同类型的证据分为不同的等级,依次为“元分析和对多个随机对照实验的系统综述”“随机对照实验”“群组研究”“案例控制研究”“案例系列研究”“横断研究和案例报告”“专家意见、使用者证言和参与者报告”[23]13。这一标准在循证实践领域被奉为经典[38]40。其中,“系统评价与元分析”位于顶级,能够为实践提供最有力的证据支持。上述元分析通常涉及四种研究类型,且都是社会工作研究中会遇到的研究类型。其中,对于前后对照、组间比较研究结果的综合与实践联系更为紧密,因而更为常见。具体来说,元分析方法在社会工作领域主要用于对某种干预方法效果的评价,例如“学校社会信息加工干预项目对儿童攻击性行为的效果评价”“太极拳预防老年抑郁症有效性的系统评价”[39]等。元分析研究与交流除了常用的学术研究数据库外,Campbell协作网也是非常重要的平台,其主要任务是为社会服务、心理、教育、法学及国际发展政策等社会科学领域提供科学、严谨的系统评价决策证据[40]224。目前,Campbell已经成立了Campbell中国联盟(5)Campbell协作网的网址为https:∥www.campbellcollaboration.org/;Campbell中国联盟的网址为https:∥www.campbellchina.com/index.。

以家庭教养项目Triple P为例。Triple P项目的独特优势之一是循证性极强,在1970—2013年有116篇实证研究评估了Triple P的有效性,这些实证研究来自不同国家和地区,都在一定程度上支持了Triple P在儿童社会、情绪和行为问题上的良好效果,反映了Triple P的跨文化适应性[41]。为了汇总这些研究成果,更综合全面地评估该项目的有效性,多项研究对这些实证研究进行了系统评价。Christoph等[42]对1970—2007年11月用英文或德文发表的关于Triple P的研究进行了综合,纳入的55篇文献使用分层线性模型(HLM)分析效应量。Sanders等[43]对Triple P的系统评价更为全面,通过对1980—2013年1月发表的Triple P干预研究进行筛选,纳入101项文章进行分析。如果将这两项系统评价得到的结果做进一步分析,还会发现有针对性的方法和治疗方法比普遍研究具有更大的效应量,这意味着Triple P系统既具有预防干预的价值,也具有治疗的价值。因此,元分析方法对于综合评估干预方法/项目的有效性非常重要。

(四)更加严格地使用定量方法

最后,社会工作研究者需要按照更加严格的方式去应用定量方法。基于对美国社会工作研究的粗略回顾,可以发现一些普遍存在的方法论问题。

第一,大多数使用定量或者混合方法的研究使用了非概率抽样的方法。这是值得注意的,因为统计学理论已经证明了非概率抽样的弊端。因此,社会工作研究者应当尽量使用概率抽样[29]。

第二,避免高昂的成本又能保证使用随机抽样的一个好方法是使用全国数据。这些数据资料一般都建立在随机抽样基础上,有着较为复杂的调查设计[29]。然而对美国的文献检索发现,只有31项研究(189项的16.4%)使用了基于全国数据的二手资料分析。这31项研究中使用最多的是Add Health:National Longitudinal Study(4项研究使用);其次是National Latino and Asian American Study、Fragile of Child and Adolescent Wellbeing Study、Survey of Income and Program Participation。社会工作研究者应该努力更多地使用二手数据的分析,去解决非随机抽样中的局限性。

第三,对文献的分析显示,189项研究中,90项(47.6%)使用了动态设计,70项(41.3%)使用了横截面的设计,18项(9.5%)使用了实验或者准实验设计,3项(1.6%)使用了质性的研究设计。值得注意的是,许多研究使用了低水平的设计,比如横截面设计(41.3%)。社会工作研究者需要提高研究设计的严谨性,去增强研究及其结果的内部效度和外部效度。

四、结论

无论在中国还是美国,Brekke对于社会工作落后于临近学科的判断是符合事实的,但是不能否认社会工作研究已经发生重要的变化,并且在过去20年有了很大的进步,也就是说,社会工作研究的精确性在不断加强。对美国来讲,三个重要的因素对这种发展意义重大。首先,美国社会工作及研究协会(the society of social work and research,SSWR)对社会工作发展的推动。SSWR是一个致力于推动社会工作研究发展的独立组织,自1994年成立以来举办了25届年会,也资助了许多学术活动,这些都推动了社会工作专业研究水平的提高。第二,越来越多的社会工作出版物借用和吸收先进的定量研究方法,去解决专业最紧迫、最具挑战性的问题。第三,信息技术革命已经极大地影响了学科,提高了社会工作研究的品质。近年来,中国社会工作领域也在上述三个方面呈现出了一定的趋势,但仍需要更多借鉴国际社会工作的有效发展路径,更有力地推动社会工作科学化的发展。同时,尽管国际社会工作研究者在提高研究科学性方面已经取得了很大的进展,但是面对21世纪社会工作的各种新的挑战,推动社会工作科学化仍然是研究者的重任,在中国这一任务尤其重要。在这一方面,Brekke的研究及其结论应当受到重视。正如本研究所证明的,方法论是一种知识能够被看作科学的重要因素。

本文讨论了定量研究者在推动社会工作科学化方面的三个原则,并结合中国社会工作研究进行了分析,对一些定量研究方法的应用做了初步讨论。每一个原则都需要对于社会工作问题的深入理解。而且,无论这些问题是来自于研究还是实践,对于现有研究方法的严格运用,或者对新方法的发展以适应特定的研究问题或者数据,都将对科学知识的增加产生重要意义。

猜你喜欢
循证定量研究者
循证护理在上消化道出血护理中的应用效果观察
循证医学教育在麻醉临床教学中的应用
有机物官能团的定量关系在解题中的应用
循证护理在增强CT检查中减少造影剂外漏发生的作用
探讨循证护理在急诊烧伤患者中的价值
定量管理在型号软件研制中的应用
用水痘病毒开发新型HIV疫苗
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
研究者调查数据统计
形成初步定量思维。做好初高中化学衔接学习