我国社会服务项目的鉴定性评估及其国际视野下的反思

2021-10-09 10:42方巍

社会工作与管理 2021年5期

方巍

（1. 浙江省舆情研究中心； 2. 浙江工业大学公共管理学院，浙江杭州，310032）

自从我国确立社会主义和谐社会的建设目标以来，各类民生服务项目迅猛发展。中共中央提出改进政府公共服务供给方式、引导社会组织健康有序发展的要求，大大提升了社会服务组织在民生项目实施过程中的作用。各地各级政府以服务购买为代表的治理模式的转变，在一定程度上促进了各类服务项目评估的发展。然而，与国外社会项目评估以证据为本(evidence-based)[1-2]或理论为本(theory-based)[3-4]的模式不同，当前我国相当部分社会服务项目的评估还是具有鉴定性的特点，甚至可以说鉴定性评估是当前社会服务项目评估的主要方式。那么，究竟应该如何看待和评价当前我国社会服务项目中的鉴定性评估？本研究将在分析鉴定性评估的表现特点以及社会服务项目鉴定性评估作用的同时，追踪国际社会服务评估发展走向以及鉴定性评估的运用特点，从国际视野出发重新审视我国社会服务项目评估现状，为提升我国社会服务项目评估水平、提升各类民生和惠民服务项目的成效，提出对策思考。

一、我国社会服务项目评估的鉴定性特征

上文已经指出，我国的社会服务项目评估具有鉴定性的特点，下面将从具体的评估现象出发描述并归纳这一类评估的表现特点，进而分析它在我国当前的项目评估过程中所处的地位，对其在评估实践中的作用做出评价。

(一) 我国社会服务项目评估的鉴定性表现

究其表现形式来说，鉴定性评估其实在现实中十分常见，电视节目中的选秀表演便是大家最为熟悉的一种形式。节目的主办方邀请相关专家组成评委，评委们则根据参加表演或竞赛人员的表现进行评分并排出名次。在评比过程中，专家根据自己的专业认识，对评定对象的表现做出独立的判断。但在大部分的这类评定过程中，发起者往往会制定一个指标体系，要求专家从不同方面对评比对象的表现做出评价。

社会服务项目的评估过程中也存在着类似的方法。评估组织方往往会就评估涉及的领域以及各个方面的评价标准做出条文性描述，要求评估专家根据这些标准对所评估服务项目的执行和成效做出自己的判断。上述评估的标准可以是现成的，也可以自己研究制定。例如，叶托和胡税根提出从项目的投入、过程、产出、品质、成效和政治等6个方面，通过36个二级指标进行测评打分，对政府购买社会服务的绩效进行评价。[5]在一些复杂的鉴定过程中，评估组织方可能还会对不同评估领域的权重做出规定，而不是简单地汇总计算各项评估指标的得分。例如，同样在上述项目绩效评估过程中，研究者通过专家判断矩阵，利用特征向量法求取获得六个评估纬度的权重值。[5]

通过分析我们不难了解上述这类社会服务项目评估的一般特点及其方法，因而可以将其称为鉴定性评估。根据《现代汉语词典》(第五版)，“鉴”就是镜子或者以物观照，引申为仔细观看或审察；鉴定便是鉴别和评定目标对象的优缺点。[6]其基本步骤便是根据一定的标准，对评估对象的属性、表现和成效做出判断和评价。为了确保权威性，同时也为了评价结果更为准确，鉴定性评估的主体往往是某一领域的专家。于是，在实践中，鉴定性评估往往表现为项目的相关利益方，特别是项目的发起者或者资助者邀请该项目领域的专家，依据一定的标准对项目的执行过程和实施结果做出评价判断。

(二) 鉴定性评估在我国社会服务项目评估中的地位

根据上述描述和分析，我们不难发现当前我国社会服务项目评估过程所呈现的鲜明鉴定性特征。为了更充分地揭示这一特点，我们于2019年10月对中国知网社会科学I辑和II辑核心期刊和CSSCI期刊论文数据库进行检索，检索篇目包含服务评估、项目评估和社会工作评估三个词的论文，将所得论文分为实践评估、评估研究和其他三类，并统计实践评估论文中鉴定性评估的数量，见表1。结果发现，上述三类检索所获得的总共21篇实践评估论文中，有12篇属于鉴定性评估研究，其比例达到57.1%。

表1 我国社会服务项目鉴定性评估的论文数 (单位：篇)

例如，有关合肥地方政府购买居家养老服务评估研究，评估者针对服务机构建构了“居家养老服务机构评估表”，从服务能力建设、服务过程管理和服务满意度三个纬度建立了二级和三级指标；针对服务对象，评估者同样也使用“居家养老服务对象需求评估表”进行项目评估。[7]同样是对养老服务的评估，另有研究则对服务机构确立了硬件设施、财政情况、职能、人员情况、服务对象的满意度、档案建立与管理等六个方面的一级指标，对服务对象则制定了老年人能力状况和条件状况两个一级评价指标。[8]此外，韩江风的研究虽然不是对政府第三方服务购买的评估，但其引用的评估实例仍然是第三方评估机构的鉴定性评估研究。[9]

从上面的举例以及文献的内容分析可以看到，鉴定性评估在我国当前社会服务项目的评估中确实具有非常重要的地位。

(三) 社会服务项目鉴定性评估的评价

那么，这类鉴定性评估在当前社会服务项目的发展过程中究竟起到什么作用呢？

一方面，鉴定性评估对于规范社会服务项目起到了一定作用。我国传统的社会福利侧重于物质性援助，重在为目标对象提供金钱和物资方面的保障，服务性援助相对来讲还是一个新事物。社会福利的形式通常可以分为现金、实物、代价(实物)券和服务等四种，它们各有自己的长处与不足。[10]从这一角度来看，社会服务是一种不可缺少，同时也是其他形式援助无法替代的方法，最显而易见的便是对老年人的援助。对于那些生活不便，特别是失能的老年人来说，金钱和实物等形式的帮助都无法完全起到基本生活的保障作用，必须提供服务才能满足他们的生存需要。但是，社会服务在我国发展历史不长，相应的服务人员和服务组织专业化水平较低，从业经验缺乏。鉴定性评估的指标体系一定程度上能够对相应社会服务的内容及其水平做出质和量两个方面的度量，对于规范当前社会服务具有不可或缺的作用。

另一方面，鉴定性评估也为政府对服务购买的管理提供了重要的手段。我国传统的政府部门具有重管理、轻服务的特点，其人员编制有限，特别是基层管理部门更是人手不足，难以适应服务性转型的需要。近年来各地各级政府借助服务购买，促进了民间社会服务的发展，同时也适应了自身在转型过程中的功能转变。随着政府在服务购买方面财政开支数额的不断增加，有关的监管工作任务愈益繁重，相应的问责也变得越来越突出。为了适应政府和社会服务发展的这一需要，借助政府和服务组织之外的第三方力量，特别是由相关社会机构的专业人员承担评估任务，确立相应的评估指标体系，或者借助已有的指标体系对服务项目做出客观的评价，便成为解决上述矛盾的重要手段。

但是，需要指出的是，鉴定性评估重在评价社会服务的规范性，其结果并不一定能够反映社会服务的有效性。一些鉴定性评估往往注重相应社会服务的硬件条件和服务人员的资质，但是它不能完全反映最终的服务效果。正如金斯伯格指出的，服务项目的评估与机构的鉴定并不是一回事。鉴定成绩好某种程度上意味着机构在自身建设方面重视、有投入，但是在具体服务执行过程中可能便是另外一回事。一个机构在社会服务的竞标过程中可能是重视的，并且投入了大量人力物力；但是一旦获得了项目，在实施过程中，往往可能不再重视，投入也不如竞标阶段，其结果则是服务效果大打折扣[11]。为了避免这种错误倾向，目前国外的一些鉴定性评估也开始注重对结果的评估，希望通过鉴定性评估的项目能够真正实现项目设计的预期目标。但是，一旦鉴定性评估这样做，其具体的评估性质已经发生转变，已经转向后面我们要讨论的证据为本或循证性评估了。它们的评估依据已经不是相关的指标体系，而是项目实施之后发生的影响或变化了。

此外，鉴定性评估具有强烈的主观性。不论是指标体系的确立还是依据指标体系对评估对象的评价，都是建立在一定的主观认识和评价基础上的。虽然鉴定性评估往往借助相关领域的专家来实施评估，在一定程度上保证了评估结论的权威性和可靠性，但是，即使专家的认识也会受到一定历史阶段的局限，不论是他们制定的评估指标还是提出的评估结论，都可能受到当时他们认识水平的限制，这就很难保证鉴定结果的绝对准确性。

为了尽量提高评价指标体系的科学性，目前国内的一些研究引入Delphi法，借助专家评分的办法对初步确定的指标进行评分筛选以提高评价的科学性。这一办法在医学和护理领域的评估中使用较为普遍[12-15]，公共管理领域也有一些学者探讨使用这一办法进行城市居民生活质量[16]和政府服务购买绩效评估[5]等方面的研究，但是不同研究人员对具体指标的筛选做法并不相同。诸如上述两个公共领域的研究，第一个对理论遴选确立的指标进行了隶属度、相关性和鉴别力等方面的实证筛选；而第二个研究则将初步确立的指标分别发送给从事相关研究的高校学者、负责购买社会服务的政府工作人员以及承包社会服务生产的社会组织成员，经过专家筛选和确认，最终获得评价指标体系。我们认为，这两种方法都具有借鉴意义。

二、鉴定性评估在国外社会服务项目评估发展中的地位

考虑到我国社会服务项目及其评估的历史相对比较短暂，我们不妨扩大视野范围，以国际项目评估的发展为对照，来更加全面地认识和评价鉴定性评估在整个评估研究中的地位和作用。

(一) 国际视野下的社会服务项目评估

西方社会服务项目评估的历史可以追溯到18世纪中期，经历了多次范式的转换之后，迄今已经发展到改革性(transformative)评估时代。[17]特别是受第二次世界大战之后西方国家社会福利运动期间政府和民间资金大量投入的推动，社会服务项目的评估也经历了快速发展期[18]，理论和方法已经十分成熟。随着近年来我国社会服务项目的发展及其对评估研究的推动，国外一些代表性的项目评估著作被翻译引进，[11,18-20]我国对国际社会服务项目的发展已有基本的了解。[21-22]但是，诚如上面分析指出的，社会服务项目的评估实践及研究却始终呈现以鉴定性为代表的主导模式。本文不打算分析这一特征的形成原因，只是希望通过中西比较，加深对鉴定性评估的认识，促进社会服务项目评估的发展及其质量的提升。

纵观国际项目评估的定义，可以说侧重有所不同，有的强调目的，有的强调任务，有的强调方法，还有的综合上述两个或三个方面，但是其对象还是十分明确的，那就是针对具有特定目的、存在于有限时空范围内的项目本身。[23]正是从这一角度出发，目前国外绝大部分的项目评估论著，不论是结果导向、过程导向还是整合导向，[22]本质上都是从项目的生命历程来展开评估研究的。也就是说，有关项目评估可以区分为对项目设计、实施和完成三个时期的评估。美国已故著名学者罗希关于项目评估的定义，便可以认为是上述内容的集大成者。在其生前最后出版的《评估：一种系统的方法》(第七版)中，罗希指出，评估就是研究者运用社会研究方法，研究、评价和帮助改善项目的社会问题诊断、概念化与设计、实施与管理、结果和效率等重要方面。[18]项目评估概念的这一界定，对于我们认识鉴定性具有十分重要的参考价值。

(二) 国际视野下的鉴定性评估

那么，这是否意味着国际社会服务评估领域便不存在鉴定性评估呢？事实上，从美国[24]到欧洲[25]、甚至到亚洲的马来西亚[26]、南美的墨西哥[27]等国家和地区，都存在着大量鉴定性评估(accreditation evaluation)，成为诸如《评估评论》(Evaluation Review)和《社会工作实践研究》(Research on Social Work Practice)等评估和社会服务期刊的重要选题。随着高等教育全球化和国际化发展[26]，鉴定性评估更是成为国际高等教育研究期刊《高等教育》(Higher Educatiuon)、《亚太教育评论》(Asian Pacific Education Review)和《师范教育杂志》(Journal of Teacher Education)等的常见主题。诚如前面所提到的，鉴定性评估最大的特点便是由某一领域的专家对某一社会服务提供主体的资质和条件进行评定。例如，美国社会工作教育委员会便独家承担了该国高校本科和硕士阶段社会工作教育课程的鉴定工作。曾经有学者对该组织的专家在国际SSCI杂志发表文章的数量、政治倾向，以及被评估课程项目学生的GRE水平提出质疑，对CSWE目前的独家垄断鉴定模式提出质疑[28]，引起了学术界广泛讨论。[29-30]尽管国际著名学者米奇利提出，鉴定组织专家的SSCI论文发表数量与他们对社会工作实践的评估没有必然联系，而学生GRE考试水平也与学生的社会工作实践能力没有直接的关系；[30]但是上述争议一定程度上也反映了鉴定性评估方法值得关注的问题，即鉴定者本身的专业水平是否能够胜任他们对项目评估的要求，他们制定的标准是否能够有效反映评估标准的科学性？

金斯伯格2000年出版的《社会工作评估原理与方法》一书在有关社会工作项目评估过程部分，讨论了被他称为传统评估方法的认证(licensing)和鉴定(accreditation)两种方法。[11]所谓的认证，指的是对社会工作机构和社会工作者借助有关机构及人员从事社会服务资格的许可的检查，实现对相关服务的质量保证的一种办法。至于鉴定，通常指的是对于服务机构是否达到鉴定机构提出的标准的一种证明。比较鉴定与认证，一般来说鉴定往往只是针对服务机构，重点是以往服务的质量及其对机构服务能力的一种判断。机构的认证和鉴定的差别在于，认证往往是由政府职能部门组织的，是对某个社会组织提供相关服务的一种许可；而鉴定通常则是由民间机构组织通过某机构以往从事的相关服务质量或条件的评价，最终为它是否被政府允许从事某一方面的服务提供参照。例如，美国、加拿大、澳大利亚和英国的公共医疗卫生领域都存在着对服务机构的鉴定性评估做法，其中前三个国家的鉴定体系是全国统一的，而英国则是分散的。[31]对于服务机构是否必须接受鉴定，不同国家情况也不同。例如在护理领域，法国要求机构必须接受强制性鉴定，而加拿大的鉴定要求则是自愿的。但是，比较研究显示，加拿大护理机构鉴定的强制性程度在上升，而法国则变得更加灵活。[32]

上述研究说明，一方面鉴定性评估也是当前国际上社会服务项目评估中一种重要的实践和方法，另一方面它也有着自己独特的运用领域，主要运用于人类和社会服务机构的评估。就社会服务评估来说，国际评估界日益转向项目生命历程的设计、实施和结果等三个方面的评估。就社会工作评估来看，当年金斯伯格便将鉴定等形式作为一种传统的评估方法，其后出版的更新版本的社会工作评估论著都没有涉及机构和人员的认证和鉴定问题。[33-35]这意味着评估方法的一种分化发展，也就是说某种程度上鉴定和认证等主观判断性评估，已经与以经验为基础的服务项目评估成为两种不同类型的评估方式。

(三) 国际项目评估范式与鉴定性评估的地位

通过上述分析和讨论可以看到，鉴定性评估和项目服务评估其实是两类具有不同运用场合的评估方式，我们不应该用鉴定性评估取代项目服务评估。接下来我们将从国际项目评估范式的发展角度进一步考察鉴定性评估与国际服务项目发展走向的关系。

关于国际项目评估范式的发展，最具代表性的概括是库巴和林肯区关于测量(measurement)、描述(description)、判断(Judgement)和建构主义等四个阶段的划分。[36]纵观这一发展历程，其基本线索便是人的主体意识的不断强化。第一代评估研究以测量技术的发明和利用为特征，其基本特点是评估者对评估对象不带丝毫主观色彩的测量和描述。第二代评估可以认为是在第一代评估基础上的发展，试图在测量的基础上对评估对象作出价值判断，测量则成为项目评价的工具。第三代评估在第二代评估的基础上再进一步，将项目目标同样作为评估研究的判断对象。建构主义的第四代评估可以说是项目评估研究范式发展中的一个重要转折。在方法上，它反对过分强调传统的科学范式，主张对不同利益相关者确认的评估对象的主张、焦虑和争议作出回应。在内容上，第四代评估反对纯粹的定量测量，要求突破权威崇拜，尊重社会价值的多元性，将促进社会发展，特别是弱势群体的发展作为评估研究的宗旨。[21]有关研究更是在建构主义的基础上提出新的改进性评估的新范式，将社会正义直接作为项目评估的宗旨。[17]

尽管项目评估的上述发展走向背离了传统的价值中立，但是在方法论上仍然体现了现代社会科学研究的经验性取向。就建构主义范式来说，它不同于实证主义的自然科学的研究传统，彰显了现代社会科学方法论的人文主义特征，回应了社会生活不同于自然世界的本质对研究方法的要求。但是，这一发展依然延续了现代科学的经验论基础，那就是一切评估研究的结论都应该建立在可以观察得到的事实依据基础之上，并在当前整个人类和社会服务领域方兴未艾的循证实践大潮中得以充分展现。[37]

循证实践的概念最早起源于医学领域，指的是将“经严格评价后的文献知识用于帮助住院医生临床决策”的实践方法。[38]当然，一个好的医生的临床实践并不能仅仅依赖于证据，也离不开临床经验和病人偏好方面的要素。在其他人类社会服务过程中也一样，除了研究证据、实践经验和服务对象等基本要素以外，循证实践也要关注这些决策要素的广泛政治、社会、经济和职业背景，区分组织内外，以及实践层面的决策要素。[39]项目评估领域的这一方法论思想的体现，被称为证据为本的评估、或循证评估(evidence-based)[2]。

与循证方法发展相对应，近年来国际项目评估发展的另一个特点是强调理论为基础的评估。[40-42]其实，所谓的理论为基础的评估并不是独立于事实为本的评估的一种方法，更为确切地说应该是循证评估的一个分支。不同于传统项目评估研究仅仅关注投入和产出之间的关系，而将项目的实施过程看作一个黑箱，理论为本的项目评估试图打破过程的黑箱，论证项目变化因果关系的内在机制原理。[23]因此，所谓的项目理论，并不是项目评估的理论，而是对具体项目实施过程中有关的干预为什么能够实现其预期结果的机制的理论解释。显然，要想通过评估验证这一项目理论的成立，依然离不开事实为本的经验性方法的支持。但是，项目理论的验证要比一般的假设验证更为复杂。一个项目理论的成立，不仅取决于理论本身能否正确概括项目干预及其结果之间的机理，还取决于项目实施的过程是否让项目理论得到体现。如果项目理论所预言的变化实现的条件不充分，或者说项目实施过程与项目理论要求的条件不符合，那么即使项目理论本身是成立的，但在具体的评估结果关系中也不可能得到证明。所以，理论为本或项目理论评估既涉及项目结果、过程结果关系的定量假设检验，也离不开对项目实施过程的经验性定性描述。

通过对上述关于项目评估范式的演变方向分析，可知鉴定性评估并不符合当前国际项目评估的发展方向。

三、国际社会服务项目评估发展的启示

通过上面的分析可以看到，鉴定性评估是国内外评估研究的一种重要形式，但是在具体的运用方面有其特定的场合。在国外，鉴定性评估通常是对社会服务组织及其人员的资质和水平的一种评价。如果将认证也视为一种广义的鉴定形式，那么鉴定性评估可以视为政府赖以保证社会服务质量、对社会服务组织及其从业人员进行管理的一种方式。但是，目前国内的评估研究有一种泛化倾向，将鉴定性评估扩展到社会服务项目的评估，甚至作为项目评估的主导方式。当然，在实际运用鉴定性评估的过程中，国内有人扩展了鉴定性评估的内涵，将服务对象的满意度评估、服务成效等内容都纳入到鉴定性评估之中。这种做法虽然一定程度上弥补了鉴定性评估的局限性，但是也混淆了不同评估方法之间的差别，影响了项目评估内容的丰富性和研究深度。为此，我们主张将鉴定性评估区别于针对项目生命周期的循证性评估，并将其区分为项目服务从业人员的资质认证评估和机构基本条件的评估，一方面加强社会服务项目的准入性管理，另一方面提升评估在社会服务项目成效评价中的作用。

首先，必须借助鉴定性评估加强社会服务组织及从业人员的准入性管理。社会服务因为服务内容的特殊性，特别是在服务与被服务双方关系上的不平等性，必须严格把控服务组织与从业人员的基本素质，以免给当事人造成不可挽回的消极影响。当前，为了满足人民群众不断增长的美好生活需要，党和政府加强了社会服务的投入。党的十九届四中全会关于社会治理体系改革的决定又在传统的政府部门之外、为各类非营利性和营利性组织及从业人员提供了大量参与社会服务的机会。但是，我国的社会服务尚不发达，从业组织和人员的专业化水平普遍较低。虽然近年来我们推出了社会工作师专业水平考试，其层次也从低级、中级发展到高级证书，但是持证人员的实务水平仍然较低，缺乏专业的职业训练。同时，我国以往对非营利性组织和营利性组织区分界线不清，有关服务人员的从业出发点千差万别。所有这些问题都告诉我们，加强对社会服务组织及其从业人员的鉴定性评估必不可少，这对于保证社会服务的质量，真正满足人民群众，特别是满足弱势群体的基本需要具有重要的作用，同时也有助于提高社会服务组织及从业人员的专业化职业能力，确保社会服务质量的稳定提高。

其次，必须明确社会服务项目评估的概念，真正将项目评估落实到提升项目成效这一根本宗旨上来。为此，我们必须将评估的重点集中到社会服务项目的生命周期，从项目设计、实施和结果三个方面开展循证性评估。项目的设计评估是科学规划社会服务项目的基础，也是我们评价社会服务项目科学性的依据。只有在项目设计之初便开展评估，通过对服务对象的需要评估和项目的可行性论证，才能充分发挥有限的社会资源的作用。只有如此才能不忘初心，迈出社会服务项目管理的第一步。在科学规划和设计的基础上，我们也要加强项目实施过程的评估，确保项目服务真正按照设计的目标、一步一个脚印地推进。如果项目的执行过程偏离了项目计划，那么即使成效再好也不是项目本意所追寻的，而是对有限的社会资源的一种浪费。在确保项目按计划实施的同时，我们最终必须确保项目的实践结果达到了我们的预期目标，产生了项目的预期变化。当然，所有这一切评断，必须建立在可以观察得到、可重复的数据基础上，只有这样的评价结果才能真正为我们提高服务成效、完善服务项目管理奠定基础。

最后，要想真正发挥项目评估在提升社会服务项目成效方面的功能，我们还需要了解相关的服务措施或干预产生成效的机理，这也是国际上重视项目理论评估的原因。如果我们要将某一项成功的社会服务项目推而广之，就不能满足于其已有的成功，而必须了解它成功的原因。要想打破项目过程的这一黑箱，评估研究就不能仅仅局限于我们实施了什么干预、最终实现了什么效果，而是要了解通过相应的社会服务为什么产生了预期的变化。唯有如此，我们才能将已有的经验成功复制到另一地点的不同服务对象身上。项目理论评估除了加深对特定社会服项目的机理认识、提高社会服务项目的管理能力、更加有效地实现项目服务的成效之外，对于上面提到的社会服务组织的管理水平也有极其重要的作用。项目理论评估是一项综合性的评估，从内容上来看，既包括对项目影响结果的评估、对项目理论的假设验证，也包括对项目实施过程的检验；从方法上来说，影响评估和假设验证都是典型的定量研究。而过程评估则又是基于经验的现代社会科学中的定性或质性研究方法，它对社会服务组织的管理水平有着非常高的要求，缺乏规范和严格的项目服务记录及文件归档，要想在事后执行项目理论评估是完全不可想象的。[43]笔者曾经在十多年前试图对某一社区的居家养老服务进行项目理论评估但最后没有做到对项目理论的经验性验证，其重要原因便是当时的社区服务组织缺乏必要的历史档案。[44]随着近年来政府服务购买及其考核的推进，虽然社会服务组织的服务档案管理有了长足进步，但是离规范性要求还是有一定的距离。同时，与服务档案管理相联系的项目及组织的全面管理任务更为繁重。笔者在十年前认为，项目理论评估不但对提高我国社会服务组织的管理有着重要促进作用，而且是提高我国的社会服务项目评估水平的必要环节[43]，这一结论对于我们当前的社会服务项目管理和评估来说依然成立。