文/彭亚平
迄今为止,技术治理依然是个无处不在又令人捉摸不定的“幽灵”。它为精细化治理、网格化治理、大数据治理等理念提供了方法论自信;它是深埋在项目制、运动式治理和行政发包制等理论观察中的草蛇灰线;它因奔走在电子政务、精准扶贫、土地资源管理、流动人口管控等治理实践中而被研究者捕捉。在欢呼技术时代来临的同时,人们也在批判技术治理对社会的裁剪、对个体施加的权力,揭示其想要“将体制和结构层次的问题化约为行政技术的问题”却又深陷在现有治理框架的困境(黄晓春、嵇欣,2016)。与此同时,治理的困局又不断地召唤新的、更好的技术。以基层治理为例,个人偏好如何反映到公共偏好之中,是基层治理的症结所在。居民二元分化、中产阶级参与社区事务的兴趣缺乏、社区抗争愈演愈烈、居委会弄虚作假等治理难题都传达了一个根本问题——民意难以正确、及时表达和有效回应。
技术治理的使命正是通过识别、处理源源不断的问题进而把社会清晰地呈现在国家面前。那么,它能够完成其使命吗?为此,本文取材民意调查领域,去追问技术治理的逻辑及其命运。将其转化成经验问题,即通过揭开民意生产过程的暗箱,探究由基层政府实施的民意调查为何普遍公信力不高,甚至被质疑造假?它能反映真实的民意吗?如果不能,原因何在?
某街道以项目的形式成立民调小组,对辖区内34个居民区进行连续三年的民意调查,内容涉及社区安全、卫生、环境、邻里关系、民生设施、居委会工作等基层治理各方面,并编制成各社区排名指标体系,用于街道各部门对居民区两委的考核、街道行政决策的参考。围绕着民调,有街道、职能科办、居民、技术人员等几类相关主体。街道及各职能科办负责问卷设计、拟定指标;居委会负责配合街道抽样和组织问卷调查;居民负责填写问题;技术人员即第三方学术机构负责提供技术指导以保证民调的科学性。
1.问卷设计:如何筛选情境?
问卷是社区情境的集合,即将民意搜集限制在一定的范围内。作为民调的执行者和组织者,街道面临的任务是从数十个社区内无数个可能的社会情境中,抽取组成问卷的代表情境。是什么样的经验标准左右了民调问卷中情境集合的筛选原则?“上级、老百姓关心的”是情境筛选的经验标准,但这是个泛指。在实际操作中,哪些情境被筛选进入集合,则基于官员和相关工作人员的日常经验。
与2015年相比,2016年的民调做了一些调整,主要是新增了几个版块。个中缘由,既有街道(特别是负责民调的领导人)与各职能科办关系的因素,也有民调与街道其他项目兼容的考虑,还与时事变化相关。新增的“协助街道工作”版块,分别对应各个职能科办的具体工作任务,即让居民评价其所在社区两委在这些工作上的表现。为什么新增该版块呢?负责民调的副主任在可行性分析会上说:“前两年的民调,效果很好,我们很多科室年终评估就用到了这些民调的排名……(街道)其他职能科办希望能共享这个数据。”民调是以街道的名义进行的,使用财政拨款,取得街道各职能科办的支持是关系到民调工作能否继续开展的因素之一。民调结果到底有没有用,很大程度取决于各职能科办是否用得上。要想数据用得上,必须在版块设计上加以体现。新增的自治和党建特色项目,也是这两年区里和街道主推的政府创新项目。街道的用意,除了检验它们在各社区推广的效果如何外,还能与区里和街道目前的工作重心相配套。
2.情境的压缩方向:如何问问题?
情境样本框确定好之后,接下来的程序是如何将情境定义为问题?一个问题的诞生,意味着一个情境朝着某个方向被限定好了。以代表情境“社区组织的人大选举和业委会选举”为例,居民与该情境发生联系的途径有多种,随之会产生多种对情境定义的可能性,并对应各自的目标问题。当问题最终被定义为“您认为居民区内人大选举和业委会选举组织得如何”时,街道的权力在于,基层民主这一情境被定义到居民对所在居委会组织类似活动的能力上了。对一个社区基层民主“能力”的衡量,既不是人大代表能否履职、选举过程是否公正,也不是造成目前选举冷漠的原因等问题,而是询问居委会组织选举的能力。显然,居委会的组织能力无法支撑起民主监督活动这个主题,却又带着这个主题的帽子,并成为计算基层民主指数时的标准。
街道为何如此命题呢?这样符合科学原则吗?民调的目的是居民对社区的评价,街道把民调与绩效评价结合起来后,民调就变成了居民对居委会的评价。人大代表的履职、选举过程的公正性不属于社区两委的工作范围,选举冷漠是一个敏感的政治话题,加上两委对选举工作的影响范围也只在于组织这项活动,所以只能朝着这个方向命题。类似的例子广泛存在。公共卫生方面不问医患矛盾、看病难、看病贵等热点问题,而问健康知识讲座做得好不好;外来人口管理方面不问城管执法、落户困难,而问群租合租治理问题;法律援助方面不问上访、拆迁、业主维权、环境抗争,而问家庭暴力的调解问题、法律宣传力度。显然,上述学界和社会关心的基层治理热点问题,几乎都没有进入问卷,但进入问卷的问题又都跟它们沾边,得以支撑背后的主题。当民意调查的操作权掌握在基层政府手中时,它内在的基因如管辖范围、上下级关系就会植入到从社会情境化简为问题的过程之中。
1.“做卷子”:集中填写问卷的理由
此次民意调查最终的抽样方法是以各社区人群分类为层级的分层抽样,调查方式是集中填写问卷。把样本集中起来填写问卷的方式在西方民调中很难见到。用居民常说的话叫“做卷子”,填一份问卷好比考一场试。在成本和仪式化的考虑下,一场民意调查要跟其他不少活动结合起来,安排得紧锣密鼓。具体流程有:各位居民代表在会场坐定后,该社区书记上台作年终述职报告;在技术人员的监督和辅导下,受访者填写问卷并回收;部分居民代表参与街道组织的结构性访谈,对社区两委工作人员进行打分和评价;街道工作人员对社区两委逐一访谈,并相互打分。
在各社区的民意调查过程中,街道人员、技术人员、社区干部、居民代表全部到场,工序明确、高效运转。半天时间,所有事情都赶在一起办了,一个社区的任务就完成了。
然而,民调抽样最重要的随机性指标能保证吗?技术上的解释同样有说服力。集中填写问卷可以保证调查环境、调查时间和调查人员造成的影响是同质的,控制住常见的情境、访员和季节等因素。另外,街道也设置了针对各个社区的小样本随机测试,采取街头偶遇的方式,以便测试问卷的信度和效度,并作为集中填写问卷方式的稳健性检验。
2.居民人数的控制权:分层抽样的政治学
抽样时如何分层呢?各社区样本数量的下限被统一规定为50人。这些人从哪里来?民意调查通常很难取得一张载有所有人口成员的名册,街道无法掌握各个社区人口的实时和动态信息,并没有一个质量较高的可供抽样的总体。就算能够调动户籍数据,因拆迁、工作变动、升学等因素的人口流动也会造成大量的无响应误差。
民调的分层抽样方案是社区向街道上报总体数量作为抽样库,由街道确定样本。为保证随机性,街道对每个社区的总体库做了一些规定,如人数的最低限制、居民样本标准、居民类型的规定、居民基本信息。各社区提交符合规定的样本库后,交与街道方进行分层抽样。将确定抽样总体的权力交与居委会可能存在一些问题,居委会选择被抽样居民时,依然依据成本原则。事实上,掌握所有居民的资料对不少居委会来说难度很大。能够被掌握资料的,一般是信息被社区登记了的人。因此,全社区居民已经依据“与居委会有无交集”这一指标经过了筛选。只要对问卷中的个体特征变量如居民年龄、受教育程度、工作性质分布情况稍加考察,比如做个散点图,马上就会发现存在不同程度的偏态,退休老年人作为参加社区活动的主力军的局面依然没有改变。然而,分层的依据不是年龄、职业或者收入,而是党员、楼组长、志愿者、群众活动团队成员、物业管理人员、驻区和共建单位人员、业委会成员、人大代表/政协委员、社区民警和其他居民十一类人群,只要保证这些类型的人员比例符合要求,在技术上就算抽样质量良好。人群划分方式与基层政府对现有人群的分类相对应,以便民意调查的数据结果能够作为参数直接输入到科层机器之中。楼组长的意见呈现什么形态、群众团队成员对哪些问题反响比较热烈、共建单位比较在乎什么问题,等等,都是街道所关心的。
居委会的控制力还体现在样本数量上。根据样本量设置规则,每个社区填写问卷的居民数原则上不少于50个。从2016年民调实际到场人数来看,各社区填写问卷的居民平均数为51.14,其中到场人数刚好为50的社区有15个。社区居委会对到场填写问卷的居民有着怎样的控制权?对精准到场人数的一个解释是,人群分类标准的漏洞给了居委会转圜的余地。按照十一类人群的划分标准,抽样库里居民类型重叠的现象较为普遍,某人可以既是志愿者也是群众团队成员更是党员。社区干部可以任意配置类型重叠的居民以符合要求,操作的空间更大。
居民为所有刻度赋值后,街道可依照各个加总原则将刻度值累加,得到不同的指标和对应的社区排名、档次,最终绘制成民意地图。构建指标体系是民调操作的最后一个阶段,也是街道和社区最为看重的部分。各个指标基于各个版块制作而成,最终计算出来的指标既要给各个职能科办使用,又要呈给街道领导阅读甚至上报区里,还会直接制作成《XX社区诊断书》下发到各个社区。自然,民调结果怎么做出来,他们的意志是个重要变量。
1.分值权重
构成民意的意见本无优/劣、重要/次要之分,但暗含操作者目的的民调却对此进行了排序。在拟定民调指标时,构成指标的各个问题的分值权重,就是街道对各个社区情境的重要性排序。2016年的各个版块被分配了不同的权重,甚至每题的分数都不一样。为了获得职能科办的支持,使民调结果能为其日常工作所用,问卷中的所有问题都可以与各个职能科办的工作范围相对应。由此,可以排列出各职能科办在问卷中所占的百分比。服务办、平安办、管理办等分值高达16%,妇联、团工委、武装部、工会却只占1%,部门之间极不均衡。分值权重既反映了目前基层工作的重心,又把街道各部门的地位作为结构的基因植入了民调。
2.计算方法
作为对街道所有社区的情况摸排,从2015年起,每个年度的民调都设置了进步指数,计算素材是各社区历年的民调得分。从结果看,较之2015年,2016年的分数出现下滑,也就是说大部分社区在2016年是退步的。在成果说明会上,副主任表态:“进步指数得要,不然上面看到了(这一部分缺失),会很显眼。进步指数这个东西,就是我们街道工作搞得好不好(的直接体现),一眼就看出来了……有没有别的办法想?”在长时间的讨论中,技术服务人员提供了几种计算指数的基准法,在场的街道民调小组成员(由街道工作人员组成)则一一询问这些方法的科学性。最终,动态指数和静态指数这对统计学概念提供了“技术支持”。繁琐计算的成果“令人欣慰”,进步的社区稍占多数。
3.各指标档次划分
在指标和排名计算好之后,要区分档次。然而,到底分为几档,按什么标准分档次,得视情况而定。各社区在各个指标中被分为非常优秀、比较优秀、一般、较差四档,词语逻辑对称的“非常差”则缺失。街道设置的分档原则是:前两个档次是指数为100及100以上的社区,后两个档次是指数为100以下的社区;除首尾外,每个档次划分的区间是均等的,如以10为区间。然而,设置档次的玄机在于,具体以多少为区间各不相同,以5、10、15为区间的情况都存在。原因也很简单,各个指数的社区分布情况差异明显,不能采用统一的分档次方法。在此作用下,档次呈现如下规律:中间两个档次比首尾两个档次的社区数量要多;“非常优秀”比“较差”的社区数量要多。各社区档次直接表现在各个指标组成的民调地图上,以形成可视化成果。在街道各社区的行政地图上,代表中等水平的“比较优秀”和“一般”的社区分别被涂成橙色和蓝色,代表极端水平的“非常优秀”和“较差”的社区被涂成红色和绿色。每个地图上,红和绿总是少数,而红色大都比绿色多。
纵观整个民调过程,各级权力主动或被动设置自己的规则,却以“事事有理由、步步讲科学”为宗。最终,富含信息的社会情境消失了,可视化的指标和地图被呈现出来。经过街道、居委会在各个环节上的层层加工,民调反映出的民意对他们来说再熟悉不过了。不同的是,街道在某些方面获得了合法性。持续多年的社区民意调查是街道实实在在的社会治理创新项目,民调的成果将作为职能科办年终评估各社区的量化参考,成为决定社区干部评优、确定编制甚至去留的标准,甚至有可能纳入决策参考。对居委会而言,一张以本社区居民的名义开具的《社区诊断书》从街道下发,为以后的工作确定了方向。政策合法性、官员政绩、官僚机器运转参数、社区工作方向等,都是民意调查为基层各主体带来的好处。唯一用不到民调数据的反而是居民。
然而,民调本来是个统计学过程,如何变成了权力入侵的政治过程?上述问题让我们回到最初的疑惑——技术治理能够完成其使命吗?从我们对民意调查全过程的解剖来看,问题的关键似乎并不在于技术的发展水平和严谨程度,而是技术治理的逻辑。当民调技术将“潜在”的复杂民意转变为“实在”的民意数据和指标时,民意被一步步化简、压缩。在此过程中,再严格的技术都只能保证化简的程序“合法”,而化简的方向则由操作者决定。同理,政务微信/微博技术管不了页面新闻或推送千篇一律,网格化治理技术管不了网格员拍照上报容易解决的事务,舆情监测平台管不了对事件识别、分类和定性的现实考量。行文至此,技术治理的悖论逐渐清晰。国家通过技术治理打量社会的同时,也在制造其眼中的社会,它必然会把自己的基因植入其中。因此,技术治理的悖论是:国家通过技术之眼观察社会图像时,它看到的可能是自己的倒影。