木怀琴
5月1日,美国总统行政办公室以国家科学与技术顾问委员会(PCAST)的研究为基础,向奥巴马提交了一份名为《大数据:把握机遇,维护价值》(Big Data: Seizing Opportunities, Preserving Values)的报告。核心观点是:公共和私人部门可以利用大数据技术最大限度地获取利益、减少风险;虽然大数据无疑增加了政府权力规避制约的可能,但也内含了降低这一风险的方案,增强政府的问责性,保护隐私与公民权利。
该报告共分六个部分,在第五部分“迈向大数据的政策框架”中,尤其关注了大数据与公民、消费者、隐私权、隐性歧视之间存在的紧张关系。报告人着重指出,大数据可以创造巨大的社会利益,但是也可能引起多种有形或无形的危害。这类危害不止是侵犯隐私权那么简单,甚至会造成对个人或群体的歧视。这一歧视可以是大数据在模型建构和使用方法上的无意结果,也可以是对弱势阶层的蓄意牺牲。不难看出,前者可以通过相对简单的技术办法加以解决。比如设计一个智能手机的应用程序,通过搜集用户反馈的海量信息,为城市管理提供基础数据。这个程序虽然明显忽略了相当数量的非智能手机用户(如老人与穷人)的需求,但是可以有意识地通过其他社会调查方法加以弥补。与此相比,蓄意歧视显然需要得到更加严肃的对待。
就美国的社会立法而言,在关乎社会公平的特定领域内,如就业、信贷、医疗、教育,法律均要求用于预测算法的个人数据和最终决策具有相当程度的透明性,并配合以补救性的校正手段。事实上,之所以存在这些保护措施,反倒是因为歧视在美国历史上从不少见。20世纪早期,银行就在使用个人居住信息来甄选客户。直到1975年《房屋贷款披露法案》颁布之前,是否给予某人贷款还取决于他所居住的区域而非个人的信贷能力。银行用“划红线”(redlining)的方式标示此前无贷款且此后也不贷款的区域。这个手法一用几十年,成了歧视非裔美国人、拉丁裔、亚裔和犹太人的应手工具。有类于此,计算机算法和在线数据汇总一旦被用于确定公民的人口学特征,就有可能形成系统性歧视。例如,划出一条“数字红线”,排斥对使用者而言并非必要的特定群体,无论是客户、员工、租赁者,还是借贷人。
报告人提醒联邦政府,必须关注大数据有可能造成有悖国家法律和社会价值的歧视。因此,公共政策与信息技术的进一步结合要想具备正当性,首先需要解决一个问题:如何才能更好地检测、计量、纠正那些由自动化决策产生出的歧视性影响。报告认为,大数据技术既可以导致歧视,也可以用来支持公民自由。联邦政府中涉及公民权利的机构必须能够辨别出源自大数据分析、又不利于被保护阶层的行为与结果,进而发展出一整套方案,用以调查并解决相关案件中的违法现象。评价过程中,各机构应当考虑到数据的层级、信息汇总的语境、信息所针对的人口群体,以及相关群体的立法期待。政府部门应与公民权利组织一起,使用大数据工具来确保弱势群体能够得到平等的对待。
不难发现,该报告努力将美国联邦政府的角色设定为不同利益群体之间的调和者,将大数据技术可能导致的政治问题转化成一系列可操作的技术流程。不妨提及,4月23日至24日,巴西圣保罗召开全球互联网治理大会。各国代表就反抗网络霸权、加强网络治理等议题形成集中讨论,从而不可避免地聚焦于自去年以来持续发酵的“棱镜门”事件,以此为出发点检讨网络治理与公民权利的关系。而这显然是上述报告并没有回答、也不希望回答的问题。