姚胤米
由于人工智能的介入,四川、广东等地,先后有8名被拐多年的儿童被重新找到。
这意味着,我们可能站在一个时间的分水岭上:一种犯罪类型正在被技术逐步瓦解。
人工智能破案的事不是在未来发生的,这件事就发生在6月18日。2019年1月25日,一个星期五,四川省公安厅8层的DNA实验室里,近300份DNA样本被录进检验系统中。下午两点多,所有信息都收录完毕,接下来是等待结果。打拐处处长蒋晓玲在办公室里坐不住,她叫上搭档胡丽,两人一块上楼,直接坐在DNA检验系统旁。
机器运转得很慢。那个DNA库“比较老”,蒋晓玲的手一直放在仪器旁边的电脑鼠标上,“一会儿刷新一下,一会儿刷新一下”。她很急,想要马上知道结果。
人工智能出现了
过去几年,四川打拐的警察们都在跟一个案子缠斗。最初,只是2014年4月一个四川遂宁的儿童被拐,经过了两个多月的侦查,同年发生在巴中、南充的两个拐卖案被串并到一起。四川省公安厅调度几个市辖的警察成立专案组,称为“4·26案”。这些案子手法一致、嫌疑人体貌特征接近。
线索都指向了王×文。
他走路有点拖,“但也不是瘸”。2014年7月31日,在四川省达州市渠县老家,王×文被抓了,这次行动有3名男孩被解救。经过进一步审讯,一个惊人的进展出现了:从2008年起,发生在四川多市县总共13起儿童拐卖案,都跟王×文有关。很快,这个系列拐卖案被公安部列为部督案件,但这只是个开始。
干了多年警察,蒋晓玲偶尔会遇到这样的案子。这些案子的线索就像一根断线的风筝,会在某个环节突然断掉。警察们用尽一切办法,不放过任何机会,但所有的努力都卡在一个关节处,成为积案。
王×文就是这样一个关节——他不断翻供,拒绝提供中间人的信息。越来越清楚,指望从他这里打开局面并不现实。
青少年是儿童成长最迅速的时期,孩子的脸一年一个样子。时间每多一天,找到的概率就少了一些。最长的一起拐卖案,有的警察跟了10年,沮丧感一度笼罩着他们。DNA比对已经进行过一次,无功而返。那一次,警察们完全依赖人的经验,从一个人口数据库中,筛出一批儿童,但没有一个中的。——即使是最亲密的父母,对于失踪了多年的孩子,肉眼和记忆也并不可靠。
直到人工智能出现了。
2018年11月,上海漕河泾开发区软件园的优图实验室里,一台拥有4块GPU的组装电脑开始高速运转。显示屏的编程软件终端界面上,一串串超级长的字符自動生成,动态移动,像一道向上流动的瀑布。
这些字符,代表着一个庞大数据库中,与10位在10年前被拐儿童的相似程度。两个小时后,研究员晓程的电脑上生成了10个文件夹压缩包。核实无误后,文件夹压缩包最终被转交到蒋晓玲的手上。
每个文件夹里有101张照片。第一张照片是被拐儿童,看着有年头了。像素很低,很模糊,是个只有两三岁的小男孩。
剩下的100张照片,是100个13岁左右的儿童,他们以满分100分制降序排列。一张照片下写着分数:98.3。这意味着照片里的人与被拐儿童有98.3%的概率是同一个人。
提交给四川警方的说明文档中,优图团队的汤海鹏做了解释:75分是万分之一阈值,80分是十万分之一阈值,85分是百万分之一阈值。以75分为例,如果两个人脸比对分数超过75,则这两个人脸是“万里挑一的像”。
这是跨年龄人脸识别技术的第一次应用。人工智能是否可以帮警方解决一个多年的难题,没有人知道答案。在四川省公安厅,参与打拐的警察们都充满期待。有人很乐观,猜测可能会比对上几个,一个干了多年警察的老刑侦比较保守,猜两个。
多年以来,这个案子成了他们最大的心结。蒋晓玲说,要是这条路走不通,“我们可能现在又换另外一条路走,反正一直得往前走,走下去,不能停止,一直得走。”
那天,他们一直在DNA实验室里等了8个小时,晚上10点多,仍然没有结果出来,他们只好先回家。下个周一,一到公安厅,蒋晓玲就直奔八楼。她还是不停地刷,没有,然后再刷,上午9点多,“一刷新,刷,出来了四个人。”
盯了一会儿这个数字,她赶紧回过神来。“一下子从八楼跑到六楼”,她找到胡丽,语气特别兴奋和激动地说:“比上了4个!”
案子拖了快10年了。两个女警察在公安厅六楼的走廊里情不自禁地“跳圈圈”,一直在转。“搞得整层楼别的科室的人都跑出来看,说打拐处的怎么回事。”回忆起这个细节时,蒋晓玲抑制不住情绪,眼泪要掉下来。
“4·26案”是一个系统工程
王×文是一个记忆力极其出色的人。在描述拐卖现场时,他能记住几乎所有的细节。但一旦谈起孩子的下落,王×文要么翻供,要么就“不记得了”。
即使掌握着越来越多的刑事侦查手段,但面对这样的拐卖案,也没有立刻奏效的办法。——错过找回失踪儿童的黄金时间,就只能从市县一级适龄人口中进行搜索,这意味着至少数十万级别的检索规模。如果进一步扩大搜索范围至省一级,检索规模将急剧扩大到千万以上,堪称“大海捞针”。
负责打拐的警察们付出了大量努力,他们的名字很难被一一记下。比如,四川省很多老刑侦都记挂着这个案子。其中一个老警察,2018年被公安部评为百佳刑警,已经50多岁了。一直参与案件,工作做得很细。
公安厅刑侦局局长王宏伟回忆,他到省厅工作,接起这个案件,“当时还没有打拐处的时候,这一块工作就抓得很紧。”
“4·26案”是一个系统工程。“就像我们猜谜语,你首先要揭晓谜底,这个我们有一个艰苦复杂的侦破过程。”王宏伟说。
但越到后面,案子变得越棘手。因为王×文拒不供述这些被拐儿童的下落,全国打拐DNA信息库比对也没有结果,案件的侦破工作陷入僵局。
对于那些丢失孩子的父母来说,10年里,他们只是在尝试各种徒劳的办法。桂宏正听说深圳有个父亲“通过不断地在电脑上发发发”,找回了孩子。他就也买了一台电脑,在天涯论坛、百度贴吧里发帖。他加了三十几个寻子微信群,每天收到成千上万条消息。
孩子被拐前唯一清晰的单人照,被印在各种形式的寻人启事上。包括:张贴在电线杆、建筑物外墙上的普通A4纸;可以用一根绳子连接起来,挂在脖子上双手托举的泡沫板;可以被挂在汽车上几个月不掉色的彩色喷绘布;还有寻人公益组织为了某次活动而印制分发的扑克牌。以及,郑州一家私人手机店的墙面上——手機店的老板也是被拐孩子的父亲,他的店铺墙面上全是丢失孩子的照片。他让来店里买手机的人都看一眼,这样找到的希望就多一些。
但这只是其中的一个故事。现实比期待残忍多了。
每天泡在数学题里
线索匮乏,专案组的警察们各种办法都试过了。
其中的一些办法,蒋晓玲现在看来,会觉得“很幼稚”。一次,专案组到广东,借了一间办公室。警察曹军和十余名同事每人对着一台电脑,一条条看别人的“家谱”。——一个家庭里有几个小孩?最后一个是不是男孩?和姐姐相差多大?和父母的年龄相差多大?
他们每天泡在数学题里,“看瞎了,几乎家家户户都好多人啊,比我们那里人多多了。”十几万条数据,专案组的警察用肉眼一个个筛查,最终颗粒无收。
2014年底,他们曾经冒着极大的风险把王×文从看守所提出来,押到广东去指认现场。 专案组十余名警察集体行动,曹军也去了。他是武胜县的警察,那起农贸市场的案子串并后,他被领导指派加入了专案组。为此,他到广东出了数不清多少次的差。走访得多了,他对当地的民风也有了解,“他们那里,家里没有男孩是没有地位的。”
曹军非常符合人们想象中的基层警察,长得高大,身材很壮,能吃苦,看起来没有架子,说话很生动。押解期间,专案组的民警们和王×文吃在一起,住在一起,24小时轮流看守,又要防止他生病,还要提防他自残或自杀。
出发前,王×文说:“应该能找到。”可一到目的地,他就改口说:“路都变了,认不出。”
车在市内刚开了没多远,王×文说:“车开得太快了,我看不清。”曹军他们只好押着他下来走路。走了一会儿,实在太慢,他们便找了几辆“火三轮”,那是11月,三轮车没有棚顶,露天,风大,“慢慢开,又冷,吹得头发全是立起来的。”
他们终于在当地一个县找到了王×文供述的“一所小学”。一下车,所有人都傻眼了——“修的房子都是一模一样的。”曹军说,不仅如此,村子里大部分人家连姓氏都是一样的。
一群四川人到广东找小孩,语言都是不通的。他们试过挨家挨户走访,没有效果。他们问了一圈儿,什么都问不出,最后只能押着王×文回去。
2015年,专案组联系了沈阳著名刑事相貌专家、中国刑警学院的赵成文教授画像,根据孩子们的童年照片,画出他们十几岁的样子。
模拟画像是刑事侦查中的一项重要技术,它曾帮助中国警方破获了相当多的案件。这一次,专案组带着这些画像再到广东,提取适龄儿童照片,“用肉眼找出觉得和这个像的”。
看了10天,找到176张照片带回四川,组织家长辨认。南充市公安局刑侦支队的贾副支队长回忆,在辨认现场,一开始,孩子的父母觉得“都不像”,看着看着,一个觉得这个像,一个觉得不像,夫妻之间有时会陷入争吵。
“你才带了几天,你知道像不像?”
“要不是你,孩子能丢吗?”
一份资料里显示:这样的家庭,“70%夫妻关系破裂,分居或离婚”。最后,他们筛出来100多个“疑似对象”,做DNA比对,一个都没中。
局面困在了这里。
跨年龄人脸识别
挫折接连不断。在警方尝试各种新办法时,2015年,具有更大运算力和储存空间的GPU的应用,把人工智能的热度推向巅峰。——GPU是图形处理器的简称,比传统中央处理器计算速度快10至100倍。
深度学习算法使得训练出一个“更聪明”的AI成为可能。人类“不可靠”的部分——人工智能总有办法规避掉。
2017年12月,公安部刑侦局副局长陈士渠到专家组调研。专家李博士和他交流时,提到人工智能和跨年龄人脸识别技术。陈士渠很感兴趣,他想起了“4·26系列”拐卖案——近10年来,公安部打拐办和四川公安从未放弃过努力和侦查,他曾多次前往四川督办此案。他希望找到突破口,便要求四川专案组和腾讯团队对接,“希望利用新技术查找被拐儿童下落。”
需求被转达给人脸识别团队——优图实验室时,没有人感到乐观。这是一个“全博士”团队,都毕业于名校,技术水平很高。但得到这个消息时,优图实验室总经理Kyle的第一反应是:“难度还是挺大的。” 跨年龄比对是人脸识别领域一个公认的难点,特别是青少年阶段,人脸特征变化最大。优图当时的算法模型,并没有进行过大规模的跨年龄比对,准确率在80%左右,这远不是一个能够应用到安防打拐领域的算法。
之后的十几天,守护者计划团队和优图实验室的同事开了很多次会。2018年1月的一个深夜,12点左右,已经入睡的优图实验室总监Allen电话突然响起,是守护者计划安全团队的同事,Allen当时“并不明确公安部要做什么事情”,他的第一反应是“这件事情肯定很重要,不然不会这么晚紧急找过来”。
第二天上午10点,Allen就接到通知,要用优图的技术帮助寻找这起拐卖大案中的失踪儿童。
Allen心里没底。跨度10年的案件难度,超过他们的想象,世界上也没有成功的案例。但他决心要全力以赴。
执行工作由优图人脸识别团队的李博士牵头。最重要的是“学习材料”。他们通过各种数学约束条件,教导AI——“这是同一个人”“这是这个人1岁的样子,5岁的样子,10岁的样子,30岁的样子”“这个大人的照片,跟其他小孩子都是不像的” 。
“它会学到一个人的面部随年龄演变时,不变的那些量是什么。”研究员晓程说,这些面部特征,“可能对应着一些语义描述”。
晓程总是会冒出这种又准确又干脆的词——“比如,一个人的耳垂长得很特别,或者他的眉峰、眉骨走向不一样。”他说,AI是无法用这样的语言去定义的,研究员们把它“转化成一些数学语言”。
最终的结果是,机器学习总结出了“不随时间变化的人脸特征”——在研究员的电脑上,是由长度为512维的特征向量呈现出来的。很多个夜晚,研究员们消耗在这些事情上。他们加了数不清的班,提交了5个版本算法模型,其中大大小小的修改多达上千次。
中间,有一次测试的机会。2018年年初,公司年会。他们收集了一些同事小时候的照片,在年会上让机器和人一起竞猜,“人机大战”。“因为都是比较熟的人,”李博士觉得,“这肯定能认出来吧。”游戏进行了几轮,最终的结果是,人最多猜对了4个,而算法比对了7个。 这终于让他放心了——“这个事情虽然难度大,但算法肯定是比人强的。”
比中4个孩子
2019年1月28日,比中4个孩子的结果,陆续向整个项目的参与者传递。李博士是在飞机上得到消息的,四川省公安厅打拐处前副处长唐中琦给他打来电话,叫他猜,比中了几个。
李博士没敢多猜,他说:“一个。”唐处说:“不对,再猜。”李新猜:“两个。”唐处揭晓答案:“4个。”
李博士听完,几乎尖叫出来。汤海鹏也很激动,他已经记不清当时在哪儿,但非常清楚地记得,听到结果时,他真的哭了。 当结果传到上海优图办公室时,几名研究员正在如常地对着电脑写代码,看到比对上4个,李博士、晓程、Allen几个人“小声地yeah了一下”。
那天是周一,Allen说,“觉得不可思议,就是一下子从凳子上坐起来,很惊奇,很惊喜。”他的预期是能找到一个就不错了。
打拐的警察们付出了几个月的努力:人工智能可以帮助警方把海量的数据缩小到100个,但拿到数据,并不意味着工作就结束了。蒋晓玲组织警员,先用4个多月的时间,进行了基础的刑侦工作。2019年2月11日,四川省公安厅刑侦局副局长宋月齐率12名专案组人员赶到广东,对比中的4个孩子的情况进行落地侦查。剩下的就是最后一步——验证结果。
春节假期刚过,警方提出进行第二次比对。研究员们又对算法进行了优化。这一次,他们扩大了比对范围。——原有的办法受“学习材料”的影响很大,因为缺乏足够的跨年龄图像数据,这个AI并不能做到像是针对成年人的人脸识别AI那样好。
李博士用“祖母细胞”打比方。“它假设人,比如说脑子里面有一个祖母细胞,只有在看到祖母的时候它才会响应。”
人类的智力不可能这样思考。但在优图内部,他们把所有的人脸识别模型都按照“祖母1、2、3、4”这样推下来,它对熟悉的东西“学得特别好”,对不熟的东西“学得就不好”。
关键时刻,晓程开发了一套损失函数,把识别成年人时表现得“很聪明”的AI作为老师,将跨年龄识别“不够聪明”的AI作为学生,让学生给出的判断结果尽可能靠近老师。现实条件中,照片的质量、人脸的角度、遮挡、光线都有可能对AI的判断带来影响。——“我们去教这个老师,尽量克服其他因素的影响,去获得人脸特征。”
对于教导和开发AI的研究员来说,与AI的关系是很特别的。他们虽然是AI的设计师,但AI经过自我学习后,又变成一个强于人类智力组织的存在。
晓程说,“我们教导AI,通过精简后的一些学习准则,行为设计的标准,把它生产出来,最终,它就会达到人类都无法达到的高度。”
AI的识别精度最终提升到接近96%。它还在不断进化。2019年2月,第二次比对,又找到1人。2019年3月,第三次比对,又找到2人。至此,这起部督拐卖专案的13名被拐儿童,只有3人尚未被确认身份。
解释不了一切
2019年4月,酿酒商人桂宏正和妻子终于等到了人生里最渴望的那个消息——被拐10年的儿子找到了。他们的心情和他们的状态一样慌乱。从警察手里接过两张照片:那是他们的孩子,变样了,有点陌生。他们仔细看,才看得出孩子两三岁时的样子。10年过去了,即使是亲生父母,也不能在人群中一下认出他。
桂宏正夫妇曾经历过一场空欢喜,那种心情“比悲伤更要悲伤”。2012年,有志愿者联系桂宏正,说疑似在西宁看到了孩子。志愿者发过来一张照片,男孩的眼角也是垂下来的,两颊红红的。桂宏正几乎确认那就是他儿子。几天之后,志愿者确认那个孩子不是他的。
“那次我真的就太伤心了。”桂宏正掏出手机,打开相册刷了几秒钟,点开那个小孩的照片,拿给我看:“你看像不像?”
不等我回答,他说:“整个都像。” 出现这样的“错误”并不奇怪。生物学统计,女性怀双胞胎的自然概率是八十分之一。人群中,两个相似度极高的人出现的概率更高,人类肉眼分辨人脸相似度没有那么可靠。
他们唯一能掌握的不太会被时间改变的细节,是孩子右脚小腿上的一处疤痕。那是男孩小时候在酒坊玩耍,不当心被滚烫的水烫的。4月12日,在广东一处民宅与儿子相认时,这对父母做的第一件事情是:一把掀开孩子的裤脚,看看小腿上是不是有一条疤。
技术带来的结果令人欣喜,6月19日,最新的一个消息:今年四五月,优图的人脸识别技术又帮助深圳警方找回一个失联多年的儿童。那是2000年,深圳罗湖发生一起绑架儿童案,绑匪索要赎金20万元。奇怪的是,小孩和绑匪随后却消失了。多年来,警察没有放弃寻找,也曾找画像专家进行跨年龄模拟画像,都没有获得有价值的线索。孩子失联时只有3岁,19年过去了,他被找到时在深圳一家餐厅当厨师。
陈士渠说,这些儿童被找回,“充分证明人工智能对于查找被拐多年儿童能够发挥重要作用。”而目前,采取盗窃、抢夺、拐骗等方式拐卖儿童的案件,“全国年发案只有几十起”,基本可以快侦快破。
这意味着,我们可能站在一个时间的分水岭上:一种犯罪类型正在被技术逐步瓦解。
蒋晓玲对未来充满期待,“我们今年准备看能不能把剩下几个解决掉,要是这几个也找到的话,我们的案子就比较完美了。”
四川的案子中,还有3个孩子没有确认。这3人中,有个男孩的比对结果很特殊。3次比对,排在相似度第一位的始終是同一个人。即便以肉眼看,这个男孩与被拐儿童的面部特征都很相似——甚至耳朵上一处非常特殊的标志。但奇怪的是,几次DNA比对都不成功。
头两次,机器判断:97、98分,第三次——100分。
警察们对这个结果感到困惑。他们调查过孩子亲生父母生产时的状况,那对夫妻是在镇上一家诊所生下的男孩,诊所并不正规,“都没有留下出生记录”。
研究员们的看法各不相同。“机器也有bad case。”李博士说,“所有的人工智能都不是百分之百正确,比如说它的识别能力就是95%,在一个千万的集合里,有一两个找不到,我觉得是在算法误差内,很正常。”
晓程则相信机器比人坦诚,也比人可靠。从2009年开始从事人脸识别,过去10年的工作给他带来的一个启发是——“它的错肯定是有理由的。”
这个世界上有太多巧合和错乱的事情了,再强大的AI也解释不了一切。