疑犯,还是吃瓜群众?

2017-03-10 18:13生猛海鲜
科学Fans 2017年1期
关键词:疑犯全网数据挖掘

生猛海鲜

如果你是阅片无数的刑侦剧资深铁粉儿,那你一定对《犯罪心理》《24小时》《疑犯追踪》这样的美剧如数家珍。从最早的全靠自身能力破案,到现在的高科技引入,相信你一定也从这些美剧中深深体会到了科技带来的变化。随着犯罪分子们扑朔迷离的身份与难度超高的犯罪手法不断进步,探员、特工们的工作难度也在不断增加。不过,好在有先进的人工智能,能够帮助他们在调查过程中提前预测到犯罪分子的动向,查出他们的真实身份。

数据挖掘不是事儿

数据挖掘(Data Mining)是人工智能比较常见的应用方向之一。数据挖掘,顾名思义,是一种在海量并且看似毫无关联的数据中寻找出大量也许有用也许没用的发展规律,应用于新的数据并且得出结论的人工智能应用方向。在给定大量数据的情况下,机器能通过对已有数据进行学习得到一个量化或者非量化的模型,并将其应用于新得到的数据中。

在美剧《疑犯追踪》里,人工智能The Machine就运用了典型的数据挖掘,而两位男主人公前期也基本是依靠The Machine提供的社保号码来寻找救助对象,预防犯罪。不过这个人工智能,从始至终都没有对获取的信息进行过单纯的判断,它只是在一个模型中通过大量的计算和分类,从而选出权重最高、特征最明显的一个号码。这种仅仅提取最明显特征而不涉及任何智能化判断的应用,就是典型的数据挖掘技术。

在这里,数据挖掘成为了统计分析方法学的延伸和扩展,它能够在预测犯罪方面起到令人满意的准确度,但同时也对使用者的要求很高。不过随着计算机能力的不断增强,人们也能完成难度较高的数据挖掘工作。而一些新兴的人工智能技术在数据挖掘领域也取得了很好的效果,如神经元网络和决策树,在足够多的数据和计算能力下,它们几乎不用人的关照,就能自动完成许多有价值的功能。数据挖掘利用了人工智能和统计分析这两门都致力于模式发现与预测的学科所带来的好处,将这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能完成同样的功能,并且能够更专注于自己所要解决的问题。

学习思维来辅助

除了简单的数据挖掘,还有一些人工智能则或多或少运用了“学习”的思维在里面,比如《黑镜》第三季“全网公敌”中的AI。在这种情况下,人工智能不再是单纯作为“计算模型”的角色,它会通过不断地学习和归纳发展拥有自己的价值观,并在调查过程中起到很大帮助。

事实上,人工智能的所谓价值观从某种程度上来说,也是计算得出的产物,人工智能就像智商卓越但是没有任何善恶观的小孩子。人们必须通过不断输入大量数据并且监督人工智能学习到的答案,从而不断修正人工智能本身,最终才会得到一个具有自主判断力的智能程序。

从《黑镜》“全网公敌”一集中,推特上被投票“必须死”的人在控制人造蜜蜂的人工智能程序看来,就是被打上了“必须死”标签的人。因为有这个标签,他们就是人造蜜蜂的攻击对象。这个人工智能是不会考虑这些有标签的人是在什么环境因为什么被打上标签的,程序也不会考虑这些人做出了哪些对周围人对社会有好处的东西。延伸一下,一个老实本分温柔善良的人因为意外(比如网络意外,同名同姓)错误地被贴上了“必须死”的标签。那么哪怕这个人平时再乐于助人、行为再完美无瑕,对于控制人造蜜蜂的程序来说,这个错误的受害者和之前那些被杀死的人一样,没有什么区别。

这种拥有自我价值判断的人工智能也是目前研究的热门之一,而且“是否有自我判断功能”这个界限其实并不是特别清晰。虽然像“全网公敌”中的人工智能目前离我们还遥遥无期,但是利用数据挖掘和人工智能对犯罪进行预测和侦察已经不是什么新鲜事情了。911之后,美国国土安全局已经开始着手建立相关的研究机构和预警系统。无论是预警系统还是研究机构,都是基于收集到的有关民众的大量活动信息数据。此外,互联网每天产生大量的信息,如何通过对这些数据和信息进行挖掘从而发现可疑的人物和行为,也一直是信息安全科学家们的研究方向之一。而针对大量数据的实时分析也一直是数据科学家们面临的挑战之一。

从总体来看,美剧中无论是单纯的“给出人物,让执法者自己判断是犯罪嫌疑人还是潜在受害者”,亦或者是“程序针对给定人物判断是不是犯罪嫌疑人”,这二者目前都没有完全得到实现。但随着科技的不断发展,这样的人工智能出现在世界上只是早晚的问题。不过,面对这样的程序,我们做好了制定善恶的准备了吗?作为一个普通研究者,能够承担程序判断“失误”的后果吗?毕竟这个世界上很多的事情,是不能简单的一分为二的。或许就连机器自己,都需要一个灰色地带来容忍判斷的失误呢。

猜你喜欢
疑犯全网数据挖掘
近在咫尺的疑犯
疑犯追踪
《唐宫夜宴》火遍全网的背后
追踪盗猎者
探讨人工智能与数据挖掘发展趋势
双十一带货6500万,他凭什么?——靠一句“把价格打下来”,牛肉哥火遍全网
电力系统全网一体化暂态仿真接口技术
基于并行计算的大数据挖掘在电网中的应用
王天戈首支中文单曲《心安理得》全网首发
一种基于Hadoop的大数据挖掘云服务及应用