向中国科技目标推进的一些最关键工作,在中国中部腹地的一座原水泥厂里进行着,与北京和深圳那些向往成为硅谷的地方相距十万八千里。工厂院内还摆着一台闲置的混凝土搅拌机。隔壁的一座仓库里堆着一箱箱密胺餐具。
院子里,侯夏梦经营着一家帮助人工智能理解世界的公司。24个年轻人在浏览照片和视频,标记他们看到的每样东西;这是一辆汽车,那是一个红绿灯;这是面包,这是牛奶,那是巧克力;这是一个人走路的样子。
“我以前觉得机器很聪明,”24岁的侯夏梦说,“现在我知道,它所有的聪明都是我们给它的。”
在长期充当世界工厂的中国,新一代的低薪工人正在为未来奠定基础。在规模较小、成本较低的城市,创业公司如雨后春笋般涌现,他们在给中国海量的图像和监控录像添加标签。正如一位专家所说,如果把中国比做数据方面的沙特阿拉伯,那么这些公司就是炼油厂,它们将原始数据转化为可以为中国的人工智能雄心提供动力的燃料。
通常认为中国和美国正在争夺人工智能的霸主地位,而中国具有一定的优势。中国政府在财政和政策上广泛支持人工智能公司。2017年,全球计算机视觉市场中,中国创业公司占了三分之一,超过美国。中国的学术论文在研究论文中被引用的频率更高了。在2018年的一份重要政策声明中,中国政府表示,预计到2030年,该国将成为人工智能领域的全球领导者。
更重要的是,这种想法认为,多亏了薄弱的隐私法律及其执行,中国政府和公司获得了堆积如山的数据。在脸书、谷歌和亚马逊已经积累的数据之外,中国互联网公司能获得更多,因为那里的人们普遍用手机进行购物、支付餐费,以及购买电影票。
标记这些数据的能力,可能是中国真正的人工智能实力,也可能是美国唯一无法匹敌的力量。
“我们这些人属于数据行业里的建筑工人。我们做的事就是垒砖头,一块一块地垒,”中部省份河南郏县一家数据标签工厂的联合创始人伊亚科说,“但我们在人工智能中扮演着重要角色,没有我们,他们无法建造摩天大楼”。
虽然人工智能机器是超快的学习者,擅长处理复杂的运算,但它们缺乏就连5岁的孩子都具备的认知能力。小孩子们都知道棕色的可卡犬和黑色的大丹犬都是狗。人工智能可以分辨一辆福特皮卡和一辆大众甲壳虫,但还无法了解二者都是汽车。
人工智能需要被教导。它必须消化大量带有标签的照片和视频,然后才能意识到,黑猫和白猫都是猫。这就是数据工厂及其工作人员起作用的地方。
“我们就是10年前流水线上的工人。”河南那家数据工厂的联合创始人伊亚科说。
数据工厂开始在远离大城市的地區涌现,通常是在相对偏远的地区,劳动力和办公空间都很便宜。许多数据工厂的工人都曾在大城市的流水线和建筑工地工作。但是那些工作正在枯竭,工资增长放缓,而且许多中国人更喜欢住在离家较近的地方。
有一次,伊亚科的公司得到一个任务,为数百万个人类的口部图像做标记。伊亚科说他不确定这是用来做什么的。也许是面部识别?
大约向北300英里的河北南宫市,侯夏梦经营着一家数据工厂,由她婆家拥有的一间旧水泥厂改建而来。她在大学毕业后的第一份工作是给旷视科技做面部标记,这是一家价值20亿美元的中国面部识别公司,其最著名的技术平台名为Face++。到目前,一些面部识别系统可以比识别她的朋友更快地识别她,她说这是因为“我的脸在原始数据库里”。
但北京的生活太过艰难而且昂贵。她和当时的未婚夫赵亚成决定搬回家乡做数据工厂。她的父母可以出电脑和办公桌的费用。他们正在翻新隔壁的仓库,再雇用80多名员工。
像伊亚科一样,侯夏梦并没有花时间思考自己的工作所带来的影响。它们是否有助于国家的监视,以及机器控制人类的反乌托邦未来?
“摄像头让我感觉安全,”她说,“最起码现在是我们在控制机器”。