希区客
人口普查是全面掌握人口状况的重要手段,不过人口普查对计算机行业发展的重要性似乎鲜为人知。
美国科学史专家大卫·罗伯茨在其专著《数字共和国:历史上美国人数学的意外故事》中讲述了这段历史故事,其中包括1896年12月3日第一家自动化数据处理公司——制表机公司的成立。
人口增长迫使工作方式改变
若只为统计人口数量,人口普查工作相当简单——各地上报总人口数即可。但美国的人口普查绝非简版。
我们可以将故事追溯至1787年美国制宪会议中的“五分之三妥协”:美国南方与北方达成协议,将奴隶的实际人口数乘以五分之三,以作为税收分配与美国众议院成员分配的代表性用途。
1790年的美国第一次人口普查也根据年龄和性别进行了区分。在随后的几十年里,职业状况、婚姻状况、教育状况、出生地等个人信息都成为普查时要填写的内容。
随着国家发展,每次人口普查都需要投入比上一次更多的精力,不仅要收集数据,还要将其汇编成可用的形式。
美国1880年人口普查的数据处理工作,直到1888年方才完成。当时,它已经成为一种无聊到让人麻木且容易出错的文书工作。
鉴于人口还将继续快速增长,那些有着足够想象力的专业人士预见到,若不改变程序,美国1890年人口普查数据的处理任务将十分可怕。
霍勒瑞斯的杰作
约·比林斯是一名被指派协助人口普查办公室编制健康统计数据的医生,曾近距离观察任务组处理1880年的原始数据时所做的海量制表工作。他向另一位协助人口普查的机械工程师赫尔曼·霍勒瑞斯表达了自己的担忧。
1884年9月23日,美国专利局记录了24岁的霍勒瑞斯提交的一份题为“编制统计数据的艺术”的意见书。
在此之后,霍勒瑞斯不断改进设计构思,并于1889年敲定最终方案,用于简化1890年人口普查的数据处理。
霍勒瑞斯的杰作是穿孔制表机,主要由穿孔卡和读卡器组成。
穿孔卡用薄纸板制成,使用者可用手或机器对其打孔。卡片被输入一个连接着计数装置的读卡器中,读卡器用针刺探卡片,只在有孔处,针才会穿过卡片以发生电连接,进而令对应的计数器前进一个刻度以实现计数。
举例说明,如果一张“白人男性农民”的卡片通過读卡器,那么“白人”“男性”“农民”这3个类别里的计数器都会前进一个刻度。
霍勒瑞斯出品的穿孔制表机效率惊人,以至于美国国会拨款所依据的各州人口数据在1890年11月下旬之前就得到了认证。
从穿孔制表机到现代计算机
在人口普查领域大获成功后,霍勒瑞斯开始销售自己的作品。
文章开头提到的制表机公司便是霍勒瑞斯创立的,在他退休后,托马斯·沃森成为掌舵人并于1924年将公司改名为国际商业机器公司,也就是IBM。
此后,IBM不断完善卡片技术,发明了一种80列穿孔卡片,能更高效地完成巨量数据的记录和制表。
到20世纪30年代,许多企业都使用穿孔卡技术记录并保存程序,例如工资单和库存。一些需要应对大量数据的科学家,尤其是天文学家,也发现这些卡片很好用,于是IBM的80列穿孔卡成为行业标准。
IBM并未满足,又开发出了在此后数十年间被广泛使用的键控打孔机。
于是,“打卡”作业成为二战后蓬勃发展的计算机行业里的一个分支,而IBM一度成为世界第三大公司。卡片处理为速度更快、空间效率更高的纯电子计算机提供了框架。
人们可能不清楚,20世纪50年代和60年代的计算机跟房间一般大,其数据和指令的主要加载方式是在键控打孔机上创建一副卡片,然后将它们输入读卡器。在20世纪80年代以前,这一直是许多计算机的默认程序。
正如计算机先驱格蕾丝·霍珀对早期职业生涯的回忆:“在那些日子里,每个人都在使用穿孔卡,而且他们认为自己会永远使用穿孔卡。”
霍珀团队创建了第一台可商用的通用计算机,同时也是穿孔读卡式的庞然大物——通用自动计算机(UNIVAC)。
1951年,第一台UNIVAC交付给了美国人口普查局。