马文方
计算走过了主机、小型机和PC机时代,而现在云计算、大数据、移动终端、可穿戴式计算、物联网和未来的脑机接口技术等将把人们带入计算无处不在的泛在计算时代。那时,计算将从贴近人生到与人生融为一体。
程序员的职业生涯可谓是程序人生,计算机科学家的职业生涯可称为计算人生。而今年10月29日,微软亚洲研究院举办的以“计算·人生”为主题的第16届“二十一世纪的计算”大会,传递出计算正在贴近寻常百姓人生的信息。
重新认识数据
拓展人们的活动空间是推动科学技术发展的唯一动力。在工业社会中的科技进步主要是为了拓展人们的物理活动空间,比如,汽车、飞机延长了人们的出行距离。而进入信息社会的初期,IT主要用于拓展人们的智力活动空间。
当下,大数据被认为是企业迅速感知外部变化的途径,殊不知,大数据还使得基于个体的人的数字化成为可能。当人被数字化后,人们的物理活动空间和智力活动空间将会融合成为一个系统,这就是将要来临的信息物理系统(Cyber-Physical Systems,CPS)。
美国国家科学院院士、加州大学伯克利分校计算机系教授Christos H. Papadimitriou《计算宇宙》的演讲告诉听众,信息空间的宏观尺度有多大;国际工程技术学会荣誉院士、牛津大学肿瘤成像学教授Michael Brady的《计算与卫生保健》告诉人们计算已经广泛地深入到人体的内部,这往往是个人核心隐私的密集区;而国际光学工程学会院士、密歇根州立大学计算机系杰出教授Anil K. Jain在《生物测量学:我怎样知道你是谁》演讲中演示了计算在微观尺度上已经达到基因层面。
数据从来没有像今天这样,承载着如此之多的内容。因而,我们有必要重新认识数据。
“个人数据将会是今后几年面临的非常重大的问题。大多数情况下,个人数据的获取既没有规则也没有监管,从而让人们越来越担忧起来。”图灵奖获得者、微软技术院士Butler W. Lampson(兰普森)表示。
兰普森说,人们的这种担心首先是因为有了搜索引擎和大数据,原本不同分布的信息被关联起来,这意味着很多曾经是人们隐私的信息,已经不再是隐私了;其次是物理世界中,人的数据与其在信息空间中的数据变得同样重要,信息的数字化使得几乎所有数据都会展示个人的相关信息。
最关心个人隐私的莫过于自己。因此,兰普森认为,个人应当有权利控制自己的数据和限制自己数据的使用,因为这些数据都是属于其本人的。而个人控制自己数据的需求既要通过技术手段来保护,如个人数字身份(NID)作为加密的公钥+网页地址(URL)构成元数据,也要通过规制和政策来加以监管。
人工智能与智慧人生
“计算技术有一种巨大的市场化力量,当这种力量显现时,人人手中都能拥有非常强大的技术工具,从而使得人们的创新能力得到极大释放。”微软资深副总裁、ACM(美国计算机协会)院士Peter Lee表示,“从这个角度来说,计算机科学的研究特别重要,而且是一个非常值得期待的领域。”
计算贴近人生首先就要面临的就是计算机如何与人交互,因此机器学习又在其中扮演重要的角色。“计算机能够越来越好地理解人们说话的内容,将对人们的生活产生巨大的影响。计算机语音识别在1993年的识别错误率几乎是100%,随着机器学习不断地进步,2000年的错误率降到了26%。
之后,近10年的时间几乎没有什么实质性的进展,直到2009年,微软突然取得了巨大的进展,这一研究进展中的很多工作都是由微软亚洲研究院完成的。”
“微软的小冰实际上是一个人工智能系统,她能够很好地理解人类之间的对话,这对我们来说是一个非常神奇的体验。”微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士说。
图灵测试是评价计算机是否具有人类智能的测试方法,如果计算机能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试。
“今天的科技不管是小娜或小冰,在很大程度上和一定范围内都通过了图灵测试。”洪小文说,“小娜不仅是一个虚拟助手,微软今天手机上的 Bing 搜索基本上就变成使用小娜来进行了。”人们的交往除了文字,还有语音、图像甚至影像等。据洪小文介绍,微软亚洲研究院在图像识别、3D建模、虚拟现实等研究领域也都取得了一批世界领先的成果。
综观计算技术的发展,计算走过了主机、小型机和PC机时代。当前的云计算、大数据、移动终端和正在兴起的可穿戴式计算、物联网和稍微遥远一些的脑机接口技术等将把人们带入计算无处不在的泛在计算时代。人们将浸润在计算环境之中,计算将从贴近人生到与人生融为一体,而虽然计算无处不在,但是人们却又感受不到其存在,则变成计算追求的终极目标。
记者手记:感受大师智慧
时隔整整十年,笔者再次来到“二十一世纪的计算”大会现场。昔日的情景依旧历历在目。距1998年11月李开复受命单枪匹马创办微软中国研究院后仅半年,在世界即将进入21世纪之际,微软中国研究院又创办了“二十一世纪的计算”大型学术活动。当时,“二十一世纪的计算”大会与TechED技术教育大会一道,成为外企在中国举办的最为成功的学术与技术教育活动,成为微软在中国的两张名片:前者增进了与国内学术界和教育界的深度交流,后者维系并培育了Winodws平台上大批的开发者。
作为IT专业媒体记者,笔者曾连续参加了前6届“二十一世纪的计算”大会。借助这一平台,笔者专访到了格雷、兰普森、Reddy、姚期智等图灵奖得主、诺贝尔得主杨振宁、菲尔兹奖得主丘成桐、激光打印机之父斯塔克伟泽和微软当时负责研发的高级副总裁雷斯特。
当年盖茨从卡内基·梅隆大学把雷斯特博士挖到微软并负责筹建微软研究院时表示,微软之所以要开展基础研究,是为了10年以后还有一个叫微软的公司。而礼聘格雷博士则是盖茨求才若渴的佳话,久居阳光明媚硅谷的格雷对微软总部所在的西雅图阴雨绵绵的天气很不感冒,为此,盖茨特别在硅谷为格雷设立了实验室。
作为数据库大师,格雷博士在微软SQL Server数据库业务壮大过程中功不可没。他还主持了微软超级网络数据库TerraServeres项目,通过卫星图库来测试数据库性能并向公众开放,该项目于1997年上线。一年以后,谷歌公司才宣告成立,而谷歌地球的发布则要到2005年。2007年1月,格雷在美国国家研究理事会计算机科学与通讯分会(NRC-CSTB)上发表《e-Science:一种科研模式的变革》演讲,提出科学发现在历经实验为主到理论研究再到计算机对复杂现象仿真的3种范式之后,数据密集型计算将成为科学发现的第四范式。而时隔将近5年后的2011年10月,IBM、甲骨文和微软相继宣布采用Hadoop平台,3家IT巨头在大数据上的措手不及,更衬托出大师的智慧。