沈晓卫
(IBM中国研究院,北京 100085)
【观点摘要】
具有洞察力的系统
传统的IT系统是基于记录的系统,即数据都是结构化的。过去几十年,大多数的IT技术都是用于构建一个基于记录的系统。今天我们看到一种新形态的系统,把它叫作基于互动的系统,这种互动可能是与人的互动(如社交媒体),也可能是与物理世界的互动(如物联网这样的系统)。在这里,大多数的数据是非结构化数据。我们今天面临的问题,就是如何基于一个传统的基于记录的系统和一个新兴的基于互动的系统共同构建一个具有洞察力的系统。IT系统最核心的价值之一就是从数据中产生洞察力,这种数据包括传统的结构化数据和新兴的非结构化数据,例如大量的多媒体数据。
认知计算
大数据的数据量远远超过传统IT技术可以处理的范围,因此如果没有认知计算,就几乎无法解决大数据的问题。也正是基于此,新的IT系统在做分析时需要一种自我学习能力。从宏观角度来看,可以认为今天的IT世界已经开始从传统的基于编程的时代进入认知计算时代。在IBM研究院有一项重要的工作内容叫“全球技术展望”,探讨未来3~10年最重要的技术趋势。从2012年开始,每一年全球技术展望中都有同认知计算相关的课题。我们认为在未来几年之内,如何构建一个认知计算的平台,如何做更好的基于对话和推理的具有实用性的系统等方面的研究可能有重大的突破。更长期来看,如何做模拟人脑的计算,做具有边缘计算这种特性的系统,如何做量子计算,这些都属于可能在未来有非常重大影响力的研究方向。
物联网3.0
今天的物联网已经进入到了3.0时代。物联网3.0有两个非常重要的特征:①方案从本地部署向云端推进。未来物联网的解决方案,应该是从云端来提供部署,而不仅仅是在本地部署。②认知计算会发挥非常重要的作用,同时,物理模型会被用于描述物理世界。物联网3.0非常重要的特征是“智能化”,从简单的数据采集推进到深度数据分析,进而产生可具有执行力的洞察力。物联网3.0能够推动产业转型的两个方面——云计算和深度智能化。在这个过程中,“认知计算”是一个非常重要的技术手段。
IBM研究院关于认知计算的探索性研究
1)Medical Sieve。需要Watson具备视觉能力。在医疗行业有非常多的多媒体数据需要理解,这个技术帮助过滤必要的临床和影像诊断信息,形成总结和建议,大大减少临床医生观看X射线、CT等医学影像的工作量,可准确定位可疑病症。
2)Debater。需要认知系统具备思辨能力。“向青少年销售暴力视频游戏应该被禁止”是一个论点。Debater需要在几秒钟内大概浏览四百万篇文章。这四百万篇文章中大概有五亿个语句,每一个语句又有很多种可能的理解。面对这样的信息规模,需要排查出最多几十条同这个观点有关的论点。与此同时,这个系统也可以提供反方的依据。
3)SyNAPSE。未来的认知系统需要具有感知能力。与现有的冯诺依曼架构的计算机系统不同,模拟人脑中神经元的系统能够实时识别出用正常速度拍摄的路口视频中的人、自行车、公交车、卡车等。这样的信息处理与传统的数据处理是不同的。