刘伟 倪桑
自2006年加拿大科学家Hinton提出深度学习技术,2012年ImageNet竞赛在图像识别领域带来突破,如今迎来了人工智能的第三次发展浪潮。不同于20世纪 80年代随着神经网络而来的技术进步无法走进现实的困境,这一次人工智能的发展浪潮真正带来了技术的落地,商业化道路也走得更加顺畅。近来人工智能技术都在突飞猛进地发展,成果应用如雨后春笋般涌现。海量的数据、不断优化的算法,以及与之匹配发展的计算机运算能力,都为更多的发展及应用可能性提供了广阔的舞台。而随着人工智能在越来越多的方面落地,人们越来越多地感受到人工智能对于生活的改变,接受程度逐渐提升。
除技术产品化的道路拓宽以外,当下的人工智能还有许多亟待发展和研究的方向。以下特点推动其在第三次发展浪潮中前往更具突破性的阶段:从人工知识表达技术到大数据驱动知识学习;从处理单一的数据到跨媒体认识、学习和推理;从追求机器智能到迈向人机混合的增强智能;从聚焦个体智能到基于互联网络的群体智能;从机器人到自主无人系统。
其中,人机混合的增强智能即为将人类智能与人工智能进行结合,迈向新的智能阶段——人机融合智能。近年来,人机融合越来越成为人工智能领域的热词。2018年10月11日,美国“防务一号”网站发表文章称,美国军方高级情报员越来越担心中国在人工智能等“提升人类效率”方面的研究。美国国防情报局局长Robert Ashley在美国陆军协会年度会议上表示,人机融合是颠覆性技术的一个关键领域,将会影响美国的国家安全。他认为,“中国在研究神经网络和人工智能方面所作的努力是一个分阶段的过程,希望最终达到‘人与机器的融合’的程度。”
在人工智能研究的领域,更快的计算并不是人们期望的最终目的,而让计算机变得越来越与人融合,最终达到人机融合智能,才是最终的发展方向。当前人工智能虽然普及了众多的应用形式,但是依然以计算为中心、难以突破意识壁垒,而能够融合意识与计算特性的人类智能和人工智能融合智能体,即为人机融合智能。
人机融合智能研究是智能技术发展到一定程度的产物,它既包括人工智能的技术研究,也包括机器与人、机器与环境及人、机、环境之间关系的探索。人机融合智能研究不仅要考虑机器技术的高速发展,更要考虑交互主体—人类的思维与认知方式,让机器与人类各司其职,互相促进,这才是人工智能真正的前景与趋势。
在人工智能发展的特点中,人工智能是从聚焦个体智能到基于互联网络的群体智能。群体智能是源于对蚂蚁、蜜蜂等为代表的社会性昆虫的群体行为的研究,最早被用在细胞机器人系统的描述中。它具有分布式无中心的控制,并且群体自组织性。
在自然界中,集群的方式可以让简单的生物展现出惊人的复杂性、效率甚至创造力。在人工智能领域,可以通过这种方法产生一种新的智能,像超级专家一样“共同思考”。通过随机扩散搜索、蚁群优化、粒子群优化等算法,人工群体智能(artificial swarm intelligence,ASI)已应用在了无线通信、医疗、无人驾驶、艺术创作等方面。
如今,Unanimous AI公司就在致力于研究群体智能,希望能够将数百人的知识、智慧、洞察以及知觉通过算法连接起来。该公司研制的SWARM平台等软件可以通过实时闭环控制系统将分布式网络组织成“人群”,能够聚集人类参与者的集体智慧以得出意见。它成功预测了奥斯卡、超级碗比赛以及法国大选的结果。该系统对 2017—2018赛季 20周的NHL曲棍球比赛进行了预测,得到了 85%的成功率,超过了维加斯博彩市场预测结果的22%。除了比赛和票选等预测活动,该群体智能方法还应用到医疗领域,其肺炎诊断的准确率比单独工作的放射科医生团队高出22%。
认知是人与世界交互的重要过程,认知计算旨在模仿人类大脑的计算系统,让计算机像人一样认知和思考。只有实现了认知计算,才能真正实现可以学习并与人类自然交互的系统。从20世纪开始,人们通过单一用途的机械系统指示机器的行动,此为“制表时代”;在 20世纪 50年代进入了“编程时代”,人们通过编程的方式控制计算设备;从2011年起,人们就将认知计算列为了人工智能发展的目标,开始进入“认知时代”。在群体智能方面,借鉴了蚂蚁等生物的启示。而在认知计算里,依然要聚焦于生物,研究认知的整个过程。在认知计算中,系统通过大规模的学习,有目的、理性、自然地与人类进行互动。认知计算让机器不仅仅通过编程执行指令,而是通过与人类的互动以及它们对环境的体验学习和推理。它能够模拟人类的思维过程,理解世界的模糊性和不确定性。通过权衡来自多个来源的信息和想法,进行推理并提供假设。
IBM公司的Watson系统是其中最有名的认知系统。它通过筛选大量的数据库获取信息,以问答的形式帮助用户回答对复杂问题的见解。通过认知计算的方式,它可以不断地从用户互动中获取数据,变得更加聪明。它目前已经成为了一个具有认知计算能力的生态系统,可不断地衍生出各种行业解决方案,被应用于医疗、天气预测法律顾问等方面。2018年,该平台被用在了教育领域,瑞典的一个研究小组开发出了一个使用IBM Watson系统的学习并行编程的助手,在实际教学实验中获得了学生的好评。
认知计算的发展需要不断地对人的认知过程进行研究。其中,态势感知的研究也属于认知计算领域。态势感知将人的认知过程分为3个独立的层次:对环境中元素的感知、对当前形势的理解、对未来状况的预测。通过建模和结构化的思想,可以将人的认知过程量化为态势感知程度。除此之外,人们也在不断地通过其他方式对人类的认知过程进行量化,试图通过计算机来进行模拟和计算。认知学可能是人工智能下一步发展的突破口。
在计算机的认知、学习、记忆和言语的水平都在逐渐提高的同时,也必须意识到,让计算机具有能够感知和理解人的情感,并且针对人的情感做出相应合适反应的能力,是让计算机具有更高的、全面的、智能的必经之路。2006年,Minsky在《情感机器》一书提出“人工智能=认知智能+情感智能”。情感计算的加入能够大大拓宽人工智能的应用领域。根据手段的不同,情感计算研究主要分为基于视觉、基于语音、基于文本及基于脑补信息和多模态信息的情感分析。
许多研究机构及情感计算工具公司都在不断对情感计算领域进行探索。例如,麻省理工学院媒体实验室、Microsoft VIBE团队、Emotient公司等,他们力求达到更精准的情绪识别,并且不断开拓新的应用领域。从研究设备上,由于得到更多样的可穿戴设备支持,2018年有许多有关可穿戴设备进行情感测量的研究涌现。例如,通过可穿戴设备获取运动心率进行情感评估,或进行压力和睡眠评估;还有在皮肤布置传感器的表皮机器人作为新的可穿戴设备。从技术上,深度学习也大量应用在了情感计算上。例如,将 CaltureNet方法应用于对自闭症儿童的面部情感识别;将深度卷积神经网络应用于语音频谱图上进行语音情感分析。从情绪的研究上,也有更多针对心理疾病的专门研究。例如,自杀冲动的数字化表征研究;能够影响和参与自闭症治疗的机器人感知研究。更加多元化的研究方向、更加专门的应用领域的研究,标志着情感计算的发展也在不断走向成熟。
过去几年,波士顿动力公司一直引领着机器人动作控制的发展。2017年,该公司的人形机器人Atlas已经可以进行完美的后空翻,而2018年它又展示了令人惊叹的跑酷特技表演。在该公司2018年新公布的视频中,Atlas可以跳上多层的平台,将重心从右脚移到左脚,在上台阶时又将重心移回左脚。此外,Atlas 2018年还可以走出仓库,在草坪上进行跑步动作,这证明了该机器人在不平坦地面上的平衡性、稳定型及导航能力。截止目前,Atlas已经可以完成拿起和放下箱子,跳过障碍物,在人类的干扰推动中保持平衡等等高难度行为。
同样产生于波士顿动力公司的SpotMini曾经是机器人领域最火的四足机器人,而2018年,ANYbotics公司的 ANYmal吸引了人们的眼球。它具有很强的自动移动和操作能力,能够安全地与环境交互,适用于室内外场所的检查操作,在自然地形等进行搜索或救援任务,还能进行舞台娱乐活动。2018年,ANYmal在位于大西洋东北部的北海的海上配电平台进行了为期 1周的检查实验,它能够进行仪表、杠杆、油、水位,各种视觉和热测量等检查。随着机器人技术的发展,机器人的职业功能实现的越来越好,越来越多的人类工作可能会被机器人取代。同时,机器人也能够更加准确地模拟人类的动作,可以预见,未来将有更多的仿生机器人能够被创造出来。人类与机器人共存,与机器人进行合作甚至融合的时代,总有一天会到来。
随着城市体量变得越来越大,规划和管理也变得越来越复杂,世界各地的许多城市规划机构都已经开始将数字化作为解决城市问题的手段。因此,人工智能技术也具有了更多的应用场景。智慧城市的普及和建设,能够提升城市中资源的运用效率,优化城市管理和服务,缓解“大城市病”,从整体上改善市民的生活质量。目前,智慧城市技术和规划已经在新加坡、迪拜、阿姆斯特丹、巴塞罗那、纽约等国家和城市实现。而在中国,从 2017年党的十九大报告中提出建设智慧社会以来,已有 290个城市入选了国家智慧城市试点。2017年底,雄安新区也与百度公司共同打造智能出行试点示范,希望共同将雄安新区打造为智能城市新标杆。
在迅速发展的浪潮中,智慧城市也存在着一些问题。根据文献分析和调查显示,在智慧城市的发展规划讨论中,人们更多关注于技术的使用和实施,对于城市居民的具体情况和他们如何参与智慧城市的发展过程等问题考虑不足。在一些智慧城市的建设过程中,甚至会由于对传统的破坏而遭到当地居民的反对,例如墨西哥的托兰特辛特拉。有一些问题可能会由于规划者无视城市的实际发展造成,这可能导致发展计划对公民缺少吸引力。在后续更多人工智能应用落地的过程中,需要更加脚踏实地,加强对居民的沟通和宣传,更多的让技术的实际惠及者——城市公民参与进智慧城市的规划和设计中,打造更高满意度,真正提升城市效率的智慧城市。
在医疗领域,不断进步的模式识别技术和深度学习算法催生出了许多辅助医疗设备及技术。在很多医疗场景下,人工智能的加入都带来了效果的提升。这些设备有一些能够独立进行判断输出结果,有一些能够辅助医生进行决策和操作。在人工智能医疗预测场景,加拿大的一项针对前列腺切除术后康复情况的预测实验中,机器学习算法比传统的统计模型表现出更好的效果,预测更准确。在推行自动预测工具后,人工智能医疗可针对患者进行个性化治疗。
人工智能的应用越来越优化,人们开始思考和探讨医生职业的可替代性。在辅助设备的效果评价上,众多实验开始将其与人类医生的手法进行比较评价。不过在大部分的实验结果中,人类医生的表现依然优于人工智能。在德国的一项实验中,针对皮肤镜黑瘤识别任务,包括30名专家在内的 58位皮肤科医生中,大部分医生的表现均优于卷积神经网络。但是无论医生的经验如何,他们均能从人工智能辅助图像分类设备中受益。
在诊断、治疗、医疗流程辅助、健康管理、药物研发等方面,人工智能均有很大的发展潜力。人工智能的参与能够减轻和优化医生的工作,让更多的人享受到更高水平的医疗。
越来越多人工智能应用的落地,在诸多领域都在为人们的生活带来可见的提升。人们对于新技术应用的意识提高,构建了一个更加以用户创新、开放创新、大众创新、协同创新为特征的创新生态。人工智能也依然处在飞速发展中,向着可知、可控、可用、可靠的方向发展。通过未来不断研究,希望人与人工智能不断融合,向着真正的强人工智能迈进一步。
(摘自《科技导报》2019年第1期)