曾大军,张 柱,梁嘉琦,徐 楠,王刊良,杨彦武,陈伟运,徐 杨,刘鹏飞,谢佳亨
1 中国科学院 自动化研究所,北京 100190
2 中国科学院大学 经济与管理学院,北京 100190
3 中国科学院大学 人工智能学院,北京 100190
4 中国人民大学 商学院,北京 100872
5 华中科技大学 管理学院,武汉 430074
6 电子科技大学 计算机科学与工程学院,成都 611731
7 特拉华大学 Alfred Lerner 商业与经济学院,纽瓦克 19716
随着大数据和机器智能的普及,人工智能技术正被越来越多地应用到管理和决策领域。人工智能在搜索、计算、优化、形式化推理、对抗博弈等领域优势明显,但在高级认知功能方面性能十分低下。在经验和知识积累的基础上,人类能够灵巧地实现无监督学习、小样本甚至无样本学习,甚至进行“无中生有”的创造。人与机器协同工作,从而构成混合智能系统,已成为包括管理科学在内的多个学术领域共同关注的热点。
在此背景下,机器行为学作为一门研究人工智能如何与人类共存、交互和协同的新兴学科开始快速发展,其核心内容包括机器个体复杂行为、机器集群交互与行为涌现、人机融合群组协调管理等。人机协同决策过程是人类、数据和算法的相互融合、相互作用、相互影响的过程,这种交互过程贯穿于算法模型的建立、人机交互分析和结果综合等各个阶段,需要结合决策组织的文化、具体决策情景和任务特征对机器行为进行综合研究,并整合多学科的知识和见解。机器行为与人机协同决策研究的核心目标是融合机器个体和机器集群智能与人类专家智慧,设计二者协同决策的有效机制,其面临的主要挑战包括机器智能在学习和推理方面的可解释性弱、人机融合群体的行为复杂、人与机器表达和解决问题的机理差异大。
作为新一轮科技革命和产业变革的重要驱动力,人工智能已上升为国家战略,而基于机器行为与人机协同的决策理论和方法则是其基础内容之一。2017 年7 月8 日国务院印发《新一代人工智能发展规划》明确指出:“大数据驱动知识学习、跨媒体协同处理、人机协同增强智能、群体集成智能、自主智能系统成为人工智能的发展重点”,混合增强智能理论需“重点突破人机协同共融的情景理解与决策学习、直觉推理与因果模型、记忆与知识演化等理论,实现学习与思考接近或超过人类智能水平的混合增强智能”。
机器行为与人机协同决策的相关研究不仅受到政府主管部门的支持,同时也受到学术界的广泛关注,主要表现在相关研究机构的项目支持、重要学术期刊的关注,以及一系列科研成果的不断涌现等方面。
2010 年美国情报高级研究计划局发起了“基于群体智慧的事件估计”项目,该项目融合专家群体研判,预测效果显著;2016 年美国情报高级研究计划局资助的“混合预测挑战”项目利用人机协同的方法对地缘政治事件进行预测。近些年来,美国国家科学基金会也资助了一批关于人机协同决策理论和应用方向的研究,2019 年的“面向医疗决策制定的人机合作研究”项目和“AI-DCL:基于人在决策回路中的人工智能系统偏见治理”项目。在欧洲,相关研究同样也受到政府支持和鼓励,2018 年欧盟资助了“推动面向学校教育的具有类人社交能力的直觉式人机交互”项目,其目标之一是探索机器人与人的虚拟角色的外表、行为、感知的相互关系等基础问题。此外,2018 年英国工程与物理科学委员会资助了“人机合作中的信任”项目,其目标之一是通过交叉学科方法将人与智能体交互以及信息可视化技术整合到人工智能的规划研究中,从而使人与人工智能的协作进入到新发展阶段。
随着大数据和人工智能技术的进一步发展,机器行为与人机协同决策也逐渐受到大量学者的关注。SHIRADO et al.[1]和AWAD et al.[2]先后在《Nature》上发表论文,认为与简单机器人的交互可以增加人类协调性,机器与人类合作可达到人类之间合作的水平。2019 年4 月24 日,《Nature》刊发了MIT 媒体实验室领衔撰写的,来自美国、德国、法国、英国和加拿大等国33 位作者参与的题为“Machine Behavior”的综述文章,提出了机器行为学这一跨学科的新兴领域,认为广义的机器行为包括人机协同过程了出现的一系列合作、竞争和协调行为[3],标志着相关探索已成为国际跨学科研究的焦点。近5 年来,《Nature》和《Science》等综合性期刊已发表20 余篇相关论文[4-5],《MIS Quarterly》等管理学期刊已发表20 余篇相关论文[6-9],《自动化学报》和《软件学报》等中文顶级期刊已发表10 余篇相关论文[10-11],这体现了机器行为与人机协同决策在医疗健康、应急管理、交通系统和政策智能等领域起到重要作用,也反映了机器行为与人机协同决策本身具有的学科交互的研究特点。
在机器行为与人机协同决策的相关研究中,棋牌类的人机博弈、社交媒体中的信息传播、基于算法的定价和交易、人机谈判、供应链决策等研究已经取得一系列重要的理论和技术成果。总体而言,已有研究聚焦于特定任务,在技术层面设计面向特定功能的智能体和算法,但仍缺乏跨学科、体系化的顶层设计和部署,对深层科学问题的研究还处于起步阶段。近年来,大数据和人工智能的飞速发展,一方面大量扩充了交叉关联的海量数据和复杂多样的应用场景,另一方面促进了深度强化学习、因果发现和推理、图神经网络等基础理论和方法的提升,这为机器行为与人机协同决策研究带来新的机遇。该领域未来的发展趋势和研究热点有以下三方面。
(1)在研究机器行为的机理和演化中,充分考虑法律制度、伦理规范和文化等因素的影响。已有相关研究主要面向结构化的简单应用场景,未来研究需要面向真实复杂的管理决策场景,将法律制度、伦理规范和文化等融合到机器行为的机理、发展、适应性、群体演化等方面的建模中。
(2)研究人机协同决策中机器行为与人的行为的交互机理和相互影响,尤其是机器行为对人的塑造和影响。随着人工智能系统在生产和生活中的广泛应用,人机协同决策会对参与其中的个人或群体提出特定的要求,机器行为也可能导致一些新的社会现象或问题,对人的心理、行为、生活和工作等产生影响。
(3)针对不同的管理应用场景,研究相应的新型人机协同决策理论和技术。虽然已有研究涉及人类的政治、经济、医疗和教育娱乐等各个领域,但是还存在大量的有重大价值和应用前景的场景尚未涉及,对应的人机交互机制和人机协同决策机制还有待深入挖掘。
机器行为与人机协同决策的相关研究也受到中国学者的高度重视。20 世纪90 年代,钱学森等[12]和戴汝为[13]提出了开放复杂巨系统理论和从定性到定量的综合集成研讨体系,其核心是将专家智慧与机器智能有机地结合起来,这为本领域在中国的发展奠定了基础。
近年来,随着脑科学和人工智能技术的进步,中国越来越多的研究机构对机器行为与人机协同决策进行了相关研究。2015 年中国科学院成立脑科学与智能技术卓越创新中心,其研究内容之一为人机智能协同。2017 年,中国科学院、清华大学、北京大学、复旦大学、浙江大学、上海交通大学、西安交通大学、东南大学、厦门大学、微软亚洲研究院、旷视科技等高校、科研机构和企业的学者参加了中国科协新观点新学说学术沙龙“人机协同的混合增强智能”,有效地传递了人机协同的混合增强智能的理念,表明混合智能将成为新一代人工智能的一个重要部分。此外,机器行为与人机协同决策也逐渐受到工业界的关注,2016 年微软亚洲研究院开展的“HI+AI:人机协同,赋能未来”项目,强调人机协同在人工智能发展中的关键作用;2018 年阿里巴巴提出“人机协同”智能服务解决方案。
机器行为与人机协同决策的相关研究同样受到政府的支持和鼓励。2019 年5 月,习近平总书记在致第三届世界智能大会的信中强调,在包括脑科学等新理论、新技术驱动下,人工智能呈现出深度学习、跨界融合和人机协同等新特征,正在对经济发展和社会进步等方面产生重大而深远的影响。开展脑科学和类脑研究,借鉴脑处理信息的特点推进人工智能的发展,是实现智能科技快速发展的关键环节。近些年,国家自然科学基金委员会(以下简称基金委)资助了一批关于人机协同决策方法和应用方向的研究,如2017 年资助了 “多源数据融合与人机混合实验驱动的两级电力市场全景式建模与决策理论研究”项目,2019 年资助了“脑机混合智能”项目。此外,基金委资助了一批相关的青年科学基金项目和面上项目。
在各类基金的支持下,中国学者在该领域取得了初步成果,已有人机协同决策的相关研究成果发表在中国和国际高水平期刊上,中国期刊包括《自动化学报》《软件学报》《Frontiers of Information Technology& Electronic Engineering》 等, 国际期刊包括《 MIS Quarterly》 《 Decision Support Systems》 《 IEEE Transactions on Neural Systems and Rehabilitation Engineering》《European Journal of Operational Research》《International Journal of Production Research》等。就研究领域而言,已有研究主要集中在理论探讨和系统设计,应用方面主要集中于人机谈判、供应链决策、船舶自动避碰和制造业等方向。
整体而言,中国科研力量在该研究领域已具备坚实基础,随着进一步的成长和壮大,有希望在该领域做出国际领先的成果,引领该领域的快速发展。
对于机器行为与人机协同决策理论和方法,主要研究方向包括管理决策环境下的机器行为模式及其演化、人机协同中人的行为塑造和特征、人机协同决策的新型模式和管理场景、基于人机协同决策的产品和服务创新4 个方面,它们之间的相互关系见图1。这4 个研究方向从整体上覆盖了机器行为与人机协同决策的微观、中观和宏观3 个层次,管理决策环境下的机器行为模式及其演化侧重于研究人机协同决策中机器的行为模式,人机协同中人的行为塑造和特征重点研究人的行为塑造和特征。由于在人机协同决策中人机之间的交互作用,这两个方向的研究有一定交互。在这两个研究方向的基础上,第3 个研究方向侧重于人机协同决策中的新型模式和管理场景,最后一个研究方向重点关注人机协同决策理论和方法在生产和生活中的具体应用,主要研究基于人机协同决策的产品和服务创新。
图1 主要研究方向的关系Figure 1 Relations of the Main Research Directions
在管理决策场景中,简单设定机器针对特定目标能够达到最优性能未必是最佳选择。在特定的社会文化背景下,人机协同可能产生复杂的社会联动效应,对这些次生效应的评估或预期将对机器行为的可能模式及其演化路径造成影响。此外,法律制度、伦理规范和决策文化也对机器行为构成实质性的约束,如法律和伦理对获取和使用训练数据集会直接影响机器可能产生的行为,对机器行为可解释性的需求也会制约机器行为的复杂性。探讨这些约束条件下机器行为的模式和可能的演化路径具有重要的研究意义。
典型科学问题举例:特定管理决策环境下机器产生特定行为的内在机理,机器行为的传播复制和突变,机器行为的发展及其驱动因素,机器行为的适应性,集群机器行为特征及产生机理,集群机器的协同和管理等。
人机协同决策环境对参与决策的个体提出了更高的要求,需要参与决策的个体对机器行为有一定的理解,以形成高效协同。近年来,以深度学习为代表的人工智能技术在多个特定领域取得了突出进展,但其“黑盒”特征也阻碍了其进一步的发展和使用。为解决这些新技术催生的人机协同问题,从机器行为的角度,需构建更易理解的可解释性人工智能;从人和组织的角度,需要从决策流程和方法、人员培训和组织决策文化等多个方面保障人机协同的顺利实施。这个过程将会影响参与人的行为,同时也需要考虑人的行为对过程可能造成的影响。
典型科学问题举例:人机协同决策中的参与者角色确定与任务分工,人员培训及其评价方法,人机协同决策算法模型,人机协同决策中的算法厌恶及其规避措施,人机协同决策中的交互优化,机器行为对人类决策行为的长期影响等。
在很多管理决策场景中,机器智能的作用形式、贡献度因场景和相关特征统计分布的不同而存在差异,人与机器的协同也存在不同的组合机制和形式。如一些场景下需要高强度的人力监督和监管,并利用群体智慧对机器进行在线培训;另外一些场景下则需要人机交互学习,充分利用机制设计、团队和制度,以保证高效持续的人机协同。本方向的问题需要综合多个学科进行系统的理论和实证研究。
典型科学问题举例:人机协同决策的典型场景及其分类,人机信任和合作的影响因素,人机协同决策模式及其效果的实证,人机协同的群体智慧决策方法,人机协同机制设计,人机协同决策行为的长期演变等。
在人机协同决策环境中,企业需要挖掘、预测消费者的内在和潜在需求,而不只是简单地满足表层和显性需求。同时,企业的产品设计和制造过程、服务流程将需要更加智能化,需精准理解消费群体结构和行为以及个体行为、需求和偏好。此外,人机协同决策还可能催生数据驱动的风险识别、政策影响评估及效果预测、大规模模拟推演系统等新的产品和服务形态。
典型科学问题举例:基于人机协同的计算广告投放机制,融合人机行为的自动推荐方法,基于人机协同的新一代电子商务,大数据驱动的群体行为计算实验,人机协同环境下的产品和服务模式创新,新能源政策推演和风险分析等。
随着大数据和人工智能技术在众多行业的普及,研究人工智能如何与人类共存、交互、协同的机器行为学作为一门新学科逐渐兴起。以人机协同为核心的机器行为学在管理和决策领域具有巨大的应用潜力,同时也面临人机融合带来的行为复杂性、机器智能的弱可解释性、人与机器表达和解决问题的差异性等多方面的挑战。相关研究在中国处于快速起步阶段,需要深入探索管理决策环境下的机器行为模式及其演化、人机协同中人的行为塑造和特征、人机协同决策的新型模式和管理场景、基于人机协同决策的产品和服务创新。今后仍需进一步提炼新的关键科学问题,规划和推进相关项目的实施和人才队伍的培养,以推动机器行为与人机协同决策理论和应用的健康发展,为国家发展人工智能的战略目标夯实理论和技术基础。
致谢:
感谢霍红、李林静、魏一鸣(依姓氏拼音排序)等各位专家参与本次“机器行为与人机协同决策理论和方法”优先领域讨论并提出真知灼见,这些建议和意见对本文尤其是其中第三部分关键科学问题具有很大帮助。