AlphaGo和AlphaGo zero接连战胜人类顶尖棋手,让更多普通人以“危机感”的视角关注人工智能。
究竟什么是人工智能?人工智能是研究、开发用于模拟、延伸和拓展人的智能的理论、方法、技术及应用系统的一门新的技术科学。该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。“人工智能可分为3个阶段:计算智能、感知智能和认知智能。其中,认知智能是与人的语言、知识、逻辑相关的智能,是人工智能的高级阶段。”科大讯飞研究院院长胡国平告诉笔者。
2014年,科大讯飞股份有限公司启动“讯飞超脑”计划,让机器不仅能听会说,还要能理解会思考。这个当时被很多人看来“很神奇”的举动在3年后收获了惊喜:2017年12月份,科技部批准依托科大讯飞建设认知智能国家重点实验室,这也是在人工智能高级阶段的第一个国家级重点实验室。该实验室重点攻关的领域及目标是让机器掌握人类的语言和知识体系,并真正理解其内在逻辑。
实验室的未来会是什么样?“也许工作场景还如今天这般,但人工智能的系统可以更好地理解和处理人类语言,在偏通用的认知上寻找更大突破。”胡国平说。
应用广泛
认知智能国家重点实验室聚焦该领域的关键共性技术,也积极推进认知智能在各个行业落地
在科大讯飞研究院,没有高精尖的仪器设备、没有萌态十足的机器人,只见一排排工位、一台台电脑、一双双专注的眼睛。
“这就是认知智能实验室的模样。”胡国平指着眼前的场景说,“认知智能实验室重点处理与人类语言相关的方面,所以在这里,看见的是计算机或超级计算机,还有像GPU这样的处理器来训练计算机深度学习。”
这是和很多计算机软件公司类似的工作场景,但位于后台的“大脑”提供的是基于语言信息的智能判断。“兔子尾巴长不了,‘长读chang还是zhang?”“爸爸举不起儿子因为他太重了,这个他是指谁?”
为了处理这些对计算机而言还比较难的事,胡国平深知人才的重要性。除了培养研究知识图谱和深度学习的研究员,认知智能实验室也借助外脑。“2014年布局认知智能的时候,就与哈工大组建了联合实验室,现在与清华大学、浙江大学、加拿大皇后大学等都建有联合实验室。”
更为重要的是应用领域的行业专家。胡国平说:“认知智能研究必须要有各领域的专家一同参与,以便帮助机器更好地学习。”为此,认知智能实验室和上海外国语大学高级翻译学院、安徽省立医院、最高人民法院等以不同方式形成联合研究中心。
“目前,我们在自然语言方面有一些突破。虽然现在看起来还没有本质的改变,但已有很大迹象表明将来机器有可能像人一样去思考,用自然语言进行推理和理解,这是非常了不起的进步。”科大讯飞AI研究院副院长魏思告诉笔者。
“这一轮人工智能热潮能否进一步打开天花板,形成更大规模,认知智能的突破是关键。”胡国平说,认知智能国家重点实验室除了聚焦该领域的关键共性技术之外,还将推进认知智能在医疗、教育、司法等各个行业的落地。
认清“短板”
面向真实复杂的情况,如何能够有效应对口语的自然语言处理,是认知智能系统应用中的难点
如今,在安徽合肥庐阳区双岗街道卫生服务中心内,前来看病的市民发现,医生身边多了一个机器人“晓医”。它由科大讯飞和清华大学联合实验室共同研发。
在学习了海量医学书籍、一线专家经验后,“晓医”在2017年国家临床执业医师资格考试综合笔试评测拿到456分,不仅超过360分的分数线,而且在所有考生中名列前5%。现在“晓医”可以帮助医生辅助诊断150种常见病。科大讯飞智慧医疗事业部总经理陶晓东介绍,目前“晓医”已在北京301医院、北京协和医院、上海瑞金医院、安徽省立医院等近50家医院“上岗”。
认知智能正在各行各业“大显身手”。“比如辅助学生进行个性化学习时,通过借助大数据与人工智能技术,针对每一位学生生成个性化学情图谱,精准推荐个性化学习资源,帮助学生高效学习。”科大讯飞教育BG副总裁丁鹏介绍说。认知智能还可以帮助整理出“错题本”,“当学生做错了一个题目,机器可举一反三,给出基于错题知识点的其他相似题目,让学生不断巩固薄弱环节”。
实际应用中,认知智能系统也有“短板”。“比如医学上说的‘三级疼痛,当病人形容‘疼得死去活来时,系统就判断不出。”胡国平说,一方面,机器系统学习的是从教科书和互联网上获取的知识表述、病情案例,与真实情况下病人的现场表述有较大区别;另一方面,现实诊断中,医生与病人需要对话和互动获取更多病情信息,这对机器系统也是比较难的。
“认知智能技术面向真实复杂的情况,在用户输入不那么规范化、确定的时候,甚至用户说得很模糊的情况下,如何能够有效应对口语的自然语言处理,这是应用中的难点。”胡国平说。
市场对认知智能的需求越来越迫切。在司法领域,科大讯飞与上海高院启动206项目,通过认知智能的算法,目前可对4类刑事案件进行辅助办案。今年,结合市场需求,这样的能力扩展到79项刑事案件。
前瞻技术
目前提及的认知智能很大程度上是限定的重复性脑力劳动,未来将把人类的理解能力复制给机器
认知智能国家重点实验室建设明确,重点开展面向认知计算的深度学习共性技术、知识自动构建与推理技术等认知智能基础理论的研究。究竟哪些是需要突破的共性技术?
“一个是语义理解,怎么理解人类的语言?第二是知识表示,怎么表示行业知识和通用知识?第三是逻辑推理,包括对知识的运用。”魏思告诉笔者。
这些技术会衍生出对人类产生巨大威胁的“仿生人”么?胡国平说:“至少在我们有生之年不用担心。”他解释说,目前所有提及的认知智能很大程度上是限定的重复性脑力劳动,接受明确任务、输入输出比较确定。“机器可以通过学习和训练去改高考作文,但去改小说就不行了。真正人类的认知没有那么多条条框框,自己会的就去用、不会的就要学,而机器还达不到这种通用的认知智能,更不可能有自我意识。”
实验室下一步向哪个方向发展?“我们需要进一步赋予机器知识获取能力、不断学习能力和复杂推理能力。”胡国平说,“同时,我们也考虑建模真实世界的现象,让机器形成更有整体感觉的认知智能,从而进行一些预测。比如,我们说‘这个人的性格像石头一样,人类在脑海中对石头的概念不仅是这两个字,还包括颜色、硬度、形状等一系列综合问题。这些关联性的理解,机器目前无法做到,我们要把这种能力复制给机器。”
“当世界上所有机器都具备高质量的认知智能,就可以在更多領域和场景下帮助人类,创造出更大价值。通过不断赋能,去建设更美好的世界。”胡国平说。
白海星 张沛