编译 无机客
伽利略用望远镜收集到大量天体观测数据。他凭借自己的智慧,在浩如烟海的数据中发现模式,创造出关于运动和力学的理论,为现代科学铺平道路。
深智(DeepMind)公司利用人工智能(AI),给予了数学家们一台新的“望远镜”。
深智公司与两个数学家团队合作,设计出一个算法。该算法能够查看不同数学领域,找出那些过去未被人类头脑发觉的关联点。人工智能并不是万能的——当它被给予充足数据时,它会找出模式。接着,这些模式被传送给人类数学家,指引他们的研究直觉和创造性工作,最终得出新的自然定律。
“我没料到,我的一些先入为主的成见会被彻底颠覆。”牛津大学的马克·拉肯比(Marc Lackenby)博士对《自然》杂志说道,包括他在内的科学家与深智公司合作的成果就发表在《自然》杂志上。
数个月前,深智公司还成功解决了生物学中一个有50年历史的挑战。这次的情况有点不同。机器学习首次瞄准数学的核心。数学的要义就是发现模式,并最终得到关于我们世界运转的、正式证明的构想(或称为定理)。它强调机器和人类之间的合作,将观测数据连接起来,得出有指导意义的定理。
“人类的创造力使得数学家凭借直觉懂得要去哪儿寻找显露模式(emerging pattern)。”波鸿鲁尔大学的克里斯蒂安·施通普(Christian Stump)博士说道,他并未参与这项研究,但撰写了一篇随附文章。
我和许多人一样,回想到上学时的数学课,依然惊恐不已。但我们那时所学的数学知识仅仅是皮毛。
数学天地奇妙无比,不只是关于算数、代数或几何。它洞察指引世界运转的基本规则。实际地说,是数学奠定了基础,才给予了我们计算机,容许人工智能算法的出现,而如今的网上世界主要由算法驱动。
背后的原因在于数学试图找到数据中的模式。下面就举一个引力的例子。
牛顿观察物体是如何坠落的,在包括伽利略在内的伟人奠定的基础上,从观察资料中找到模式,再将那些模式提炼为公式。这个过程也许听起来无聊,但没有这个步骤的话,我们不会拥有飞行、火箭或太空旅行。
施通普说,数学依循一套固定步骤。开始是若干相关例子(比方说物体的外形或从不同高度丢下物品),再是收集数据,计算性质,分析那些性质之间可能的关系,直到模式显露。接着,数学家在更普通或更复杂的背景下不断测试这些构想。假如出现奇怪的迹象,那么就应该更新模式。这套步骤继续循环,最终得出新的定理。这在我们的数字世界里是个好消息。
我们现在产生的数据呈现指数增长,意味着需要挖掘的数据量是史无前例之高。问题是什么呢?数据太多了,任何一位数学家在他或她的一生里都无法理清头绪。
人工智能格外擅长的一件事是在海量数据中找到模式。
数学家以前借助软件处理数字,寻找新定理。然而机器学习并不受欢迎,部分是因为它内在固有的或然性。由于算法设计的因素,这些算法只能提供估测,而不是明确结果。数学需要的是明确结果。
解决方案呢?建立一支人和机器合作的团队。
深智公司推断人工智能可以提供一些指引新数学构想的见解,于是和牛津大学的拉肯比博士、安德拉斯·尤哈斯(András Juhász)博士,悉尼大学的乔迪·威廉森(Geordie Williamson)博士合作探索两个领域:纽结理论和对称性的研究。两个领域中都有存在已久、能够影响我们对于世界的理解的开放式难题。
拿纽结理论来说。表面上,它是关于一条绳索如何打结,打出什么类型的结(对于登山者和渔夫来说至关重要)。但纽结理论的核心所包括的数学原理能帮助指引量子计算——类似于过去数学和逻辑学的扩展如何赋予了我们计算机。
纽结理论的吸引力尤其大,因为数学的不同分支——代数学、几何学和量子理论——共享“独特的视角”,深智公司团队在一篇博客文章中如此写道。但“一个长期存在的谜团是,这些不同分支是如何关联的”。
在该研究中,团队训练一个机器学习模型在数据中构建联系。人工智能受到计算机视觉中一个名叫“显著图”(saliency map)的招数影响。简洁地说,这些显著图在寻找携带更多信息的像素点方面尤其强大——类似于一个人的眼睛聚焦于某样东西和随机模糊的背景之间的差别。显著图指出与几何有关、特别有意思的性质(也就是“签名”),揭示出之前被忽视的重要特征。
“我们与拉肯比携手,下一步就能证明所发现关系的准确性质,确定一些首次发现的、数学不同分支之间的关联。”深智项目的作者写道。
另一项概念验证中,深智公司与威廉森联合,解决了一个对称性方面的难题,而这个难题触及了许多其他数学分支。
传统上,数学家利用图表来研究对称性。但就像渲染一部三维高清电影,这个工作很快变得过于复杂,太过耗费时间,甚至“超出人类的理解能力”。
深智公司用一个量身定做的人工智能,在对称性领域发现多个有趣的模式。这些模式勾起研究者极大兴趣,使得威廉森跟进研究。他提出了一个假设(基于所有已知的数据,显然是正确的,但依然需要严格的数学证明)。
“人工智能的强大威力给我留下深刻印象。”威廉森说,“我认为,我花费一年时间在黑暗中摸索,仅仅获知计算机知道一些我不知道的东西。”
深智公司证明了机器学习不仅仅适用于游戏,而且有众多实际用处。从用AI阐释核心生物学原理到预测基因表达,再到协助数学家发现新定理,AI在科学领域获得越来越多的进展。
然而,人类的直觉依旧不可能复制。由于算法的或然性质,得要由数学家使用现有方法来正式评估和证明人工智能的成果,但算法能够充当指引。像灯塔一样,算法为数学家指出可能正确的研究方向,但最终要由人类利用他们的判断力、直觉和缜密工作来找到突破口。
以这种方式,人类和机器能驱策彼此,形成良性循环。
就目前而言,人工智能仅仅在有限实例中受到检验。这个项目中使用的人工智能还无法适用于所有数学领域,尤其是因为它需要的数据量相对庞大。然而,相比于许多机器学习算法,它的效率很高,在一台笔记本电脑上都能运行。
“对于这两个领域的研究者来说,这些研究结果都不是难以触及的,但都提供了过去未被专家们发现的、真正的洞见。”施通普说。
深智团队对此心知肚明:“即使某几类模式依然无法用现代机器学习来发现,我们还是希望,我们的《自然》论文能激励其他研究者考虑人工智能的潜能,它能成为研究纯数学的一个有用工具。”
资料来源 singularityhub.com