骆清铭
从认识脑、保护脑和创造脑角度,脑科学一般分为神经生物学、临床神经科学和计算神经科学等学科。神经生物学被定义为研究人和动物的神经系统的结构、功能及其相互关系的科学,旨在分子、细胞、神经回路或网络、乃至系统和整体水平上,阐明神经系统特别是脑的物质、能量、信息的基本活动规律,可进一步细分为分子神经生物学、细胞神经生物学、系统神经生物学、行为神经生物学、发育神经生物学和比较神经生物学等分支学科。
众所周知,脑是一个极其复杂的巨系统。脑内神经元、胶质细胞、血管等结构与功能信息高度复杂,时空尺度的跨度可达十几个数量级。脑连接及脑活动是在不同时间—空间尺度上演化和变化的,其物质、能量和信息高度耦合,具有空间位置不确定性、空间关系不确定性以及时域不确定性等。如何在大跨度的时间—空间尺度上研究脑连接及脑活动的演化和变化规律是脑科学研究面临的重大挑战,然而前述分支学科都不能很好地定义这一新兴的交叉研究领域。
研究表明,学科成熟的重要标志包括独立的研究内容、成熟的研究方法和规范的学科体制等,其中相对成熟的研究方法或完备的技术体系至关重要。Seung在《连接组:造就独一无二的你》中提到,神经科学家缺少足够的技术去测绘神经元之间的连接,因为这个原因,连接主义(connectionism)从来没有被视为一门真正的科学。由此可见技术体系在学科发展过程中的地位。
美国Harvard大学Lichtman教授领导的团队以电子显微镜为观察手段,用时15个月以4 nm×6 nm×28 nm体素分辨率测绘了0.07 mm3P32小鼠(Mus musculus)外侧膝状体核并重建400多个神经元。美国Allen脑科学研究所重建了100 μm分辨的小鼠脑连接图谱。他们所采用的手段都没能在小鼠全脑范围内获取单神经元分辨水平的神经环路精细结构图谱,当然更谈不上获取功能连接信息。由此可见,如何在小鼠全脑范围获取神经元分辨水平的结构与功能图谱在国际上仍然是未获解决的瓶颈问题。
功能磁共振成像(functional Magnetic Resonance Imaging,fMRI)主要通过测量磁共振信号来量化血氧饱和度和血流量的变化,对流向特定脑区血液的变化进行检测,从而间接反映脑神经活动所伴随的能量消耗。它可同时提供脑的解剖和功能视图。该技术的突出优点包括无损伤、无辐射、可重复测量,空间分辨率在毫米量级。DNA双螺旋结构发现人之一、诺贝尔生理学或医学奖获得者Crick和Jones在给《Nature》的评论中写道:“我无法忍受我们没有绘制出人类大脑的连接图。没有它,很难有希望能了解我们的大脑是如何工作的。”他还测算过,1 mm3的人脑视皮层包括超过40000个神经元。显然,fMRI离神经元分辨水平还有很大差距。
以显微光学切片断层成像(micro-optical sectioning tomography,MOST)为标志的全脑高分辨精准空间定位与成像方法的日益成熟和应用,使得在全脑范围测量和绘制三维精细的脑连接图谱、建立标准化的数据体系成为可能。这里所说的三维精细脑连接图谱不是传统的、由若干带有注释信息的、离散的断面图片的集合,而是指空间间隔为亚微米(准连续)、能分辨出单个神经元、具有明确空间尺度和位置信息的全脑结构及功能(包括基因组、转录组、蛋白质组和代谢组等信息)连接图谱。为此,有必要建立规范的脑空间信息研究科学体系,即运用现代信息科学理论、技术与方法,从信息科学角度,以高的体素分辨率(voxel resolution),如细胞/轴突/毛细血管分辨水平,在全脑范围测量(surveying)与绘制(mapping)脑结构和功能信息的三维空间分布,如神经元投射、神经/血管分布、基因组/蛋白组/代谢组/转录组分布等,从而揭示脑连接及活动的时空特征和变化规律,如神经元和血管走向、同类型神经元的覆盖范围、神经元之间的时空连接特征及投射方向等。脑空间信息学的提出正是顺应这一发展趋势的体现。
脑空间信息学(brain-spatial information science,brainsmatics)是以脑连接的基本结构与功能单元为研究对象,揭示脑连接空间信息机制,引导脑疾病防治与智能技术发展的新兴交叉学科。该学科是认知脑功能并进而探讨意识本质的科学前沿,是沟通脑科学与智能科学的桥梁。脑空间信息学将脑作为一个完整的系统,顺应智能技术发展需求,以脑科学和信息科学的基本理论为指导,运用新兴的全脑高分辨精准空间定位与成像方法,同时结合多种前沿脑科学研究技术,标记、获取、分析和可视化具有明确空间尺度和位置的精细脑网络结构与功能信息,从大数据中提取跨层次、多尺度的脑连接时空特征,揭示感知、记忆、意识和情感等脑连接空间信息机制,从而促进脑健康与智能技术的跨越式发展。
这里从脑连接的示踪、测量、可视化以及时空信息特征的提取与模拟等4个方面简要讨论脑空间信息学的研究内容、技术体系及关键科学问题。脑空间信息学的技术体系是指贯穿脑空间信息示踪、测量、分析、处理、呈现、传播和应用等一系列技术方法所构成的完整技术方法的总和。它是实现脑空间信息从获取到应用的技术保证,并能在自动化、时效性、详细程度和可靠性等方面满足人们的需要。
对比脑科学的其他分支学科可以看出,虽然研究对象都是脑神经系统,脑空间信息学具有相对独特而成熟的技术体系,特别是介观尺度的全脑高分辨精准空间定位与成像,为获取具有明确空间尺度和位置的精细脑网络结构与功能信息,并从大数据中提取跨层次、多尺度的脑连接时空特征提供了技术保证。与过于理想的连接主义不同的是,可行的技术体系标志着脑空间信息学这一新兴交叉学科日臻成熟。
脑连接的示踪主要研究并运用各种示踪技术,从分子、突触、单细胞,到环路、网络和脑区等不同层次,为多模态原位获取精细脑连接结构和功能信息,提供特异、高效、可控的标记方法。19世纪末和20世纪初,意大利科学家Camillo Golgi和西班牙学者Santiago Ramón y Cajal先后开发利用高尔基银染法对神经元进行染色,并获得1906年的诺贝尔生理学或医学奖,由此可见示踪方法的重要性。
现有示踪技术包括:借助化学、病毒学和基因组、蛋白质组、转录组、代谢组等组学技术,发展不同尺度下脑空间信息的原位标记技术,如转基因技术、示踪标记技术(免疫标记、染色示踪、转染标记等)、基因编辑技术等,实现对不同层次脑连接基本单元的特异、高亮标记。从实现测量的角度,通常被忽视的样品制备技术往往是最重要制约因素。
Jiang等人研究了成年小鼠新皮层不同神经元的形态差异并初步证实神经元可被归类为有限的细胞类型,且每一种神经元类型都有其固定的连接模式。据此,可以大胆假设,不同类型的神经元、神经环路/网络与神经系统之间的关系,可以类比于化学元素、化合物与生命有机体,也可类比于分立的电子元器件(如电阻、电容、电感、三极管等)、基础电路(如电源电路、音频电路、放大电路等)与电子系统(通信电子系统、飞机电子系统、导弹电子系统等)。
关键科学问题主要包括:(ⅰ)如何增强脑空间信息的示踪效率,实现对微观精细结构、介观完整形态和宏观整体信息的高对比度、完整标记?(ⅱ)如何提高标记的特异性,实现不同类型神经元和脑细胞(可进一步区分为亚类)、神经环路、以及由多个环路所组成的神经网络乃至神经系统等不同层次结构和功能信息的示踪?如何实现针对特定类型神经元、环路和网络的稀疏数量可控、跨突触级数可控?
全脑范围脑连接的测量主要研究不同尺度下全脑、高分辨精准成像与空间定位方法,建立与之相应的定位基准,并将数据采集过程标准化,实现具有明确空间尺度和定位含义的精细脑网络结构与功能信息的获取和分析,为提取脑连接时空特征提供跨层次、多尺度的大数据,从而揭示和掌握脑空间信息的时空变化特征及规律。
在介观尺度下最有特色的全脑范围脑连接的测量技术是以MOST为基础的系列全脑高分辨精准空间定位与成像技术。此外,连续双光子层析成像(serial two-photon tomography,STP)、光片照明显微成像(light sheet microscopy,LSM)、多光子显微成像等也可以为研究脑空间连接信息提供部分技术支持。介观尺度的测量技术可以与宏观尺度的测量技术,如fMRI、正电子发射断层成像(positron emission tomography,PET)、脑电(electroencephalogram,EEG)、功能近红外光学成像(functional near-infrared imaging,fNIRI)、X射线计算机层析成像(X-CT)、超声成像等,以及微观尺度的成像技术,如电子显微镜成像、超分辨荧光纳米显微成像等,相互配合与交互。脑空间信息测量的定位基准和数据采集过程的标准化是推动脑科学研究成果产业化的重要保障,这也是脑空间信息测量技术最迫切需要解决的问题。
关键科学问题主要包括:(ⅰ)如何实现介观和微观尺度下脑连接空间信息的获取?现有技术已能解析宏观尺度下的脑连接,但仍缺乏介观和微观空间尺度水平时空变化的测量手段。(ⅱ)如何建立不同尺度的定位基准?定位基准是在不同条件下所获取的脑空间信息进行匹配及比较的前提条件。目前,宏观尺度的定位基准已初步建立,尚缺乏介观及微观尺度的定位基准,亟待确定。(ⅲ)如何实现测量标准化?测量设备及测量过程的全过程标准化管理是保证脑空间信息数据可靠性和有效性的重要前提,也是开展对比性研究的重要基础。
研究内容主要包括脑空间信息的数据可视化、科学可视化、信息可视化和知识可视化。可视化的目标是将跨层次、多维度的脑空间信息时空变化过程,通过运用高维数据场、虚拟现实等技术直观、高效地呈现出来,以供用户观察、模拟和计算。开展脑连接的可视化研究一方面需要建立涵盖数据管理、运算、分析和展现等手段在内的一整套技术方案,另一方面还要构建数据编码标准、数据表示标准、数据质量标准、数据交换标准、空间定位标准、流程控制规范等完整标准体系。实现脑连接的可视化首先要完成脑空间信息大数据的数字化和知识化,其中,数字化又是知识化的基础,研究从多维图像大数据中准确、高效地分割重建出脑区核团、神经元形态等特定结构,实现图像到图形的变换。知识化是研究运用计算机辅助技术并结合专家知识,将数字化的图形图像数据准确变换为结构化的知识,并通过数据库、图谱等基本组织形式对脑空间信息知识进行收集、分类、检索和调用。
三维脑连接信息的可视化对于建立脑认知模型并最终理解脑工作机制至关重要。16世纪意大利艺术家Giuseppe Arcimboldo曾神奇地把蔬菜、水果和花组合成人像,犹如几十种不同的化学元素最终能组成人体。人类依据还原论思想,成功地对自然界加深了认识,然而另一方面,也需要整体论或系统论思想的指导。如何实现对海量脑连接大数据的准确展示,将是脑科学研究面临的重大挑战。
脑空间信息数据量巨大,技术体系涉及大数据存储与传输,在数据结构、数据压缩、云存储等多方面都需要技术支撑。此外,在数字化方面,需要运用和发展现代数字图像处理、云计算、统计学、机器学习等技术;在知识化方面,需要借鉴和采用数据挖掘、数据库、情报学等技术;在可视化方面,则需要运用和发展计算机图形学、虚拟现实等技术。
关键科学问题主要包括:(ⅰ)如何灵活运用专家介入和自动化技术,在复杂大数据中实现脑空间信息准确而高效的数字化?(ⅱ)如何应用虚拟现实等技术,对时空变化过程中获取的大数据进行交互式可视化?(ⅲ)如何利用有限的计算资源,实现对大数据的存储、传输、运算和呈现?
主要内容是通过整合多模态、跨层次、多尺度的全脑高时空分辨信息,模拟特定功能(运动、视觉、听觉、情感、记忆等)神经环路和网络的时空动态过程,进行空间上的形态分析、时间上的过程分析和发生上的因果分析,实现对脑空间信息的定性解译和定量反演,揭示脑连接的时空变化规律,进而实现全脑的功能模拟,为类脑和智能技术提供全新的理论基础。
采用全脑网络可视化(visible brain-wide networks,VBN)技术测绘的小鼠桶状脑皮层发现,同一脑区存在多种形态的神经元,其投射模式也不一样,有局部,也有长程。总线有限的数据传输速率被称为“冯·诺依曼瓶颈”,显然,脑信息处理的机制是完全不一样的,但实际情况是什么?不同脑区之间如何实现信息交互?是具有少量捷径连接的小世界网络吗?需要在全脑范围、运用系统生物学思想来研究这个问题,通过建立跨层次多尺度模型,模拟并最终认识脑连接的基本规律。
技术体系中,需要采用对所获得的数据进行解析和理解的方法,包括统计信号处理、高维数据分析、大数据处理等,而对所理解的知识进行建模的方法,则包括统计建模、机器学习、深度学习等。
关键科学问题主要包括:(ⅰ)如何从多模态跨层次多尺度和多维度的脑连接大数据中,揭示特定脑功能的时空变化规律?(ⅱ)如何针对类脑研究的需求,构建脑空间信息的数学模型?
大脑非常复杂,全面理解大脑必将带来多层次、多模式的海量数据。例如,基于MOST成像技术,以微米体素分辨率采集一个完整小鼠脑的数据量达8 TB,如果是荧光图像数据量则更大。对于人脑而言,若以相同体素分辨率采集,预计数据量将达到11 PB,相当于20万部4K高清电影,或500家三甲医院产出的全年数据。如果用正在普及的10 M宽带,仅数据传输就需要耗时300年。此外,脑研究中数据类型具有多样性,维度、深度、密度、数据结构、压缩方式,以及所代表的物理量及其对应的生物信息量各不相同。因此,脑研究产生的海量数据必将对数据处理、存储、分析、管理和共享等方式带来全方位的挑战。
数据的计算、存储、传输等技术的需求从某种意义上来讲具有“大数据”的共性,但如何科学地组织、共享和管理这些神经信息数据,提高数据的使用率和价值,是对现代信息技术特别是计算机技术提出了前所未有的巨大挑战。大数据的计算离不开高性能计算领域的参与,欧盟“人类脑计划”在巨型计算机上对人脑建模,通过超级计算机描绘和模拟大脑神经元活动的海量数据,对大脑的功能和活动进行模拟。美国“脑计划”也将建立大规模神经信息数据计算平台列为重要任务之一。
大数据时代,开展脑空间信息学研究正当时,机遇与挑战并存。
具有跨层次、多尺度时空变化特征的脑空间信息学有望在绘制脑结构及功能的三维甚至四维图谱,并进而在认知脑功能、防治脑疾病和发展智能技术等方面发挥重要作用。
利用所建立的脑空间信息知识库,回答神经元种类及绘制脑图谱等问题,并对研究认知和行为的神经活动机制等脑科学问题提供基础数据。基于脑内原位多种信息共存的空间信息构建的模型将为脑科学研究提供模拟和分析平台。
由于在介观尺度缺乏有效的研究工具,目前对高等哺乳动物神经环路连接信息的认识还极度匮乏。复杂脑功能往往需要局部神经环路和长程神经环路的协同作用才能完成,其中长程神经环路可能从皮层一直投射至脊髓,几乎跨越全脑范围。小鼠全脑在任意方向上都是厘米量级;脑中的特定结构,如海马,在毫米量级;一般神经元胞体的直径约为5~30 μm,胞体发出的突起直径往往小于1 μm。要在全脑范围获取精细神经结构,需要跨越4~5个数量级的几何尺度进行高分辨率成像——这是现有成像技术必须克服的技术瓶颈。目前,人们仅对拥有302个神经元的线虫进行了较完整的神经环路研究,而对于拥有约10万个神经元的果蝇(Drosophila melanogaster)脑的相关研究还只是刚刚起步。相比之下,高等哺乳动物大脑由数亿到数百亿计的神经元构成,在介观尺度绘制哺乳动物脑连接图谱对传统成像技术而言无疑是不可能完成的任务。作为脑空间信息学领域最有特色的研究手段之一,以MOST为基础的全脑高分辨精准空间定位与成像技术体系的日益成熟,为在介观尺度(具有神经元/细胞分辨度)建立小鼠或非人灵长类(猕猴)全脑网络精细结构与功能连接图谱提供了重要的研究工具和技术平台。
通过全脑空间精细信息的整合,对比不同模态下脑部结构与功能的差异,有助于系统地研究脑部疾病及大脑发育的机制,为脑部重大疾病如神经遗传与发育性疾病(自闭症等)、精神性疾病(抑郁症等)和神经退行性疾病(老年痴呆症等)的临床防治提供支撑,并为儿童教育等提供理论指导。
脑疾病防治是脑科学研究最重要的需求导向之一。由于对脑的结构和功能缺乏认识,不能及时有效地治疗老年痴呆、帕金森氏病、抑郁和自闭等脑疾病,导致脑疾病已经成为社会负担最重的病种。在单神经元分辨水平揭示全脑神经环路的空间连接信息,不仅是阐明各种高级脑功能机制所必需的,也是彻底认识和征服脑疾病的重要前提。特定神经系统疾病往往伴随着相关神经环路的异常。获得病理模型下特定神经环路精细图谱,对研发脑重大疾病的早期诊断、精准干预(包括病前干预和疗后康复)的新技术、新方法是至关重要的。
理想情况下,完美模拟大脑不仅意味着知晓了大脑如何工作,也将知道脑功能被破坏的原因,即脑疾病的致病机制。控制论的创始人Wiener就鼓励人们从计算机工作原理的角度去理解人类大脑。通过有效的计算机模拟,有望使科学家能够厘清脑部疾病的某些细节,进而筛选出可行的治疗途径,甚至革命性地改观现有的药物研发方式,从而形成重要的应用价值。
通过模拟、解译和反演等多种手段,利用脑空间信息模型探究记忆、学习、决策等原理,构建并规范全脑空间的功能计算模型,在类脑人工智能的设计上模拟仿真和再现脑局部和整体功能的工作结构,发展类脑人工智能算法,以此让机器获得更好的概括能力、更好的抽象能力以及对稀疏数据的使用能力。
经过60年的发展,人工智能已经取得了一系列令人瞩目的成就。1997年,IBM深蓝计算机因为击败了世界国际象棋冠军卡斯帕罗夫而名声大噪。2016年,Google的AlphaGo又在全世界人民面前大败围棋世界冠军李世石,掀起了智能技术新一轮的热潮。智能技术如今已成功应用在非常多的领域,例如,机器翻译、智能控制、专家系统、机器人学、语言和图像理解、航天应用等重要领域,以代替人类去执行复杂或规模庞大的任务。但是,现有的智能技术还限制于弱人工智能的发展阶段,它的显著特征是仅具备某项认知能力,无法推广至实现其他功能。谭铁牛院士形象地评价“有智能,没有智慧;有智商,没有情商;会计算,不会算计;有专能,无全能”。究其原因,还是人工智能向脑工作机制的学习还不够,“类脑”不够,当然人类对脑的认识本身也还十分粗浅。目前的人工神经网络只是参考了神经元间的部分拓扑结构而搭建的数学模型,其核心算法是计算机科学研究者发明的,而非来自于生物神经系统的解析,尚与大脑的原理和能力相去甚远。
瑞士洛桑联邦理工学院的“蓝脑计划”从2005年开始就试图模拟人脑功能,其初始目标是对构成鼠脑新皮层中功能柱单元的1万个神经元及3千万个突触连结进行模拟。这个模型虽然基于十几年来的各种实验数据,如神经形态学、基因表达、离子通道、突触连接,以及很多鼠脑活动的电生理记录,但仍然不是真实完整的神经元网络。美国脑计划于在2015年启动了脑皮层模拟项目(MICrONS),旨在通过重建一立方毫米脑区内的神经环路连接,模拟脑皮层功能,研发下一代机器智能系统。酝酿中的中国脑计划也将类脑研究列为重要目标之一。
由此可见,脑空间信息机制研究是认知脑功能并发展类脑人工智能的必由之路。智能技术正从狭义的人工智能向类脑人工智能发展,基于脑连接三维甚至四维图谱的脑空间信息学的发展将是成败的关键。
综上,有理由认为,脑空间信息学研究将为理解脑功能与防治脑疾病打下坚实基础,也为发展类脑人工智能技术提供重要指导。中国脑计划已箭在弦上,以重大需求为导向,通过发展核心关键技术,建立科学的研究体系,应该成为中国脑计划实现突破并引领国际的重要路径。
考察生物信息学的发展历程我们可以看到,正是由于DNA测序技术的快速发展,催生了一个从积累数据向解释数据的时代转变,这是历史发展的必然。同样,随着介观尺度全脑网络可视化技术的发展,产生了PB级脑空间信息的数据。如何利用信息技术,特别是计算机技术,解析脑连接时空变化特性,正成为脑科学研究的前沿。因此,脑空间信息学是脑科学与信息科学交叉融合与发展的必然结果。
从研究方法角度,以VBN为核心技术体系的脑空间信息学是系统论研究和还原论研究的重要结合点。
脑空间信息学是由脑科学和信息科学高度交叉而形成的一门新兴的学科,其最重要的目标是认识脑,并且其研究成果对于保护脑和创造脑同样意义重大。脑空间信息学最重要的特点是采用了以VBN为核心的独特技术体系,这一新的技术体系以亚微米甚至更高的体素分辨率,全局(全脑范围)、动态(脑发育的不同阶段)地为脑科学研究提供前所未有的数据,包括神经元分辨水平的基因组、转录组、蛋白质组和代谢组等表达信息。脑空间信息学不仅在研究对象上面临着人类的终极挑战——脑,在研究手段方面,对现代信息科学与技术的发展也提出了前所未有的挑战。为此,有必要对这一新兴学科进行更深入更全面的规划和建设,不断完善其学科体系,引领脑科学与智能技术的发展。
需要特别强调的是,支撑脑空间信息学的技术体系不只是VBN,也包括以电子显微镜为代表的局域脑组织高分辨成像和以fMRI为代表的宏观水平的全脑成像。电子显微镜的成像分辨率很高,但成像范围极其有限,Luo等人测算过,1 mm3的脑组织,如果用电子显微镜成像,需要1万人/年的工作量。fMRI虽然能快速观测全脑,但不能在神经元/细胞分辨水平真实反映脑结构与功能活动。只有基于MOST或荧光MOST(fluorescence micro-optical sectioning tomography,fMOST)的技术体系既能在亚细胞分辨水平、又能在全脑范围实现脑结构与功能的观测。
MOST/fMOST与电子显微镜和fMRI等技术互相补充、融合,将构建出更完备的脑空间信息技术体系框架,使得脑空间信息学不再是空中楼阁。
致谢
中国科学院武汉物理与数学研究所叶朝辉、国家自然科学基金委员会曹河圻、华中科技大学龚辉提出了重要修改意见,华中科技大学李安安、袁菁、李向宁、许彤辉、杨孝全、张智红、王平、黄松林、张小宇、吴昊、齐毅松、周伟、曾绍群、施华等参加了调研与讨论。