1948年,维纳在其著作《控制论:关于在动物和机器中控制和通讯的科学》中提出“控制论”概念,指出控制规律既适用于无生命的机器,也存在于生命体中.此后,工程控制论蓬勃发展,逐步形成完备的理论和技术体系.而进入21世纪后,随着生物学、医学和信息智能技术的进步,对生命系统的深度干预和控制成为可能,也成为各科技强国竞逐的焦点.而深度干预和控制的前提是精确地描述生命系统.
生命是一个复杂、动态、交互的系统,宏观层面有神经系统、循环系统、消化系统等的相互作用,微观层面有DNA、RNA、蛋白质、代谢物等生物分子的相互作用,同时生命体与环境还存在复杂的交互过程.我国著名信息学家李衍达院士认为要描述这些过程,传统的还原论是不够的,必须使用复杂系统科学的理论和方法.一方面,研究表明生命系统里很多过程和机器系统一样,也遵循传统控制论里的基本原理.例如,仅仅在基因调控和信号转导中,就可以归纳出七种典型的控制环节:串联控制、分支控制、负反馈控制、简单正反馈、复杂正反馈、条件控制和延时控制.可以认为,生命体是典型的包括感知、反馈、作用的闭环控制系统.但李衍达院士也强调,另一方面,生命又是一个典型的复杂系统.生物系统不能用传统的简化模型进行分析,而应该用复杂系统科学的理论和方法.生命体无论在宏观还是在微观层面上都具有复杂系统的性质,只有用复杂系统的观点才能理解生物的非线性、涌现等特性.基于海量生物学数据的系统方法学研究被认为是获得对复杂生命系统全面认识的必由之路.
2020年,清华大学自动化系的张学工教授提出“数基生命系统”的概念.数基生命系统力图在数字空间中实现生命体孪生系统,通过对生命全方位跨尺度的数据感知和数字化建模,实现对生命机理从微观到宏观的全方位数学化理解.真正读懂从宏观到微观各尺度的生命“天书”,理解正常与异常的生命,理解生命的发生、进化、生长、疾病、衰老和死亡,理解生物的新陈代谢、应激与调控,从而真正理解生命的本质.目前,数基生命的研究刚刚起步.我们认为,由于控制环节在生命系统中普遍存在,数基生命研究中控制论、系统论的观点必不可少.
数基生命系统是一种新的思维与范式,通过对复杂的生命体的系统建模,对认识生命这种复杂的现象和机理,对疾病的预防、诊治、康复具有重要的价值.数基生命建模用信息科学与系统科学的思想来看待生命现象,在系统层面上对生命过程进行全方位跨尺度建模,揭示其机制与规律,进而对生命过程中不良事件进行预测和干预,实现对健康与生命过程从检测到分析再到控制的闭环;基于控制与系统的思想,利用信息和计算的手段,通过对大量复杂的宏观、微观生物数据的分析,认识复杂生物过程内在的调控机理,用数学模型定量地理解和刻画复杂生命系统,逐步建立对生命机理的定量模型,将生物体纳入到闭环控制系统之中.
在数字和数学空间中精准建立生命体的数基模型,包括:
一是对生命的全方位数据感知和数字化表示,也就是控制系统中的传感部分,通过全方位跨尺度、多模态生物医学大数据,把人体表征为数字化实体.基于分子层面的高通量组学技术,宏观、介观到微观的影像学技术,各种临床生理病理检验,快速发展中的可穿戴、可植入的生物兼容传感技术等,实现人体生物信息的系统检测,实现对生命体全方位、多模态的信息感知.
二是生命体全维度、多尺度的层次系统模型,也就是基于系统科学的思想,在数字实体中建立贯穿分子、细胞、组织、器官、系统、人体的生命系统数学模型,是不同尺度下、超耦合、多反馈的超复杂控制系统.而这样的应用场景对控制系统的研究提出了新的挑战,将大大扩展控制问题的内涵和外延.
三是在一般性数字孪生基础上,融合个人基因组、生理病理和生活环境等数据,建立个体化数字孪生,模拟个体健康演化和疾病发生发展过程,智能推演过程中各种因素的作用,实现重要生命过程定量评估、精准的动态健康指导和疾病治疗方案的精准优化,让数字实体“活起来”,模拟生老病死各种生命过程,形成人体“数字孪生”,在生命健康领域为国家的“虚拟现实”、“元宇宙”等数字经济战略布局奠定理论基础和关键技术支持.
细胞是生命的基本结构和功能单元,是在微观尺度上描述生命体的重要元素.细胞中基因表达决定了细胞类型、状态和功能,大量多样性的细胞通过复杂相互作用构成人体复杂系统,从控制与系统的角度,全方位刻画和理解各类细胞的特性和相互关系是理解人体生命和疾病机理的基础.
“细胞图谱”是指对人体所有细胞类型和状态进行刻画,形成人体单细胞分辨率的 “地图集”.细胞图谱的复杂性和信息量高于基因组多个数量级,对信息学提出了前所未有的挑战;同时微观尺度上细胞时空布局具有多样性和不确定性,缺乏确定的低维坐标体系;不同来源的数据在细胞类型标注等方面存在较大差异,缺乏统一的细胞信息表示体系.
用单一、独立、静态的数据分析与建模方式显然无法满足构建“细胞图谱”的要求,因此动态、互作、融合的复杂系统科学方法与反馈控制的思想必须引入到研究体系中,建设人类细胞数字化基础参照系和重要器官细胞图谱,研究各类细胞分子特性、内在规律和深层关联,揭示生理病理过程中细胞、器官和系统的多重复杂性,建立基于细胞参照系和图谱的医学研究新范式和示范应用,包括以下模块:
1) 建设人类细胞全信息基础参照系, 探索细胞系统的信息特性和多维度复杂性,建立统一的细胞多组学数据的集成标准,设计结构化、空间、时序、状态和功能等属性的细胞图谱信息架构,建立统一的细胞信息表示基础参照系.
2) 构建细胞全息图谱,基于细胞参照系框架,研究人体器官细胞全息图谱的要素、表征和呈现方式,研发图谱组装、信息表征、可视化呈现的技术,为图谱建设提供统一的数据标准与信息技术.
3) 研发数据、知识与假说共同驱动的多组学数据深度挖掘和关联解析方法, 挖掘发育和疾病发生等动态过程中的复杂规律和关键节点,研究细胞图谱中器官、细胞、基因的多维度全息刻画建模方法,挖掘疾病与健康状态系统差异.
基于控制论、系统论的思想应用对生命建模,构建完备的数基生命系统是一个很长远的目标,但数基生命系统并非在完全解码生命机理后才能建立和发挥作用.它既是一个目标,也是一种新的研究范式.当我们从某个尺度入手,把对生命的研究映射到数字空间中,同时采取控制、系统的思想将信息、数据的采集、反馈、作用通过在数字空间中的数学模拟、校验观测数据、外推科学发现、再反馈到科学实验,这种数基-碳基耦合的科学研究模式将加快对生命机理的认识进程,促进对于生命个体发育、衰老、疾病乃至对生命的演化、生命与非生命构成的生态系统的理解, 完善对复杂生命现象和规律的定量探索.
同时,生物是典型的复杂巨系统,其研究可以推动复杂系统相关理论与方法的发展,催生新的控制理论与方法.生命体中的控制与系统问题将丰富控制论与系统论的内涵,拓展其外延.