财新传媒 财新传媒

阅读:0
听报道

王晓东,北京生命科学研究所所长、资深研究员

撰文|王晓东‍

 ●                  ●                   ●

——从生命本质到逆向工程

“道可道,非常道。”

老子的这句话,用来形容今天生命科学的现状,或许再合适不过。

突破层出不穷。新的疾病通路、靶点与机制,几乎每天都会通过手机里的各种推送扑面而来。抗衰老、抗肿瘤、抗老年痴呆的新方法、新思路,不断登上三大科学杂志的头条。AI加持的医学与生命科学,正在成为各种大项目与资本追逐的中心。发明AlphaFold的诺奖获得者,甚至做出了“十年内治愈所有人类疾病”的预言。仿佛人类距离活到150岁,已经只差几个大模型和几个融资轮次。

生命科学的规律——也就是它的“道”——好像已经可以经常被人说道了。

01

什么是生命

然而,这些“可道”,是否真的是生命科学的“常道”?

我们仍需要回到“什么是生命”这个最根本的问题。

人类真正开始理解生命,其实不过是最近几十年的事情。

1953年DNA双螺旋结构被发现时,人类第一次真正意识到:生命或许并不是一种神秘力量,它背后同样存在可以被理解的规律。

如果抽象地看,DNA本质上是一套由四种碱基构成的信息系统。真正革命性的地方,在于其互补双链结构使信息第一次能够以“模板复制”的方式稳定延续。达尔文进化论也因此第一次真正拥有了明确的物质基础。

但信息本身并不足以构成生命。

一本书可以储存大量信息,一块硬盘甚至可以储存整个人类文明,但它们都不是生命。生命除了能够复制信息之外,还必须维持自身存在。一个无法维持结构稳定的系统,会迅速走向热力学平衡,也就是死亡。

因此,生命的第二个核心问题,是能量。

二十世纪生物化学的发展逐渐回答了这一问题。从电子传递链到氧化磷酸化,人类开始理解:生命并不是违反热力学定律的存在。恰恰相反,生命本质上是一个远离热平衡的耗散系统。它通过持续吸收外界能量,转化为可以利用的ATP来维持自身高度有序的状态。

从这个意义上讲,DNA解决了“信息如何延续”的问题,而能量转化则解决了“生命如何维持存在”的问题。

真正深刻的地方在于:生命并不是信息本身,也不是能量本身,而是信息与能量第一次被稳定耦合在一起。DNA储存信息,ATP提供能量,而蛋白质与代谢网络则让信息能够调用能量去维持自身结构,并继续复制信息本身。

信息与能量的耦合,构成了生命的起源;而演化,则不断扩展生命能够存在的空间。

然而,信息与能量究竟如何通过核苷、氨基酸等简单有机分子的相互作用,最终耦合成一个能够自我复制并维持稳态的系统——也就是生命真正的“道”——至今仍然超出了我们的理解。

生命真正需要对抗的,并不是个体死亡。

而是信息的湮灭。

个体会消失,但只要信息能够延续,生命本身便仍在继续。

02

生命为何如此复杂

二十世纪物理学的巨大成功,很大程度上塑造了现代人对于“科学”的理解。相对论重新定义了时间与空间,量子力学揭示了微观世界的规律。现代物理学之所以辉煌,很大程度上建立在数学这一语言之上。

而生命科学不同。

生命不是静态系统,而是演化系统。一个电子不会因为过去发生过什么而改变性质和运动轨迹,但一个生命系统,却携带着几十亿年的演化历史。

因此,生命不仅遵循物理规律,它还记录历史。

今天所有活着的生命系统,都不是“从零开始设计”的结果,而是在无数随机突变、自然选择与环境压力下不断修补、妥协与叠加后幸存下来的产物。生命系统中充满冗余、补偿、模块重复,以及各种演化遗留下来的“bug”与历史补丁。它更像一段不断被修改、却从未被彻底重写的古老代码。

而生命演化中最深刻、也最具有偶然性的例子之一,或许就是线粒体的出现。

今天几乎所有真核生命——包括人类——都依赖线粒体产生ATP来提供能量;但线粒体原本并不属于这些细胞。

宿主细胞与线粒体祖先,最初都能够独立生存。

在二十多亿年前某个偶然时刻,一个原始细胞吞噬了另一种能够高效利用氧气产生能量的微生物。但这次吞噬并没有像通常那样导致消化。相反,双方逐渐形成了稳定共生关系。被吞噬的微生物最终演化成线粒体。

而今天地球上所有复杂生命——从海洋里的鱼类、陆地上的动物,到森林中的植物与最终出现的人类——某种意义上,都源于二十多亿年前两个微生物的一次偶遇。否则地球上的生物可能至今仍停留在肉眼不可见的单细胞状态。

从这个意义上讲,生命系统很多时候并不是“最优设计”。它更像是历史偶然事件不断累积后的“幸存方案”。

因此,理解生命,不仅需要理解物理与化学规律;还必须理解历史本身。

也正因为如此,生命科学很难像物理学那样,仅仅依靠几个优美方程就被完全统一。如果生命系统真能被几个优美方程完全统一,生物学家的数学功底恐怕也会好很多。

生命不仅是物理系统,它还是历史系统。

而历史,恰恰是不容易重复、也很难完全简化的。所以生命科学研究中不可以只是凭逻辑自洽,或孤证结论。

03

生命科学研究的“道”

如果说生命科学存在一个最根本的“道”,那就是理解生命如何利用能量维持一个能够自我复制、并不断演化的信息系统,并通过占领不同的生存空间去最大限度地利用能量、复制信息。

DNA让信息能够跨越时间;ATP让系统能够维持远离热平衡的稳态;而演化,则让生命不断适应环境并产生复杂性来扩展生存空间。

而整个现代生命科学能够成立,还有一个极其重要、甚至近乎奇迹般的前提:地球上所有生命形式,无论是细菌、植物、昆虫,还是人类,都来自共同祖先。

因此,所有生命的信息载体都使用相同的核苷酸多聚体;DNA与RNA的基本化学逻辑一致;从核酸到蛋白质翻译的遗传密码,也几乎完全统一。

这一点意味着,生命虽然演化出了亿万种形态,但底层“操作系统”却高度统一。

于是,人类才可能通过酵母、果蝇、线虫、小鼠甚至细菌去研究人类自身,研究细胞分裂、神经系统、衰老与死亡。

整个现代生命科学,其实都建立在“生命单一起源”这一巨大幸运之上。

04

生命科学研究的“术”

如果说生命科学的“道”是理解生命为何存在,那么生命科学研究的“术”,本质上则是一种逆向工程(reverse engineering)来了解生命体的运行。

生命并不是一个由人类设计出来的机器。它没有设计图纸,也没有统一架构。今天所有生命系统,都是几十亿年演化不断叠加后的结果。

因此,现代生命科学研究,本质上是在不断拆解这个复杂系统,逐渐理解它如何运作、如何组装、如何维持稳态,以及如何根据环境变化不断调节自身状态。

这个过程大致可以分成几个层次。

最初是对生命现象的描述。从博物学时代对自然界生命形式的记录,到显微镜发明后对细胞与微生物的观察,生命科学首先需要知道“发生了什么”。

随后,研究进入机制分解阶段。问题不仅是“发生了什么”,而是“为什么会发生”。于是,人类开始不断把复杂生命活动拆解成更基础的分子与细胞事件:哪些基因参与,哪些蛋白发挥作用,它们如何相互作用,信息如何传递,能量如何流动。

而机制研究本身,又包括两个层面:一个是生命活动最基础的核心过程,例如DNA复制、蛋白质翻译、ATP产生与细胞分裂;另一个则是调节机制。

因为生命并不是静态机器。生命存在于不断变化的环境中。温度、营养、感染、压力、损伤、昼夜节律都会改变生命状态。因此,调节本身就是生命最核心的属性之一。

某种意义上,一个实验室里观察到的生命现象是否真实,一个重要标准就是它是否会随着环境变化而被调节。因为生命最本质的特征之一,正是动态适应。

但即便理解了分子机制,生命科学研究仍未结束。因为生命最终并不是单个分子的集合,而是一个高度整合的整体系统。因此,机制最终必须重新回到组织、器官、个体与生态系统中,在正常(生理)与异常(病理)状态下不断被验证,并赋予其生命过程中的意义。

而生命科学研究最终,也并不止于“理解”。更进一步的目标,是人为调节生命过程,为人类服务。治疗疾病、提高农作物产量、增强抗病与抗逆能力、优化生态系统,本质上都属于建立在生命逆向工程基础上的“再工程化”。

05

技术革命与生命科学

生命科学的发展,在极大程度上受到技术进步推动。

某种意义上,生命科学的发展史,本身就是一部不断“看见更深层生命世界”的技术史。

从光学显微镜,到X光衍射解析DNA结构;从荧光蛋白到超分辨显微镜;从冷冻电镜到单分子技术与活体成像;从模式生物与遗传突变体,到DNA重组、测序与编辑、光和化学遗传学、类器官、单细胞组学与空间组学。

每一次技术革命,都会重新定义人类能够观察生命的尺度与深度。

技术发展的不均衡,也逐渐塑造了现代生命科学内部两种不同研究路径。

一种是传统的还原论(Reductionism)。不断把生命系统拆解成更小、更基础的子系统,以化学分析为手段,研究单个基因、单个蛋白、单条信号通路,用遗传学的手段建立因果关系。这种方式像“管中窥豹”,速度很慢,以小团队、专业化、探索性为途径。

另一种则是随着组学与AI发展而兴起的整体化(Holistic)研究方式。即不再首先拆解系统,而是试图直接从全基因组、全转录组、全蛋白组与全细胞状态中整体推断生命活动规律。我把这种方式戏称为“观豹造虎”。

某种意义上,Reductionism是在“拆机器”,而Holistic则更像是在透视“整台机器如何整体运转”。

随着组学、AI与深度学习的发展,生命科学第一次开始真正拥有“在尚未完全理解子系统之前,直接从整体数据推断规律”的能力。

这与传统还原论研究形成了明显不同。

传统生命科学强调的是:在可控条件下建立因果关系。而AI与大数据更擅长的,则是从复杂数据中发现关联与模式。

于是,生命科学第一次真正开始面对一个问题:

关联,是否能够替代机制?

06

AI时代与生命科学的边界

AlphaFold对蛋白质结构预测的成功,第一次让人类看到:生命活动背后的某些复杂规律,或许能够通过大模型与深度学习被“学习”出来。

于是,出现了很多惊人的预测:十年内解决所有人类疾病,彻底攻克衰老,重新设计生命。

但真正重要的问题是:我们的逆向工程,究竟进行到了什么程度?

即便所有蛋白结构都被解析,所有空间位置都被确定,疾病状态中的所有变化都被系统记录,是否就意味着我们真正理解了疾病?

问题恰恰在这里。

因为变化本身,并不一定就是病因。

最明显的变化,未必是最早发生的变化;最强烈的变化,也未必是真正驱动疾病的变化。很多变化,可能只是系统失衡后的结果,甚至只是代偿反应。真正困难的,并不是“观察变化”,而是如何在可控条件下建立真正可靠的因果关系。

否则,任何一个熬夜、喝咖啡、发炎,或者老板当天情绪与兴趣方向的变化,都足以在组学数据里制造出成千上万个“重大机制”。

而生命系统中的因果关系,往往并不是线性的。中间可能存在未知调节层、时间依赖、空间依赖、环境依赖以及目前完全未知的黑箱。

这些黑箱,并不仅仅存在于理论中。它们每天都在实验室里不断出现,包括在我自己的实验室中。很多时候,现象真实存在,实验也稳定可靠,但目前技术与研究体系,依然无法解释其背后的运行逻辑。

因此,AI、大数据与整体组学当然会极大加速生命科学研究,但它们不会真正取代小团队、探索性、以传统还原论为基础的机制研究。

因为生命科学最终仍然需要在可控条件下建立因果关系。

真正重要的新发现,很多时候依然来自一个个小实验室中,对一个异常现象长期而执着的追问,并最终把光亮照进这些黑箱。

07

科学研究与人的成长

科学研究从来不只是寻找答案。

它同样是在不断追问中,理解世界,也理解自己。

真正决定一个科学家最终能走多远的,往往也并不是技术。因为技术终究可以学习,也可以通过合作来利用。真正稀缺的,其实是在表象之下,发现可以入手研究问题的能力。

技巧可以让人走得快,但只有问题,才能决定一个科学家最终能走多远。

科研真正培养的,从来不只是知识与技术,而是判断力。

也许人类永远无法彻底完成对生命的理解。因为生命本身,不仅承载着淹没的历史,同时还是一个仍在不断演化中的系统。

但科学的意义,或许从来也不在于终点。

通过不断提出更深的问题,

并在追问这些问题的过程中,

一点点接近世界的真实。

从而回应人类亘古以来最深的追问:

我从哪里来?

又将到哪里去?

话题:



0

推荐

知识分子

知识分子

4242篇文章 2小时前更新

由饶毅、鲁白、谢宇三位学者创办的移动新媒体平台,现任主编为周忠和、毛淑德、夏志宏。知识分子致力于关注科学、人文、思想。我们将兼容并包,时刻为渴望知识、独立思考的人努力,共享人类知识、共析现代思想、共建智趣中国。

文章