2025年,来自西湖大学的卢培龙实验室先后在两本顶刊Nature、Cell杂志上介绍从头设计跨膜荧光蛋白和电压门控阴离子通道。这一年,卢培龙教授也因在蛋白从头合成领域的出色工作,获得了腾讯“新基石研究员”、“顾孝诚讲座奖”等荣誉。
此前一年,卢培龙实验室在Cell Research发表了从头合成的镜像蛋白,这种与自然界常见的L-型蛋白截然相反的D-型蛋白,因具有更低的免疫原性、更好的稳定性因而在未来医学领域大有用武之地而备受关注。
无论是新合成的有功能的蛋白,还是前景光明的人工智能设计抗体领域,从头合成蛋白领域从未如此受到学界和医药领域的关注。回国之前,卢培龙曾在2024年诺贝尔化学奖得主David Baker实验室做博后,回国后他在蛋白设计领域做了许多出色工作。此前,围绕这些自然界原本不存在的合成蛋白,我们采访了卢培龙教授。
被访人|卢培龙(西湖大学生命科学学院特聘研究员)
访谈人|叶水送
问:2024年,David Baker因在蛋白质设计领域的开创性贡献获诺奖,这给你们的研究工作带来了新的变化吗?
答:诺奖颁发给蛋白质设计以及蛋白质结构预测领域之后,大家觉得这个领域更热了。事实上,Alphafold刚出现时(注:2020年),大家就对人工智能在生物学领域里面的应用抱以很高的期待。
我之前在David Baker实验室做博后研究时,就开始关注比如膜蛋白、功能性膜蛋白的设计,以及怎样更好地将蛋白质设计应用到治疗性蛋白药物的开发上面。从我个人角度来讲,(这个领域获得诺奖认可)并没有改变我的研究兴趣。只是获诺奖后,可能公众或者更多的人开始对这个领域感兴趣了。
问:如何通过AI来设计一个全新的蛋白?
答:现在大家基本上都在用AI工具来生成蛋白。如果回看整个历史,其实最早的时候,大家可能基于经验,比如疏水的氨基酸在蛋白质的核心内部,亲水的氨基酸在蛋白质的表面,从而去构建一个Alpha螺旋束。后来可能有更多计算的内容介入进来,比如我们可以用固定骨架的序列,去固定一个骨架蛋白,看哪些氨基酸的序列能够自发地折叠形成结构。
还有另外一类研究,就是怎么样更高效地生成这种可以设计的蛋白质骨架,比如全新的蛋白质骨架,这些都是通过一些计算生物学的方法来做的。
我们原来的方法是用一些近似的能量计算以及大规模的采样(空间采样和结构采样)来看哪些序列的蛋白质,或者是哪些结构的蛋白质,其折叠水平具有比较低的能量状态,我们就认为它可能是一个可设计的蛋白质序列或者是蛋白质骨架。
proteinMPNN蛋白设计体系 | 图源:Science
在人工智能时代下,我们可以应用最先进的工具,比如像protein MPNN或者是rfdusion,直接定制不同类型的骨架或者是蛋白质序列,这大幅降低了原来我们计算和试错的成本。而且由于Alphafold以及Rosettafold的出现,基本上可以说,那些小的、简单的蛋白质结构,都可以相对比较准确地预测出来,所以这大幅加快我们对设计的蛋白质序列和蛋白质结构验证过程。
目前,蛋白设计领域新出现的一个趋势是各种大语言模型在蛋白质设计方面的应用,比如我们可以用大语言模型来更好地找到蛋白质功能与结构之间的关联;一个具有特定结构的蛋白质,通过对氨基酸序列的变化,可找到特定的功能或性质,比如说热稳定性、耐酸性、耐碱性变化规律等。人工智能预测蛋白结构工具也可以应用到产生新型的蛋白上,这些蛋白有一些氨基酸的突变,具有更好的酶活或热稳定性,这些都是蛋白设计领域新出现的一些研究方向。
问:围绕镜像蛋白和跨膜蛋白的人工设计,它们有何不一样?
答:首先对于镜像蛋白,我们想用计算生物学的方法去设计自然界中完全不存在的、完全是由D-型氨基酸编码的蛋白,也就是所谓的镜像蛋白(注:天然的蛋白都是L-型氨基酸编码的)。它们设计出来之后,和天然的蛋白属性完全相反,这会有哪些优势?比如镜像蛋白的免疫原性比较低,因为它不能够被天然的酶水解,还有它可能具有口服给药的潜力以及在生物体内的半衰期更长的特点,所以这无疑是代表了一类新的蛋白质多肽药物的研究方向,我们对这个科学问题格外地关注。
镜像结合蛋白的从头设计 | 图源:Cell Research
那么如何设计镜像蛋白?我们还是基于原来传统的、根据能量来计算后广泛采样的这种方式。就目前而言,人工智能并没有对镜像蛋白的结构或者是它和天然蛋白之间相互作用的规律进行广泛地学习,因为这类镜像蛋白在自然界中是完全不存在的,所以它学习的空间非常有限。我们也希望通过对这一类相互作用的设计,得到足够多的数据,使人工智能能更高效地去设计这类镜像结合蛋白。
跨膜荧光激活蛋白结构示意图 | 图源:Nature
另外一个课题是刚提到的跨膜荧光蛋白。最近,我们完成了设计跨膜荧光蛋白的这项工作,它主要的难点在于如何在疏水的膜环境里面去创造一个水溶性的ligand binding site,也就是配体结合位点。
跨膜蛋白选择性激活特定荧光分子 | 图源:Nature
如果我们想在疏水的膜环境里面创造这样一个配体结合位点,就需要先对蛋白进行额外的设计,必须得具有跨膜蛋白的特征,然后在蛋白质的核心里面有一个配体结合位点。
通常情况下,这样的配体结合位点会极大地降低整个蛋白的稳定性,因为引入了一个空腔后,蛋白质折叠会受到影响,尤其是对于膜蛋白来说,它对于这种堆积作用要求非常高,所以如果里面有一个很大空腔的话,膜蛋白通常来讲不稳定。那有没有我们想设计的这样一个功能?我们最终通过人工智能辅助设计,创造出跨膜的荧光蛋白,它可以特异性地结合一个荧光生成型的配体分子,有非常高的量子荧光产率,荧光强度大,甚至比我们平常常用的EGFP荧光蛋白的亮度还要高,这在领域里也得到了大家的认可。
卢培龙团队2025年发表的从头合成跨膜荧光蛋白论文 | 图源:Nature
问:人工合成蛋白将在生物医学领域有哪些应用?
答:蛋白质是生命活动的主要执行者,所以人工合成蛋白有无限的空间和可能,比如作为合成生物学里面一些关键的酶或者是纳米孔测序里面关键的纳米孔蛋白,以及治疗性的蛋白,不管是纳米抗体还是常用的抗体,以及最近新兴的迷你蛋白,或者是镜像蛋白,我们都可以想象它们可以去干预各种各样的蛋白与蛋白之间的相互作用。它还可以作为治疗新冠的疫苗,能应对各种新出现的、对人类健康有重大威胁的传染病。它还可以作为刚提到的一些研究工具,或者是作为基因治疗的工具,可以更精准地去编辑体内的基因,进而纠正这种疾病给人带来的影响。
特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2.『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。