新闻 发表于 2025-12-21 10:08

AI正在如何重塑生物制造?

作者:微信文章
从发现神秘酶的功能,到设计“自然界从未存在”的全新酶,再到优化微生物细胞工厂,人工智能正在以前所未有的速度颠覆传统生物技术。


近日,国际生物技术领域顶级期刊 Current Opinion in Biotechnology 发布了一篇重磅综述,系统阐述了深度学习和生成式人工智能在酶与细胞工程中的最新进展与未来挑战。这篇由德国于利希研究中心Holger Gohlke教授团队撰写的文章指出,AI方法正成为推动可持续生物经济发展的关键加速器。

本文将带你一览这篇综述的核心内容,看AI如何为生命科学注入“智慧”。



一、AI驱动酶工程:从“发现”到“创造”

酶是生物制造的核心“催化剂”。然而,自然界中仍有数百万酶的功能未知,且天然酶往往不能满足工业生产的需求。AI正在三个层面改变这一领域。

1. 酶功能发现:超越传统比对

过去,预测一个未知序列酶的功能,主要依赖与已知酶的序列相似性比对。但现在,AI模型展现了更强大的能力。


对比学习模型:如CLEAN,通过对比学习,在挑战性基准测试上击败了传统的BLASTp方法。

图神经网络:如GraphEC和TopEC,直接将蛋白质的三维结构信息转化为图结构进行学习,预测精度更高,还能预测酶的最适pH值等属性。

关键挑战:研究者强调,公平评估AI模型至关重要。数据泄露是常见陷阱,即训练集和测试集中存在相似度较高的蛋白质,会“虚高”模型性能。使用严格的数据拆分方法(如基于结构的拆分)是未来趋势。



2. 从头设计:创造“自然界不存在”的酶

这无疑是AI在酶领域最令人兴奋的应用。研究者可以像“搭乐高”一样,为特定化学反应定制全新的酶。目前主要有两种策略:


从活性中心到蛋白质骨架:先计算目标反应的理想活性中心模型,然后用3D扩散模型生成包裹该活性中心的稳定蛋白质骨架。

从骨架到活性中心:将最小化的活性中心“安装”到已知的蛋白质骨架中。


尽管初始活性通常较低,但已有成功案例。例如,研究者通过结合AI预测与实验,设计出一种小型卟啉结合蛋白,能高效催化环丙烷化反应,产率高达99%,且能在70%乙醇中保持活性,熔点超过90°C,展示了卓越的工业应用潜力。



3. 酶性质优化:加速定向进化

传统的定向进化耗时耗力,AI能通过学习突变与功能的关系,智能预测有益突变,大幅减少实验筛选量。


零样本预测:如蛋白质语言模型ESM3,能从海量序列中学习“适应度”,其分数可与酶的稳定性、活性等实验指标相关。但这类模型对训练数据之外的底物预测仍存挑战。

监督学习模型:当拥有特定酶的高质量数据集时,微调大型模型或使用传统回归模型往往更可靠。例如,一项研究将AI与无细胞高通量筛选平台结合,快速将一个通用的酰胺合成酶优化成9个分别擅长生产不同药物的变体。


综述指出,最可靠的策略是融合多维实验数据训练AI模型,再结合基于生物物理的计算过滤,实现高效探索。

二、AI赋能细胞工程:精细调控“细胞工厂”

如果说酶是单个工具,那么整个细胞就是一个复杂的工厂。AI能对工厂的各个“部门”进行精细优化。

1. 优化“启动开关”:启动子工程

启动子是基因的“开关”,控制蛋白表达量。生成对抗网络、变分自编码器和扩散模型已被用于设计合成启动子。例如,一项研究中的扩散模型成功设计了活性优于天然启动子的合成版本。

2. 优化“生产指令”:密码子与mRNA设计

通过优化基因序列(密码子优化),能大幅提高蛋白产量。Transformer模型如CodonTransformer、DeepCodon等能平衡宿主偏好、GC含量和mRNA结构,设计出表达量提升数十倍的序列。有研究甚至利用LLM设计mRNA,使新冠疫苗在小鼠体内的抗体滴度显著提升。

3. 优化“物流系统”:蛋白质分泌

信号肽是引导蛋白分泌的“邮政编码”。AI模型能精准预测和优化信号肽,将目标蛋白的分泌效率提高150倍。

4. 设计“基因剪刀”:CRISPR系统

AI可用于设计高活性、高特异性的CRISPR/Cas系统向导RNA。有研究通过训练语言模型ProGen2,生成了上百万个新型Cas9蛋白,并筛选出脱靶活性降低95% 的优质变体。

5. 设计“代谢路线”:逆生物合成

如何让微生物合成一种特定药物分子?逆生物合成就像规划一张“代谢地图”。AI模型如BioRetro、READRetro能摆脱传统规则的局限,从反应数据中学习,预测出全新的生物合成路径,甚至为未知天然产物推测可能的合成路线。

6. 优化“整体工厂效能”:代谢通路优化

结合通量平衡分析与机器学习,AI能识别代谢网络中的瓶颈,预测如何改造以提高产量。主动学习框架能通过“设计-构建-测试-学习”的循环,快速迭代优化菌株。例如,一项研究利用此方法将酵母生产对香豆酸的产量提高了68%。

三、挑战与未来:AI的局限性何在?

尽管前景广阔,AI在生物技术中的应用仍面临核心挑战:


数据瓶颈:模型性能严重依赖高质量、大规模、多样化的数据集。数据稀缺、不平衡会导致模型偏差或生成不现实的设计。

可转移性差:在特定条件下训练的模型,可能无法推广到其他物种或环境。

复杂性缺失:许多模型忽略了细胞内的复杂因素,如竞争性通路动力学、调控约束和毒性效应,导致预测在实验中失败。

成本与收敛:主动学习等方法的实验成本高昂,且可能陷入局部最优解。


结语:迈向智能生物制造新时代

这篇综述清晰地描绘了一幅蓝图:AI正在将酶与细胞工程从“试错密集型”劳动转变为“理性设计型”科学。从发现神秘的酶,到定制高效的生物催化剂,再到构建精密的细胞工厂,AI的赋能正全方位加速我们向可持续生物经济的转型。

尽管前路仍有挑战,但持续的技术创新、数据积累和算法优化,无疑将使我们离一个更绿色、更智能的生物制造时代越来越近。

参考文献:

Docter, S., David, B., & Gohlke, H. (2026). Deep learning and generative artificial intelligence methods in enzyme and cell engineering. Current Opinion in Biotechnology, 97, 103393.
页: [1]
查看完整版本: AI正在如何重塑生物制造?