ICML 2024 | 知识感知的强化学习优化的蛋白质定向进化方法
这个过程在将模型的输出与有向进化任务的特定目标对齐中起着至关重要的作用,确保每个连续迭代产生一个更符合所需特征的蛋白质序列。奖励函数(即适应度预测器F)在主动学习框架内进行了微调。这种方法通过策略网络迭代地对蛋白质序列进行采样,然后通过预言机注释这些样本的适应度。每一轮采样和注释都有助于用于训练适应...
中国科大在蛋白质从头设计方法研究中取得重要进展
图.用SCUBA-D模型进行蛋白质主链设计的原理。(a)SCUBA-D可基于噪声或者用户定义的结构草图设计新主链结构,也可以基于给定的含功能位点的局部结构设计新的完整主链。(b)包含对抗损失函数的SCUBA-D模型架构。团队对SCUBA-D在多类蛋白质从头设计任务中的应用进行了实验验证。针对单体结构从头设计任务,团队对共计70条...
他开创了AI蛋白质结构领域,现在要做比诺奖更大的事
许锦波拿这个方法去预测了一个200多个氨基酸的膜蛋白结构,发现误差只有2.29个埃,大概0.2纳米,两个原子的宽度。为什么选择膜蛋白?许锦波说,“目前的实验技术去解析膜蛋白结构是很困难的,所以数据库里就没有太多的膜蛋白结构。以前的算法也就没有足够的膜蛋白数据去用于训练,所以在预测膜蛋白结构时往往会失效。但我的...
借助AI模型破解蛋白质结构的密码
在预测蛋白质与其他分子的相互作用上,AlphaFold3相比现有方法至少提高了50%的准确率,针对一部分相互作用类别甚至提高了1倍。AlphaFold3是基于其2020年推出的AlphaFold2研发而来。这使得AlphaFold3成为首个超越基于真实生物分子结构预测工具的AI系统。AlphaFold3不仅限于蛋白质,将探索更广泛的生物分子。这一再次飞...
Nature Communications | 基于ESMFold预测结构的几何图学习以准确...
通过结合同源性信息,研究采用标签扩散算法进一步改进了预测,同时预测酶的最适pH值反映酶催化的反应。实验表明,与其他最先进的方法相比,该模型在预测活性位点、EC编号和最适pH值方面具有卓越的性能。进一步的分析表明,GraphEC能够从蛋白质结构中提取功能信息,强调了几何图学习的有效性。
实现蛋白质动态对接预测!上海交大/星药科技/中山大学等联合推出...
DynamicBind:基于几何深度学习的动态复合物结构预测模型不同于传统的将蛋白质视为大多数刚性实体的对接方法,DynamicBind使用先进的深度扩散模型和等变几何神经网络技术,将蛋白质构象生成和配体姿势预测这两个传统上分离的步骤统一到一个框架中,实现了蛋白质和配体的动态对接预测(www.e993.com)2024年11月3日。同时,作为一种端到端的深度学习方法...
2024化学诺奖接力青睐AI,蛋白质结构预测新工具获一半奖项
组织者向参与者提供目标蛋白质的氨基酸序列,据此预测蛋白质结构,与此同时还采取实验方法获取蛋白质结构,最终将二者进行对比获得全局距离测试(globaldistancetest,GDT)评分。为保证结果客观性,整个过程为双盲,即参与者和评审员互不知晓。GDT是百分制,用于评判结构预测的精准度,超过90分则非常理想,达到实验数据级...
谷歌云与Ginkgo Bioworks推出蛋白质大语言模型和应用程序接口
谷歌云加大与GinkgoBioworks的合作,两家公司日前推出了两项新产品。第一项是推出一个蛋白质大语言模型,使业界的组织和公司能够利用Ginkgo的专有见解和数据加快药物发现过程。第二项是生物技术公司Ginkgo将推出一个模型应用程序接口(API),帮助机器学习工程师和科学家获取生物学人工智能模型。
大模型落地应用观察:难点与破局
许锦波认为,研发蛋白质生成大模型,除了必备的算法、算力、数据等基础条件,还需要具备两大专业进阶能力:首先是融合计算机、生物、物理等多学科,熟识AI、分子动力学、量子计算等多种方法,且能在实践中并行考虑序列与结构、主链与侧链、进化与组学的跨领域融合能力。其次是走出实验室,下沉至真实的产业环境,在需求、验证、...
助力解决图基础模型可信任危机,科学家设计新型大模型微调方法,可...
图数据是一种遍布于微观世界(如蛋白质、细胞、化学分子)和宏观世界(如知识图谱、金融交易网、社交网络)的数据类型。相较于传统意义上的图片、音频和视频,它具有自己独特的几何结构。而在深度学习或人工智能领域以图数据为基础的一类方法,则被叫做图基础模型。