中国科大建立新的蛋白质从头设计方法
(a)SCUBA主链能量面上的极小对应了蛋白质的可设计主链结构,即特定氨基酸序列下的最低自由能结构;(b)SCUBA中用神经网络表示的统计能量项;(c)和(d)用近邻计数(NC)-神经网络(NN)方法从蛋白质结构原始数据中学习解析能量函数的方法框架。理论计算和实验证明,用SCUBA设计主链结构,能够突破只能用天然片段来拼接产生...
中国科大用深度学习实现高实验成功率的蛋白质序列从头设计
图2.左侧图为实验验证采用的一个目标主链结构(天蓝色)与相应ABACUS-R设计蛋白晶体结构(绿色)的叠合比较。在右侧展示的局部结构放大图中,ABACUS-R设计蛋白的残基间氢键等极性相互作用不同于天然结构。相较于ABACUS模型,ABACUS-R序列设计更高的成功率和结构精度进一步增强了数据驱动蛋白质从头设计方法的实用性。ABACUS...
“阿尔法折叠2”预测蛋白结构近原子水平
将实验方法得到的蛋白质结构叠加在“阿尔法折叠2”的结构上,组成蛋白质主链骨架的叠加原子之间的距离中位数(95%的覆盖率)为0.96埃(0.096纳米)。成绩排第二的方法只能达到2.8埃的准确度。“阿尔法折叠2”的神经网络能在几分钟内预测出一个典型蛋白质的结构,还能预测较大蛋白质(比如一个含有2180个氨基酸、无同源结...
分析蛋白质功能结构域的策略和步骤
1.序列比对使用如BLAST之类的工具,将目标蛋白序列与已知的蛋白数据库进行比对,寻找相似的已知结构或功能的区域。2.域预测使用专门的软件工具,如Pfam、InterPro、SMART等,来预测蛋白序列中可能存在的结构域或功能域。3.三维结构预测如果可行,可以使用如Phyre2、SWISS-MODEL等工具来预测蛋白质的三维结构。这可以...
清华大学药学院学者开发基于蛋白质语言模型的结构与功能预测方法
基于结构的方法如GraphBind利用图神经网络(GNN)来提取蛋白的序列和结构特征,并以此来识别蛋白质分子中哪些氨基酸残基与核酸的结合位置。然而基于结构的方法需要准确的蛋白质结构作为模型的输入,因此,目前基于蛋白质序列的DNA结合位点的预测仍然是一个具有挑战性的问题。
单模型斩获“蛋白质突变预测”榜一,西湖大学提出基于结构词表方法
方法该研究利用Foldseek将蛋白质进行编码,生成了一维的3Di结构序列(使用了Foldseek的结构词表,每种3Ditoken代表不同的局部结构),这样的结构序列与氨基酸序列是等长的(www.e993.com)2024年11月8日。因此研究人员使用了一种简单而有效的结构嵌入方式:将结构词表和氨基酸词表计算笛卡尔积(即两两组合),形成新的结构感知词表。
...度提高56%,港中文/复旦/耶鲁等联袂提出全新蛋白质同源物检测方法
在大数据集研究方面,该研究选用了BFD/MGnify数据集,这是一个庞大的数据库,包含了大约3亿个蛋白质,以便能够探索更广泛的蛋白质序列谱系。DHR方法:一种超快速、灵敏的蛋白质同源物搜索管道DHR方法的核心思想是将蛋白质序列编码成密集的嵌入向量,从而有效地计算出序列间的相似性。具体来说,该研究通过初始化...
蛋白质功能预测新SOTA,上海理工、牛津统计AI方法,登Nature子刊
例如,通过计算含有丝氨酸-天冬氨酸重复序列的蛋白质D(SdrD)的RC,表明功能位点的残基通过自然进化而得以保留,并且PhiGnet能够捕获此类信息,从而改进在残基水平上预测蛋白质功能的方法,即使在没有结构数据的情况下也是如此。注释蛋白质功能位点计算预测是否与实验确定的功能注释一样准确?为了解决这个问题,研究...
AlphaFold为什么能精准预测蛋白质结构?
这是蛋白质结构预测界的奥林匹克竞赛,来自世界各地的参赛团队会拿到未知结构的蛋白质的氨基酸序列,然后使用自己的算法预测其三维结构,最后和实验测定结果进行比较,相似度越高分数就越高。在这一年的比赛中,AlphaFold2取得了中位数分数92.4分(满分100分;90分以上被认为预测方法可与实验方法媲美)的高分预测结果,它预测...
Cell Press Live:蛋白质结构与功能预测及设计—新闻—科学网
现有方法主要关注蛋白质序列、网络及结构数据,而忽视了蛋白相关文献信息。然而目前大约82%的SwissProt蛋白已拥有专家标注的文献信息。为此我们提出了一种基于深度信息检索的算法GORetriever。大量实验结果表明,GORetriever能显著提高蛋白功能预测性能。GORetriever也是我们开发的GOCurator的核心组件,GOCurator在最近的第五届大...