科学家基于AI构建蛋白质组时钟,为预测衰老和治疗疾病提供新工具
研究人员使用基于梯度提升的机器学习算法和Boruta特征选择算法,来识别和优化与年龄预测相关的蛋白质标志物,不仅能够处理复杂的数据集、识别模式,还增强了蛋白质的准确性和稳定性。他们从近3000个蛋白质肽段进行筛选,确定了与年龄增长相关的204个关键蛋白质,进而基于这些蛋白质构建了预测模型。图丨研究设计和...
科学家基于AI构建蛋白质组年龄时钟,发现衰老与18种疾病风险密切...
研究人员使用基于梯度提升的机器学习算法和Boruta特征选择算法,来识别和优化与年龄预测相关的蛋白质标志物,不仅能够处理复杂的数据集、识别模式,还增强了蛋白质的准确性和稳定性。他们从近3000个蛋白质肽段进行筛选,确定了与年龄增长相关的204个关键蛋白质,进而基于这些蛋白质构建了预测模型。图丨研究设...
中国生物计算大会 百图生科发布全球首个全模态生命科学基础大模型
BioMap百图生科是全球生命科学基础大模型的先行者,通过2100亿参数的跨模态生物语言大模型,解码蛋白质、细胞、生物系统等底层规律,以更小的数据和成本消耗,构建高质量的生命科学AI任务模型。BioMap在药物研发、生物制造、医疗健康等领域实现了200余个State-of-the-Art(SOTA)模型表现,服务全球300余家用户,实现超过20亿美...
百图生科发布xTrimo V3生命科学基础大模型 全模态突破赋能更多...
BioMap百图生科是全球生命科学基础大模型的先行者,通过2100亿参数的跨模态生物语言大模型,解码蛋白质、细胞、生物系统等底层规律,以更小的数据和成本消耗,构建高质量的生命科学AI任务模型。BioMap在药物研发、生物制造、医疗健康等领域实现了200余个State-of-the-Art(SOTA)模型表现,服务全球300余家用户,实现超过20亿美...
AI的诺贝尔时刻:2024年化学奖与蛋白质研究的突破
自19世纪起,科学家们就意识到蛋白质对生命至关重要。但直到20世纪50年代,科学家们才利用精确的化学工具开始深入研究蛋白质。剑桥大学的约翰·肯德鲁和马克斯·佩鲁茨在50年代末通过X射线晶体学技术,成功构建了第一个蛋白质的三维模型,为此他们获得了1962年的诺贝尔化学奖。
David Baker:从头设计蛋白的“上帝之手 ”,极大地推动了蛋白质...
美国生化学家、华盛顿大学蛋白质设计研究所所长DavidBaker,因开发能够设计出在自然界从未见过的新型蛋白质的技术获得2020年科学突破奖生命科学奖(www.e993.com)2024年11月3日。图源:httpsipd.uw.edu/david-baker/导读昨天,诺贝尔化学奖授予蛋白设计和蛋白预测领域的三位学者。来自华盛顿大学
当大模型遇上生命科学,有望真正解码生命“语言”的奥秘
摘要:本案例描述了在大语言模型引发颠覆性变革的今天,百图生科如何以蛋白质语言为核心构建生命科学的基础模型,来解码生命“语言”的奥秘,进而为生命科学领域前沿问题提供创新性的解决方案。基础模型是一种生命科学领域革命性的人工智能技术,作为一个超大规模跨模态生物计算大模型,百图生科“xTrimo”两年多来不断迭代升级...
分子之心完成数亿A轮融资,将完善AI蛋白质基础大模型等生物领域新...
分子之心创始人、国际知名计算生物学家许锦波表示,本轮融资将用于进一步扩大顶级复合型人才团队,深入完善AI蛋白质基础大模型、AI蛋白质优化设计平台MoleculeOS等生物经济共性技术平台,加速AI蛋白质技术的产业落地和商业化进程。“我们用AI设计超越自然进化的超级蛋白,并通过AI蛋白质基础设施建设,把蛋白质设计这一科学问题...
从结构准确预测蛋白质功能,东北大学「CNN+GCN」统一框架
为了解决这些问题,东北大学研究人员提出了一种新型蛋白质功能预测方法TAWFN。该方法集成了CNN和GCN,同时利用了蛋白质结构和蛋白质语言模型。对蛋白质结构进行处理,得到相应的蛋白质序列。研究的主要贡献总结如下:在GCN方面,使用处理后的蛋白质序列特征和蛋白质接触图构建图形输入网络。使用GCN编码器来捕获短程...
灵敏度提高56%,港中文/复旦/耶鲁等联袂提出全新蛋白质同源物检测...
DHR方法:一种超快速、灵敏的蛋白质同源物搜索管道DHR方法的核心思想是将蛋白质序列编码成密集的嵌入向量,从而有效地计算出序列间的相似性。具体来说,该研究通过初始化ESM和集成对比学习技术来有效训练序列编码器,从而为蛋白质语言模型的构建创造了条件,并使得DHR能被更有效的用来检索同源物。