基于深度学习的蛋白质设计新方法

理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。...

Deep learning for new protein design

理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。但这里有个问题。

“蛋白质的搜索空间是巨大的,”华盛顿大学蛋白质设计研究所和霍华德休斯医学研究所的研究科学家布莱恩考文垂说。

他的实验室研究的蛋白质通常由65种氨基酸组成,每个位置有20种不同的氨基酸选择,就有65的20次方次方的结合组合,这个数字比宇宙中原子的估计数量还要大。

考文垂是2023年5月发表在《自然通讯》杂志上的一项研究的合著者。

在这项研究中,他的团队使用深度学习方法在“从头开始”(从头开始)计算蛋白质设计中增强现有的基于能量的物理模型,结果在实验室中验证了将设计的蛋白质与其目标蛋白质结合的成功率提高了10倍。

“我们表明,通过结合深度学习方法来评估氢键形成或疏水相互作用的界面质量,你可以显著改善管道,”研究合著者纳撒尼尔·贝内特(Nathaniel Bennett)说,他是华盛顿大学蛋白质设计研究所的博士后学者。

“这与试图一一列举所有这些能量是相反的,”他补充说。

读者可能熟悉深度学习应用程序的流行示例,例如语言模型ChatGPT或图像生成器DALL-E。

深度学习使用计算机算法从数据模式中分析和推断,对算法进行分层,逐步从原始输入中提取更高级别的特征。在这项研究中,使用深度学习方法来学习蛋白质序列和可能结构的表示的迭代变换,这些变换非常迅速地收敛于非常准确的模型上。

作者开发的深度学习增强的从头蛋白质粘合剂设计协议包括机器学习软件工具AlphaFold 2和由蛋白质设计研究所开发的RoseTTA折叠。

该研究问题非常适合在Frontera上并行化,因为蛋白质设计轨迹彼此独立,这意味着当计算作业运行时,信息不需要在设计轨迹之间传递。

“我们只是拆分了这个问题,其中有200万到600万个设计,并在Frontera的庞大计算资源上并行运行所有这些设计。它上面有大量的CPU节点。我们给每个cpu分配一个设计轨迹,这样我们就可以在可行的时间内完成大量的设计轨迹。”

作者使用RifDock对接程序生成了600万个蛋白质“对接”,或潜在结合的蛋白质结构之间的相互作用,将它们分成大约10万个块,并使用Linux实用程序将每个块分配给Frontera的8000多个计算节点之一。

这10万个码头中的每一个都将被分成100个工作,每个工作有1000个蛋白质。一千个蛋白质进入计算设计软件Rosetta,在那里,这一千个蛋白质首先以十分之一秒的尺度进行筛选,而那些存活下来的蛋白质则以几分钟的尺度进行筛选。

此外,作者使用蛋白质设计研究所开发的软件工具ProteinMPNN,进一步提高了生成蛋白质序列神经网络的计算效率,比以前最好的软件快200倍以上。

他们在建模中使用的数据是酵母表面显示结合数据,所有这些数据都是由蛋白质设计研究所公开收集的。在这个实验中,数万条不同的DNA链被命令编码一种不同的蛋白质,这是科学家们设计的。

然后将DNA与酵母结合,使每个酵母细胞在其表面表达一种设计好的蛋白质。然后将酵母细胞分为结合细胞和不结合细胞。反过来,他们使用人类基因组测序计划的工具来找出哪些DNA有效,哪些DNA无效。

考文垂表示,尽管研究结果表明,设计结构与目标蛋白质结合的成功率提高了10倍,但仍有很长的路要走。

“我们已经上升了一个数量级,但我们还有三个数量级要做。研究的未来是进一步提高成功率,并转向更困难的新目标,”他说。病毒和癌症的t细胞受体就是最好的例子。

改进计算设计的蛋白质的方法是使软件工具更加优化,或者取样更多。

考文垂说:“我们能找到的电脑越大,我们就能制造出越好的蛋白质。我们正在研发未来抗癌药物的工具。我们制造的许多单独的粘合剂可能会成为拯救人们生命的药物。我们正在努力使这些药物变得更好。”

本文来自作者[盼香]投稿,不代表思达普立场,如若转载,请注明出处:https://wak.cdstartup.cn/wiki/202505-525.html

(3)

文章推荐

  • 专家提醒:加州安全措施保障海滩游客远离鲨鱼威胁

    加州长滩——加州一个著名的鲨鱼研究中心面临关闭的危险,因为该州取消了对一个防止鲨鱼袭击的项目的资助。加州州立大学长滩鲨鱼实验室主任克里斯·洛告诉福克斯新闻数字频道,该项目监测南加州海岸线上的大白鲨。“2018年,我们从加利福尼亚州获得资金,启动了加州

    2025年05月06日
    0
  • 疫情都需要买什么(疫情要买什么生活用品)

    因疫情需要居家隔离,一个三口之家居家生活用品和食物准备多少合适?_百度...1、牙膏(一管可用两周以上):准备足够的牙膏,以满足家庭成员的口腔卫生需求。卫生巾(夜用三片一包+日用两包):为女性家庭成员准备适量的卫生巾。食物:-蔬菜:土豆6个,西红柿6个

    2025年05月06日
    0
  • 基准研究助力科学家解析空间转录组学数据

      范德比尔特大学的一组研究人员发布了一项新的基准研究,旨在帮助科学家选择最有效的方法来分析空间转录组学(ST)数据。该研究由生物医学工程和计算机科学助理教授周昕迈兹领导,评估了空间转录组学(ST)中的

    2025年05月06日
    0
  • 美国疫情在哪里看(帮我查一下美国的疫情)

    全球每年重大传染病感染或者死亡人数的数据在哪里可以找到1、根据世界卫生组织(WHO)的最新数据,全球每年重大传染病的感染和死亡人数是可以找到的。例如,对于新冠病毒(COVID-19),全球累计确诊病例已超过5亿,死亡人数超过636万,死亡率约为17%。在中

    2025年05月06日
    0
  • Qiagen向卫生部赠送3000份潜伏性肺结核筛查测试

    吉隆坡,9月5日——Qiagen今天宣布向马来西亚卫生部(MoH)捐赠3000份QuantiFERON-TBGoldPlus检测试剂盒,作为潜伏性结核感染(LTBI)筛查的诊断工具。这种筛查的重点是协助检查免疫功能低下患者,这是结核病(TB)疾病的关键风险群体,作为Qiagen

    2025年05月06日
    0
  • 国际家庭暴力组织(IHOP)创始人迈克·比克尔被指控性侵

    迈克·比克尔,堪萨斯城国际家庭暴力协会(IHOPKC)的创办人,组织acusações性暴力协会和精神健康协会,组织váriasmulheres。比克尔,68岁,《关于性行为的调查》,《关于性行为的调查》,《关于性行为的调查》,《关于性行为的调查》,《关于性行

    2025年05月06日
    0
  • 疫情期间怎么举报(疫情期间怎么举报外来人员)

    疫情期间怎么举报聚众打麻将法律分析:可以直接拨打报警电话进行举报。现在仍处于疫情的威胁下,对于聚众打麻将行为,在各地颁布的《关于严惩危害疫情防控行为通知》,应当属于危害疫情防控行为,应当予以打击。法律分析:疫情聚众打麻将的举报电话是110,也可以直接拨打当地

    2025年05月05日
    0
  • 小河马Moo Deng因泰国小动物园的网络‘弹性猪肉’而成名

    泰国春武里——泰国可爱的小河马MooDeng在Facebook上亮相仅仅一个月后,她在国内外的名声就势不可挡。动物园管理员AtthaponNundee已经在他照顾的动物中发布了大约五年的可爱时刻。他从未想到考丘开放动物园(KhaoKheowOpenZoo)新生的侏儒河马会

    2025年05月05日
    0
  • 美国疫情死几人(美国疫情死了65万人)

    美国即将面对新冠肺炎和流感疫情,这会对美国经济发展带来了哪些阻碍...这次疫情对于美国经济的影响,最直观的体现就是美元在各个国家的储蓄震荡幅度很大。而为了应对这次疫情所带来的风险,美联储紧急发布了降息措施。表示美联储将降息50个基点,希望来稳定金融市场的震荡

    2025年05月05日
    0
  • 凯特王妃自宣布停止癌症治疗后首次亮相公众活动

    凯特王妃在癌症治疗结束后首次公开露面。周日,凯特和她的丈夫威尔士亲王在巴尔莫勒尔的教堂与国王和王后一起。她在本月早些时候分享的一段视频中证实,她将在化疗结束后重返公众岗位。在视频中,凯特说:“不过,我很期待回到工作岗位,并在未来几个月尽

    2025年05月05日
    0

发表回复

本站作者后才能评论

评论列表(4条)

  • 盼香
    盼香 2025年05月05日

    我是思达普的签约作者“盼香”!

  • 盼香
    盼香 2025年05月05日

    希望本篇文章《基于深度学习的蛋白质设计新方法》能对你有所帮助!

  • 盼香
    盼香 2025年05月05日

    本站[思达普]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 盼香
    盼香 2025年05月05日

    本文概览:理解蛋白质——比如那些控制癌症、COVID-19和其他疾病的蛋白质——的关键很简单:确定它们的化学结构,并找到哪些其他蛋白质可以与它们结合。...

    联系我们

    邮件:思达普@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们