在最近发表在《自然生物医学工程》杂志上的一项研究中,一组研究人员展示了使用深度学习从灭绝的生物中复活抗生素肽,为抗生素耐药性和其他生物医学挑战提供了新的解决方案。
鉴于抗微生物药物耐药性感染每年在全世界造成约127万人死亡,并且预测显示到2050年每年可能有1000万人死亡,因此需要采取紧急措施来对抗抗生素耐药性。此外,到2030年,由于治疗这些感染的高昂费用,约有2400万人可能面临极端贫困。分子反灭绝包括复活已灭绝的分子,以应对抗生素耐药性等当代挑战。这种方法揭示了新的序列空间,扩大了我们对分子多样性和潜在治疗设计的理解。最近的计算和人工智能方法加速了抗生素的发现,包括通过蛋白质组挖掘。需要进一步的研究来充分挖掘复活抗生素肽的治疗潜力和安全性,并使其成为对抗抗生素耐药感染的有效治疗方法。
在本研究中,研究人员从国家生物技术信息中心(NCBI)分类浏览器中收集了已灭绝生物的蛋白质组,从208个已灭绝物种中检索了12,860个蛋白质序列。对于现代人类蛋白质组,他们从UniProt获得了20,388个经过审查的智人蛋白质。利用内部肽数据集(包含988种肽对34种细菌的14,738个抗菌活性测量值)来训练和评估抗生素肽去灭绝(APEX)模型,并利用来自抗菌活性和肽结构数据库(DBAASP)的公开抗菌肽(AMP)序列进行增强。
APEX模型架构采用带关注层的递归神经网络(RNN)处理肽序列并提取特征。全连接神经网络(fcnn)预测抗菌活性并对AMP/非AMP标签进行分类。训练使用了Adam优化器的小批量优化。超参数通过网格搜索和五倍交叉验证(CV)进行调整,集成学习平均来自前八个APEX模型的预测。
研究人员从已灭绝生物中筛选加密肽(EP)序列,以评估其抗菌活性、选择性和多样性,最终得到3784个独特的候选EP。他们合成并验证了69个多肽。抗菌实验、膜通透性和细胞质膜去极化实验评估肽活性,而细胞毒性用3-(4,5-二甲基噻唑-2-基)-2,5-二苯基溴化四唑(MTT)实验评估。在人血清中测试了对蛋白水解降解的抗性,并通过圆二色性分析了二级结构。
小鼠模型对皮肤脓肿和大腿感染的体内疗效进行了测试。统计分析采用单因素方差分析(ANOVA),数据分析采用GraphPad Prism和Python。
训练数据集包括来自DBAASP的988个内部肽和5093个抗菌肽和5500个非抗菌肽。内部数据集包含来自34种菌株的14,738个抗菌活性值。数据集被分成一个CV集和一个独立集。使用五倍CV调整超参数,独立集评估最终的预测性能。
APEX在大多数特定病原体的最小抑制浓度上优于基线机器学习模型(弹性网络、额外树回归器、线性支持向量回归、随机森林和梯度增强决策树)
(MIC)预测。集成学习方法,平均来自前八个APEX模型的预测,进一步提高了性能。
为了比较APEX与评分函数的预测能力,研究人员测试了49个由评分函数预测的肽和69个由APEX预测的来自灭绝生物的肽。在69个apex预测的肽中,21个来自分泌蛋白,48个来自非分泌蛋白。合成的肽段对11种病原菌的抗菌活性进行了实验测试,结果表明,鉴定具有抗菌活性的肽段的准确率为59%,显著高于评分函数的24%的准确率。
研究人员还评估了这些肽的二级结构,发现apex鉴定的肽主要形成α-螺旋结构,增强了它们的膜相互作用和抗菌效果。通过膜去极化和渗透实验研究了apex的作用机制,结果表明apex预测的肽能有效地去极化细菌膜。
小鼠皮肤脓肿和大腿感染模型的体内实验表明,包括AEPs(古EPs)和MEPs(现代EPs)在内的几种肽具有显著的抗感染作用。值得注意的是,肽如大象素-2、hydrodamin-1、meggalocerin -1、mammuthusin-2和mylodonin-2减少了2-5个数量级的细菌负荷,与广泛使用的抗生素多粘菌素B相当。
总之,本研究强调了深度学习在预测肽序列抗菌活性方面的成功应用,特别是通过开发和使用APEX模型。APEX在内部和公开可用的数据集上进行训练,利用多任务学习架构来预测肽的抗菌特性。该模型在预测物种特异性抗菌活性方面优于传统的机器学习方法,显示出实质性的预测能力。这些发现强调了分子去灭绝在发现新的治疗分子和解决抗生素耐药性方面的潜力。