
人工智能(ai)越来越多地用于基因组学,通过筛选大量基因组数据来确定潜在的治疗靶点,尽管人工智能决策具有不透明的性质。为了解决这个问题,冷泉港实验室的科学家们开发了SQUID (Deepnets的替代定量可解释性),这是一种旨在提高基因组学中人工智能模型可解释性的工具。
由冷泉港实验室的科学家开发的SQUID通过使用大型DNA变体库和MAVE-NN程序来分析其影响,提高了AI在基因组学中的可解释性。
这个工具可以帮助研究人员做出更准确的遗传预测,并支持更好地理解基因组功能的假设发展。
人工智能继续在我们生活的许多方面蠕动着。但是生物学呢,对生命本身的研究呢?人工智能可以筛选数十万个基因组数据点,以确定潜在的新治疗靶点。虽然这些基因组的见解可能看起来很有帮助,但科学家们并不确定今天的人工智能模型最初是如何得出结论的。现在,一个名为SQUID的新系统出现在现场,准备撬开AI内部模糊逻辑的黑盒子。
SQUID计算管道的示意图。资料来源:Koo and Kinney实验室/冷泉港实验室
SQUID:增强AI的可解释性
SQUID是Deepnets代理定量解释性(Surrogate Quantitative Interpretability for Deepnets)的缩写,是冷泉港实验室(CSHL)科学家创建的一个计算工具。它旨在帮助解释人工智能模型如何分析基因组。与其他分析工具相比,SQUID更具一致性,减少了背景噪声,并且可以更准确地预测基因突变的影响。
为什么效果这么好?CSHL助理教授古永明说,关键在于SQUID的专业训练。
“人们用来理解这些模型的工具主要来自计算机视觉或自然语言处理等其他领域。虽然它们可能有用,但它们并不是基因组学的最佳选择。我们利用SQUID所做的是利用数十年的定量遗传学知识来帮助我们了解这些深度神经网络正在学习什么,”Koo解释说。
这项研究的第一作者埃文·e·塞茨(Evan E. Seitz)是肯尼和库实验室的博士后。来源:冷泉港实验室
SQUID的工作原理是首先生成一个超过100,000个变异DNA序列的文库。然后,它会使用一个名为MAVE-NN (multi - plex Assays of Variant effects Neural Network)的程序分析突变库及其影响。这个工具允许科学家同时进行数千个虚拟实验。实际上,它们可以“捞出”给定人工智能最准确预测背后的算法。他们的计算“捕获”可以为更现实的实验奠定基础。
鱿鱼的实际影响
“计算机(虚拟)实验不能取代实际的实验室实验。然而,它们可以提供非常丰富的信息。它们可以帮助科学家对基因组的特定区域如何工作或突变如何产生临床相关影响形成假设,”CSHL副教授贾斯汀·金尼解释说,他是该研究的合著者。
海洋中有无数的人工智能模型。每天都有更多的人进入水中。Koo、Kinney和同事们希望SQUID能帮助科学家抓住那些最能满足他们特殊需求的细胞。
尽管人类基因组已经被绘制出来,但它仍然是一个极具挑战性的领域。SQUID可以帮助生物学家更有效地导航该领域,使他们更接近他们的发现的真正医学意义。
参考文献:Nature Communications, 2024年6月21日。DOI: 10.1038 / s42256 - 024 - 00851 - 5
资助:西蒙斯基金会、美国国立卫生研究院、阿尔弗雷德·p·斯隆基金会




