揭示生物学:可扩展的单细胞分析工具

   日期:2025-06-06     来源:本站    作者:admin    浏览:108    
核心提示:    为了理解即使是最小的细节是如何影响人类生物学的,研究人员收集了大量的单细胞基因样本压力databases。然而,目前的分

  

  为了理解即使是最小的细节是如何影响人类生物学的,研究人员收集了大量的单细胞基因样本压力databases。然而,目前的分析技术无法处理大量的数据,因此无法产生数据一致和扭曲的结果。

  为了产生更准确的结果,St. Jude儿童研究医院的研究人员开发了一种机器学习算法,可以与这些单细胞数据存储库进行扩展。《细胞基因组学》杂志发表了这项新技术。

  在单细胞分析之前,大量基因表达数据为许多疾病提供了高水平但不精确的结果。研究人员可以使用单细胞分析检查感兴趣的单个细胞;这类似于检查单个玉米粒而不是田地。

  尽管对不断增长的数据进行复制和扩展分析的困难阻碍了进展,但这些深入的见解已经导致对一些疾病和治疗的理解取得突破。

  每一种用于研究单细胞基因表达的方法都会产生大量的数据。当科学家一次测试数百万个细胞时,处理数据所需的计算机内存和处理能力是巨大的。为了解决这个问题,Geeleher的团队开始寻找另一种硬件。

  当使用标准方法进行分析时,数据量经常迫使研究人员做出假设和让步,从而引入偏见。圣犹达研究人员采用的人工智能方法消除了这些选择中的这种偏见。

  刘说:“我们的方法使用无监督机器学习,它自动确定更鲁棒和更少任意的分析参数。它学习如何根据不同的活性生物过程或细胞类型身份对细胞进行分组。”

  研究人员可以将该算法应用于任何规模可观的单细胞RNA测序数据集,因为它可以从提供的数据中学习并进行分析。研究人员将这种方法命名为基因表达程序的共识和可扩展推理(CSI-GEP),因为它单独检查每个新的大型数据集,并仅根据这些表达程序线索得出结论。

  当应用于最大的单细胞RNA数据库时,CSI-GEP优于所有其他方法。该算法能够识别其他方法无法识别的细胞类型和生物过程。

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行