中国基因网您的位置:首页 >遗传基因 >

大型复杂数据集的可视化方面的进步

对主要的数据可视化工具t分布随机邻域嵌入(t-SNE)的改进,称为优化t-SNE(opt-SNE),为研究人员准确查看其数据集中的内容提供了新的亮点。

大型复杂数据集的可视化方面的进步

opt-SNE是近十年前广泛使用的t-SNE的改进。尽管t-SNE可以准确分析任何给定样本中的大约一百万个细胞,但近年来,单细胞数据集已经变得更大。借助opt-SNE,研究人员现在可以以前所未有的分辨率可视化包含数千万个细胞的样本中的数据。opt-SNE的开发由波士顿大学医学院(BUSM)病理学和实验室医学助理教授Anna Belkina博士领导。

除了能够正确处理大型数据集之外,opt-SNE还能够成功地可视化所测血样中很小的不同细胞群(这些组中的每个细胞十分罕见,占总数的十万分之一)样本中的细胞数)。在opt-SNE之前,这种精确的大规模可视化不可能同时放大微小的种群。“ t-SNE最初是一种“千篇一律”的算法,但是opt-SNE计算是针对每个单独的数据集量身定制的,因此可以鸟瞰和近距离查看样品中的物质。 opt-SNE,既可以看到大海捞针,也可以看到里面的针头。”该研究的通讯作者Belkina解释说。“这是一个特别有价值的工具 用于细胞计数和单细胞转录组学数据的研究”。

opt-SNE使研究人员可以找出以前无法检测到的特征,从而将病变样品与对照区分开。这种进入疾病状态的新视角可能揭示出治疗的新目标以及新的生物学现象。由于Belkina与主要的单细胞数据分析平台的开发人员正在进行的合作,该方法已被多个研究小组使用,这些开发人员已将opt-SNE实施到Omiq.ai云分析平台(Christopher Ciccolella,MS)和FlowJo软件(Josef Spidlen)中博士和Richard Halpert博士)并共同撰写了手稿。一个开源的选择,SNE包也得到了释放。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。