中国基因网您的位置:首页 >基因科普 >

使用全基因组测序数据通过性状预测鉴定个体

Human Longevity,Inc。(HLI)的研究人员发表了一项研究,其中使用全基因组测序数据和机器学习预测了个体面部和其他身体特征。这项工作来自第一作者Christoph Lippert,博士。高级作者J. Craig Venter博士发表在“美国国家科学院院刊”(PNAS)上。

使用全基因组测序数据通过性状预测鉴定个体

作者认为,虽然该研究为取证提供了新方法,但该工作对数据隐私,去除识别和充分知情同意具有严重影响。该团队得出结论认为,随着越来越多的基因组被生成并放置在公共数据库中,需要进行更多的公众审议。

对于IRB批准的研究,1,061名年龄在18至82岁之间的不同种族的人参与其基因组测序至平均深度至少30倍。研究人员还以三维面部图像,声音样本,眼睛和皮肤颜色,年龄,身高和体重的形式收集表型数据。

该团队高精度地预测了眼睛的颜色,肤色和性别,但其他更复杂的遗传特征证明更加困难。该团队认为他们的预测模型是合理的,但需要大量的人才来使预测更加稳健。该团队还开发了一种称为最大熵算法的机器学习算法,该算法具有新颖性,因为它找到了所有预测模型的最佳组合,以匹配全基因组测序数据与表型和人口统计数据,并且能够正确识别平均值, 10个不同种族的参与者中有8个,非洲裔美国人或欧洲参与者中有5个参与者。

HLI的联合创始人,执行主席兼科学战略负责人Venter评论说:“我们开始做这项研究,以证明你的基因组编码所有使你成为你的东西。这显然是一个有限队列的概念证明但我们相信,随着我们将本研究和HLI数据库中的人数增加到数十万,我们将能够准确预测所有可以从个体基因组中预测出的数据。

他补充说:“我们还担心公众和研究界没有充分关注基因组学时代对个人隐私的更好保障和政策的需求,并且正在敦促更多的分析,更好的技术解决方案和持续的讨论。 “

HLI的数据科学家Lippert补充说:“这项研究显示了成像技术在筛选大量个体特征方面的潜力。机器学习能够实现全自动数据解释,并在科学发现中起着至关重要的作用。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容