近日,一项发表在PLOS Genetics的研究使用机器学习来挖掘现有的生物库,并生成不属于真实人类但具有真实基因组特征的人类基因组块。
研究人员称,“现有的基因组数据库是生物医学研究的宝贵资源,但由于伦理考虑,要么无法公开获取,要么程序复杂繁琐。这给研究人员造成了重大的科学障碍。”而用人工智能生成的基因组可以解决这个问题。
这项研究还包括评估人工基因组与真实基因组的接近程度,以测试原始样本的隐私是否得到保护。
多学科团队进行了多次分析,以评估生成的基因组与真实基因组相比的质量。最终发现,这些从机器学习中产生的基因组模拟了真实人类基因的复杂性,而且就大多数属性而言,除了不属于任何基因捐赠者之外,它们与用来训练算法的生物库的其他基因组没有区别。”
编译/前瞻经济学人APP资讯组
论文链接:
https://journals.plos.org/plosgenetics/article?id=10.1371/journal.pgen.1009303