抓捕美国“金州杀手”的新DNA匹配技术比你想象的强大
大数据文摘出品
编译:M、小七、夏雅薇
今年4月,警方用一种以前未使用过的DNA技术解决了几十年前的谜团 ,金州杀手的身份。
具体方法是使用家族性DNA测试,这是一种新型DNA取证工具,它克服了在现有数据库中搜索样本匹配没有结果的困难,可以通过公共DNA数据库搜索到杀手可能的远亲,这将大大提高警方侦查的效率。
注:美国加州一个上世纪70到80年代曾出现一名连环杀手,涉及至少12宗谋杀、45宗强奸和多宗爆窃案,被称为“金州杀手”。
联邦调查局(FBI)在 2016年曾悬赏5万元通缉“金州杀手”,图为当年的画像。
这是当时的一项新技术,在取得如此高调的成功后,该技术已被证明是法医学领域最强大的新工具之一。
在此后的几个月里,Parabon NanoLabs和DNA Doe项目等团体通过这种方法确定了至少19个不同的悬案样本,称为公共数据库的家族性DNA检测,为以前无法解决的案件提供了至关重要的新线索。
如今,两个新的发现可以使这项技术更加强大。
最近发表在《科学》(Science)杂志上的一篇论文发现,同样的技术比实验室里的研究更高效,因为可以用相对较小的样本可以覆盖几乎所有人口。
与此同时,在《细胞》(Cell)杂志发表论文的研究人员已经设计出一种从不完整的样本中推断DNA的方法,构建出比最初测试的基因组更广泛的图像。
总而言之,这些技术将使研究人员在仅使用现有样本的情况下识别几乎所有人——这是法医学上强大到令人胆寒的一种新型DNA取证工具。
最大限制是覆盖范围
家族性DNA测试是对传统DNA测试的一次突破,该测试寻找正向匹配,例如将作案工具上的DNA与特定嫌疑人的DNA相匹配。
但至关重要的是,匹配只有在收集到嫌疑人的DNA时才能进行,这对于大多数悬案来说是不切实际的。但家族DNA搜索寻找部分匹配,这可能表明样本来自兄弟姐妹或父母,而不是特定的犯罪嫌疑人。这还不足以确定犯罪嫌疑人本身,但可以给警察一个关键线索,推动进一步检测。
为了找到那些部分匹配,实验室在很大程度上依赖于公共DNA数据库,如GEDMatch和DNALand。
因为数据已经公开,这些搜索不需要法院批准,但它们的范围比较有限。最大的数据库GEDMatch只包含一百万个左右的基因谱,很大程度上限制了许多搜索的范围。
相反,FBI的国家DNA索引(National DNA Index)包含超过1700万个档案,但只能在特定的法律环境下访问。像23andMe和MyHeritage这样的消费者DNA服务也包含更多样本,但他们的政策可以保护他们免于这种执法搜索。
所以这是对数据的一场新的争夺,以及关于公共数据可以涉及多少个人信息的质疑。
“最大的限制是数据覆盖范围,”哥伦比亚大学计算机科学教授,MyHeritage首席科学官Yaniv Erlich说,“即使你找到一个人,因为数据问题还是得进行复杂的分析。”
覆盖人口的2%的数据库几乎可以与任何人匹配
现在,Erlich已经与哥伦比亚大学和希伯来大学的其他研究人员一起研究了覆盖范围可以达到的确切范围。该团队发表在《科学》上的论文,分析查看了一个128万个人的数据集(主要来自MyHeritage数据库),并对一个选定个体与DNA在数据库中的亲属相匹配的可能性进行了统计分析。
根据这些结果,研究人员发现超过60%的搜索能找到第三代表亲或更接近的匹配(与金州杀手嫌疑人使用相同的接近度),从而有合理的机会认定或排除嫌疑目标。
因此,研究人员估计,数据库只需覆盖2%的目标人群,即可为几乎任何人提供远亲或更好的匹配。“随着消费者基因组学的指数增长,”研究人员写道,“我们认为,在不久的将来,某些第三方网站可以到这样的数据库规模。”
值得注意的是,该预测基于同质群体,但大多数遗传数据集显示出显著的种族差异。最显著的是执法数据库,其数据来源于被捕者或囚犯群体,因此偏向黑人和拉丁裔人口。 Erlich表示,消费者和公共数据库表现出相反的偏见,偏向白人,后者更有可能被家族性搜索所识别。
与此同时,另一组科学家正在进一步扩大使用这些技术的范围。消费者基因测试提取基因组的不同部分而不是用于执法检验,这导致当在无法获得完整样本时会出现持续的比较问题。
斯坦福大学,加州大学戴维斯分校和密歇根大学的一组研究人员已经开发出一种比较结果的方法,即使基因组的某些部分不重叠,也可以利用遗传密码不同部分之间的已知相关性。该方法尚处雏形,但它可以为法医分析师在处理数据类型上提供更多的灵活性。
根据负责《细胞》论文的加州大学戴维斯分校的Michael Edge,新研究“提出了一个框架,执法部门可以使用这个框架开始考虑现有STR数据库与SNP数据的向后兼容性,但需要做更多工作才能看到实际应用效果如何。”
相关报道:
https://www.theverge.com/2018/10/11/17964862/family-dna-crime-search-golden-state-killer-forensics