前段时间,南京警方宣布一起多年前的奸杀案告破。死者沉冤得雪,生者罪恶已昭,就不再讨论当事人的故事了。
值得注意的是,在事发的1992年,警方调动了极大资源去调查,核查线索数千条,走访人数超1.5万,但随后的二十几年间案情都未曾获得突破。
而从意外获得嫌疑人男性亲属DNA,到成功确认嫌疑人身份并抓捕,只用了短短三天。
今天我们就来聊一聊,在这起案件告破过程中,发挥了极大作用的DNA检测,或者说是Y-STR检测到底是什么。
我们都知道,DNA可以标志一个人的身份,不过在现代法医学实践中,DNA检测并不会完整地对比所有DNA序列。
人类DNA长度超过32亿个碱基对,倒也不是不能测。
实际上,我们只要选出DNA中比较有特征的部分,单独检测这部分就好了。
这就是我们今天要说的短序列重复(STR)。
这就是一个典型的STR。
DNA序列有ATCG四种碱基组成,它们四个的排列组合中,有时就会出现同样的排列反复出现的情况。
比如ATATATATATATATATATATAT。
又比如CTGCTGCTGCTGCTGCTGCTG。
STR片段一般2-6个碱基长,重复次数从几次到几十次不等。
不抽卡谢谢。
检测中往往选取位于非编码区的STR,这部分基因没有功能,不容易被自然选择淘汰,更容易保留突变带来的个体差异。
不同的个体之间具有完全相同的STR的概率是非常小的,如果同时检测多个位点,那准确度就更高了。
美国的法医学鉴定会同时检测13个常染色体STR位点,在理想情况下,两个人同时匹配同一份DNA样本的概率还不到十亿分之一。
这是最大的优点,也是最大的问题。
从犯罪现场提取到的嫌疑人DNA刚好能匹配到已有数据的概率有多大?
我不知道,至少在拥有全民基因数据之前,这个概率应该很低。这意味着你的嫌疑人必须以前也犯过罪、被抓到过、被登记在案。
那这犯罪分子真是屡教不改还总被抓到,又蠢又坏。
很显然,我们需要一种更“模糊”的、能迅速找到嫌疑人所在特定群体的技术。
先来说说常染色体STR为什么不行。
人体体内有23对染色体,其中22对称为常染色体,1对叫做性染色体,女性为XX,男性为XY。
在精子和卵细胞形成过程中,23对染色体会一一分开,每个精子/卵子都只有每对中的一条。
所以受精卵形成倒也的确是个找到另一半的过程。
那么,在不考虑基因突变的情况下,你和父亲/母亲的STR相似度可能只有50%,算到祖父辈则是25%或更少。
如果往上倒推10辈人,从时间上来看可能也就只有300年左右,但是你的8曾祖辈将有2的十次方个个体。
210=1024。
这一个G的人每个人又和你有多相似呢?
而且如果你有耐心推算就会发现,因为染色体的重组是完全随机的,并不是亲缘更近基因相似性就更高。
隔了三代的表亲并不一定就比隔了八代的在基因上更相似。
实际上,如果用比较低的常染色体STR相似率去匹配,是极有可能匹配到地球另一边儿一个完全没关系的人的。
说不定也能匹配到大猩猩。
所以常染色体STR一般只用作单一身份的鉴定,或者结合家谱推断亲缘。在除了DNA什么都没有的情况下,并不实用。
相比之下,Y-STR的普适价值更广一些。
顾名思义,Y-STR就是对Y染色体进行的STR检测。
与常染色体不同,Y染色体仅有男性拥有,在一个家族中,所有男性个体的Y染色体,都来自统一祖先。
这就意味着,同样不考虑基因突变的情况下,只要是一家人,那就拥有同一条Y染色体。
那么可供精确匹配的样本数就大得多了。一旦匹配成功,就可以确认嫌疑人所在的家族,再结合其他证据的推断,比如说嫌疑人的年龄、身高、某些习惯等等,就可以迅速锁定到个人,最后通过常染色体STR确认身份。
当然了,实际应用中面临的困难还会更多一些。我们再来看一遍这张图。
受到犯罪现场条件限制,警方提取到的DNA很多时候是多个来源混合的,可能由于外部环境原因有所降解,又或者检材比较少DNA量不足,真实检测结果并不总是像示例这样清晰。
这就需要法医们利用经验和技巧来综合判断了。
在刑事案件、尤其是凶杀案中,嫌疑人为男性的比例非常之高,这也是Y-STR技术得以应用的现实原因之一。
在南医大案中,犯罪分子麻某被捕,就是因为他的一位近亲被盘查采血,发现Y染色体数据与当年的检材高度重合。
麻某为人和气、家庭和睦、有正经编制工作,在邻里之间口碑非常不错。如果不是因为这次“意外”,深埋的罪行可能很难曝光。
其实真实的刑事案件调查中,这样的例子并不罕见。如果现场没有留下明确的嫌疑人身份指向证据,那么警方往往只能从受害人的人际关系逐一排查。
这就是南医大案中调查了数千线索、走访1.5万人的原因。
随着时间的进展,不管是当事人的记忆、还是心理状态都会发生变化,调查只会越来越难。
感谢现代科技,让天网恢恢疏而不漏这句话,不再只是一种心理安慰。
2018年,公安部宣布了一项三年规划,要求全国各地在三年内建成自己的Y库。
从理论上讲,上下几代人的Y染色体都是基本一致的,那么可能几十口人只要录入一个人的Y数据就足够司法使用了。
根据《三联新闻周刊》对刑侦专家的采访,国内最早应用Y库的是河南省,现在河南Y库规模应该有500万。
Y-STR技术在中国率先被推向应用。林恩正告诉本刊,国内最早的应用应该是在河南。他听到的说法是,因为河南当时大量出现流动作案团伙和家族式作案团伙,有刑侦专家向河南省公安厅推荐了这一技术,“现在河南应该已经有一个超过500万规模的Y库。”林恩正说。葛建业向本刊简单计算了一下,河南有1亿人口,男性约有5000万,如果按祖孙三代男性1:3:5计算,几乎已经覆盖全部家庭。
最后再聊两句Y库的伦理问题。
其实在上个世纪90年代,DNA检测就已经在法医学实践中应用了,但是到今天,我们也没听说过为了司法大规模采集DNA信息的行为。
甚至随着商业化DNA检测的流行,人们越来越意识到,DNA也是隐私的一部分。
比如说,如果某个人携带者一段疾病相关基因,那么这会不会成为他被歧视的理由呢,他是不是有权利保密呢?
所以现在司法掌握的DNA数据,都来自犯罪者和警务人员,至多涉及到高犯罪率的群体。
在这个意义上,Y库甚至是更加扩大了一步的,它针对的不是个体,而是一个家族、一个群体,你我都有可能因为远得不能再远的亲戚被警察找上门来。
但我们或许不用担心Y库会泄露基因的秘密,毕竟它只保存部分STR的数据,这些来自非编码区的小片段大概率并不决定我们的身高体貌。
当然,这也意味着Y库的功用较为单一,保障司法正义之外,很难在医疗等领域提供更多的帮助。