Y染色体携带的历史

#科技/上海/2013.12.08/32431 次观看

我们实验室全称是叫复旦大学现代人类学教育部重点实验室。前一阵我们这个组干了一件事,做了曹操的家族DNA。曹操,其实大家都知道这个祖先是有点问题的。

我们实验室有三个人,一个是李辉老师,一个是我,还有一个王传超,是李辉的学生,然后另外还有一个历史学家,是复旦历史系的韩升教授。

我们这个分子人类学,已经发展到一个能开始做从民族转到家族的时候。然后当时他们就是想,我们开始做一些跟历史有关的事吧。然后当时选择的对象就是曹操。

曹操因为首先他是有很大的知名度,另外一个正好他名声不是特别好,那这样的话他做家谱,你最怕的是有人冒名顶替,有很多跟他们家族没关的人顶进来。然后那就说,做曹操吧。

结果当时李辉老师和韩升老师正决定好这件事以后,突然安阳那儿冒出来一个曹操墓,正好我们就借这个机会宣传我们这个行当。

我们采了全国按照家谱一百多个家族,三百多个姓曹的人,然后还有一些其他的,比如姓夏侯的和姓操的人。然后把这些人都测了一下他们的那个结果,把这些人按照家谱分成三类。

一类是家谱里声称是曹操后代的人,这些人其实挺少的只有那么十几家;然后第二类,是其他的所有姓曹的人;第三类就是所有的一个中国的本底,不姓曹的所有汉人。

然后做下来结果会发现,有一类人从我们分子人类学那个Y染色体的标记,它是叫O2*-M268,是在那个十几个声称曹操后代的家族里面,它有六个都是属于这个型。而这个类型在全中国散乱的这些姓曹的人里面,他们只占了5%左右。可是在这十几个人里,等于相当于占了一半的家族。

然后这些家谱也是互相都没有关系的,它只是说是曹操后代。可是有的说是曹丕的后代,有的说是曹植的后代,而且分布的都是在各个省。这样的话我们就做了一个结论,就认为,这些人很有可能他是曹操后代,否则的话你那么多家,正好都是这同一支5%的人,然后都串通好说是曹操后代这个可能性不大,尤其在曹操他名声又不是特别好的情况下,他没有必要做这件事。

李辉老师到安徽省的亳州找曹操的家族墓,找到一个骨头是曹操的叔祖,是叫曹鼎。然后王传超就把他的牙齿做了几个月的实验。

因为它那个古DNA还是比较难做的。古DNA它里面的那个DNA是大量降解的,所以你如果不小心人,现代人身上粘了一点,那你测出来就全都是现代人的DNA,可是他用非常严格的条件,在我们复旦大学的古DNA实验室里头,做了几次发现都是一个固定的结果。然后能确定这个结果,它就应该确实是曹鼎这一个古人的结果。

然后这个结果发现正好就是我们从现代人里,推出这个O2*-M268的这个型,所以这样曹操的一个叔祖,加上从谱记的曹操后代,这两边人都对上了。那我们现在就有相当大的把握认为,曹操应该就是属于这个家族。

曹操的这个项目只是我们分子人类学做的很小的一块的事情,而我们做的整个一个大的事情,还是一个跟历史学家考古学家很多人都在思考一个问题,我们是谁,我们是从哪儿来的,只不过,我们是通过不同的研究手段,来实现这个目的。

首先我们之前都是靠的历史学,历史可以说甚至有点像中国的一个宗教一样的东西。可是历史有两个很大的问题。第一个,它不一定是真实的。因为很多中国的史学家,他最关注的并不是史实,而是史观,他是借史来讽人,这样的话他可能会在他的历史书里面,加入一些虚假的东西,甚至还有一些比如笔删《春秋》这样的。它不一定是假的,可是它会省略掉很多东西。而更有很多东西,其实是非常重要的,各种平民大众的东西。可是在历史书上是没反映的,它是不全面的。

后来从20世纪开始,现代的考古学被全面引进中国。考古学至少有一点,它是真实的,而且它能发现很多以前历史上没有记载下来的东西。而我们分子人类学就是跟考古学类似,它也是一个科学,它是用类似的方法,类似的一个科学理念,来考证到底一个真实的历史是什么。

讨论一件考古的事件的时候,我们是有这么几个,就是时间地点人物事件。也就是谁在什么时候,做了哪些事情,其中地点还有事件这两件事,是通过考古学就可以解决的。而那个事件他们是通过,一个陶罐或者是一个青铜器,看它们那个地层叠加关系,还有包括其他的一些文物,能判断这儿出现了一种什么事情。而时间这件事,以前考古学没有特别好的办法。后来是有同位素的鉴定,比如说碳-14,它就能很准确地,把一个考古遗址的年代给定下来。

一开始碳-14这个技术刚出来的时候,有些考古学家还有看法,觉得我们本来就能通过这个地层关系,说他们是什么文化就解决问题了,你这个碳-14出来是不是要抢了我们考古学家饭碗啊。

可是大家现在就发现这个东西非常有用,能判断很多用器物没法来判断的东西。然后现在碳-14已经成为一个考古学的一个标配,也就是说你任何一个遗址,都要用碳-14来看一看,到底什么年代的。

而人物这件事,尤其是这个历史人物他是谁,还有他和以前的古人,同时的古人还有现代人,他都是什么关系,这件事是碳-14还有这个考古的文化都不能很好解决的。这时候就用到了DNA。这DNA,也就包括了通过现代人研究出DNA,和古人研究出DNA。这个我就讲一下,我用Y染色体,来解决这个历史问题的一些原理。

首先人都是有46条染色体,其中有22对是常染色体,父母各给一条,还有一对是性染色体,性染色体,是男的是XY,女的是XX。Y染色体就只有男的有,所以每个男人的他这个Y染色体,都是从他爸传下来的,也这个是Y染色体。然后另外还有一个线粒体,线粒体是男女都有,可是只能从妈妈传下来。

Y染色体它是一个很长的序列,它总共有60个兆,也就是6乘以10的7次方个碱基,六千万个碱基那么长。然后它比较好测的区段,差不多是有一千万个,就是10的7次方。

然后在这些区段里面,它这一千万个碱基是碱基对,比如说这如果是一个A,它对应的肯定是个T。然后它这样的话,它一堆序列连起来,然后这个序列往下传的时候,是相当稳定的。

可是还是会发生一些突变的情况,比如说这是A这几代都是A,突然传到后面就成T了。可是这些概率是非常小的,我们现在算起来,在这一千万个碱基上,平均过四代,也一百年左右,才会发生一个可以往下传的突变。

而且这个突变发生的位置,每次发生的都是很不一样的,这样的话我们就能通过这个突变,来追溯这个人的演化树。比如说如果在这儿,多少辈儿的一个爷爷,他发生了一个突变,这时候在这个位置上,他的所有的子孙都会有这么一个突变,而其他的人,在这个位置上就没有这么一个突变,我们就能判断这些人,肯定他们是有一个共同的祖先,而其他人祖先不是这个人。

这样的话我们就把全世界所有人做成一棵大的一个树,是所有的男性做成一棵Y染色体的树。然后这个树,你可以看到它最根部,是A这个单倍群,这单倍群基本只在非洲有,另外还有B的单倍群基本也是非洲的。

然后再看其他的,这个DD这个单倍群是主要是分布在西藏和日本,可是他们的类型不太一样,西藏是D1和D3这个型,日本是D2这个型,可能在日本和西藏都有40%左右,这么一个比例。可是这两个类型,其实分开已经是有两万多年以上了,这只是一个很古老的类群。

这个是C一个类群,C这个类群是在北亚特别多。比如像蒙古能占一大半,汉人里头差不多是有10%左右。然后你看整个东亚东南亚,甚至北美,就是那个印第安土著都稍微有一点。

然后N这个单倍群,是产生于中国。后来也是到了北亚,然后又一直西迁,一直到了芬兰俄罗斯,都有很多的N。

O就是一个中国最常见的单倍群,中国四分之三以上的人,包括汉族80%左右的人,都是属于O这个单倍群。然后这个群,又往下分能分成O1O2O3等等,我自己也是属于这个群的,包括像我们实验室的,金力李辉等等老师都是属于这个单倍群,我想大家如果测一下的话,可能也会有大部分是这个。

这个是Q单倍群,它主要是分布在北亚,在中国有2%左右,美洲的土著印第安人,主要都是Q这个单倍群的。还有R这个单倍群,R最主要是在西方印欧语系为主。从中亚一直到欧洲,包括印度北部等等全都是这个单倍群。

我就是通过这些基础的东西,来给大家讲几个故事。

头一个故事,我们为什么说人类是走出非洲的。比如说原来我们看的这个,中学课本都说的是咱们中国人祖先,是比如说几十万年前,甚至上百万年前的元谋人蓝田人,北京猿人这些的。

有了这个新的技术以后,我们就做了一棵树,看一下到底这个人的这个树根是在什么位置。做了一下发现,这个最早期的一些分支,什么A00A1这一区间的,全都是在非洲有、有的是在比如说西非喀麦隆,有的是在埃塞俄比亚,有的是在纳米比亚,然后,只有右下角这一小群,这个地方,是才有非洲以外的,所有欧洲亚洲澳洲美洲的人。最简单的一种解释,人一开始就只是在非洲有,后来才有一支走出了非洲。当然这其实和考古学一个大的观点,也是一致的,因为最早的比如两百万年以前的,所有的那个考古遗迹也都是只在非洲有。

可问题是我们计算了一下这个年代,所有走出非洲它都有一个M168这么一个突变,这个年代发现是不到十万年前的。然后我现在算出来,其实只有五万多年不到六万年,也就是说,现在所有的欧洲亚洲的活人,他都是十万年之内走出非洲的人,把之前的人取代掉了。

从这个线粒体,我们也能看出这么一个关系。然后线粒体大家可以看,这个地方是尼安德特人,这是一个丹尼索瓦人,这个是黑猩猩。然后这个地方,是这些以L开头的这些支系,全都是非洲人,只有这个MN还有这个R,比如M和N这两个支系,才是所有走出非洲的人。

也就是说,这个母系,也都一定是在非洲产生的。现在人走出非洲,至少从纯父系和纯母系来看,是板上钉钉的一件事。

当然现在我们又有了新的技术,就是能测人的整个这三个G的常染色体。我们看,人到底有没有混合一些不是走出非洲的这些人的这个基因,就是现在发现其实还是有一点的,大概现在我们算是可能有3%左右。这其中有一部分,是从尼安德特人混进来的,还有一些是从各种野人混进来的。所谓野人,现在说不清楚是一些什么人,反正不是现代人,不是走出非洲的人。

现在我们实验室还在做着这样的一项工作,相信以后也就会能给出一个更复杂的一个图景。也就是说,人可能并不是一个很简单的动物,而是说有很多种类似于,大家可能看过那个橘子柑橙子那么一个杂交史。其实人跟那个可能是差不太多的,可是当然就是人的95%以上的,绝对主体还是从非洲走出来的。这个是东亚各个民族的Y染色体类型的一个分布。

大家可以看,这个是汉族,汉族最常见的是O3这个单倍群,这几支加起来都是O3。然后画了红线的其实就是最常见的最有特色的一些单倍群。藏族我刚才说了,一个是D非常多,另外还有一个M117,这一支是和汉族共享的。也所有汉藏语系,它都是有比较高的比例M117这个类型,它是属于O3下面的。

然后像彝族,壮泰还有比方说就每个民族,都是有它自身的特点。然后这个东西在网上资料很多,我也就不多讲了。可是我通过这个能知道每个民族它既然有不同的分布谱。那就有人说汉族并不是一个单纯民族,它是历史上可能北方的这个戎狄这些人,然后跟南方的这个蛮,还有东边的这些夷,这些不同的民族混合起来,就成了汉族。

然后我们看看到底是不是这么回事,因为如果是这么的乱混起来的话,肯定各个地方的人应该会差的比较多。而我们是这样,把汉族分成了几个区域。当时这还做得比较早,一个是北方一个是南方,然后一个是华东。因为我们在上海采样,可能就是江浙沪这边人做得多点,专门给它分了一个区。

就发现这上面每一个竖列,都是一个Y染色体的类型。然后就发现,甭管是北方还是南方的汉族,它有几个常见的型,比如说O3下面的这个002611,M134 M117,还有比如说N,这几个群它们的分布比例都特别的接近。

原因?甭管是哪儿的汉族,它们互相之间这个Y染色体型的接近的比例这个情况,是和外族非常不一样的。也就是说,汉族总体来说,它是一个整体,而并不是一个大杂烩。

可是还有一些群,比如说C3这个群,它在北方是12%,然后南方可能5%6%,也北方稍微多点;另外还有O1这个群,它在北方只有4%,可是在比如说浙江上海还有福建这些地方,它可能能到20%以上;然后还有那个O2a这个群,它可能是在两广分布比较多一些,也还是有一定的地方性的一些群。因为我们对汉族的历史,其实还是比较清楚的。因为是有史书很明确地说,是从黄河流域向南迁的。

这样的话,我们就先看一下南方汉族,到底主要是汉族的成分,还是说是主要是南方少数民族文化上接受了汉化,然后形成了南方汉族。然后这两幅图,这个是南方汉族,这每一个竖条代表一个省份,这些南方汉族它的父系。这是代表母系,也就是母系是线粒体做出来的。

然后所有蓝的是代表北方汉族的贡献,黄的代表南方汉族的贡献。然后这个做出来一看,所有的这个父系,它的那个大部分大概80%左右都是北方,也全中国共有的这么一个贡献只有20%左右,是南方分布明显偏多的这些类群。

然后在母系上,差不多一半是全国都有的,另外一半是南方非常常见的,这样说明一件什么事?也就是说汉族的它的那个父系确实主要都是从北方迁来,并不是简单的一个南方的少数民族接受了汉族的文化形成南方的汉族,而是北方的汉族往南迁为主,形成南方汉族。可是在往南迁的时候,并不是男的和女的都一样程度地到南方。而是说,是以北方的男性为主,结合了很多南方的女性,是这么形成的,也是有一个性别偏向的。

当然这个意味着哪些故事,有人说可能是因为战争,汉人到南方,然后把当地的那个男子全杀了,然后娶了当地的女的什么的这种情况。当然这其实也不一定,因为有的时候还可能会有些文化阶层,或者说比如说现在人也都喜欢嫁高富帅对吧。然后有可能汉族因为它是带着一个比较先进的文化到了当地,也许是可以不通过战争的手段,也会造成的这种通婚的现象的发生。

然后我们再看一下,北方汉族到底混了多少北方的胡人,还有戎狄这些人的成分。首先看这个是蒙古人最常见的一个类型,它是叫C3的星簇。现在其实已经有它下游的一个名称了,然后这个当时是03年的时候,有一个文章它还认为这个可能是成吉思汗所属的一个类型。当然现在其实是有一些疑问还没有完全定论下来。

这个类型是在蒙古非常多,它在蒙古占到百分之十几以上,甚至百分之二十的也有。而且从东北一直到这个中亚,还有比如说阿富汗,都是有这个类型的。可是这个类型在汉族,我现在做了好几千个人,其中只有那么两三个是属于这个类型的。

也就是说,假如说蒙古在一千年前左右这个时候跑到汉族,它如果是有大量的蒙古人进到汉族,这个类型比如在蒙古能够占到10%以上,那在汉族至少,能会留下比如2%3%这样,是会有一个很可观的一个比例,可是现实是没有,只有千分之几。还有另外一个类群是C3c,其实和那个也类似,也是只有蒙古和东北这些少数民族是比较常见,包括满族。可是在汉族我到目前为止,还一个都没有做出来。

这样也就说明了,甭管是蒙古族还是满族,它虽然是占了中国很长的时间,可是并没有成功地把它的Y染色体也就是父系,留给汉族,当然其他的文化,包括语言上,甚至一些母系的混合,我相信还是会有的。

然后还有类似的比如说日本的。刚才说了那个日本有一个常见类型是D,D2这个型。D2这个型在日本也是占了40%左右,我目前也是在汉族里一个都没有做出来。这样也是说明中国人民在当时抗日战争的时候,对日本人的这个抵抗还是相当坚决的。

然后我再讲第三个故事,也就是说,到底中国存在不存在一个超级祖先?

因为我们都知道如果按照《史记》,或者是各种家谱的记载,很多人说哇我们姓,姓王的或者姓周的,或者姓杨的,我们是从一个姬姓来的,这个姬姓的祖先是周文王。然后还有其他一些姓氏,说我们祖先可能是子姓或者姜姓,或者芈姓等等,然后往上推按照《史记》,我们都推到一个黄帝,然后我们现在还说我们是炎黄子孙。

到底我们是不是这样定义的黄帝的后代?也就说是不是有一个单一的共同祖先,他比如说能占了现在中国一大半人的这么一个祖先。我做的方法是这样,从我目前手里的这些样本,我挑了一百多个各个支系都能代表的这么一些人。然后把他们做了很高精度的一个测试,就测了他们四百万个碱基左右的区段,把里面所有Y染色体之间的突变,全都找出来,然后画了这么棵树。

这个树根,这外头对的还是黑猩猩,后面的下面这是分了几支,就是包括FCD,都是汉族里反正有的。或者包括中国人里有的,就是里头有一些少数民族,我全都放进来。最大一个好处,以每250年能产生一个突变,我就能把它很准确的时间算出来,发现走出非洲这个时间就算出是五万四千年左右。

这个树有一个很大的特点,大家如果学工科的话就知道,它每一个这种分叉,它都是一个二叉,是一个binary的,也就是从一个祖先,只分出两个后代,流传到后代下来。可是这有几个很例外的地方,这儿这是在O3这一支下面的,有一支这出现了一个是准七支的一个结构,这是一个五支这又是一个七支,然后我把它分别称为Oα、Oβ、Oγ。

这几个年代我算下来,这是5400年,这两个也都是,反正总归这三支都是在6000年的上下。这又说明一件什么事?6000年左右这几支发生了一个非常强大的人口扩张过程,它其实就是中国的一个超级祖先。而且6000年这个时间,正好是农业开始从一个原始农业变成一个主要口粮的这么一个转化的阶段,这是考古学得出的一个结论。而且人的那个村落的聚落的那个数量,也开始大幅增加了。

还有另外两支我们后来也找出来,是一个是在O1下面也那个,东南沿海最常见的,还有一个C3下面也是,北方稍微偏多一点,这支不是成吉思汗所属的那支。

这五支我们现在算了一下,它们都是6000年以后扩张起来的,每一支的数量都能占了汉族差不多是10%以上,最多是占17%左右。这五支加起来,能有现在中国人的60%甚至以上。

也就是说,有五个超级祖先,他们是在新石器时代,扩展了非常多的后代,然后形成现在的汉族,包括中国人的一个基础。因为其中这几支有一些是在少数民族里也是都存在不少的。

我们结论超级祖先确实是有的,而且他们的扩张是非常迅速,就在6000多年前。我讲的故事基本就是这些。

现在其实分子人类学,因为刚刚只进行了十几年,这还是一个开头。我们想以后,研究人的各种情况,包括远古的混合,也包括因为现在这个Y染色体能做得越来越细了,以前是只能做到几万年,现在我能做到几千年甚至是能做到一百年这个精度。

那我们就可以来判断,以前这个周文王刘邦等等这种著名家族,它都是哪个类型的,它现在留了多少后代。还有包括有人传说,说爱新觉罗他们家是宋徽宗被清朝虏到东北以后生的孩子,这到底是不是真的。

我想这其实,虽然看起来很可笑,可是毕竟它其实是一个可以解决的科学问题。然后包括还有一个孔子,现在李辉老师应该已经把这个研究到一个程度,我想过不了多久大家能看到这个结果。随着我们这个学科的发展,能给大家贡献更多的更真实的历史。

然后最后说一下,如果大家想要学习这门新兴的学科,可以去这个论坛,就叫兰海的分子人类学论坛,Ranhaer,我们有这方面的很多的专业讨论,当然主要都是爱好者参加的。然后这个是李辉老师编写的网上的一个杂志,叫《现代人类学通讯》,是可以免费阅读的。然后我自己是有一个博客是“人类学杂记”,可能每过个一个月左右,会更新那么一篇,也会讲到很多的知识。然后另外,大家可以关注我的这个新浪微博,polyhdron,也是多面体的意思。

完整演讲稿

严实

分子人类学研究者

您可能还喜欢

47′50″

海昏侯墓考古

杨军

#历史/上海/2016.06.26

24′42″

发现巴米扬

邵学成

#历史/深圳/2018.04.15

27′14″

漫漫疗

Tango

#社会/南京/2022.07.16

25′31″

告别汉字“常识”

葛亮

#文化/上海/2023.09.17