财新传媒
位置:博客 > 知识分子 > 基因组学研究追溯人类迁移历史(上)

基因组学研究追溯人类迁移历史(上)

编者按:
在过去十年,科学家对人类基因组数据的分析,正在重塑我们对人类演化历史及遗传适应的理解。2017年1月19日,来自美国、英国、丹麦和瑞典的六位学者在《自然》(Nature)发文,介绍了现代人及古人基因组测序分析为人类演化研究带来的一系列重大突破。
 
《知识分子》获《自然》与作者授权编译全文,介绍给关注人类命运与历史的中文读者。文章分两部分,今天刊登第一部分,下周将介绍欧洲、亚洲、美洲与大洋洲人类的迁移史。
 
撰文 | Rasmus Nielsen, Joshua M. Akey, Mattias Jakobsson, Jonathan K. Pritchard, Sarah Tishkoff, Eske Willerslev
编译 | 汪鸿儒
审校 | 程莉
责编 | 陈晓雪
 
● ● ●
 
过去,我们主要依赖考古学和古生物学的数据,去理解现代人类,即我们的祖先,出现和扩散过程中的关键事件。然而,仅通过这些数据,我们难以确定不同人群之间的遗传关系。另外,考古学研究虽成功阐释了文明的传播,却难以回答:文明的传播,到底是由于人群迁移还是仅仅思想的传播造成的?现在,通过对现代人以及古人基因组数据的研究这一全新视角,我们可以直接确定不同人群的系谱关系、迁移路径以及基因混合的情况。
 
20世纪80年代,DNA数据的出现,使得我们可以用大量分子遗传数据对不同人类起源理论进行直接的检验。线粒体DNA和其它简单分子标记的研究,为我们带来了许多关于人类演化的新洞见。最重要的是,这些研究使得“走出非洲”假说被广泛接纳,该假说认为所有的现代人类起源于非洲并由此向外扩张。而与之相对的一个假说,“多地区独立起源”假说,则被广为证伪——这一假说认为现代人类是在世界多个地区独立演化而来的,伴随有不同人群之间的基因交流。
 
研究发现,人类线粒体DNA谱系的根部在非洲,这一结果和“走出非洲”的模型是吻合的。然而,线粒体DNA不能重组,由母亲直接遗传给后代,因此只能作为一个反映母系遗传的标记。仅仅通过一个遗传标记去推断遗传系谱,有可能并不代表整个基因组的情况,从而难以真实反映人类演化历史。为了更加严格地去检验复杂的人类演化模型,结合核基因组的分析是必需的。20世纪80年代到21世纪初期的大量基于线粒体标记(或者Y染色体)的研究,仍然留下了许多人类演化的未解之谜。例如,现代人类和和其它人种之间是否有过基因交流?关于美洲原住民的来源,也存在着激烈的争论。文明的演进,例如农业出现和传播的过程中,人群迁徙和思想传播的作用哪个更重要?对欧洲及世界其他地区的农业文明来说,这一问题仍不清楚。
 
在过去的十年里,基因组测序以及古DNA抽取富集方法上的巨大技术进步,使得最终破解这些未解之谜成为可能(图1)。技术的进步使得研究者能够从人骨残骸中提取并测序几万年前古人甚至其他人种的基因组。通过囊括广泛历史时期以及不同地理位置的样品,为基因组测序研究加入时间和空间的维度,这些工作为人类演化研究提供了全新的视角。
 
本文将综述人类基因组测序所带来的关于人类演化的大量重要发现。有些情况下,对新基因组数据的分析,进一步支持了之前基于考古学和古生物学的主流理论;在另一些情况下,则带来全新的发现,而这些发现,是仅凭之前数据完全无法想象的。
 
源起非洲
 
现代人类的最早化石证据来自于埃塞俄比亚,可追溯至15-19万年前。非洲之外,已报道的现代人类化石证据有来自于10万年前的中东,和8万年前的中国南部。其他人种,如尼安德特人,最早可追溯到40万年前,他们曾遍布欧亚大陆,却在大约4万年前,从化石记录中消失了(图2)。
 
初步的基因组多样性研究表明,非洲人在所有的现代人群中有着最高的多样性,并且有着广泛的群体分化,这个结果与人类线粒体DNA谱系根部在非洲的结果相吻合。一份基于3000个非洲人样本的全基因组分子标记的研究,在非洲鉴定出了14个祖先人群。这一人群划分结果,和非洲的地理、文化以及语言有着广泛的相关性。
 
其它基于更多分子标记的研究也在很大程度上支持这些观点。这些以及更多的研究发现表明,非洲人群在其演化历史上保留了巨大而细分的结构,而且全球人群内部最深的遗传分化(Deepest split)来自于撒哈拉以南的非洲人群(译者注:最深遗传分化,说明两群人之间的分化时间非常久远。如果把地球上的人群两两配对,看分化的时间,如果有一对,他们的分化时间最久远,那么他们之间的遗传分化最深)。有证据显示,这一地区既有古老的、也有新近的人群迁徙事件,伴随着迁徙,发生了大量的遗传混合。在基因组层面,对非洲人影响最大的迁徙事件,发生在约4000年前,说班图语(Bantu-language)的人群从尼日利亚和喀麦隆高地,迁徙到撒哈拉以南非洲的大部分地区。他们随后和狩猎—采集的土著人群有着广泛的遗传混合,甚至有可能替代了这些土著人。其他重要的迁徙事件包括,约7000年前,由畜牧农民组成的游牧人群从南苏丹迁移到非洲的东部和中部;还有约5000年前,农牧人群(他们既畜牧又耕作)从埃塞俄比亚迁徙到坦桑尼亚(图2和图3)。
 
基于全基因组测序的分析发现,说“咔哒语”(click-language)的桑人(San)人群内部包含了全球人群中最深的遗传分化,且这种分化估计发生在11-16万年前左右(图2)。然而,单亲遗传的遗传标记(线粒体DNA或者Y染色体分子标记)和语言学的研究揭示,说“咔哒语言”的采猎人群最初的分布可能更加广泛,而如今除了在非洲南部,在其它的区域桑人都被取代了。又或者,他们可能起源于东非,在过去的5万年里,迁徙到了南非。其他说“咔哒语言”的狩猎采集人群,包括现在居住在东非的坦桑尼亚的哈扎人(Hadza)和桑达韦人(Sandawe),与非洲南部的桑人实际上在基因组上亲缘关系较远。
 
由于非洲热带地区化石和考古数据的缺乏,我们仍无法得知,现代人类在非洲准确的起源地点。无论如何,现代人类在非洲的多区域起源,也就是说,现代人的特征在非洲多个地区以分散的方式分别演化而来,然后又通过基因交流被联到一起,仍然是有可能的,特别是在这个大陆上,有着大量的人群迁徙和混合的机会。事实上,有证据显示,现代人类曾经和古人类在非洲有过遗传混合。想要对1万年前的非洲人基因组进行鉴定,非常具有挑战,因为非洲地区的环境,包括局部气候条件,对于遗传物质的保存不利,因此非洲一万年前的人样本中很难提取出DNA。不过,对非洲地区不同地理环境下的现代狩猎—采集人群全基因组测序数据分析显示,他们的基因组中,有着古人类基因渗入(通过交配交换遗传物质)的迹象,部分研究推测这些古人类和现代人类分化的时间远至120到130万年前,而另外的研究则认为分化时间近达35000年前。因此,非洲现代人群基因组中,是否存在着古人类的基因渗入还有着争议,很多正在进行的研究就是要准备解决这个问题。
 
走出非洲
 
作为一个引人注目的事件,现代人类从非洲起源并扩散到全世界(图2),在所有非洲以外的现代人遗传变异中都留下了很强的信号,包括较低的多样性和更强的连锁不平衡(译者注:连锁不平衡,linkage disequilibrium,表示两个分子标记之间的连锁状态,随着时间推移,充分的重组会打破这种不平衡,趋向连锁平衡。在当前语境下,人群内部较强的连锁不平衡状态,暗示着该人群有着较近的共同祖先)。然而,“走出非洲”的次数、准确的起源位置、迁移的路径以及具体时间仍然很模糊。例如,有证据分别支持现代人类起源于非洲的东部,中部或者南部;单次或者多次走出非洲;迁移扩散路径为自北向南;扩散发生时间的估计也在5-10万年前的范围。
 
最近,三份由哈佛大学、哥本哈根大学和爱沙尼亚生物中心分别领衔,世界范围内一百余家科研单位参与的研究,收集了全球地理分布多样的270个地点的个体样本,产生了全新的、高质量全基因组测序数据,这些数据的分析结果也指向单次“走出非洲”的模型。在这次扩散中,所有非洲以外的现代人由同一拨走出非洲的人群分出,同时,可能有少量来自于更早走出非洲并进入大洋洲的那一拨现代人的的遗传贡献(译者注:支持现代人群来源以单次“走出非洲”为主,同时暗示多次“走出非洲”,但对现代人的遗传贡献极小,难以确证;多次“走出非洲”的结论本身在三份研究中也有着争议。)。此外,离开非洲之后,现代人随即分成了两拨。一拨人最终留在澳大利亚和新几内亚,而另一拨成为了现代欧亚人的祖先。然而,这些走出非洲的人群,早期分化过程中具体的迁移路径仍然是一个充满争议的话题,需要更多的研究。
 
遭遇尼安德特人
 
基于基因组的证据表明,非洲以外当代人的祖先曾经遭遇过尼安德特人,并且与之混血。到目前为止,科学家们研究过的全球除非洲以外的个体都含有大约2%的尼安德特人的基因组序列,这说明他们之间的混血主要发生在现代人类刚走出非洲之后不久,这个结果也和单次走出非洲的模型是一致的(图2)。基于连锁不平衡的模式,科学家估计混血发生在大约5-6.5万年前,而现代人类祖先与尼安德特人混血的时间也可为“走出非洲”的时间估计设定下限(译者注:“走出非洲”的时间应早于与尼安德特人混血的时间)。
 
对留存在现代人的基因组中尼安德特人血统成分进一步的估计分析,则指向更为复杂的尼安德特人和现代人类互动的历史。具体说来,东亚人比欧洲人多出20%的尼安德特人基因组序列。这个结果,一方面可能反映了自然选择的结果;另一方面,可解释为东亚人祖先在和欧洲人分开之后,与尼安德特人有着进一步的混血(图2);又或者,欧洲人与含尼安德特人成分较少的其他人群混血,导致了尼安德特人血统的稀释。
 
一个非常有趣的研究结果是,对4万年前罗马尼亚人的单核苷酸多态性基因分型研究证实,尼安德特人对现代人类的基因渗入在欧亚大陆的多个区域发生过多次。来自芝加哥大学的最新研究揭示,尼安德特人和现代人类之间有着比想象更为复杂的混血历史。值得注意的是,我们对遗传混合模型的理解仍然是动态的,更为复杂的种群历史模型也能解释目前观察到的结果。
 
遭遇丹尼索瓦人
 
当第一个现代人类出现在欧亚大陆的时候,和尼安德特人一样,至少还有另外一种古人类——神秘的丹尼索瓦人——居住在这片大陆。我们对丹尼索瓦人的形态和地理分布知之甚少,因为我们是通过从一个指骨和三颗牙齿中测出的基因组序列了解到他们的存在的,这些指骨和牙齿发掘于西伯利亚的丹尼索瓦山洞。丹尼索瓦人和尼安德特人的联系最为紧密,他们之间的遗传分化相当于现代人类不同群体之间最深的遗传分化,分化时间可追溯至20-40万年前。丹尼索瓦人有许多独特的地方,例如,他们有着来自于和早期人类(很可能是直立人)相关的遗传物质(通过遗传混血获得)(图2)。可以说,丹尼索瓦人占据(甚至可能超过)了古人类在欧亚大陆分布的东端和南端,而尼安德特人分布在西端。
 
和尼安德特人类似的是,丹尼索瓦人与现代人类有过杂交。部分人群,包括大洋洲的美拉尼西亚人(Melanesians),其基因组的3-6%序列可能来自丹尼索瓦人(图2)。东南亚大陆人群0.1-0.3%的遗传物质也可追溯到丹尼索瓦人。尼安德特人和丹尼索瓦人的基因渗入(introgression)很可能都受到了遗传选择的清除。人类所受的选择似乎大多是针对渗入的DNA,因为在基因组功能区域,渗入的DNA相对缺乏(编者注:基因组功能区域,很可能有一些功能重要的基因。但是在这些区域,尼安德特人或丹尼索瓦人的序列缺乏,暗示现代人的在这些区域的序列更加有利,因而被自然选择保留;反之,则被选择所清除)。此外,通过对现代人群基因组的分析,研究者鉴定出了大片的缺乏尼安德特人和丹尼索瓦人序列的基因组区域,这一结果,与有害序列快速清除的推测是一致的。然而,有一些DNA渗入可能帮助人类适应局部的环境,例如藏族人对高海拔的适应。
 
对第一个可靠的古人类基因组的研究,科学家检测到了两个非常明确的古人类与现代人类混血的事件。自那以后,我们渐渐了解到,这类事件比之前检测到的更加常见,不同现代人类和古人类人群之间的混血时有发生(图2)。丹尼索瓦人对美拉尼西亚人和澳大利亚原住民的基因渗入,是发生在澳大拉西亚(Australasia)还是亚洲,目前仍不清楚,因为澳大拉西亚人祖先曾横跨这些区域迁徙。如果发生在亚洲,那么今天的亚洲人祖先就可能是在后来迁徙事件中才抵达亚洲的。与之相关的谜题,如东亚人中的丹尼索瓦人成分和对澳大拉西亚人中的丹尼索瓦人成分,是否为同一次混合的结果也是未知的。
 
作者介绍:
Rasmus Nielsen, 美国加州大学伯克利分校计算生物学教授
Joshua M. Akey,美国华盛顿大学基因组学系教授
Mattias Jakobsson, 瑞典乌普萨拉大学有机生物学系教授
Jonathan K. Pritchard,美国斯坦福大学遗传学系与生物学系教授、霍华德•休斯研究员
Sarah Tishkoff,美国宾夕法尼亚大学遗传学系与生物学系教授
Eske Willerslev,丹麦哥本哈根大学地质遗传学中心主任,英国剑桥大学动物学系讲席教授,英国威康信托基金会桑格研究所副研究员
 
编译:汪鸿儒,遗传学博士,中科院古脊椎动物与古人类研究所古DNA实验室博士后
 
审校:王传超, 人类学博士, 美国哈佛大学医学院遗传学系、德国马普人类历史科学研究所博士后
 
原文标题“Tracing the peopling of the world through genomics”,2017年1月19日发表于《自然》(Nature)杂志。《知识分子》获作者与《自然》授权编译。
 
原文链接:http://www.nature.com/nature/journal/v541/n7637/full/nature21347.html
推荐 3