摘 要:不同于西方民族国家,中国的各民族之间有着千丝万缕的联系,组成天然而紧密的中华民族共同体。现代人在东亚已繁衍了近5万年,最初从事狩猎采集的原始人群如何聚合成民族系统、演化出文明,这是研究中华民族共同体起源的关键问题。从多个学科的视角可以观察到,东亚现代人群呈现明显的“五瓣”内部结构:在语言学方面,主要有汉、藏缅、阿尔泰、侗傣、苗瑶语系(族);在考古学方面,主要有红山、仰韶、高庙、龙山、良渚文化;在古史传说方面,《尚书序》等认为中华民族起源于伏羲、神农、黄帝、少昊、颛顼五大部族;在遗传学方面,Y染色体最大的扩张单倍群是Oα、Oβ、Oγ、C2、O1a。以DNA为纽带,可以大致串联起上述视角,揭示中华民族共同体起源于五大原始族群在新石器时代中晚期的融合与演化。
关键词:中华民族共同体;民族起源;遗传谱系;语系;新石器时代
中华民族是一个共同体,这是目前学界的共识。然而,对这个共同体的起源,学界存在巨大的分歧。某些学科认为中华民族共同体是近代建构的概念,但大量的人类学实证研究,特别是在中国人群的遗传结构和考古文化区系中体现的规律性,都将中华民族共同体的起源指向上古时代。在20世纪的研究中,中华文明的上古史部分因为时代久远且缺少明确的文字材料,加之有效的科学研究极其匮乏,所以从不同学科的视角往往无法得出相互兼容的结论,在学术界引发了诸多争议。近年来,随着人类学各个领域的快速发展,基因组学和表型组学技术推动了领域之间的交流与融合,形成了现代人类学结合多学科成果展开交叉研究的新动态,对诸如民族起源之类的人类学问题有了全新的解析度,重新解读中华民族共同体起源问题的时机也逐渐成熟。本文试图整理科学逻辑和证据,总结目前可能得出的结论,以推动学术界进一步讨论中华民族共同体起源问题。其中,上古史的科学逻辑遵循人类进化和社会发展的客观规律,而科学证据必须综合遗传学、考古学、语言学、民族学、神话学等所有自然和人文相关领域的有关数据。如果将这些证据系统地整合起来,我们会发现过去错位的研究结果似已基本重合,中华民族共同体的起源应追溯到新石器时代。
一、现代人类学的研究范式
早期的人类学与动物学、植物学以及矿物学相似,作为博物学的一个分支出现,致力于对全世界“人种”的多样性进行收集、整理和分析,主要使用生物人类学的研究方法。迄于近代,为了更加细致地梳理和分析人群关系,人类学发展出了使用不同研究方法的四个分支:生物人类学、考古人类学、语言人类学和文化人类学。然而,各分支之间的交流并不充分,常常从不同角度得出不同的研究结论。
目前,人类学前沿已经进入一个多学科交叉融合研究的新阶段。王士元先生提出,研究人类学与人类起源的问题应从三个角度切入——语言文化、化石考古与基因遗传。只有综合地从上述三个角度分析人群与人群之间的结构和关系,才能全面地理解人群演化、迁徙与交流的历史。若只从单一的学科角度入手,则无异于盲人摸象,得出的结论难免具有片面性。
2016年,Science杂志对本实验室做了题为“Bringing Legends to Life”的专门报道,虽然某些历史学家对现代人类学的解析度提出质疑,但是学界肯定了将遗传学、历史学和考古学结合起来的现代人类学的研究范式,并给予了高度评价。现代人类学作为人类学全新学术发展阶段的产物,融合了大量学科的研究成果,尤其是以人类基因组学为基础的研究成果。同时,现代人类学结合了历史学、组学和大数据的研究方法,使研究结果更具系统性、全面性。作为跨领域交叉学科,现代人类学力求从不同角度探索人群的结构,并以综合的视角进行归纳和总结,通过相互印证,全面地分析人类学问题。可以毫不夸张地说,只有基于现代人类学的研究思路和现代学科的分析方法,我们才有可能真正理解整个人类演化的历程与脉络,并进一步理解东亚族群起源和发展的整体过程。
二、东亚现代人群的“五瓣”内部结构
从现代人类学的角度出发,在东亚现代人群中可以观察到相似的“五瓣”结构,涵盖语言学、考古学、古史传说和遗传学四个层面。值得注意的是,这些相似的结构虽然并不一定完全对应,但存在较为明显的相关性。
在语言学方面,东亚地区存在汉、藏缅、阿尔泰、侗傣、苗瑶五个具有代表性的语系(族)。在考古学方面,新石器时代发展程度最高、最为辉煌的五种考古学文化是红山文化、仰韶文化、高庙文化、龙山文化和良渚文化,这五种考古学文化分别形成于辽河流域、黄河中游、长江中游、黄河下游和长江下游,张忠培先生将以上五个区域的考古学文化序列群确定为中华文化的五大文化基因谱系。这些区域性文化虽然彼此存在关联和交流,但同时在更大程度上拥有独立而明确的文化特征。在古史传说方面,中国上古有五个排名在最前的神帝,《周易·系辞下》列举了包牺、神农、黄帝、尧和舜的名号,《三统历谱·世经》根据五德相生说,构建了木德太昊、火德炎帝、土德黄帝、金德少昊、水德颛顼的帝王系统。此后经过早期经学家的研究,形成了《尚书序》中伏羲、神农、黄帝、少昊、颛顼的排列顺序。而在遗传学方面,也能观察到五个经历过迅速扩张的Y染色体谱系:其中三个属于O2单倍群,用α、β、γ标志;另有北方的C2单倍群和南方的O1a单倍群。以上五个类群曾在中国迅速扩张,是中国人口中占比较大的主要类群,其他单倍群的占比则相对较小。
可以发现,“五瓣”结构在语言学、考古学、古史传说和遗传学四个层面上都于现代东亚人群有所体现,其重要价值不言而喻。因此,有必要围绕这一结构进一步展开多角度、多层次、多领域的考察与验证。
三、Y染色体:家族与人群的标记
为了更好地聚焦于语言学、考古学、古史传说和遗传学这四个维度共同的研究对象,我们需要充分利用DNA构建的人群遗传谱系,以发挥其纽带作用。然而,人类基因组中不同区段的DNA存在功能性和遗传模式的差异,选择适当的区段作为人群的遗传标记对后续分析至关重要。
首先,这种遗传标记不应受到环境压力的强烈选择,即当处于不表达蛋白质的无功能区段。功能区段上基因产生的突变受到自然选择作用,相对较为保守,同时受不同地理环境因素的影响较大,这种定向的选择作用在一定程度上会掩盖由于随机突变而产生的群体间的遗传差异。相对来说,无功能区段上的突变更加随机、自由,这些突变以一定速率在人群演化的历史中积累,而不会被环境淘汰。利用两个群体之间无功能区段上积累的突变差异,可以计算不同群体的分化时间,从而推测人群的历史。
其次,这种遗传标记的遗传模式应易于分析并契合历史背景。常染色体的同源染色体之间存在遗传重组,每一个世代都在不断融合,包含该个体所有(父系和母系)祖先的信息,其遗传模式呈现为一个极其复杂的网络结构,并不能追溯到某一个具体的祖先个体,分析起来较为困难。Y染色体则不存在网络式的遗传模式,可用于追溯纯父系的祖先。同时,自新石器时代以来,东亚地区的社会结构以父系社会为主。因此,选择父系遗传模式的遗传标记更能贴合历史传承的背景,从而更好地解决现实的科学问题。
Y染色体的男性特异区段(the male-specific region of the Y chromosome,MSY)由于具有严格遵循父系遗传和受自然选择作用较小的特点,是研究父系社会中家族与人群演化历史的良好工具。近年来,已经有许多使用Y染色体标记解决人类学与历史学问题的案例。例如,本实验室团队从2009年起对曹操及其后代家系的Y染色体单倍型进行了系统性研究,最终根据曹操后代家系的现代数据和曹操叔祖父曹鼎的古DNA数据确定了该家族的单倍群归属为O2-F1462,佐证了曹操之父为族内过继而非外族过继的历史事实,解开了曹操的身世谜团。
在全人类的尺度上,利用Y染色体能够稳定父系遗传、适于构建清晰的树状谱系的特性,则能够解答与现代人类起源、发展以及迁徙相关的重大人类学问题。通过对全世界男性的Y染色体区段进行谱系分析,可以得到一棵巨大的Y染色体谱系树,再现了现代人群的发展历程。目前绘制出的Y染色体谱系树根植于20万年前,当时分化出来的A00型现今仅存于西非喀麦隆西北部山区的一个亩巴(Mbo)人村落中,14万年前分化出来的A0型现今仅在喀麦隆南部的俾格米人、阿尔及利亚的柏柏尔人和加纳人中出现,而12万年前分化出来的一系列分支则形成了现代人的几个主流分支。在这些分支中,可以明确地先分出A型这一大类,然后是B型、E型和D型,C型和F型,F型下游又可细分出G、H、I、J、L、T、K等类型。这些类型的分化时间较长,对应着十分明确的地理区域,进而对应着全世界不同的人类地理种(见图1)。人类地理种并不等同于种族,并非社会学概念,其产生以人类对不同气候、地理环境的长期适应为基础。这种长期适应伴随着对基因组上某些突变的定向选择作用,从而造成了不同人群形态、代谢特征的明显差异。
图1 现代人Y染色体谱系树及其人类地理种起源
资料来源:笔者自制
旧石器时代人类地理种之间的长期隔离发展,使有效群体最小的Y染色体漂变为完全不同的类群。因此,Y染色体类群与人类地理种形成了最强的关联度。全世界现存八个人类地理种,分别是布须曼人、俾格米人、尼格罗人、尼格利陀人、澳大利亚人、高加索人、蒙古利亚人和亚美利加人。这些名称沿用了人种学的旧称,定义却已然不同。尽管Y染色体现今在各个人类地理种之间存在交流,但各个人类地理种的主流类型仍有一定差别。
四、东亚的语系族群
分子人类学研究发现,全世界的人群大约于20万年前起源于非洲,并于7万年前走出非洲。走出非洲的起因可能是多峇巨灾——7.4万年前,印度尼西亚苏门答腊岛北部多峇火山超大规模爆发引发的巨灾使人群数量骤减,非洲之外的智人亚种(尼安德特人和丹尼索瓦人)濒临灭绝。灾后非洲幸存的现代人(晚期智人)从东非大裂谷走出,才开始向全世界各地分散,占领其他亚种空出的地区。因此,可以观察到人类走出非洲部分的谱系树根位于7万年前。这些人群扩散到世界各处后,适应不同的气候环境,形成了八个人类地理种,其中东亚的人类地理种于4万年前形成。
在Y染色体谱系树上,除了4万年前的O单倍群,还能观察到5万年前进入东亚地区的D单倍群、6万年前进入东亚地区的C单倍群以及3万年前进入东亚地区的Q单倍群。这些类型实际上源于不同的人类地理种,它们都曾分布在东亚地区,甚至留下大量的骨骸。例如,根据考古发现,在沿江、沿海的贝丘中出土的大量骨骸多属于澳大利亚人,而尼格利陀人则一度活跃于青藏高原和东南亚的密林中。蒙古利亚人于4万年前从南方进入东亚地区,并迅速扩散为优势种。欧罗巴人从西方进入东亚地区的时间较晚,大约始于4000年前,而且在东亚人口中所占比例较低。
在旧石器时代,人群虽然有语言,但并没有形成语系,语系的形成是在新石器时代。在整个东亚地区,我们可以观察到九个主要语系(超语系):阿尔泰超语系(目前争议较多,可能包括朝鲜语和日本语)、古西伯利亚语系(可简称为古亚语系)、叶尼塞语系、乌拉尔语系、汉藏语系、苗瑶语系、南亚语系、侗傣语系和南岛语系。一个语系的形成,既源于其内部的发生学,也与同其他语系的接触和交流有关。因此,从不同角度分析可能会得出某些语系应合并为同一个语系,或某一个语系应拆分为两个语系的不同结论。例如,有观点认为可以将苗瑶、南亚、侗傣和南岛四个语系合并为南方(Austric)语系,也有将苗瑶和侗傣语系归入汉藏语系的观点。这些不同的观点可能并不相互矛盾。
从Y染色体的角度来看,上述九个语系之间存在近乎两两一对的相似性(见图2)。例如,古西伯利亚语系和叶尼塞语系的关系非常近,其对应人群的Y染色体Q单倍群比例较高。乌拉尔语系和汉藏语系尤其是汉语族关系非常近,其对应人群的N单倍群比例较高。苗瑶语系和南亚语系、侗傣语系和南岛语系的关系也非常近,而且研究发现遗传相似性高的两个语系之间的同源词比例也高。同一语系内部群体的遗传关系非常接近,Y染色体的单倍型比例几乎一致——尽管分化时间较早,但满-通古斯语族和蒙古语族的Y染色体类型大致相同,频率差异不大,而突厥语族的核心单倍型虽与满蒙族群一致,在比例上却有显著差异。汉语族和藏缅语族的Y染色体单倍型比例几乎一致,反映了汉藏同源的历史事实。在苗瑶语系人群中,O2-M7这一单倍型类群较多,在南亚语系人群中也存在类似情况,体现了苗瑶语系人群和南亚语系人群的遗传联系。侗傣语系人群的独特性表现在O1-M119类型的比例较高,而南岛语系人群的O1比例更高,与汉藏语系人群之间的遗传差异更大一些。以上现象表明,Y染色体单倍型比例在一定程度上反映了东亚族群之间遗传关系的远近。
图2 东亚诸语系人群的遗传相似性
资料来源:笔者自制。
注:图中数值单位均为万年,编号均为族群分支中的主要Y染色体单倍群。
根据以上关于Y染色体单倍型的比较,可以大致描绘东亚人群在遗传上的分化过程。东亚人群整体起源于4万年前。近3万年前,侗傣的祖先人群开始分化。近2万年前,苗瑶和汉藏的共同祖先分化为苗瑶和汉藏的祖先人群,之后汉藏祖先人群再分化为汉和藏缅人群,汉人群又与满蒙人群、芬兰-乌戈尔人群频繁接触。这些远古群体在分化之后仍长期存在基因交流。
然而,以上分化过程并不能反映语系的分化过程。正如上文所述,由于人群只是自由扩散,缺乏交流,故而在旧石器时代只存在孤立的语种,不同语种之间的关系非常遥远。语系的产生与新石器时代的农业起源有密切联系。
五、农业起源与语系形成
多峇巨灾爆发后,全球进入末次冰期。1.2万年前,末次冰期结束,全球气候转暖,温带地区变得非常适合人类居住与活动。动植物开始大量繁殖,大大增加了人类的食物来源,促进了人口增长,尤其是从事采集活动的女性人口的增长。人口增长后,技术和文化开始有了传承和发展,采集活动也进一步演变为从事种植活动的农业。
约1万年前,东亚地区的农业与西亚地区几乎同时起源。稳定产出的粮食在进一步促进人口增长的同时,还使劳动者不再需要为了采集和狩猎奔波,有了更多打磨石制生产工具的时间,为新石器时代的开启奠定了重要基础。而更精细、先进的生产工具又进一步提升了生产力,形成了一个正循环:食物充足—人口增长—人群聚合—文化圈逐渐形成。同一个文化圈的人群逐渐产生了相同的语言、文化、信仰和社会规则,民族也逐渐形成。随着越来越多的人群聚合,社会阶级与规章制度逐渐产生,初级的国家形态诞生,文明自此起源。
在中国,南方的水稻(大米)和北方的粟(小米)是对语系形成产生重要影响的两种农作物。目前发现水稻可能最早起源于湘赣地区,并在沅江流域形成规模,此可追溯到至少1.4万年前;而粟被驯化的最早遗迹位于北京郊区永定河畔的东胡林遗址,该遗址是中国北方农业十分重要的起源地,可追溯到1万年前。此后,浙江的上山文化、甘肃的大地湾文化也都出现了农业起源,只是其驯化的作物种类可能有所不同,如籼米、糯米、黄米等。水稻和粟这两种重要的农作物的起源决定了彼时中国农业区的数量,而农业区的数量又决定了关键语系源头的数量。
从考古学的角度来看,东亚地区的考古学文化主要可分为五大区系,红山文化、仰韶文化、高庙文化、龙山文化和良渚文化分别是其巅峰期的代表。对这些区系出土的人类骨骸进行Y染色体单倍型的调查,结果显示不同区系的人群的Y染色体单倍型比例亦不相同,与现代的语系族群的主流类型存在关联。例如,在良渚文化遗址出土的人类骨骸中检测到大量的O1-M119类型,该类型也主要存在于侗傣语系、南岛语系人群中。因此,长江中下游的新石器时代文化可能与这两个语系的起源有关。以遗传工具为纽带,可将古代与现代的人群、考古学文化与语系联系起来,从而以历时性的方式理解中华民族共同体的演变进程。
六、中华民族的血脉共祖——三至五个扩张谱系
当人群聚合成文明和族群时,社会阶级与规章制度的形成导致了统治者的出现。在婚姻、家庭以及相关社会规则尚未获得充分发展的时代,相较一般人而言,统治者享有更加特殊的生育权,能够拥有更多的后代。因此,他们的Y染色体谱系会迅速扩张,甚至在人口中占有很高比例。尤其考虑到当时人口稀少的特殊情况,一个男性的后代数量迅速增长会在现代人群的遗传结构中留下极其深刻的印记。
2014年,本实验室团队对全中国人群的Y染色体单倍型进行了谱系树构建,观察到三个较大的、迅速扩张的类型,这三个类型的后代在现代中国人口中所占比例高达40%。每一个类型都在三至五代之内迅速扩张,产生了成千上万的后代。可以推测,这三个人的生育特权可能是其统治者地位赋予的。上古时代的统治者在历史发展过程中往往因各个时代人们的不断推崇,地位越来越高,成为带有神话色彩的古史传说人物。对这些人物的尊崇和考证,在古代成为经学的一部分。《周易·系辞下》载:
古者包牺氏之王天下也,仰则观象于天,俯则观法于地,观鸟兽之文与地之宜,近取诸身,远取诸物,于是始作八卦,以通神明之德,以类万物之情。作结绳而为网罟,以佃以渔,盖取诸离。包牺氏没,神农氏作,斫木为耜,揉木为耒,耒耨之利,以教天下,盖取诸益。日中为市,致天下之民,聚天下之货,交易而退,各得其所,盖取诸噬嗑。神农氏没,黄帝、尧、舜氏作,通其变,使民不倦,神而化之,使民宜之。
这里列举了包牺、神农、黄帝、尧和舜五位上古帝王的名号。《尚书序》也非常明确地将中国最早的三个祖先定为伏羲、神农和黄帝。因此,可以进一步推测并建立假说,现今在遗传谱系中看到的三个迅速扩张的类型可能与这三位上古统治者之间存在对应关系,而人群的扩张又势必与语系的形成有关,因为语系需要稳定的人群进行传承。为了厘清这三个谱系的时空线索,必须将语言学、考古学、古史传说和遗传学充分串联起来,同时尽可能地找寻这三位统治者的陵墓,测得其骨骸中的遗传信息,同上述考古学文化进行比对,探索这些遗传信息与现代人群的联系。
第一个谱系起源于始建于6800年前的湖南城头山古城。对城头山古城6300年前的统治者的骨骸进行取样检测,发现属于第一个扩张的Oγ类型。城头山古城遗址虽然主要属于大溪文化,但其下层起源于高庙文化,因而我们倾向于认为第一个扩张的类型源自高庙文化。一方面,高庙文化以点刻有各式各样花纹图案的白陶为特征,其中出现了大量八角星图案,如汤家岗遗址出土的浮雕印纹白陶盘(M43:1)外底便点刻有八角星图案,其内部有一个以陶盘中心为对称中心的正四边形,正四边形中还有一个近似“卐”字的纹样。这种八角星图案与湖南南部汉族、瑶族等群体所画的八卦图案十分接近,同水族巫师所传的算卦书籍(如《水书·八山卷》)中的八卦形状也很相似。湖南省文物考古研究所在对高庙文化陶器图案进行深入分析后,提出最早的八卦观念源自7800年前的洪江高庙遗址,这可能就是伏羲演八卦传说的历史背景。另一方面,高庙文化的陶器上还装饰有大量凤鸟图案,而“凤”字又与“风”字存在语义上的紧密关联,如王国维便认为甲骨卜辞“假‘凤’为‘风’”。考虑到传说中伏羲的姓氏为风,推测凤鸟可能是与伏羲氏族相关的文化符号。八角星、凤鸟等文化符号在现代苗瑶族群的艺术作品中亦屡见不鲜,如苗族的织锦、刺绣常出现八角星图案,这可以初步说明伏羲和高庙文化、原始苗瑶语族人群之间存在关联。
第二个谱系与6500年前达到巅峰的仰韶文化有关。河南濮阳西水坡遗址是仰韶文化的一部分,该遗址有一座6400多年前的墓葬(45号墓)。墓主头朝南方,其身周遭有几处蚌壳摆塑的图案,东方为苍龙,西方为白虎,北方为北斗,南方很可能是代表南宫七宿的动物(该墓葬还发现有近似朱雀的图案,虽未载入考古发掘报告,但在西水坡遗址博物馆展出了相关照片)。这一现象反映了当时天文观测的实践和理论已经十分成熟,既对后世中华民族的文化要素产生了深远影响,又提示我们这些文化要素的形成年代很可能比传统认为的春秋战国时期更早。作为国家博物馆的展品,西水坡45号墓墓主的骨骸虽然尚未经过DNA检测,但是在许多时代更晚的仰韶文化高等级墓葬的墓主骨骸中已检测出较多Oβ类型,说明其同为此类型的可能性很大。此外,仰韶文化出现大量绘有各式图案的彩陶,其中以人面鱼纹图案的陶盆最具代表性。在人面鱼纹图案中,人面上有锥形凸起似螺,类似藏族文化中的双鱼捧螺图案;到了马家窑文化时期,上孙家寨遗址出土的舞蹈纹彩陶盆上描绘的舞蹈与现代藏族的锅庄舞亦颇为相似,展现了藏缅族群的文化特征。由于马家窑文化与仰韶文化有相似的彩陶传统,二者关系紧密,故而有理由相信,藏缅语族人群是仰韶文化的主要继承者之一,其起源甚至可以追溯到仰韶文化的前身——磁山、裴李岗文化。这在语言学上也有佐证,Sagart等通过计算语言学的方法论证了汉藏语系的早期起源与磁山文化和仰韶文化相关,可见考古学和语言学对此是具有一致性的。
第三个谱系的起源与约5000年至5500年前属于红山文化的牛河梁遗址有关。该遗址由女神庙、积石冢和祭坛等建筑构成,16个积石冢大致排列成了轩辕星座的样式,值得注意的是最早、最大的积石冢的墓主,其Y染色体单倍型经检测属于第三个扩张的Oα类型。牛河梁遗址位于辽宁省建平县、凌源市的交界处,与《山海经》中“轩辕之山”位于“北次三经”的描述一致。牛河梁遗址第五地点的中心大墓出土了大量质地上乘的玉器,可见墓主身份之显赫。其中,在墓主胸部发现一件玉制鼓形箍,李文信先生认为这是束发的冠饰,即古代帝王佩戴的玉瑁,如《周礼·玉人》所言:“天子执冒四寸,以朝诸侯。”墓主的君王身份或可由此得以证明。红山文化对玉的大规模使用正是汉语族人群的一个标志性特征,玉雕的龙、凤更明确体现了汉语族人群的文化特征。此外,牛河梁遗址第十六地点出土的玉人、玉锥、玉环等还可能与早期的中医实践存在关联,而中医的起源亦可追溯至“岐黄之术”,这进一步证明了轩辕黄帝、红山文化、汉语族人群之间的联系。
综上所述,通过语言学、考古学、古史传说和遗传学四个维度的联系,我们有一定的理由建立相关假说——传说中的天皇伏羲氏、地皇神农氏以及人皇轩辕氏是真实存在、有具体历史背景的人物,他们传承下来的文化综合在一起,形成了中华民族共同体的精神内核。
除了以上三个最大的扩张谱系,我们还检测到数个较小的扩张谱系,其中在现代中国人口中占比较高的是C2-F1144和O1a-P203(可分别简称为C2和O1a)。它们扩张的时间稍晚,扩张地点分别在今天的山东和江浙地区,可能与三皇之后的两位上古统治者少昊、颛顼有关。
七、语系重组与中华民族共同体形成的历史过程
当然,语系的形成并非某一种考古学文化之功。在5300年前,发生了一次大规模的人群迁徙、融合、重组事件,使语系经历了深度重组,进而催生了现代的语系格局。这一重大人口事件的肇因很可能是传说中的涿鹿之战,标志着中华民族共同体开始形成。
从遗传结构的地理分布可见,约5300年前,第三个谱系开始扩张,逐渐扩散至中国各地。在考古学文化方面,可以观察到这一时期全国范围内的巨大变迁。辽河流域的红山文化向南扩张,河北北部曾出土红山文化玉龙。中原地区的仰韶文化向西迁移,并与大地湾文化充分融合,形成马家窑文化。在黄河中下游地区,龙山文化亦开始萌发。在长江以南,安徽的凌家滩文化、两湖地区的大溪文化以及江浙地区的崧泽文化衰落,取而代之的是屈家岭文化和良渚文化。全国范围内的考古学文化变迁伴随着大量的人群迁徙、文化融合和基因交流,开启了中华民族早期融合的新时期。
此后,在Y染色体谱系树上还可观察到数次内部扩张,可能与传说中的五帝相关。在距今5300年至4000年期间,新石器时代的五大族群——红山、仰韶、高庙、龙山和良渚人群进一步融合,不断巩固原始的中华民族共同体。因为上述人口事件始于红山文化南下,所以汉族的核心语言文化很有可能主要传承自红山文化,在历史发展进程中又不断与其他族群的语言文化发生融合与变异,因此形成典型的混合语特征。根据考古发现,这一时期最大的特征是全国各地出现了大量城邦,如位于杭州市余杭区的良渚古城已形成复杂的城市规划。良渚文化的玉器与红山文化和凌家滩文化的玉器存在一定相似性,可能与红山文化上层阶级的南迁和吸收凌家滩文化技术有关。如果这样的迁徙事件确曾发生,就必然引发汉藏语原始人群和侗傣语原始人群的聚合,这或可解释现在侗傣语中大量早期汉语同源词的来历。良渚文化还进一步对其他考古学文化产生广泛影响,如陕西神木市石峁遗址的皇城台大台基出土大量精美的石雕,其形象、风格颇具良渚文化特征,石峁文化区域内甚至不排除有直接来自良渚文化区域的玉器。在良渚文化的下层,崧泽文化人群可能受到了凌家滩文化(主要发源于高庙文化)人群的统治,因此高庙文化的八角星图案亦见于崧泽文化的陶器。在Y染色体谱系树上,还可观测到比崧泽文化更早的谱系分离及其随后的扩张,可能与马家浜文化上层人群的迁徙以及现代南岛人群的起源有关,而崧泽文化和良渚文化中的谱系向南方的分离则分别指向侗傣语系中的仡黎语族和壮侗语族。从大约4600年前开始,龙山文化逐渐形成并将其影响扩展至东亚绝大多数地区,甚至是东南亚地区,这一被考古学界称为“龙山化”的历程,可能就是中华民族共同体迅速成熟的过程。高度“龙山化”的群体最终融合成汉族的雏形,而迁入偏远地区并与当地族群融合的浅层“龙山化”群体则演化成了其他语族的人群(见图3)。其中,随着良渚文化逐渐向西北方扩散,齐家文化建立并发展至高峰。位于甘青地区的齐家文化人群通过青铜之路获得了麦作农业、家畜驯化、青铜冶炼、马车制造等生产与技术优势,并可能依赖这些优势最终入主中原、建立统一王权,从而开启中华文明的全新时代。这与夏朝的兴起过程非常一致。
中国的新石器时代文化在约6000年前出现了两个重要发展趋势:一是各区域性文化之间的互动增强,二是各区域性文化的内部发展更加复杂化。这一过程同时伴随着平等社会向区分阶级的复杂社会的转变,礼制与王权也应运而生。可见,在约6000年前,通过一系列错综复杂的人群迁徙和文化交流,中国各处的新石器时代文化人群逐渐聚集、融合,形成现代汉族人群的主要谱系。同时,这些古代人群亦与现代分属各语系的少数民族紧密相关,共同成为中华民族共同体时空框架的重要组成部分。为了深入解析和再现中华民族共同体起源的演化历程,我们必须掌握现代人类学的研究范式,综合利用语言学、考古学、古史传说以及遗传学的相关研究方法和证据,发展多组学分析技术,以进一步夯实中华民族共同体系“同根多元一体”的实证结论。
图3 中华民族共同体起源的简化模式
资料来源: 笔者自制。
注: 图中小圆内的名称为代表考古学文化系统的文化名称, 外圈的名称为族群或语族名称, 编号系统为相应族群中的主要 Y 染色体类型。
八、结语
综合以上各方面的证据,可以明确看到中华民族共同体的实体早在中华文明起源之初就已存在。在末次冰期结束后,中国出现了五个农业区,形成了湖广、中原、辽西、齐鲁、江浙五个考古区系。这五个考古区系陆续兴起并产生原始政权,在后来的群体记忆中可能演化成了伏羲、神农、黄帝、少昊、颛顼的传说。对遗址骨骸和当代族群的基因分析表明,中国各语系族群与不同考古学文化高度相关,各族之间也共享大量遗传类型和词汇语素。综合遗传学、考古学、语言学、神话学、民族学等学科的证据推测,从这五个考古区系的上古政权发源的原始族群在不断互动中形成了中华民族共同体,其中大部分人口融合为现代汉族,小部分人口迁徙到相对边远地区发展为少数民族。总之,中华民族共同体在新石器时代经由五大原始族群重组形成初级形态,后又通过各民族的交往交流交融形成中级形态,近代以来伴随各民族进一步紧密结合形成高级形态。今天中国的各民族实际上源于中华民族共同体的初级形态,中华民族共同体是先有实体、后有名称的。
原文刊于《中国社会科学院大学学报》2024年第4期,第5-22+140+145页,注释及参考文献从略,请见原文。
文章推荐:李鹤;图文编辑:张雅倩。