汉族基因单一?汉族人基因表明未必如此!

2024.03.15 责任编辑:陈醒 阅读量:481

2024年2月,贵州医科大学在《遗传》上发表了一篇基于Y-SNP和Y-STR揭示汉族人群父系遗传关系的研究报告。该报告通过统计Y-SNP单倍群频率、Y-STR单倍型多样性,使用PC(principal component analysis, 主成分分析)、系统发育树、单倍型网络等分析,综合Y-SNP和Y-STR两个反映不同时间尺度的遗传标记,以全局视角下的汉族人群父系遗传结构研究不同地区汉族人群之间的遗传分化、汉族人群与其周边少数民族的遗传关系[1]。
表1 O-M175下游 亚单倍群呈现地域差异化分布

1.Y-SNP单倍群在不同地区汉族人群中的分布差异

主干单倍群在不同地区汉族的分布频率如图1所示


红色字体代表其下游单倍群频率的加和
基于89个Y-SNP[2],16个汉族人群共观察到63个不同的末端单倍群。主干单倍群在不同地区汉族的分布频率如图1所示,东亚地区高频分布的单倍群O-M175、C2-M217、N-M231、D1-M174占汉族人群父系单倍群的88%以上。
单倍群O-M175是汉族人群主体单倍群(青海汉族60.53%~广东汉族92.7%),其中,青海汉族O-M175单倍群分布(60.53%)较其他汉族(67%~92.7%)低。

2.Y-STR单倍型多样性和基因多样性

16个单拷贝Y-STR基因座中汉族群体的HD(haplotype diversity, 单倍型多样性)均高于0.99,HD及DC(discrimination capacity, 鉴别能力)为1的汉族人群均分布于中国北部(分别为黑龙江汉族、辽宁铁岭汉族、山西汉族),且北部汉族HD值普遍高于其他地区(表2)。


在1830份汉族样本中共检测到60个中间等位基因、2个空等位基因和9个拷贝数变异,16个Y-STR基因座在汉族人群中的GD(genetic diversity, 基因多样性)值介于0.292(DYS391)到0.84(DYS458)之间(图2),其中DYS458、DYS635、DYS389II、DYS392、DYS19、DYS448、DYS390等基因座在各地汉族人群中基因多样性普遍较高,GD值均高于0.6。


3.不同地区汉族人群遗传关系及遗传分化

不同地区汉族人群Y-SNP遗传关系及遗传分化

基于不同地区汉族人群的Y-SNP单倍群频率的主成分分析(PCA)结果见图3A。为了进一步观察群体间的遗传分化关系,基于16个Y-STR的16个汉族人群遗传距离RST值构建系统发育树见图3B。


A:不同地区汉族人群 Y-SNP 单倍群频率 PCA 图;B:不同地区汉族人群 Y-STR 系统发育关系图。
在第一个主成分上显示了北部汉族、中部汉族和南部汉族三个明显的遗传聚类簇,这与地理分布关系一致。北部汉族聚类紧密,而南部汉族聚类相对松散,表明南部汉族彼此之间的遗传分化程度比北部汉族大。西部汉族呈现明显的遗传差异,西南与中部汉族聚集在一起,西北地区的青海汉族与其他汉族人群显示出明显的遗传分化。
不同地区汉族人群单倍型网络分析

为了观察同一单倍群下Y-STR单倍型的个体关联,本研究选取了汉族人群主要分布的O2-M122单倍群的两大亚支及O1a-M119单倍群下的Y-STR进行了网络分析见图4。在网络图中观察到特定区域汉族的聚集分布,显示群体间单倍型共享的节点。



总结

中国是东亚地区最大的国家,这里有全世界人口最多的民族——汉族,汉族属于汉藏语系的汉语族人群,主要分布在中国东部,在西部主要与其他语系人群杂居在一起[3]。大量的遗传学研究报道汉族人群起源于黄河流域的仰韶文化,并随着农业的驯化,仰韶文化由中原地区逐渐向西向南及向北迁移、定居,并与各地少数民族交流融合[4]。


本研究检测了362个汉族样本89个Y-SNP、16个Y-STR数据[2],并与从文献中收集的1468名汉族样本89个Y-SNP和16个Y-STR数据进行整合,单倍群分类结果显示基于汉族人群Y-SNP单倍群频率的PCA及的系统发育树结果显示汉族人群主要包括北部、中部及南部三个聚类簇,为汉族群体的父系遗传结构提供了遗传证据,另外发现来自青海的汉族与其他汉族在单倍群频率PCA上有明显的遗传分化。对汉族与中国其他人群父系遗传关系的研究表明,中国群体父系遗传结构与语系语族分类和地理划分高度一致,不同地区汉族人群与蒙古语族、突厥语族、藏缅语族、侗台语系人群和回族等少数民族人群相比,汉族人群之间遗传亲缘性更强,且可以观察到南部汉族与南部少数民族之间遗传交流更频繁。综上,中国族群的Y-SNP系统发育树结合Y-STR单倍型、地理来源不同的汉族群体遗传证据,对研究汉族群体的人群亚结构是必不可少的。未来可纳入更多地理区域的样本和更多的遗传标记集,进一步探索精细人群遗传结构并提高Y染色体遗传标记在法医学领域的应用价值。




[1]朱信, 黄江. 基于Y-SNP和Y-STR揭示汉族人群父系遗传关系[研究报告]. Hereditas (Beijing), 2024.02, 46(2):149-167. 
[2]Lang M, Liu H, Song F, Qiao XH, Ye Y, Ren H, Li JN,Huang J, Xie MK, Chen SJ, Song MY, Zhang YF, Qian XQ, Yuan TX, Wang Z, Liu YM, Wang MG, Liu YC, Liu J, Hou YP. Forensic characteristics and genetic analysis of both 27 Y-STRs and 143 Y-SNPs in Eastern Han Chinese population. Forensic Sci Int Genet, 2019, 42: e13–e20.
[3]蔡晓云. Y染色体揭示的早期人类进入东亚和东亚人群特征形成过程[学位论文].复旦大学, 2009.
[4]Yu XE, Li H. Origin of ethnic groups, linguistic families, and civilizations in China viewed from the Y chromosome. Mol Genet Genomics, 2021, 296(4): 783–797.

返回上页
意见反馈

类型

联系方式

内容

DNA鉴定

根据孟德尔遗传定律(亲子鉴定的理论基础),孩子身上的遗传物质一半来自于生物学父亲(简称“生父”),一半来自于生物学母亲(简称“生母”),每个基因座上的两个等位基因也分别来自生父和生母。DNA亲子鉴定就是根据科学技术将子女的DNA信息与父亲、母亲的DNA信息相比对,如果符合即是亲生关系,不符则非亲生。

蓝沙生物依托自主研发的多项国家专利技术,向广大社会公众提供准确、可靠的亲子关系鉴定服务。蓝沙实验室采用高通量测序技术,并配备市面先进检测设备;为确保结果的准确性,实施了包含样本质检、生产质检、报告质检三层质检流程,结合生物信息分析与计算机数据分析技术,对检测过程进行严格的质量监控和比对,确保每一位客户都能得到精确可靠的鉴定结果。