首页>寻医·问药>医讯同期声医讯同期声

最大规模中国人基因组学大数据研究成果发布———

从测算身高说遗传奥秘

2018年10月24日 09:46 | 作者:刘喜梅 | 来源:人民政协网
分享到: 

彩C2018-10-24zx501_P_1_446_647_1469_1228

刘斯洋、徐讯、金鑫(从左至右)在实验室

中国人乙肝病毒携带率更高?南方人免疫力更强?携带某种基因更容易怀上双胞胎?这些有关中国人群基因遗传的问题,如今都有了科学依据,相关研究成果日前发表在国际顶级期刊《细胞》杂志上。

这是一项由中国科学家主导,历时两年完成,迄今为止最大规模的中国人基因组学大数据研究成果。研究团队来自深圳华大,科学家通过对14余万中国人的无创产前基因检测数据进行深入研究,首次揭秘了中国人群基因遗传的诸多特征,填补了大规模中国人基因组学研究领域的众多空白。

■我国南北方人群部分基因频率有明显差异

“北方飘雪你穿着秋裤,南方的我正‘风餐露宿’。”一句调侃,道出了我国南北气候的差异。

不过我国的南北差异可不仅仅体现在气候上,也体现在人群的遗传规律上。但长时间以来,由于实验研究抽样不充分,导致我们对自身的遗传特征认识不多。

“你知道吗?受遗传背景和气候、饮食、病原体等环境因素带来的自然选择压力的影响,我国南北方人群在部分基因的频率上也呈现出明显差异。比如,一些免疫力相关的基因频率呈南高北低趋势,而部分脂肪代谢相关的基因正好相反。”该研究的主要负责人之一、华大生命科学研究院母婴研究所副所长金鑫博士告诉记者,借助14余万份基因检测数据,研究小组成功构建了包含904万个多态性位点在内的中国人基因频率数据库(CMDB),并在此基础上分析出差异化的南北遗传特征。

为什么北方人脂肪代谢率更高,而南方人免疫力更强呢?金鑫表示,可能是因为古代在中国北方、西北地区如新疆、青海和内蒙古等省份,蔬菜获取相对比较困难,因而生活在这些地区的人们肉类摄入比例较大。因此,促进脂肪代谢率的等位基因在这些地区呈现明显富集的趋势。而在古代,中国南方自然环境恶劣,病原微生物尤其是疟疾盛行,因此对于生存于该地区的人在免疫力方面有较高的要求。

基因频率的南北差异,还体现为南北人群疾病谱的不同。比如,南方人特别是两广和云南地区,地中海贫血(简称“地贫”)的发病概率较高,而北方人白化病的发病率更高。

“目前我们已经能够解释南方人‘地贫’发病率较高的原因。这一方面是因为自然选择,携带‘地贫’致病基因的人抗疟疾的能力较强;另一方面,则跟区域人群的祖源有关。也就是说,虽然中国南北方人有诸多相似但又有所不同,适应环境和祖先遗传是差异的主因。但关于白化病,目前我们的研究虽然发现了北高南低的遗传规律,却还不能给出充分的解释,需要进一步研究。”金鑫告诉记者。

发现了疾病谱的差异,卫生部门就可以根据疾病谱制定更加精准的公共卫生防控政策。“比如‘地贫’,利用基因科技的手段,其发病目前在云南和两广地区已经得到了很好的控制。未来,根据中国人基因频率数据库,会有更多地方制定更加精准的公共卫生防控政策,让更多地方病得到更好的防治。”研究成果第一作者刘斯洋博士向记者解释。

■测算身高或可成真

在构建中国人基因频率数据库的基础上,华大的研究团队还开展了多种表型的全基因组关联研究,发现了人的身高、体重、易怀双胞胎等表型与基因之间的关联。

研究成果的通讯作者、华大生命科学研究院院长徐讯博士告诉记者,通过数据分析,研究小组一次性发现并且验证了48个与身高显著相关的基因位点,以及13个与身体质量指数(BMI)显著相关的基因位点,包括这些位点在内的常见突变位点分别解释了48%的身高遗传率以及10%的BMI遗传率。随着研究的进一步深入,科学家和算法工程师有可能可以利用这些信息,构建一套适合于中国人的身高预测模型,从而通过基因数据推断出个人的身高情况。

“不过测算身高并不是科学研究的最终目的。但科学家在了解了基因跟身高之间关系之后,可为某些疾病的治疗提供更多参考依据。比如,在发现人的身高异常和基因突变的关联之后,科学家可能据此找出矮小症治疗的靶点或者跟骨质发育相关的一些新药靶标。当然,新药物的研发需要较长时间,但前期的这些科学发现,会给以后的科学研究增加更多辨识。”刘斯洋强调。

除了揭示身高体重的遗传特征,研究小组还对怀孕年龄和双胎怀孕两个表型进行了深入研究,结果发现了与怀孕年龄显著相关的基因位点。

“女性的生育年龄受社会因素和生理因素共同影响,其中基因起着关键作用。我们这次大样本的研究则发现,女性的生育年龄跟一个叫EMB的基因有关。EMB基因型不同的女性,生育年龄的高低存在差异。也就是说,一个人什么时候‘想’生,很可能要由她的基因说了算。”金鑫笑言。

实际上,基因除了能够影响一个人“什么时候想生”,还能影响这个人一胎能“生几个”。据刘斯洋介绍,母亲的NRG1基因不但影响甲状腺功能,还能影响生双胞胎的几率。如果这个基因表达量偏高,不但容易让人甲状腺素分泌增加,还容易让人怀双胞胎。“与此相关,一些双胞胎妈妈脾气暴躁,也许是因为NRG1基因表达量高导致的甲状腺素分泌高。”金鑫补充道。

■绘制中国人群遗传结构图,为精准医学“加码”

构建了中国人群的遗传结构图,也是本次研究的另一项重要贡献。

“根据研究数据,我们绘制了涵盖31个省份,包括汉族与36个少数民族在内的中国人群精细遗传结构图。实际上,绘制遗传结构图与绘制地图相似。不同的是,以前我们绘制地图是按照物理的位置去画,今天是按照基因的关系来画。遗传结构图既体现了汉族与少数民族群体的遗传结构特点,也体现了中国各省与欧洲、南亚、东亚人群的基因交流程度(或者说是通婚程度)。这些特点,证实了当今中国人的遗传特征,同时受到丝绸之路及近代人口大规模迁徙等因素的多重影响。”徐讯表示。

比如,甘肃以及靠近甘肃省的宁夏和青海等省份,汉族人群体中所含有的欧洲血统高于其他省份,达到全国平均水平的1.7倍。对此,研究团队的解释是,这些地区是古丝绸之路所经过的地方,作为曾经的文化和商业汇聚地,各种血统的人汇聚于此,因而也拥有了更多的繁衍机会。

中国人群遗传结构图的绘制,也为精准医学添加了“砝码”。

“精准医学实施的关键之一,是要明确所进行治疗或者诊断人群的基本基因特征。以往科学家的很多研究,比如药物的开发、疾病的诊断等,所使用的都是白种人的数据库和基因组,然后用很少量中国人的基因数据作为参照,其精准性就受到了中国科学家的质疑。以乳腺癌为例,众所周知影星安吉丽娜·朱莉在基因检测之后发现自己是高危人群,然后就采取了比较激进的肿瘤防治策略———切除了双侧的乳腺和卵巢。那么导致白种人发病风险提升的基因突变对中国人影响如何,是明显提高致病风险还是影响不大?这需要大数据来说话。因而在拥有中国人群的遗传结构图之后,未来精准医学针对中国人群的诊疗方案就能拥有更高分辨率,能够精准到每一个具体人群,这样就会有更多的人从精准医学中受益。”金鑫强调。

■首次揭示中国人病毒图谱

在这次发表的成果中,华大的研究小组还首次全面揭示了中国人病毒图谱。

根据病毒图谱科学家们发现,人体血液中携带的病毒也体现了高度的地域性。比如,中国人血浆的病毒组与欧洲人存在比较大的差异——在欧洲人群中排名前两位的病毒分别是与皮肤急疹相关的疱疹病毒7型,以及与鼻咽癌相关的疱疹病毒4型,而在我国人群中排在首位的则是乙肝病毒,其感染发生率大约为2.5%。

在分析病毒易感性和基因型之间的关系时,科学家们还首次发现了一个与疱疹病毒6型易感性极显著相关的基因突变。

“可能很多人都对疱疹病毒6型比较陌生,因为它不像艾滋病毒、SARS病毒、埃博拉病毒一样,常常直接危及人的性命。传统的研究也只是认为,这种病毒只会让婴儿和成人长皮疹、红斑,多数患者都会迅速痊愈。但就在今年6月,国外有研究团队发表论文表示,看似温和的疱疹病毒6型竟然与阿尔茨海默症显著相关。”金鑫表示,这项结果对阿尔茨海默症的研究也有重要的参考价值,如果研究结果能够进一步得到证实,会对阿尔茨海默症的防治和药物研发带来全新的机遇。

除填补了大规模中国人基因组学研究领域的众多空白,徐讯表示,华大的这项研究成果还有两项重要意义。“首先,这标志着生命科学产业已经从单个样本的检测和诊断,正式进入了基因大数据时代;其次,该研究也验证了基于大人群的精准医学研究已成为新的科研模式,对基因组学大数据研究具有开创性价值。未来,这些大数据深度研究或将在遗传病诊断、肿瘤研究、药物研发等领域得到广泛应用。”徐讯说。

值得一提的是,这是高水平国际学术期刊第一次认同在其上发表基因组学文章所使用的数据仅需保存于深圳国家基因库,而无需向境外数据库进行备份。这意味着国际学术期刊对我国遗传资源的充分尊重与认同,也代表着中国已经完全有能力与实力管理并保护我国重要的遗传资源。

编辑:赵彦

关键词:测算身高 遗传 基因

更多

更多