公司新闻

研究人员发布全基因组单核苷酸变异数据库

分类:公司新闻 作者: 来源: 发布:2019-11-06 21:54
  

图片.png

  10月22日,世界学术期刊Genome Biology 以PGG.SNV: understanding the evolutionary and medical implications of human single nucleotide variations in diverse populations 为题,在线宣布了中国科学院上海养分与健康研讨所/马普核算生物学研讨所徐书华团队根据20万人k8娱乐基因组的单核苷酸变异数据库——PGG.SNV(https://www.pggsnv.org)。PGG.SNV录入的基因组数据涵盖了800多个现存人类族群和来源于古DNA研讨的100多个已消亡人类族群,一共超越20万个基因组;因而在代表性人群数量和样本量上均超越现在被广泛运用的由西方学者主导的gnomAD数据库。PGG.SNV更明显的科学价值在于供给了人群、个别、基因和变异多个层面的种群遗传多样性和进化参数的估量,有助于更深化地解析人类基因组变异的功用和表型效应以及了解其进化和医学含义。

  该研讨经过全基因组深度测序技能新发生并搜集、整合公共人类基因组数据取得2.5亿以上人类单核苷酸变异(SNV),并进行了变异频率、基因多样性、集体分解、功用效应、进化保存性、天然选择信号、连锁不平衡等多方面的解析和注释。经过对人类孟德尔遗传疾病相关变异的频率剖析,该研讨发现7%的此前报导的稀有病危险变异在许多人群中处于高频状况,提示疾病剖析中骤变的稀有性不是确认该变异与疾病相关的金规范;孟德尔疾病骤变在不同族群中频率存在不同,标明不同族群的遗传负荷存在差异,因而用西方族群的基因组来研讨或猜测其他族群的骤变功用和疾病危险或许会导致误判。

  即便是关于大多数出于医学确诊或研讨意图或其他爱好只是需求简略查询基因变异频率信息的人来讲,PGG.SNV数据库也具有共同的优势。在医学遗传学范畴的实践中,人们往往经过骤变位点的频率比较剖析来挑选并判别骤变是否或许致病。其潜在假设是孟德尔疾病相关的致病骤变在天然人群中是稀有的。比较广泛运用的查询骤变频率的数据资源为根据全基因组信息的千人基因组数据集和gnomAD数据库以及根据外显子测序的ExAC数据库。但是以它们为仅有参阅来研讨骤变的频率或许存在以下问题:首要,以上基因组数据资源均未能很好地掩盖代表人类族群的多样性;其次,gnomAD和ExAC中将近一半的基因组来自西方人群,而遗传多样性最高的非洲人群的基因组只是占9%,东亚人基因组所占份额则更少,因而此库存在明显的西方白人族源偏向性;再次,gnomAD数据库主要以大洲对人群进行分类,而短少基因组对应的族群信息。举例来讲,因为缺少代表性亚洲人群的数据,gnomAD将亚洲人群分为“韩国人”、“日本人”和“其他东亚人(other East Asian)”,因而它不能准确反馈给用户每个族群的骤变频率信息。尤其是当研讨目标为特定的亚洲人群时,gnomAD和ExAC并不是适宜的参照数据集,关于亚太地区的研讨者来讲实践使用价值存在较大的局限性。

  实践上,亚洲人群的人口数量和族群多样性远高于欧洲人群。PGG.SNV数据库更好地掩盖了现在西方学者主导的数据库所缺少的东亚和东南亚人群的基因组数据。除了广泛搜集和录入了800多个现代人族群和100多个古人族群组成的20万人以上基因组骤变以外,PGG.SNV数据库还包含了新测得的来自东亚和东南亚的16个族群共1009个全基因组测序的骤变信息。这些信息在我国以及周边国家的实践使用中更具有参阅价值。因而PGG.SNV数据库的发布关于我国及周边国家人群的进化遗传和医学研讨具有迫切性和必要性。

  为了便利微信用户经过智能手机查询特定的变异信息,PGG.SNV数据库一起开通了配套的微信大众号“PGGbase”,大众号内供给查找服务,实时获取变异位点在各集体中的频率信息,并在线生成频率散布地图,为手机用户供给一个简洁方便的查询途径。

  考虑到全球人类基因组数据资源开展不平衡以及我国和周边国家的人类遗传资源管理方针改变,未来PGG.SNV基因组变异数据库的开展将经过广泛协作、要点录入和整合我国和亚洲的人类基因组数据,从(1)继续添加样本量和数据质量、(2)进步样本的族源多样性、(3)注重和加强亚洲人群代表性、(4)提高查询和剖析功用以及信息同享等四个方面进一步完善和保护。

下一篇:没有了
-

Copyright © 2013 k8娱乐k8娱乐-k8娱乐登录 All Rights Reserved