2017 年 10 月 27 日,在深圳举行的第 12 届国际基因组学大会上,华大基因发布了百万中国人基因数据库 (CMDB, Chinese Millionome Database),为我国精准医学事业的发展做出了重要的基础性工作。 我国虽然是世界上人口最多的国家和第二大经济体,但是与欧美发达国家相比,中国人群基因数据库的构建却进展缓慢。目前全球样本量过万的人群基因数据库,如 ExAC、UK10K 等主要基于欧美白人群体构建,能代表中国人群的仅有千人基因组中的三百余个样本。该基础数据的缺乏严重制约了中国人群的遗传学研究以及精准医学事业的发展。 华大基因在保障知情同意、伦理审核并严格遵守《人类遗传资源管理办法》的基础上,整理了上百万中国人的全基因组测序数据,并开发了一系列新方法对这些数据进行高精度的分析,产生了迄今为止最大规模、精度最高的中国人群基因数据库。该数据库只体现抽象后的群体基因频率信息,对于个体信息完全脱敏,在推动科学研究的基础上充分的保护了个人隐私。 会议上,华大股份研发中心副总监金鑫博士对百万基因组数据库进行了详细介绍。百万基因组数据库目前所包含样本总数已超过两百五十万,样本来源覆盖我国所有省份,具有非常好的代表性。数据库存放于国家基因库 (CNGB, China National GeneBank),此次发布的为第一期——基于十四万人的基因多态性位点 (SNP) 和频率信息,共包括充分代表中国人群的八百五十余万高质量 SNP,其中 24% 是从未在已公开发布的中国人群基因数据库中被发现过的新 SNP。与千人基因组项目比较,CMDB 数据库解决了人群数目不足而导至的基因数据库精确度低以及抽样误差等问题。该数据库将在通过相关管理机构审批后开放检索,并持续维护升级,届时可通过 https://db.cngb.org/cmdb 访问。 这一高质量的中国人群基因数据库将成为我国罕见病、复杂疾病、癌症、药物研发等领域的重要基础设施,加快适用于中国人群的精准医学实现的步伐。
|