生命与健康大数据中心
生命与健康大数据中心(BIG DataCenter;简称BIGD)是研究所科研、支撑体系的一部分,其发展目标为面向我国人口健康和社会可持续发展的重大战略需求,围绕国家精准医学和重要战略生物资源的组学数据,建立海量生物组学大数据储存、整合与挖掘分析研究体系,发展组学大数据系统构建、挖掘与分析的新技术、新方法,建设组学大数据汇交、应用与共享平台,力争建成支撑我国生命科学发展、国际知名的生命与健康大数据中心。
生命与健康大数据中心目前拥有30余人的工作团队,具备5000个以上CPU计算核心及总容量超过8PB数据存储资源,已经开发形成一系列的多组学数据库系统,BIGD的主要致力于以下三方面的工作:
- 围绕中国人群普惠健康的精准医学相关组学信息资源,完善建立中国人群基因组遗传变异图谱,形成中国人群精准医学信息库
- 基于高通量测序的海量原始组学数据资源,建立符合国际标准的原始组学数据归档库,形成中国原始组学数据的共享平台
- 围绕国家重要战略生物资源,建立海量组学数据的整合、挖掘与应用体系,形成综合性的多组学数据库系统。
基本信息
网站名称 | 生命与健康大数据中心 |
资源类型 | 特色数据 |
网站分类 | 科学数据 |
国家地区 | 中国 |
收录时间 | 2018-11-12 |
网站地址 | http://bigd.big.ac.cn |
详细介绍
生命与健康大数据中心的定位与目标是,面向我国人口健康和社会可持续发展的重大战略需求,围绕国家精准医学和重要战略生物资源的组学数据,建立海量生物组学大数据储存、整合与挖掘分析研究体系,发展组学大数据系统构建、挖掘与分析的新技术、新方法,建设组学大数据汇交、应用与共享平台。中心主要涵盖以下三个部门:
原始组学数据部门 Branch of Genome Sequence Archive (GSA)
- 存储多种高通量测序的海量原始组学数据资源
- 建立符合国际标准的原始组学数据归档库
- 形成中国原始组学数据的共享平台
精准医学组学数据部门 Branch of Precision Medicine Omics Databank (PMOD)
- 整合公共个人组学数据,建立不同人群的基因组参考序列
- 完善建立中国人群基因组遗传变异图谱
- 形成中国人群精准医学信息库,为疾病的诊疗提供更为有效的方法
重要动植物组学数据部门 Branch of Animal & Plant Omics Databank (APOD)
- 围绕国家重要战略生物资源
- 建立海量组学数据的整合、挖掘与应用体系
- 形成综合性的多组学数据库系统
此外,还有专门的信息系统管理部门给予技术和服务支持
信息系统管理部门 Branch of Information & System Management (ISM)
- 负责网络以及系统基础设施的管理
- 管理和维护机房服务器,提供安全可靠的Web系统。
- 与其他部门协调,确保BIGD所有资源都始终安全可靠。
研究内容
生命与健康大数据中心(BIGD)的研究侧重于计算生物学和生物信息学中的基本科学问题,目的是将大型组学数据转换成重大发现。BIGD拥有包括生物信息学,分子生物学,计算机科学和数学等多学科的专家和科研人员。BIGD研究人员致力于海量数据的整合,开发先进的算法工具,从大数据中挖掘宝藏。
研究内容主要集中在以下几个方面:(1)基于高通量测序的海量原始组学数据资源,建立符合国际标准的组学原始数据归档库,形成中国组学原始数据共享平台;(2)围绕中国人群普惠健康的精准医学相关组学信息资源,建立中国人群基因组遗传变异图谱,形成中国人群精准医学信息库;(3)围绕中国人群普惠健康的精准医学相关组学信息资源,建立中国人群基因组遗传变异图谱,形成中国人群精准医学信息库。
基础设施
生命与健康大数据中心不断加强高性能计算与存储能力建设,截至2017年底,拥有150万亿次/秒的计算能力,约6800个计算核心,12PB的存储资源,1.5Gbps网络带宽,形成了国内领先的生物大数据云计算平台。支持国家重点研发计划、国家自然科学基金、中科院战略先导专项等60余个科研项目,为院内外16家科研单位的79个课题组提供数据储存与计算服务,平均每天活跃用户超过600人次。
合作项目
DogSD
- 中国科学院昆明动物研究所
IC4R
- 河南农业大学
- 华中科技大学
- 华中农业大学
- 内蒙古师范大学
- 北京大学
LncRNAWiki
- 沙特阿卜杜拉国王科技大学
RiceWiki
- 北京理工大学
- 华中农业大学
SorgSD
- 中国科学院植物研究所
附加资料
参考资料
