Categories

Recent Posts

生物医学数据挖掘:GEBA-I 1003基因组数据集

生物医学数据挖掘:GEBA-I 1003基因组数据集

一、背景信息:

该数据集来自 GEBA-I,属于 DOE JGI 的细菌与古菌基因组百科全书 (Genomic Encyclopedia of Bacteria and Archaea, GEBA) 项目。

GEBA-I 包含了 1003 个基因组(974 个细菌 和 29 古细菌类型菌株),其中 396 个基因组属于一个属的第一个测序基因组,极大扩展了微生物基因组系统进化多样性。

1003 个基因组的除了可以通过综合微生物基因组和微生物系统(Integrated Microbial Genomes with Microbiomes,IMG/M)获得数据,也可以通过 NCBI 的 Genbank 数据库获得基因组及其注释信息。

1003个基因组质量都很高,根据 CheckM (一款根据一组Marker基因评估基因组完整度的应用)的评估结果显示,平均基因组完整度可达到99.4%, 该数据集除了可以帮助更准确的鉴定菌株,对环境DNA样本测序的注释(功能和物种来源)也会有很大贡献。

菌株生境分布图, 包括了工业废弃物、人体、极端环境、陆地生物群落、土壤、污泥、食物、动植物的等。

菌株生境分布图

了解更多请参考GEBA项目可以参考下面两个连接:

Jonathan Eisen:GEBA pilot文章背后的故事 DOE JGI: GEBA项目主页

二、数据处理:

菌株信息

可以从 Nature […]

June 26th, 2017 | Category: Uncategorized | Leave a comment

About

Meta

June 2017
M T W T F S S
« Nov    
 1234
567891011
12131415161718
19202122232425
2627282930  

Blogrolls

Copyright © 2020 deepbiome.org - All Rights Reserved
Powered by WordPress & Atahualpa