生物信息大数据数据库(NCBI、EBI、UCSC、TCGA)
想系統(tǒng)的學(xué)習(xí)生信數(shù)據(jù)庫可以先看一下北大的公開課,有一章專門講的數(shù)據(jù)庫與軟件:
1-生物信息學(xué):導(dǎo)論與方法 北大\10 生物信息數(shù)據(jù)庫及軟件資源
一個(gè)優(yōu)秀的生信開發(fā)者能夠解決如下問題:
- 如何鑒定一個(gè)重要的且沒有被解決的生物學(xué)問題?
- 如何將該問題轉(zhuǎn)化為一個(gè)可計(jì)算的問題?
- 如何提出一個(gè)解決此問題的算法?
- 如何實(shí)現(xiàn)該算法?
- 如何評(píng)估算法?
生信工具使用者需要解決如下問題:
- 每個(gè)方法解決的是哪個(gè)生物學(xué)問題?
- 該方法有哪些基本的假設(shè)?
- 每個(gè)參數(shù)是什么意思,都是用來干什么的?
- 準(zhǔn)確度評(píng)估,sensitivity and specificity,tradeoff,應(yīng)該追求哪一個(gè)?
- 生物學(xué)問題和方法的局限性?
生信資源的分類:
- 集中資源&獨(dú)立資源
- 數(shù)據(jù)庫&軟件工具
- 原始數(shù)據(jù)庫&二級(jí)數(shù)據(jù)庫
- 命令行工具&網(wǎng)頁服務(wù)器工具
NCBI
EBI
UCSC Genome Browser:基因組瀏覽器,表達(dá)調(diào)控、變異數(shù)據(jù),track,ENCODE 非編碼元件(計(jì)劃)
集中資源
| NCBI | EBI | UCSC | |
| 鏈接 | Database、Tools、Resource List(A-Z) | by topic | Table Browser |
| Tools | BLAST | BLAST、Exonerate、ClustalW2 | BLAT、In-Silico PCR |
| Data Repository | GenBank、GEO、SRA | ArrayExpress、ENA、PDBe | ENCODE |
| DNA/Genome | Genome | Ensembl、Genomes | Ideogram、Recombination Rate、GC Content |
| DNA/Gene | Gene | Ensembl | UCSC Genes、GENCODE、RefSeq Genes |
| RNA | RefSeq | Ensembl | mRNAs、ESTs、UniGene |
| Proteins | Protein, RefSeq、Conserved Domain | UniProt、InterPro、PRIDE | |
| Expression | UniGene | Expression、Atlas | Affy Exon Array、Caltech RNA-seq、Allen Brain |
| Regulation | Transcription、TFBS、Epigenetics、DNaseI HS | ||
| Literature | PubMed | ||
| Ontology | Gene Ontology | ||
| Comparative Genomics | Taxonomy、HomoloGene | *Ensembl | Conservation、Neandertal |
| Variation | dbSNP、dbVar | *Ensembl | SNPs、DGV、RepeatMasker |
| Disease | OMIM、MeSH、dbGaP、ClinVar | GAD、COSMIC、ClinVar、GWAS Catalog、QTLs |
獨(dú)立資源
?
癌癥
DNAnexus Reanalyzes Cancer Genome Atlas Data
DNAnexus完成世界上最大的泛癌癥數(shù)據(jù)的重分析(附數(shù)據(jù)下載) - 基因慧
DNANexus:DNANexus專注于建立一個(gè)云計(jì)算服務(wù)器中的DNA數(shù)據(jù)庫,然后以服務(wù)方式將該數(shù)據(jù)庫提供給研究者和科學(xué)家。DNAnexus和谷歌開展技術(shù)合作,提供最為全面的DNA數(shù)據(jù)庫,它可通過美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)下SRA的網(wǎng)站訪問到這些DNA數(shù)據(jù)(2011年2月,NCBI曾宣布由于聯(lián)邦政府削減經(jīng)費(fèi)支持逐步淘汰SRA)。
Cancer Genome Atlas:泛癌癥基因組
The Cancer Genome Atlas:就是 TCGA 的全稱,Atlas 古希臘的一個(gè)神
TCGA 官網(wǎng)?? User Guides and Help
轉(zhuǎn)載于:https://www.cnblogs.com/leezx/p/6182161.html
總結(jié)
以上是生活随笔為你收集整理的生物信息大数据数据库(NCBI、EBI、UCSC、TCGA)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 我想是我不够温柔是什么歌呢
- 下一篇: 【MongoDB学习之一】初始Mongo