|
1977 bakteriofág øX174 (5386bp, 11 genes)
|
tarix | 17.01.2018 | ölçüsü | 445 b. | | #21303 |
|
1977 bakteriofág øX174 (5386bp, 11 genes) 1977 bakteriofág øX174 (5386bp, 11 genes) 1981 mitochondriální genom (16,568bp; 13 prots; 2 rRNAs; 22 tRNAs 1986 chloroplastový genom (120,000-200,000bp) 1992 Saccharomyces chromosom III (315kb; 182 ORFs) 1995 Haemophilus influenzae (1.8Mb 1996 Saccharomyces celý genom (12.1Mb; přes 600 výzkumníků, 100 laboratoří) 1997 E. coli (4.6Mb; 4200 proteins) 1998 Caenorhabditis elegans (97 Mb; 19,000 genů) 2000 Arabidopsis thaliana (115Mb, 25-30,000 genů) 2001 myš (za 1 rok!) 2001 člověk (2 projekty) 2005 šimpanz, rýže 2006 topol
Každý ddNTP značen jinou fluorescenční barvou – 1 reakce – vše dohromady Každý ddNTP značen jinou fluorescenční barvou – 1 reakce – vše dohromady Separace dle velikosti v gelu v kapiláře – detekce fluorescence při průchodu přes čidlo
1 reakce přečte obvykle 1 reakce přečte obvykle - do nedávna: 500 – 800 bp (454, Senger, Illumina)
- nově: až desítky tisíc bp (Oxf. nanopore, PacBio)
typický genom má stovky milionů až miliardy bp Co s tím?
Klasická strategie (Map-Based Assembly): minimalizace objemu sekvenování Klasická strategie (Map-Based Assembly): minimalizace objemu sekvenování – třídění klonů DNA fragmentů a postupné čtení (původní strategie sekvenování genomu člověka) Whole genome shotgun (WGS) – náhodné mnohonásobně redundantní sekvenování – třídění dat (prvně u Haemophilus) Kombinace – „hierarchical shotgun“, „chromosome shotgun“
Klasická - Map-Based Assembly: Klasická - Map-Based Assembly: - Detailní kompletní mapa pozic klonů (restrikční + dle koncových sekvencí genomových fragmentů)
- Časově náročné a drahé
- Ale přímo poskytuje „lešení“ (fyzickou mapu)
- pro následné sestavování sekvence
Hierarchical shotgun Hierarchical shotgun 1) knihovny velkých úseků, jejich zamapování 100-300 kb YACs (yeast artificial chromosomes): cca 0.5-1Mb u velkých genomů aspoň třídění na chromozómy nově kombinování přístupů s dlouhým a krátkým čtením 2) shotgun sekvenování jednotlivých velkých úseků
z překryvných dlouhých úseků, např. BAC klonů z překryvných dlouhých úseků, např. BAC klonů rozložení jednotlivých BACs na chromozómech, případně ve vztahu k molekulárním markerům např. STS (sequence tagged sites = krátké úseky DNA známé sekvence a pozice na chromozómu) základ klasického sekvenování VELMI užitečná i k zakotvení „shotgun“ sekvencí
- rychlé
- vyžaduje 7-9X více sekvenování
- - pro dostatečný překryv fragmentů, a tedy kompletní pokrytí genomu
- problémy s repetitivní DNA
- - nejasný počet tandemových kopií
- - ruší sestavování (je-li na více místech genomu)
- počítačově náročný alignment, kompletní sestavení velkých genomů s repetitivní DNA není bez dalších informací principielně možné
- výborné pro malé genomy či další genomy již sekvenovaných druhů
Vyhledání překryvů jednotlivých sekvenčních běhů Vyhledání překryvů jednotlivých sekvenčních běhů Propojení do „kontigů“ = vzájemně se překrývající sekvence, ze kterých lze odvodit většinovou (consensus) sekvenci 3. Propojení kontigů do superkontigů (příp. využití info o párech sekvencí = koncových úseků a jejich vzdálenosti) 4. Odvození výsledné genomové (consensus) sekvence
Vyhledávání genů: Vyhledávání genů: - automatická predikce kódujících oblastí
- predikce sestřihu ab initio
- predikce z příbuzných sekvencí
- ověřování – EST knihovny, cDNA klony
Predikce funkce – z experimentálně charakterizovaných homologů
hledání homologních genů hledání homologních genů analýzy (izolace) promotorových sekvencí analýzy repetitivních sekvencí snadné zamapování inserčních mutací matrice pro (epi)genomy dalších jedinců (ekotypů, mutantů, …) - 1000 + 1 genom: http://1001genomes.org/
Dostları ilə paylaş: |
|
|