Monte karlo metode I primene u bioinformatici master rad


Rezultati primene MKRK na problem uvijanje proteina



Yüklə 1,03 Mb.
səhifə10/11
tarix17.11.2018
ölçüsü1,03 Mb.
#81043
1   2   3   4   5   6   7   8   9   10   11

5.3 Rezultati primene MKRK na problem uvijanje proteina

Efikasnost algoritma predstavljenog u prethodnom odeljku testirana je na sistemu pentapeptida Met-enkefalina u gasnom stanju, odnosno na problem njegovog uvijanja [38]. Ovaj peptid ima aminokiselinsku sekvencu Tyr-Gly-Gly-Phe-Met. Izvršena je MD simulacija od Nsim = 105 vremenskih koraka za svaku repliku (kopiju peptida), gde je jedinica vremenskog koraka 10fs. Pri simulaciji korišćene su sledeće temperature (M = 8): 700, 585, 489, 409, 342, 286, 239 i 200K [37].

Iz opisa MKRK algoritma u prethodnom odeljku očigledno je da je simulacija razmene kopija posebno pogodna za paralelno izvršavanje na M računara. Pošto se može smanjiti količina razmenjenih informacija među čvorovima, najbolje je dodeliti jednu repliku jednom čvoru (zamenjivanje parova temperaturnih vrednosti među čvorovima je mnogo brže od zamenjivanja koordinata i impulsa). Posle svakih 10fs simulacije MD koraka, iteriramo kroz sve susedne replike pokušavajući da ih zamenimo ukoliko je zadovoljen Metropolisov kriterijum.



Slika 5: Šematski prikaz razmene kopija na susednim temperaturama.

Između svake zamene se izvršava određen broj MD koraka
Da bismo ispitali da li se zamene replika izvršavaju na pravi način potrebno je da proverimo tri stavke. (a) Da li su temperature optimalno raspoređene? (b) Da li je broj replika (temperatura) dovoljan? (c) Da li je najviša temperatura dovoljno visoka da bi se izbeglo zaglavljivanje u stanju lokalnog minimuma energije? Prve dve stavke se mogu proveriti ispitivanjem opsega prihvatljivosti zamene replika koje odgovaraju susednim parovima temperatura. Što se tiče prve stavke, optimalne raspodele temperature impliciraju da su svi opsezi prihvatljivosti isti, što rezultira slobodnim prelazom u prostoru replike (temperature). Što se druge stavke tiče, broj replika (temperatura) je dovoljan ukoliko opsezi prihvatljivosti nisu isuviše mali (recimo veći od 0.1). U Tabeli 1 su predstavljeni opsezi prihvatljivosti zamena replika, čije vrednosti su jedinstvene (oko 15% verovatnoće prihvatanja) i dovoljno veliki (>10%). Stoga, ispunjena su dva od tri gore opisana kriterijuma ((a) i (b)) za optimalni učinak.

Treću stavku ipak nije tako jednostavno proveriti kao što je to slučaj sa prve dve. Posmatrani nasumični prelazi među replikama (i temperaturama) nisu dovoljni za treću stavku. To je zato što ne možemo isključiti sledeću mogućnost. Ako se dogodi da su sve replike u istom stanju lokalnog minimuma energije i da je granica za izlazak iz ovog stanja veoma visoka (uzimajući u obzir najvišu temperaturu), onda ćemo i dalje posmatrati nasumične prelaze među svim replikama (i temperaturama) ali će oni ostati u istom lokalnom minimumu. Potkrepljujući dokaz za ispunjenost treće stavke se može dobiti upoređivanjem rezultata sa onima dobijenim iz regularne kanonske simulacije, što se razmatra u nastavku.



Parovi temperatura

Opseg prihvatljivosti

200 239 K

0.160

239 286 K

0.149

286 342 K

0.143

342 409 K

0.139

409 489 K

0.142

489 585 K

0.146

585 700 K

0.146

Table 1: Opsezi prihvatljivosti zamene replika koji odgovaraju parovima susednih temperatura

Rezultati iz Tabele 1 impliciraju da za svaku repliku postoji mogućnost nasumičnog prelaz na niže ili više temperature. Rezultati razmene temperatura i ukupna potencijalna energija za jednu od replika (replika 6) su prikazani na Slici 6. Na Slici 6b prikazan je grafikon ukupne potencijalne energije tokom posmatranog vremenskog perioda od 1 nanosekunde, pa mozemo primetiti da je ostavaren nasumični prelaz u prostoru potencijalne energije između najnižih i najviših energija.





Slika 6: Grafičiki prikaz zamene temperature (a) i ukupne potencijalne energije (b) za jednu od replika.
Na Slici 7 su prikazane kanonske raspodele verovatnoće dobijene na osam izabranih temperatura iz simulacije zamene replika. Primetimo da postoji dovoljno preklapanja između svih susednih parova raspodela, što ukazuje na to da će biti dovoljan broj zamene replika između parova. Na Slici 7b upoređujemo kanonske raspodele verovatnoće na tri temperature (T=200, 239 i 700k), dobijene MD simulacijom zamene replika, sa onima dobijenim regularnim kanonskim MD simulacijama, izvedenim odvojeno na odgovarajućim temperaturama. Kanonske simulacije su izvedene sa istim početnim uslovima i simulacionim vremenom kao i simulacija zamene replika. Uočavamo očekivano ponašanje da se raspodele slažu na višim temperaturama, a da su sklone odstupanju na nižim temperaturama. Činjenica da su raspodele dobijene regularnim kanonskim simulacijama na niskim temperaturama sklone prebacivanju na desno u odnosu na one dobijene zamenom replika ukazuje na to da su se kanonske simulacije zaglavile u stanjima lokalnog minimuma energije na tim temperaturama.



Slika 7: Kanonske raspodele verovatnoće ukupne potencijalne energije Met-enkefalina dobijene iz MD simulacije zamene replika na 8 temperatura (a) i poređenje kanonskih raspodela verovatnoće dobijenih iz MD simulacije zamene replika (pune linije) i konvencionalne kanonske MD simulacije (ukrštene) na tri temperatura (b). Raspodele u (a) odgovaraju sledećim temperaturama (s leva na desno): 200, 239, 286, 342, 409, 489, 585 i 700 K. Parovi raspodela u (b) odgovaraju sledećim temperaturama (s leva na desno): 200, 239 i 700 K.

U nastavku ćemo uporediti rezultate simulacije zamene replika sa onim dobijenim iz jedne kanonske MD simulacije na odgovarajućim temperaturama. Na Slici 8 upoređujemo raspodele para sa diedarskim uglovima (φ,ψ)13 Gly-2 (Gly-Gly) segmenta na dve ekstremne temperature (T = 200 i 700K). Dok se rezultati na T = 200K iz regularne kanonske simulacije lokalizuju sa samo jednim dominantnim vrhom, oni iz simulacije zamene replika imaju nekoliko vrhova (što se i vidi na slikama 8a i 8b). Stoga, simulacija zamene replika uzorkuje daleko širi konfiguracioni prostor u odnosu na konvencionalnu kanonsku simulaciju na niskim temperaturama. Uočimo da set vrhova posmatranih u raspodeli iz simulacije zamene replika uključuju one iz kanonske simulacije kao podgrupu. Međutim, vrh iz kanonske simulacije nije najviši u simulaciji zamene replika što ukazuje na to da se kanonska simulacija nije završila u prirodnom stanju, već je zapela u jednom od stanja lokalnog minimuma energije. Prosečna potencijalna energija na 200K konformacije koja odgovara najvišem vrhu u raspodeli kanonske simulacije (Slika 8a) je za oko 2 kcal/mol viša od ove iz simulacije zamene replika (Slika 8b)(-141 u odnosu na –143 kcal/mol). Sa druge strane, rezultati na T = 700K su slični, što ukazuje na to da regularna kanonska simulacija može dati precizne termodinamičke veličine na visokim temperaturama.





Slika 8: Raspodele para diedarskih uglova (φ,ψ) Gly-2 za: (a) T=200K iz regularne kanonske MD simulacije, (b) T = 200K iz MD simulacije zamene replika, (c) T = 700K iz regularne kanonske MD simulacije, (d) T = 700 K iz MD simulacije zamene replika.

Činjenica da raspodela dobijena iz simulacije zamene replika ima nekoliko vrhova čak i na niskim temperaturama daje delimičnu potporu da je gore pomenuti treći kriterijum za optimalni učinak simulacije zamene replika ispunjen. Naime, najviša temperatura je dovoljno visoka da se uzorkuje široki konformacioni prostor i da raspodela nije prinuđena da konvergira ka samoj konformaciji čak i na niskim temperaturama, gde regularne kanonske simulacije zapadaju u stanje lokalnog minimuma energije.

Na Slici 9 prikazana je prosečna ukupna potencijalna energija kao funkcija temperature. Kao što je i očekivano na osnovu rezultata sa Slike 7 i 8, uočavamo da su se kanonske simulacije na niskim temperaturama zaglavile u stanjima energije lokalnog minimuma, što je rezultovalo odstupanjima u prosečnim vrednostima između rezultata iz kanonskih simulacija i onih iz simulacije zamene replika. Moze se uočiti da kanonske simulacije počinju da zapinju već negde oko 300 K (i niže), što je eksperimentalno relevantna temperatura.


Slika 9: Prosečna ukupna potencijalna energija u funkciji temperature. Puna linija je rezultat iz MD simulacije zamene replika a tačke su one iz regularnih kanonskih MD simulacija na osam temperatura.
Ovo ukazuje na to da su potrebne dosta duže simulacije da bi se dobili termodinamički proseci na ovim temperaturama koristeći konvencionalne MD metode zasnovane na kanonskom ansamblu. Kao što je i očekivano, imamo totalno slaganje na višim temperaturama između rezultata iz kanonskih simulacija i onih iz simulacije zamene replika.

GROMACS softver u sebi sadrži podršku za MKRK simulaciju. Predstavićemo sada korake koji su potrebni pri izvršavanju ove simulacije [43]:



  • definisati sistem, npr. peptid + rastvor

  • u zavisnosti od broja procesora i opsega iz kojeg se mogu odabrati temperaturne vrednosti, odrediti raspodelu temperatura. Može se koristiti eksponencijalna raspodela: , gde se i mogu podesiti tako da se dobiju razumni temperaturni intervali. Eksponencijalnost omogućava povećanje temperaturnih intervala sa povećanjem temperature, što je neophodno zbog raspodele ukupne energije, koja se povećava zajedno sa temperaturnom kao i stopa razmene (eng. exchange rate). Stopu razmene treba održavati konstantnom kroz sve temperaturne vrednosti. (Za odabir temperatura na osnovu i broja replika se može koristiti i http://folding.bmc.uu.se/remd/ )

  • uravnotežiti sisteme na N odabranih temperatura odvojeno koristeći .mdp14 fajlove i generisati N ulaznih tpr. fajlova.

  • pokrenuti kratku MKRK simulaciju kako bi se estimirala stopa razmene i modifikovale temperaturne vrednosti ukoliko nije postignuta zadovoljavajuća stopa (obično se prihvatljiva stopa razmene kreće između 0,2 i 0,3). Takođe treba obratiti pažnju i na vreme koje jedna replika provede na određenoj temperaturi kao i način na koji se vrši razmena, da li vršiti razmenu svih parova ili samo jednog nasumično odabranog para.

  • odrediti početne konfiguracije za svaku temperaturu. Ove konfiguracije mogu biti iste ili različite, što zavisi od razloga zašto izvršavamo MKRK simulaciju.

Primer: Posmatrajmo 8 kopija (konformacija nekog proteina) na temperaturama u opsegu od 200K do 700K i odgovarajućim .mdp fajlovima. Svi potrebni parametri su smešteni u .mdp fajlovima i svi su jednaki za svaku od kopija. Ulazni .tpr fajlovi se prave pokretanjem gmx grompp komande nad svakim od .mdp fajlova, nakon čega je simulacija spremna za izvršavanje pokretanjem komande:

~$ mpiexec -x -np 8 gmx mdrun -s sd_.tpr -multi 8 -replex 1000 -reseed 175320, gde je:

np – broj procesora

multi – instrukcija programu da se izvrši 8 puta

replex – instrukcija da sistem pokuša razmenu posle svakih 1000 koraka tj. Svake 2ps (pikosekunda) ukoliko je vremenski korak jednak 2fs

reseed – broj za inicijalizaciju generatora slučajnih brojeva.

Log fajl dobijen nakon izvršavanja gore navedene komande sadrži statistiku simulacije, kao na primer verovatnoću razmene i replike koje su učestvovale u razmeni nakon 1000 koraka, na osnovu kojeg je moguće iscrtati odgovarajuće trajektorije.

GROMACS predstavlja jedan od glavnih softverskih paketa koji se koristi u jednom od najvećih istraživačkih projekta za simulaciju uvijanja proteina – Folding@home. Ideja ovog distribuiranog računarskog projekta je da se obrada ogromnog broja podataka podeli na relativno male delove, koji se distribuiraju putem Interneta do personalnih računara širom sveta, gde se vrši obradi i potom rezultati vraćaju pokretaču projekta. Folding@home koristi skriveni Markovljev model za modeliranje mogućih oblika i putanja uvijanja proteina, kao što je predstavljeno na Slici 10 [44].



Slika 10: Dijagram skrivenog Markovljevog modela

Simulacija uvijanja proteina koje ja izvršena pomoću Folding@home-a se može pogledati na sledećem linku: https://www.youtube.com/watch?v=gFcp2Xpd29I dok se primer simulacije razmene kopija može videti na linku https://www.youtube.com/watch?v=LPmt9nRtJ5Y&t=52s. Ova simulacija se sastoji od 8 kopija na temperaturama u intervalu od 100K do 500K.




Yüklə 1,03 Mb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   10   11




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2022
rəhbərliyinə müraciət

    Ana səhifə