Mavzu : Biologik ketma-ketliklarni ma`lumotlar bazalari bo`yicha taqqoslanishi uchun dasturlar


Biologik ketma-ketliklarni taqqoslash asoslari



Yüklə 0,57 Mb.
səhifə7/11
tarix23.12.2023
ölçüsü0,57 Mb.
#157531
1   2   3   4   5   6   7   8   9   10   11
Biologik ketma-ketliklarni ma`lumotlar bazalari bo`yicha taqqoslanishi uchun dasturlar

Biologik ketma-ketliklarni taqqoslash asoslari
Taqqoslash bioinformatikaning asoslaridan biridir. Tasavvur qilib ko’raylik, funksiyasi ma’lum bo’lgan aminokislota ketma-ketligining tajribadan olingan natijalari bor. Tuzilishi shunga o’xshash aminokislota ketma-ketligi yordamida bu modda ham o’xshash vaifalarni amalga oshiradi deb tahmin qilishimiz mumkin bo’ladi. Bu ketma-ketliklarning mos kelishi vazifasiga kiradi.
Yana bir boshqa vazifa genom tahlili bilan bog’liq. Turli organizmlar genomi tahlil etilganida uzun nukleotid ketma-ketligi olinadi. U yerda genlar –oqsil hamda tRNK va rRNKni kodlovchi uchastkalar ham bor. Ketma-ketlik orasidan ushbu genlarni topish asosiy vazifalardan biri xisoblanadi. Yana bir vazifa boshqarish vazifasini amalga oshiruvchi, DNKdagi signallarni, ya’ni regulyator oqsillar bog’lanish uchastkalari, ushbu gendan transkirptisiyalanuvchi mRNK ikkilamchi strukturalarini izlash xisoblanadi. Bioinformatikada bundan tashqari yana ko’plab vazifalar mavjud. Bu masalalarni hal etishda tahlil qilish usullari-algoritmlarni va tahlil dasturlarini ishlab chiqish kerak bo’ladi. Biror dasturni yaratishda uning barcha uchun mos, haqiqatga yaqin ekanligi muxim sanaladi. Yaratilgan yangi usulning to’g’ri ishlashini tekshirish uchun uni avvalilgaridan ma’lum bo’lgan, to’liq o’rganilgan moddalarda tekshirib ko’rish kerak bo’ladi. Agar bunda olingan natijalar haqiqatga 80-90% mos kelsa, bu usul nom’lum strukturalarni aniqlashda ham to’g’ri natijalarni beradi deb aytish mumkin bo’ladi.
Ketma-ketliklarni taqqoslash masalasini ko’rib chiqaylik. Bunda bir ketma-ketlik ikkinchisining pasiga yoziladi.
attgtACcTCgTgG-AA----
-----AC-TCaTaGcAAccag
Bunda ikki ketma-ketlik shunday solishtirilishi kerakki, tasodiflar soni maksimal qiymatga erishsin (juftlab taqqoslash (tekislash)). Tekislashtirishning sifati mos kelmagan harflar va probellar uchun (ko’proq mos keluvchi ketma-ketliklarga ega bo’lish uchun ba’zan ketma-ketliklar surilganida bo’sh joylar qoladi) jarima belgilash orqali aniqlanadi.
Shu tariqa, ketma-ketlik sekvenirlanganidan keyin ma’lumotlar bazasidan unga o’xshash ketma-ketliklar qidirilib, uning vazifasi haqida birlamchi ma’lumot olish imkonini beradi. Agar ikkita xarf o’zoro mos kelsa, demak bu soxa funksional muxim xisoblanadi. Aminokislotalar almashinuvi oqsil xossalariga ta’sir ko’rsatmasligi yoki butkul o’zgartirib yuborishi mumkin. Masalan, lizin aminokislotasi leytsin bilan almashib qolsa, mazkur oqsilning vazoviy strukturasi va xossalari butkul o’zgarib ketishi mumkin. Lizinning arginin bilan almashinishi esa deyarli hech qanday o’zgarishlarga sabab bo’lmaydi. Shuning uchun aminokislota ketma-ketliklari taqqoslanayotganida aminokislota qoldiqlarini qarshi qo’yish matritsasi ham inobatga olinadi (o’xshash, bir oz o’xshash, o’xshamaydigan). Ikkita ketma-ketlikni tekislashtirish –ularni yonma-yon qo’yib, ular orasidagi probellar shunday qo’yiladiki, bunda ularning umumiy uzunligi bir hil bo’lishi kerak.
Ketma-ketliklarni bu tarzda taqqoslash molekulyar biologiyada keng tarqalgan. Tekislashtirish evolyutsion jarayonni aks ettiradi deb taxmin qilinadi. Bir-birini ostida turuvchi ketma-ketliklar ajdod-ketma-ketlik ramziga mos keladi. Ketma-ketliklar evolyutsiyasi qanday yo’nalishda borganligini aniq aytib bera olmaymiz. Shuning uchun, “to’g’ri” ketma-ketlik tariqasida sifat vazifalari bo’yicha nisbatan optimal tekisliklar olinadi. Ammo, ushbu tanlangan vazifaning haqiqatdan ham to’g’ri ekanligini qanday nazorat qilish mumkin, nisbatan yaqin bo’lgan etalonlar bormi? Etalon tariqasida ularning fazoviy strukturasini o’rnini nisbatan to’laroq to’ldirishga mos keluvchi tekisliklar olinishi mumkin (bunday strukturalar bir necha yuz oqsillar uchun aniqlangan). Bu oqsilning hujayrada biror bir vazifani amalga oshirishi uning fazoviy strukturasiga bog’liq ekanligi bilan aniqlanadi, uchlamchi struktura asosida yotuvchi aminokislota esa ajdod oqsilning aynan o’sha aminokislotalariga mos keladi. Ketma-ketliklar “biologik tahlilga” qadar tahlil etilganida (masalan birorta fayl taqqoslanganda) masofani taxrir qilish atamasidan foydalaniladi. Bunda taxrir qiluvchi amallar ketma-ketligi qayd etiladi (masalan ramzni o’zgartirish, joylashtirish yoki olib tashlash) va har bir amal ushun ma’lum narx belgilanadi. Shu tariqa har bir tekislashtirish o’z narxiga ega bo’lib, aloxida amallar summasining bahosi kabi aniqlanadi. Eng kam narxga ega bo’lgan ketma-ketlik eng yaxshisi xisoblanadi.
Biologik ketma-ketliklarni tekislashtirishda yuqoridagi sxemaga o’zgartirishlar kiritish kerakligi aniqlandi. Chunki, turli aminokislotalar bir biridan turli belgilari bilan farq qiladi. Masalan, alanin va valin bir biriga juda o’xshash bo’lgani uchun ularni almashinish baxosi u qadar katta bo’lmaydi. Triptofan esa kam uchrovchi aminokislota bo’lganligi uchun ikkita triptofanni qarama-qarshi qo’yish yuqori baholanadi. Shuning uchun bioinformatikada oqsillar solishtirilganida “ramzning o’zgartirish bahosi”ning o’rniga ozgarishlarning og’irlik matritsasidan foydalaniladi. Bunda har bir juft harfga ma’lum og’irlik belgilanadi (o’xshash bo’lsa –musbat”+”, farqlansa –manfiy”-“) . Umumiy xolda tekislanishlar esa W=R-G kabi yoziladi. Bunda R-qarama-qarshi qo’yilgan ramzlarning summaviy og’irligi (tanlab olingan almashinishlar matritsasi og’irligiga mos ravishda), G –ramzlarni olib tashlagan yo keltirib qo’yilganligi uchun jarimalar summasi. Demak, optimal tekislashtirish – nisbatan katta og’irlikka ega bo’lgan tekislashtirishdir. Masalan, unli harflar mos kelish og’irligi +2, undosh xarflarning mos kelishi +1, ikkita xar hil undosh yoki unlini qarama qarshi qo’yish -1, unli va undoshni qarama –qarshi qo’yish og’irligi -2, Biror belgini joylashtirish yoki olib tashlash uchun jarima -5 bo’lsin. Bunda istalgan ikkita so’zni taqqoslab, uni og’irligini chiqarishimiz mumkin boladi. Bahoni minimallashtirib, sifatni maksimallashtirish –bu texnik nayrang emas. Sifatni maksimallashtirish tilida optimal lokal o’xshashlikni topish vazifasi qo’yiladi. Bu evolyutsiya jarayonida o’zgarib ketgan, faqat kichik uchastkalarigina o’xshash bo’lgan, ikkita oqsilni o’zoro taqqoslashga mos keladi.
Optimal tekislashtirish algoritmi Richard Belman tomonidan 1957 yilda amaliyotga tadqiq etilgan dinamik dasturlashtirish usuliga asoslangan. Usulning asosiy g’oyasi quyidagilardan iborat: asosiy vazifani xal etish uchun bir nechta oraliq formalarni o’ylab topish va ketma-ketlik bilan ularni xal qilish kerak (ketma-ketlik tartibi –bu alohida savol). Bunda navbatdagi savol undan oldin yechilgan masala javobidan kelib chiqqan xolda oson yechilishi kerak. Bir qator oraliq masalalarni orientirlangan atsiklik graf ko’rinishida namoyon etish qulaydir. Uning yuqori qismi oraliq vazifalarga mos keladi, Qovurg’a qismi esa qaysi oraliq masalalarning natijalari asos sifatida qo’llanilishini ko’rsatadi. Shu tariqa dastlabki vazifa grafdagi optimal yo’lni topishga olib boradi.
Optimal tekislashtirish tuzilganida oraliq vazifa -dastlabki ketma-ketlikning boshlang’ich fragmentlarining optimal tekislanishlarini tuzish xisoblanadi. Bunda masalani fragment uzunligi ortish ketma-ketligida xal etish kerak. «ПАПКА» va «ПАПАХА» so’zlarini oraliq yechimlari orasidagi bog’liqlik hamda optimal tekislashtirishga olib keluvchi oraliq qadamlar ketma-ketligi quyidagi rasmda keltirilgan.




(a) PAPKA va PAPAXA so’bog’liqlik grafi. Xar bir tepalik berilgan so’z boshlang’ich fragmentlariga mos keladi. Tepalik tarkibiga kiruvchi diagonal qovurg’a solishtirilayotgan boshlang’ich fragment oxirgi xarflarini qarama-qarshi qo’yishga mos keladi (1-xolat), gorizontal qovurg’a-PAPAXA so’zidagi harflarni o’chirish, vertical qovurg’a –PAPKA so’zidagi harflarnni o’chirishga mos keladi. (2 va 3 xolatlar). O’ng tomon tepadagi cho’qqi –boshlang’ich bo’lib, bo’sh so’zlarni taqqoslashga mos keladi, chap tomondagi pastki burchak – to’liq PAPKA va PAPAXA so’zlarining tekislanishlarini aks ettiradi





(b) quyidagi parametrlarda PAPKA va PAPAXA so’zlarining optimal tekislashtirilishi: xarflarni mos kelish og’irligi:1, unlini undoshga yoki aksincha almashtirilish jarimasi: 2, ramzni olib tashlaganlik uchun jarima:3.



(c) Optimal tekislanishlarga mos keluvchi treaktoriya. Kataklar ichida oraliq optimal tenglashtirishlar og’irligi keltirilgan. Masalan, PAP va PAPA uchun optimal tekislanishlar og’irligi 0 ga teng. PAPK va PAPAX uchun esa 1 ga teng.

Amaliy nuqtai nazardan tadqiq etilayotgan ketma-ketlikka mos ketma-ketliklarni ma’lumotlar bazasidan izlab topish eng muxim xisoblanadi. Oqsillarning fazoviy strukturasini tahmin etishda ketma-ketlikni struktura bilan tekislashtirish algoritmlari muxim o’rin egallaydi (bunda aminokislotalarning turli hil fizik-kimyoviy hossalarga ega bo’lganliklari uchun oqsil yuzasida turli chastotalarda uchraydi).

Yüklə 0,57 Mb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   10   11




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə