Ma'lumotlar bazasini qidirish. Yaqinda Cifani va boshqalar. [40] gibrid proteomika asosi bo'lgan ProteomeGeneratorni taklif qildi . Ushbu yangi yondashuv namunaga xos boshqaruv elementlari bilan maqsadli ma'lumotlar bazasidan mos natijalarni kalibrlaydi va kanonik bo'lmagan proteomalarda izoformani aniqlashning aniqligini sezilarli darajada yaxshilaydi . Katta miqyosdagi proteomik ma'lumotlar to'plami uchun parallel PSM ishlov berish algoritmlari ham amalga oshirildi [33].
Ma'lumotlardan mustaqil yig'ish (DIA) massa spektrometriyasi endi peptid aralashmalarini tizimli tahlil qilish uchun yangi strategiya sifatida paydo bo'ladi . An'anaviy ma'lumotlarga bog'liq yig'ish (DDA) dan farqli o'laroq, prekursor ionlarining aralashmalari birgalikda tanlash va birgalikda dissotsiatsiya asosida tanlanadi, DIA oldindan belgilangan m/z diapazonidagi har bir xromatografik vaqt nuqtasida barcha parchalangan ionlarni aniqlaydi yoki m
dan foydalanadi. Izolyatsiya va parchalanish vaqtida /z diapazonlari [65].
DIA ning kuchliligi shundaki, barcha prekursor ionlari egilishsiz tanlanadi va quyi oqimdagi tizimli tahlil uchun yanada ishonchli ma'lumot beradi. Turli yondashuvlar bilan DIA yondashuvi uchun turli tahlil strategiyalari ishlab chiqilgan. Misol uchun, MSPLIT-DIA [19] kutubxonani moslashtirish usuli bo'lib, unda DIA spektridan kiritilgan ma'lumotlar kutubxona spektrlariga nisbatan qidiriladi va
spektr proektsiyalari normallashtirilgan nuqta mahsuloti asosida baholanadi. Biroq, kutubxonaga asoslangan ushbu usullarning natijalari kutubxonada mavjud ma'lumotlardan oldingi bilimlar bilan cheklangan . Ushbu muammoni hal qilish uchun ko'plab kutubxonalarsiz usullar ham taklif qilingan. Ushbu vositalar odatda DIA-Umpire [42] kabi multiplekslangan spektrlarni yoki yuqori korrelyatsiya qilingan prekursor ion guruhlarini dekonvolyutsiyadan soxta spektrlarni qayta tiklaydi yoki FT-ARM [66] kabi DIA ma'lumotlaridan har bir so'rov peptidining mavjudligi ishonchini to'g'ridan-to'g'ri hisoblab chiqadi. va PECAN [31]. Yaqinda Searle va boshqalar. [67] model bo'lmagan organizmlar va kanonik bo'lmagan ma'lumotlar bazalari uchun DIA-MS uchun tezkor, eksperimentga xos kutubxona yaratish ish jarayonini taklif qildi . Ularning tizimida birinchi navbatda proteomadagi har bir peptidni o'z
ichiga olgan kutubxonalar
quriladi, so'ngra to'g'ridan-to'g'ri protein ketma-ketligi ma'lumotlar bazalaridan tuzilgan empirik ma'lumotlardan foydalangan holda tozalash
Proteinlardagi posttranslatsion modifikatsiyalar (PTM) MS bilan ham aniqlanishi mumkin. Biroq, barcha mumkin bo'lgan o'zgartirish pozitsiyalari bilan ma'lumotlar bazasini oddiygina qidirish juda ko'p vaqt talab qilishi mumkin, chunki barcha mumkin bo'lgan pozitsiya/modifikatsiya kombinatsiyalarining ko'pligi. Hisoblash talablarini kamaytirish yoki natijalarning aniqligini oshirish uchun ModifiComb [45], PTMselect [51] va G-PTM-D [68] kabi
bir qancha usullar mavjud . PEAKS PTM [69] PEAKS Studio dasturiga integratsiyalangan PTM identifikatsiya usulidir . PEAKS PTM da yuqori de novo ballga ega tayinlanmagan spektrlar aniqlangan oqsillarga nisbatan qidiriladi . Genomik yoki transkriptomik ma'lumotlar bazalaridan olingan ketma-ketlik ma'lumotlari, shuningdek, mumkin bo'lgan protein ketma-ketligini ta'minlash orqali peptidlarni aniqlashga yordam beradi. Ushbu strategiya proteogenomikada keng qo'llaniladi , u MS asosidagi proteomika ma'lumotlaridan yangi peptidlarni aniqlashni osonlashtirish uchun genomik va transkriptomik ma'lumotlar bazalari ma'lumotlaridan foydalanadigan tadqiqotning yangi sohasi hisoblanadi [70]. MetaMorpheus [50] global PTM kashfiyotida ko'p bosqichli qidiruvlarni o'z ichiga olgan yana bir yangi vositadir . G-PTM-D yondashuvi
bilan solishtirganda, qidiruv tezligi sezilarli darajada oshishi bilan aniqlangan PTMlarning ko'proq soniga erishadi .
Peptid identifikatsiyasi tugallangandan so'ng, keyingi qadam peptid ketma-ketligini asl oqsillarga qayta tiklashdir. Ushbu protsedura oqsil xulosasi deb ataladi. Uzunroq peptidlar o'zlarining noyobligi tufayli ushbu bosqichda ko'proq ma'lumotga ega . Taqqoslash uchun, odatda, qisqaroq peptidlardan oqsillarning ishonchli ro'yxatini tuzish oson emas, chunki peptidlarning ba'zilari ikki yoki undan ko'p oqsillar tomonidan taqsimlanishi mumkin. Ushbu "degeneratsiyalangan peptidlar" odatda oqsillarni tayinlash uchun bir nechta optimal echimlarga ega. Peptidlarni yig'ish uchun yaratilgan ko'plab modellar aniqlangan peptidlarni hisobga olgan eng kichik oqsillar to'plamini bildiradigan parsimon qoidani moslashtiradi [41,43,71]. Probabilistik modellar oqsil xulosasida ham keng qo'llaniladi va birinchi marta ProteinProphet [72] tomonidan kiritilgan. O'shandan beri ierarxik statistik model [73] va Bayes xulosasi modeli [74] kabi ko'proq statistik modellashtirish ramkalari taklif qilindi. Bayes xulosasi modeli posterior ehtimollar asosida qurilgan Bayesian modellarini qo'llaydi va original ProteinProphet ish faoliyatini taxminan 6% ga yaxshilagan. Protein xulosasining ishlashi ko'pincha kuzatilgan peptidlardan PSM balli kabi dalillarning kuchiga ta'sir qiladi [75]. Odatda, katta proteomik ma'lumotlar to'plamlari uchun noto'g'ri xabar qilingan oqsillar sonini kamaytirish uchun oqsillarni identifikatsiyalash FDRlari uchun qattiq chegara o'rnatiladi . Protein xulosasi uchun yangi FDR baholash asoslari ham ishlab chiqilgan.
Int. J. Mol. Sci. 2020 yil, 21, 2873 yil 25 tadan 7 tasi
Reiter va boshqalar. taklif qilingan MAYU [44], bu PSM ni FDR baholash uchun maqsadli aldash strategiyasini oqsil darajasiga kengaytiradi. Turli yirik proteomik ma'lumotlar to'plamlarida tekshirish shuni ko'rsatadiki, ma'lumotlar to'plamining o'lchami oqsillarni identifikatsiyalash natijalarining ishonchliligiga ta'sir qiladi. Yaqinda Wu va boshqalar. [76] yangi FDR baholash yondashuvini taklif qildi , unda null taqsimot logistik regressiya modelining Permutation + BH (Benjamini-Hochberg) usuli bilan kombinatsiyasidan hosil bo'ladi . Bundan tashqari, mualliflar ushbu yondashuv MAYUga qaraganda doimiy ravishda yaxshiroq ishlashga erishishini ko'rsatdi.