Mavzu: Ekspressiya va protoeomika bo`yicha ma`lumotlar bazasi reja: Kirish i-bob. Proteomika ma'lumotlarini qayta ishlash


 Ma'lumotlar to'plamidagi etishmayotgan qiymatlarning ta'siri



Yüklə 393,45 Kb.
səhifə6/7
tarix29.11.2023
ölçüsü393,45 Kb.
#141470
1   2   3   4   5   6   7
Ekspressiya va protoeomika bo`yicha ma`lumotlar bazasi

2.2 Ma'lumotlar to'plamidagi etishmayotgan qiymatlarning ta'siri
Asl UPS1 va SGSDS ma'lumotlar to'plamlarida etishmayotgan qiymatlarning o'rtacha yoki past soni (mos ravishda 14,1% va 3,4%) va ko'tarilgan oqsillarda faqat bir nechta etishmayotgan qiymatlar (mos ravishda 0% va 4,2%) mavjud edi. Shu sababli, usullarni yanada kuchaytirish uchun CPTAC ma'lumotlar to'plami yordamida etishmayotgan qiymatlarning katta qismiga ega bo'lgan yarim simulyatsiya qilingan ma'lumotlar to'plamlari yaratildi, ular etishmayotgan qiymatlarning umumiy ulushi (19,5%) va keskinlikdagi etishmayotgan qiymatlarning sezilarli darajada katta qismiga ega edi. -UPS1 va SGSDS ma'lumotlar to'plamlariga qaraganda oqsillarda (29,4%). Yo'qolgan qiymatlarning bunday katta qismi mavjud bo'lganda, barcha usullar UPS1 va SGSDS ma'lumotlar to'plamlariga qaraganda aniq yomonroq bajarildi ( 2g -rasm ). Har bir vaqt nuqtasiga alohida qo'llaniladigan BaselineROTS kesma usuli IQR o'rtacha pAUC 0,782 bo'lgan uzunlamasına usullardan sezilarli darajada oshib ketdi , so'ngra 0,745 IQR o'rtacha pAUC bilan RolDE ( p <10 -5 ). BaselineROTS va RolDE ikkalasi ham IQR o'rtacha pAUC 0,740 ( p <10 -5 ) bilan keyingi eng yaxshi usul LMMS dan sezilarli darajada yaxshi ishladilar.
Bundan tashqari, baholangan usullarning ko'pchiligi ma'lumotlarda etishmayotgan qiymatlar mavjudligida oqsillar uchun to'g'ri ball berish uchun kurash olib bordi. Turli usullar ma'lumotlar to'plamidagi oqsillar uchun ballarni qanchalik izchil ta'minlay olishini baholash uchun har bir usul va ma'lumotlar to'plami turi uchun IQR o'rtacha haqiqiy ball nisbati hisoblab chiqilgan (1-jadval ) . Sukut bo'yicha ma'lumotlar to'plamidagi barcha oqsillar uchun reytingni yaratadigan RolDE ga qo'shimcha ravishda , chiziqli regressiya usuli Lme va chiziqli aralash model spline usuli LMMS ko'pincha barcha ma'lumotlar to'plamlaridagi oqsillar uchun haqiqiy reytingni ta'minlay oldi.
Vaqt nuqtalarining qisqarishi ta'siri
RolDE , Timecourse , Limma va asosiy ROTS usullarining eng yaxshi ishlashini atigi uch yoki to'rt marta qo'shimcha 1200 yarim simulyatsiya qilingan ma'lumotlar to'plamida baholadik. ball. Hammasi bo'lib 300 ta filtrlangan (yo'qolgan qiymatlarsiz) va 300 ta to'liq (shu jumladan etishmayotgan qiymatlar) UPS1 asosidagi ikkala uzunlikdagi yarim simulyatsiya qilingan ma'lumotlar to'plami o'rganildi. Shunga qaramay, RolDE ikkinchi eng yaxshi usul Timecourse ( barcha stsenariylarda p <0,02, qo'shimcha 2- rasm ) dan sezilarli darajada oshib, umumiy eng yaxshi natijani ko'rsatdi. RolDE ham , Timecourse ham kesma asosiy usuldan ( barcha stsenariylarda p <0.001) va Limma ( p <10 -15 ) dan yaxshiroq ishladi. Haqiqiy manfiy oqsillardagi etishmayotgan qiymatlar usullarning hech biriga katta ta'sir ko'rsatmadi.
Fn ma'lumotlar to'plamlari o'rtasida takrorlanish
Haqiqiy proteomikani o'rganish sharoitida uzunlamasına differensial ifodalash usullarini baholash uchun biz Fransisellaning eksperimental membrana bilan boyitilgan uzunlamasına proteomik ma'lumotlarini yaratdik . tularensis kichik turlari novicida ( Fn ) ( 1b -rasm), shu jumladan to'rtta shtamm: lpxD1 (D1), lpxD2 (D2) va lpxL (L) ning yovvoyi turi (WT) va null mutantlari . Usullarni baholash uchun null mutant va yovvoyi turdagi shtammlar o'rtasidagi differentsial ifoda o'rganildi, ularning besh xil haroratda o'sishi turli vaqt nuqtalari uchun surrogatni taklif qildi. Usullarning takrorlanuvchanligini baholash uchun turli usullar bilan tahlil qilingan texnik takroriy ma'lumotlar to'plamini shakllantirish uchun uchta biologik takroriy namunaning uchta texnik nusxasi ishlatilgan. Sinovdan o'tkazilgan usullar bilan olingan natijalarning umumiy takrorlanishini tekshirish uchun shtammlarning barcha mumkin bo'lgan juftlik kombinatsiyalari tahlil qilindi (WT va D1, WT va D2, WT va L, D1 va D2, D1 va L, D2). Lga qarshi).
Fn ma'lumotlaridagi etishmayotgan qiymatlarning umumiy ulushi 10,8% ni tashkil etdi, bu 37 °C namunalarida eng yuqori bo'lib, L dan tashqari barcha shtammlarda barcha qiymatlarning 25% dan ortig'i yo'q (Qo'shimcha 3-rasm ) . Turli usullar bilan ta'minlangan haqiqiy reytinglar nisbati etishmayotgan qiymatlari bo'lgan to'liq yarim simulyatsiya qilingan spike-in benchmark ma'lumotlar to'plamiga mos keldi ( 1- jadval ): RolDE , Lme , BaselineROTS , Pme_L , LimmaSplines_L va LMMS 97 dan ortiq reytingni taqdim etdi. Har bir juftlik taqqoslashdagi barcha oqsillarning % ; Limma , LimmaSplines_H va Pme_H oqsillarning 84-87% uchun reytingni taqdim etdi; OmicsLonDA oqsillarning 84-88% ni belgilashga muvaffaq bo'ldi; va Timecourse , EDGE va MaSigPro oqsillarning <80% uchun reytingini taqdim etdi.
Limma ning turli xil variantlari bilan o'rtacha eng yuqori edi (IQR o'rtacha korrelyatsiyasi 0,793-0,813, 3a- rasm ), undan keyin LMMS (IQR o'rtacha korrelyatsiyasi 0,757) va RolDE (IQR o'rtacha korrelyatsiyasi 0,754), ikkalasi ham. 0.745 ( p <0.05) IQR o'rtacha korrelyatsiyasi bilan keyingi Pme_L usuliga qaraganda sezilarli darajada yuqori korrelyatsiyaga ega edi. Natijalar ro'yxatining umumiy o'zaro bog'liqligiga qo'shimcha ravishda, biz takroriy ma'lumotlar to'plamlari orasidagi eng yuqori topilmalarning o'rtacha o'xshashligini ko'rib chiqdik, bunda bir-birining o'lchami 1 dan ma'lumotlar to'plamidagi oqsillarning umumiy sonigacha o'zgargan. Korrelyatsiya natijalariga ko'ra, Limma , LMMS va RolDE ning turli xil variantlari texnik takroriy natijalar ro'yxati o'rtasida, ayniqsa, eng yaxshi topilmalar orasida yuqori o'xshashlikni ko'rsatdi.
Fn ma'lumotlaridagi topilmalarning biologik ahamiyati
Odatda, har qanday eksperimentdagi eng yaxshi topilmalar eng qiziqarli bo'lib, keyinchalik tekshirish uchun tanlanadi. Shu sababli, ro'yxatning yuqori qismida bir xil topilmalarni etkazib berish usulining izchilligi juda kerakli sifatdir. Biroq, takror ishlab chiqarishning o'zi biologik ahamiyatga egaligini kafolatlamaydi. Shuning uchun biz Fn ma'lumotlarida o'zgartirilgan asiltransferazalarga tegishli oqsillarni turli usullar bilan qanday aniqlaganini ham ko'rib chiqdik . Shu maqsadda, harorat bo'yicha uzunlamasına differensial ifoda lpxD1 (D1), lpxD2 (D2) va lpxL (L) ning yovvoyi turi (WT) va null mutantlari o'rtasida har bir biologik uchun o'rtacha hisoblangan texnik replikatsiyalar bilan to'liq ma'lumotlarda ikki marta tekshirildi . takrorlash. Har bir usul bo'yicha natijalar ro'yxati usul tomonidan berilgan differentsial ifoda kuchiga qarab tartiblangan.
BETR , EDGE_H va EDGE_L bundan mustasno, lpxL va lpxD2 atsiltransferazalari bilan bog'liq oqsillarni natijalar ro'yxatining yuqori qismiga qo'ydi . BETR, Pme_H , Timecourse , Limma , LimmaSplines_H , EDGE_H, EDGE_L va OmicsLonDA lpxD1 bilan bog'liq bo'lgan oqsillarni qanday tartiblash usullarida ko'proq o'zgarishlar kuzatildi ( 3c -rasm ).
Asiltransferazalarning o'ziga qo'shimcha ravishda, biz turli xil usullar lipid A va endotoksin lipopolisakkarid (LPS) sintezining tegishli yo'llarini qanday tartiblaganini ham o'rganib chiqdik. Shunga ko'ra, biz KEGG yo'lidagi lipopolisaxaridlar biosintezi - Fransisellaning turli xil taqqoslashlarida tegishli oqsillarni qanday ko'rib chiqdik. tularensis subsp. novicida U112 (ftn00540) va tegishli lipopolisakkarid biosintezining nokaut yo'li (ko00540) bizning Fn ma'lumotlar to'plamimizda aniqlandi ( 3d- rasm , 1- jadval ). RolDE , Limma , LimmaSplines_H va BaselineROTS yovvoyi turdagi va mutant shtammlarni har bir taqqoslashda yuqori biologik ahamiyatga ega bo'lgan eng yaxshi topilmalarni doimiy ravishda taqdim etdi ( 3d -rasm ). Shuningdek, MaSigPro_H , LMMS va Timecourse ko'pgina taqqoslashlarda yuqori biologik ahamiyatga ega yuqori natijalarni taqdim etdi.
iTreg ma'lumotlaridagi topilmalarning biologik ahamiyati
Fn ma'lumotlaridagi turli usullarning topilmalarining biologik ahamiyatini baholashdan tashqari , biologik jihatdan mazmunli natijalarni taqdim etish usullarini har tomonlama baholash uchun taqqoslashga inson iTreg in vitro induktsiyasining 33 qo'shimcha ochiq ma'lumotlar to'plami kiritilgan. Taxminan 10 000 oqsildan iborat ushbu ma'lumotlar to'plamida sodda T hujayralari rag'batlantirildi va ikki xil protokol yordamida iTreg hujayralari induktsiya qilindi. Proteom profillari 6 soat, 24 soat, 48 soat va 6 kun ichida iTreg induksiyasi yoki soxta stimulyatsiyasi paytida bir nechta vaqt nuqtalarida olingan . Uzunlamasına differentsial ifoda iTreg va soxta stimulyatsiya qilingan nazorat hujayralari o'rtasida ikkala protokol uchun alohida aniqlandi , natijada ikkita taqqoslash amalga oshirildi.
Induksiya jarayonidan aziyat chekadigan aniq oqsillar hali ham tadqiqot ostida 33 , 34 va batafsil ma'lum emasligi sababli, topilmalarning biologik ahamiyatini baholash uchun Treg bilan bog'liq bir nechta gen to'plamlari ishlatilgan. Hammasi bo'lib 28 Treg hujayralari bilan bog'liq inson genlari to'plami Molekulyar imzolar ma'lumotlar bazasidan ( MSigDB versiyasi 7.5.1) 35 yuklab olindi va 14 Treg gen to'plamlariga birlashtirildi (Qo'shimcha ma'lumotlar 2 ). Bundan tashqari, katta odam tadqiqotidan olingan Treg imzo geni 34 , tegishli Reactome yo'lidan genlar (RUNX1 va FOXP3 tartibga soluvchi T-limfotsitlarning rivojlanishini nazorat qiladi) va vilkalar qutisi P3 (FOXP3) oqsilining interaktomasi . Treg hujayralarining nasl-nasabining spetsifikatsiya faktorlari Treg bilan bog'liq funktsional boyitishni o'rganish uchun ishlatilgan . Ikki xil iTreg induktsiya protokollaridan foydalangan holda taqqoslashlarning ikkalasida ham eng yuqori boyitishlar RolDE , BaselineROTS va BETR ( 4a -rasm) bilan eng izchil aniqlandi , bu usullar Treg bilan bog'liq biologik ahamiyatga ega natijalar va topilmalarni taqdim etishga qodirligini ko'rsatadi. Treg hujayra indüksiyon protokollari yordamida kutilgan hujayra holati .
Eksperimental iTreg ma'lumotlaridagi turli usullar bilan topilmalarning ishonchliligini o'rganish uchun biz usullar orasidagi eng yaxshi topilmalarning bir-biriga mos kelishini solishtirdik. Ko'p usullar bilan umumiy topilmalar ko'pincha faqat bitta usul bilan aniqlanganlardan ko'ra ishonchli hisoblanadi 11 , 33 . Ushbu tadqiqotda (RolDE, Timecourse, Limma, LMMS va BaselineROTS) umumiy eng yaxshi ishlaydigan usullarning 1000 ta topilmalarini solishtirganda, RolDE ikkala taqqoslashda ham eng ko'p umumiy va eng kam noyob topilmalarga ega bo'ldi (4b-rasm) . ); Limma 112 va 133, BaselineROTS 177 va 559, LMMS 278 va 262 va Timecourse 288 va 321 noyob topilmalar bilan solishtirganda RolDE ikkita taqqoslashda atigi 94 va 90 noyob topilmalarga ega edi.
Ushbu tadqiqotlarni yanada kengaytirish uchun biz har bir usulning eng yaxshi 1000 ta topilmasining ikkita taqqoslash bo'yicha 1000 ta topilmalaridagi boshqa usullar bilan umumiy bo'lgan ulushini o'rganib chiqdik (4c-rasm ) . Bu erda xolis va to'g'ri taqqoslash uchun har bir usulning faqat eng yaxshi ko'rsatkichli varianti kiritilgan, chunki bir nechta variantli usullar uchun eng yuqori natijalar ro'yxatining katta qismi variantlar o'rtasida taqsimlanadi. Umuman olganda, BETR noyob aniqlashlarning eng past ulushiga ega edi, undan keyin EDGE_H, RolDE, LMMS va Pme_H. Ularning 1000 ta eng yaxshi topilmalarining 10% dan kamrog'i usulga xos bo'lgan va topilmalarning 50% dan ortig'i olti yoki undan ortiq boshqa usullar bilan bo'lingan.
RolDE ni bo'ylama 1-toifa diabet proteomikasi ma'lumotlariga mos kelmaydigan vaqt nuqtalari bilan qo'llash
Xulosa
Yarim simulyatsiya qilingan spike-in ma'lumotlar to'plamlari va eksperimental Fn va iTreg ma'lumotlar to'plamlari mukammal moslashtirilgan vaqt nuqtalarini (yoki ularning o'rnini bosuvchilarini) o'z ichiga olgan bo'lsa-da, bu har doim ham turli xil haqiqiy eksperimental sozlamalarda shunday emas. Shuning uchun, biz 10-gachasi moslashtirilmagan vaqt nuqtalari bilan ilgari nashr etilgan uzunlamasına 1-toifa diabet proteomikasi ma'lumotlarida umumiy eng yaxshi ishlaydigan RolDE usulining qo'llanilishini ko'rsatamiz . Ma'lumotlar to'plamida T1D rivojlanayotgan 11 ta bolalarning qon plazmasidagi oqsillarni ifodalash o'lchovlari va 10 ta mos keladigan nazorat 10 mavjud . Hizalanmagan vaqt nuqtalari bo'lgan har bir bola uchun to'qqizta uzunlamasına namunalar to'plangan. Maqsad, serokonversiya va T1D diagnostikasidan oldin ham qondan T1D bilan bog'liq biomarkerlarni erta aniqlash edi, bu kasallikni oldindan bashorat qilish va aralashuvga imkon beradi.
RolDE 0,05 noto'g'ri kashfiyot tezligi (FDR) da T1D holatlari va boshqaruvlar o'rtasida uzunlamasına differentsial ifodalangan jami 15 ta oqsilni aniqladi ( 2 -qo'shimcha jadval ). Bularga aniq tendentsiya farqlari bo'lgan oqsillar, shuningdek holatlar va nazoratlar o'rtasida aniq ifoda darajasidagi farqlarga ega bo'lgan oqsillar kiradi. Ikkita keratin, K1H1 va KRT86, yuqori darajada farqlanganligi aniqlandi ( 5a- rasm, 2- jadval ). Keratinlar darajasining pasayishi 36 , shuningdek, keratin almashinuvining ortishi 37 ilgari keratinotsitlar proliferatsiyasi, differentsiatsiyasi va funktsiyasi 38 bilan diabet va giperglikemiya bilan bog'liq edi . Boshqa aniqlangan oqsilning ( 5b -rasm ), EF-qo'l domeni 1 (CGRE1) bilan hujayra o'sishi regulyatorining pastga regulyatsiyasi odamlarda giperglikemiya bilan bog'liq 39 . T1D holatlarida serotransferrinning (TRFE) sezilarli pasayishi ham aniqlandi ( 5c -rasm ). Serotransferrin bir nechta tadqiqotlarda diabet va glyukoza metabolizmi darajasi bilan bog'liq 40 , 41 , 42 ; Metz va boshqalar. serotransferrinning nazorat 42 bilan solishtirganda T1D bemorlarining plazmasida ikki baravar kamayishi haqida xabar berdi . Xuddi shunday, sarum amiloid A1 (SAA1, rasm. 5d ), RolDE ning eng yuqori differensial ifoda topilmasi ilgari ko'plab tadqiqotlarda diabet va qon glyukoza darajasi bilan bog'langan edi 43 , 44 , 45 . Bundan tashqari, natriy kanali va klatrin bog'lovchisi 1 (SCLT1) juda muhim deb topildi ( 5e -rasm ). Bu inson 46 da siliopatiyalar bilan bog'langan va ko'plab siliopatiyalar oshqozon osti bezi silia 47 ning tartibga soluvchi ta'siri bilan oshqozon osti bezida semizlik va insulin sekretsiyasi bilan bog'langan .




Yüklə 393,45 Kb.

Dostları ilə paylaş:
1   2   3   4   5   6   7




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə