Mashinali o’qitishga kirish fanidan 1-oraliq nazorat savollari

Yüklə 169,89 Kb.

tarix	29.11.2023
ölçüsü	169,89 Kb.
	#142664

1-oraliq nazorat savollari

Mashinali o’qitishga kirish fanidan 1-oraliq nazorat savollari
Asosiy savollar
~Mashinali o'qitish va uni qo'llanilish sohalari
Mashinani o'rganish - bu sun'iy intellektning kichik sohasi bo'lib, u aniq dasturlashtirilgan emas, balki kompyuterlarga ma'lumotlar va tajribadan "o'rganish" imkonini beruvchi algoritmlar va modellarni o'rganadi va ishlab chiqadi. Mashinani o'rganish ma'lumotlarni tahlil qilish va sharhlash uchun statistik va matematik usullardan foydalanadi, so'ngra bashorat qiladi, ob'ektlarni tasniflaydi yoki shu tahlil asosida qarorlar qabul qiladi.
Mashina o'rganish turli sohalarda ko'plab ilovalarga ega. Ulardan ba'zilari quyidagilarni o'z ichiga oladi:
1. Naqshlarni tasniflash va tanib olish: Mashinani o'rganish yuzni aniqlash, qo'l yozuvini tanib olish, tasvirlarda ob'ektni aniqlash va boshqalar kabi naqshlarni tasniflash va tanib olish uchun ishlatilishi mumkin. U xavfsizlik tizimlari, tibbiyot, avtomobil sanoati va boshqa sohalarda ilovalarni topadi.
2. Prognozlash va ma'lumotlarni tahlil qilish: Mashinani o'rganish mahsulotga bo'lgan talabni, moliyaviy bozorlarni, iqlim sharoitlarini va hokazolarni bashorat qilish kabi ma'lumotlarni prognoz qilish va tahlil qilish uchun ishlatilishi mumkin. Bu kompaniyalarga ko'proq asosli qarorlar qabul qilish va o'z faoliyatini optimallashtirish imkonini beradi.
3. Tavsiya qiluvchi tizimlar: Mashinani o'rganish foydalanuvchilarga ularning afzalliklari va xatti-harakatlari asosida shaxsiylashtirilgan tavsiyalarni taklif qiluvchi tavsiya qiluvchi tizimlarni yaratish uchun ishlatiladi. Bu onlayn-do'konlarda, oqim xizmatlarida, ijtimoiy tarmoqlarda va boshqa platformalarda keng qo'llaniladi.
4. Tabiiy tilni qayta ishlash: Mashinani o'rganish tabiiy tilni qayta ishlash va tahlil qilish uchun ishlatiladi, jumladan nutqni aniqlash, mashina tarjimasi, hissiyotlarni tahlil qilish, matn yaratish va hokazo. U chatbotlarda, avtomatik matn qazib olishda, qidiruv tizimlarida va boshqa ilovalarda ilovalarni topadi.
5. Avtonom tizimlar va robototexnika: Mashinani o'rganish avtonom tizimlar va robototexnika rivojlanishida muhim rol o'ynaydi. Bunga avtonom avtomobillar, uchuvchisiz uchish apparatlari, qiyin sharoitlarda vazifalarni bajaradigan robotlar va boshqalar kiradi.
Bu mashinani o'rganish ilovalarining kichik ko'rinishi. Aslida, mashinani o'rganish inson faoliyatining ko'plab sohalarini qamrab oladi va katta hajmdagi ma'lumotlarni tahlil qilish va ulardan foydalanish uchun muhim vositadir.
~Chuqur o'qitish va uni katta malumotlarni qayta ishlashdagi o'rni
Deep Learning katta ma'lumotlarni qayta ishlashda muhim rol o'ynaydi. Bu ma'lumotlardan murakkab ierarxik xususiyatlarni olish uchun ko'p qatlamli sun'iy neyron tarmoqlardan foydalanadigan mashinani o'rganishning kichik to'plamidir.
Chuqur o'rganish katta ma'lumotlarni qayta ishlashga ta'sir qilishning bir necha usullari:
1. Xususiyatlarni chiqarish: Chuqur neyron tarmoqlar katta hajmdagi ma'lumotlardan yuqori darajadagi xususiyatlarni avtomatik ravishda ajratib olishga qodir. Bu sizga murakkab naqshlarni va ma'lumotlar o'rtasidagi yashirin munosabatlarni aniqlash imkonini beradi, bu tasniflash, naqshni aniqlash, tasvirni segmentatsiyalash va boshqalar kabi turli vazifalar uchun foydali bo'lishi mumkin.
2. Scalability: Chuqur o'rganish sizga katta hajmdagi ma'lumotlar bilan samarali ishlash imkonini beradi. Grafik ishlov berish bloklari (GPU) va taqsimlangan hisoblashlardan foydalanish katta ma'lumotlar to'plamlarida chuqur modellarni o'qitish va xulosa chiqarishni tezlashtirishga imkon beradi. Bu qaror qabul qilish va aniqroq natijalarga erishish uchun katta hajmdagi ma'lumotlarni tahlil qilish va ulardan foydalanish imkonini beradi.
3. Avtomatik ekstraktsiya: Chuqur modellar aniq dasturlash qoidalari yoki funktsiyalarisiz katta hajmdagi ma'lumotlarga o'rgatiladi. Ular avtomatik ravishda ma'lumotlardan foydali xususiyatlarni ajratib olishlari va murakkab modellarni qurishlari mumkin, bu katta ma'lumotlarni qayta ishlash jarayonini soddalashtiradi va yashirin bog'liqliklarni topishga imkon beradi.
4. Bashorat va umumlashtirish: Chuqur o‘rganish sizga katta hajmdagi ma’lumotlar asosida aniq bashorat qila oladigan modellarni yaratish imkonini beradi. Bu tendentsiyalarni tahlil qilish, kelajakdagi voqealarni bashorat qilish, tavsiyalar va axborotning yuqori aniqligi va umumlashtirilishi talab qilinadigan boshqa vazifalar uchun foydali bo'lishi mumkin.
5. Strukturalanmagan ma'lumotlarni qayta ishlash: chuqur o'rganish tasvirlar, audio, matnlar va videolar kabi tuzilmagan ma'lumotlar bilan samarali ishlaydi. U bunday ma'lumotlarni qayta ishlash va tahlil qilish, tasvirlardagi ob'ektlarni tanib olish, matnlarni boshqa tillarga tarjima qilish, video tavsiflarini yaratish va boshqa ko'p narsalarni amalga oshirishi mumkin. Bu sizga turli xil ma'lumotlar manbalaridan foydali ma'lumotlarni olish imkonini beradi.
Chuqur o'rganish katta ma'lumotlarni qayta ishlashda asosiy rol o'ynaydi, yuqori aniqlik, avtomatik xususiyatlarni ajratib olish va tuzilmagan ma'lumotlar bilan ishlash qobiliyatini ta'minlaydi. U kompyuter ko'rish, tabiiy tilni qayta ishlash, nutqni aniqlash, tavsiya tizimlari va katta hajmdagi ma'lumotlarni tahlil qilish va ulardan foydalanishni talab qiladigan boshqa vazifalar kabi turli sohalarda keng qo'llaniladi.~Sinflarga ajratish masalasi va uni uchun o'qitish algortmlari
~O'qituvchi yordamida o'qitish
Nazorat ostida oʻrganish - bu mashinani oʻrganishdagi asosiy yondashuvlardan biri boʻlib, unda model yorliqli maʼlumotlardan tayyorlanadi, bunda har bir maʼlumot misolida tegishli yorliq yoki toʻgʻri javob mavjud. Trening davomida model yangi, ilgari ko'rilmagan misollar uchun to'g'ri javoblarni bashorat qilish uchun ma'lumotlardagi naqsh yoki qonuniyatlarni aniqlashga intiladi.
O'qituvchi yordami bilan ta'limning asosiy bosqichlari va tamoyillari:
1. Ma'lumotlarni tayyorlash: Ushbu bosqichda ma'lumotlar ikki qismga bo'linadi: o'quv ma'lumotlar to'plami va test ma'lumotlar to'plami. O'quv majmuasi modelni o'rgatish uchun ishlatiladi va test to'plami uning ishlashini baholash uchun ishlatiladi. O'quv to'plamidagi har bir ma'lumot misoli kiritish xususiyatlaridan (masalan, rasm, matn, raqamli qiymatlar) va tegishli yorliq yoki to'g'ri javobdan (masalan, sinf yorlig'i yoki raqamli qiymatdan) iborat.
2. Model tanlash: Vazifa mashg'ulot uchun ishlatiladigan modelni tanlash va aniqlashdir. Model - bu kiritilgan ma'lumotlarni oladigan va tegishli teglar yoki qiymatlarni bashorat qilish uchun transformatsiyani amalga oshiradigan matematik funktsiya.
3. Yo'qotish funktsiyasining ta'rifi: Yo'qotish funktsiyasi (yoki xato funktsiyasi) modelning taxmin qilingan teglari va ma'lumotlardagi haqiqiy teglar orasidagi masofani o'lchash uchun ishlatiladi. Maqsad, model aniqroq bashoratlarga erishishi uchun yo'qotish funktsiyasini minimallashtirishdir.
4. Modelni o'qitish: Bu bosqichda optimallashtirish algoritmi yordamida ichki parametrlarni sozlash orqali model ma'lumotlarga moslashtiriladi. O'qitish modelga kirish ma'lumotlarini kiritish, bashoratlarni hisoblash va ularni haqiqiy teglar bilan taqqoslash orqali amalga oshiriladi. Keyinchalik optimallashtirish algoritmi xatoni kamaytirish uchun model parametrlarini sozlash uchun yo'qotish funktsiyasidan foydalanadi.
5. Modelni baholash: Model o'qitilgandan so'ng, uning ishlashi test ma'lumotlar to'plamida baholanadi. Aniqlik, o'rtacha mutlaq xato yoki F1 balli kabi baholash ko'rsatkichlari modelning yangi ma'lumotlarga to'g'ri javoblarni qanchalik umumlashtirishi va bashorat qilishini o'lchaydi.
6. Modelni qo'llash: Muvaffaqiyatli treningdan so'ng, model yangi, noma'lum ma'lumotlar misollari uchun teglar yoki qiymatlarni bashorat qilish uchun ishlatilishi mumkin.
Nazorat ostidagi o'rganish tasniflash, regressiya va bashorat qilish muammolari uchun keng qo'llaniladi, bu erda kirish ma'lumotlari asosida teglar yoki qiymatlarni bashorat qilish kerak. Ushbu yondashuv tasvirni aniqlash va nutqni aniqlashdan tortib tavsiya qiluvchi tizimlar va matnni qazib olishgacha bo'lgan keng ko'lamli ilovalarga ega.
~O'qituvchisiz o'qitish
Nazoratsiz oʻrganish - bu mashinani oʻrganishdagi yondashuv boʻlib, unda model yorliqsiz maʼlumotlarga oʻrgatiladi, yaʼni maʼlumotlarda tegishli yorliqlar yoki toʻgʻri javoblar yoʻq. Nazoratsiz ta'limning maqsadi ma'lumotlardagi yashirin tuzilmalar, naqshlar yoki guruhlarni aniqlashdir.
Nazoratsiz ta'limning asosiy tamoyillari va usullari:
1. Klasterlash: Bu eng keng tarqalgan nazoratsiz ta'lim usullaridan biridir. Maqsad - ma'lumotlarni o'xshashlik yoki yaqinlik asosida klasterlarga guruhlash. Model ma'lumotlarga o'rgatilgan va uning maqsadi klasterlar chegaralarini aniqlash va har bir ma'lumot misolini mos keladigan klasterga belgilashdir.
2. Ma'lumotlar o'lchovliligi: nazoratsiz o'rganish ma'lumotlarning o'lchamini kamaytirish uchun ham ishlatilishi mumkin. Bu ma'lumotga ega bo'lmagan yoki o'zaro bog'liq xususiyatlarni olib tashlash orqali ma'lumotlarning yanada ixcham ko'rinishini topishni o'z ichiga oladi. Asosiy komponent tahlili (PCA) yoki avtokoderlar kabi usullardan ma'lumotlarni pastroq o'lchamli bo'shliqqa siqish uchun foydalanish mumkin.
3. Assotsiatsiya qoidalari: Bu usul maʼlumotlar toʻplamidagi oʻzgaruvchilar orasidagi yashirin assotsiatsiyalar yoki bogʻliqliklarni aniqlashga qaratilgan. Model xususiyatlarning tez-tez uchraydigan birikmalarini qidiradi va o'zgaruvchilar o'rtasidagi munosabatlar haqida xulosa chiqarish imkonini beruvchi assotsiatsiya qoidalarini belgilaydi.
4. Anomaliyalarni aniqlash: Nazoratsiz o'rganish ma'lumotlardagi anomaliyalarni yoki chetga chiqishlarni aniqlash uchun ishlatilishi mumkin. Model ma'lumotlarning normal modelini yaratishga va ushbu me'yordan sezilarli darajada farq qiluvchi ob'ektlarni aniqlashga intiladi. Bu firibgarlik, tizimdagi nosozliklar yoki boshqa nodir va noodatiy hodisalarni aniqlash uchun foydali bo'lishi mumkin.
5. Generativ modellar: Ushbu modellar sinfi o'quv majmuasiga o'xshash yangi ma'lumotlar misollarini yaratishga imkon beradi. Generativ raqib tarmoqlari (GAN) yoki variatsion avtokoderlar (VAE) kabi modellar ma'lumotlar bo'yicha o'qitiladi va asl ma'lumotlarni taqlid qiluvchi yangi namunalarni yaratishga qodir.
Nazoratsiz o'rganish bizda yorliqli ma'lumotlar bo'lmagan yoki ma'lumotlardagi yashirin tuzilma va bog'liqliklarni o'rganmoqchi bo'lgan holatlarda foydalidir. Ushbu yondashuv turli sohalarda, masalan, ma'lumotlarni qazib olish, tasvirlarni segmentatsiyalash, tavsiya qiluvchi tizimlar, tabiiy tilni qayta ishlash va etiketlanmagan ma'lumotlardan ma'lumot olishni talab qiladigan boshqa vazifalarga ega.

~Mustaxkamlangan o'qitish

~Regresiiya masalasi
Regressiya masalasi - bu turli xil xususiyatlarga ega bo'lgan ob'ektlar namunasiga asoslangan prognoz. Chiqarilgan mahsulot haqiqiy songa ega bo'lishi kerak (2, 35, 76.454 va boshqalar), masalan, kvartira narxi, olti oydan keyin xavfsizlik qiymati, do'konning keyingi oy uchun kutilayotgan daromadi, ko'r-ko'rona sinovlarda sharob sifati.
Mashinani o'rganishda regressiya muammosi kirish xususiyatlariga asoslangan doimiy o'zgaruvchi yoki qiymatni bashorat qilishdir. Maqsad ma'lumotlar misoliga kategorik yorliqni belgilash bo'lgan tasniflash muammosidan farqli o'laroq, regressiya muammosi raqamli qiymatni bashorat qilishni talab qiladi.
Bu erda regressiya muammosi bilan bog'liq ba'zi xususiyatlar va texnikalar:
1. Muammoning bayoni: Regressiya muammosi kirish xususiyatlari va chiqish qiymatlari o'rtasidagi funktsional munosabatni aniqlash bilan bog'liq. Masalan, ko'chmas mulk narxlarini bashorat qilish muammosida kirish xususiyatlari uyning maydoni, yotoq xonalari soni, hammom soni va boshqalar bo'lishi mumkin va chiqish qiymati uyning narxi bo'lishi mumkin.
2. Baholash ko'rsatkichlari: Regressiya modeli sifatini baholash uchun o'rtacha kvadrat xato (MSE), o'rtacha mutlaq xato (MAE), aniqlash koeffitsienti (R^2) va boshqalar kabi turli ko'rsatkichlar qo'llaniladi. Ushbu ko'rsatkichlar modelning taxmin qilingan qiymatlari va haqiqiy qiymatlar o'rtasidagi tafovutni o'lchaydi.
3. Chiziqli regressiya: Bu eng oddiy va keng tarqalgan regressiya usullaridan biridir. Chiziqli regressiyada model ma'lumotlarga eng mos keladigan chiziqli funktsiyani yaratadi. Usul taxmin qilingan qiymatlar va haqiqiy qiymatlar o'rtasidagi xatolikni minimallashtirish orqali optimal koeffitsient qiymatlarini topadi.
4. Regularizatsiya: haddan tashqari moslashishga qarshi kurashish va regressiya modelining umumlashtirish qobiliyatini yaxshilash uchun tartibga solish qo'llaniladi. Regularizatsiya modelning koeffitsient qiymatlarini kamaytirish va uni yanada mustahkam qilish uchun yo'qotish funktsiyasiga jarima shartlarini qo'shadi.
5. Nochiziqli regressiya: Kirish xususiyatlari va chiqish qiymatlari o'rtasidagi bog'liqlik chiziqli bo'lmagan hollarda chiziqli bo'lmagan regressiya usullari qo'llaniladi. Ushbu usullar ko'p nomli regressiya, qarorlar daraxtlari, vektor regressiyasini qo'llab-quvvatlash (SVR) va neyron tarmoqlar kabi turli xil algoritmlardan foydalangan holda chiziqli bo'lmagan funktsiyani modellashtiradi.
6. Xususiyatlarni qayta ishlash: regressiya muammosida xususiyatni tayyorlash va qayta ishlash ham muhim rol o'ynaydi. Bu xususiyatlarni masshtablash, etishmayotgan qiymatlarni qayta ishlash, kategorik xususiyatlarni o'zgartirish va hokazolarni o'z ichiga olishi mumkin.
Regressiya muammosi moliya, iqtisod, tibbiyot, vaqt seriyalarini prognozlash va boshqa sohalarda keng qo'llaniladi, bu erda mavjud ma'lumotlar asosida raqamli qiymatlarni bashorat qilish kerak.
~Chiziqli regressiya
Chiziqli regressiya mashinani o'rganishda asosiy va eng oddiy regressiya usullaridan biridir. U bashorat qilingan qiymatlar va haqiqiy qiymatlar o'rtasidagi kvadratik og'ishlar yig'indisini minimallashtirish orqali ma'lumotlarga eng mos keladigan chiziqli funktsiyani yaratadi.
Bu erda chiziqli regressiya bilan bog'liq asosiy tushunchalar va qadamlar:
1. Chiziqli model: Chiziqli regressiya qaram o'zgaruvchining kirish xususiyatlariga chiziqli bog'liqligini nazarda tutadi. Bir o'zgaruvchan regressiya uchun buni to'g'ri chiziq tenglamasi bilan ifodalash mumkin: y = mx + b, bu erda y - bog'liq o'zgaruvchi, x - kirish xususiyati, m - nishab koeffitsienti va b - kesishish hadi. Ko'p o'zgaruvchan regressiya uchun chiziqli model quyidagi ko'rinishga ega: y = b0 + b1*x1 + b2*x2 + ... + bn*xn, bu erda b0, b1, ..., bn - model koeffitsientlari, xi - kirish xususiyatlari.
2. Yo'qotish funktsiyasi: chiziqli regressiyaning maqsadi - bashorat qilish xatosini minimallashtirishda model koeffitsientlarining optimal qiymatlarini topish. Odatda, o'rtacha kvadrat xato (MSE) prognoz qilingan qiymatlar va haqiqiy qiymatlar o'rtasidagi standart og'ishni o'lchaydigan yo'qotish funktsiyasi sifatida ishlatiladi.
3. Eng kichik kvadratlar usuli: Model koeffitsientlarining optimal qiymatlarini topish uchun eng kichik kvadratlar usuli qo'llaniladi. Bu usul chiziqli tenglamalar tizimini yechish yoki raqamli optimallashtirish usullarini qo'llash orqali yo'qotish funksiyasini minimallashtirish muammosini kamaytiradi.
4. Modelli trening: Chiziqli regressiyani o'rgatish kirish xususiyatlaridan va mos keladigan haqiqiy qiymatlardan iborat o'quv ma'lumotlar to'plamini talab qiladi. Model optimal koeffitsient qiymatlarini topish orqali ma'lumotlarga moslashtiriladi.
5. Modelni baholash: Modelni o'rgatgandan so'ng, uning sifatini baholash kerak. Buning uchun o'rtacha kvadrat xato (MSE), o'rtacha mutlaq xato (MAE), aniqlash koeffitsienti (R^2) va boshqalar kabi baholash ko'rsatkichlari qo'llaniladi.
6. Kengaytmalar va yaxshilanishlar: Chiziqli regressiyani ko‘p nomli xususiyatlarni qo‘shish, tartibga solishni qo‘llash (masalan, L1 Lasso yoki L2 Ridge regressiyasi), faollashtirish funksiyalaridan foydalangan holda chiziqli bo‘lmagan munosabatlarni hisobga olgan holda yoki tizma regressiyasi (ElasticNet) kabi ilg‘or modellar yordamida kengaytirilishi va yaxshilanishi mumkin. ) yoki lasso regressiyasi (Lasso).
Chiziqli regressiya ma'lumotlardagi munosabatlarni bashorat qilish va modellashtirish uchun keng qo'llaniladi. Bu murakkabroq regressiya modellari qurilgan va ishlatilishi mumkin bo'lgan asosiy usuldir Chiziqli regressiya - qaram o'zgaruvchi va bir yoki bir nechta mustaqil o'zgaruvchilar o'rtasidagi munosabatlarni modellashtirish uchun ishlatiladigan statistik usul. U mustaqil va qaram o'zgaruvchilar o'rtasidagi chiziqli munosabatni nazarda tutadi.
Chiziqli regressiya ma'lumotlarga eng mos keladigan chiziqni (yoki ko'p o'zgaruvchan holatda giperplanni) quradi. Bunga qaram o'zgaruvchining haqiqiy qiymatlari va chiziqli modeldan olingan bashorat qilingan qiymatlar o'rtasidagi kvadratik farqlar yig'indisini minimallashtirish orqali erishiladi.
Chiziqli regressiyaning asosiy taxminlari:
1. Chiziqlilik: Mustaqil va bog'liq o'zgaruvchilar o'rtasidagi munosabatlar chiziqli deb qabul qilinadi. Agar munosabatlar chiziqli bo'lmasa, ma'lumotlarni o'zgartirish yoki boshqa modellardan foydalanish kerak bo'lishi mumkin.
2. Xatolarning mustaqilligi: Model xatolari (haqiqiy va bashorat qilingan qiymatlar orasidagi farq) mustaqil bo'lishi va doimiy dispersiyaga ega bo'lishi kerak (homosedastiklik). Agar xatolar bir-biriga bog'liq bo'lmasa yoki tizimli bo'lsa, bu modelda hisobga olinmagan boshqa omillar mavjudligini ko'rsatishi mumkin.
3. Xatolarning normalligi: xatolar o'rtacha 0 bilan normal taqsimlangan deb faraz qilinadi. Bu model koeffitsientlarining ahamiyatini baholash va statistik xulosalar qilish uchun statistik usullardan foydalanish imkonini beradi.
4. Multikollinearlik: Mustaqil o'zgaruvchilar bir-biri bilan yuqori korrelyatsiyaga ega bo'lmasligi kerak. Agar mustaqil o'zgaruvchilar o'rtasida yuqori korrelyatsiya mavjud bo'lsa, bu vaznlarni baholash va modelni sharhlashni qiyinlashtirishi mumkin.
Chiziqli regressiyani baholash va talqin qilish usullariga eng kichik kvadratlar yordamida model koeffitsientlarini topish, koeffitsientlarning ahamiyatini baholash, statistik testlarni o'tkazish, modelni baholash ko'rsatkichlaridan foydalanish (R-kvadrat kabi) va qoldiqlarni tahlil qilish (haqiqiy va taxmin qilingan qiymatlar o'rtasidagi farq) kiradi. .
Chiziqli regressiya bashorat qilish, omillarning bog'liq o'zgaruvchiga ta'sirini aniqlash, mustaqil o'zgaruvchilarning ahamiyatini aniqlash va oddiy modellarni yaratish uchun foydali bo'lishi mumkin. Biroq, u cheklovlarga ega va o'zgaruvchilar orasidagi murakkab munosabatlar yanada murakkab regressiya modellarini talab qilishi mumkin.
~Polinomial regressiya
Ko'p nomli regressiya - bu mustaqil va qaram o'zgaruvchilar o'rtasidagi chiziqli bo'lmagan munosabatlarni modellashtirish imkonini beruvchi chiziqli regressiyaning kengaytmasi. Chiziqli funktsiya o'rniga polinom regressiyasi model sifatida ko'p nomli funktsiyadan foydalanadi.
Ko'p nomli regressiyaning asosiy g'oyasi modelga mustaqil o'zgaruvchilarning darajalarini (polinom xususiyatlari) qo'shishdir. Masalan, bitta mustaqil o'zgaruvchi x bo'lgan bir o'zgaruvchan polinomli regressiya uchun model quyidagicha ko'rinishi mumkin: y = b0 + b1*x + b2*x^2 + ... + bn*x^n, bu erda n - daraja. polinom, b0, b1 , ..., bn - model koeffitsientlari.
Polinomli regressiyani yaratish jarayoni quyidagi bosqichlarni o'z ichiga oladi:
1. Ko'p nomli xususiyatlarni yaratish: Modelga mustaqil o'zgaruvchilar darajalarini qo'shish kerak. Har bir x mustaqil o'zgaruvchisi uchun 1 dan n gacha (yoki yetarli bo'lsa, undan kam) darajalar yaratiladi. Masalan, ikkinchi darajali ko'phad uchun x^2, x^3 va hokazo xususiyatlar qo'shiladi.
2. Model qurish: Polinom xususiyatlarni yaratgandan so'ng, model chiziqli regressiyaga o'xshash tarzda quriladi. Model koeffitsientlarini baholash uchun eng kichik kvadratlar usulidan foydalanish mumkin.
3. Modelni baholash: Model sifatini o'rtacha kvadrat xato (MSE), o'rtacha mutlaq xato (MAE), aniqlash koeffitsienti (R^2) va boshqalar kabi turli ko'rsatkichlar yordamida baholash mumkin.
4. Modelning talqini: Modelning koeffitsientlari xuddi chiziqli regressiyadagi kabi talqin qilinishi mumkin. Ular har bir xususiyatning bog'liq o'zgaruvchini bashorat qilishga qo'shgan hissasini ifodalaydi.

Ko'p nomli regressiya o'zgaruvchilar orasidagi munosabatlar chiziqli bo'lmagan hollarda foydali bo'lishi mumkin. Bu o'zgaruvchilar orasidagi egri chiziqli munosabatlarni yanada moslashuvchan modellashtirish imkonini beradi. Ammo shuni hisobga olish kerakki, polinomli regressiyadan foydalanish polinom darajalari yuqori bo'lganda yoki ma'lumotlar miqdori etarli bo'lmaganda modelni haddan tashqari moslashtirishga olib kelishi mumkin.

Polinom darajasini tanlashda modelning murakkabligi va umumlashtirish qobiliyati o'rtasidagi muvozanatni hisobga olish kerak. Juda yuqori polinom darajasi haddan tashqari moslashishga olib kelishi mumkin, juda past bo'lgan polinom darajasi esa chiziqli bo'lmagan munosabatlarni ushlay olmaydi. Ko'phadning optimal darajasini topish o'zaro tekshirish yoki qoldiq tahlil kabi usullar yordamida amalga oshirilishi mumkin.
~Mashinali o'qitish uchun instrumental vositalar
Mashinada o'rganish va sun'iy intellekt, albatta, texnologik yutuqlardir. AI texnologiyalarining mashhurligi tobora ortib bormoqda, demak, ularga bo'lgan talab ham ortib bormoqda. Bu butun ishlab chiquvchilar jamoasining ko'payishiga va o'rganish va ishlashni osonlashtiradigan AI ramkalarining paydo bo'lishiga olib keladi.
Framework - bu dasturiy mahsulotni tezroq ishlab chiqishga imkon beradigan vositalar va standart dasturlar to'plami. Uni ko'pincha kutubxona bilan aralashtirib yuborishadi, bu esa, o'z navbatida, muammoni hal qilishni osonlashtiradigan standart dasturlar, funktsiyalar va ma'lumotlar tuzilmalari to'plamidir.

Sodda savollar

~Chuqur o'qitish - Chuqur o'rganish - bu mashinani o'rganishning kichik sohasi bo'lib, u aqlli bashorat yoki qarorlarni o'rganish va qabul qilish uchun sun'iy neyron tarmoqlarni o'qitishga qaratilgan.
~mashinali o'qitish - Mashinani o'rganish - bu sun'iy intellekt (AI) sohasi bo'lib, u kompyuterlarga aniq dasturlashtirilmagan holda ma'lumotlardan o'rganish va bashorat qilish yoki qaror qabul qilish imkonini beradigan algoritmlar va modellarni ishlab chiqishga qaratilgan.
~Python - dasturlash tili sodda va o’qilishi oddiy bo’lgan dasturlash tili bo’lib u inglizcha so’zlarni qo’llab quvvatlaydi kalit so’zlar o’rnida shuning uchun bu boshqacha ko’rinishga ega.
~Java - Java qati’y va statik tipizatsiyaga ega boʻlgan va obyektga yoʻnaltirilgan umumiy maqsaddagi dasturlash tilidir. Avvaliga Sun Microsystems tomonidan ishlab chiqilgan, keyinchalik Oracle kompaniyasi tarafidan sotib olingan.
~Sensor - bu bir yoki bir nechta asosiy o'lchash transduserlarini o'z ichiga olgan tizimli ravishda alohida qurilma
~Malumotlar toplami
Ma'lumotlar to'plami - bu mashinani o'rganish modellarini o'rgatish va sinab ko'rish uchun foydalaniladigan ma'lumotlar to'plami.

~O'qitiliuvchi tanlanma - Mashinani o'rganish - bu sun'iy intellektning bo'limi bo'lib, u ma'lumotlardan "o'rgana oladigan" va aniq dasturlashsiz bashorat yoki qarorlar qabul qila oladigan algoritmlar va modellarni ishlab chiqish bilan shug'ullanadi.
~Testlanuvchi tanlanma - Testlanuvchi tanlanma, kompyuterli matematik modellar yordamida testlar yaratish va tahlil qilish usulidir. Bu usul, testlarni yaratish va tahlil qilish jarayonini avtomatlashtiradi va o'quvchilarning yutuqlarini va kamchiliklarini aniqlashga yordam beradi.

~O'qituvchi yordamida o'qitish - Bu ma’lumotlarni tasniflash yoki natijalarni aniq bashorat qilish uchun algoritmlarni o‘rgatish uchun etiketli ma’lumotlar to‘plami hisoblanadi. Kirish ma’lumotlari modelga kiritilganligi sababli, model mos ravishda o‘qitgunga qadar uning vaznlarini moslashtiradi va bu o‘zaro tekshirish jarayonining bir qismi sifatida sodir bo‘ladi. Bu o‘qitish asosan spamni elektron pochtalarda alohida papkada tasniflash kabi turli xil real muammolarni hal qilishda yordam beradi.

~O'qituvchisiz o'qitish - har bir foydalanish uchun faqat “vaziyat” o’rnatiladi, ob’ektlarning juft o’xshashligi to’g’risidagi ma’lumotlar yordamida ob’ektlarn guruhlarga yordamida ob’ektlarni guruhlarga birlashtirish va/yoki ma’lumo tlarning hajmini kamaytirish talab qilinadi.

~Regressiya - (matematikada) biror (u) tasodifiy miqdor oʻrta qiymatining boshqa bir tasodifiy miqdoriga bogʻlikligi. Funksional bogʻlanishda miqdorning har bir qiymatiga u miqdorning bitta qiymati mos kelsa, regressiv bogʻlanishda x ning x qiymatiga turli

hollarda turli qiymatlar mos keladi.

~Chiziqli regressiya - Chiziqli regressiya chiziqlar bo'ylab ajratilishi mumkin bo'lgan ma'lumotlar uchun ajoyib ishlaydi. U tartibga solish, o'zaro tekshirish va o'lchamlarni kamaytirish usullaridan foydalangan holda ortiqcha moslamani boshqarishi mumkin.

~Polinomal regressiya - Statistikada polinomal regressiya regressiya tahlilining bir shakli bo‘lib, unda x mustaqil o‘zgaruvchisi va y bog‘liq o‘zgaruvchisi o‘rtasidagi bog‘liqlik x da n-darajali ko‘phad sifatida modellashtiriladi.

~Logistik regresiiya - bu o'zgaruvchilardan o'zaro bog'liqlikni aniqlash usulidir, ulardan biri qat'iyan bog'liq, boshqalari esa mustaqil. Buning uchun logistik funksiyadan

(akkumulyativ logistik taqsimot) foydalaniladi. Logistik regressiyaning amaliy qiymati shundaki, u bir yoki bir nechta mustaqil o'zgaruvchini o'z ichiga olgan voqealarni bashorat qilishning kuchli statistik usuli hisoblanadi.

~Sinflarga ajratish masalasi - Klassifikatsiya algoritmi -bu nazorat ostida o'qitish usuli bo'lib, u o'quv ma'lumotlari asosida yangi kuzatuvlar toifasini aniqlash uchun ishlatiladi. Klassifikatsiyada dastur berilgan ma'lumotlar to'plami yoki kuzatuvlardan o'rganadi

va keyin yangi kuzatishni bir qator sinflar yoki guruhlarga tasniflaydi.
Masalan, Ha yoki Yoʻq, 0 yoki 1, Spam yoki Spam emas, mushuk yoki it va hokazo. Sinflarni maqsad/yorliq yoki toifalar deb atash mumkin.

~Mustaxkamlangan o'qitish - Mustahkamlovchi o'rganish ma'lum bir kichik to'plamini

Anglatadi kompyuterni o'rganishbu kerakli xatti-harakatlarni mukofotlash va istalmagan xatti-
harakatlarni jazolash orqali echimlarni topishga qaratilgan.

~Freymwork

Framework - bu dasturiy mahsulotni tezroq ishlab chiqishga imkon beradigan vositalar va standart dasturlar to'plami. Uni ko'pincha kutubxona bilan aralashtirib yuborishadi, bu esa, o'z navbatida, muammoni hal qilishni osonlashtiradigan standart dasturlar, funktsiyalar va ma'lumotlar tuzilmalari to'plamidir.
~TensorFlow
TensorFlow - bu ochiq manbali, keng qamrovli mashinalarni o'rganish platformasi. Bu Google Brain jamoasi tomonidan DistBelief kengaytmasi sifatida ishlab chiqilgan, bu kompyuterni yopiq o'qitish tizimi, ammo 2015 yil noyabrida kompaniya o'z fikrini o'zgartirib, bepul kirish uchun asos yaratdi.
~Keras
Keras - bu Python-da yozilgan ochiq manbali chuqur o'rganish freymworki. U Google muhandisi Fransua Sxollet tomonidan ishlab chiqilgan va 2015 yil mart oyida taqdim etilgan.
~KNIME
Knime - bu "Konstanz Information Miner" degan ma'noni anglatuvchi ochiq kodli Java o'zaro faoliyat platforma dasturi. Aslida, u ma'lumotlarni tahlil qilish, ma'lumotlarni tahlil qilish va optimallashtirish uchun keng qo'llaniladi.
~PyTorch
PyTorch - bu GPU tezlashtirilgan tensorli hisoblashni ta'minlaydigan ochiq kodli Python mashinasini o'rganish freymworki. U Facebook tomonidan ishlab chiqilgan va 2016 yil oktyabr oyida chiqarilgan va 2017 yil yanvar oyida uchinchi tomon ishlab chiquvchilariga ochilgan. Ushbu ramka tadqiqotlarda tezkor prototiplarni yaratish, shuningdek, havaskorlar va kichik loyihalar uchun javob beradi.
~Darknet
Darknet - CUDA dasturiy ta'minoti / apparati parallel hisoblash arxitekturasidan foydalangan holda C tilida yozilgan ochiq manba freymworkdir. Bu tez, yengil va ishlatish uchun qulay. Darknet shuningdek, CPU va GPU hisoblashlarini qo'llab-quvvatlaydi.
~XGBooSt
XGBoost - bu C ++, Java, Python, R, Julia uchun gradientni kuchaytirish tizimini taklif qiluvchi ochiq manbali fremwork. U yuqori ishlash, moslashuvchanlik va portativlik uchun mo'ljallangan.
~Microsoft Azure ML Microsoft Azure Machine Learning - bu MS Azure-ning yangilangan versiyasi bo'lgan Microsoft-ning bulutli hisoblash infratuzilmasi.
~Rapid Miner - ilgari YALE (yana bir o'quv muhiti - yana bir o'quv muhiti) nomi bilan tanilgan deyarli eng mashhur ma'lumotlarni tahlil qilish vositasidir.
~Apache Mahout - bu mashinani o'rganish modellarini yaratish uchun kengaytiriladigan algoritmlar va vositalarni taqdim etadigan ochiq manbali mashina o'rganish kutubxonasi. U keng ko'lamli ma'lumotlar to'plamlari bilan ishlash uchun mo'ljallangan va katta ma'lumotlarni samarali boshqarish uchun taqsimlangan hisoblash va parallel ishlov berishga qaratilgan.
~Anaconda
Anaconda Navigator - bu foydalanuvchilarga buyruq satri buyruqlarini ishlatmasdan dasturlarni ishga tushirish va oddiy paketlar, muhit va quvurlarni boshqarish imkonini beradigan, Anaconda taqsimotiga kiritilgan grafik foydalanuvchi interfeysi (GUI).
~PyCharm -JetBrains tomonidan ishlab chiqilgan Python dasturlash tili uchun Integrated Development Environment (IDE). U Python dasturlarini ishlab chiqish uchun qulay vositalarni taqdim etadi, jumladan kodni to'ldirish, disk raskadrovka, versiyalarni boshqarish va boshqalar.
~Bilim nima?
Bilim nima? bu taxmin qilingan natija bilan harakat qilishga imkon beradigan ma'lumot
~Axborot nima?
Axborot nima? noaniqlikni kamaytirish uchun yangi dalillar
~Malumot nima? - qayd etilgan faktlar to'plami

Yüklə 169,89 Kb.

Dostları ilə paylaş: