Mavzu: Mashinali o’qitishga kirish va uning asosiy tushunchalari, algoritmlari



Yüklə 0,65 Mb.
səhifə4/6
tarix26.10.2023
ölçüsü0,65 Mb.
#130907
1   2   3   4   5   6
1- amaliy mashg'ulot

4. Qarorlar daraxtlari
Qarorlar daraxti algoritmlar va ma'lumotlar tuzilmalarida ko'pchilikka tanish bo'lgan ikkilik daraxt sifatida ifodalanishi mumkin. Har bir tugun kirish o'zgaruvchisini va ushbu o'zgaruvchining bo'linish nuqtasini ifodalaydi (o'zgaruvchi raqam bo'lsa).

Barg tugunlari bashorat qilish uchun ishlatiladigan chiqish o'zgaruvchisidir. Daraxtni barg tuguniga o'tkazish va shu tugundagi sinf qiymatini chiqarish orqali bashorat qilinadi.
Daraxtlar tezda o'rganadilar va bashorat qiladilar. Bundan tashqari, ular keng ko'lamli ilovalar uchun aniq va maxsus ma'lumotlarni tayyorlashni talab qilmaydi.
5 . Naive Bayes klassifikatori
Naive Bayes oddiy, ammo juda samarali algoritmdir.
Model ikki xil ehtimollikdan iborat bo'lib, ular o'quv ma'lumotlari yordamida hisoblanadi:

  1. Har bir sinfning ehtimoli.

  2. X ning har bir qiymatida har bir sinf uchun shartli ehtimollik.

Ehtimoliy model hisoblab chiqilgandan so'ng, Bayes teoremasi yordamida yangi ma'lumotlar bilan bashorat qilish uchun foydalanish mumkin. Agar sizda haqiqiy ma'lumotlar mavjud bo'lsa, unda normal taqsimotni hisobga olsak, bu ehtimolliklarni hisoblash unchalik qiyin emas.

Naive Bayes sodda deb ataladi, chunki algoritm har bir kirish o'zgaruvchisi mustaqil deb hisoblaydi. Bu haqiqiy ma'lumotlarga mos kelmaydigan kuchli taxmindir. Shunga qaramay, ushbu algoritm spamni tasniflash yoki qo'lda yozilgan raqamlarni aniqlash kabi bir qator murakkab vazifalar uchun juda samarali.
6. K-eng yaqin qo'shnilar (KNN)
K-eng yaqin qo'shnilar - bu juda oddiy va juda samarali algoritm. KNN modeli (K- eng yaqin qo'shnilar ) butun o'quv ma'lumotlar to'plami bilan ifodalanadi. Juda oddiy, to'g'rimi?
Yangi nuqtani bashorat qilish ma'lumotlar to'plamidagi K eng yaqin qo'shnilarni qidirish va ushbu K misollari uchun chiqish o'zgaruvchisini yig'ish orqali amalga oshiriladi.
Bitta savol - ma'lumotlar misollari o'rtasidagi o'xshashlikni qanday aniqlash mumkin. Agar barcha xususiyatlar bir xil shkalada bo'lsa (masalan, santimetr), u holda eng oson yo'li Evklid masofasidan foydalanishdir, bu raqamni har bir kirish o'zgaruvchisi bilan farqlar asosida hisoblash mumkin.



KNN barcha ma'lumotlarni saqlash uchun juda ko'p xotira talab qilishi mumkin, ammo u tezda bashorat qiladi. Vaqt o'tishi bilan bashoratlarni to'g'ri saqlash uchun trening ma'lumotlari ham yangilanishi mumkin.
Eng yaqin qo'shnilar g'oyasi ko'p o'lchovli ma'lumotlar (ko'p kirish o'zgaruvchilari) bilan yaxshi ishlamasligi mumkin, bu muammoni hal qilishda algoritm samaradorligiga salbiy ta'sir qiladi. Bu o'lchovlilikning la'nati deb ataladi. Boshqacha qilib aytganda, siz faqat eng muhim bashoratli o'zgaruvchilardan foydalanishingiz kerak.

Yüklə 0,65 Mb.

Dostları ilə paylaş:
1   2   3   4   5   6




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə