Mavzu: Mashinali o’qitishga kirish va uning asosiy tushunchalari, algoritmlari



Yüklə 0,65 Mb.
səhifə3/6
tarix26.10.2023
ölçüsü0,65 Mb.
#130907
1   2   3   4   5   6
1- amaliy mashg'ulot

2. Logistik regressiya
Logistik regressiya - bu to'g'ridan-to'g'ri statistikadan mashinani o'rganishga kelgan yana bir algoritm. Uni ikkilik tasniflash muammolari uchun ishlatish yaxshidir (bular biz ikkita sinfdan birini chiqish sifatida oladigan muammolar).
Logistik regressiya chiziqli regressiyaga o'xshaydi, chunki u sizdan kiritilgan o'zgaruvchilar uchun koeffitsientlarning qiymatlarini topishni talab qiladi. Farqi shundaki, chiqish qiymati chiziqli bo'lmagan yoki logistik funktsiya yordamida aylantiriladi.
Logistik funktsiya S bosh harfiga o'xshaydi va har qanday qiymatni 0 dan 1 gacha bo'lgan raqamga aylantiradi. Bu juda foydali, chunki logistik funktsiyaning chiqishiga 0 va 1 ni bog'lash qoidasini qo'llashimiz mumkin (masalan, agar funktsiyaning natijasi 0,5 dan kichik bo'lsa, u holda chiqish 1) va sinf bashoratlari.

Modelni o'qitish usuli tufayli logistik regressiya bashoratlari namunaning 0 yoki 1-sinfda bo'lish ehtimolini ko'rsatish uchun ishlatilishi mumkin. Bu bashorat qilish uchun ko'proq dalillar kerak bo'lganda foydalidir.
Chiziqli regressiyada bo'lgani kabi, logistik regressiya ham ortiqcha va shunga o'xshash o'zgaruvchilar olib tashlanganida o'z ishini yaxshiroq bajaradi. Logistik regressiya modeli tezda o'rganadi va ikkilik tasniflash muammolari uchun juda mos keladi.
3. Chiziqli diskriminant tahlili (LDA)
Logistik regressiya namunani ikkita sinfdan biriga tayinlash kerak bo'lganda qo'llaniladi. Agar ikkitadan ortiq sinf mavjud bo'lsa, LDA algoritmidan foydalanish yaxshiroqdir ( Linear diskriminant tahlil ).
LDA ni ifodalash juda oddiy. U har bir sinf uchun hisoblangan ma'lumotlarning statistik xususiyatlaridan iborat. Har bir kirish o'zgaruvchisi uchun quyidagilar kiradi:

  • Har bir sinf uchun o'rtacha qiymat;

  • Barcha sinflar uchun hisoblangan dispersiya.


Har bir sinf uchun diskriminant qiymatini hisoblash va eng katta qiymatga ega sinfni tanlash orqali bashorat qilinadi. Ma'lumotlar normal taqsimotga ega deb taxmin qilinadi, shuning uchun ishni boshlashdan oldin ma'lumotlardan anomal qiymatlarni olib tashlash tavsiya etiladi. Bu tasniflash muammolari uchun oddiy va samarali algoritmdir.

Yüklə 0,65 Mb.

Dostları ilə paylaş:
1   2   3   4   5   6




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə