O’zbekiston respublikasi aloqa, axborotlashtirish va telekommunikasiya texnologiyalari davlat qo`mitasi



Yüklə 1,59 Mb.
Pdf görüntüsü
səhifə10/25
tarix17.06.2023
ölçüsü1,59 Mb.
#117611
1   ...   6   7   8   9   10   11   12   13   ...   25
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 


27 
II BOB. MA’LUMOTLARNI INTELLEKTUAL TAHLIL ETISHDA 
KLASTERIZATSIYA MASALASI ALGORITMLARI 
Ushbu bobda ma‘lumotlarni intellektual tahlil etish jarayonida 
klasterizatsiya masalasi algoritmlari aks ettirilgan bo‗lib, paragrafning birinchi 
qismida klasterizatsiya masalasini tizimli yechishning formal qo‘yilishi va 
algoritmlar tahlillari to‘g‘risida ma‘lumotlar berilgan va ular qarab o‗tilgan. 
Ikkinchi qismida esa klasterizatsiya algoritmlarida qo‘llaniladigan masofaga 
asoslangan yaqinlik darajasining o‘lchovi keltirilgan. Uchunchi qismida esa bu 
keltirilgan algoritmlarning qiyosiy tahlili aks ettirilgan. 
1.
 
Klasterizatsiya masalasini tizimli yechishning formal quyilishi 
 
Klasterlar analizi haqidagi birinchi nashr o‘tgan yuz yillikning 30-
yillarida paydo bo‘ldi. Ammo bu usulning faol rivojlanishi va uning keng 
qo‘llanilishi 60-yillar oxiri, 70-yillar boshiga to‘g‘ri keladi. Keyinchlik bu ko‘p 
o‘lchamli analizni yo‘nalish intensiv ravishda tarqaldi, yangi usullari paydo 
bo‘ldi, ma‘lum algoritmlar modefikatsiyalandi, klasterlar analizining tadbiq 
etilish sohasi sezilarli darajada kengaydi. Agar dastlab ko‘p o‘lchamli sinflash 
psixalogiya, bialogiya, arxeologiya sohalarida qo‘llanilgan bo‘lsa, hozir esa ular 
sotsialogiya, iqtisod, statistika va tarixiy izlanishlarda ham faol qo‘llanilmoqda. 
Hisoblash mashinalari paydo bo‘lgandan keyin ularning qo‘llanilishi alohida bir 
ko‘rinishda kengayib bordi. Bu katta hajmdagi axborotlarni ishlash bilan 
bog‘liq[13].
Klasterizatsiya klassifikatsiyadan farqi shundaki, o‘rganiladigan analizda 
ajratilgan maqsad o‘zgaruvchilari talab etilmaydi. Shu nuqtai nazardan u 
unsupervised learning sinfiga qarashli bo‘ladi. Bu masalani o‘rganishning 
birinchi bosqichida ma‘lumot haqida juda kam ma‘lum bo‘lganda echiladi. 
Uning yechimi ma‘lumotni yaxshiroq tushunishga yordam beradi. Bu nuqtai 
nazardan klasterizatsiya masalasi tavsifiy masala bo‘ladi (discriptive). 
Klasterizatsiya bosqichlari uchun yozuvlar va o‘zgaruvchilar orasidagi farq 


28 
yo‘qligidir, aksincha yaqinroq guruhlar va o‘xshash yozuvlar izlanadi. 
Avtomatik klasterlarga bo‘linish usuli to‘g‘ridan – to‘g‘ri kam ishlatiladi, faqat 
o‘xshash ob‘yektlar guruhini hosil qilish uchun ishlatiladi. Klasterlarga ajratish 
bilan analiz boshlanadi. Klasterlarni aniqlagandan so‘ng bosha Data Mining 
usullaridan foydalanib, klasterlarga bo‘linish nimani bildirishi, u nima bilan 
bog‘liqligini aniqlashga harakat qiladi[13,14]. 
Klasterlar analizining katta ahamiyatga egaligi shundaki, u ob‘yektlar 
bo‘linishini bitta parametr bo‘yicha olmaydi, balki butun belgilar majmuasini 
qamrab oladi. Bundan tashqari klasterlar analizi boshqa ko‘pgina matematik – 
statistik usullardan farqli ravishda, qaralayotgan ob‘yektlarga hech qanday 
chegaralash quyilmaydi va ma‘lumotlarning boshlang‘ich to‘plami sifatida 
tabiatdagi ixtiyoriy to‘plamni qarashga yo‘l beradi.
Klasterlar analizi katta hajmdagi axborotlarni ko‘rish va keskin 
qisqartirish, katta massivli axborotlarni siqish, ularni kompakt va yaqqol qilish 
imkoniyatini beradi.
Klasterizatsiya masalasi o‘rganilayotgan ob‘yektlar to‘plamini klasterlar 
deb ataluvchi ―o‘xshash‖ ob‘yektlar guruhlariga ajratishdan iborat. Klaster so‘zi 
ingliz tilidan kelib chiqqan bo‘lib (claster), zichlik, dasta, guruh kabi tarjima 
qilish mumkin. Adabiyotda qo‘llaniladigan o‘xshash ma‘nolari sinf, takson, 
zichlanish degan ma‘nolarni beradi. Ba‘zan, to‘plam elementlarini klasterlarga 
ajratish masalasi klasterlar analizi deb ataladi. Klassefikatsiya masalasining 
yechimida har bir ma‘lumotlar ob‘yekti oldindan aniqlangan bir (yoki bir necha) 
sinfga oid bo‘ladi va ma‘lumotlar ob‘ekti to‘plamini sinflarga ajratish aniq 
hisoblarga asoslanadi. Klasterlash masalasida esa har bir ma‘lumotlar ob‘ektlari 
oldindan aniqlangan bir (yoki bir necha) sinflarga oidligi aniqlanadi. 
Ma‘lumotlar ob‘ektlarini klasterlarga ajratish ham ularni shakllantirish bilan bir 
vaqtda amalga oshiriladi. Klasterlarni aniqlash va ma‘lumotlar ob‘ektlari 
bo‘yicha bo‘linish ma‘lumotlarning yakuniy modelini beradi. Bu model o‘z 
vaqtida klasterizatsiya masalasining yechimi bo‘ladi[14].
Qaralayotgan klasterizatsiya masalasining qator xususiyatlarini qaraymiz. 


29 
- Birinchidan, ob‘ektlar ma‘lumotlari yechmi tabiatiga (va ular atributiga ) 
kuchli bog‘liq. Demak, boshqa tamondan bu ob‘ektlarning qat‘iy miqdoriy 
qiyofasini aniqlaydi, boshqa tamondan esa ehtimollikka ega yoki noqat‘iy 
tavsifli ob‘ektlarni bildiradi. 
- Ikkinchidan, yechim sinfining ifodalanishi va faraz qilingan ma‘lumotlar 
ob‘ekti munosabatiga va sinflarga ham katta bog‘liq. Ob‘ektlarning bir necha 
sinfga qarashli bo‘lish imkoniyati borligi yoki imkoni yo‘qligini bilish zarur. 
Sinfga qarashlilik xossasining o‘zini ham aniqlash zarur: bir qiymatli (qarashli, 
qarashli emas), ehtimollik (qarashlilik ehtimoli), noqat‘iy (qarashlilik darajasi). 
Klasterizatsiya masalasi ma‘lumotlarning intellektual analizida muhim 
o‘rin egallab, uning yechimi uchun ko‘pgina usullar ishlab chiqilgan. Ulardan 
biri – ma‘lumotlar ob‘ektining berilgan sinfga qarashli yoki qarashli emasligini 
ko‘rsatuvchi sinflarning xarakteristik funksiyalari majmuasini qurish. 
Sinflarning xarakteristik funksiyasi ikki ko‘rinishda bo‘lishi mumkin: 
1.
Ma‘lumotlar ob‘ektini berilgan sinfga qarashli yoki qarashli emasligi 
ma‘nolariga teng kuchli aniq ikki qiymatdan birini qabul qiladigan diskret 
funksiya. 
2.
0...1 intervaldagi haqiqiy qiymatlar qabul qiladigan funksiya. Funksiya 
qiymati 1 ga qancha yaqin bo‘lsa, ma‘lumotlar ob‘ekti berilgan sinfga shuncha 
ko‘p qarashli bo‘ladi. 
Klasterizatsiya masalasi yechimiga umumiy yo‘nalish L. Zadening 
noqat‘iy to‘plamlar nazariyasi rivojidan kelib chiqqan. Berilgan yondashish 
chegarasi sifatida tushunchalarni formallashtirish mumkin. Real jarayonlardagi 
va ma‘lumotlardagi noaniqlikni yo‘qotish mumkin. Bu yondashuvning afzallik 
jihatlari shundaki, ma‘lumotlarning anashu jarayonida inson qatnashadi, baholar 
va xulosalar sub‘ekti bo‘ladi. Noqat‘iy to‘plamlar nazariyasi asoschisi L. Zade 
aytganidek: ―noqat‘iylikni insonning mavjudligi kabi universal reallik deb qabul 
qiluvchi yangi tushunchalar va usullar kompleksi bo‘yicha yangi nuqtai nazar 
zarur edi‖[14]. 
Klasterizatsiya masalasini yechishda noqat‘iy to‘plamlar nazariyasini 


30 
qo‘llash bilan masalani ijobiy hal qiluvchi turli usullarni hosil qilish mumkin. 
Noqat‘iylikni xuddi ma‘lumotlarning ifodalanishi va ularning o‘zaro aloqasini 
yozish kabi o‘rganish mumkin. Bundan tashqari ma‘lumotlar miqdoriy tabiatga 
ega bo‘lishi ham, bo‘lmasligi ham mumkin. Bundan tashqari ko‘pgina tajribaviy 
masalalarni o‘rganishni talab qiladi va inson tamonidan to‘plangan tajribalarga 
asoslagan bo‘lib, ko‘p hollarda miqdoriy ifodaga ega bo‘ladi. O‘rganilayotgan 
ma‘lumotlarning noqat‘iyligini umumiy holda hisoblash juda muammo. Shuning 
uchun maxsus algoritmlar va yondashuvlar mavjud bo‘lib, boshlang‘ich 
ma‘lumotlarning noqat‘iy bo‘linishiga yo‘l qo‘ymaydi. Ma‘lumotlar qat‘iy va 
miqdoriy deb hisoblanadi.
Noqat‘iy ma‘lumotlarning o‘zaro aloqasini turli usullarda tasniflash 
mumkin. Xuddi shunday usullardan biri, noqat‘iy ma‘lumotlarni klasterlash 
algoritmlarini qo‘llashda keng tarqalganlaridan biri algoritmlarning o‘zaro 
aloqasini klasterizatsiyalash markazi va munosabatlar orqali tavsiflanishidir[15].

Yüklə 1,59 Mb.

Dostları ilə paylaş:
1   ...   6   7   8   9   10   11   12   13   ...   25




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə