O’zbekiston respublikasi aloqa, axborotlashtirish va telekommunikasiya texnologiyalari davlat qo`mitasi


-Qadam.  Klasterlar sonini tanlash:  d c 2 .  2-Qadam



Yüklə 1,59 Mb.
Pdf görüntüsü
səhifə16/25
tarix17.06.2023
ölçüsü1,59 Mb.
#117611
1   ...   12   13   14   15   16   17   18   19   ...   25
1-Qadam. 
Klasterlar sonini tanlash: 
d
c
2

2-Qadam. 
Ma‘lumotlar vektorini haqiqiy sonlar o‘qida tasvirlash uchun 
skalyar metrikani tanlash. 
3-Qadam. 
To‘xtash qadami ni tanlash. 


41 
4-Qadam. 
Noqat‘iylik koeffitsenti 
)
,
1
(
w
ni tanlash, masalan w=2. 
5-Qadam. 
Bo‘linishlar matritsasini initsializatsiya qilish (masalan, 
tasodifiy qiymatlarni). 
6-Qadam. 
Klasterlar markazlarini quyidagi formula yordamida hisoblash:
d
j
w
l
ij
d
j
j
w
l
ij
i
l
u
m
u
c
1
)
1
(
1
)
1
(
)
(
,
c
i
1
(15) 
7-Qadam. 
Barcha 
ma‘lumotlar 
elementlari 
uchun 
barcha 
klasterlargacha (markazlarigacha) bo‘lgan masofa kvadratini quyidagi formula 
bo‘yicha hisoblash: 
)
(
)
(
)
,
(
)
(
)
(
)
(
2
j
i
l
l
j
i
l
i
l
j
A
m
c
A
m
c
c
m
d
,
(16) 
8-Qadam. 
Bo‘linishlar matritsasini quyidagi formula bo‘yicha aniqlash: 
c
k
w
k
j
A
i
j
A
l
ij
c
m
d
c
m
d
u
1
1
1
)
(
2
)
(
2
)
(
,
(
)
,
(
1
,
(17) 
(16) formuladagi cheklanishlarni hisobga olib, barchasi uchun 
c
i
1

d
j
1
.
9-Qadam. 
)
1
(
)
(
l
l
U
U
shartni tekshirish. Agar shart bajarilsa, 
jarayon to‘xtatiladi, aks holda iteratsiya nomerini 
deb, 7-qadamga 
o‘tish. 
2.4-rasm.
Fuzzy k-means 
algoritmida klasterlar shakli.
 


42 
Berilgan algoritm 
means 
algoritmiga qaraganda afzalliklarga ega, 
ammo shunday kamchilikka egaki, sferik formadagi klasterlarni izlaydi. Bu esa 
masalalarga mos kelavermayda va shuning uchun yechim tuzatib bo‘lmaydigan 
darajaga keltiradi. Bu kamchilik quyidagi algoritmda kuzatilmaydi. 
Gustafson – Kassel bo’yicha klasterizatsiyalash 
Quyida beriladigan noqat‘iy klasterizatsiyalash algoritmi ellipsoida (2.5-
rasm) ko‘rinishidagi algoritmlarni izlaydi. Bu esa turli xil masalalarni yechishda 
ancha egiluvchan qiladi. Algoritmni tavsiflashdan oldin unda qo‘llaniladigan 
qo‘shimcha tushunchalarni keltiramiz[21]. 
2.5-rasm.
 
Gustafson – Kassel bo‘yicha klasterizatsiyalash 
algoritmidagi klaster formasi. 
 
Klaster faqat o‘zining markazi bilangina emas, balki kovariatsion matritsa 
bilan ham xarakterlanadi.
d
j
w
ij
d
j
i
i
j
i
j
w
ij
i
u
c
m
c
m
u
F
1
1
)
(
)
(
)
(
)
(
)
)(
(
)
(
, (18) 
bu yerda, 
ik
berilgan 
)
(
i
F
matritsaning
xos qiymatlarini 
belgilaydi, 
ik
esa 
)
(
i
F
matritsaning
birlik xos vektori. 
ik
ning xos 
qiymatlari kamayish tartibida tartiblangan. U holda 
)
1
(
1
,....,
n
i
i
xos vektorlar 
i-chi chiziqli qism fazoni o‘raydi, 
in
esa bu chiziqli qism fazoning normali 


43 
bo‘ladi. Yuqorida aytilganlarning barchasi 2.6-rasmda tasvirlangan.
 
2.6-rasm.
Gustafson – Kassel bo‘yicha klasterizatsiyalash algoritmining 
geometrik tasviri. 
Bu algoritm masofani hisoblash uchun o‘zining normallashtiruvchi 
matritsasidan foydalanadi. Bu masofani hisoblash formulasi quyidagicha 
bo‘ladi: 
)
(
)
(
)
(
)
(
2
)
(
j
i
i
j
i
A
m
c
m
c
d
i
, (19) 
bu yerda,
1
)
(
1
1
)
(
)
(
|)
(|
i
r
i
i
F
F
A
,
(20) 
)
(
i
F
esa (18) formula bilan aniqlanadi. 
Asosiy tushunchalarni umumlashtiramiz: 
-
d
j
j
m
M
1
}
{
o‘rganilayotgan to‘plam, d – ma‘lumotlardagi nuqtalar 
(vektorlar) soni; 
-
(19) va (20) formulalar bilan hisoblanadigan masofa metrikasi. 
-
c
i
i
c
C
1
)
(
}
{
klasterlar markazi vektori, 
bu yerda,


44 
d
j
w
ij
d
j
j
w
ij
i
u
m
u
c
1
1
)
(
)
(
)
(
,
c
i
1
(21) 
-
}
{
ij
u
U
bo‘linish matritsasi, bu yerda 
c
k
w
k
j
A
i
j
A
ij
c
m
d
c
m
d
u
i
i
1
1
1
)
(
2
)
(
2
,
(
)
,
(
1
)
(
)
(
,
(22) 
-
Maqsad funksiyasi: 
c
i
d
j
i
j
A
w
ij
c
m
d
u
C
U
M
J
i
1
1
2
)
,
(
)
,
,
(
)
(

(23) 
bu yerda, 
)
,
1
(
w
noqat‘iylik koeffitsenti (tortish koeffitsenti). 
-
Chegaralanishlar majmuasi: 
]
1
,
0
[
ij
u
;
c
i
ij
u
1
1
,
d
j
ij
d
u
1
0
.
(24) 
Har bir ma‘lumotlar vektori turli xil klasterlarga turlicha qarashlilik 
darajasi bilan qarashli bo‘lishini ifodalaydi. Ma‘lumotlar elementlarining 
bo‘linishlari fazasida barcha klasterlarga qarashliligining yig‘indisi birga 
teng[21,22]. 
Bu algoritmning bajarilish ketma-ketlagi quyidagicha amalga oshiriladi: 
1-Qadam. 
Klasterlar sonini aniqlash: 
d
c
2

2-Qadam. 
To‘xtash qadami >0 ni tanlash. 
3-Qadam. 
Noqat‘iylik parametri 
)
,
1
(
w
ni tanlash, masalan w=2 deb 
olish mumkin. 
4-Qadam. 
Bo‘linishlar matritsasini initsializatsiya qilish (masalan, 
tasodifiy qiymatlarni). 
5-Qadam. 
Klasterlar markazlarini quyidagi formula yordamida 
hisoblash: 


45 
d
j
w
l
ij
d
j
j
w
l
ij
i
l
u
m
u
c
1
)
1
(
1
)
1
(
)
(
,
c
i
1
(25)
6-Qadam. 
Klasterlar kovariatsion matritsasini quyidagi formula 
bo‘yicha hisoblash: 
d
j
w
ij
d
j
i
i
j
i
j
w
ij
i
u
c
m
c
m
u
F
1
1
)
(
)
(
)
(
)
(
)
)(
(
)
(
, (26) 
7-Qadam. 
Quyidagi formula bo‘yicha masofani aniqlash: 
)
(
)
(
)
(
)
(
)
(
1
)
(
1
1
)
(
)
(
)
(
2
)
(
j
i
l
i
r
i
i
j
i
l
j
i
l
F
m
c
F
F
m
c
m
c
d
i
(27) 
8-Qadam. 
(14) formuladagi cheklanishlarni hisobga olib, bo‘linishlar 
matritsasini quyidagi formula bo‘yicha aniqlash: 
c
k
w
k
j
F
i
j
F
ij
c
m
d
c
m
d
u
i
i
1
1
1
)
(
2
)
(
2
,
(
)
,
(
1
)
(
)
(
, (28) 
9-Qadam. 
)
1
(
)
(
l
l
U
U
shartni tekshirish. Agar shart bajarilsa, 
jarayon to‘xtatiladi, aks holda iteratsiya nomerini 
deb, 5-qadamga 
o‘tish. 
Xulosa sifatida aytish kerakki, berilgan algoritmlar klasterizatsiyaga 
yondashish jihatdan bir biridan farq qilmaydi. Bu maqsad funksiyalarini 
taqqoslashda aniqroq ravshanlashadi, ularni minimallash berilgan algoritm 
asosida yotadi. Farq esa kirish ma‘lumotlari fazasidagi nuqtalar orasidagi 
masofa turlicha usullar bilan hisoblanishidangina iborat bo‘ladi. Berilgan 
algoritmlar qiyinlashib borish tartibida joylashgan. Har bir algoritm o‘zidan 
oldingilaridan ko‘ra ko‘proq ma‘lumotlarning o‘zaro aloqasini, aspektlarini 
o‘rganishga harakat qiladi[23].
Yuqorida aytilganidek, bir qancha algoritmlar mavjudki, ular bir biridan


46 
maqsad funksiyasidagi qo‘shimcha qo‘shiluvchilar bilan farq qiladi. Shuni 
ta‘kidlash karakki, bu maqsad funksiyalarida Bezdekov ikkilangan yig‘indisi Ф 
bilan aniqlanuvchi qo‘shiluvchi o‘zgartirilmaydigan qo‘shiluvchi bo‘lib, maqsad 
funksiyasining qurilishiga asos bo‘ladigan asosiy faraz o‘gartirilmasligidan 
dalolat beradi.
Bu farazlardan asosiylari quyidagi ko‘rinishda bo‘ladi: 
-
Umumiy holda klasterlar ellipsoida shaklida bo‘ladi; 
-
Klasterda doimo markaz mavjud bo‘ladi ; 
-
Nuqtaning klasterga qarashliligi, nuqtadan klasterlar markazlarigacha 
bo‘lgan bir necha masofalarga asoslanadi
Bu uchta qismni o‘zi berilgan algoritmlar kamchiliklarini aniqlash uchun 
yetarli bo‘ladi. 
-
Faraz qilinadiki, barcha klasterlar har doim bir necha aniqlovchi 
algoritm shakllariga ega bo‘ladi, shunisi aniqki, bu har doim ham 
bajarilavermaydi. Ma‘lumotlarda bir necha figuralarda berilgan kirish 
ma‘lumotlar fazasining aproksimatsiyasi interpritatsiyalanmagan yechimlarga 
olib keladi.
-
Klasterda doimo bir nechta tugun nuqtalar (klaster markazlari) mavjud 
bo‘lib, uning klasterga qarashlilik darajasi birga teng, bir vaqtda boshqa nuqtalar 
kabi klasterga bunday yuqori qarashlilik darajasi bilan qarashli bo‘lmaydi va 
yana nuqtalarining o‘zaro qiyin joylanishi o‘lchamsiz bo‘ladi. 
-
Berilgan algoritmlar nuqtalarning o‘zaro jaylashishiga asoslanmaydi, 
balki nuqtalarning klasterlar markazlariga bo‘lgan munosabatiga asoslanadi.
Bunaqa klasterlash algoritmlarining kuchsiz tamoni shundaki, kirish 
ma‘lumotlari ikkita doiraga joylashgan shaklda bo‘ladi. Fuzzy C-Means 
algoritmi sferik klasterlar quradi, lekin hech qanday shartda bu sferalarni 
saqlovchi ma‘lumotlar fazasini ikkita klasterga ajratmaydi[22,23].


47 

Yüklə 1,59 Mb.

Dostları ilə paylaş:
1   ...   12   13   14   15   16   17   18   19   ...   25




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə