1-Qadam.
Klasterlar sonini tanlash:
d
c
2
.
2-Qadam.
Ma‘lumotlar vektorini haqiqiy sonlar o‘qida tasvirlash uchun
skalyar metrikani tanlash.
3-Qadam.
To‘xtash qadami ni tanlash.
41
4-Qadam.
Noqat‘iylik koeffitsenti
)
,
1
(
w
ni tanlash, masalan w=2.
5-Qadam.
Bo‘linishlar matritsasini initsializatsiya qilish (masalan,
tasodifiy qiymatlarni).
6-Qadam.
Klasterlar markazlarini quyidagi formula yordamida hisoblash:
d
j
w
l
ij
d
j
j
w
l
ij
i
l
u
m
u
c
1
)
1
(
1
)
1
(
)
(
,
c
i
1
(15)
7-Qadam.
Barcha
ma‘lumotlar
elementlari
uchun
barcha
klasterlargacha (markazlarigacha) bo‘lgan masofa kvadratini quyidagi formula
bo‘yicha hisoblash:
)
(
)
(
)
,
(
)
(
)
(
)
(
2
j
i
l
l
j
i
l
i
l
j
A
m
c
A
m
c
c
m
d
,
(16)
8-Qadam.
Bo‘linishlar matritsasini quyidagi formula bo‘yicha aniqlash:
c
k
w
k
j
A
i
j
A
l
ij
c
m
d
c
m
d
u
1
1
1
)
(
2
)
(
2
)
(
,
(
)
,
(
1
,
(17)
(16) formuladagi cheklanishlarni hisobga olib, barchasi uchun
c
i
1
,
d
j
1
.
9-Qadam.
)
1
(
)
(
l
l
U
U
shartni tekshirish. Agar shart bajarilsa,
jarayon to‘xtatiladi, aks holda iteratsiya nomerini
deb, 7-qadamga
o‘tish.
2.4-rasm.
Fuzzy k-means
algoritmida klasterlar shakli.
42
Berilgan algoritm
means
algoritmiga qaraganda afzalliklarga ega,
ammo shunday kamchilikka egaki, sferik formadagi klasterlarni izlaydi. Bu esa
masalalarga mos kelavermayda va shuning uchun yechim tuzatib bo‘lmaydigan
darajaga keltiradi. Bu kamchilik quyidagi algoritmda kuzatilmaydi.
Gustafson – Kassel bo’yicha klasterizatsiyalash
Quyida beriladigan noqat‘iy klasterizatsiyalash algoritmi ellipsoida (2.5-
rasm) ko‘rinishidagi algoritmlarni izlaydi. Bu esa turli xil masalalarni yechishda
ancha egiluvchan qiladi. Algoritmni tavsiflashdan oldin unda qo‘llaniladigan
qo‘shimcha tushunchalarni keltiramiz[21].
2.5-rasm.
Gustafson – Kassel bo‘yicha klasterizatsiyalash
algoritmidagi klaster formasi.
Klaster faqat o‘zining markazi bilangina emas, balki kovariatsion matritsa
bilan ham xarakterlanadi.
d
j
w
ij
d
j
i
i
j
i
j
w
ij
i
u
c
m
c
m
u
F
1
1
)
(
)
(
)
(
)
(
)
)(
(
)
(
, (18)
bu yerda,
ik
berilgan
)
(
i
F
matritsaning
xos qiymatlarini
belgilaydi,
ik
esa
)
(
i
F
matritsaning
birlik xos vektori.
ik
ning xos
qiymatlari kamayish tartibida tartiblangan. U holda
)
1
(
1
,....,
n
i
i
xos vektorlar
i-chi chiziqli qism fazoni o‘raydi,
in
esa bu chiziqli qism fazoning normali
43
bo‘ladi. Yuqorida aytilganlarning barchasi 2.6-rasmda tasvirlangan.
2.6-rasm.
Gustafson – Kassel bo‘yicha klasterizatsiyalash algoritmining
geometrik tasviri.
Bu algoritm masofani hisoblash uchun o‘zining normallashtiruvchi
matritsasidan foydalanadi. Bu masofani hisoblash formulasi quyidagicha
bo‘ladi:
)
(
)
(
)
(
)
(
2
)
(
j
i
i
j
i
A
m
c
m
c
d
i
, (19)
bu yerda,
1
)
(
1
1
)
(
)
(
|)
(|
i
r
i
i
F
F
A
,
(20)
)
(
i
F
esa (18) formula bilan aniqlanadi.
Asosiy tushunchalarni umumlashtiramiz:
-
d
j
j
m
M
1
}
{
o‘rganilayotgan to‘plam, d – ma‘lumotlardagi nuqtalar
(vektorlar) soni;
-
(19) va (20) formulalar bilan hisoblanadigan masofa metrikasi.
-
c
i
i
c
C
1
)
(
}
{
klasterlar markazi vektori,
bu yerda,
44
d
j
w
ij
d
j
j
w
ij
i
u
m
u
c
1
1
)
(
)
(
)
(
,
c
i
1
(21)
-
}
{
ij
u
U
bo‘linish matritsasi, bu yerda
c
k
w
k
j
A
i
j
A
ij
c
m
d
c
m
d
u
i
i
1
1
1
)
(
2
)
(
2
,
(
)
,
(
1
)
(
)
(
,
(22)
-
Maqsad funksiyasi:
c
i
d
j
i
j
A
w
ij
c
m
d
u
C
U
M
J
i
1
1
2
)
,
(
)
,
,
(
)
(
,
(23)
bu yerda,
)
,
1
(
w
noqat‘iylik koeffitsenti (tortish koeffitsenti).
-
Chegaralanishlar majmuasi:
]
1
,
0
[
ij
u
;
c
i
ij
u
1
1
,
d
j
ij
d
u
1
0
.
(24)
Har bir ma‘lumotlar vektori turli xil klasterlarga turlicha qarashlilik
darajasi bilan qarashli bo‘lishini ifodalaydi. Ma‘lumotlar elementlarining
bo‘linishlari fazasida barcha klasterlarga qarashliligining yig‘indisi birga
teng[21,22].
Bu algoritmning bajarilish ketma-ketlagi quyidagicha amalga oshiriladi:
1-Qadam.
Klasterlar sonini aniqlash:
d
c
2
.
2-Qadam.
To‘xtash qadami >0 ni tanlash.
3-Qadam.
Noqat‘iylik parametri
)
,
1
(
w
ni tanlash, masalan w=2 deb
olish mumkin.
4-Qadam.
Bo‘linishlar matritsasini initsializatsiya qilish (masalan,
tasodifiy qiymatlarni).
5-Qadam.
Klasterlar markazlarini quyidagi formula yordamida
hisoblash:
45
d
j
w
l
ij
d
j
j
w
l
ij
i
l
u
m
u
c
1
)
1
(
1
)
1
(
)
(
,
c
i
1
(25)
6-Qadam.
Klasterlar kovariatsion matritsasini quyidagi formula
bo‘yicha hisoblash:
d
j
w
ij
d
j
i
i
j
i
j
w
ij
i
u
c
m
c
m
u
F
1
1
)
(
)
(
)
(
)
(
)
)(
(
)
(
, (26)
7-Qadam.
Quyidagi formula bo‘yicha masofani aniqlash:
)
(
)
(
)
(
)
(
)
(
1
)
(
1
1
)
(
)
(
)
(
2
)
(
j
i
l
i
r
i
i
j
i
l
j
i
l
F
m
c
F
F
m
c
m
c
d
i
(27)
8-Qadam.
(14) formuladagi cheklanishlarni hisobga olib, bo‘linishlar
matritsasini quyidagi formula bo‘yicha aniqlash:
c
k
w
k
j
F
i
j
F
ij
c
m
d
c
m
d
u
i
i
1
1
1
)
(
2
)
(
2
,
(
)
,
(
1
)
(
)
(
, (28)
9-Qadam.
)
1
(
)
(
l
l
U
U
shartni tekshirish. Agar shart bajarilsa,
jarayon to‘xtatiladi, aks holda iteratsiya nomerini
deb, 5-qadamga
o‘tish.
Xulosa sifatida aytish kerakki, berilgan algoritmlar klasterizatsiyaga
yondashish jihatdan bir biridan farq qilmaydi. Bu maqsad funksiyalarini
taqqoslashda aniqroq ravshanlashadi, ularni minimallash berilgan algoritm
asosida yotadi. Farq esa kirish ma‘lumotlari fazasidagi nuqtalar orasidagi
masofa turlicha usullar bilan hisoblanishidangina iborat bo‘ladi. Berilgan
algoritmlar qiyinlashib borish tartibida joylashgan. Har bir algoritm o‘zidan
oldingilaridan ko‘ra ko‘proq ma‘lumotlarning o‘zaro aloqasini, aspektlarini
o‘rganishga harakat qiladi[23].
Yuqorida aytilganidek, bir qancha algoritmlar mavjudki, ular bir biridan
46
maqsad funksiyasidagi qo‘shimcha qo‘shiluvchilar bilan farq qiladi. Shuni
ta‘kidlash karakki, bu maqsad funksiyalarida Bezdekov ikkilangan yig‘indisi Ф
bilan aniqlanuvchi qo‘shiluvchi o‘zgartirilmaydigan qo‘shiluvchi bo‘lib, maqsad
funksiyasining qurilishiga asos bo‘ladigan asosiy faraz o‘gartirilmasligidan
dalolat beradi.
Bu farazlardan asosiylari quyidagi ko‘rinishda bo‘ladi:
-
Umumiy holda klasterlar ellipsoida shaklida bo‘ladi;
-
Klasterda doimo markaz mavjud bo‘ladi ;
-
Nuqtaning klasterga qarashliligi, nuqtadan klasterlar markazlarigacha
bo‘lgan bir necha masofalarga asoslanadi;
Bu uchta qismni o‘zi berilgan algoritmlar kamchiliklarini aniqlash uchun
yetarli bo‘ladi.
-
Faraz qilinadiki, barcha klasterlar har doim bir necha aniqlovchi
algoritm shakllariga ega bo‘ladi, shunisi aniqki, bu har doim ham
bajarilavermaydi. Ma‘lumotlarda bir necha figuralarda berilgan kirish
ma‘lumotlar fazasining aproksimatsiyasi interpritatsiyalanmagan yechimlarga
olib keladi.
-
Klasterda doimo bir nechta tugun nuqtalar (klaster markazlari) mavjud
bo‘lib, uning klasterga qarashlilik darajasi birga teng, bir vaqtda boshqa nuqtalar
kabi klasterga bunday yuqori qarashlilik darajasi bilan qarashli bo‘lmaydi va
yana nuqtalarining o‘zaro qiyin joylanishi o‘lchamsiz bo‘ladi.
-
Berilgan algoritmlar nuqtalarning o‘zaro jaylashishiga asoslanmaydi,
balki nuqtalarning klasterlar markazlariga bo‘lgan munosabatiga asoslanadi.
Bunaqa klasterlash algoritmlarining kuchsiz tamoni shundaki, kirish
ma‘lumotlari ikkita doiraga joylashgan shaklda bo‘ladi. Fuzzy C-Means
algoritmi sferik klasterlar quradi, lekin hech qanday shartda bu sferalarni
saqlovchi ma‘lumotlar fazasini ikkita klasterga ajratmaydi[22,23].
|