36
bir biri biln masofa orqali hisoblanadi (masalan, Evklid bo‘yicha masofa
olinadi). 4-rasmda irislarning uch guruhga ajratilishi ko‘rsatilgan.
2.2-rasm.
Irislarning uch klasterga boshlang‘ich bo‘linishi.
Ikkinchi
qadamda
klasterlarning
yangi
markazlari
hisoblanadi.
Markazlarni guruh shakllantirgan ob‘ektlarning o‘zgaruvchilarning o‘rtacha
qiymatini hisoblash kabi hisoblash mumkin.
Tabiiyki, yangi markazlar
oldingilaridan farq qiladi. 5-rasmda
yangi markazlar va ularga mos yangi
bo‘linishlar ko‘rsatilgan. Tabiiyki, avvalgi klasterga tegishli bo‘lgan ba‘zi bir
nuqtalar yangi bo‘linishda boshqasiga tushadi (berilgan holatda 4,2,5 va
boshqalar shunaqa nuqtalar bo‘ladi). Rasmda yangi markazlar aylanaga olingan
―x‖ belgi bilan berilgan.
37
2.3-rasm.
Irislar to‘plamining klasterga ikkinchi bo‘linishi.
Qaralayotgan operatsiyalar klasterlar markazlari (mos
holda ular
orasidagi chegara) o‘zgarishdan to‘xtamaguncha davom etadi. Bizning misolda
ikkinchi bo‘linish oxirgisi bo‘ladi. Agar klasterizatsiya natijasiga qarasak, quyi
klasterlar to‘lig‘icha Iris Setos sinfiga to‘g‘ri keladi. Qolgan boshqa klasterlarda
ikki sinfning ham vakillari bor. Yuqorida berilgan holda klasterizatsiya to‘rtta
emas, balki ikkita parameter bo‘yicha amalga oshirilganligi sababli ro‘u berdi.
Ob‘ektlar ko‘p o‘lchovli fazodagi nuqtalar kabi aks ettirilsa, klasterlarga
avtomatik bo‘lish amali ancha osonlashadi[20].
Muammo
shundaki, kirish ob‘ektlarini har doim ham nuqtalar
ko‘rinishida ifodalab bo‘lmaydi. Geometriyada hamma o‘zgaruvchilar har xil
qiymatli bo‘ladi, real holatda berilgan o‘zgarishlarda o‘zgaruvchilardan biri
boshqalariga nisbatab sezilarli darajada katta o‘zgarishi mumkin.
Haqiqiy
o‘zgaruvchilarni taxminan har xil qiymatli masshtabda o‘zgaradi, ularning tabiiy
xarakterli mashtabni bo‘lish orqali yoki, agar u aniq bo‘lmasa, bu
o‘zgaruvchilarning o‘rtacha qiymati bilan ularning o‘zgarish diopazonida
(o‘zgaruvchilarning minimum va maksimum qiymatlari orasidagi farq) yoki
38
standart
cheklanishi bolsa, u holda nuqtalar orasidagi geometrik masofa
taxminan yozuvlar haqidagi intuitiv ifodalanishga mos keladi.
Berilgan algoritm noqat‘iy klasterizatsiyaning tajribadagi barcha
algoritmlarning asl qiyofasi bo‘lib, uni o‘rganish
qiyinroq algoritmlarning
prinsiplarini yaxshiroq tuchunishga yordam beradi.
Berilgan algoritmni umumiylashtiruvchi ta‘rif va tushunchalar
quyidagilar:
-
d
j
j
m
M
1
}
{
- o‘rganilayotgan to‘plam, d- ma‘lumotlar vektori soni.
-
(7.6) formula bilan hisoblanuvchi masofa metrikasi
-
c
i
i
c
C
1
)
(
}
{
klasterlar markazi vektori, bu yerda
d
j
ij
d
j
j
ij
i
u
m
u
c
1
1
)
(
,
c
i
1
(5)
}
{
ij
u
U
bo‘linish matritsasi, bu yerda
. (6)
-
Maqsad funksiyasi:
c
i
d
j
i
i
A
ij
c
m
d
u
C
U
M
J
1
1
2
)
(
)
,
,
(
(7)
-
Chegaralanishlar majmuasi:
}
1
,
0
{
ij
u
;
c
i
ij
u
1
1
,
d
j
ij
d
u
1
0
. (8)
Bu chegaralanishlar majmuasi har bir ma‘lumotlar
vektori faqat bitta
sinfga qarashli ekanligini, qolganlari esa qarashli emasligini bildiradi.
Har bir klaster bittadan kam bo‘lmagan, lekin barcha nuqtalar sonidan
kam nuqtani o‘zida saqlaydi[20].
Konstruktiv algoritm o‘zi bilan quyidagi
iteratsion protsedurani
ifodalaydi:
Dostları ilə paylaş: