33
bilan mos keluvchi klasterni hosil qilamiz.
Klasterlar orasidagi masofani topish uchun turli usullardan foydalanish
mumkin.
Ularga bog‘liq holda turli xossali algoritmlarni olamiz.
Birlashtirilgan
klasterlar uchun masofani eski qiymatlaridan foydalanib hisoblaydigan bir necha
usullar mavjud bo‘lib, quyidagi formuladagi koeffitsentlardan farqlanadi
|
|
qs
ps
pq
qs
p
ps
p
rs
d
d
d
d
d
d
, (1).
Agar
va
klasterlar klasterga birlashtarilsa va yangi klasterdan
klastergacha bo‘lgan masofa hisoblanishi talab qilinsa,
qaysi usulni
qo‘llashimiz klasterlar orasidagi masofani topish usuliga bog‘liq bo‘lib, bu
usullar α
p
,α
q
, va
larni qiymatlari bilan farqlanadi[16].
Divizim algoritmlar
Divizim klasterlash algoritmida aglomerativ algoritmdan farqli birinchi
qadamda butun
I
to‘plamning barcha elementlari
yagona klaster kabi
ifodalanadi. Algoritmlarning har bir qadamida mavjud bo‘lgan klasterlardan biri
rekursiv ravishda ikkiga bo‘linadi .Xuddi shu usulda klasterlar balanddan pastga
iteratsion ifodalanadi. Bu usul klasterlar analizi adabiyotlarida algomerativ
algoritmlari kabi to‘la tavsiflamaydi. Bu usulni qo‘llash zarur bo‘lganda obektlar
to‘plami ga nisbatan kam sonli klasterlarga ajratiladi.
Birinchi divizm algoritmlardan biri 1965- yili Smit Makneomo tomonidan
taklif qilingan.
Birinchi qadamda barcha elementlar
birgina klasterga joylanadi
.
Keyin bu klasterdagi elementlardan boshqa elementlarga nisbatan
masofani o‘rtacha qiymatining kattasi tanlab olinadi. O‘rtacha qiymatlarni misol
uchun quyidagi formula bilan hisoblash mumkin:
)
,
(
/
1
1
1
q
p
C
C
i
i
d
N
D
,
C
i
i
q
p
,
, (2).
1
С
klasterdan tanlangan element o‘chiriladi va
2
С
klasterning birinchi
elementi sifatida olinadi.
Keyingi
har bir qadamda
1
С
klaster elementlaridan
2
С
klasterdagi
34
elementlarigacha bo‘lgan o‘rtacha masofa va
1
С
klasterdagi
qolgan
elementlargacha bo‘lgan o‘rtacha masofalar orasidagi farq katta bo‘ladigan
element
2
С
ga o‘tkaziladi.
Elementlarni
1
С
dan
2
С
ga o‘tkazish o‘rtacha masofalar orasidagi farq
manfiy bo‘lguncha davom etadi, ya‘ni
1
С
da
1
С
dagi
elementlarga qaraganda
2
С
dagi elementlarga yaqinroq bo‘ladigan elementlar qolmaguncha davom etadi.
Natijada bitta klaster ikkitaga bo‘linadi va ulardan biri ierarxiyaning keying
darajasida birlashtiriladi. Keyingi har bir darajada klasterlardan birining
bo‘linishida tadbiq qilinadi.
Birlashgan klasterni tanlash turlicha bajariladi. 1990-yil
Kaufman va
Rouzev birlashtirilgan klasterlardan diametri kattasini olishni taklif qildi.
Diametr quyidagi formula biln topiladi:
)
,
max(
q
p
C
l
l
D
,
C
l
l
q
p
,
(3).
Klasterlarning rekursiv bo‘linishi yoki barcha klasterlar bir ob‘ektdan
tashkil topgan bo‘lguncha yoki klasterning barcha a‘zolari bir biridan farqi nol
bo‘lguncha davom etadi.[68]
Dostları ilə paylaş: