31
},
,...,
,...,
,
{
2
1
n
j
i
i
i
i
I
bu yerda – o‘rganilayotgan ob‘ektlar.
Bunday to‘plamga misol iris haqidagi ma‘lumotlar
majmuasini keltirish
mumkin. O‘tgan asrning 30-yillari o‘rtalarida mashxur statist R.A. Fisher iris
haqidagi ma‘lumotlar ustida ishlagan (bu ma‘lumotlar ba‘zan Fisher irislari deb
ataladi). U uch sinf irislarni o‘rgangan
Iris setosa, Iris versicolor va Iris
virginika. Ularning har biri uchun to‘rt parameter: kosachabargning uzunligi va
kengligi, gulbargning uzunligi va kengligi bo‘yicha har xil qiymat 50 nusxada
taqdim etildi. Har bir sinf uchun 5 nusxa bo‘yicha ma‘lumotlar taqdim etildi.
Ob‘ektlarning har bir parametrlar majmuasi bilan xarakterlanadi.
m
j
x
x
x
x
i
,..,
,...,
,
2
1
Irislar qatnashgan misollarda bunday parametrlar
sifatida Iris kosachabargning uzunligi va kengligi Iris
gulbargning uzunligi va
kengligi olingan.
x
o‘zgaruvchi bir necha to‘plamlardan qiymat qabul qilishi
mumkin.
,...
,
2
1
v
v
x
Qaralgan misol uchun qiymatlar haqiqiy bo‘ladi.
Klasterizatsiya masalasi quyidagi to‘plamni qurishdan iborat:
}
,...,
,...,
,
{
2
1
g
k
c
c
c
c
С
Bu yerda
I to‘plamning bir – biriga o‘xshash ob‘ektlarni saqlovchi
klaster
I
i
I
i
i
i
С
p
j
p
j
k
,
|
,
{
va
}
)
,
(
p
j
i
i
d
.
Bu yerda
yaqinlik darajasini aniqlovchi kattalik bo‘lib, ob‘ektlarning
bir klasterga qarashligini bildiradi.
)
,
(
p
j
i
i
d
ob‘ektlar
orasidagi yaqinlik
darajasini bildiruvchi masofa deb ataladi.
)
,
(
p
j
i
i
d
manfiy bo‘lmagan qiymat quyidagi shartlarni qanoatlantirsa,
elementlar orasidagi masofa deyiladi:
a)
0
)
,
(
p
j
i
i
d
, barcha
j
i
va
p
i
lar uchun;
32
b)
0
)
,
(
p
j
i
i
d
, faqat va faqat
p
j
i
i
bo‘lganda;
c)
)
,
(
)
,
(
j
p
p
j
i
i
d
i
i
d
;
d)
)
,
(
)
,
(
)
,
(
p
r
r
j
p
j
i
i
d
i
i
d
i
i
d
;
Agar
)
,
(
p
j
i
i
d
masofa
qiymatdan kichik bo‘lsa,
u holda elementlar
yaqin va bir klasterda joylashgan deyiladi. Aksincha bo‘lganda esa elementlar
bir biridan farqli va ular turli klasterlarda joylashadi.
Klasterizatsiya masalasini yechish uchun keng
tarqalgan algoritmlarning
ko‘pchiligida kirish ma‘lumotlari formati sifatida
farq matritsasi ishlatiladi.
Matritsaning satr va ustun elementlari to‘plam elementlariga mos bo‘ladi.
Matritsaning
elementi
sifatida
qatordagi
va
ustundagi
)
,
(
p
j
i
i
d
qiymatlarni olamiz. Bundan esa bosh
dioganal elementlari nolga
tengligi kelib chiqadi:
0
...
)
,
(
)
,
(
)
,
(
...
0
)
,
(
)
,
(
...
)
,
(
0
2
1
2
1
2
1
2
1
e
e
d
e
e
d
e
e
d
e
e
d
e
e
d
e
e
d
D
n
n
n
n
Ko‘pgina algoritmlar simmetrik matritsalar bilan ishlaydi. Agarda
matritsa simmetrik bo‘lmasa,
2
/
)
(
m
D
D
almashtirish yordamida simmetrik ko‘rinishga keltiriladi[14].
Dostları ilə paylaş: