O’zbekiston respublikasi aloqa, axborotlashtirish va telekommunikasiya texnologiyalari davlat qo`mitasi



Yüklə 1,59 Mb.
Pdf görüntüsü
səhifə11/25
tarix17.06.2023
ölçüsü1,59 Mb.
#117611
1   ...   7   8   9   10   11   12   13   14   ...   25
Masalaning formal quyilishi. 
Ma‘lumotlar to‘plamining quyidagi 
xossalari berilgan. 
- ma‘limotlarning har bir nusxasi qat‘iy sonli qiymat bilan ifodalanadi. 
- har bir aniq ma‘lumotning nusxasi uchun sinf aniq emas. 
Quyidagilarni topish kerak. 
- ma‘lumatlarni o‘zaro taqqoslash usuli (o‘xshashlik darajasi). 
- klasterizatsiya usuli.
- ma‘lumotlarning klaster bo‘yicha ajratish. 
Formal klasterizatsiya masalasi quyidagi ko‘rinishda ifodalanadi. 
Har bir atributlar majmuasi bilan ifodalangan ma‘lumotlar ob‘ektlar 
to‘plami I berilgan. Klasterlar to‘plami C va I to‘plamni C da akslantiruvchi F 
akslantirish 
ni qurish talab qilinadi. F akslantirish masala yechimi 
bo‘lgan ma‘lumotlar modelini beradi. Masala yachimi sifatida to‘g‘ri sinflangan 
ma‘lumotlar ob‘ektlar soni aniqlanadi. 
to‘plamni quyidagicha aniqlaymiz: 


31 
},
,...,
,...,
,
{
2
1
n
j
i
i
i
i
I
bu yerda – o‘rganilayotgan ob‘ektlar. 
Bunday to‘plamga misol iris haqidagi ma‘lumotlar majmuasini keltirish 
mumkin. O‘tgan asrning 30-yillari o‘rtalarida mashxur statist R.A. Fisher iris 
haqidagi ma‘lumotlar ustida ishlagan (bu ma‘lumotlar ba‘zan Fisher irislari deb 
ataladi). U uch sinf irislarni o‘rgangan Iris setosa, Iris versicolor va Iris 
virginika. Ularning har biri uchun to‘rt parameter: kosachabargning uzunligi va 
kengligi, gulbargning uzunligi va kengligi bo‘yicha har xil qiymat 50 nusxada 
taqdim etildi. Har bir sinf uchun 5 nusxa bo‘yicha ma‘lumotlar taqdim etildi. 
Ob‘ektlarning har bir parametrlar majmuasi bilan xarakterlanadi. 
m
j
x
x
x
x
i
,..,
,...,
,
2
1
Irislar qatnashgan misollarda bunday parametrlar 
sifatida Iris kosachabargning uzunligi va kengligi Iris gulbargning uzunligi va 
kengligi olingan. 
x
o‘zgaruvchi bir necha to‘plamlardan qiymat qabul qilishi 
mumkin. 
,...
,
2
1
v
v
x
Qaralgan misol uchun qiymatlar haqiqiy bo‘ladi. 
Klasterizatsiya masalasi quyidagi to‘plamni qurishdan iborat: 
}
,...,
,...,
,
{
2
1
g
k
c
c
c
c
С
Bu yerda 
I to‘plamning bir – biriga o‘xshash ob‘ektlarni saqlovchi 
klaster 
I
i
I
i
i
i
С
p
j
p
j
k
,
|
,
{
va 
}
)
,
(
p
j
i
i
d

Bu yerda 
yaqinlik darajasini aniqlovchi kattalik bo‘lib, ob‘ektlarning 
bir klasterga qarashligini bildiradi. 
)
,
(
p
j
i
i
d
ob‘ektlar orasidagi yaqinlik 
darajasini bildiruvchi masofa deb ataladi. 
)
,
(
p
j
i
i
d
manfiy bo‘lmagan qiymat quyidagi shartlarni qanoatlantirsa, 
elementlar orasidagi masofa deyiladi: 
a)
0
)
,
(
p
j
i
i
d
, barcha 
j
i
va 
p
i
lar uchun;


32 
b)
0
)
,
(
p
j
i
i
d
, faqat va faqat 
p
j
i
i
bo‘lganda; 
c)
)
,
(
)
,
(
j
p
p
j
i
i
d
i
i
d

d)
)
,
(
)
,
(
)
,
(
p
r
r
j
p
j
i
i
d
i
i
d
i
i
d

Agar 
)
,
(
p
j
i
i
d
masofa 
qiymatdan kichik bo‘lsa, u holda elementlar 
yaqin va bir klasterda joylashgan deyiladi. Aksincha bo‘lganda esa elementlar 
bir biridan farqli va ular turli klasterlarda joylashadi. 
Klasterizatsiya masalasini yechish uchun keng tarqalgan algoritmlarning 
ko‘pchiligida kirish ma‘lumotlari formati sifatida 
farq matritsasi ishlatiladi. 
Matritsaning satr va ustun elementlari to‘plam elementlariga mos bo‘ladi. 
Matritsaning 
elementi 
sifatida 
qatordagi 
va 
ustundagi 
)
,
(
p
j
i
i
d
qiymatlarni olamiz. Bundan esa bosh dioganal elementlari nolga 
tengligi kelib chiqadi: 
0
...
)
,
(
)
,
(
)
,
(
...
0
)
,
(
)
,
(
...
)
,
(
0
2
1
2
1
2
1
2
1
e
e
d
e
e
d
e
e
d
e
e
d
e
e
d
e
e
d
D
n
n
n
n
Ko‘pgina algoritmlar simmetrik matritsalar bilan ishlaydi. Agarda 
matritsa simmetrik bo‘lmasa,
2
/
)
(
m
D
D
almashtirish yordamida simmetrik ko‘rinishga keltiriladi[14]. 

Yüklə 1,59 Mb.

Dostları ilə paylaş:
1   ...   7   8   9   10   11   12   13   14   ...   25




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə