2. Klasterizatsiya algoritmlarida qo’llaniladigan masofaga asoslangan yaqinlik darajasining o’lchovi Ob‘ektlar orasidagi masofa
m R o‘chovli fazodagi nuqtalar ko‘rinishida
ifodalanishini faraz qiladi. Bu holda masofani hisoblash uchun turli usullardan
foydalanish mumkin. Quyida qaraladigan daraja kirish o‘zgaruvchilari
fazosidagi ikki nuqta orasidagi masofani aniqlaydi.
Quyidagi belgilashlardan foydalanamiz:
-
m Q R X ma‘lumotlar to‘plami bo‘lib,
o‘lchovli haqiqiy fazoning
qism to‘plami.
-
Q i i i X x x x m )
,....,
(
1
,
Q i ,
1
- ma‘lumotlar to‘plamining
elementlari.
-
Q i i i i x x x x Q S 1
)
)(
(
1
m m o‘lchovli kovariatsion matritsa.
Endi bizga ancha ma‘lum bo‘lgan yaqinlik darajalari (o‘chovlari,
miqdorlari) ni o‘rganamiz.
Evklid masofasi. Ba‘zida bir biridan ancha uzoqlikdagi ob‘ektlarga
ko‘proq kuch quyish uchun standart evklid masofani kvadratga ko‘tarish ehtiyoji
paydo bo‘ladi. Bu masofa quyidagi ko‘rinishda hisoblanadi:
m i ji ii j i x x x x d 1
2
)
(
)
,
(
.
Xemmingu masofasi. Bu yerda oddiy koordinatalar bo‘yicha o‘rtacha
farq masofa bo‘ladi. Ko‘pgina hollarda berilgan masofa o‘lchovi (darajasi)
beradigan natijalar Evklid masofasi o‘lchovi natijalari bilan bir xil bo‘ladi. Bu
holda farqlar kamayadi. Xemmingu masofasi quyidagi formula bilan
hisoblanadi:
m i ji ii ji ii j i L x x x x m x x d 1
1
)
,
(
.
Agar ma‘lumotlarning klasterizatsiyalashga ta‘sir etuvchi xarakterlari
haqidagi axborotga ega bo‘lsak, u holda qaralgan masofalar darajalaridan
48
ixtiyoriysini ishonch bilan olish mumkin. Xuddi shunday cho‘qqili masofada
tasodifiy o‘zgaruvchilar orasidagi erkinlik so‘ralishi kabi. Ammo tajribada
qo‘llashda bu o‘zgaruvchilar mustaqil bo‘la olmaydi[21,22].