83
tezliklərinə görə qruplaşdırılır. Tezlikləri eyni olan sözlərin
hamısı bir qrupda birləşdirilir. Bütün qruplar onlara daxil
olan sözlərin tezliklərinin qiymətinə görə azalan sıra ilə dü-
zülür və ardıcıl olaraq nömrələnirlər. Qrupların sıra nömrəsi
onların ranqı adlanır. Belə ki, ən çox rast gəlinən sözlər qru-
punun ranqı 1, ondan sonrakı 2 və s. olur.
Zipf sübut etmişdir ki, sənədə daxil olan sözlərin ranqları
ilə onların rastgəlinmə tezlikləri arasında asılılıq mövcuddur.
Tutaq ki,
j
f
– j sözünün sənədin mətninə daxilolma
tezliyi,
d
f
– sənədin mətnindəki sözlərin ümumi sayıdır.
Onda sözün mətndə rast gəlinməsi ehtimalı aşağıdakı
kimi olar:
d
j
j
f
f
p
.
Zipf “ranq-tezlik” asılılığını aşağıdakı şəkildə ifadə
etmişdir: sözlərin mətndə rastgəlinmə ehtimalı onların
ranqları ilə düz mütənasibdir. Başqa sözlə, sözlərin
mətndə rast gəlinmə ehtimalının onların ranqına hasili
nəticəsində alınan qiymət təxminən sabit qalır:
d
j
j
j
j
f
r
f
r
p
c
.
Burada
j
r
– j sözünün ranqı, c – empirik sabitdir. Bu
sabit müxtəlif dillər üçün fərqli ola birər, lakin onlar təx-
minə yaxın olur. Məsələn, bu sabit ingilis dili üçün 0.1,
rus dili üçün 0.06-0.07, Azərbaycan dili üçün təxminən
0,09 qiymətlərini alır.
Zipfin I qanununa əsasən, sözlərin rastgəlinmə tez-
likləri ilə ranqları arasındakı asılılıq hiperbola şəklində
84
olur və sənəd üçün daha çox məna kəsb edən, yəni termin
kimi qəbul oluna biləcək sözlər qrafikin orta hissəsində
yerləşir (şək.2.4).
Daha çox rast gəlinən (rastgəlinmə tezliyi daha böyük
olan) sözlər əsasən əvəzliklər, bağlayıcı və s. kimi xidməti
sözlərdir. Ən az rast gəlinən sözlər isə fellər və digər xidmə-
ti, eləcə də təsadüfi istifadə olunan sözlər olur. Ona görə də
həddən artıq çox və həddən artıq az rast gəlinən sözlər, adə-
tən, mətnin məzmununa yaxınlıq baxımından əhəmiyyət
kəsb etmirlər. Açar sözlərə və terminlərə isə, əsasən, orta
rastgəlmə tezliyinə malik olan sözlər aid olurlar.
Burada hər şey sözlərin rastgəlinmə tezliyi intervalının
necə seçilməsindən asılı olur. Belə ki, bu interval çox
r
f
Şək.2.4. Zipfin I qanunu: “ranq-tezlik” asılılığı
Tezlik
Ranq
85
geniş götürülərsə, onda köməkçi və xidməti sözlər termin
qismində sənədin axtarış obrazına düşə bilər ki, bu da
sonradan axtarış prosesini çətinləşdirər. Əgər bu interval
çox kiçik seçilərsə, onda əhəmiyyət kəsb edən terminlər
diqqətdən kənarda qala bilərlər. Praktika göstərir ki, bu
interval əsasən ranqlar siyahısının ortasında yerləşən bir
zolaqdan ibarət olur.
Nümunəyə baxaq. Tutaq ki, mətndə “Azərbaycan”,
“respublika”, “ölkə” və s. sözlər təxminən 30 dəfə
(f
1
=30), “müstəqil”, ”bayraq”, “müdafiə” və s. sözlər 15
dəfə (f
2
=15) dəfə, “əsgər”, “torpaq”, “sərhəd” və s. sözlər
təxminən 10 dəfə (f
3
=10) dəfə, “düşmən”, “müharibə” və
s. sözlər isə 8 dəfə (f
4
=8) dəfə rast gəlinmişdir. Onda
c=30
1=152=103=84=...≈ 30 olar.
2.5.2. Zipfin II qanunu – “say-tezlik” asılılığı
Zipfin I qanununda müxtəlif sözlərin mətnə eyni
tezliklə daxil olması amili diqqətdən kənarda qalmışdır.
Sözlərin mətnlərə daxilolmalarının statistik göstəriciləri
üzərində təhlilini davam etdirən Zipf müəyyən etmişdir
ki, sözlərin mətnlərə daxilolma tezlikləri ilə həmin tezliyə
mailk sözlərin sayı arasında da asılılıq mövcuddur.
Belə ki, insanlar tərəfindən yaradılmış bütün mətnlər
üçün tezlik və həmin tezliyə malik sözlərin sayı arasındakı
asılılıq hiperbola şəklidə olur. Bu qanunauyğunluq bütün
dillər üçün öz qüvvəsini saxlayır. Yalnız əyrinin meyilliyini
müəyyən edən əmsal cüzi fərqlənə bilər (şək.2.5).
Qeyd edilməlidir ki, Zipfin qanunları universal olub bir
çox sahələrdə doğruluğunu saxlayır. Məsələn, şəhərlərdə
86
yaşayan əhalinin sayı ilə həmin sayda əhalisi olan şəhərlərin
sayı arasındakı asılılıq, varlı insanların (şirkətlərin) kapital-
ları ilə həmin həcmdə kapitala malik insanların (şirkətlərin)
sayı arasındakı asılılıq və s. Zipf qanununa cavab verir.
Nümunəyə baxaq. Tutaq ki, “Azərbaycan”, “respublika”,
“ölkə” və s. cəmi 20 söz hərəsi 30 dəfə, “müstəqil”, “bayraq”,
“müdafiə” və s. cəmi 40 söz hərəsi 15 dəfə, “əsgər”, “torpaq”,
“sərhəd” və s. cəmi 60 söz hərəsi 10 dəfə, “düşmən”, “mü-
haribə” və s. cəmi 80 söz hərəsi 8 dəfə və s. rast gəlinmişdir.
Onda c=30
20=1540=1060= =880=...≈ 600 olar.
Şək.2.5. Zipfin II qanunu:
“sözlərin sayı – tezlik” asılılığı
Sözl
ərin say
ı
Tezlik
İngilis dili
Azərbaycan dili
Rus dili
87
2.5.3. Bredford qanunu
Elmi jurnalların məzmunlarının, o cümlədən hər hansı
mövzu sahəsi üzrə məqalələrin elmi jurnallar üzrə paylan-
masının tədqiqi zamanı Bredford elmi jurnalların sayı ilə bu
və ya digər mövzu sahəsi üzrə həmin jurnallarda dərc olun-
muş məqalələrin sayı arasında qanunauyğunluq müəyyən
etmişdir.
Belə ki, əgər elmi jurnallar hər hansı mövzu sahəsi üzrə
çap olunmuş məqalələrin sayına görə azalan sıra ilə düzü-
lərsə, onda onları elə zonalara bölmək olar ki, hər bir zonda
həmin mövzu sahəsi üzrə məqalələrin sayı eyni olsun.
Tutaq ki, N
1
, N
2
, N
3
, N
4
,... – uyğun olaraq 1-ci, 2-ci, 3-
cü, 4-cü və s. zonalarda olan jurnalların sayı, k – bir zona-
dakı jurnalların sayının növbəti zonadakı jurnalların sayı-
na nisbətini göstərən kəmiyyətdir. Onda
N
1
: N
2
: N
3
: N
4
: ... = 1 : k : k
2
: k
3
: ...
olar.
Bredford qanunu internetin saytlarının və saytlarda
dərc olunan web-səhifələrin sayı arasındakı münasibət
üçün də doğrudur.
Bu qanunauyğunluq informasiya fəzasında (o cümlə-
dən internetin web-fəzasında) çox böyük ehtimalla məhz
istifadəçini maraqlandıran mövzu sahəsinə uyğun olan
məqalələri (web-səhifələri) mövzu özündə saxlayan nəşr-
ləri (web-saytları) seçməyə imkan verir.
Nümunəyə baxaq. Tutaq ki, bizi maraqlandıran mövzu sa-
həsi üzrə məqalələrin sayına görə ilk on yeri tutan cəmi 10
jurnal (sayt) müəyyən edilmişdir. Əgər bu zonada məqalələ-
rin (web-səhifələrin) cəmi sayı 30 olarsa, onda daha 30 mə-
qalənin (web-səhifənin) tapılması üçün mövcud jurnalların
sırasına əlavə 10* k sayda (əgər k=5 olarsa, 50) jurnal (sayt)
Dostları ilə paylaş: |