Microsoft Word Qasimov-ias docx



Yüklə 3,02 Kb.
Pdf görüntüsü
səhifə38/74
tarix17.10.2017
ölçüsü3,02 Kb.
#5225
növüDərs
1   ...   34   35   36   37   38   39   40   41   ...   74

152 
-  sinonimlər və tezaurus lüğətlərinin istifadəsi
-  assosiativ sözlər çoxluğunun istifadəsi; 
-  ehtimala əsaslanan indeksləşdirmə; 
-  biblioqrafik məlumatların istifadəsi. 
Yuxarıda sadalanan üsullardan daha məşhuru sinonim-
lər və tezaurus lüğətlərinin istifadə olunması üsuludur. Bu 
lüğətlər sinonim və ya ekvivalent sözlərin sinifləri çoxlu-
ğundan ibarət olur. Hər sinifdə bir-biri ilə sinonim və ya 
tezaurus təşkil edən terminlər, eyni bir obyektin və ya hə-
rəkətin təsvirini verən, mənaca bir-birinə çox yaxın olan, 
eyni mövzu sahəsinə aid edilən sözlər qruplaşdırılır.  
Belə lüğətlərin istifadəsi axtarış prosesində sorğunun 
hər hansı termininin müvafiq sinonimlər sinfinin identi-
fikatoruna dəyişdirilməsinə imkan verir. Nəticədə verilmiş 
hər hansı bir termin bu sinfə daxil olan terminlər çoxluğu 
ilə əvəz edilmiş olur. 
Terminlərin  əlavə üst-üstə düşmələrini təmin etmək 
üçün tətbiq olunan növbəti üsul assosiativ sözlərin istifa-
dəsi üsuludur. Bu üsula əsasən sorğuda göstərilən və sənə-
di təsvir edən hər bir termin üçün onunla assosiasiya təşkil 
edən əlavə terminlər çoxluğu əlavə olunur. 
Terminlərin assosiativlik göstəricisinin müəyyən edilməsi 
üçün indeksləşdirmə üsullarından, məsələn, statistik üsuldan 
istifadə etmək olar. Belə üsullara əsasən terminlər çoxluğu 
üçün 
n
m
ij
a
A


}
{
 assosiativlik matrisi tərtib olunur. Bu 
matrisin sətir və sütunlarının kəsişməsində yerləşən 
ij
a
 
ele-
menti 
i
 və 
j
 terminləri cütü üçün assosiativlik dərəcəsinin 
(assosiativlik əmsalının) qiymətini müəyyən edir. 
İki i və j terminlərinin assosiativlik əmsalı bu terminlə-
rin informasiya massivinin bütün sənədləri üzrə rast-
gəlinmə tezliklərinin hasillərinin cəmi şəklində hesablanır: 


153 




n
k
jk
ik
ij
f
f
a
1
,
(8.1)
burada 
ij
 – i və j terminlərinin assosiativlik əmsalı, 
ik
f
 – i 
termininin  k  sənədində rastgəlinmə tezliyi, n – massivdə 
olan sənədlərin sayıdır. 
Yuxarıda qeyd olunduğu kimi, i  və  j terminlərinin  k 
sənədində rastgəlinmə tezlikləri 
ik
f
 və 
jk
 [0,1]  interva-
lında qiymətlər alır. Lakin (8.1) düsturuna uyğun olaraq, 
hesablama nəticəsində 
ij
a
 
assosiativlik  əmsalının qiyməti 
çox böyük ola bilər. Ona görə  də bu əmsalın qiymətini 
normallaşdırmaq məqsədilə aşağıdakı düstur tətbiq olunur: 

















n
k
jk
ik
n
k
jk
n
k
ik
n
k
jk
ik
ij
f
f
f
f
f
f
a
1
1
2
1
2
1
  (8.2) 
Terminlərin assosiativlik göstəricilərinin qiymətləri üçün 

 sərhəd qiyməti müəyyən olunur. Əgər 


ij
a
 olarsa, 
onda i və terminləri assosiativ terminlər kimi qəbul olunur. 
Ehtimala  əsaslanan indeksləşdirmə zamanı  əvvəlcə ter-
minlərin sənədlərdə mövcud olub-olmaması müəyyənləşdi-
rilir, bundan sonra terminlərlə  sənədlər arasındakı münasi-
bətlərin əsasında bu terminlərə uyğun olan tematik siniflərin 
identifikatorları həmin sənədlərə mənimsədilir, yəni sənədlər 
bu terminləri özündə saxlayan tematik siniflərə aid edilir. 
Nəhayət,  biblioqrafik məlumatların istifadə olunması 
üsulları açar sözlərin sayını artırmağa, bunun nəticəsində 
isə axtarış prosesində  əhatə olunan sənədlər dairəsini ge-
nişləndirməyə imkan verir. Biblioqrafik məlumatlar qis-
mində müəlliflərin soyadı, nəşriyyatların adı, sənədlərdə 


154 
rast gəlinən istinadlar, sitatlar və s. kimi rekvizitlər istifadə 
olunur. Onlar açar sözlər qismində  sənədlərə (onların in-
dekslərinə) əlavə edilərək yazılır.   
5.3.  Axtarışın dəqiqliyinin yaxşılaşdırılması 
üsulları 
Axtarışın dəqiqliyinin yaxşılaşdırılması üsulları sor-
ğuya daha az uyğun olan, eləcə də təsadüfi və lazımsız sə-
nədləri istisna etmək və daha relevant sənədləri saxlamaq 
yolu ilə sistem tərəfindən tapılaraq istifadəçiyə verilən sə-
nədlər çoxluğunu (siyahını) daraltmağa xidmət edir. 
Yuxarıda qeyd olunduğu kimi, axtarışın dolğunluğunun 
yaxşılaşdırılması sorğuların və sənədlərin təsviri üçün isti-
fadə olunan terminlər çoxluğunun genişləndirilməsi, habe-
lə onların digər qohum terminlərlə əvəz olunması yolu ilə 
əldə edilir. Lakin dolğunluqdan fərqli olaraq, axtarışın də-
qiqliyi daha dar mənalı terminlərin və ya bir neçə terminin 
(yəni söz birləşmələrinin) birgə  tətbiq olunması yolu ilə 
yaxşılaşdırıla bilər. Qeyd olunmalıdır ki, dolğunluğun 
yaxşılaşdırılması üçün əlavə olunan terminlər sorğuya 
«OR» məntiqi əməli ilə, dəqiqliyin yüksəldilməsi üçün isə 
«AND» məntiqi əməli ilə daxil edilirlər. 
Dar mənalı terminlərin və söz birləşmələrinin seçilməsi 
üçün xüsusi üsullardan istifadə olunur. Lakin bu üsullar 
bir sıra üstün və çatışmayan cəhətlərə malikdirlər. 
Söz və ya termin birləşmələrinin yaradılması üçün statis-
tik üsulun məğzi aşağıdakından ibarətdir. Fərz edilir ki, mas-
sivdəki sənədlərdə söz birləşmələrinin, yəni terminlərin bir-
gə rast gəlinməsi tezliyi bu terminlərin ayrı-ayrılıqda rast gə-
linməsi tezliyindən yüksək olmur. Onda iki termin arasın-
dakı bağlılıq dərəcəsini aşağıdakı kimi müəyyən etmək olar: 


Yüklə 3,02 Kb.

Dostları ilə paylaş:
1   ...   34   35   36   37   38   39   40   41   ...   74




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə