152
- sinonimlər və tezaurus lüğətlərinin istifadəsi;
- assosiativ sözlər çoxluğunun istifadəsi;
- ehtimala əsaslanan indeksləşdirmə;
- biblioqrafik məlumatların istifadəsi.
Yuxarıda sadalanan üsullardan daha məşhuru sinonim-
lər və tezaurus lüğətlərinin istifadə olunması üsuludur. Bu
lüğətlər sinonim və ya ekvivalent sözlərin sinifləri çoxlu-
ğundan ibarət olur. Hər sinifdə bir-biri ilə sinonim və ya
tezaurus təşkil edən terminlər, eyni bir obyektin və ya hə-
rəkətin təsvirini verən, mənaca bir-birinə çox yaxın olan,
eyni mövzu sahəsinə aid edilən sözlər qruplaşdırılır.
Belə lüğətlərin istifadəsi axtarış prosesində sorğunun
hər hansı termininin müvafiq sinonimlər sinfinin identi-
fikatoruna dəyişdirilməsinə imkan verir. Nəticədə verilmiş
hər hansı bir termin bu sinfə daxil olan terminlər çoxluğu
ilə əvəz edilmiş olur.
Terminlərin əlavə üst-üstə düşmələrini təmin etmək
üçün tətbiq olunan növbəti üsul assosiativ sözlərin istifa-
dəsi üsuludur. Bu üsula əsasən sorğuda göstərilən və sənə-
di təsvir edən hər bir termin üçün onunla assosiasiya təşkil
edən əlavə terminlər çoxluğu əlavə olunur.
Terminlərin assosiativlik göstəricisinin müəyyən edilməsi
üçün indeksləşdirmə üsullarından, məsələn, statistik üsuldan
istifadə etmək olar. Belə üsullara əsasən terminlər çoxluğu
üçün
n
m
ij
a
A
}
{
assosiativlik matrisi tərtib olunur. Bu
matrisin sətir və sütunlarının kəsişməsində yerləşən
ij
a
ele-
menti
i
və
j
terminləri cütü üçün assosiativlik dərəcəsinin
(assosiativlik əmsalının) qiymətini müəyyən edir.
İki i və j terminlərinin assosiativlik əmsalı bu terminlə-
rin informasiya massivinin bütün sənədləri üzrə rast-
gəlinmə tezliklərinin hasillərinin cəmi şəklində hesablanır:
153
n
k
jk
ik
ij
f
f
a
1
,
(8.1)
burada
ij
a – i və j terminlərinin assosiativlik əmsalı,
ik
f
– i
termininin k sənədində rastgəlinmə tezliyi, n – massivdə
olan sənədlərin sayıdır.
Yuxarıda qeyd olunduğu kimi, i və j terminlərinin k
sənədində rastgəlinmə tezlikləri
ik
f
və
jk
f [0,1] interva-
lında qiymətlər alır. Lakin (8.1) düsturuna uyğun olaraq,
hesablama nəticəsində
ij
a
assosiativlik əmsalının qiyməti
çox böyük ola bilər. Ona görə də bu əmsalın qiymətini
normallaşdırmaq məqsədilə aşağıdakı düstur tətbiq olunur:
n
k
jk
ik
n
k
jk
n
k
ik
n
k
jk
ik
ij
f
f
f
f
f
f
a
1
1
2
1
2
1
(8.2)
Terminlərin assosiativlik göstəricilərinin qiymətləri üçün
sərhəd qiyməti müəyyən olunur. Əgər
ij
a
olarsa,
onda i və j terminləri assosiativ terminlər kimi qəbul olunur.
Ehtimala əsaslanan indeksləşdirmə zamanı əvvəlcə ter-
minlərin sənədlərdə mövcud olub-olmaması müəyyənləşdi-
rilir, bundan sonra terminlərlə sənədlər arasındakı münasi-
bətlərin əsasında bu terminlərə uyğun olan tematik siniflərin
identifikatorları həmin sənədlərə mənimsədilir, yəni sənədlər
bu terminləri özündə saxlayan tematik siniflərə aid edilir.
Nəhayət, biblioqrafik məlumatların istifadə olunması
üsulları açar sözlərin sayını artırmağa, bunun nəticəsində
isə axtarış prosesində əhatə olunan sənədlər dairəsini ge-
nişləndirməyə imkan verir. Biblioqrafik məlumatlar qis-
mində müəlliflərin soyadı, nəşriyyatların adı, sənədlərdə
154
rast gəlinən istinadlar, sitatlar və s. kimi rekvizitlər istifadə
olunur. Onlar açar sözlər qismində sənədlərə (onların in-
dekslərinə) əlavə edilərək yazılır.
5.3. Axtarışın dəqiqliyinin yaxşılaşdırılması
üsulları
Axtarışın dəqiqliyinin yaxşılaşdırılması üsulları sor-
ğuya daha az uyğun olan, eləcə də təsadüfi və lazımsız sə-
nədləri istisna etmək və daha relevant sənədləri saxlamaq
yolu ilə sistem tərəfindən tapılaraq istifadəçiyə verilən sə-
nədlər çoxluğunu (siyahını) daraltmağa xidmət edir.
Yuxarıda qeyd olunduğu kimi, axtarışın dolğunluğunun
yaxşılaşdırılması sorğuların və sənədlərin təsviri üçün isti-
fadə olunan terminlər çoxluğunun genişləndirilməsi, habe-
lə onların digər qohum terminlərlə əvəz olunması yolu ilə
əldə edilir. Lakin dolğunluqdan fərqli olaraq, axtarışın də-
qiqliyi daha dar mənalı terminlərin və ya bir neçə terminin
(yəni söz birləşmələrinin) birgə tətbiq olunması yolu ilə
yaxşılaşdırıla bilər. Qeyd olunmalıdır ki, dolğunluğun
yaxşılaşdırılması üçün əlavə olunan terminlər sorğuya
«OR» məntiqi əməli ilə, dəqiqliyin yüksəldilməsi üçün isə
«AND» məntiqi əməli ilə daxil edilirlər.
Dar mənalı terminlərin və söz birləşmələrinin seçilməsi
üçün xüsusi üsullardan istifadə olunur. Lakin bu üsullar
bir sıra üstün və çatışmayan cəhətlərə malikdirlər.
Söz və ya termin birləşmələrinin yaradılması üçün statis-
tik üsulun məğzi aşağıdakından ibarətdir. Fərz edilir ki, mas-
sivdəki sənədlərdə söz birləşmələrinin, yəni terminlərin bir-
gə rast gəlinməsi tezliyi bu terminlərin ayrı-ayrılıqda rast gə-
linməsi tezliyindən yüksək olmur. Onda iki termin arasın-
dakı bağlılıq dərəcəsini aşağıdakı kimi müəyyən etmək olar:
Dostları ilə paylaş: |