155
N
F
F
F
C
j
i
ij
ij
,
(8.3)
burada
ij
F
– massivin sənədlərində i və j terminləri cütlü-
yünün birgə rast gəlinməsi tezliyi,
i
F
və
j
F
isə massivin
sənədlərində uyğun olaraq i və j terminlərinin ayrı-
ayrılıqda rast gəlinmə tezlikləri, N – massivin sənədlərində
olan terminlərin və ya sözlərin ümumi sayıdır.
Massivin sənədlərinin mətnlərindən müvafiq söz birləş-
mələrinin seçilməsinin effektivliyini yüksəltmək üçün əv-
vəlcə sənədin sözləri çoxluğundan bütün xidməti sözlər çıxa-
rılır, sonra isə qalan sözlər arasından birgə rast gəlinmə tezli-
yi və əlaqəlik əmsalı yüksək olan terminlərin kombinasiyala-
rı seçilir. Bu zaman tezliklər üçün müəyyən sərhəd qiymətlə-
ri daxil edilir.
ij
F
birgə rast gəlinmə tezliyi və
ij
C
əlaqəlik
dərəcəsi verilmiş hər hansı sərhəd qiymətlərindən yuxarı
olan bütün terminlər söz birləşmələri kimi qəbul edilir.
Söz birləşmələrinin seçilməsi üçün statistik üsullar heç
də həmişə yararlı olmur. Belə ki, onlar sənədin məzmunu-
nun həddən artıq daralmasına və dolğunluğun itməsinə
gətirib çıxara bilər.
Sintaktik və semantik üsullar söz birləşmələrini təşkil
edən komponentlərin qrammatik və mətnin strukturlarının
isə linqvistik təhlilinə əsaslanırlar. Bu üsullar təbii dillərlə
bağlı olur. Belə ki, mətnlərin sintaktik və semantik xassə-
ləri onların hazırlandığı dillərin xüsusiyyətlərindən bilava-
sitə asılı olur. Sintaktik və semantik üsulların az inkişaf et-
məsinə baxmayaraq, hal-hazırda bir sıra mövcud tam-
mətnli axtarış sistemlərində bu üsullardan istifadə olun-
mağa başlanmışdır.
156
5.4. Relevantlığın yüksəldilməsi üçün istifadəçi ilə
əks əlaqənin istifadəsi
Adətən, axtarış sistemlərində sənədlər terminlər vasitə-
silə qeyri-dəqiq təqdim olunurlar. Ona görə də istifadəçilər
axtarış prosesini qeyri-dəqiq, yəni natamam sorğular əsa-
sında aparmağa məcbur olurlar. Bu isə təbii ki, arzu olu-
nan nəticələri əldə etməyə imkan vermir. Amma sonra
prosesin növbəti mərhələlərində istifadəçilər iterativ yolla
öz sorğularını dəqiqləşdirərək tədricən effektivliyi artıra
və axtarışın nəticəsini yaxşılaşdıra bilərlər.
Bunun üçün axtarış sistemlərində istifadəçi ilə əks əla-
qə mexanizmi reallaşdırılır. Bu mexanizm istifadəçiyə
onun ilkin sorğusuna əsasən sistem tərəfindən tapılmış sə-
nədlərin relevantlıq dərəcəsini qiymətləndirərək öz fikrini
sistemə ötürməyə imkan verir. Bu, iki və ya çoxsəviyyəli
münasibətlərin əsasında həyata keçirilir.
İkisəviyyəli münasibətlərdə istifadəçi aşağıdakı iki va-
riantdan birini göstərə bilər: sistem tərəfindən verilmiş sə-
nədlər sorğuya ya relevant olur, ya da qeyri-relevant. Çox-
səviyyəli münasibətlər istifadə olunduqda isə bu iki va-
riantdan əlavə həm də sənədlərin qismən relevant olması
münasibəti müəyyən edilə bilər. Əks əlaqə üsullarının
reallaşdırılmasının sadələşdirilməsi üçün, adətən, ikisəviy-
yəli relevantlıq münasibətlərindən istifadə olunur.
Hazırda iki əks əlaqə üsulu istifadə olunur:
- sorğunun təqdimatının dəyişdirilməsi;
- sənədin təqdimatının dəyişdirilməsi.
Sorğunun təqdimatının dəyişdirilməsi üsulları cari seansda
axtarışın effektivliyini artırmaq üçün nəzərdə tutulmuşdur,
onlar digər sorğular üzrə axtarışın effektivliyinə təsir etmir.
157
Sənədin təqdimatının dəyişdirilməsi üsulları isə sənəd-
lərin təqdimat formasını dəyişdirir və ona görə də yalnız
cari axtarış seansda deyil, həmçinin sonrakı seanslarda da
axtarışın nəticəsini yaxşılaşdırmağa imkan verir.
Sorğunun təqdimatının dəyişdirilməsi üsullarının kö-
məyi ilə axtarışın effektivliyinin artırılması üçün üç üsul-
dan istifadə olunur:
- terminlərin çəkilərinin dəyişdirilməsi;
- sorğunun genişləndirilməsi;
- sorğunun parçalanması (hissələrə ayrılması).
Terminlərin çəkilərinin dəyişdirilməsi üsulu sorğuya
daxil edilmiş terminlərin çəkilərinin yaxşılaşdırılmasını
həyata keçirir. Terminlərin çəkilərinin korrektə edilməsi
üçün sorğu vektoru ilə müsbət əks əlaqəli sənədlərin vek-
torlarını toplamaq lazımdır. Terminlərin çəki əmsallarını,
həmçinin sorğu vektorundan mənfi əks əlaqəli sənədlərin
vektorlarının çıxılması yolu ilə də korrektə etmək olar.
Qeyd olunmalıdır ki, müsbət əks əlaqəli sənədlər dedik-
də axtarış nəticəsində istifadəçiyə verilmiş və istifadəçi
tərəfindən sorğuya relevant sənəd kimi qiymətləndirilmiş
sənədlər başa düşülür.
Axtarış sisteminin verdiyi sənədlər içərisindən istifadə-
çi tərəfindən qeyri-relevant sənəd kimi qeyd olunmuş sə-
nədlər isə mənfi əks əlaqəli sənədlər kimi qəbul olunur.
Sorğu korrektə edildikdən sonra axtarış sistemi tərəfin-
dən verilmiş relevant sənədlərin sayı korreksiyadan əvvəl-
kindən çox olmalıdır. Belə ki, əvvəlki relevant sənədlər-
dən əlavə əks əlaqənin köməyi ilə onlar arasından istifadə-
çi tərəfindən müsbət qeyd olunmuş relevant sənədlərə ox-
şar yeni sənədlər də bu çoxluğa əlavə olunur.
Relevant sənədlərin keyfiyyətində və sayında arzu olu-
nan səviyyə əldə edilənə qədər istifadəçi bu prosesi davam
etdirə bilər.
Dostları ilə paylaş: |