158
Sorğunun genişləndirilməsi üsulu ilkin sorğuya yeni
terminlər əlavə etmək yolu ilə onu daha əhatəli edir. Belə
ki, əvvəlcə müsbət əks əlaqəli sənədləri təsvir edən ter-
minlər çoxluğu seçilir. Bu çoxluq terminlərin vaciblik də-
rəcələrinə görə nizamlandıqdan sonra siyahının əvvəlindən
verilmiş sayda termin götürülür və sorğuya əlavə edilir.
Sorğunun parçalanması (hissələrə ayrılması) üsulu ax-
tarış nəticəsində tapılmış sənədlər arasında müsbət əks
əlaqəli müxtəlif xarakterli sənədlər olduqda tətbiq olunur.
Belə hallarda istifadəçiyə verilmiş sənədlər çoxluğu eyni
xarakterə malik sənədlərdən ibarət bir neçə alt çoxluğa
(klasterə) bölünür. Əgər bu mümkün olarsa, onda istifadə-
çinin sorğusu elə alt sorğulara (yəni ilkin sorğunun alt his-
sələri olan bir neçə ayrı-ayrı sorğulara) bölünür ki, hər bir
alt sorğu ayrı-ayrı sənədlər alt çoxluğuna uyğun olsun.
Bundan sonra hər bir alt sorğu üzrə ayrı-ayrılıqda axta-
rış aparılır, onların terminlərinin çəki əmsalları yaxşılaşdı-
rılır və ya bu alt sorğular əvvəl qeyd olunmuş üsulların kö-
məyi ilə genişləndirilir. Beləliklə, axtarışın effektivliyinin
səviyyəsi yüksəldilmiş olur.
Sənədlərin təqdimatının dəyişdirilməsi üsulları istifadəçi
ilə əks əlaqənin köməyi ilə axtarış sisteminin indekslər baza-
sında sənədlərin təqdim olunması vektorunu yaxşılaşdırma-
ğa imkan verir. Bu zaman terminlərin çəki əmsalları elə şə-
kildə korrektə edilir ki, tapılmış relevant sənədlərin vektoru
sorğunun vektoruna müəyyən qədər yaxınlaşmış olsun, qey-
ri-relevant sənədlərin vektorları isə əksinə ondan uzaqlaşsın.
Sənədlərin təqdim olunması vektorlarının belə korrek-
siyasından sonra növbəti dəfə analoji axtarış sorğusu daxil
edildikdə sistem əvvəlki axtarış seanslarına nisbətən daha
relevant sənədləri tapıb istifadəçiyə verir.
VI FƏSİL
İNFORMASİYA AXTARIŞININ
MODELLƏRİ
İnformasiya axtarışının modelləşdirilməsinə
yanaşmalar
Nəzəri-çoxluqlar modeli
Vektorlar modeli
Statistik tezliklər modeli
Ehtimallar modeli
Linqvistik model
Semantik model
Qeyri-səlis model
160
6.1. İnformasiya axtarışının modelləşdirilməsinə
yanaşmalar
Mütəxəssislərin fikrinə görə, internetdə fəaliyyət göstə-
rən informasiya-axtarış sistemlərinin böyük əksəriyyəti
hər hansı riyazi modelə əsaslanmır. Onlarda yalnız istifa-
dəçinin daxil etdiyi sorğuya uyğun olan müəyyən sənədlə-
rin tapılıb verilməsini təmin edən alqoritmlər reallaşdı-
rılmış olur. Lakin axtarışın keyfiyyətinin yaxşılaşdırılma-
sı, məlumatın həcminin böyüklüyü, istifadəçi sorğularının
axınının intensivliyi ilə bağlı məsələlərin həlli zamanı təc-
rübi alqoritmlərlə yanaşı nəzəri riyazi aparata əsaslanan
axtarış modelinə (sadə olsa belə) zərurət yaranır.
Axtarışın modeli dedikdə əsasında hansı sənədlərin ta-
pılması və nizamlanması barədə qərar qəbul etməyə imkan
verən zəruri qaydaların yaradıldığı real vəziyyətin müəy-
yən sadələşdirilməsi başa düşülür. Model qəbul edildikdən
sonra məsələnin həlli üçün zəruri olan parametrlər həqiqi
mənalarını ifadə edir və başa düşülən olur.
İnformasiya axtarışı modelləri əsas dörd parametrlə
xarakterizə olunur:
- sənədlərin və sorğuların təqdim edilməsi;
- sənədin istifadəçinin sorğusuna relevantlığının
qiymətləndirilməsi üçün tətbiq olunan qarşılıqlı
müqayisə üsulları;
- axtarışın nəticələrinin nizamlanması üsulları;
- relevantlığın istifadəçi tərəfindən
qiymətləndirilməsini təmin edən əks əlaqə
mexanizmləri.
Sənədlərin təqdim olunması, indeksləşdirilməsi, axtarış
obrazlarının yaradılması, eləcə də reallaşdırılan informasiya
161
axtarışı üsullarından və vasitələrindən asılı olaraq, informa-
siya axtarışının bir sıra modellərini fərqləndirirlər. Bütövlük-
də bu modellərin effektivliyi qeyd olunan üsul və vasitələrin
reallaşdırılmasının keyfiyyəti ilə müəyyən olunur.
Sənədli informasiya axtarışının ümumiləşdirilmiş mo-
delini aşağıdakı kortej şəklində vermək olar:
, , , ( , ) .
Burada D – sənədlərin təqdimatları çoxluğu, Q – infor-
masiya sorğularının təqdimatları çoxluğu, F – sənədlərin
və sorğuların təqdimatlarının təhlili, qiymətləndirilməsi və
müqayisəsi, onlar arasındakı münasibətlərin modelləşdiril-
məsi vasitələri, R( d,q) – nizamlama funksiyasıdır. R( d,q)
funksiyası hər bir
∈
sənədinə və
∈
sorğusuna
qarşı həqiqi ədədlər qoyur,
∈ sorğusuna görə ∈
sənədinin axtarış nəticəsində verilmiş sənədlər çoxluğunda
sırasını müəyyən edir.
Aşağıda informasiya axtarışının daha məşhur olan mo-
dellərinə baxılır:
- nəzəri-çoxluqlar modeli;
- vektorlar modeli;
- statistik tezliklər üsulu;
- ehtimallar modeli;
- linqvistik model;
- semantik model;
- qeyri-səlis model.
6.2. Nəzəri-çoxluqlar modeli
Nəzəri çoxluqlar (bul) modelləri tammətnli axtarışı
reallaşdıran ən ilk və çox istifadə olunan modellərdir. Bu
162
modellərə əsasən, axtarış sorğusundakı söz sənəddə rast
gəlinirsə, onda həmin sənədin axtarılan sənəd olduğu qə-
bul edilir. Əks halda sənəd sorğuya relevant hesab olunur.
Nəzəri-çoxluqlar modelində sənədlərin və sorğuların
təsvir edilməsi üçün bul dəyişənlərindən istifadə olunur.
Məhz bu səbəbdən çox vaxt nəzəri-çoxluqlar modellərini
“bul modelləri“ adlandırırlar. Beləliklə, bul modellərində
sənədlər onun indeksində olan və bul dəyişənləri (məntiqi
dəyişənlər) kimi qəbul edilən terminlər çoxluğunun kömə-
yi ilə təqdim olunurlar. Əgər hər hansı termin sənəddə rast
gəlinirsə, onda bu termin üçün uyğun məntiqi dəyişən
“True”, əks halda “False” qiymətini alır. Terminlərə hər
hansı çəki əmsallarının mənimsədilməsinə icazə verilmir.
Belə ki, burada yalnız terminin sənədə daxil olub-olma-
ması (True və ya False) faktı təsbit olunur.
Bu modelə uyğun olaraq, istifadəçilər öz sorğularını
məntiqi (bul) ifadələr şəklində formalaşdırırlar. Sorğulara
daxil olan terminlər AND, OR, NOT və s. kimi məntiqi
əməllərin köməyi ilə bir-birinə bağlanırlar. Axtarış sistemi
tərəfindən istifadəçinin sorğusu qəbul edildikdən sonra in-
formasiya fəzasının hər bir sənədi üçün seçim statusunun
qiymətləri – retrial status values (RSV dəyişəni) hesab-
lanır. RSV dəyişəninin qiymətləri informasiya fəzasının
sənədlərinin istifadəçinin sorğusuna uyğunluğu dərəcələ-
rini müəyyən etməyə imkan verir. RSV dəyişəni “1” və ya
“0” qiymətlərindən birini alır. Əgər verilmiş sorğu üçün
məntiqi ifadənin qiyməti “True” olarsa, onda RSV dəyi-
şəni “1” qiymətini alır və müvafiq sənədlər verilmiş sor-
ğuya relevant kimi qəbul edilir. Əgər ifadənin qiyməti
“False” olarsa, onda RSV=0 qiymətini alır və müvafiq sə-
nədlər sorğuya qeyri-relevant hesab olunur.
Dostları ilə paylaş: |