163
AND operatoru sorğuya cavab olaraq verilən sənədlərin
sayını çox kəskin surətdə azalda bilər. Bu zaman hər şey ax-
tarış terminlərinin indekslər bazası üçün nə qədər xarakterik
olmasından çox asılı olur. OR operatoru isə əksinə sorğunun
özünü doğrultmayan genişlənməsinə gətirib çıxara bilər. Belə
olduqda isə faydalı informasiyanın lazımsız məlumatlar (in-
formasiya səs-küyü) arasında itib batmasına səbəb ola bilər.
Bul modeli əsasında qurulmuş informasiya-axtarış dili-
nin müvəffəqiyyətlə tətbiq edilməsi üçün sistemin leksika-
sını və tematik istiqamətini yaxşı bilmək tələb olunur.
Adətən, belə İAD olan sistemlər üçün xüsusi mürəkkəb lü-
ğətlərə malik sənədli leksik məlumat (indekslər) bazaları
yaradılır. Tezaurus adlanan bu lüğətlər terminlər arasında-
kı əlaqələr haqqında məlumatı özündə saxlayır.
Qeyd etmək lazımdır ki, məntiqi modellər reallaşdırma
üçün çox sadədir və bu baxımdan hazırda onlar bir çox
kommersiya əsaslı (özəl) axtarış sistemlərində tətbiq olu-
nurlar. Onlar məntiqi əməllərin köməyi ilə istifadəçilərə
öz sorğularını ixtiyari mürəkkəb ifadələr şəklində forma-
laşdırmağa imkan verir.
Həmçinin qeyd olunmalıdır ki, məntiqi modeldə axta-
rışın effektivliyi, adətən, yüksək olmur. Belə ki, terminlərə
çəki əmsallarının mənimsədilməməsi və relevant sənədlər
qismində tapılmış bütün sənədlər üçün RSV dəyişəninin
eyni qiymətlər alması səbəbindən axtarışın nəticəsini ni-
zamlamaq və sıraya düzmək mümkün olmur. Ona görə də,
tapılıb istifadəçiyə verilmiş sənədlərin siyahısında (onların
sayı minlərlə, bəzən isə yüz minlərlə ola bilər) daha vacib
sənədlər siyahının ortasına və ya axırına düşə və istifadə-
çinin diqqətindən kənarda qala bilərlər.
Bu modeldə axtarışın effektivliyini artırmaq məqsədilə
çox vaxt istifadəçi ilə əks əlaqə üsulundan istifadə olunur.
164
İAS tapılmış sənədlərin siyahısını istifadəçilərə verərkən sis-
tem onlardan siyahının əvvəlində yerləşən bir neçə sənədin
həqiqətən relevant olub-olmamasını göstərməyi xahiş edir.
Məntiqi modelin dəyişdirilmiş (modifikasiya olunmuş)
variantı çəkiyə (qeyri-səlis çoxluqlar və münasibətlər nəzə-
riyyəsinin köməyi ilə qiymətləndirilir) əsaslanan bul axta-
rışıdır. Belə axtarışın ideyası olduqca sadədir. Fərz edilir ki,
termin sənədin məzmununu hər hansı dəqiqliklə təsvir edir
və bu dəqiqlik terminin həmin sənəd üçün çəkisi kimi qəbul
olunur. Bu zaman həm sənədin terminlərinin, həm də sor-
ğuya daxil olan terminlərin çəkisini müəyyənləşdirmək
olar. Sorğular yuxarıda təsvir olunmuş informasiya-axtarış
dilinin köməyi ilə formalaşdırıla, axtarışın nəticəsi isə isti-
fadəçiyə verilən zamanı sənədlərin sorğuya yaxınlıq dərə-
cəsinə uyğun olaraq nizamlana bilər. Burada yaxınlığın öl-
çülməsi elə aparılır ki, məntiqi axtarış modeli çəkiyə əsas-
lanan bul axtarışının xüsusi halını təşkil etsin.
6.3. Vektorlar modeli
Vektorlar modeli informasiya axtarışının atası hesab olu-
nan Gerard Salton tərəfindən 1968-ci ildə SMART axtarış
sistemində reallaşdırılmışdır. Bu model çərçivəsində nəticə-
nin nizamlanması təbii statistik müşahidəyə əsaslanmışdır.
Vektorlar modelində (onu bəzən cəbri model adlandırır-
lar) sənədlər informasiya fəzasının vektorları çoxluğu ilə təq-
dim olunurlar. n normallaşdırılmış vektordan ibarət bazislə
müəyyən olunan bu fəzada hər bir sənəd bir n-ölçülü vektorla
təqdim edilir. Bu vektorun birinci elementi vektorlar fəzasın-
da ölçməyə uyğun olaraq birinci terminin sənəddəki çəkisini,
ikinci elementi ikinci terminin çəkisini və s. əks etdirir.
165
Vektorlar modelində qəbul edilmişdir ki, fəzanı əmələ gə-
tirən terminlərin vektoru ilə sənədlərin vektorları ortoqonal
olmalıdır. Burada terminlər arasında mövcud olan qarşılıqlı
əlaqələr nəzərə alınmır. Adətən, informasiya axtarışının vek-
torlar modelində bir çox anlayışlardan istifadə olunur.
İnformasiya axını və ya massivi n* m ölçülü matris şək-
lində təqdim olunur. Burada n – sənədlərin, m isə massiv-
də olan sənədlərin təsvir olunması üçün istifadə olunan
terminlərin ümumi sayıdır. Matrisin sətirləri qismində sə-
nədlərin axtarış obrazları çıxış edir:
N
d
d
d
D
,...,
,
2
1
.
İnformasiya massivinin ümumi terminləri çoxluğu lüğət
adlanır və
m
t
t
t
T
,...,
,
2
1
ilə işarə olunur.
Sənədlər m ölçülü vektorlar şəklində təqdim edilirlər.
Əgər hər hansı termin verilmiş sənədə daxildirsə, onda vek-
torun müvafiq müvafiq elementinə 1, əks halda isə 0 qiyməti
mənimsədilir. Adətən, xətti indeksləşdirmə modelində bütün
axtarış əməliyyatları sənədlərin vektorlar şəklində təqdim
edilmiş axtarış obrazları üzərində yerinə yetirilir, lakin bu
zaman sadəlik naminə bu obrazları sənəd adlandırırlar.
İstifadəçi sorğusu da l ölçülü vektorla təqdim olunur:
l
q
q
q
Q
,...,
,
2
1
. L – sorğuya daxil edilmiş açar sözlərin
sayıdır.
Axtarış prosesində sənədin sorğuya uyğunluğunu
müəyyən etmək üçün sənəd və sorğu vektorlarının skalyar
hasili hesablanır:
=
∙ , (6.1)
burada Q – sorğu vektoru, R – sistemin sorğuya cavabıdır.
Alınan nəticə nə qədər böyük olarsa, sənəd bir o qədər
sorğuya relevant hesab edilər.
Nəticənin yaxşılaşdırılması məqsədilə relevantlığa görə
sorğunun korrektə edilməsi mexanizmindən istifadə olu-
Dostları ilə paylaş: |