Microsoft Word Qasimov-ias docx



Yüklə 3,02 Kb.
Pdf görüntüsü
səhifə41/74
tarix17.10.2017
ölçüsü3,02 Kb.
#5225
növüDərs
1   ...   37   38   39   40   41   42   43   44   ...   74

 
 
163 
 
AND operatoru sorğuya cavab olaraq verilən sənədlərin 
sayını çox kəskin surətdə azalda bilər. Bu zaman hər şey ax-
tarış terminlərinin indekslər bazası üçün nə qədər xarakterik 
olmasından çox asılı olur. OR operatoru isə əksinə sorğunun 
özünü doğrultmayan genişlənməsinə gətirib çıxara bilər. Belə 
olduqda isə faydalı informasiyanın lazımsız məlumatlar (in-
formasiya səs-küyü) arasında itib batmasına səbəb ola bilər. 
Bul modeli əsasında qurulmuş informasiya-axtarış dili-
nin müvəffəqiyyətlə tətbiq edilməsi üçün sistemin leksika-
sını  və tematik istiqamətini yaxşı bilmək tələb olunur. 
Adətən, belə İAD olan sistemlər üçün xüsusi mürəkkəb lü-
ğətlərə malik sənədli leksik məlumat (indekslər) bazaları 
yaradılır. Tezaurus adlanan bu lüğətlər terminlər arasında-
kı əlaqələr haqqında məlumatı özündə saxlayır. 
Qeyd etmək lazımdır ki, məntiqi modellər reallaşdırma 
üçün çox sadədir və bu baxımdan hazırda onlar bir çox 
kommersiya əsaslı (özəl) axtarış sistemlərində  tətbiq olu-
nurlar. Onlar məntiqi  əməllərin köməyi ilə istifadəçilərə 
öz sorğularını ixtiyari mürəkkəb ifadələr  şəklində forma-
laşdırmağa imkan verir. 
Həmçinin qeyd olunmalıdır  ki, məntiqi modeldə axta-
rışın effektivliyi, adətən, yüksək olmur. Belə ki, terminlərə 
çəki əmsallarının mənimsədilməməsi və relevant sənədlər 
qismində tapılmış bütün sənədlər üçün RSV dəyişəninin 
eyni qiymətlər alması  səbəbindən axtarışın nəticəsini ni-
zamlamaq və sıraya düzmək mümkün olmur. Ona görə də, 
tapılıb istifadəçiyə verilmiş sənədlərin siyahısında (onların 
sayı minlərlə, bəzən isə yüz minlərlə ola bilər) daha vacib 
sənədlər siyahının ortasına və ya axırına düşə və istifadə-
çinin diqqətindən kənarda qala bilərlər. 
Bu modeldə axtarışın effektivliyini artırmaq məqsədilə 
çox vaxt istifadəçi ilə  əks  əlaqə üsulundan istifadə olunur. 


164 
İAS tapılmış sənədlərin siyahısını istifadəçilərə verərkən sis-
tem onlardan siyahının əvvəlində yerləşən bir neçə sənədin 
həqiqətən relevant olub-olmamasını göstərməyi xahiş edir. 
Məntiqi modelin dəyişdirilmiş (modifikasiya olunmuş) 
variantı çəkiyə (qeyri-səlis çoxluqlar və münasibətlər nəzə-
riyyəsinin köməyi ilə qiymətləndirilir)  əsaslanan bul axta-
rışıdır. Belə axtarışın ideyası olduqca sadədir. Fərz edilir ki, 
termin sənədin məzmununu hər hansı dəqiqliklə təsvir edir 
və bu dəqiqlik terminin həmin sənəd üçün çəkisi kimi qəbul 
olunur. Bu zaman həm sənədin terminlərinin, həm də sor-
ğuya daxil olan terminlərin çəkisini müəyyənləşdirmək 
olar. Sorğular yuxarıda təsvir olunmuş informasiya-axtarış 
dilinin köməyi ilə formalaşdırıla, axtarışın nəticəsi isə isti-
fadəçiyə verilən zamanı  sənədlərin sorğuya yaxınlıq dərə-
cəsinə uyğun olaraq nizamlana bilər. Burada yaxınlığın öl-
çülməsi elə aparılır ki, məntiqi axtarış modeli çəkiyə əsas-
lanan bul axtarışının xüsusi halını təşkil etsin. 
6.3.  Vektorlar modeli  
Vektorlar modeli informasiya axtarışının atası hesab olu-
nan Gerard Salton tərəfindən 1968-ci ildə SMART axtarış 
sistemində reallaşdırılmışdır. Bu model çərçivəsində nəticə-
nin nizamlanması təbii statistik müşahidəyə əsaslanmışdır.  
Vektorlar modelində (onu bəzən  cəbri model adlandırır-
lar) sənədlər informasiya fəzasının vektorları çoxluğu ilə təq-
dim olunurlar. n normallaşdırılmış vektordan ibarət bazislə 
müəyyən olunan bu fəzada hər bir sənəd bir n-ölçülü vektorla 
təqdim edilir. Bu vektorun birinci elementi vektorlar fəzasın-
da ölçməyə uyğun olaraq birinci terminin sənəddəki çəkisini
ikinci elementi ikinci terminin çəkisini və s. əks etdirir. 


165 
Vektorlar modelində qəbul edilmişdir ki, fəzanı əmələ gə-
tirən terminlərin vektoru ilə  sənədlərin vektorları ortoqonal 
olmalıdır. Burada terminlər arasında mövcud olan qarşılıqlı 
əlaqələr nəzərə alınmır. Adətən, informasiya axtarışının vek-
torlar modelində bir çox anlayışlardan istifadə olunur. 
İnformasiya axını və ya massivi n*m ölçülü matris şək-
lində təqdim olunur.  Burada n – sənədlərin, isə massiv-
də olan sənədlərin təsvir olunması üçün istifadə olunan 
terminlərin ümumi sayıdır. Matrisin sətirləri qismində sə-
nədlərin axtarış obrazları çıxış edir: 


N
d
d
d
D
,...,
,
2
1

.
İnformasiya massivinin ümumi terminləri çoxluğu lüğət 
adlanır və 


m
t
t
t
T
,...,
,
2
1

 ilə işarə olunur.
Sənədlər  m ölçülü vektorlar şəklində  təqdim edilirlər. 
Əgər hər hansı termin verilmiş sənədə daxildirsə, onda vek-
torun müvafiq müvafiq elementinə 1, əks halda isə 0 qiyməti 
mənimsədilir. Adətən, xətti indeksləşdirmə modelində bütün 
axtarış  əməliyyatları  sənədlərin vektorlar şəklində  təqdim 
edilmiş axtarış obrazları üzərində yerinə yetirilir, lakin bu 
zaman sadəlik naminə bu obrazları sənəd adlandırırlar.  
İstifadəçi sorğusu da l ölçülü vektorla təqdim olunur: 


l
q
q
q
Q
,...,
,
2
1

– sorğuya daxil edilmiş açar sözlərin
sayıdır. 
Axtarış prosesində  sənədin sorğuya uyğunluğunu 
müəyyən etmək üçün sənəd və sorğu vektorlarının skalyar 
hasili hesablanır: 
=
∙ , (6.1)
burada Q – sorğu vektoruR – sistemin sorğuya cavabıdır. 
Alınan nəticə  nə  qədər böyük olarsa, sənəd bir o qədər 
sorğuya relevant hesab edilər. 
Nəticənin yaxşılaşdırılması məqsədilə relevantlığa görə 
sorğunun korrektə edilməsi mexanizmindən istifadə olu-


Yüklə 3,02 Kb.

Dostları ilə paylaş:
1   ...   37   38   39   40   41   42   43   44   ...   74




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə