Microsoft Word Qasimov-ias docx



Yüklə 3,02 Kb.
Pdf görüntüsü
səhifə63/74
tarix17.10.2017
ölçüsü3,02 Kb.
#5225
növüDərs
1   ...   59   60   61   62   63   64   65   66   ...   74

Axtar
ış
ın 

tic
əl
ərinin  

hlili, üm
um


rar
ın q
əbul

Axtar
ış
  
ma
şı

 – 2  
Axtar
ış
 
 ma
şı

 – 1  
Axtar
ış
  
ma
şı

 – N  
... 
Meta-axtar
ış
 agenti 

sor
ğun
un a
xtar
ış
ma
şı
nlar
ına 
ötürülm
əsi
 
Meta-axtar
ış
ın 

tic
əsi
 
Axtar
ış
  
sor
ğusu
Şə
k.
8.2. M
eta-axtar
ış
 siste
m
inin funksional strukturu 
2
29 


230 
8.4.  İnternetin informasiya ehtiyatlarının 
indeksləşdirilməsi və təqdim olunması 
mexanizmləri 
Qeyd olunduğu kimi, axtarış sistemlərində hər bir sənəd 
özünün axtarış obrazı ilə  təqdim olunur. Sənədin axtarış 
obrazı  (SAO) – informasiya ehtiyatlarının (sənədlərin) 
məzmununu tam əks etdirən təsviredicilər (terminlər, açar 
sözlər və s.) çoxluğunu özündə birləşdirir. SAO axtarış 
sistemində istifadə olunan model çərçivəsində informasiya 
massivinin ehtiyatlarının məzmunlarının indeksləşdirilmə-
si, yəni onların müəyyən olunmuş formaya inikas etdiril-
məsi prosedurasının tətbiqi nəticəsində yaranır. 
Aydındır ki, SAO-nun yaradılması üçün sənədin məz-
mununa uyğun olan terminlər çoxluğunun müəyyənləşdiril-
məsi, sistemləşdirilərək saxlanılması problemi həll olunma-
lıdır. Məlumdur ki, SAO-nun yaradılması, yəni sənədlərdən 
vacib terminlərin seçilməsi və onlara bağlanması prose-
durası sənədlərin indeksləşdirilməsi, terminlər çoxluğu isə 
sənədin indekslər bazası və ya sadəcə indeksi adlanır. 
Mümkün terminlərin sənədlərə bağlanmasını  təmin et-
mək üçün təsbit olunmuş terminlər (informasiya massivi-
nin sənədlərində rast gəlinə biləcək bütün terminlər) çox-
luğunun – lüğətin yaradılması indeksləşdirmə ilə bağlı 
olan  ən başlıca problemlərdən biridir. İndeksləşdirmə za-
man sənədlərin məzmununu təsvir etmək üçün onun mət-
nindən götürülən və ya məzmununa uyğun olaraq rubrika-
tordan seçilən terminlər bu lüğətlə uzlaşdırılır. 
İnternetdə  hər gün yeni informasiya ehtiyatlarının ya-
ranmasının (meydana gəlməsinin) və mövcud informasi-
yanın məhv edilməsinin mümkünlüyü səbəbindən İAS-da 


231 
indekslərin müntəzəm olaraq yeniləşdirilməsi, yəni sənəd-
lərin təkrar indeksləşdirilməsi həyata keçirilməlidir. Bu 
məqsədlə, yuxarıda qeyd edildiyi kimi, axtarış robotların-
dan (robot proqramlarından) istifadə olunur.  
Robot proqramı, bir qayda olaraq, “hörümçək”, “qurd”, 
“indeksləyici” adlanan və qarşılıqlı  əlaqədə  işləyən kom-
ponentlərdən ibarət olur.  
“Hörümçək” (spider) əvvəlcədən verilmiş ünvanlar si-
yahısında göstərilən web-səhifələri axtarış maşınının mü-
vəqqəti bazasına yükləyən proqramdır. O, istifadəçi kom-
püterinə yüklənmiş brauzer proqramına analoji qaydada 
işləyir, lakin web-səhifənin HTML-kodunu axtarış siste-
minə ötürür və monitorda heç məlumat əks etdirmir.  
“Qurd”  (crawler) “hörümçək” tərəfindən axtarış siste-
minə yüklənmiş web-səhifələrdə digər yeni web-səhifələrə 
istinadları (yəni yeni web-ünvanları) aşkar edərək axtarış 
sisteminin ünvanlar siyahısına əlavə edən proqramdır. Hə-
min ünvanlar siyahısı “hörümçəyin” hansı istiqamətdə hə-
rəkət edəcəyini müəyyənləşdirir. 
“İndeksləyici” (Indexer) “hörümçək” tərəfindən axtarış 
sisteminə yüklənmiş web-səhifələri tərkib hissələrinə (baş-
lıq, istinadlar, sənədin mətni) bölərək, onları, eləcə də sə-
nəddə xüsusi stillərdə yazılmış (qalın, maili, altından xətt 
çəkilmiş  şriftlərlə yazılmış, fonu rənglənmiş  və s.) mətn-
ləri təhlil edir. Sənəd, sənədin mövzusu üçün vacib olan, 
mətndə xüsusi çəki əmsalına malik elementlər – indekslər 
seçilir və sənədin axtarış obrazına daxil edilir. 
Axtarış sistemlərində informasiya ehtiyatlarının indeks-
ləşdirilməsi zamanı,  əsasən, aşağıdakı mexanizmlərdən 
istifadə olunur:   


232 
I üsul. Sənədin təsvir edilməsi üçün məna təhlili əsasın-
da onun kontekstini, yəni mahiyyətini və məzmununu da-
ha dəqiq əks etdirən terminlər (açar sözlər) sistemdə möv-
cud olan xüsusi lüğətlərdən (məsələn, tematik rubrikator-
dan) seçilir və SAO-ya daxil edilir. Bu zaman seçilən ter-
minlər sənədin məzmununda rast gəlinməyə də bilər. 
II üsul. Sənədin təsvir edilməsi üçün xüsusi üsulların kö-
məyi ilə onun adından, başlığından və  mətnindən, habelə 
onlarla bağlı digər xidməti məlumatlardan əhəmiyyət kəsb 
edən terminlər və açar sözlər seçilərək SAO-ya daxil edilir. 
Bu halda axtarış sistemində sinonimlər, assosiativ sözlər, 
stop-sözlər və digər lüğətlər mövcud olur ki, onların vasi-
təsilə SAO-ya yeni sözlər bağlanmış olur və genişləndirilir. 
III üsul. Mövcud tematik rubrikatora uyğun olaraq sə-
nədlərin məzmununun (kontekstinin) təhlili yolu ilə onla-
rın mətnindən həmin rubrikatorda olan müvafiq terminlər 
seçilir və SAO-ya daxil edilir.  
Qeyd olunmalıdır ki, birinci yanaşma güclü semantik 
aparatın tətbiqini və ya indeksləşdirilən informasiya ehti-
yatlarının tematikası sahəsində ixtisaslaşmış mütəxəssislə-
rin iştirakı ilə əllə indeksləşdirmənin həyata keçirilməsini 
tələb edir. Əllə indeksləşdirmənin nəticəsi yüksək dəqiqli-
yi ilə seçilir, lakin yaxşı tematik kataloqun yaradılması 
personalın peşəkarlığından asılı olur. Bunun üçün böyük 
intellektual əmək, müvafiq mövzu sahələri üzrə dərin bilik 
və  təcrübəyə malik olan mütəxəssislərin və ekspertlərin 
köməyi tələb olunur. 
Semantik təhlilə əsaslanmış üsullar, əsasən, çətin reallaş-
dırılır və az inkişaf etmişdir. Lakin son dövrlərdə bu üsulla-
rın tətbiqi ilə tematik kataloqların avtomatik yolla, proqram 
təminatının köməyi ilə yaradılması məsələsi tədqiqat obyek-


Yüklə 3,02 Kb.

Dostları ilə paylaş:
1   ...   59   60   61   62   63   64   65   66   ...   74




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə