Axtar
ış
ın
nə
tic
əl
ərinin
tə
hlili, üm
um
i
qə
rar
ın q
əbul
u
Axtar
ış
ma
şı
nı
– 2
Axtar
ış
ma
şı
nı
– 1
Axtar
ış
ma
şı
nı
– N
...
Meta-axtar
ış
agenti
–
sor
ğun
un a
xtar
ış
ma
şı
nlar
ına
ötürülm
əsi
Meta-axtar
ış
ın
nə
tic
əsi
Axtar
ış
sor
ğusu
Şə
k.
8.2. M
eta-axtar
ış
siste
m
inin funksional strukturu
2
29
230
8.4. İnternetin informasiya ehtiyatlarının
indeksləşdirilməsi və təqdim olunması
mexanizmləri
Qeyd olunduğu kimi, axtarış sistemlərində hər bir sənəd
özünün axtarış obrazı ilə təqdim olunur. Sənədin axtarış
obrazı (SAO) – informasiya ehtiyatlarının (sənədlərin)
məzmununu tam əks etdirən təsviredicilər (terminlər, açar
sözlər və s.) çoxluğunu özündə birləşdirir. SAO axtarış
sistemində istifadə olunan model çərçivəsində informasiya
massivinin ehtiyatlarının məzmunlarının indeksləşdirilmə-
si, yəni onların müəyyən olunmuş formaya inikas etdiril-
məsi prosedurasının tətbiqi nəticəsində yaranır.
Aydındır ki, SAO-nun yaradılması üçün sənədin məz-
mununa uyğun olan terminlər çoxluğunun müəyyənləşdiril-
məsi, sistemləşdirilərək saxlanılması problemi həll olunma-
lıdır. Məlumdur ki, SAO-nun yaradılması, yəni sənədlərdən
vacib terminlərin seçilməsi və onlara bağlanması prose-
durası sənədlərin indeksləşdirilməsi, terminlər çoxluğu isə
sənədin indekslər bazası və ya sadəcə indeksi adlanır.
Mümkün terminlərin sənədlərə bağlanmasını təmin et-
mək üçün təsbit olunmuş terminlər (informasiya massivi-
nin sənədlərində rast gəlinə biləcək bütün terminlər) çox-
luğunun – lüğətin yaradılması indeksləşdirmə ilə bağlı
olan ən başlıca problemlərdən biridir. İndeksləşdirmə za-
man sənədlərin məzmununu təsvir etmək üçün onun mət-
nindən götürülən və ya məzmununa uyğun olaraq rubrika-
tordan seçilən terminlər bu lüğətlə uzlaşdırılır.
İnternetdə hər gün yeni informasiya ehtiyatlarının ya-
ranmasının (meydana gəlməsinin) və mövcud informasi-
yanın məhv edilməsinin mümkünlüyü səbəbindən İAS-da
231
indekslərin müntəzəm olaraq yeniləşdirilməsi, yəni sənəd-
lərin təkrar indeksləşdirilməsi həyata keçirilməlidir. Bu
məqsədlə, yuxarıda qeyd edildiyi kimi, axtarış robotların-
dan (robot proqramlarından) istifadə olunur.
Robot proqramı, bir qayda olaraq, “hörümçək”, “qurd”,
“indeksləyici” adlanan və qarşılıqlı əlaqədə işləyən kom-
ponentlərdən ibarət olur.
“Hörümçək” (spider) əvvəlcədən verilmiş ünvanlar si-
yahısında göstərilən web-səhifələri axtarış maşınının mü-
vəqqəti bazasına yükləyən proqramdır. O, istifadəçi kom-
püterinə yüklənmiş brauzer proqramına analoji qaydada
işləyir, lakin web-səhifənin HTML-kodunu axtarış siste-
minə ötürür və monitorda heç məlumat əks etdirmir.
“Qurd” (crawler) “hörümçək” tərəfindən axtarış siste-
minə yüklənmiş web-səhifələrdə digər yeni web-səhifələrə
istinadları (yəni yeni web-ünvanları) aşkar edərək axtarış
sisteminin ünvanlar siyahısına əlavə edən proqramdır. Hə-
min ünvanlar siyahısı “hörümçəyin” hansı istiqamətdə hə-
rəkət edəcəyini müəyyənləşdirir.
“İndeksləyici” (Indexer) “hörümçək” tərəfindən axtarış
sisteminə yüklənmiş web-səhifələri tərkib hissələrinə (baş-
lıq, istinadlar, sənədin mətni) bölərək, onları, eləcə də sə-
nəddə xüsusi stillərdə yazılmış (qalın, maili, altından xətt
çəkilmiş şriftlərlə yazılmış, fonu rənglənmiş və s.) mətn-
ləri təhlil edir. Sənəd, sənədin mövzusu üçün vacib olan,
mətndə xüsusi çəki əmsalına malik elementlər – indekslər
seçilir və sənədin axtarış obrazına daxil edilir.
Axtarış sistemlərində informasiya ehtiyatlarının indeks-
ləşdirilməsi zamanı, əsasən, aşağıdakı mexanizmlərdən
istifadə olunur:
232
I üsul. Sənədin təsvir edilməsi üçün məna təhlili əsasın-
da onun kontekstini, yəni mahiyyətini və məzmununu da-
ha dəqiq əks etdirən terminlər (açar sözlər) sistemdə möv-
cud olan xüsusi lüğətlərdən (məsələn, tematik rubrikator-
dan) seçilir və SAO-ya daxil edilir. Bu zaman seçilən ter-
minlər sənədin məzmununda rast gəlinməyə də bilər.
II üsul. Sənədin təsvir edilməsi üçün xüsusi üsulların kö-
məyi ilə onun adından, başlığından və mətnindən, habelə
onlarla bağlı digər xidməti məlumatlardan əhəmiyyət kəsb
edən terminlər və açar sözlər seçilərək SAO-ya daxil edilir.
Bu halda axtarış sistemində sinonimlər, assosiativ sözlər,
stop-sözlər və digər lüğətlər mövcud olur ki, onların vasi-
təsilə SAO-ya yeni sözlər bağlanmış olur və genişləndirilir.
III üsul. Mövcud tematik rubrikatora uyğun olaraq sə-
nədlərin məzmununun (kontekstinin) təhlili yolu ilə onla-
rın mətnindən həmin rubrikatorda olan müvafiq terminlər
seçilir və SAO-ya daxil edilir.
Qeyd olunmalıdır ki, birinci yanaşma güclü semantik
aparatın tətbiqini və ya indeksləşdirilən informasiya ehti-
yatlarının tematikası sahəsində ixtisaslaşmış mütəxəssislə-
rin iştirakı ilə əllə indeksləşdirmənin həyata keçirilməsini
tələb edir. Əllə indeksləşdirmənin nəticəsi yüksək dəqiqli-
yi ilə seçilir, lakin yaxşı tematik kataloqun yaradılması
personalın peşəkarlığından asılı olur. Bunun üçün böyük
intellektual əmək, müvafiq mövzu sahələri üzrə dərin bilik
və təcrübəyə malik olan mütəxəssislərin və ekspertlərin
köməyi tələb olunur.
Semantik təhlilə əsaslanmış üsullar, əsasən, çətin reallaş-
dırılır və az inkişaf etmişdir. Lakin son dövrlərdə bu üsulla-
rın tətbiqi ilə tematik kataloqların avtomatik yolla, proqram
təminatının köməyi ilə yaradılması məsələsi tədqiqat obyek-
Dostları ilə paylaş: |