İQTİSADİ İNFORMATİKA
________________________194________________________
əvvəlki axtarış sistemlərindən fərqli olaraq sənədin
məzmunu ilə iş görür.
Təbii dildə verilən cümlə və ya ifadə çox hallarda
ikimənalı və bolluqlu olur. Sinonimləri, omonimləri,
qramatik forma müxtəlifliklərini nəzərə almaq lazım gəlir.
Cümlədəki sözlər arasındakı məna əlaqələri çox zaman
əyani olmur. Yeni terminlər və anlayışlar yaranır. Bütün
bunlar
mətni
informasiya
resurslarının
strukturlaşdırılmamasına dəlalət edir.
SƏNƏDLƏRİN TƏQDİMATI
Mətni axtarış sistemlərində saxlanan sənəd
kolleksiyaları olduqca iri ola bilir. Sənəddəki mətnlər də iri
həcmli ola bilir. Buna görə də bütün mətnin təhlili səmərəli
deyil. Vəziyyətdən çıxış yolu sənədin struktur təqdimatı
ilə, başqa sözlə, sənədin təqdimat nümayəndələri ilə
işləməkdən ibarətdir.
SƏNƏDLƏRİN İNDEKSLƏŞDİRİLMƏSİ
Sənədlərin təqdimatı onların xassələri (atributları)
çoxluğu ilə yaradılır.
“Dublin nüvəsi” (DC 1.1) adlanan
beynəlxalq standartda sənədin təqdimatı 15 metaverilən
elementlə verilir:
Title (resursun adı);
Creator (resursu hazırlayan və buna məsul olan şəxs,
təşkilat və ya şöbə);
Subject (resursun məzmununda müzakirə edilən mövzu);
İQTİSADİ İNFORMATİKA
________________________195________________________
Deskription (resursun məzmununun sərbəst formada
təsviri);
Publisher (resursa müraciət təmin edən şəxs, təşkilat,
şöbə);
Contributor (Creator-da göstərilənlərdən əlavə, resursun
hazırlanmasında iştirak edənlər);
Date (resursun yaradılması və ya təqdim edilməsi tarixi);
Type (resursun janrı, kateqoriyası və digər
xarakteristikaları);
Format (resurs təqdimatının xarakteri);
İdentifier (resursa dəqiq iqtibas);
Source (resursun götürüldüyü mənbəyə iqtibas);
Language (resursun təqdimat dili);
Relation (verilənlərlə əlaqəli resursa iqtibas);
Coverage (resursun aid olduğu sahə, zaman və s.);
Rights (resursa intellektual mülkiyyət hüququ).
Kvalifikatorlar
–
metaverilən
elementlərin
semantikasının dəqiqləşdiriciləri “Dublin nüvəsi”ndəki
qeyri-müəyyənlikləri aradan qaldırır. Məsələn,
Date
elementi üçün yaradılma tarixi, müraciət tarixi kimi
dəıqiqləşdirmə etmək olar.
Sənədlə
assosiasiyalanmış
ixtiyari
atribut
indeksləşdirilmiş xassə adlanır. Bu xassələrə əsasən
axtarış sistemində verilənlərin köməkçi strukturu qurulur
ki, bunun köməyi ilə sənədin bütün məzmununa
baxmadan lazımi sənədi axtarıb tapmaq olur. Köməkçi
struktur
indeks, göstərilən atributların sənədlə
assosiasiyalanması propsesi
sənədin indeksləşdirilməsi
adlanır.
İQTİSADİ İNFORMATİKA
________________________196________________________
Köhnə axtarış sistemlərində
deskriptor adlanan ayrı-
ayrı söz və söz birləşmələrindən istifadə olunurdu.
Deskriptor sənədin axtarış obrazı idi. Bu sistemlər
deskriptorlu sistem adlanırdı. Deskriptorlu sistemlər hələ
də istifadə edilir.
Sənədlərin indeksləşdirilməsi sənədin annotasiyası
və ya tam mətni əsasında müəllif tərəfindən adi qaydada,
ya da sənədin kompüter təhlili yolu ilə avtomatik həyata
keçirilir.
İSTİFADƏÇİ SORĞULARININ TƏQDİMATI
Mətn axtarış sistemlərinin digər mühüm məsələsi
istifadəçi sorğularının məzmununun strukturlaşdırılmış
təqdimatıdır. Sorğuların təqdimatı da sənədlərin
təqdimatına uyğun prinsiplərdən çıxış edərək hazırlanır.
Əks halda sorğu ilə axtarış obyektini müqayisə etmək
mümkün olmaz.
SƏNƏDLƏRİN RELEVANTLIĞI KRİTERİLƏRİ
İstifadəçi sorğusunun emalı prosesində növbəti
baxılacaq sənədin relevantlığı qiymətləndirilməlidir. Bu
məqsədlə
relevantlıq (yaxınlıq) kriterisindən istifadə edilir.
Bu kriteri sənəd və sorğunun təqdimat üsulundan asılıdır.
Məsələn, deskriptorlu sistemlərdə sənəd o zaman relevant
sayılır ki, sorğudakı axtarış obrazını əmələ gətirən
deskriptorlar sənədin axtarış obrazındakı deskriptorlar
çoxluğunun alt çoxluğu olsun. Müasir sistemlərdə daha
mürəkkəb kriterilərdən istifadə edilir.
İQTİSADİ İNFORMATİKA
________________________197________________________
MƏTN AXTARIŞIN ÜMUMİ PRİNSİPLƏRİ
Müasir mətn axtarış sistemlərində sənədlərin
indeksləşdirilməsi və təqdimatı, istifadəçi sorğularının
təqdimatı və sənədlərin relevantlığının qiymətləndirilməsi
üçün çoxsaylı yanaşmalar tətbiq edilir. Buna baxmayaraq,
axtarışın təşkilinin müəyyən ümumi prinsipləri də
mövcuddur.
QEYD: Relevantlıq (latınca relevo sözündəndir,
sadələşdirmək, asanlaşdırmaq, qaldırmaq anlamını verir)
dedikdə informasiya axtarışında axtarış sorğusunun
semantik uyğunluğu və sənədin axtarış nümunəsi kimi
başa düşülür. Ümumi mənada isə “relevantlıq”
“adekvatlıq”
kimi,
yəni
uyğunluq
dərəcəsinin
qiymətləndirilməsi, nəticənin praktiki tətbiq edilmə
dərəcəsi, həmçinin məsələnin qəbul edilməsinin sosial
dərəcəsi kimi qəbul edilir.
Sənəd sistemə daxil edilərkən indeksləşdirilir və
təqdimatı hazırlanır ki, bu da sorğuların emalı zamanı
həmin sənədin əvəzedicisi kimi çıxış edir. Sonra konkret
sənədlərin indeksləşdirilən xassələri əsasında sənədlər
kolleksiyası avtomatik indeksləşdirilir.
İstifadəçi sorğusu sistemə daxil olan kimi onun da
təqdimatı hazırlanır. Bu, sənədin təqdimatına anolijidir.
Sonra sorğu təqdimatı yaxınlıq kriterisi üzrə sənəd
təqdimatları ilə bir-bir müqayisə edilir. Uyğunluq şərti
ödəndikdə axtarış bitir.
Dostları ilə paylaş: |