Dərslik kimi tövsiyyə edilir. B a k I 1 İQTİsadi İnformatiKA



Yüklə 2,91 Kb.
Pdf görüntüsü
səhifə43/65
tarix11.10.2017
ölçüsü2,91 Kb.
#4434
növüDərs
1   ...   39   40   41   42   43   44   45   46   ...   65

 
İQTİSADİ İNFORMATİKA 
 
 
________________________194________________________ 
 
əvvəlki  axtarış  sistemlərindən  fərqli  olaraq  sənədin 
məzmunu ilə iş görür. 
Təbii  dildə  verilən  cümlə  və  ya  ifadə  çox  hallarda 
ikimənalı  və  bolluqlu  olur.  Sinonimləri,  omonimləri, 
qramatik forma müxtəlifliklərini nəzərə almaq lazım gəlir. 
Cümlədəki  sözlər  arasındakı  məna  əlaqələri  çox  zaman 
əyani  olmur.  Yeni  terminlər  və  anlayışlar  yaranır.  Bütün 
bunlar 
mətni 
informasiya 
resurslarının 
strukturlaşdırılmamasına dəlalət edir. 
 
SƏNƏDLƏRİN TƏQDİMATI 
 
Mətni  axtarış  sistemlərində  saxlanan  sənəd 
kolleksiyaları olduqca iri ola bilir. Sənəddəki mətnlər də iri 
həcmli ola bilir. Buna görə də bütün mətnin təhlili səmərəli 
deyil.  Vəziyyətdən  çıxış  yolu  sənədin  struktur  təqdimatı 
ilə,  başqa  sözlə,  sənədin  təqdimat  nümayəndələri  ilə 
işləməkdən ibarətdir. 
 
SƏNƏDLƏRİN İNDEKSLƏŞDİRİLMƏSİ 
 
Sənədlərin  təqdimatı  onların  xassələri  (atributları) 
çoxluğu  ilə  yaradılır. 
“Dublin  nüvəsi”  (DC  1.1)  adlanan 
beynəlxalq standartda sənədin təqdimatı 15 metaverilən 
elementlə verilir: 
 Title (resursun adı); 
 Creator  (resursu  hazırlayan  və  buna  məsul  olan  şəxs, 
təşkilat və ya şöbə); 
 Subject (resursun məzmununda müzakirə edilən mövzu); 


 
İQTİSADİ İNFORMATİKA 
 
 
________________________195________________________ 
 
 Deskription  (resursun  məzmununun  sərbəst  formada 
təsviri); 
 Publisher  (resursa  müraciət  təmin  edən  şəxs,  təşkilat, 
şöbə); 
 Contributor  (Creator-da  göstərilənlərdən əlavə,  resursun 
hazırlanmasında iştirak edənlər); 
 Date (resursun yaradılması və ya təqdim edilməsi tarixi); 
 Type  (resursun  janrı,  kateqoriyası  və  digər 
xarakteristikaları); 
 Format (resurs təqdimatının xarakteri); 
 İdentifier (resursa dəqiq iqtibas); 
 Source (resursun götürüldüyü mənbəyə iqtibas); 
 Language (resursun təqdimat dili); 
 Relation (verilənlərlə əlaqəli resursa iqtibas); 
 Coverage (resursun aid olduğu sahə, zaman və s.); 
 Rights (resursa intellektual mülkiyyət hüququ).  
Kvalifikatorlar 
– 
metaverilən 
elementlərin 
semantikasının  dəqiqləşdiriciləri  “Dublin  nüvəsi”ndəki 
qeyri-müəyyənlikləri  aradan  qaldırır.  Məsələn, 
Date 
elementi  üçün  yaradılma  tarixi,  müraciət  tarixi  kimi 
dəıqiqləşdirmə etmək olar. 
Sənədlə 
assosiasiyalanmış 
ixtiyari 
atribut 
indeksləşdirilmiş  xassə  adlanır.  Bu  xassələrə  əsasən 
axtarış sistemində verilənlərin köməkçi strukturu qurulur 
ki,  bunun  köməyi  ilə  sənədin  bütün  məzmununa 
baxmadan  lazımi  sənədi  axtarıb  tapmaq  olur.  Köməkçi 
struktur 
indeks,  göstərilən  atributların  sənədlə 
assosiasiyalanması  propsesi 
sənədin  indeksləşdirilməsi 
adlanır.  


 
İQTİSADİ İNFORMATİKA 
 
 
________________________196________________________ 
 
Köhnə axtarış sistemlərində 
deskriptor adlanan ayrı-
ayrı  söz  və  söz  birləşmələrindən  istifadə  olunurdu. 
Deskriptor  sənədin  axtarış  obrazı  idi.  Bu  sistemlər 
deskriptorlu sistem adlanırdı. Deskriptorlu sistemlər hələ 
də istifadə edilir. 
Sənədlərin  indeksləşdirilməsi  sənədin  annotasiyası 
və ya tam mətni əsasında müəllif tərəfindən adi qaydada, 
ya da sənədin kompüter təhlili yolu ilə avtomatik həyata 
keçirilir. 
 
İSTİFADƏÇİ SORĞULARININ TƏQDİMATI 
 
Mətn  axtarış  sistemlərinin  digər  mühüm  məsələsi 
istifadəçi  sorğularının  məzmununun  strukturlaşdırılmış 
təqdimatıdır.  Sorğuların  təqdimatı  da  sənədlərin 
təqdimatına  uyğun  prinsiplərdən  çıxış  edərək  hazırlanır. 
Əks  halda  sorğu  ilə  axtarış  obyektini  müqayisə  etmək 
mümkün olmaz. 
 
SƏNƏDLƏRİN RELEVANTLIĞI KRİTERİLƏRİ 
 
İstifadəçi  sorğusunun  emalı  prosesində  növbəti 
baxılacaq  sənədin  relevantlığı  qiymətləndirilməlidir.  Bu 
məqsədlə 
relevantlıq (yaxınlıq) kriterisindən istifadə edilir. 
Bu kriteri sənəd və sorğunun təqdimat üsulundan asılıdır. 
Məsələn, deskriptorlu sistemlərdə sənəd o zaman relevant 
sayılır  ki,  sorğudakı  axtarış  obrazını  əmələ  gətirən 
deskriptorlar  sənədin  axtarış  obrazındakı  deskriptorlar 
çoxluğunun  alt  çoxluğu  olsun.  Müasir  sistemlərdə  daha 
mürəkkəb kriterilərdən istifadə edilir. 


 
İQTİSADİ İNFORMATİKA 
 
 
________________________197________________________ 
 
MƏTN AXTARIŞIN ÜMUMİ PRİNSİPLƏRİ 
 
Müasir  mətn  axtarış  sistemlərində  sənədlərin 
indeksləşdirilməsi  və  təqdimatı,  istifadəçi  sorğularının 
təqdimatı və sənədlərin relevantlığının qiymətləndirilməsi 
üçün çoxsaylı yanaşmalar tətbiq edilir. Buna baxmayaraq, 
axtarışın  təşkilinin  müəyyən  ümumi  prinsipləri  də 
mövcuddur.  
 
QEYD:  Relevantlıq  (latınca  relevo  sözündəndir, 
sadələşdirmək, asanlaşdırmaq, qaldırmaq anlamını verir) 
dedikdə  informasiya  axtarışında  axtarış  sorğusunun 
semantik  uyğunluğu  və  sənədin  axtarış  nümunəsi  kimi 
başa  düşülür.  Ümumi  mənada  isə  “relevantlıq” 
“adekvatlıq” 
kimi, 
yəni 
uyğunluq 
dərəcəsinin 
qiymətləndirilməsi,  nəticənin  praktiki  tətbiq  edilmə 
dərəcəsi,  həmçinin  məsələnin  qəbul  edilməsinin  sosial 
dərəcəsi kimi qəbul edilir.  
 
Sənəd  sistemə  daxil  edilərkən  indeksləşdirilir  və 
təqdimatı  hazırlanır  ki,  bu  da  sorğuların  emalı  zamanı 
həmin sənədin əvəzedicisi kimi çıxış edir. Sonra konkret 
sənədlərin  indeksləşdirilən  xassələri  əsasında  sənədlər 
kolleksiyası avtomatik indeksləşdirilir.  
İstifadəçi  sorğusu  sistemə  daxil  olan  kimi  onun  da 
təqdimatı  hazırlanır.  Bu,  sənədin  təqdimatına  anolijidir. 
Sonra  sorğu  təqdimatı  yaxınlıq  kriterisi  üzrə  sənəd 
təqdimatları  ilə  bir-bir  müqayisə  edilir.  Uyğunluq  şərti 
ödəndikdə axtarış bitir.
 
 


Yüklə 2,91 Kb.

Dostları ilə paylaş:
1   ...   39   40   41   42   43   44   45   46   ...   65




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə