İQTİSADİ İNFORMATİKA
________________________198________________________
LİNQVİSTİK TƏMİNAT VASİTƏLƏRİ
Mətn axtarış sistemlərində tammətnli sənədlərlə
işləyərkən təbii dilin emalı vasitələrindən istifadə edilir. Bu
vasitələr sözügedən sistemlərin son dərəcə mürəkkəb
komponentləridir.
Təbii dilin emalı vasitələri mətn
sənədlərindəki və sorğulardakı
termləri (söz və söz
birləşmələrini, frazaları) təhlil edib onların məzmununu
aydınlaşdırır, termlər arasındakı münasibətləri aşkarlayır
və səmərəli axtarışı təmin edir. Bu məqsədlə mətni axtarış
sistemlərində linqvistik təminat vasitələri kompleksindən
istifadə edilir. Bu kompleksə müxtəlif lüğətlər, tezauruslar,
sistemin predmet oblastının
ontoloji xüsusiyyətlərini əks
etdirən materiallar daxildir.
QEYD: Ontologiya (latınca ontologia – təhsil alma,
elm anlamını verir) dedikdə həqiqətin oyrənilməsi,
doğruluq haqqında elm sahəsi başa düşülür. Ontologiya
fəlsəfənin bir bölməsidir, varlığın fundamental
prinsiplərini, struturunu, qanunauyğunluğunu və
kateqoriyalarını öyrənir.
“Ontologiya” termini 1613-cü ildə Rudolf Qoklenius
(1547-1628) tərəfindən hazırlanmış “Fəlsəfə lüğəti”
(
Lexicon philosophicum, quo tanquam clave philisophiae
fores aperiunter. Francofurti) kitabında təklif edilmişdir.
Sonralar, 1656-cı ildə İohan Klauberq (1622-1665)
bu sahə ilə məşğul olur və yazdığı
Metaphysika de ente,
quae rectus Ontosophia kitabında sözə ekvivalent olan
“metafizika” baradə ətraflı araşdırmalar verir.
İQTİSADİ İNFORMATİKA
________________________199________________________
Rudolf Qoklenius
İohan Klauberq
SİSTEM LÜĞƏTLƏRİ
Təbii dilin emalı ilə məşğul olan mətn axtarış
sistemlərində həm ümumdil leksikası, həm də predmet
oblastı leksikası üzrə lüğətlərdən istifadə edilir. Bu lüğətlər
mətnin morfoloji təhlilinə və axtarış zamanı müxtəlif
qrammatik formalardakı sözləri tanımağa imkan verir.
TEZAURUSLAR
Mətn sənədlərinin formal təqdimatında tezaurus
adlanan xüsusi lüğətlər mühüm rol oynayır. Tezaurus –
dilin əsas anlayışları lüğətidir. Tezaurus həm də sorğunu
genişləndirmək üçündür.
İQTİSADİ İNFORMATİKA
________________________200________________________
ONTOLOJİ MATERİALLAR
Təbii dildə təqdim edilmiş mətn sənədlərinin və
axtarış sorğularının adekvat dərki (interpretasiyası) üçün
sistem predmet oblastının əsas anlayışlarını və onların
arasındakı müxtəlif semantik əlaqələri təyin edən vasitə
olmalıdır ki, buna da ontoloji materiallar deyilir. Buraya
predmet oblastının tezaurusu, birinci dərəcəli məntiq
dilləri və s. aiddir.
AXTARIŞ MODELLƏRI
Axtarış modeli anlayışı. Axtarış modeli dedikdə,
sənədlərin və sorğuların təqdimatı üsulları və relevantlıq
kriterisinin növü və bunların əlaqələndirilməsi nəzərdə
tutulur.
Sadə axtarış modeli. Bu modellər deskriptorlu və
klassifikatorlu axtarışı təsvir edir.
Aidi axtarış modeli. Mətndə tez-tez rast gələn söz
və söz birləşmələri əsasında axtarışı təsvir edir.
Məntiqi (Bul) axtarış modeli. Bu halda VƏ, VƏ
YA, DEYİL operatorlarından istifadə edilir.
Vektor axtarış modeli. Bu halda sənəd və sorğular
vektor kimi təsəvvür edilir. Sənəddəki və sorğudakı söz və
sözbirləşmələrinin lüğətdəki koordinatları əsas rol oynayır.
Axtarılan söz sənəddə varsa, onun koordinatına 1, əks
halda 0 yazılır.
İQTİSADİ İNFORMATİKA
________________________201________________________
MƏTN AXTARIŞ SİSTEMLƏRİNİN VƏZİYYƏTİ VƏ
YENİ TƏLƏBLƏR
İlk mətni axtarış sistemləri kitabxana işi üçün
nəzərdə tutulsa da, hal-hazırda bu, insan fəaliyyətinin bir
çox sahələrinə uğurla tətbiq edilir. Xüsusən qlobal
informasiya məkanı olan Veb-lə bağlı təkamül intensiv
xarakter almışdır.
MƏTN AXTARIŞ SAHƏSİNİN PROBLEMLƏRİ
Müasir dövrdə mətn axtarış problematikası olduqca
genişlənmişdir. Belə ki, buraya: konkret axtarış
modellərinin inkişafı; sistemlər üzərində eksperiment
aparılması, onların testləşdirilməsi və qiymətləndirilməsi
metodologiyası; mətn axtarışın reallaşdırılması metodları;
mətn axtarış və VB texnologiyalarının inteqrasiya edilməsi
üçün tətbiq edilən yanaşmalar; Veb mühitində axtarış;
verilənlərin sıxılması metodları; sorğuların emalı
səmərəliliyinin qiymətləndirilməsi; təbii dilin emalı; mətn
sənədlərinin təsnifləşdirilməsi və
klasterləşdirilməsi
metodları; elektron kitabxanalardakı informasiya axtarışı
üzrə proqram əlavələri; mətnlərin dərin təhlili;
multimediya informasiyasının indeksləşdirilməsi və
axtarışı texnologiyaları; “insan – kompüter” interfeysləri
və s. aiddir. Bu istiqamətlərin hamısında böyük uğurlar
əldə edilmişdir.
QEYD: Klaster (ingiliscə cluster - toplaşma, fırça,
dəstə, yığın anlamını verir) dedikdə müəyyən
Dostları ilə paylaş: |