128
Tam m
ətnli, video və audio, vizual və s. resursların texnki hazırlanmsı
skanir
ə, format, sistem və s. məsələlər nəzərdə tutulur (buraya metaverilənləri
d
ə aid etmək lazımdır)
E-
resursların sənəd halına gətirilməsi (qeydiyyat məlumatlarının
hazırlanması)
E-s
ənədlərin yerləşdiyi virtual məkan, miqrasiya və ləğv edilməsi
m
əsələlərinin müəyyənləşdirilməsi.
İstifadəçilərin formalaşdırılmış e-sənədlərdən istifadə imkanlarının,
hüquqi m
əsələlərin müəyyənləşdirilməsi
E-
resursların anazlizi
Tip v
ə növlərinin müəyyənləşdirilməsi
Predmet göst
əricilərinin tərtib edilməsi
Analitik sintez, münd
əricat, referat, annotasiyanın tərtib edilməsi və s.
e-resursun mövzusunu t
əsvir edən proseslərin aparılması
İnformasiyanın təsnifləşdirilməsi metodlarının işlənilməsi
Elektron s
ənədlərin qiymətləndirilməsi
Qeyd edil
ənləri sadə formada praktiki müşahidə etmək üçün müxtəlif
texnoloji imkanları nəzərədn keçirdək və buna nümunə olaraq OCR (Optical
Character Recognation) Obrazların Avtomatik Tanınması və Hipermətn
texnologiyalarına diqqət yetirək.
OCR (Optical Character Recognation) texnologiyalar
əsasında
Obrazların avtomatlaşdırılmış tanınma proseslərinin OCR sistemlərdə
realiz
ə edilməsi intellektual informasiya texnologiyalarının ən əhəmiyyətli
hiss
ələrindəndir. Adı çəkilən abreviatura (Optical Character Recognation)
m
ətnlərin avtomatlaşdırılmış oxunmasını və simvoların optik tanınması kimi
q
əbul edilir. Başqa sözlə çap və əlyazma məlumatların xüsusi intellektual
texnologiyalar vasit
əsi ilə elektron emal və analiz etmək imkanları nəzərdə
tutulur.
OCR sisteml
ərinin aşağıdakı xüsusiyyətlərinə nəzər salaq:
Simvolların şrift və ölçü fərqləri
Simvolların təsvirində dəyişikliklər (şəkildə ölçü dəyişikliyi zamanı
simvolların yerdəyiºikliyi, itməsi və s.)
Skanir
ə proselərində əyriliklərin müəyyənləºdirilməsi
Müxt
əlif dilli mətnlərin olması
Simvolların müxtəliflikləri. Burada oxşar, xüsusi simvollar. Misal üçün
Az
ərbaycan dilində bu “ə, ü, ö, ö, ç” spesifik hərfləri göstərmək olar.
Obrazların tanınması. Yüksək meqapikselli foto aparatlar vasitəsi ilə,
müxt
əlif skanirə prosesləri ilə elektron sənədlərin yaradılmasıdır. Vizual və
m
ətn sənədlərin elektron emalı prosesi qeydiyyat məlumatlarının
elektronlaşdırılması texnlologiyaları və ümumilikdə elektron kitabxanaların
yaradılamasında geniş istifadə edilə bilər.
129
Aparıcı OCR sistemlər:
Fine Reader (Fayn Rider), Fine Reader
əlyazma və Form Reader
ABBYY Software House t
ərəfindən istehsal edilmişdir və çap, əlyazma
m
ətnlərin, təsviri formların oxunmasında istifadə olunan mükəmməl proqram
t
əminatlarındandır.
CuneiForm, Cognitive
Technologies firması tərəfindən istehsal
edilmişdir.
Fine Reader kimi sistemin işləmə texnologiyası özündə iki mərhələni
c
əmləşdirir.
Qrafiki t
əsvirlərin analizizi
C
ədvəl və şəkillərin seçilməsi
Tanınma bölmələrinin müəyyənləşdirilməsi
S
ətir, simvolların ayrılması
Ayrılmış simvolların tanınması. Bununda daxili bölmələrini klassifator
kimi realiz
ə etmək olar.
Şablon
Əlamətlər
Struktur
Çoxsaylı araçdırmalar göstərmişdir ki, belə mürəkkəb prosedurların
aparılması üçün “intellektual tanınma” texnikası tətbiq edilməlidir.
Ən mükəmməl OCR sistemlərdə insana xas tanınma texnologiyaları
t
ətbiq edilir. Nəzərə alsaq ki, insanda bu çox pilləlidir aşağldakı misala nəzər
salaq:
1
Kontekstin emalı
Dağlıq ərazi. Zirvələrdə ağ rənglər görünür
2
Əlamətlərin ilkin seçilməsi
Ağ rəngin kompakt obyekti
3
Proqnozun verilm
əsi
İlkin versiya olaraq həmin obyektin qar olması
4
Obyektin hiss
ələrinin seçilməsi
Zirv
ədə olan qarın spesifik forması, harada
yerl
əşməsi.
5
Hiss
ələrin düzgün strukturu
R
əngi, həcmi
6
Proqnozların təsdiq edilməsi
Dağın ətəyində ağ qarın olması
3 prinsip var ki, OCR sistem onu üz
ərində qurulub.
T
əsvirin tamlığı prinsipi
Istiqam
ətliliyi prinsipi
Adaptasiya prinsipi
Simvolun qrafiki obrazı skanerdən çıxdığı anda nöqtələrdən ibarət
matris formasında müşahidə edilir. Misal olaraq ”ə” hərfi bu əlifbada “a”
simvolu il
ə oxşarlıq təşkil edir. Məlum olduğu kimi simvolların düzgün
oxunması mətndə olan fikir dəqiqliyini bildirmək üçün vacib elementlərdəndir.
Bu zaman artıq intellektual analiz prosesi baş verir və ilkin olaraq söz üzrə
analiz aparılır. Bunu misalda izləyək: “*laqə” ulduzla işarələnmiş yerə “a” və
130
ya “
ə” simvolunun uyğun olması avtomatik sistemdə olan lüğətlə yoxlanılır.
N
əticədə bazada “alaqa” yox “əlaqə” sözünün olduğu və qrammatik cəhətdən
“alaqa”
sözünün düzgün olmadığı müəyyənləşdirilir. Digər bir misal: ”*y”
simvolları göstərilir, bu həm ay və həm də əy sözü ola bilər. Artıq bu halda
bütün cüml
ə analiz edilir, mənası aşkarlanır və hansı simvolun əlavə olunacağı
mü
əyyənləşir [7 s. 35].
Hiperm
ətn informasiya texnologiyaları
Hiperm
ətn semantik informasiyanın təşkil edilməsi formasıdır. Misal
üçün ensiklopediyayaların əsas elementi kimi, məqalələr və terminlər arasında
assosiativ
əlaqənin qurulmasıdır. Müasir anlamda hipermətn müxtəlif
m
əqsədlər üçün nəzərdə tutulmuş elektron informasiya fondudur, xarakterik
xüsusiyy
ətləri tematik, formativ sənədlərin əlaqələndirilməsi kimi qəbul etmək
olar.
Hiperm
ətinin əsasını informasiyanı təşkil edən semantik əlaqəli
fraqmentl
ər təşkil edir ki, bir biri ilə əlaqəli məlumatlara keçid əldə edilməsini
t
əmin edir və buda intellektual informasiya axtarışının özül hissəsi kimi qəbul
etm
ək olar.
Hiperm
ətn informasiya texnologiyalarının tətbiq sahələri:
Informasiya resursları və Internet texnologiyaları;
Hiperm
ətn informasiya-axtarış sistemləri;
İqtisadi sistemlər üçün hipermətn informasiya modelləri;
Hiperm
ətn əsaslı verilənlər bazaları;
T
əhsil, distant təhsil sistemlərində hipermətn informasiya modelləri
v
ə sözsüz bu siyahıya elektron kitabxanalarıda daxil etmək məqsədə
uyğun olardı [7 s. 42].
Bildiyimiz kimi elektron kitabxananın özül strukturunu İnternetdə
informasiya resursları təşkil edir və bu məlumatlar müxtəif növlü, dinamik
olur. Hiperm
ətn texnologiyalarının İnternet məkanında tətbiqi 1993-cü ildən
WWW (Wo
rld Wide Web) “dünya hörmüşək toru” texnologiyaları
ç
ərçivəsində tətbiq edilir. Bu HTTP (Hyper Text Transport Protocol)
protokolu vasit
əsilə HTML (Hyper Text Markup Language) dilində maşınlar
arası informasiya mübadiləsini təşkil edir, çox zaman biz “veb səhifə” və ya
“HTML s
əhifə” kimi terminlərə rast gələ bilərik. Qeyd edilən HTML səhifə
özünd
ə sənədin strukturunun təsvirini təqdim edir və bu tip reusrsa URL
(Uniform Resource Locator) ünvan vasit
əsi ilə daxil olunur. Növbəti
m
ərhələdə bir neçə HTML səhifənin qarşılıqlı əlaqəsi və bir sistem halında
birl
əşməsi veb saytın strukturunu yaradır. Texniki tərfdən də nəzər salsaq
HTML dilind
ə təqdim edilən hipermətn sənədi nəinki mətn, həmçinin cədvəl,
skript, müxt
əlif rəqəmli obyektlərə edilən hiperistinadları (şəkil, audion və
video material v
ə s.) dəstəkləyir ki, bu da informasiya resurslarının semantik
əlaqəliliyini təmin edir [1 s. 200].
Dostları ilə paylaş: |