KitabxanaşÜnasliq

Yüklə 3,72 Kb.

Pdf görüntüsü

səhifə	57/88
tarix	08.03.2018
ölçüsü	3,72 Kb.
	#30859

1 ... 53 54 55 56 57 58 59 60 ... 88

128

Tam m
ətnli, video və audio, vizual və s. resursların texnki hazırlanmsı
skanir
ə, format, sistem və s. məsələlər nəzərdə tutulur (buraya metaverilənləri
d
ə aid etmək lazımdır)
E-
resursların  sənəd  halına  gətirilməsi (qeydiyyat məlumatlarının
hazırlanması)
E-s
ənədlərin yerləşdiyi  virtual  məkan,  miqrasiya və  ləğv  edilməsi
m
əsələlərinin müəyyənləşdirilməsi.
İstifadəçilərin  formalaşdırılmış  e-sənədlərdən istifadə  imkanlarının,
hüquqi m
əsələlərin müəyyənləşdirilməsi
E-
resursların anazlizi
Tip v
ə növlərinin müəyyənləşdirilməsi
Predmet göst
əricilərinin tərtib edilməsi
Analitik sintez, münd
əricat, referat, annotasiyanın tərtib edilməsi və s.
e-resursun mövzusunu t
əsvir edən proseslərin aparılması
İnformasiyanın təsnifləşdirilməsi metodlarının işlənilməsi
Elektron s
ənədlərin qiymətləndirilməsi
Qeyd  edil
ənləri sadə formada praktiki müşahidə etmək üçün müxtəlif
texnoloji imkanları nəzərədn keçirdək və buna nümunə olaraq OCR (Optical
Character  Recognation)  Obrazların  Avtomatik  Tanınması  və  Hipermətn
texnologiyalarına diqqət yetirək.
OCR (Optical Character Recognation) texnologiyalar
əsasında
Obrazların  avtomatlaşdırılmış  tanınma  proseslərinin OCR sistemlərdə
realiz
ə  edilməsi  intellektual  informasiya  texnologiyalarının    ən  əhəmiyyətli
hiss
ələrindəndir.  Adı  çəkilən abreviatura (Optical Character Recognation)
m
ətnlərin  avtomatlaşdırılmış  oxunmasını  və  simvoların  optik  tanınması  kimi
q
əbul  edilir.  Başqa  sözlə  çap və  əlyazma məlumatların      xüsusi  intellektual
texnologiyalar vasit
əsi ilə  elektron emal və  analiz etmək  imkanları  nəzərdə
tutulur.
OCR sisteml
ərinin aşağıdakı xüsusiyyətlərinə nəzər salaq:
Simvolların şrift və ölçü fərqləri
Simvolların  təsvirində  dəyişikliklər  (şəkildə  ölçü dəyişikliyi  zamanı
simvolların yerdəyiºikliyi, itməsi və s.)
Skanir
ə proselərində əyriliklərin müəyyənləºdirilməsi
Müxt
əlif dilli mətnlərin olması
Simvolların müxtəliflikləri. Burada oxşar, xüsusi simvollar. Misal üçün
Az
ərbaycan dilində bu “ə, ü, ö, ö, ç” spesifik hərfləri göstərmək olar.
Obrazların  tanınması.  Yüksək meqapikselli foto aparatlar vasitəsi ilə,
müxt
əlif skanirə  prosesləri ilə  elektron sənədlərin  yaradılmasıdır.  Vizual  və
m
ətn sənədlərin  elektron  emalı  prosesi  qeydiyyat  məlumatlarının
elektronlaşdırılması  texnlologiyaları  və  ümumilikdə  elektron  kitabxanaların
yaradılamasında geniş istifadə edilə bilər.

129

Aparıcı OCR sistemlər:
Fine Reader (Fayn Rider), Fine Reader
əlyazma və  Form Reader
ABBYY Software House t
ərəfindən  istehsal  edilmişdir  və  çap,  əlyazma
m
ətnlərin, təsviri formların oxunmasında istifadə olunan mükəmməl proqram
t
əminatlarındandır.
CuneiForm, Cognitive
Technologies  firması  tərəfindən istehsal
edilmişdir.
Fine Reader kimi sistemin işləmə texnologiyası özündə iki mərhələni
c
əmləşdirir.
Qrafiki t
əsvirlərin analizizi
C
ədvəl və şəkillərin seçilməsi
Tanınma bölmələrinin müəyyənləşdirilməsi
S
ətir, simvolların ayrılması
Ayrılmış simvolların tanınması. Bununda daxili bölmələrini klassifator
kimi realiz
ə etmək olar.
Şablon
Əlamətlər
Struktur
Çoxsaylı  araçdırmalar  göstərmişdir  ki,  belə  mürəkkəb  prosedurların
aparılması üçün “intellektual tanınma” texnikası tətbiq edilməlidir.
Ən mükəmməl OCR sistemlərdə  insana  xas  tanınma  texnologiyaları
t
ətbiq edilir. Nəzərə alsaq ki, insanda bu çox pilləlidir aşağldakı misala nəzər
salaq:

1
Kontekstin emalı
Dağlıq ərazi. Zirvələrdə ağ rənglər görünür
2
Əlamətlərin ilkin seçilməsi
Ağ rəngin kompakt obyekti
3
Proqnozun verilm
əsi
İlkin versiya olaraq həmin obyektin qar olması
4
Obyektin hiss
ələrinin seçilməsi
Zirv
ədə  olan  qarın  spesifik  forması,  harada
yerl
əşməsi.
5
Hiss
ələrin düzgün strukturu
R
əngi, həcmi
6
Proqnozların təsdiq edilməsi
Dağın ətəyində ağ qarın olması

3 prinsip var ki, OCR sistem onu üz
ərində qurulub.
T
əsvirin tamlığı prinsipi
Istiqam
ətliliyi prinsipi
Adaptasiya prinsipi
Simvolun  qrafiki  obrazı  skanerdən  çıxdığı  anda  nöqtələrdən ibarət
matris  formasında  müşahidə  edilir. Misal olaraq ”ə” hərfi bu əlifbada “a”
simvolu il
ə  oxşarlıq  təşkil  edir.  Məlum  olduğu  kimi  simvolların  düzgün
oxunması mətndə olan fikir dəqiqliyini bildirmək üçün vacib elementlərdəndir.
Bu  zaman  artıq  intellektual  analiz  prosesi  baş  verir və  ilkin olaraq söz üzrə
analiz aparılır. Bunu misalda izləyək: “*laqə” ulduzla işarələnmiş yerə “a” və

130

ya  “
ə” simvolunun uyğun olması avtomatik sistemdə olan lüğətlə yoxlanılır.
N
əticədə bazada “alaqa” yox “əlaqə” sözünün olduğu və qrammatik cəhətdən
“alaqa”
sözünün  düzgün  olmadığı  müəyyənləşdirilir.  Digər bir misal: ”*y”
simvolları göstərilir, bu həm ay və həm də əy sözü ola bilər. Artıq bu halda
bütün cüml
ə analiz edilir, mənası aşkarlanır və hansı simvolun əlavə olunacağı
mü
əyyənləşir [7 s. 35].
Hiperm
ətn informasiya texnologiyaları
Hiperm
ətn  semantik  informasiyanın  təşkil  edilməsi  formasıdır.  Misal
üçün ensiklopediyayaların əsas elementi kimi, məqalələr və terminlər arasında
assosiativ
əlaqənin  qurulmasıdır.    Müasir  anlamda  hipermətn müxtəlif
m
əqsədlər üçün nəzərdə  tutulmuş  elektron  informasiya  fondudur,  xarakterik
xüsusiyy
ətləri tematik, formativ sənədlərin əlaqələndirilməsi kimi qəbul etmək
olar.
Hiperm
ətinin  əsasını  informasiyanı  təşkil  edən semantik əlaqəli
fraqmentl
ər təşkil edir ki, bir biri ilə əlaqəli məlumatlara keçid əldə edilməsini
t
əmin edir və buda intellektual informasiya axtarışının özül hissəsi kimi qəbul
etm
ək olar.
Hiperm
ətn informasiya texnologiyalarının tətbiq sahələri:
Informasiya resursları və Internet texnologiyaları;
Hiperm
ətn informasiya-axtarış sistemləri;
İqtisadi sistemlər üçün hipermətn informasiya modelləri;
Hiperm
ətn əsaslı verilənlər bazaları;
T
əhsil, distant təhsil sistemlərində hipermətn informasiya modelləri
v
ə  sözsüz bu siyahıya elektron kitabxanalarıda daxil etmək məqsədə
uyğun olardı [7 s. 42].
Bildiyimiz  kimi  elektron  kitabxananın  özül  strukturunu  İnternetdə
informasiya  resursları  təşkil  edir  və  bu məlumatlar müxtəif növlü, dinamik
olur. Hiperm
ətn  texnologiyalarının  İnternet  məkanında  tətbiqi 1993-cü ildən
WWW (Wo
rld  Wide  Web)  “dünya  hörmüşək  toru”  texnologiyaları
ç
ərçivəsində  tətbiq edilir. Bu HTTP (Hyper Text Transport Protocol)
protokolu vasit
əsilə HTML (Hyper Text Markup Language) dilində maşınlar
arası informasiya mübadiləsini təşkil edir, çox zaman biz “veb səhifə” və ya
“HTML s
əhifə” kimi terminlərə rast gələ bilərik. Qeyd edilən HTML səhifə
özünd
ə  sənədin strukturunun təsvirini təqdim edir və  bu tip reusrsa URL
(Uniform Resource Locator) ünvan vasit
əsi ilə  daxil olunur. Növbəti
m
ərhələdə  bir neçə  HTML səhifənin  qarşılıqlı  əlaqəsi və  bir  sistem  halında
birl
əşməsi  veb  saytın  strukturunu  yaradır.  Texniki  tərfdən də  nəzər salsaq
HTML dilind
ə təqdim edilən hipermətn sənədi nəinki mətn, həmçinin cədvəl,
skript, müxt
əlif rəqəmli obyektlərə  edilən  hiperistinadları  (şəkil, audion və
video material v
ə s.) dəstəkləyir ki, bu da informasiya resurslarının semantik
əlaqəliliyini təmin edir [1 s. 200].

Yüklə 3,72 Kb.

Dostları ilə paylaş:

1 ... 53 54 55 56 57 58 59 60 ... 88