Azərbaycan Milli Elmlər Akademiyası Nəsimi adına Dilçilik İnstitutu



Yüklə 1,69 Mb.
Pdf görüntüsü
səhifə18/40
tarix19.07.2018
ölçüsü1,69 Mb.
#57268
1   ...   14   15   16   17   18   19   20   21   ...   40

Məhəbbət Mirzəliyeva, Kamilə Vəliyeva 
 
52 
Süni intellektin yeni bir istiqaməti olan “təbii dillərin ema-
lı”  (Natural  Language  Processing)  artıq  60-cı  illərin  sonunda 
formalaşmışdır. Burada da əsas məqsəd təbii dildə EHM-lə əla-
qəyə  (ünsiyyətdə  olmaq,  insan-maşın  dialoqunda  iştirak  etmək) 
girməkdir.  Bu  cəhətdən  də  o, daim müxtəlif sahələrin mütəxəs-
sislərinin  –  dilçilərin,  psixoloqların,  filosofların  diqqət  mər-
kəzində  olmuşdur.  Yeri  gəlmişkən  qeyd  edək  ki,  hələ  EHM-lər 
meydana gəldiyi vaxtdan insanla maşın arasında ünsiyyətin yara-
dılması alimləri düşündürmüşdü. Məhz bu əlaqəni yaratmağa ilk 
dəfə proqramçılar cəhd göstərmişlər. Sonralar təbii dillərin struk-
turunun  dərindən  öyrənilməsi,  insan-maşın  münasibətlərinin  la-
büdlüyü, kommunikativ aktın bütün aspektlərini özündə əks etdirən 
ünsiyyət üçün  ən  vacib,  dolğun nəzəriyyə  yaradılması və ifadəçi-
lərin tələbatını ödəyəcək səviyyəyə çatdırılması ilə əlaqədar dilçilə-
rin bu işə cəlb olunması labüdlüyü ortaya çıxmışdır. 
Təbii ki,  insan-maşın  əlaqəsində  əsas  ünsiyyət  dialoq  for-
masında  olmalıdır.  Dialoq  qoyulan  məqsəddən  asılı  olaraq  üç 
səviyyədə:  qlobal,  tematik    lokal  səviyyələrdə  ola  bilər.  Qlo-
bal  səviyyədəki  əlaqə  istifadəçinin  qarşıya  qoyduğu  məsələnin 
ümumi xüsusiyyətləri ilə təyin olunur, tematik səviyyədə isə dia-
loqun strukturu qoyulan məsələnin konkret alqoritmik həllindən 
asılıdır, lokal səviyyədə isə iştirakçıların qarşılıqlı ifadələri dia-
loqunun ayrı-ayrı addımlarına baxılır.
1
 
Dilin  diskursiv  səviyyədə  öyrənilməsində  bu  şərtlərin  lü-
zumluluğu bir daha bariz şəkildə nümayiş etdirilir. 
Təbii  dillərin  maşın  vasitəsilə  tanınması  dedikdə,  burada  iki 
tanınma: mətnin və şifahi nitqin tanınması nəzərdə tutulur. Hər iki ta-
nınma, ayrı-ayrı istiqamətlər üzrə öyrənilir və geniş sahəni əhatə etdiyi 
üçün biz burada yalnız qısa məlumat verməklə kifayətlənəcəyik. 
Mətnin avtomatik yolla tanınması üçün əlbəttə, ilk növbə-
də linqvistik təminat hazırlanmalıdır. Linqvistik təminata aşağı-
dakı məsələlər daxil edilməlidir: 
                                                           
1
 Искусственный интеллект. Кн.1. Система общения и экспертные системы. М., 
1990, стр.10 


Maşın tərcüməsinin nəzəri problemləri 
 
53 
1.
 
Qrafemlərin avtomatik (maşın vasitəsilə) tanınması; 
2.
 
Morfemlərin avtomatik (maşın vasitəsilə) tanınması; 
3.
 
Sintaktik səviyyədə morfemlər zəncirinin tanınması. 
Qrafem  səviyyəsində  dilin  uyğun  əlifbasını  (mətndə  qra-
femini) maşın dilinə (maşın dili – əlifbası iki ədəddən ibarətdir: 
sıfır  –  0  və  vahid  –  1)  çevirmək  yəni  kodlaşdırmaq  lazımdır. 
Azərbaycan  dilinin  əlifbası  32  qrafemdən  ibarətdir.  Deməli, 
maşın  dilinə  çevirəndə  32  qrafem  0  və  1-dən  ibarət  rəqəmlərlə 
ifadə olunacaq, yəni kodlaşdırılacaqdır. 
Morfemlərin  avtomatik  tanınması  zamanı  morfemlər  qra-
femlər  zəncirindən  ibarət  olduğundan  onların  kodlaşdırılması 
uyğun  qrafemlərin  cəmi  ilə  ifadə  olunacaqdır.  Məlumdur  ki, 
morfemlər  kök  və  şəkilçi  morfemlərinə  ayrılır.  Qeyd  etməliyik 
ki, kök və şəkilçi morfemləri maşın yaddaşına daxil edilməlidir. 
Sintaktik səviyyədə morfemlərin tanınması üçün frazeoloji 
vahidlər,  sabit  söz  birləşmələri  bir  sözlə,  kodlaşdırılmış  sintaq-
malar eyni zamanda kompüterin yaddaşına daxil edilməlidir. 
Təbii  dillərin  kompüterdə  tanınması  üçün  linqvistik  təmi-
natla  yanaşı riyazi təminat da hazırlanmalıdır. Əlbəttə ki, riyazi 
təminata qoyulmuş məsələnin həllinin alqoritminə əsasən tanın-
ma proqramları hazırlanmalıdır.  
Hal-hazırda  müxtəlif  sistemli  dillərin  tanınma  proqramları 
sistemləri  mövcuddur.  Son  illərin  məhsulu  olan  skaner  qurğuları 
vasitəsilə yazılı mətnlər kompüterə daxil edilir və tanınma proqram-
larının  köməyi  ilə  həmin  mətnlər  kompüterdə  oxunur  və  onların 
qarşısında qoyulan məsələ ilə əlaqədar uyğun əməliyyatlar aparmaq 
mümkün  olur.  Danışıq  dilinin,  o  cümlədən  şifahi  nitqin  kompüter 
vasitəsilə  tanınması,  yazılı  mətnlərin  tanınmasından  xeyli  fərqlə-
nirlər.  Doğrudur,  həll  metodunda  oxşar  cəhətlər  dilin  yanaşma  sə-
viyyəsində  özünü  büruzə  verir.  Burada  da  artıq  qrafem  əvəzinə 
fonemləri linqvistik bazaya təqdim etmək üçün onun səslənməsinin 
bir  tərəfdən  frazeoloji  və  akustik  aspektdə  öyrənərək  tətbiq  etmək 
lazım  gəlir,  digər  tərəfdən  isə  fonemlər  sisteminə  aid  olan  bütün 
məlumatlar, fonemlərin əsas əlamətləri və statusu, onların perspektiv 


Məhəbbət Mirzəliyeva, Kamilə Vəliyeva 
 
54 
və funksional aspekti, korrelyasiyası, linqvistik bazaya daxil edilmə-
lidir. Bundan başqa fonemlərin allofonik variasiyası, kompleksiyası, 
onların tipləri, orfoepiyası, tanınma funksiyası linqvistik təminat ha-
zırlanarkən nəzərə alınmalıdır. 
Şifahi  nitqin  tanınmasında  başlıca  rol  hecaların  üzərinə 
düşür. Buna görə də, hecaların strukturu dərindən öyrənilməli və 
formal modelləri hazırlanmalıdır. Eləcə də şifahi nitqin tanınma-
sında əsas amillərdən biri də vurğu problemidir. Dilçilik ədəbiy-
yatından məlumdur ki, müxtəlif sistemli dillərdə  vurğu daşıdığı 
funksiyadan asılıdır.  
Məs:  rus  dilində  hər  bir  sözün  özünəməxsus  vurğusu  vardır. 
Çünki bu dildə vurğu kuliminativ  funksiya  daşıyır.  Türk  dillərində 
isə  vurğu  deliminativ  funksiya  daşıdığından  vurğu  sözün  sonuncu 
hecasına  düşür.
1
  Nitqin  tanınma  proqramında  isə  vurğu  sonuncu 
hecanın daha yüksək tonla səslənməsi ilə təyin olunur. Bu baxımdan 
şifahi nitqin tanınmasında hecaların modelləri, intonasiya, sözlərin 
ahəngi məsələləri  xüsusi  rola malikdir.  Bu,  ayrıca tədqiqat  obyekti 
olduğundan biz burada bu məsələyə toxunmayacağıq. 
Qeyd etməliyik ki, süni intellektin maraqlı məsələlərindən 
biri  də  qədim  əlyazmalarının  oxunmasıdır.  Buna  misal  mayya 
qəbiləsinin heroqlif  yazılarının  oxunması  üzərində aparılan təd-
qiqatları  nümunə  gətirmək  olar.  Amerika  qitəsində  yaşayan, 
yazısı olan bu xalq öz mədəniyyətindən məhrum edilmiş, kitab-
ları itib-batmış, 1951-ci ildə zəngin kitabxanası ispan işğalçıları 
tərəfindən yandırılmışdır.
2
  
Dövrümüzdə üç əlyazma Drezden, Madrid və Parisdə saxlanı-
lır. Müxtəlif ölkələrin, xüsusilə ABŞ, Fransa və Almaniyanın alimləri 
bu əlyazmaların de-şifrəsi üzərində çalışmış, lakin bir nəticə əldə edə 
bilməmişlər.  1951-ci  ildə  sovet  alimi  Y.V.Knorozov  mayya  əl-
yazmalarında  olan  heroqlifləri  eyni  şəklə  gətirmişdir.  Sonra  alimlər 
heroqlifləri  kodlaşdırmış,  maşının  yaddaşına  daxil  etmişlər.  Bundan 
                                                           
1
Вейселли Ф.Я. Элементы общей и частной лингвистики. I ч. В., 2011, стр.210 
2
  Bax:  Большая  советская  энциклопедия.  26,  второе  издание,  том  подписан  к 
печати 16 апреля 1954 г. стр.87 


Yüklə 1,69 Mb.

Dostları ilə paylaş:
1   ...   14   15   16   17   18   19   20   21   ...   40




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə