Məhəbbət Mirzəliyeva, Kamilə Vəliyeva
52
Süni intellektin yeni bir istiqaməti olan “təbii dillərin ema-
lı” (Natural Language Processing) artıq 60-cı illərin sonunda
formalaşmışdır. Burada da əsas məqsəd təbii dildə EHM-lə əla-
qəyə (ünsiyyətdə olmaq, insan-maşın dialoqunda iştirak etmək)
girməkdir. Bu cəhətdən də o, daim müxtəlif sahələrin mütəxəs-
sislərinin – dilçilərin, psixoloqların, filosofların diqqət mər-
kəzində olmuşdur. Yeri gəlmişkən qeyd edək ki, hələ EHM-lər
meydana gəldiyi vaxtdan insanla maşın arasında ünsiyyətin yara-
dılması alimləri düşündürmüşdü. Məhz bu əlaqəni yaratmağa ilk
dəfə proqramçılar cəhd göstərmişlər. Sonralar təbii dillərin struk-
turunun dərindən öyrənilməsi, insan-maşın münasibətlərinin la-
büdlüyü, kommunikativ aktın bütün aspektlərini özündə əks etdirən
ünsiyyət üçün ən vacib, dolğun nəzəriyyə yaradılması və ifadəçi-
lərin tələbatını ödəyəcək səviyyəyə çatdırılması ilə əlaqədar dilçilə-
rin bu işə cəlb olunması labüdlüyü ortaya çıxmışdır.
Təbii ki, insan-maşın əlaqəsində əsas ünsiyyət dialoq for-
masında olmalıdır. Dialoq qoyulan məqsəddən asılı olaraq üç
səviyyədə:
qlobal, tematik və
lokal səviyyələrdə ola bilər. Qlo-
bal səviyyədəki əlaqə istifadəçinin qarşıya qoyduğu məsələnin
ümumi xüsusiyyətləri
ilə təyin olunur, tematik
səviyyədə isə dia-
loqun strukturu qoyulan məsələnin konkret alqoritmik həllindən
asılıdır, lokal səviyyədə isə iştirakçıların qarşılıqlı ifadələri dia-
loqunun ayrı-ayrı addımlarına baxılır.
1
Dilin diskursiv səviyyədə öyrənilməsində bu şərtlərin lü-
zumluluğu bir daha bariz şəkildə nümayiş etdirilir.
Təbii dillərin maşın vasitəsilə tanınması dedikdə, burada iki
tanınma:
mətnin və şifahi nitqin tanınması nəzərdə tutulur. Hər iki ta-
nınma, ayrı-ayrı istiqamətlər üzrə öyrənilir və geniş sahəni əhatə etdiyi
üçün biz burada yalnız qısa məlumat verməklə kifayətlənəcəyik.
Mətnin avtomatik yolla tanınması üçün əlbəttə, ilk növbə-
də linqvistik təminat hazırlanmalıdır. Linqvistik təminata aşağı-
dakı məsələlər daxil edilməlidir:
1
Искусственный интеллект. Кн.1. Система общения и экспертные системы. М.,
1990, стр.10
Maşın tərcüməsinin nəzəri problemləri
53
1.
Qrafemlərin avtomatik (maşın vasitəsilə) tanınması;
2.
Morfemlərin avtomatik (maşın vasitəsilə) tanınması;
3.
Sintaktik səviyyədə morfemlər zəncirinin tanınması.
Qrafem səviyyəsində dilin uyğun əlifbasını (mətndə qra-
femini) maşın dilinə (maşın dili – əlifbası iki ədəddən ibarətdir:
sıfır – 0 və
vahid – 1) çevirmək yəni kodlaşdırmaq lazımdır.
Azərbaycan dilinin əlifbası 32 qrafemdən ibarətdir. Deməli,
maşın dilinə çevirəndə 32 qrafem 0 və 1-dən ibarət rəqəmlərlə
ifadə olunacaq, yəni kodlaşdırılacaqdır.
Morfemlərin avtomatik tanınması zamanı morfemlər qra-
femlər zəncirindən ibarət olduğundan onların kodlaşdırılması
uyğun qrafemlərin cəmi ilə ifadə olunacaqdır. Məlumdur ki,
morfemlər kök və şəkilçi morfemlərinə ayrılır. Qeyd etməliyik
ki, kök və şəkilçi morfemləri maşın yaddaşına daxil edilməlidir.
Sintaktik səviyyədə morfemlərin tanınması üçün frazeoloji
vahidlər, sabit söz birləşmələri bir sözlə, kodlaşdırılmış sintaq-
malar eyni zamanda kompüterin yaddaşına daxil edilməlidir.
Təbii dillərin kompüterdə tanınması üçün linqvistik təmi-
natla yanaşı riyazi təminat da hazırlanmalıdır. Əlbəttə ki, riyazi
təminata qoyulmuş məsələnin həllinin alqoritminə əsasən tanın-
ma proqramları hazırlanmalıdır.
Hal-hazırda müxtəlif sistemli dillərin tanınma proqramları
sistemləri mövcuddur. Son illərin məhsulu olan skaner qurğuları
vasitəsilə yazılı mətnlər kompüterə daxil edilir və tanınma proqram-
larının köməyi ilə həmin mətnlər kompüterdə oxunur və onların
qarşısında qoyulan məsələ ilə əlaqədar uyğun əməliyyatlar aparmaq
mümkün olur. Danışıq dilinin, o cümlədən şifahi nitqin kompüter
vasitəsilə tanınması, yazılı mətnlərin tanınmasından xeyli fərqlə-
nirlər. Doğrudur, həll metodunda oxşar cəhətlər dilin yanaşma sə-
viyyəsində özünü büruzə verir. Burada da artıq qrafem əvəzinə
fonemləri linqvistik bazaya təqdim etmək üçün onun səslənməsinin
bir tərəfdən frazeoloji və akustik aspektdə öyrənərək tətbiq etmək
lazım gəlir, digər tərəfdən isə fonemlər sisteminə aid olan bütün
məlumatlar, fonemlərin əsas əlamətləri və statusu, onların perspektiv