D i l ç i l i k İ n s t i t u t u n u n ə s ə r l ə r i – 2 0 1 8
292
K.A.Vəliyeva, M.Ə.Mahmudov, V.Pines), Kommunist nəşriyyatının sifarişi
ilə Azərbaycan mətnlərinin sətirdən-sətrə keçirilməsi (K.A.Vəliyeva,
C.Ə.Rəhmanov, V.Pineslə birlikdə), B., 1991; Mətnləri yoxlayan “Korrek-
tor” sistemi AMEA Kibernetika İnstitutunun əməkdaşları Z.Səfərov,
Z.Əmirovla birlikdə.
Həmin dövrdə dilin riyazi-statistik metodlarının köməyi ilə tədqiqində
Azərbaycan dilçiliyində önəmli yer tutan tezlik lüğətləri tərtib olundu.
Məlumdur ki, tezlik lüğətlərində sözlər və onların mətndəki işlənmə
tezliyinin göstəricisi qeyd olunur. Bu lüğətləri tərtib edərkən bir sıra
çətinliklər qarşıya çıxır. Birinci mətnləri elə seçmək lazımdır ki, kafi qədər
ədəbi dil normalarını özündə əks etdirmiş olsun. Bu bir o qədər də asan iş
deyildir. İkinci, daha mürəkkəb məsələ, mətnlərin ümumi həcmini
seçməkdən ibarətdir. Azərbaycan dilinin tezlik lüğəti üçün əsas mənbə qəzet
materialları olmuşdur. İxtiyari götürülmüş mətnlərdən 100 min söz
seçilmişdir.
Tezlik lüğətlərinin tətbiqinin məlumatların avtomatik işlənməsində
avtomatik tərcümədə, referatlaşdırmada, poliqrafiyada, kriminalistikada,
anonim yazıların müəlliflərini müəyyənləşdirməkdə müstəsna əhəmiyyəti
vardır.
Əvvəldə qeyd etdiyimiz kimi, ilk tezlik lüğəti 1997-ci ildə işıq üzü
gördü [8]. Sonralar onun yenidən işlənmiş variantı 2004-cü ildə nəşr olundu
[9]. 2010-cu ildə isə Azərbaycan dilinin tezlik lüğəti çap edildi [10]. Bu
lüğətin tərtibi üçün Azərbaycan dilinin bütün üsulları təmsil olunmaqla
təxminən 50 milyona yaxın söz formadan ibarət mətnlər linqvo-statistik
təhlilə cəlb olunmuşdur. Lüğətdə 12000-ə yaxın söz kökü əhatə olunmuşdur.
Burada xüsusi qeyd etmək lazımdır ki, Azərbaycan dilinin tezlik lüğəti
leksikanın statistik modeli kimi ümumi leksikologiyanın, dil tədrisinin bir
çox problemlərinin həllində əvəzsiz mənbə rolunu oynayır.
Bundan başqa tarixi abidələrin öyrənilməsində statistik metodların
tətbiqi təkzibolunmaz əhəmiyyət kəsb edir. Dünya dilçiliyində hind-
Avropa dillərinin qrupları arasındakı qohumluq əlaqələrinin aşkar
edilməsində 1927-ci ildə ilk dəfə polşa alimi Yan Çekanovskiy, məhz, bu
metoddan istifadə etmişdir [11]. Amerika alimi Morris Svodeş isə 1948-
ci ildə leksik-statistik metoddan istifadə edərək dillərin lüğət fondunu
öyrənərkən belə qənaətə gəlmişdir ki, bütün dillərin əsas lüğət fondu
sabit sürətlə, yavaş-yavaş dəyişir [11]. Eləcə də dillərin tipoloji
öyrənilməsində də statistik metodların böyük rolu vardır.
Azərbaycan dilçiliyində tarixi abidələrin o cümlədən yazılı
abidələrin kompüterlərdə tədqiqi ilə bağlı “Kitabi-Dədə Qorqud”un
D i l ç i l i k İ n s t i t u t u n u n ə s ə r l ə r i – 2 0 1 8
293
1988-ci ildə nəşr olunmuş tənqidi mətni üzrə (tərtibçilər: F.Zeynalov,
S.Əlizadə) əlifba-tezlik və əks əlifba siyahısı hazırlandı [12]. Burada
tezlik siyahısı ön minə yaxın söz formanı əhatə edir. Dastanda qeydə
alınmış sözlər işlənmə tezliyinə görə azalma sırası ilə verilmişdir.
Əlifba-tezlik siyahısında isə söz formalar işlənmə tezliyinə görə
deyil, əlifbaya görə düzülmüşdür. Tərtib olunmuş bu siyahının dil tarixi
ilə məşğul olan mütəxəssislər üçün böyük əhəmiyyəti vardır.
Klassik irsimizdən M.Füzulinin nəzm əsərlərinin statistik-distributiv
təhlili tədqiq olunmuşdur. Əlbəttə, klassik ədəbiyyat müraciətin, müəlliflə-
rinin əsərlərində üslubi xüsusiyyətlərinin özünəməxsusluğunu aşkar etmək,
işlənmə tezliyinin göstəricilərini müqayisə etməklə naməlum müəllifli
əsərlərin müəllifini müəyyənləşdirməkdə böyük əhəmiyyəti olar.
Bundan başqa Azərbaycan dilçiliyində linqvistik tədqiqatlarda bir çox
problemlərin həllində geniş istifadə olunan Azərbaycan dilinin əks lüğəti
tərtib edilmişdir [13].
“Azərbaycan dilinin əks-lüğəti”, “Azərbaycan dilinin orfoqrafiya lü-
ğəti əsasında tərtib olunmuşdur. Bundan başqa “Azərbaycan dilinin
orfoqrafiya lüğəti”ndə iştirak etməyən sözlər “Azərbaycanca-rusca” lüğət-
dən götürülərək əks lüğətə daxil edilmişdir. “Azərbaycan dilinin əks lüğəti”
türk dilləri üzrə tərtib olunmuş lüğətlərdən həcm etibarilə ən sanballısı hesab
edilə bilər.
Bir sözlə, demək olar ki, yuxarıda sadaladığımız metodlardan
Azərbaycan alimləri uğurla öz tədqiqatlarında istifadə edirlər. Belə ki,
aksiomatik metodla Axundov, Vəliyev, Melnikov [4-7, 14] mo-
delləşdirmə metodu ilə Vəliyeva, Pines, Mahmudov, Əmirov, Fətullayev,
Xəlili, Kuliyeva, İskəndərova [3, 15-22];
Nəzəri-linqvistik metodla Melnikov, Vəliyeva, Vəliyev, Mahmudov
[22-29,37] çoxluqlar, avtomatlar və alqoritmlər nəzəriyyəsindən istifadə Və-
liyeva, Mahmudov [26-29], statistik metodla Pines, Vəliyeva, Mahmudov,
Rəhmanov, Sultanov, Məmmədova, Şıxıyeva [ 30-36, 38] işləri aparmışlar.
90-cı illərin əvvəlində qrupun rəhbəri V.Pines ABŞ-a köçdüyü üçün
qrupa rəhbərlik M.Ə.Mahmudova (1991-1995) tapşırıldı. M.Mahmudovun
rəhbərlik etdiyi illərdə qrupa V.Sultanov və İ.Qəribova daxil edildi. Bu illər
ərzində uzun müddət çapını həsrətlə gözlədiyimiz kollektivin əsərləri nə-
hayət ki, işıq üzü gördü: Kitabi-Dədə Qorqud dastanlarının statistik-
distributiv təhlili. B.,1997; B., 1999 (ikinci nəşr). M.Füzulinin nəzm
əsərlərinin əlifba-tezlik sözlüyü. B., 2004; M.Ə.Mahmudov Azərbaycan
mətnlərinin avtomatik işlənməsi sistemi, B., 1994, D.D.A. K.A.Vəliyeva
Mətnin avtomatik sintaktik təhlili və sintezi, B., 1996; Azərbaycan qəzet
Dostları ilə paylaş: |