61
Əlbəttə, məsələnin həlli üçün ona uyğun metodlar araşdırılarkən qarşıya çıxan müxtəlif
variantlardan optimalını seçmək lazımdır. Məsələn, tezlik lüğətinin tərtibi zamanı əlverişli metod artıq
standart hala keçmiş sortlaşdırma metodudur. Seçilmiş üsula əsasən isə məsələnin alqoritmi qurulmalıdır.
Alqoritmin tərifinə gəlincə isə ədəbiyyatda aşağıdakı kimi təsviri verilir.
Alqoritm – elə hesablama sistemidir ki, müəyyən dəqiq əməliyyatlarla (qaydalarla) ardıcıl
addımlardan sonra qoyulmuş məsələnin həllinə gətirib çıxarır.
Alqoritm qurulduqdan sonra məsələnin EHM-də realizə edilməsi üçün proqram tərtib olunmalıdır.
Qurulmuş alqoritmə əsasən isə proqram hazırlanır. Proqram ayrı-ayrı əməliyyatların maşın əmrləri ilə ifadə olun-
muş yazılışından ibarətdir. Hər bir əmr müəyyən rəqəm vasitəsilə ifadə olunmalıdır. Məlumdur ki, hesablama
maşınlarının özünəməxsus əmr sistemi vardır.
Əmrlər sisteminə hesab əməlləri, məntiqi idarəedici əməliyyatlar daxildir. Hər bir əmr müəyyən
informasiya daşıyır. Yəni kodun bir hissəsi yerinə yetiriləcək əməliyyatı, digəri isə həmin əməliyyatın
hansı rəqəmlər (kodlar) üzərində yetirilməsini göstərir. Maşında əmrlər onlar üçün əvvəlcədən ayrılmış
xüsusi xanələrdə (oyuqlarda) yaddaşda yerləşdirilir. Alqoritm proqramlaşdırıldıqdan sonra son-mərhələ
onun EHM-də realizə olunması başlanır. Proqram maşına daxil edilir, onu təşkil edən ayrı-ayrı hissələr,
yəni bloklar yoxlanılır. Çünki proqram qurularkən şübhəsiz ki, müəyyən xətalara məntiqi və ya mexaniki
səhvlər yol verilə bilər. Məhz yoxlama zamanı müəyyən buraxılmış səhvlər bilavasitə maşında insan
tərəfindən düzəldilir. Müasir maşınlarda bu düzəliş displeydə aparılır. Bəzən səhvlərdən asılı olaraq maşın
dayanır. Belə halda da proqramda müəyyən səhvə yol verilmiş, ya da maşının qurğularında müəyyən mexaniki
nasazlıq baş vermişdir. Proqram maşında yoxlanıldıqdan sonra proqramın bütün blokları düzgün işləyirsə, artıq
onu tamamilə insanın iştirakı olmadan avtomatın ixtiyarına vermək olar.
Bu zaman maşının idarəedici pultundakı avtomat düyməni açmaq kifayətdir. Məsələnin alqoritminə
gəlincə isə tezlik lüğətləri üçün tərtib olunmuş alqoritm aşağıdakı ardıcıllıqla yerinə yetirilmişdir:
1. Mətndəki sözlərin seçilməsi;
2. Sözlərin əlifba sırası ilə düzülüşü;
3. Hər bir sözün işlənmə tezliyinin hesablanması;
4. Alınan massivin işlənmə tezliyindən asılı olaraq əlifba sırası ilə düzülüşü;
5. Alınan nəticənin çap edilməsi.
Bu alqoritmə əsasən dilin riyazi-statistik metodlarının köməyi ilə tədqiqində Azərbaycan
dilçiliyində önəmli yer tutan tezlik lüğətlərinin tərtibi oldu. Məlumdur ki, tezlik lüğətlərində sözlər və
onların mətndəki işlənmə tezliyinin göstəricisi qeyd olunur. Bu lüğətləri tərtib edərkən bir sıra çətinliklər
qarşıya çıxır. Birinci mətnləri elə seçmək lazımdır ki, kafi qədər ədəbi dil normalarını özündə əks etdirmiş
olsun. Bu bir o qədər də asan iş deyildir. İkinci, daha mürəkkəb məsələ, mətnlərin ümumi həcmini seç-
məkdən ibarətdir. Azərbaycan dilinin tezlik lüğəti üçün əsas mənbə qəzet materialları olmuşdur. İxtiyari
götürülmüş mətnlərdən 100 min söz götürülmüşdür.
Tezlik lüğətlərinin tətbiqinin məlumatların avtomatik işlənməsində avtomatik tərcümədə, referat-
laşdırmada, poliqrafiyada, kriminalistikada, anonim yazıların müəlliflərini müəyyənləşdirməkdə müstəsna
əhəmiyyəti vardır.
Yuxarıda danışdığımız lüğətlərin EHM-da necə tərtib olunması prosesini nəzərdən keçirək.
EHM-in köməyi ilə ilk tezlik lüğəti H.Yosselson tərəfindən tərtib olunmuşdur. Hal hazırda EHM-in
köməyi ilə yüzlərlə müxtəlif xarakterli tezlik lüğətləri tərtib olunmuşdur. Ümumiyyətlə, dünya miqyasında 500-ə
qədər tezlik lüğəti bizə məlumdur. Bunların bir qismi texniki vasitəsiz, yəni əl ilə uzun illərin zəhməti bəhrəsi
kimi, digər qismi EHM-in köməyi ilə tez bir zamanda əldə edilmişdir. Misal üçün mətndən seçilmiş 200 min
sözdən ibarət olan siyahıdan tezlik lüğətini tərtib etmək üçün tədqiqatçı 2 il vaxt sərf etməlidir. Ancaq EHM-in
köməyi ilə həmin işi 3 aya görmək mümkündür. Burada əsas çox vaxt aparan iş mətnlərdəki sözləri kodlaş-
62
dırmaqdır. Əgər hər gün 7 saat ərzində 4000 söz kodlaşdırılsa, onda EHM-də lüğətin tərtibinə 12 saat vaxt sərf
edilər.
EHM vasitəsilə tərtib edilən lüğətlər aşağıdakı mərhələlər üzrə aparılır:
1. Tərtib ediləcək lüğətin növündən asılı olaraq blok-sxemə əsasən proqram qurulur;
2. Lüğətlər üçün hazırlanmış materiallar kompyuterdə yığılır;
3. Alqoritmə əsasən qurulmuş proqram kompyuterin yaddaşına daxil edilir;
4. Alınan nəticələr çap qurğusu – çıxışda çap edilir.
EHM-də tezlik lüğətinin tərtibi isə aşağıdakı alqoritm üzrə görülmüşdür:
1. Mətndəki sözlərin seçilməsi;
2. Sözlərin əlifba sırası ilə düzülməsi;
3. Hər bir sözün işlənmə tezliyinin hesablanması;
4. Alınan massivin işlənmə tezliyindən asılı olaraq əlifba sırası ilə düzülməsi;
5. Alınan nəticənin çap edilməsi.
Azərbaycan qəzet dilinin tezlik lüğəti bu silsiləyə daxildir. Əvvəldə qeyd etdiyimiz kimi, ilk tezlik lüğəti
1997-ci ildə işıq üzü gördü [36]. Sonralar onun yenidən işlənmiş variantı 2004-cü ildə nəşr olundu [37]. 2010-
cu ildə isə Azərbaycan dilinin tezlik lüğəti çap edildi [38]. Bu lüğətin tərtibi üçün Azərbaycan dilinin bütün
üsulları təmsil olunmaqla təxminən 50 mln. yaxın söz formadan ibarət mətnlər linqvostatistik təhlilə cəlb
olunmuşdur. Lüğətdə 12 000-ə yaxın söz kökü əhatə olunmuşdur. Azərbaycan tezlik lüğəti leksikanın
statistik modeli kimi ümumi leksikologiyanın, dil tədrisinin bir çox problemlərinin həllində əvəzsiz mənbə
rolunu oynayır.
Bundan başqa tarixi abidələrin öyrənilməsində statistik metodların tətbiqi təkzibolunmaz əhəmiyyət kəsb
edir. Dünya dilçiliyində hind-avropa dillərinin qrupları arasındakı qohumluq əlaqələrinin aşkar edilməsində 1927-
ci ildə ilk dəfə Polşa alimi Yan Çekanovski məhz bu metoddan istifadə etmişdir [84]. Amerika alimi Morris
Svodeş isə 1948-ci ildə leksik-statistik metoddan istifadə edərək dillərin lüğət fondunu öyrənərkən belə qənaətə
gəlmişdir ki, bütün dillərin əsas lüğət fondu sabit sürətlə, yavaş-yavaş dəyişir [85]. Eləcə də dillərin tipoloji
öyrənilməsində də statistik metodların böyük rolu vardır.
Azərbaycan dilçiliyində tarixi abidələrin o cümlədən yazılı abidələrin kompyuterlərdə tədqiqi ilə bağlı
«Kitabi-Dədə Qorqud»un 1988-ci ildə nəşr olunmuş tənqidi mətni üzrə (tərtibçilər: F.Zeynalov, S.Əlizadə)
əlifba-tezlik və əks əlifba siyahısı hazırlandı [28]. Burada tezlik siyahısı on minə yaxın söz formanı əhatə
edir. Dastanda qeydə alınmış sözlər işlənmə tezliyinə görə azalma sırası ilə verilmişdir.
Əlifba-tezlik siyahısında isə söz-formalar işlənmə tezliyinə görə deyil, əlifbaya görə düzülmüşdür.
Tərtib olunmuş bu siyahının dil tarixi ilə məşğul olan mütəxəssislər üçün böyük əhəmiyyəti vardır.
Klassik irsimizdən M.Füzulinin nəzm əsərlərinin statistik-distributiv təhlili tədqiq olunmuşdur.
Əlbəttə,
klassik
ədəbiyyata
müraciətin,
müəlliflərinin
əsərlərində
üslubi
xüsusiyyətlərinin
özünəməxsusluğunu aşkar etmək, işlənmə tezliyinin göstəricilərini müqayisə etməklə naməlum müəllifli
əsərlərin müəllifini müəyyənləşdirməkdə böyük əhəmiyyəti olar.
Bundan başqa Azərbaycan dilçiliyində linqvistik tədqiqatlarda bir çox problemlərin həllində geniş
istifadə olunan Azərbaycan dilinin əks lüğəti tərtib edilmişdir [78].
Əks lüğət adı altında nə başa düşülür və onun adi lüğətlərdən (ikidilli, izahlı və s.) fərqləndirən
cəhət nədir?