57
Burada
N – sistemin həcmi;
– nisbi xəta;
P – tezlik;
Z
p
– konstanta.
Lakin əksər lüğətlərdə həcm seçimi üçün bu düsturdan istifadə edilmir. Adətən müəlliflər intuisiya
yolu ilə həcmi müəyyənləşdirməklə məhdudlaşırlar.
Ehtimal nəzəriyyəsində seçim – ümumi çoxluğundan ehtimal metodları ilə seçilmiş obyektlərdən
ibarət, sonlu altçoxluqdur. Seçimdəki obyektlərin sayı seçimin həcmi adlanır. Əksər hallarda statistik seçim və
seçimi təşkil edən obyektlərin xarakteristikalarının qiymətlər toplusu ilə eyniləşdirilir. Obyektlər toplusunun
(məsələn, istehsalatda ədədi məmulatları), demoqrafiyada əhalini araşdırmaq üçün statistik seçimlərin yaradıl-
masında müxtəlif ehtimal metodları istifadə olunur [19. S.798, 803–804].
Qaytarmamaq şərtilə təsadüfi seçim – -dan ixtiyari qaydada obyektlərin bir-bir ardıcıl surətdə
götürülməsilə aparılır və seçilmiş obyektlər sonrakı seçmədə iştirak etmir, seçilməmiş bütün obyektlərin
seçilməmiş bütün obyektlərin seçilməsi ehtimalları eyni hesab olunur.
n
elementli çoxluqdursa, onda qaytar-
mamaq şərtilə
r həcmi seçimlərin sayı
n (
n – 1) ... (
n –
r + 1). 1 ≤
r ≤
n olacaqdır. Bu halda
n elementli
çoxluqdan r həcmli seçim qaytarmamaq şərtilə sxemi üzrə aparılır, deyilir.
Qaytarmaq şərtilə təsadüfi seçim – -dan ixtiyari qaydada seçilən obyekt hər dəfə məhz bu
çoxluqdan götürülür. Belə ki, eyni bir obyekt təkrar götürülə bilinər.
n
elementli çoxluq olarsa,
qaytarmaq şərtilə
n həcmli seçimlərin sayı
n . . . n = n
1
r dəfə
olacaqdır. Bu halda n elementli çoxluqlar r həcmli seçim qaytarmaq şərtilə sxemi üzrə aparılır, deyilir.
Əgər seçimdə hər bir obyektin hər hansı bir qaydadan asılı olmadan eyni p ehtimalı ilə seçilməsi qərarı
qəbul edilirsə, onda alınan statistik binominal seçim adlanır. Riyazi statistikada sonlu sayda obyektlərdən ibarət
çoxluqlardan statistik seçimlərlə yanaşı, sonsuz çoxluqlardan seçimlərə də baxılır [19. S.798, 801–802].
R.M.Frumkinaya görə, həcmi müəyyən seçimlə əsaslandırılmış lüğətlərdən O.Qarşıya tərəfindən
hazırlanmış ispan dilinin lüğəti [71] və H.Yosselsonun rus dilinin tezlik lüğətidir [72]. Osun Qarşıya 100 000
sözdən ibarət bu lüğəti haqqında geniş məlumatı R.M.Frumkinanın yuxarıda adı çəkilən kitabında tanış olmaq
olar. Leksikanın statistik metodla öyrənilməsində ən önəmli məqamlardan «Sipf qanunu» ilə tezliyin empirik
asılılığını öyrənilməsidir:
p
r
=
k . r
–Y
.
Burada
r – siyahıda sözün azalan tezliyinin nömrəsidir;
p
r
– r nömrə altında sözün nisbi tezliyi;
k,
y – isə sabit parametrlərdir [70. S.16].
Azərbaycan dilçiliyinə gəlincə isə burada statistik metodla yazılı abidələrin öyrənilməsi və uyğun
tezlik lüğətlərin hazırlanması qarşıya məqsəd qoyulmuşdu.
Məlumdur ki, statistik yolla linqvistik materialların araşdırılması, yazılı abidələrin öyrənilməsi
tədqiqatçıdan yüksək dəqiqlik tələb edir. Bu istiqamət üzrə Azərbaycan dilçiliyində 60-cı illərdə tədqiqatlar
aparılmış müasir Azərbaycan dili saitlərinin ümumi statistik təhlili edilmişdir. Kök və şəkilçilərdə işlənən
58
saitlərin nisbəti araşdırılmış, sözün axırında, əvvəlində, ortasında işlənən saitlərin faiz göstəriciləri uyğun
cədvəllərdə əks olunmuşdur [13; 43. S.18–20].
Dialektlərdə fonemlərin sözlərdəki mövqeyini ilk dəfə olaraq A.H.Vəliyev tərəfindən statistik metodla
tədqiq edilmişdir [73; 74. S.44–57].
Klassik ədəbi irsimizdən yalnız Molla Vəli Vidadinin əsərlərindəki leksik vahidlərin işlənmə tezliyi
müəyyənləşdirilmişdir [22; 43].
Qeyd etməliyik ki, böyük zəhmət tələb edən bu statistik məlumatlar maşınsız, yalnız əl üsulu ilə
görülmüşdür.
Azərbaycan dilçiliyində ilk dəfə olaraq 1979-cu ildə EHM vasitəsilə qəzet materialları əsasında
«Azərbaycan dilinin tezlik lüğəti» tərtib olunmuşdur [36]. Bu lüğətdə ikidilli lüğətlərdən fərqli olaraq
lüğəvi vahidlərin mənası deyil, onun mətndə işlənmə tezliyinin göstəricisi qeyd olunmuşdur. Son illərdə
tezlik lüğətinin elektron versiyası tərtib olunmuşdur [38]. Bu lüğətin annotasiyasına nəzər saldıqda onun
tərtibi üçün «Azərbaycan dilinin bütün üslubları təmsil olunmaqla təxminən 50 mln. yaxın söz-formadan
ibarət mətnlər linqvostatistik təhlilə cəlb olunmuşdur. Elmi, bədii, publisistik, rəsmi, məişət və s. üslublara
dair materialların elektron variantlarının mövcudluğu tədqiqatın hərtərəfli olmasına və statistik seçmə
baxımından etibarlığına imkan yaratmışdır. Lüğətdə 12 000-ə yaxın söz kökü əhatə olunmuşdur [38. S.2].
Türkologiyada ilk dəfə tərtib olunmuş bu lüğət sanballılığı ilə seçilir və leksikanın statistik modeli kimi
nəzəri və tətbiqi dilçiliyin, ümumi leksikologiyanın, dil tədrisinin bir çox problemlərinin həlli üçün əvəzsiz mənbə
rolunu oynayır. Bundan başqa, Azərbaycan dilçiliyində Azərbaycan dilində söz formalarının statistik distributiv
təhlili qrafem və fonem səviyyəsində tədqiq edilmiş, onların mətndə işlənmə tezliyi müəyyənləşdirilməsinin
şahidi oluruq [75].
Qeyd etməliyik ki, bütün bu prinsiplərin daha asanlıqla həlli elektron hesablayıcı maşınların köməyi
ilə həyata keçirilir. Azərbaycan dilçiliyində yuxarıda qeyd etdiyimiz kimi, EHM-lərin köməyi ilə tərtib
olunmuş lüğətlər haqqında geniş məlumat verməmişdən kibernetikanın dilçiliyə tətbiqini şərh edək.
Elmlərin diferensiyası prosesin əksi kimi meydana çıxan inteqrasiya, elmi-texniki tərəqqinin coşğun
inkişafının nəticəsindən yarandı. Əlbəttə, bu inkişaf kor-koranə deyil, məhz müasir dövrdə cəmiyyət qarşı-
sında duran məsələlərin xarakteri bağlı olub, onların kompleksli həllindən doğmuşdu.
Müasir dövrdə dəqiq elmlərlə humanitar elmlər bir-birilə qovuşmuş, ümumiyyətlə, xalq təsər-
rüfatının, iqtisadiyyatın müxtəlif sahələrində aparılan işlərin kompleksli həlli elm sahəsində gedən
inteqrasiya prosesini daha da şiddətləndirmişdir.
Hal-hazırda elmi-tədqiqatların avtomatlaşdırılması prosesi mühüm məsələ kimi qarşıda durmuşdur.
Avtomatlaşma prosesi təkcə texniki elmlər üçün deyil, eləcə də humanitar elmlərdə də mühüm səciyyəvi
xüsusiyyətlərdən birinə çevrilmişdir.
Şübhəsiz ki, avtomatlaşma sistemi prosesində EHM-lərin həlledici rolu böyükdür. Məhz EHM-lərin
meydana gəlməsi ilə əlaqədar yeni bir elm sahəsi kibernetika yaranmışdır ki, hal-hazırda kibernetik qurğular
texnoloji prosesləri modelləşdirir, onları idarə edir, istehsalı planlaşdırır, materialları, işçi qüvvəsini, əmək
haqqını uçota alır. Müxtəlif növlü nəqliyyatı idarə edir, mürəkkəb riyazi məsələləri həll edir, bir dildən başqa
dilə tərcümə edir, qədim və şifrələnmiş mətnləri aça bilir, strateji məsələləri həll edir, şahmat oynaya bilir.
Artıq zehni əməyin bəzi sahələrinin avtomatlaşdırılmasının mümkünlüyü bir daha sübut olundu.
Əlbəttə, hesablama maşınlarının tətbiq dairəsi və fəaliyyəti maşının özündə deyil, insanların qarşıya
qoyduğu məsələlərdən və tətbiq etdiyi proqramdan asılı idi.
Buna görə də, ilk növbədə insanın təfəkkür prosesini dərindən araşdırmaq, onun mahiyyətini açıb
hesablama maşınlarında modelləşdirmək imkanı əldə olunmalıydı. Bu isə, o qədər də asan məsələ olmayıb böyük
zəhmət tələb edən işdir.
Hal-hazırda neyrofiziologiyanın nailiyyətləri idrak prosesinin dərk edilməsi üçün baza yaratmışdır.
Təbii olaraq qarşıya belə bir sual çıxır: madam ki, idrak prosesi modelləşdirilir, onda «İntellektual»
elektron hesablama maşınları yaratmaq olarmı? Bunun üçün ilk növbədə təfəkkür prosesinin qanunauy-