N
əsimi adına Dilçilik İnstitutunun Əsərləri – 2012, Xüsusi buraxılış
K.A.
VƏLİYEVA
EHTİMALİ-STATİSTİK METODLARIN
AZƏRBAYCAN DİLÇİLİYİNDƏ TƏTBİQİ
Açar sözl
ər: Ehtimal metodları, riazi statistika, tezlik lüğəti
Ключевые слова: частотные словари, вероятностный метод, выборочный
метод, математическая статистика
Key words: frequency word-book,
probabilistic methods, sampling method,
mathematical
statistics
Statistik metodların dilçilik tədqiqatlarında istifadəsi hələ 1905-ci ildən
m
əşhur dilçi İ.A.Boduen de Kurtene tərəfindən irəli sürülmüş, ondan sonra
A.M.Peşkovskiy, M.N.Peterson, E.D.Polivanov, V.V.Vinoqradov və s. alimlər
davam etdirmişlər. 1938-ci ildə Vinoqradovun dildə tezlik göstəricilərinin rolu
haqda mülahiz
əsi böyük maraq doğurmuşdur. “Müasir rus dili” kitabında o yazır
ki, “müxt
əlif kitab üslublarında və danışıqda, o cümlədən
bədii ədəbiyyatda
müxt
əlif üslub və janrlarda sözlərin işlənmə tezliyi müxtəlifdir. Bu müxtəlifliklər,
üslublar arasındakı struktur-qrammatik və eləcə də semantik fərqləri tədqiqat
prosesind
ə üzə çıxarmaqda kömək edir (1, 155-156).
Bu bar
ədə V.V.İvanovun fikri ilə razılaşmaq olar ki, sözlər, hecalar və
foneml
ər arasındakı kəmiyyət münasibətlərinin tədqiqi dillərin təsnifatının tarixi
aspektd
ə öyrənilməsinə zəmin yaradır. Misal üçün dildə təkhecalı sözlərin orta
uzunluğu morfemlərə ayrılmırsa, bu tipli dillər musiqi vurğulu dillərə mənsub olur
(vyetnam, klassik çin, m
ərkəzi Afrika dillərindən bəziləri və s.)...
Digər mövcud
qanunauyğunluqlardan biri də fonemlərin sayı ilə morfemlərin uzunluğu
arasındakı əlaqədir. Misal üçün abxaz dilinin bzib
şivəsində 81 fonem vardır. Bu
asılılıqları da tarixi müqayisəli dilçilikdə dillərin
müqayisəli-tipoloji səpgidə
öyr
ənilməsində tətbiq etmək olar (2, 176-177).
Müşahidələr göstərir ki, sözdəki fonemlərin sayı (həm fonoloji və həm də
struktur-semantik c
əhətdən) morfemlərin keyfiyyətinə təsir edir
(3,8). Bundan
başqa dilləri kəmiyyətcə öyrənərkən aşkar olunur ki, dildəki elementlərin
tezliyinin müxt
əlifliyi müəyyən statistik qanunauyğunluqlarla bağlıdır. Bu sahədə
aparılan tədqiqatlarda A.A.Markovun XIX-XX əsrlərdəki yazıçıların əsərlərində
işlənən ümumişlək sözlərin orta tezliyinin müəyyənləşdirib müəllifləri bir-biri ilə
müqayis
ə etməklə maraqlı nəticələrə gəlməsidir (4,142). Müşahidələr göstərir ki,
dilçilik
ədəbiyyatında statistik metoddan istifadədə də üstünlük tezlik lüğətlərinin
t
ərtibinə verilmişdir. Tezlik lüğəti haqqında qısa məlumat verək.
Tezlik lüğətləri adı altında xüsusi tip lüğətlər nəzərdə tutulur. Burada adi iki
dilli lüğətlərdən fərqli olaraq sözlərin siyahısı və onun ixtiyarı seçilmiş
m
ətnlərdəki işlənmə tezliyi göstərilir.
142
N
əsimi adına Dilçilik İnstitutunun Əsərləri – 2012, Xüsusi buraxılış
Dilçiliy
ə statistik metodların tətbiqi mətnlərdə sözlərin işlənmə tezliyinə
əsasən tərtib olunmuş tezlik lüğətlərin meydana gəlməsi ilə başlandı. Dünya
dilçiliyind
ə ilk statistik lüğət 1898-ci ildə tərtib edilmiş alman dilinin tezlik
lüğətidir (5,113). Müəllif bu lüğətin tərtibi üçün 11 mln.
sözdən ibarət mətnlər
seçmişdir. Bundan sonra yüzlərlə müxtəlif sistemli dillərin tezlik lüğətləri
meydana g
əlmişdir. Bu lüğətlərin geniş tərtibatı və tarixi Frumkina (6, 5-8)
t
ərəfindən verildiyindən burada onun şərhinə ehtiyac duymadığımızdan, yalnız
Az
ərbaycan dilçiliyində statistik üsulla aparılan tədqiqatları nəzərdən keçirəcəyik.
Qeyd etm
əliyik ki, tərtib edilmiş tezlik lüğətlərinin
dəqiqliyi mətnlərin həcm
v
ə seçimlərindən asılıdır. Bu seçim aşağıdakı elementar statistik düsturla təyin
olunur.
Burada N – sistemin h
əcmi
δ – nisbi x
əta
P – tezlik
Z
p
– konstata
Lakin
əksər lüğətlərdə həcm seçimi üçün bu düsturda istifadə edilmir.
Ad
ətən müəlliflər intuisiya yolu ilə həcmi müəyyənləşdirməklə məhdudlaşırlar.
Ehtimal n
əzəriyyəsində seçim – ümumi Ω çoxluğundan ehtimal metodları
il
ə seçilmiş obyektlərdən ibarət, sonlu altçoxluqdur. S-dəki obyektlərin sayı
seçimin h
əcmi adlanır. Əksər hallarda statistik seçim və seçimi təşkil edən
obyektl
ərin xarakteristikalarının qiymətlər toplusu eyniləşdirilir. Obyektlər
toplusunun (m
əs., istehsalatda ədədi məlumatları, demoqrafiyada əhaləni
araşdırmaq üçün statistik seçimlərin yaradılmasında müxtəlif ehtimali
metodlar
istifad
ə olunur (seçim araşdırma metodu bax. Ehtimal nəzəriyyəsi və riyazi
statistika ensiklopediyası, s. 2010, s. 803-804).
Qaytarmamaq şərtilə təsadüfi seçim - Ω -dan ixtiyari qaydada obyektlərin
bir-
bir ardıcıl surətdə götürülməsi ilə aparılır və seçilmiş obyektlər sonrakı
seçm
ədə iştirak etmir, seçilməmiş bütün obyektlər sonrakı seçmədə iştirak etmir,
seçilm
əmiş bütün obyektlərin seçilməsi ehtimalları eyni hesab olunur. Ω
n
elementli çoxluqdursa, onda qaytarmamaq şərtilə v həcmi seçimlərin sayı n (n-1)
... (n –r +1), (1
≤ r ≤
n) olacaqdır. Bu halda n elementli çoxluqdan r həcmli seçim
qaytarmamaq şərtilə sxemi üzrə aparılır.
Qaytarmaq şərtilə təsadüfi seçim - Ω-dan ixtiyari qaydada
seçilən obyektlər
h
ər dəfə məhz bu çoxluqdan götürülür. Belə ki, eyni bir obyekt təkrar götürülə
bil
ər. Ω
n
elementli çoxluq olarsa, qaytarmaq şərtilə n həcmli seçimlərin sayı
n.n... n = n
r d
əfə
δ =
Z
p
√ N
p
143