(
Машинный
фонд
русского
языка
)
hamda
Rus tilining Milliy Korpusi
(
Национальный
корпус
русского
языка
)
loyihalari ishlab chiqildi. Masalan, Rus tilining Milliy Korpusi hajmi hozirgi kunda
149 million so’zdan iborat. Keyingi yillarda internet tizimining rivojlanishi
virtual
matnlar korpusi
ning yuzaga kelishiga olib keldi. Ya’ni internetdagi qidiriv
saytlari, elektron kutubxonalar, virtual ensiklopedialar korpus vazifasini
bajarmoqda. Korpusning janri va tematik rang-barangligi internetdan
foydalanuvchining qiziqishlariga bog’liq. Masalan, ilm-fan doirasida
Wikipedia
katta hajmdagi matnlar korpusi sifatida foydalanilmoqda.
Matnning statistik tahlili
– tilni ehtimollik belgilariga tahlil qilish, til
hodisalarini statistik xarakteristikalari asosida baholash demakdir. Til birligining
gapda yoki matnda qo’llanish chastotasi (sur’ati) ehtimollik deyiladi. Til hodisalari
haqidagi haqiqatlar lingvostatistik tadqiqotlar yordamida aniqlanadi. Masalan,
o’zbek tili uchun qaysi bo’g’in strukturasi tipik ekanligini, gap modellaridan qaysi
biri eng asosiy konstruksiya ekanligini, bosh kelishikdagi otlarning asosan qaysi
gap bo’lagi vazifasida kelishini, tanlangan matnda so’z turkumlarining qay
darajada ishlatilishini aniqlash uchun lingvostatistik tahlillarga ehtiyoj seziladi.
Matnning statistik tahlili matn atributsiyasi muammosiga ham oydinlik
kiritishda muhim tadqiqot usuli hisoblanadi. Ayniqsa, badiiy matnlarni ng statistik
tahlili natijasida o’sha matn muallifi ham aniqlanmoqda. Bunda matnda tez-tez
ishlatiluvchi til birliklari (otlar, sifatlar, kalit so’zlar, fe’llar, grammatik shakllar,
jumla qurilishi, bir so’z bilan aytganda, yozuvchining idiostilini – o’ziga xos
uslubini ko’rsatuvchi vositalar) lingvostatistik tahlil yordamida aniqlanadi. Turli
matnlardan olingan dalillarning qiyosiy tahlili bizga o’sha matnning mazmun-
mundarijasini, matn tuzilgan davrni, dalillarni argumentlash xarakterini va hatto
mualliflikni aniqlashga imkon beradi. Badiiy asarlarning syujet qurilishiga, matn
strukturasiga kvantitativ metodlarning tatbiq etilishi natijasida F.Dostoyevskiy,
L.Tolstoy, M.Sholoxov kabi yozuvchilarning matnlari atributsiyasi amalga
oshirilgan. Keyingi paytlarda anonim (muallifi noma’lum) va psevdonim (soxta
muallifli) matnlarning aniqlanishi yuzasidan ham tadqiqotlar amalga oshirilmoqda.
|