81
ishlab chiqildi.
73
Masalan, Rus tilining Milliy
Korpusi hajmi hozirgi kunda
149 million so’zdan iborat. Keyingi yillarda internet tizimining rivojlanishi
virtual
matnlar korpusi
ning yuzaga kelishiga olib keldi. Ya’ni internetdagi qidiriv
saytlari,
elektron kutubxonalar, virtual ensiklopedialar korpus vazifasini
bajarmoqda. Korpusning janri va tematik
rang-barangligi internetdan
foydalanuvchining qiziqishlariga bog’liq. Masalan, ilm-fan doirasida
Wikipedia
katta hajmdagi matnlar korpusi sifatida foydalanilmoqda.
74
Korpus lingvistikasida parallel matnlar korpusi ham muhim ahamiyat kasb
etadi.
Parallel matnlar korpusi
esa o’z navbatida badiiy asar, qo’llanma,
ommaviy
axborot vositasi nashrlari, turli xil hujjatlarning ikki yoki undan ko’p
tillardagi elektron holdagi ko’rinishlaridir. Masalan, Yevropa Ittifoqi o’zining
barcha qonun va hujjatlarini ingliz, fransuz, nemis, ispan va italyan tillarida nashr
qiladi hamda ular internet tizimiga barchaga ochiq arxiv sifatida qo’yiladi. Bunday
korpuslarning afzalligi shundaki, ular yordamida nafaqat biron bir so’z yoki
jumlaning, balki butun boshli matnlarning turli tillardagi
variantlarini bilish
imkoniyati mavjud. Xuddi mana shu imkoniyat tufayli maxsus
Dostları ilə paylaş: