Inglizcha so’z shakllarning grammatik chappa lug’ati fragmenti (ushbu
lug’at 54000 leksik birlikni o’z chiga oladi)
So’z Grammatik ma’lumot
OT (Noun)
Sifat (Adjective)
Fe’l (Verb)
America 0/11
morphologic 0/21
tightened 0/2433
Africa 0/11
epidemiologic 0/21
shortened 0/2433
Corsica 0/11
physiologic 0/21
fastened 0/2433
Arctica 0/11
immunologic 0/21
moistened 0/2433
Antarctica 0/11
hydrologic 0/21
flattened 0/2433
Casablanca 0/11
geohydrologic 0/21
aligned 0/2433
Canada 0/11
paleohydrologic 0/21
standardize 0/32
transcanada 0/11
micrometeorologic 0/21
focalize 0/32
Granada 0/11
metrologic 0/21
realize 0/32
Nevada 0/11
neurologic 0/21
specialize 0/32
Andromeda 0/11
paleontologic 0/21
commercialize 0/32
Florida 0/11
allergic 0/21
rationalize 0/32
Propaganda 0/11
readable 0/21
neutralize 0/32
addenda 1/11
achine-readable 0/21
visualize 0/32
agenda 0/11
degradable 0/21
conceptualize 0/32
thermobalance 0/11
biodegradable 0/21
stabilize 0/32
microbalance 0/11
upgradable 0/21
utilize 0/32
heatbalance 0/11
decidable 0/21
straightening 0/142444
resemblance 0/11
undecidable 0/21
heightening 0/142444
surveillance 0/11
formidable 0/21
brightening 0/142444
ambulance 0/11
avoidable 0/21
whitening 0/142444
conformance 0/11
artifical 0/21
fastening 0/142444
performance 0/11
strategical 0/21
listening 0/142444
high-performance 0/11
pedagogical 0/21
peculiarities 3/11
maintenance 0/11
logical 0/21
similarities 3/11
standartization 0/11
mineralogical 0/21
polarities 3/11
stochastization 0/11
pharmacological 0/21
multipolarities 3/11
analyzation 0/11
gynecological 0/21
micropolarities 3/11
radioabsorbtion 0/11
silent 0/21
particularities 3/11
action 0/11
excellent 0/21
regularities 3/11
co-action 0/11
repellent 0/21
singularities 3/11
113
reaction 0/11
violent 0/21
stabilizes 1/32
prereaction 0/11
turbulent 0/21
utilizes 1/32
photoreaction 0/11
Ravish (Adverb)
minimizes 1/32
trigger 0/11
profoundly 0/41
optimizes 1/32
debugger 0/11
upwardly 0/41
maximizes 1/32
plugger 0/11
outwardly 0/41
customizes 1/32
tiger 0/11
nicely 0/41
reorganizes 1/32
anger 0/11
largely 0/41
recognizes 1/32
changer 0/11
likely 0/41
specify 1/32
histler 0/11
unlikely 0/41
modify 1/32
hustler 0/11
extremely 0/41
qualify 1/32
settler 0/11
timely 0/41
implify 1/32
bottler 0/11
germetically 0/41
unify 1/32
transmitter 0/11
genetically 0/41
clarify 1/32
knitter 0/11
diamagnetically 0/41
OT (Noun)
plotter 0/11
geomagnetically 0/41
contractions 1/11
slotter 0/11
OT (Noun)
abstractions 1/11
relevancy 1/11
endings 1/11
attractions 1/11
conservancy 1/11
findings 1/11
extractions 1/11
adjacency 1/11
disbondings 1/11
transactions 1/11
complacency 1/11
surroundings 1/11
mperfections 1/11
dependency 1/11
soundings 1/11
objections 1/11
interdependency 1/11
codings 1/11
isolators 1/11
tendency 1/11
encodings 1/11
translators 1/11
agency 1/11
oxidizer 0/11
turbulators 1/11
interagency 1/11
localizer 0/11
calculators 1/11
analogy 1/11
demineralizer 0/11
circulators 1/11
trilogy 1/11
neutralizer 0/11
ecology 1/11
equalizer 0/11
oncology 0/11
stabilizer 0/11
Morfologik analizning mantiqiy davomi sintaktik analiz hisoblanadi.
Sintaktik analiz morfologik analiz ustiga quriladi. Bunda sintaktik analiz turli xil
modellar asosida amalga oshirilishi mumkin. Ularning ichida formal grammatika
asoschisi bo’lgan Noam Chomskiy belgilagan algoritm o’zining optimalligi bilan
boshqa sintaktik modellardan ajralib turadi. Matnning avtomatik sintaktik analizi
masalasi XX asrning 50-yillarida bir tildan boshqa tilga kompyuter yordamida
tarjimani amalga oshiruvchi tizimlarga oid tadqiqotlar bilan uzviylikda
o’rganilgan. Zero matn tarjimasida gaplarning sintaktik strukturasi, sintaktik
aloqasi hal qiluvchi ahamiyat kasb etadi. Dastlabki sintaktik analiz protseduralari
ancha cheklangan bo’lib, unda faqat gapning strukturasi analizi e’tiborga olingan,
bunda har qanday gap so’zlarning muayyan ketma-ketligi asosida tashkil topgan
qurilma sifatida baholangan. Gap strukturasining formallashgan modeli sifatida
odatda tobelik daraxti (sentence tree)dan foydalanilgan.
86
Shuni alohida ta’kidlash
zaruri, sintaktik analizning samaradorligi hozirgi kunda juda yuqori saviyada, ular
86
Jurafsky D., Martin J.H.
Speech and Language Processing. - New Jersey, 2000. – P. 353.
114
faqat avtomatik tarjima sistemasi ishlab chiqilgan tillarda maksimal darajada
ishlatilmoqda. Lekin haligacha gapning to’laqonli semantik analizi yuzasidan
sezilarli natijalarga erishilgani yo’q. Bu muammo kompyuter lingvistikasidagi
ko’plab muammolar bilan tutashib ketadi. Jumladan, inson tafakkurini
modellashtirish, sun’iy intellekt tizimi, semantik freym, Word-net kabilar. Agar
sanab o’ilgan muammolar o’z yechimini topsa, shundagina semantik va konseptual
analizning avtomatik tizimi ham to’laqonli ishlaydi.
Kompyuterdagi avtomatik tarjima kompyuter lingvistikasining eng
zamonaviy yo’nalishlaridan biri hisoblanadi. Hozirgi kunda dunyoda keng
tarqalgan jahon tillari uchun avtomatik tarjima dasturlari ishlab chiqilgan.
Jumladan, ruschadan inglizchaga, inglizchadan ruschaga, ruschdan fransuzchaga
yoki aksi tarzida dasturlar yaratilgan. Bunday dasturlar sirasiga SOCRAT,
PROMPT, MAGIC GOODDY kabilar kiradi. Ular 2 xil ta’minotga asoslanib
ishlaydi: 1) lingvistik ta’minot – bunda mavjud tillarning umumiy leksikoni
kiritiladi, uning grammatikasi joylashtiriladi, bir so’z bilan aytganda, ma’lumotlar
bazasi yaratiladi; 2) programmaviy ta’minot – bunda bir tildan ikkinchi tilga
tarjima qilish algoritmi va kompyuter analizi ishlab chiqiladi (maxsus
programmalashtirilgan tillar yordamida).
Avtomatik tarjimaning ishlash algoritmi quyidagicha bo’ladi:
1.
Boshlanish – dasturlar paneli va menyu satri ko’rinadi.
2.
Ishlash rejimi tanlanadi. (tarjimaning yo’nalishi - inglizchadan
ruschaga yoki ruschadan inglizchaga).
3.
Jumla kiritiladi va xotiradagi kodi qidirib topiladi.
4.
Topilgan kod maxsus dasturlar yordamida qayta ishlanadi va tarjima
oynada paydo bo’ladi.
5.
Joriy rejimda ishlashni davom ettirish haqida so’raladi.
6.
Dasturni yopish haqida savol so’raladi.
7.
Dastur yopiladi.
Avtomatik tarjimada samaradorlikning yuqori bo’lishiga tabiiy tillarning
ayrim jihatlari – polisemiya (ko’p ma’nolilik), omonimlik, frazeologizmlar,
idiomalar, paremalar, troplar to’sqinlik qiladi. Shularni istisno qilganda hozirda
avtomatik tarjima yo’nalishida yuqori samaradorlikka erishilgan. Hatto hozirda
faqat avtomatik tarjima yo’nalishiga bag’ishlangan saytlar ham yaratilgan. Bu
avtomatik tarjimaning keng qamrovda taraqqiy etayotgan sohalardan ekanligini
ko’rsatib turibdi.
Hozirgi kunda inglizcha-o’zbekcha va o’zbekcha-inglizcha kompyuter
tarjimasi dasturlari juda katta ahamiyatga ega. Ma'lumki, ingliz va o’zbek tillari
leksik-grammatik xususiyatlariga ko’ra bir-biridan tubdan farq qiladi. O’zbek tilida
gap qurilishi SOV (Ega+To’ldiruvchi+Kesim) qolipida bo’lsa, ingliz tilida SVO
115
(Ega+Kesim+To’ldiruvchi) qolipidadir; o’zbek tili agglyutinativ tillar sirasiga
kiradi, ingliz tili esa flektiv til hisoblanadi. Shuning uchun ingliz tilidan
o’zbekchaga va o’zbekchadan inglizchaga kompyuter tarjimasini yaratish o’ziga
xos qiyinchliklarni keltirib chiqaradi. Bugungi kunda rus tili vositasida ingliz
tilidan o’zbek tiliga avtomatik tarjima qiluvchi dasturlarning versiyalari e’lon
qilingan.
Ammo biz taklif qilayotgan ingliz tilidan o’zbek tiliga kompyuterda tarjima
qilish dasturi vositachi tilsiz amalga oshiriladi. Ta'kidlash lozimki, mazkur ish
gaplarning sintaktik analiz qilish algoritmlari va formal modellari bazasi asosida
amalga oshiriladi.
Ingliz tilidan o’zbek tiliga kompyuterda tarjima qilish algoritmi quyidagi
vazifalarni hal qilish uchun mo’ljallangan:
I.I. Analiz-bunda ingliz tilidagi gap quyidagi soddalashtirilgan model
ramkasida sintaktik tahlil qilinadi.
1.1. Ushbu model faqat sodda gaplarni qamrab oladi.
2. Gapning har bir bo’lagi bitta so’zdan iborat bo’ladi.
3. Gaplarda aniqlovchilar bo’lmaydi.
4. Gaplarning
standart
tiplari
ko’rib
chiqiladi
(darak
gap
(ega+kesim+to’ldiruvchi+hol), so’roq, inkor va so’roq-inkor gaplar).
5. Fe'lning quyidagi tuslanishli shakllarni qamrab oluvchi kesimli gaplar
ko’rib chiqiladi:
a) shaxs (I, II, III shaxs);
b) son (birlik va ko’plik);
v) zamon (o’tgan, hozirgi, kelasi);
g) harakat tipiga ko’ra (Simple)
d) maylga ko’ra (Indicative)
e) nisbatga ko’ra (Active)
II. Tarjimada gaplar ingliz tilidan o’zbek tiliga o’giriladi.
Algoritm quyidagi bosqichlardan tashkil topadi:
1) gap kiritiladi;
2) gapning har bir so’zi massivining elementlariga qo’shiladi;
3) massivining elementlari yordamida lug’at elementlari bilan
taqqoslanadi, bu lug’atda olmosh, ko’makchilar, ko’makchi va modal fe'llar,
artikllar va noto’g’ri fe'llar ro’yxati mavjud bo’ladi;
4) agar so’zlar yordamchi lug’atda topilmasa, unda taqqoslash maxsus
lug’at yordamida davom ettiriladi;
5) topilgan so’zlar yordamchi lug’atga beriladi, bu yerda so’zga ushbu
so’zni va uning tarjimasini saqlovchi kod beriladi;
116
6) bunday so’z lug’atlarda mavjud bo’lmasa, so’z shakl yasovchi
affikslardan ajratib olinadi va 5-ish bajariladi;
7) agar so’zlar yordamchi va maxsus lug’atlardan topilmasa, ushbu
so’zning yo’qligi haqida ma'lumot kiritiladi;
8) gap 2 guruhga bo’linadi: kesimgacha bo’lgan so’zlar ega guruhiga
kiradi (ega guruhiga ega);
9) kesimdan boshlanib gapning oxirgacha bo’lgan so’zlar kesim guruhi
hisoblanadi (kesim guruhiga: kesim, to’ldiruvchi, hol);
10) kesim guruhidan kesim ajratib olinadi;
11) so’ngra to’ldiruvchi ajratiladi;
12) gapning qolgan qismi hol hisoblanadi;
13) gapning har bir bo’lagi shakl yasovchi qo’shimchalarsiz tarjima
qilinadi;
14) tarjima qilingan gap bo’laklaridan o’zbek tilidagi gap tuziladi, u albatta
ingliz tilidagi gap konstruksiyasiga mutanosib bo’ladi;
15) o’zbek tilidagi so’zlarga ingliz tilidagi so’zlarga mutanosib ravishda
affiks va qo’shimchalar qo’yib chiqiladi;
16) tarjima chiqarib beriladi ("tarjima" rejimida);
17) analiz chiqarib berilad ("analiz" rejimida).
Dostları ilə paylaş: |