Oʻzbek tili uchun teglangan korpus yaratish”



Yüklə 0,5 Mb.
səhifə1/26
tarix05.04.2023
ölçüsü0,5 Mb.
#104313
  1   2   3   4   5   6   7   8   9   ...   26
001 DISSERTATSIYA 2022 SOBIROV cop 21.06 (1)


OʻZBЕKISTОN RЕSPUBLIKASI
ОLIY VA OʻRTA MAХSUS TA’LIM VAZIRLIGI
URGANCH DAVLAT UNIVЕRSITЕTI
Qoʻlyozma huquqida
UDK 811.322

Sobirov Jasurbek Muxtor oʻgʻli


Oʻzbek tili uchun teglangan korpus yaratish”


5A120106 – Kompyuter lingvistikasi
Magistr akadеmik darajasini оlish uchun yozilgan
D I S S Е R T A T S I Y A



Ish koʻrib chiqildi


va himoyaga ruxsat berildi

Kompyuter lingvistikasi


kafedrasi mudiri:
_____ dots. Madatov X.A.
“____” _________2022-y.

Ilmiy rahbar:


____ t.f.n. M.S.Sharipov

Taqrizchi:


____ PhD Raximboyev X. J.

Urganch – 2022
MUNDARIJA
Kirish…………………………………………...….…………………………..………4

I BOB. TEGLANGAN KORPUS YARATISH TEXNOLOGIYALARI.


I.1-§. Teglangan korpus haqida ……………………………..………………………..8
I.2-§. Zamonaviy teglangan korpuslarning turlari …….….……................................12
I.3-§. Oʻzbek tili uchun teglangan korpus yaratish va uning dolzarbligi……….……17
I bob boʻyicha xulosa…………………………………………………………………19
II BOB. TEGLANGAN KORPUS YARATISH VOSITALARI
II.1-§. Korpuslarni teglash usullari……………………….……………...…….…..…21
II.2-§. Morfologik teglash………………………………………….…….…….…..…22
II.3-§. Sintaktik teglash……………….………………………………….….…...…...44
II bob boʻyicha xulosa………………………………………………………….…..…37
III BOB. TEGLANGAN KORPUS TUZILISHI
III.1-§. Teglangan korpus yordamida soʻzlarni morfologik hamda
sintaktik tahlil qilish ….…………………………………………….…….…………...52
III.2-§. Teglangan korpus tarkibiy tuzilishi……..…………………..…...…………….54
III.3-§. Teglangan korpusning statistik tahlili ……………………..…..….……...…...56
III bob boʻyicha xulosa…………………………………………….…………….….…59
XULOSA………………………………………………………….………..…….……60
ADABIYOTLAR ROʻYXATI……………..…….………..……….……...….….……61


ANNOTATION
This dissertation explores the theoretical and practical foundations of creating a tagged corpus for the Uzbek language. The issue of creating an Uzbek-language corpus has not yet been fully explored, and an appropriate corpus has not been created. In this work, the corpus, the means, methods and principles of its creation are studied. The benefits of this type of corps for Uzbek-language research are described. Based on the results obtained, certain conclusions were made. In the work, the methods of creating a tagged corpus were studied and morphological and syntactic tags were created for the Uzbek language. Based on the created tags, texts of different genres are morphologically and syntactically tagged. The designed corpus can be used to study Uzbek texts.
ANNOTATSIYA
Ushbu dissertatsiyada oʻzbek tili uchun teglangan korpus yaratishning nazariy va amaliy asoslari oʻrganilgan. Oʻzbek tili teglangan korpusini yaratish masalasi hozirgi kungacha toʻliq oʻrganilmaganligi hamda tegishli korpus yaratilmaganligi sababli ushbu masalani yechish dolzarb hisoblanadi. Mazkur ishda teglangan korpus, uni yaratish vositalari, usullari, tamoyillari oʻrganib chiqilgan. Bu turdagi korpus tuzib chiqilishi oʻzbek tilida olib borilayotgan ilmiy tadqiqotlar uchun keltiradigan foydalari bayon qilingan. Olingan natijalar asosida muayyan xulosalar qilingan. Ishda teglangan korpus yaratish usullari oʻrganib chiqilgan va oʻzbek tili uchun morfologik hamda sintaktik teglar yaratilgan. Yaratilgan teglar asosida turli xil janrlardagi matnlar morfologik va sintaktik jihatdan teglab chiqilgan. Ishlab chiqilgan teglangan korpusdan oʻzbek tilidagi matnlarni oʻrganishda foydalanish mumkin.

Yüklə 0,5 Mb.

Dostları ilə paylaş:
  1   2   3   4   5   6   7   8   9   ...   26




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə