Oʻzbek tili uchun teglangan korpus yaratish”



Yüklə 0,5 Mb.
səhifə24/26
tarix05.04.2023
ölçüsü0,5 Mb.
#104313
1   ...   18   19   20   21   22   23   24   25   26
001 DISSERTATSIYA 2022 SOBIROV cop 21.06 (1)

III bob boʻyicha xulosa

Ushbu bobda teglangan matn, uning tuzilishi, izohlangan gaplar statistikasi oʻrganib chiqildi. Teglangan korpusning umumiy tuzilishi, unda qoʻllanilgan teglarning turlari, ularning joylashish tartibi koʻrib chiqildi. Soʻz turkumlarini teglashda kelib chiqadigan muammolar, ularning yechimlari tahlil qilindi. Bir qator olimlarning teglangan korpus hosil boʻlishi uchun zarur shartlari keltirib oʻtildi. Hosil boʻlgan algoritmlar yordamida teglash jarayonining qay tarzda amalga oshirilishini, soʻz turkumlari hamda gap boʻlaklari qanday qism teglaridan iborat ekanligi aytildi. Teglangan korpusning umumiy koʻrinishi, qanday tahlil qilinishi koʻrib chiqildi.


Bizning hozirgi korpusimizda jami 14 kategoriyaga mansub boʻlgan 1003 ta gap hamda 6078 ta soʻz va soʻzlar birikmasida morfologik hamda sintaktik teglash amalga oshirildi.


XULOSA
Ushbu magistrlik dissertatsiyasi oʻzbek tilining teglangan korpusi dasturiy ta’minotini yaratishga bagʻishlangan boʻlib, u kirish, uchta bob va foydalanilgan adabiyotlar roʻyxatidan iborat.
Birinchi bobning birinchi paragrafida korpuslar, xususan teglangan korpuslar haqida ma’lumotlarni oʻrganish masalasi qoʻyilgan va shuning uchun hozirgacha yaratilgan boshqa tillarning teglangan korpuslari oʻrganib chiqilgan, zamonaviy teglangan korpuslarning turlari va xususiyatlari haqidagi ma’lumotlar oʻrganib chiqilgan. Oʻrganilgan materiallar asosida oʻzbek tili uchun teglangan korpus yaratish metodi shakllantirilgan va shu asosda oʻzbek tili uchun teglangan korpus yaratish masalasi qoʻyilgan.
Ikkinchi bob uchta paragrafdan iborat boʻlib, korpuslarni teglash usullari oʻrganib chiqilgan. Undan tashqari korpus tilshunosligi uchun muhim tadqiqot manbasi hisoblangan matnlarni izohlash uchun yaratilgan teglar koʻrib chiqilgan. Oʻzbek tili teglangan korpusi tuzish tamoyilini yaratish masalasi oʻrtaga tashlangan. Korpusdagi yigʻilgan matnlarni belgilab chiqish uchun maxsus sayt bilan hamkorlik yoʻlga qoʻyildi. Oʻzbek tilining teglangan korpusini yaratish maqsadida 103 ta morfologik hamda 15 ta sintaktik teg ishlab chiqildi.
Uchinchi bob uchta paragrafdan iborat boʻlib, ushbu bobda teglangan korpus yaratilish jarayoni, korpusning tarkibiy tuzilishi hamda uning statistik tahlili bayon qilingan Yaratilayotgan oʻzbek tilining teglangan korpusining strukturasi va undagi soʻzlar hamda gaplar soni toʻgʻrisidagi ma’lumotlar aniqlangan.
Yuqorida ishlab chiqilgani aytilgan teglar asosida umumiy hisobda 1003 ta gap hamda 6078 ta soʻz va soʻzlar birikmasi izohlab chiqildi.
Teglangan korpusni yaratish uchun har xil janrlarga tegishli matnlarni yigʻish va foydalanish uchun darakchi.uz sayti rahbariyatidan ruxsat olingan va shu asosda teglangan korpus matnlari yigʻilgan.



Yüklə 0,5 Mb.

Dostları ilə paylaş:
1   ...   18   19   20   21   22   23   24   25   26




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə