Kompyuter tizimlati kafedrasi Ma’lumotlarning intelektual tahlili fani bo’yicha Amaliy ish №1 Mavzu



Yüklə 379,36 Kb.
Pdf görüntüsü
tarix07.01.2023
ölçüsü379,36 Kb.
#98306
2115-18 Muxtarova Aziza MIT amaliy1



O`ZBEKISTON RESPUBLIKASI AXBOROT TEXNOLOGIYALARI VA 
KOMMUNIKATSIYALARINI RIVOJLANTIRISH VAZIRLIGI MUHAMMAD 
AL-XORAZMIY NOMIDAGI TOSHKENT AXBOROT TEXNOLOGIYALARI 
UNIVERSITETI 
 
Kompyuter tizimlati kafedrasi 
Ma’lumotlarning intelektual tahlili fani bo’yicha 
Amaliy ish №1 
Mavzu: 
Bo'sh qiymatli datasetlarni to'ldirish yoki ularni tushirib qoldirish
Bajardi: 215-18 guruh talabasi 
Muxtarova Aziza 
Tekshirdi: Ochilov Temur 
 
 
 
 
 
 
 
Toshkent 2021 


 
Laboratoriya ishi №3 
Mavzu: 
Bo'sh qiymatli datasetlarni to'ldirish yoki ularni tushirib qoldirish
 
Ishdan maqsad: 
Ma’lumotlar to’plamini optimallashtirishda 
Pandas
kutubxonasining dropna()
 
modulidan foydalanib bo’sh qiymatlarni tushirib 
qoldirishni tashkillashtirish. Ustunlardagi kategoriyali ma’lumotlarni ushbu 
ustundagi eng ko’p takrorlangan qiymat(mode) bilan to’ldirish. Boshqa qiymatlarni 
esa ushbu vaziyatga qarab ustundagi qiymatlarning mean yoki medianlari bilan 
to’ldirish
,
df.shape() 
orqali qayta ishlangan ma’lumotlar sonini chiqarish va 
bajargan ishdan xulosa chiqarish. 
Ishni bajarish 
4-variant 
iris.csv database dan foydalanib ma’lumotlarni optimallashtiramiz 
Kutubxonalarni yuklab olish: 
import numpy as np
import pandas as pd 
 
Ma’lumotlarni o’qib olish 
data=pd.read_csv('iris.csv') 
data 
1-rasm. O’qib olingan dataset ko’rinishi. 


O’qib olingan ma’lumotlar soni chiqarish 
df.shape() 
orqali 
df=pd.DataFrame(data) 
rows, columns=df.shape 
rows, columns 
Hozirgi datasetda 150ta qator, 5ta ustun mavjud ekan. Har bir ustun bo’yicha bo’sh 
qiymatlar yig’indisini chiqarish: 
df.isnull().sum() 
Qatorning 80% idan ko’p qismi mavjud bo’lmasa qatorni tushirib qoldirish
df=df.dropna(axis=0,thresh=4) 
df 
 
2-rasm. Qatorlari o’chgandan keyingi dataset. 


Qatorlarni o’chirgandan keyin 139ta qator qoldi. Qolgan ma’lumotlarni har 
bir ustuni bo’yicha bo’sh qiymatlarning yig’indisini chiqarish: 
df.isnull().sum() 
Qolgan bo’sh qiymatlarni 
mean, median, mode
lardan mosidan foydalanib 
to’ldirib chiqamiz. Sepal va Petal yaproqlarining uzunligi va enini 
mean
bilan, gul 
turini (class label) 
mode
bilan to’ldirib chiqamiz.
sepal_length=df['sepal_length'].mean() 
sepal_width=df['sepal_width'].mean() 
petal_length=df['petal_length'].mean() 
petal_width=df['petal_width'].mean() 
class_label=df['class_label'].mode().iloc[0] 
 
df['sepal_length']=df['sepal_length'].fillna(value=sepal_length) 
df['sepal_width']=df['sepal_width'].fillna(value=sepal_width) 
df['petal_length']=df['petal_length'].fillna(value=petal_length) 
df['petal_width']=df['petal_width'].fillna(value=petal_width) 
df['class_label']=df['class_label'].fillna(value=class_label) 
df 


3-rasm. Bo’sh qiymatlarni to’ldirgandan keyingi dataset ko’rinishi. 
df.isnull().sum() 
rows, columns=df.shape 
rows, columns 
Yuqorida ko’rib turganimizdek dataset ustunlarining bo’sh qoymatlari 
qolmadi. Natijada 139ta qator, 5ta ustun qoldi. 
 
 
 
 
 


Xulosa 
Bu laboratoriyani ishini bajarish davomida ma’lumotlar to’plamini 
optimallashtirish bilan tanishdim. Berilgan datasetdan pandas kutubxonasining 
dropna() modulidan foydalanib bo’sh qiymatlarni tushirib qoldirdim. Qolgan bo’sh 
qiymatlarni 
mean, mode 
larni hisoblab to’ldirib chiqdim. Bundan maqsad, qurgan 
modelimizning aniqligini oshirish.
 
 

Yüklə 379,36 Kb.

Dostları ilə paylaş:




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə