Statistika
-
je zpracovatelská a metodologická
-
americký statistik FISCHER, u nás profesor HÁJEK
-
instituce Český statistický úřad = evidence a výkaznictví (nejznámější je sčítání obyvatel)
Statistika je věda o sběru a zpracování hromadných údajů, nezabývá se izolovanými jevy a procesy, nikdy ne jedincem, podnikem apod. Zabývá se jevy, které se opakují.
Statistika hovoří o subjektech jako o průměrných za 1 celek (průměrný občan, průměrné zvíře).
Statistika podává svědectví o věcech minulých, souvisí s celou řadou disciplín, nejbližší vztah k matematice, která je teoretickým základem moderní statistiky.
Teorie pravděpodobnosti -
zabývá se konstrukcí zvláštního druhu matematických modelů, a to takových, které se zabývají vystižením procesů ovlivněných náhodou => základní pojem.
Statistika -
popisná – zabývá se elementárními (jednoduchými) metodami sběru a zpracování hromadných údajů
-
matematická – moderní – zabývá se složitějšími metodami sběru a zpracování hromadných údajů
-
ekonomická – na pomezí vědy společenské a metodologické => kromě matematických úvah i úvahy ekonomické
Pozn.: na agronomické fakultě se přednáší jako biometrika, v technických disciplínách se přednáší technická statistika, která je bezprostředně použitelná u technických jevů, ekonometrie = aplikovaná statistika
Popisná statistika
Jednotkou je statistický soubor (osob, podniků, institucí, zvířat, zemí, atd.). Statistické soubory jsou tvořeny statistickými jednotkami, mají vlastnosti jednoznačně vymezeny.
Statistický soubor
Konečná neprázdná množina prvků, které mají z daného hlediska podobné vlastnosti. Jde o soubor osob, věcí, zvířat.
-
základní – obsahuje všechny jednotky
-
výběrový – část základního souboru, který je určitým způsobem vybrán (pořízen) ze základního souboru
Pracujeme většinou s výběrovými soubory, práce je jednodušší a méně finančně náročná => zevšeobecnění úvah z výběrového souboru na celý soubor.
Statistické znaky
Vlastnosti statistických jednotek. Veličiny, které tvoří soubor, který sledujeme. Mohou být povahy:
-
kvantitativní – vyjádřené čísly (výška studenta v cm, hmotnost v kg)
-
spojité – znaky jsou vždy v nějakém intervalu
-
nespojité (diskrétní, izolované) – často celočíselné znaky (např. průměrný prospěch)
-
kvalitativní – slovní znaky
-
alternativní – např. pohlaví (muž – žena: pouze 2 obměny)
-
množné - nabízejí více než 2 obměny
Rozsah souboru
Počet statistických jednotek daného souboru, značí se n.
Statistický sběr
Získávání neznámých informací o znacích statistických jednotek. Výsledkem statistického zjišťování jsou neuspořádané údaje => pak navazuje fáze statistického zpracování = souhrn postupů, které by měly zpřehlednit a uspořádat údaje získané jako výsledek statistického zjišťování.
Podle provedení dělíme statistické zpracování:
-
ruční
-
strojní – pomocí počítače (výpočetní techniky)
Třídění původních neuspořádaných a nepřehledných údajů podle různých kritérií a hledisek:
JEDNOROZMĚRNÉ ROZDĚLENÍ ČETNOSTÍ Absolutní četnosti
známka
|
počet studentů
|
hodnoty znaku
|
četnosti znaku
|
1
|
27
|
2
|
124
|
3
|
94
|
4
|
78
|
Grafické vyjádření je přehledné, názorné, často pro zveřejnění (např. výsečové grafy, obrázkové grafy – piktogramy, sloupcové grafy, čárové grafy, kartogramy – grafické vyjádření pomocí mapy).
V tomto případě šlo o absolutní četnosti, ještě máme relativní četnosti.
Relativní četnosti
Kumulativní četnosti
Vznikají postupným načítáním
-
absolutní
-
relativní
Intervalové rozdělení četností
Místo hodnot četností se dávají intervaly:
|
ni
|
fi
|
140-149,9
|
2
|
2
|
150-159,9
|
12
|
14
|
160-169,9
|
41
|
55
|
170-179,9
|
84
|
139
|
180-189,9
|
111
|
250
|
190-199,9
|
90
|
340
|
Velmi často se také používají „neuzavřené intervaly“ (např. velikost do 149,9 cm nebo nad 200 cm)
Průměrná hodnota intervalu se zjišťuje podle původních hodnot intervalu, používá se často prostřední hodnota intervalu (dopouštíme se chyby, která je rovna maximálně polovině délky intervalu (některé hodnoty se totiž soustřeďují na jednom okraji intervalu)
DVOUROZMĚRNÉ ROZDĚLENÍ ČETNOSTÍ
-
třídíme podle 2 znaků (do tabulky – řádky a sloupce)
-
existují různé formy kombinačních tabulek:
-
korelační tabulka – typ, formát kombinační tabulky
-
asociační a kontingenční tabulka
TROJROZMĚRNÉ ROZDĚLENÍ ČETNOSTÍ
Téměř nepoužívané. Se souborem neuspořádaných údajů provedeme třídění do souboru absolutních nebo relativních četností (dvourozměrně, jednorozměrně).
Charakteristiky polohy (střední hodnoty)
Charakteristika = jedno číslo, jedna hodnota, která nám zastupuje statistický soubor (shrnutí údajů statistického souboru do 1 čísla)
Tato skupina charakteristik nám 1 číslem ukáže nějakou střední neboli průměrnou hodnotu znaků v souboru. Dělíme je na:
-
průměry – průměrná úroveň hodnoty znaku
-
ostatní střední hodnoty
ad a)
Dostları ilə paylaş: |