Zjišťování statistické významnosti celé regresní funkce
K řešení tohoto problému používáme upraveného modelu analýzy rozptylu.
Variabilita
|
Součty čtverců
|
Stupně volnosti
|
Rozptyly
|
Testovací kritérium
|
Regrese
|
|
|
|
|
Kolem regrese
|
|
|
|
n = rozsah výběrového souboru
p = počet parametrů regresní funkce
F>Fα [(p-1), (n-p)] → zamítáme H0 a regresní funkci považujeme jako celek za statisticky významnou
Uvedený model analýzy rozptylu lze použít k testování všech typů regresních funkcí a to i vícenásobných (párových, hyperboly, paraboly, logaritmické funkce).
ODHADY
Intervalové odhady korelačních koeficientů -
pro velký výběrový soubor (n >100)
sr = odhad směrodatné odchylky souboru výběru korelačních koeficientů
-
malý výběrový soubor (n ≤ 100)
Používáme Fisherovu z – transformaci:
-
r zr
-
-
interval spolehlivosti pro zr:
-
zpětně interval pro - hodnoty hledáme obráceně než jsme hledali z
Praktické využití regresní analýzy je velice rozšířené. V časové řadě je nezávislá proměnná čas. Když korelujeme, měříme závislost 2 časových řad.
Bodový odhad
Bodový odhad b byx = byx → výběrový soubor = základní soubor
byx ± ta(n-2) .
Lze stanovit bodový i intervalový odhad pro 2. regresní koeficient bxy .
Analýza kovariance
Používá se na zhodnocení současného vlivu kvalitativního znaku i kvantitativního znaku, případně více znaků na výsledný znak kvantitativní. Jde o kombinaci analýzy rozptylu a regresní analýzy. Část zkoumaných znaků sledujeme kvalitativně a část kvantitativně.
Při analýze kovariance existuje navíc rozklad součtů součinů odchylek dvojic proměnných. Znak y je roztříděn do skupin podle hodnot kvalitativního faktoru A. Vedle toho známe ještě znak x, který je sledován pro stejné jednotky jako znak y a působí na znak y. Podmínka analýzy kovariance: nezávislost doprovodné proměnné x na znaku A.
Problémy použití:
-
jak působí dva znaky na výsledný znak
-
testování stability regresních modelů – např. roztřídění farem podle výrobních oblastí – společný model => analýza kovariance ukáže, zda je možné pracovat se společným nebo rozděleným modelem
Modifikace analýzy kovariance
Analýza rozptylů s některými prvky regresní analýzy – zkoumá vliv kvalitativního faktoru na výsledný kvantitativní faktor s vyloučením vlivu dalších kvantitativních faktorů.
Regresní analýza s některými prvky analýzy rozptylu – zkoumá vliv kvantitativních faktorů na výsledný kvantitativní znak, přičemž eliminuje vliv kvalitativních faktorů.
Analýza kovariance dvojného třídění
Využíváme 2. modifikaci analýzy kovariance. Vliv dvou kvalitativních faktorů A a C a jednoho kvantitativního faktoru X na Y. Úkolem je odhadnout efekty a a g a testovat hypotézu o nich. Důležitým předpokladem je homogenita rozptylu.
Model:
gj = efekt j-té varianty kvalitativního faktoru C
Výpočetní tabulka
Variabilita |
Součty čtverců odchylek
|
Součty součinů odchylek
|
Počty stupňů volnosti
|
Nezávisle proměnná X
|
Závisle proměnná Y
|
mezi skupinami (A)
|
|
|
|
k-1
|
mezi skupinami (C)
|
|
|
|
h-1
|
uvnitř skupin (reziduální)
|
|
|
|
(k-1)(h-1)-1
|
celkem
|
|
|
|
hk-1
|
Regresní koeficient:
Ověření statistické významnosti doprovodné regrese
F-test o shodnosti i
= definitivní odhad yx
FA > F[(k-1); (k-1)(h-1)-1] zamítáme H0 a byl prokázán vliv faktoru A.
F-test o shodnosti i
FC > F[(k-1); (k-1)(h-1)-1] zamítáme H0 a byl prokázán vliv faktoru C.
Při potvrzení doprovodné regrese lze odhadnout tyto rovnice regresních přímek:
Analýza kovariance jednoduchého třídění
Vliv jednoho kvalitativního faktoru A a jednoho kvantitativního faktoru X na výsledný kvantitativní znak Y.
Model:
yij = hodnoty závisle proměnné
= obecná konstanta společná všem pozorováním
i = efekty jednotlivých úrovní kvalitativního faktoru A
xij = hodnoty doprovodné proměnné
= regresní koeficient pro závislost y na x
eij = chyba měřená s průměrnou střední hodnotou a neznámým rozptylem
V modelu analýzy kovariance používáme tečkový způsob zápisu z analýzy rozptylů. Vstupní data uvádíme v tabulce, kde počítáme řádkové součty a průměry.
Dostları ilə paylaş: |