Regresijos lygties statistinio reikšmingumo įvertinimas
Taikant regresinę analizę neužtenka įvertinti, kiek priklausomojo kintamojo kitimo paaiškina nepriklausomų kintamųjų veikimas. Logiška, kad atlikus mažai stebėjimų daryti išvadas apie daugelio veiksnių įtaką, net ir turint aukštą determinacijos koeficientą nėra patikima. Pvz., turint tik pusmečio, t.y., 6 stebėjimų duonos kainos priklausomybę nuo išteklių kainų regresijos vertinimai nėra patikimi. Norint žinoti, ar galima pasikliauti apskaičiuota regresiniu modeliu, yra atliekama regresijos statistinio reikšmingumo tikrinimo procedūra, naudojant Fišerio testą. Tuo tikslu skaičiuojama F statistika,
kur α- pasirinktas reikšmingumo lygmuo, k ir n-k-1 yra atitinkami laisvės laipsnių skaičiai F-statistikos skaitiklyje ir vardiklyje.
Jei pagal regresiją apskaičiuota F statistika yra didesnė už pasirinkto reikšmingumo
lygmens teorinę Fk, ,n-k-1 skirstinio reikšmę, tai apskaičiuota regresija yra statistiškai reikšminga.
Hipotezės tikrinimo procedūr tradiciškai susideda iš keturių žingsnių:
1. žingsnis. Iškeliam hipotezes:
H0: 1 =2 =… =k = 0, (visi parametrai prie nepriklausomų kintamųjų yra lygūs 0 t.y., regresija yra nereikšminga, nes nė vienas veiksnys neįtakoja priklausomojo kintamojo)
HA: bent vienas iš parametrų j nėra lygus 0 (regresija statistiškai reikšminga, nes yra bent vienas veiksnys, kuris įtakoja priklausomą kintamąjį)
2 žingsnis Apskaičiuojama pagal formulę F statistikos reikšmė ir laisvės laipsnių skaičius k, ir n-k-1.
3 žingsnis Apskaičiuotą faktinę F reikšmę lyginame su pasirinkto reikšmingumo, pvz., 5 proc. (=0,05), teorine Fk,n-k-1 reikšme iš F-skirstinio lentelių (žr. priedus 8)
4 žingsnis Išvada. Jeigu Fapskaičiuota > Fk,n-k-1 , tuomet su 95% pasikliovimo lygmeniu atmetame nulinę hipotezę, jog regresija yra statistiškai nereikšminga ir priimame alternatyvią, kad bent vienas nepriklausomas kintamasis įtakoją nagrinėjamą kintamąjį. Jeigu yra priešingai ,t.y., Fapskaičiuota < Fk,n-k-1 , tuomet negalime atmesti H0 hipotezės, kad kintamųjų priklausomybė yra statistiškai nereikšminga.
Visa reikiamus regresijos statistinio reikšmingumo tikrinimui reikalingus rodiklius galima matyti Excel –Regression skai
iavimų išklotinės (priedai 4,5) antroje lentelėje ANOVA
ANOVA
|
|
|
|
|
|
|
Df-laisvės laipsniai
|
SS-kvadratinių nuokrypių sumos
|
MS (Stulpelis SS/df-laisvės laipsnių)
|
F – apskaičiuota
|
Reikšmingumo lygmuo F
|
Regression (E)
|
3
|
2,409
|
0,803
|
225,772
|
0,000
|
Residual ( R)
|
32
|
0,114
|
0,004
|
|
|
Total (T)
|
35
|
2,523
|
|
|
|
Determinacijos koeficientas yra apskaičiuojamas iš SS stulpelio duomenų
R2=ESS/TSS2,409/2,523=0,955, o FapskaičiuotaEMS/RMS=0.804/0.004225.772
Regresijos statistinio reikšmingumo hipotezei patikrinti atliekami tokie žigsniai:
1. žingsnis. Tikriname hipotezę, ar regresinis ryšys yra statistiškai reikšmingas:
H0: visi parametrai j =0, prie kintamųjų (mūsų pavyzdyje turime 3 nepriklausomus kintamuosius xrugių kaina, xdyzelino kaina ir xdarbo užm ) yra statisiškai nereikšmingi
HA: bent vienas iš parametrų j, nėra lygus 0 (regresija statistiškai reikšminga)
2 žingsnis Apskaičiuojame pagal formulę statistikos Fapskaičiuota reikšmę, ir laisvės laipsnius :k=3 ir n-k-1=36-3-1=32 laisvės laipsniai:
3 žingsnis Fapskaičiuota reikšmę lyginame su 5 proc. (=0,05) reikmingumo teorine
F3,32 =2,92 reikšme iš F-skirstinio lentelių (žr. priedus8). Matome, kad
Fapskaičiuota =225,772> F3,32= 2,92
4 žingsnis Išvada. Su 95% pasikliovimo lygmeniu atmetame nulinę hipotezę ir priimame alternatyvią hipotezę, kad bent vienas veiksnys reikšmingai įtakoja duonos kainą, t.y., modelis yra statistiškai reikšmingas
Prisimename, kad regresinį modelį sudaro regresijos lygtis – tai sisteminė modelio dalis ir paklaidos -atsitiktinė modelio dalis. t.y.,
Yi =f(X1; X2; …X1k) + ɛi
Sisteminė dalis Atsitiktinė dalis
Kaip ir buvo minėta, adekvatus ir patikimas modelis bus tuomet, kai modelyje dominuos sisteminė dalis, t.y., kai ji bus statistiškai reikšminga. Taip pat modelyje yra labai svarbu patikrinti ir modelio paklaidas. Sudarytas modelis bus adekvatus ir patikimas tuomet, kai o paklaidos bus atsitiktinis dydis, kurio kitimas nepriklauso nuo jokių dėsningumų. Kitais žodžiais tariant modelio paklaidos turi tenkinti klasikines modelio prielaidas, kurios yra nurodytos konspekto 19psl.o, šioje lentelėje pateikiamos tik tos, kurios susijusios su modelio paklaidomis.
Prielaida
|
Prielaidos simbolinė išraiška
|
II. Paklaidų vidurkis lygus nuliui (nulinis vidurkis)
|
E(i) = 0
|
III. Paklaidos neautokoreliuoja (likučių ne autokoreliacijos) , t.y, paklaidos tarpusavyje nėra susijusios ir nestebimi sklaidos dėsningumai.
|
Cov(i j) = 0, i,j / ij
|
IV. Paklaidų dispersija yra pastovi (ne heteroskedastiškumas) Didėjant nepriklausomų kintamųjų reikšmėms, priklausomojo kintamojo sklaidos intervalas išlieka pastovus.
|
2(i) = konstanta
|
VI. Paklaidos pasiskirsčiusios pagal normalųjį skirstinį (normalumas).
|
i ~ N (0, 2)
| |
Dostları ilə paylaş: |