Regresinė analizė: samprata ir turinys


Ryšio determinuotumo samprata



Yüklə 0,54 Mb.
səhifə6/9
tarix14.09.2018
ölçüsü0,54 Mb.
1   2   3   4   5   6   7   8   9

Ryšio determinuotumo samprata


Įvertinti atskirus regresijos parametrus, nustatyti jų reikšmingumą yra tik pradinis regresinės analizės etapas. Toliau reikia nagrinėti, kokia dalimi regresinė funkcija paaiškina priklausomojo kintamojo reikšmių išsibarstymą apie vidurkį. Kuo regresinė lygtis tiksliau aprašo priklausomojo kintamojo pokyčius, tuo ryšys yra labiau determinuotas. Ryšio determinuotumas nustatomas tarpusavyje lyginant regresija ir vidurkiu paaiškinamą stebėjimų išsibarstymą (žr. pav. apačioje) - kuo didesnę stebėjimo nuokrypio nuo vidurkio dalį paaiškina regresija, tuo regresinis ryšys yra geriau determinuotas.

Regresija paaiškinta ir nepaaiškinta stebėjimo dalis



Nagrinėjant atskirą stebėjimą galima matyti, jog jo reikšmės nuokrypis nuo vidurkio suskyla į dvi dalis:



Bendras Regresija Nepaaiškinta

nuokrypis paaiškinta dalis dalis
kur,– i-tojo stebėjimo apskaičiuota pagal regresijos lygtį reikšmė y stebėjimų vidurkis,

yi –faktinė priklausomojo kintamojo i-ojo stebėjimo reikšmė.

Pakėlus kvadratu visus tris viršuje esančios lygybės narius bei susumavus visų stebėjimų reikšmes gauname tokią lygybę:

Bendrieji svyravimai regresija paaiškinta nepaaiškinta dalis

(TSS) dalis (ESS) (RSS)

Regresijos ryšio determinuotumas skaičiuojamas, lyginant regresija paaiškintos dalies ir bendrų svyravimų santykiu:




kur ( yi -y)2 faktinių yi reikšmių nuokrypių nuo vidurkio kvadratų suma, ( -y)2 pagal regresijos lygtį apskaičiuotų reikšmių nuokrypių nuo vidurkio kvadratų suma.

Šis rodiklis yra vadinamas determinacijos koeficientu, jis parodo, kurią dalį priklausomojo kintamojo svyravimų apie vidurkį , galima paaiškinti į regresiją įtrauktų kintamųjų svyravimais.


Kai regresija paaiškina visą faktinių priklausomojo kintamojo reikšmių išsibarstymą apie vidurkį, determinacijos koeficientas įgyja vieneto reikšmę (R2=1). Kuo mažesnę stebėjimų nuokrypių nuo vidurkio dalį regresinis ryšys paaiškina, tuo determinacijos koeficiento reikšmė artimesnė nuliui (visiško nepaaiškinimo atveju R20). Taigi determinacijos koeficiento reikšmė gali būti tarp 0 ir 1.Kuo arčiau vieneto yra determinacijos koeficiento reikšmė, tuo nepriklausomi kintamieji stipriau įtakoja priklausomą kintamąjį . Pvz. determinacijos koeficiento reikšmė R2=0,75, rodo, kad 75 proc. priklausomojo kintamojo pokyčių sąlygoja nepriklausomų veiksnių kitimas.

Tiesinės regresijos atveju determinacijos koeficiento kvadratinė šaknis lygi koreliacijos koeficientui (R2 = r). Netiesinio ryšio atveju ši lygybė negalioja.

Determinacijos koeficientas dažnai naudojamas, norint parinkti tinkamiausią regresijos lygtį. Tačiau jis turi vieną trūkumą - daugėjant regresijoje nepriklausomų veiksnių skaičiui, determinacijos koeficientas visuomet didėja. Nesvarbu, ar naujai įtrauktas veiksnys yra statistiškai reikšmingas, ar ne.Norint išvengti šio trūkumo, yra skaičiuojamas koreguotas determinacijos koeficientas. Šis koeficientas žymimas ir skaičiuojamas pagal formulę: (R2 = r). Netiesinio ryšio atveju ši lygybė negalioja.



Determinacijos koeficientas dažnai naudojamas, norint parinkti tinkamiausią regresijos lygtį. Tačiau jis turi vieną trūkumą - daugėjant regresijoje nepriklausomų veiksnių skaičiui, determinacijos koeficientas visuomet didėja. Nesvarbu, ar naujai įtrauktas veiksnys yra statistiškai reikšmingas, ar ne.Norint išvengti šio trūkumo, yra skaičiuojamas koreguotas determinacijos koeficientas. Šis koeficientas žymimas ir skaičiuojamas pagal formulę:
kur n – stebėjimų skaičius, k – regresijos nepriklausomų kintamųjų skaičius. Todėl koreguotas determinacijos koeficientas yra taikomas patikrinti ar papildomai įtraukus veiksnį į regresinį modelio jo determinuotumas padidėjo, t.y., ar naujos lygties yra didesnis už pradinės lygties.


Excel skaičiuoklė visus tris determinacijos koeficientus pateikia kartu su kitais regresijos skaičiavimais. Šie rodikliai yra pateikti Regression skaičiavimo išklotinės lentelėje Regression statistics. Dauginės koreliacijos koeficientas Multiple R, determinacijos koeficientas R Square, o koreguotas determinacijos koeficientas Adjusted R.

Pavyzdyje apie duonos kainų priklausomybę yra tokie determinacijos rodikliai







TS- Tiesinis modelis

LN-ogaritmins modelis

Dauginės koreliacijos koeficientas Multiple R,

0,98

0,98

determinacijos koeficientas R Square

0,97

0,97

koreguotas determinacijos koeficientas Adjusted R.

0,96

0,96

Abiejų modelių determinuotumo rodikliai yra aukšti. t.y.,R2 =0,97 reikšmė rodo, kad 97 proc. visų duonos kainų svyravimų apie vidutinę nagrinėjamo periodo reikšmę galima paaiškinti įtrauktų veiksnių: rugių ir dyzelino kainų bei darbo užmokesio kitimu. Dauginės koreliacijos koeficientas yra labai artimas vienetui, o tai patvirtina išvadą apie stiprų sąryšį. Koreguotą determinacijos koeficientą galima buvo panaudoti atmetant regresijoje nereikšmingus veiksnius.

Pateiktame kainos priklausomybės pavyzdyje yra akivaizdu, kad TS- tiesinis ir LS logaritminis modeliai yra gerai determinuoti. Tačiau praktikoje dažnai apskaičiavus modelį, pasitaiko determinacijos koeficiento reikšmės 0,5 arba 0,33. Kyla klausimas, kokią išvadą turėtų daryti tyrėjas apie tokį modelio determinuotumą. Išvados gali būti skirtingos Jeigu modelyje yra įtraukta mažai stebėjimų, tuomet tokio determinuotumo, žinoma, nepakanka, o jeigu stebėjimų daug, tuomet tokio determinuotumo gali ir pakakti. Konkretų atsakymą į šį klausimą galima gauti atlikus regresijos bendrojo statistinio reikšmingumo testą,




Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9


Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©genderi.org 2017
rəhbərliyinə müraciət

    Ana səhifə