MATERI 4
REGRESI DENGAN VARIABEL INDEPENDEN KUALITATIF
TUJUAN
Memahami dan mampu mengoperasikan regresi dengan variabel independen kualitatif (dummy variabel)
KOMPETENSI
Setelah mempelajari bab ini, mahasiswa akan dapat:
-
Memahami karakteristik dari variabel dummy
-
Memahami regresi dengan satu variabel kualitatif baik pada cross section dan time series
-
Memahami regresi dengan satu variabel kualitatif dua kategori
-
Memahami regresi dengan dua atau lebih variabel kualitatif
-
Memahami regresi linear dengan dua segmen dan perbandingan dua regresi pendekatan dummy variable
-
Memahami penggunaan variabel dummy dalam analisis musiman
URAIAN MATERI
Karakteristik dari Variabel Boneka (Dummy Variable)
Variabel dalam persamaan regresi yang sifatnya kualitatif bisanya menunjukkan ada tidaknya suatu “quality” atau “atribute’, misalnya laki atau perempuan, sarjana atau bukan, dan seterusnya.
Salah satu metode untuk mengkuantitatifkan atribut yang bersifat kualitatif tersebut adalah dengan cara membentuk variabel yang sifatnya artificial (dummy) ke dalam model persamaan regresi dengan mengambil nilai 1 (satu) atau 0 (nol).
Ketentuan pemberikan angka 1 atau 0 bisa kita pahami bahwa :
-
Beri angka 1 untuk menunjukkan adanya atribut.
-
Beri angka 0 untuk menunjukkan tidak adanya atribut.
Contoh, seseorang diberi angka 1 jika sarjana dan 0 jika bukan sarjana, nilai 1 jika laki-laki dan 0 jika perempuan, nilai 1 jika periode krisis ekonomi dan 0 jika tidak krisis ekonomi, nilai 1 untuk sesudah pemberlakuan UU dan 0 untuk sebelum pemberlakuan UU, dan lain sebagainya.
Regresi dengan Dua atau Lebih Variabel Kualitatif
Teknik persamaan regresi dengan menggunakan variabel dummy dapat diperluas seandainya kita ingin memasukkan lebih dari satu variabel kualitatif. Misalnya bahwa gaji karyawan selain ditentukan oleh masa kerja juga oleh jenis kelamin (laki-laki / perempuan), akan tetapi selain jenis kelamin sebagai variabel dummy-nya juga memasukkan variabel jenjang pendidikan, yaitu S1 atau bukan, yang mempengaruhi gaji.
Maka, model persamaan regresinya adalah :
Yi = β0 + β1 D1i + β2 D2i + β3 Xi + ei
Dimana: Yi = gaji karyawan tahunan
Xi = masa kerja karyawan (tahun)
D1i = 1 jika laki-laki
= 0, jika lainnya (perempuan)
D2i = 1, jika S1
= 0, jika lainnya
Kita perhatikan bahwa masing-masing dari dua variabel kualitatif, yaitu jenis kelamin dan tingkat pendidikan, mempunyai dua kategori atau kelas. Sehingga hanya memerlukan dua variabel dummy saja, yaitu D1 dan D2. Dalam hal ini, kategori dasarnya (the base category) adalah karyawan bukan S1.
EVALUASI
-
Apa yang dimaksud dengan variabel dummy? Dan apa gunanya?
-
Jika kita mempunyai data bulanan beberapa tahun, berapa variabel dummy yang harus kita masukkan dalam model regresi untuk menguji hipotesis berikut?
-
Semua bulan (12 bulan) dalam setiap tahunnya menunjukkan pola musiman.
-
Jika hanya bulan Maret, Juni, Agustus, dan November yang menunjukkan pola musiman.
-
Jika diperoleh suatu model persamaan regresi berikut ini terkait dengan pengaruh beberapa variabel kualitatitf terhadap penentuan sewa kamar kosan mahasiswa di Bandung adalah:
Y = 3,13 + 4,69 D1 – 2,55 D2 + 16,22 X1 + 0,48 X2
(1,44) (2,04) (1,13) (3,51) (0,25)
R2 = 0,89 (angka dalam kurung adalah standard error)
Dimana :
Y = sewa kamar kosan (satuan mata uang)
D1 = letak rumah kosan
= 1, dekat kampus
= 0, jauh dari kampus
D2 = tempat mandi di dalam kamar
= 1, jika ada tempat mandi di dalam kamar
= 0, tidak ada tempat mandi di dalam kamar
X1 = biaya renovasi (satuan mata uang)
X2 = pajak bumi bangunan (PBB) (satuan mata uang)
-
Coba Anda jelaskan maksud arti dari setiap koefisien dari regresi di atas!
-
Masuk akalkah menurut Anda jika variabel X2 dimasukkan dalam model tersebut?
-
Diketahui data pendapatan triwulanan selama 5 tahun (dalam ribu rupiah) dari pemasukan tiket masuk Kebun Binatang di Kota Bandung, diketahui juga data belum bebas dari pengaruh musiman, adalah sebagai berikut:
-
Tahun
|
TRIWULANAN
|
I
|
II
|
III
|
IV
|
1
|
22123
|
19445
|
28456
|
24278
|
2
|
20467
|
19759
|
28679
|
23668
|
3
|
24666
|
17388
|
29043
|
23677
|
4
|
23821
|
17123
|
30274
|
24116
|
5
|
24111
|
16899
|
32723
|
23994
|
Dengan mengikuti model sebagai berikut:
Yt = a0 + a1 D1 + a2 D2 + a3 D3 + et
Dimana :
Y = pendapatan
D1 = 1, untuk triwulan II
= 0, lainnya
D2 = 1, untuk triwulan III
= 0, lainnya
D3 = 1, untuk triwulan IV
= 0, lainnya
-
Buatlah regresi dari data di atas !
-
Bagaimana menginterpretasikan koefisien arah dari masing-masing variabel dummy ?
-
Bagaimana menggunakan perkiraan koefisien arah untuk membebaskan data dari pengaruh musiman ?
MATERI 5
MULTIKOLINEARITAS
TUJUAN
Menjelaskan dan memahami pelanggaran asumsi klasik : multikolinearitas
KOMPETENSI
Setelah mempelajari bab ini, Anda akan dapat:
-
Memahami sifat dan konsekuensi dari multikolinearitas
-
Memahami cara mendeteksi multikolinearitas
-
Memahami cara penyembuhan multikolinearitas
URAIAN MATERI
Sifat Multikolinearitas
Istilah kolinearitas ganda (multicollinearity) diciptakan oleh Ragner Frish di dalam bukunya: Statistical confluence analysis by means of Complete Regression System. Aslinya, istilah multikolinearitas itu berarti adanya hubungan linear yang sempurna atau eksak (perfect or exact) di antara variabel-variabel bebas dalam model regresi. Istilah kolinearitas ganda (multicollinearity) menunjukkan adanya lebih dari satu hubungan linear yang sempurna.
Konsekuensi dari Multikolinearitas
Konsekuensi sebuah model yang mengandung multikolinearitas adalah variannya akan terus naik atau membesar. Dengan varian yang semakin naik atau membesar maka standar error β1 dan β2 juga naik atau membesar. Oleh karena itu, dampak adanya multikolinearitas di dalam model regresi jika kita menggunakan teknik estimasi dengan metode kuadrat terkecil (OLS) adalah:
-
Meskipun penaksir OLS mungkin bisa diperoleh dan masih dikatakan BLUE, tapi kesalahan standarnya cenderung semakin besar dengan meningkatnya tingkat korelasi antara peningkatan variabel sehingga sulit mendapatkan penaksir yang tepat.
-
Karena besarnya kesalahan standar, selang atau interval keyakinan untuk parameter populasi yang relevan cenderung lebih besar dan nilai hitung uji statistik t akan kecil sehingga membuat variabel independen secara statistik tidak signifikan mempengaruhi variabel independen.
-
Atas dasar no.2, dalam kasus multikolinearitas yang tinggi, data sampel mungkin sesuai dengan sekelompok hipotesis yang berbeda-beda, jadi probabilitas untuk menerima hipotesis yang salah (yaitu kesalahan tipe II) meningkat.
-
Selama multikolinearitas tidak sempurna, penaksiran koefisien regresi adalah mungkin tetapi taksiran dan kesalahan standarnya menjadi sangat sensitif terhadap sedikit perubahan dalam data.
-
Jika multikolinearitas tinggi, seseorang mungkin memperoleh R2 yang tinggi tetapi tidak satupun atau sangat sedikit koefisien yang ditaksir yang penting secara statistik, jadi mutikolinearitas yang tinggi membuat tidak mungkin mengisolasi pengaruh individual dari variabel yang menjelaskan.
Cara Mendeteksi Multikolinearitas
Ada beberapa cara mendeteksi ada tidaknya multikolinearitas, yaitu melalui:
-
Nilai R2 Tinggi Tetapi Hanya Sedikit Variabel Independen yang Signifikan
-
Korelasi Parsial Antarvariabel Independen
-
Regresi Auxiliary
-
Tolerance (TOL) dan Variance Inflation Factor (VIF)
Cara Penyembuhan Multikolinearitas
-
Tanpa Ada Perbaikan
-
Ketika dihadapkan dengan multikolinearitas yang parah, satu cara yang “paling sederhana” untuk dilakukan adalah mengeluarkan satu dari variabel yang berkoliner. Tetapi dalam mengeluarkan suatu variabel dari model, kita mungkin melakukan bias spesifikasi, atau kesalahan spesifikasi.
-
Kombinasi dari cross-sectional dan time series) dikenal sebagai penggabungan (pooling the data) merupakan salah satu perbaikan ketika ada masalah multikolinearitas.
EVALUASI
-
Jelaskan apa yang dimaksud dengan kondisi multikolinearitas?
-
Jika model kita terkena multikolinearitas, apa memang pengaruhnya ?
-
Apa yang dimaksud dengan “hight” but not “perfect” multicollinearity? Masalah apa yang akan terjadi?
-
Apa yang dimaksud dengan BLUE? Masih BLUE –kah jika model kita terkena multikolinearitas?
-
Jika model kita terkena multikolinearitas, boleh tidak model tersebut kita lanjutkan saja tanpa perbaikan? Mengapa? Jelaskan!
-
Bagaimana kita dapat mengetahui suatu model terkena multikolinearitas?
-
Jika model kita kena multikolinearitas dan ingin menyembuhkannya, bagaimana cara penyembuhannya?
-
Diketahui data-data ekonomi Indonesia periode 1980-2008 sbb:
-
TAHUN
|
FDI
|
GDP
|
OPEN
|
INF
|
1980
|
5.85
|
13.26
|
48.36
|
15.97
|
1981
|
5.94
|
13.34
|
45.75
|
7.09
|
1982
|
6.13
|
13.36
|
43.40
|
9.69
|
1983
|
6.25
|
13.37
|
50.58
|
11.46
|
1984
|
5.82
|
13.44
|
42.88
|
8.76
|
1985
|
6.39
|
13.46
|
33.63
|
4.31
|
1986
|
6.19
|
13.52
|
40.79
|
8.83
|
1987
|
6.58
|
13.57
|
39.00
|
8.9
|
1988
|
6.36
|
13.62
|
39.50
|
5.47
|
1989
|
6.53
|
13.70
|
41.28
|
5.97
|
1990
|
6.56
|
13.76
|
45.87
|
9.53
|
1991
|
6.97
|
13.83
|
48.18
|
9.52
|
1992
|
7.57
|
13.89
|
48.59
|
4.94
|
1993
|
8.64
|
13.96
|
45.52
|
9.77
|
1994
|
8.24
|
14.03
|
41.46
|
9.24
|
1995
|
8.81
|
14.11
|
43.69
|
8.64
|
1996
|
8.44
|
14.18
|
41.50
|
6.47
|
1997
|
8.15
|
14.23
|
70.47
|
11.05
|
1998
|
8.49
|
14.09
|
63.97
|
77.63
|
1999
|
9.02
|
14.11
|
46.92
|
2.01
|
2000
|
9.20
|
14.14
|
72.55
|
9.35
|
2001
|
8.16
|
14.18
|
61.85
|
12.55
|
2002
|
8.03
|
14.23
|
43.37
|
10.03
|
2003
|
8.60
|
14.27
|
39.35
|
5.06
|
2004
|
8.43
|
14.32
|
47.79
|
6.4
|
2005
|
9.10
|
14.38
|
50.80
|
17.11
|
2006
|
8.70
|
14.43
|
43.72
|
6.6
|
2007
|
9.24
|
14.49
|
44.90
|
6.59
|
2008
|
9.61
|
14.55
|
50.13
|
11.06
|
Dimana :
FDI
|
=
|
Investasi asing langsung (nilai realisasi investasi asing langsung dalam bentuk ln)
|
GDP
|
=
|
Pertumbuhan ekonomi (di-proxy dengan ln PDB riil)
|
OPEN
|
=
|
Rasio ekspor dan impor terhadap PDB (keterbukaan ekonomi)
|
INF
|
=
|
Inflasi (%)
|
-
Coba Anda regresikan FDI terhadap GDP, OPEN, dan INF dengan periode mulai tahun 1980 sampai 1996. Jelaskan makna dari koefisien masing-masing variabel tersebut!
-
Uji deteksi multikolinearitas dari hasil regresi a) tersebut melalui Nilai R2 , Korelasi Parsial Antarvariabel Independen, Regresi Auxiliary, dan Tolerance (TOL) serta Variance Inflation Factor (VIF). Apakah terjadi multikolinearitas atau tidak?
-
Kemudian coba Anda regresikan kembali FDI terhadap GDP, OPEN, dan INF dengan periode mulai tahun 1980 sampai 2008. Lalu uji deteksi multikolinearitas dari hasil regresi tersebut melalui Nilai R2 , Korelasi Parsial Antarvariabel Independen, Regresi Auxiliary, dan Tolerance (TOL) serta Variance Inflation Factor (VIF). Apakah terjadi multikolinearitas atau tidak?
-
Menurut Anda mana hasil yang lebih baik, hasil regresi model a) atau hasil regresi model c) ? Jelaskan alasannya!
-
Jika model tersebut kena multikolinearitas, bagaimana cara penyembuhannya? Jelaskan !
MATERI 6
HETEROSKEDASTISITAS
TUJUAN
Menjelaskan dan memahami pelanggaran asumsi klasik : heteroskedastisitas
KOMPETENSI
Setelah mempelajari bab ini, mahasiswa akan dapat:
-
Memahami sifat dan konsekuensi dari heteroskedastisitas
-
Memahami cara mendeteksi heteroskedastisitas
-
Memahami beberapa cara mendeteksi heteroskedastisitas dengan metode formal melalui metode Park, metode Glejser, metode korelasi Spearman, metode Goldfeld-Quandt, metode Breusch-Pagan-Godfrey, dan metode White.
-
Memahami cara penyembuhan heteroskedastisitas
URAIAN MATERI
Sifat dan Konsekuensi dari Heteroskedastisitas
Satu asumsi yang penting dalam model regresi linear klasik ialah bahwa kesalahan pengganggu mempunyai varian yang sama, artinya Var () = untuk semua i, i = 1, 2, ..... n. Asumsi ini disebut HOMOSKEDASTIK (homoscedastic).
Ada beberapa alasan mengapa varians ui mungkin variabel (tidak konstan), yaitu :
-
Sejalan proses belajar (the errorlearning models) manusia, kesalahan (error) perilaku makin mengecil seiring berjalannya waktu. Dalam kasus ini, σi2 akan mengecil.
-
Dengan income meningkat, maka orang akan lebih mempunyai kebebasan dan akan lebih banyak pilihan untuk menggunakan income-nya itu. Sehingga σi2 akan meningkat sejalan dengan peningkatan pendapatannya.
-
Perbaikan teknik pengumpulan data akan menurunkan σi2
-
Kesalahan spesifikasi model, ini disebabkan:
-
Kesalahan spesifikasi model yang dikarenakan menghilangkan variabel penting dalam model.
-
Dalam fungsi permintaan jika tidak dimasukkan harga komoditi complementary (komplementer) maka σi2 tidak konstan.
-
Kesalahan tranformasi data (misal, Rasio / first difference).
-
Kesalahan bentuk fungsi (misal, linear atau log-linear model)
Jika terkena heteroskedastisitas maka dengan demikian estimator tidak lagi mempunyai varian yang minimum apabila kita menggunakan motode OLS. Oleh karena itu, estimator yang kita dapatkan akan mempunyai karakteristik sebagai berikut :
-
Estimator metode kuadrat terkecil masih linear (linear).
-
Estimator metode kuadrat terkecil masih tidak bias (unbiased).
-
Tetapi, estimator metode kuadrat terkecil tidak mempunyai varian yang minimum lagi (no longer best).
Jadi kesimpulannya, dengan adanya heteroskedastisitas maka estimator OLS tidak menghasilkan estimator yang Best Liniar Unbiased Estimator (BLUE) hanya mungkin baru sampai Linear Unbiased Estimator (LUE).
Apa konsekuensinya jika estimator tidak mempunyai varian yang minimum ? Maka jika kita tetap menggunakan metode OLS maka konsekuensinya adalah :
-
Jika varian tidak minimum maka menyebabkan perhitungan standard error metode OLS menjadi tidak bisa dipercaya kebenarannya.
-
Akibat dari no 1 di atas, maka interval estimasi maupun uji hipotesis yang didasarkan pada distribusi t maupun uji F tidak bisa lagi dipercaya untuk evaluasi hasil regresi.
Dostları ilə paylaş: |