Ekonometrika program studi pendidikan ekonomi dan koperasi

MATERI 4 REGRESI DENGAN VARIABEL INDEPENDEN KUALITATIF

Yüklə 232,77 Kb.

səhifə	2/4
tarix	17.09.2018
ölçüsü	232,77 Kb.
	#69180

1 2 3 4

MATERI 4
REGRESI DENGAN VARIABEL INDEPENDEN KUALITATIF

TUJUAN
Memahami dan mampu mengoperasikan regresi dengan variabel independen kualitatif (dummy variabel)

KOMPETENSI
Setelah mempelajari bab ini, mahasiswa akan dapat:

Memahami karakteristik dari variabel dummy
Memahami regresi dengan satu variabel kualitatif baik pada cross section dan time series
Memahami regresi dengan satu variabel kualitatif dua kategori
Memahami regresi dengan dua atau lebih variabel kualitatif
Memahami regresi linear dengan dua segmen dan perbandingan dua regresi pendekatan dummy variable
Memahami penggunaan variabel dummy dalam analisis musiman

URAIAN MATERI
Karakteristik dari Variabel Boneka (Dummy Variable)

Variabel dalam persamaan regresi yang sifatnya kualitatif bisanya menunjukkan ada tidaknya suatu “quality” atau “atribute’, misalnya laki atau perempuan, sarjana atau bukan, dan seterusnya.

Salah satu metode untuk mengkuantitatifkan atribut yang bersifat kualitatif tersebut adalah dengan cara membentuk variabel yang sifatnya artificial (dummy) ke dalam model persamaan regresi dengan mengambil nilai 1 (satu) atau 0 (nol).

Ketentuan pemberikan angka 1 atau 0 bisa kita pahami bahwa :

Beri angka 1 untuk menunjukkan adanya atribut.
Beri angka 0 untuk menunjukkan tidak adanya atribut.

Contoh, seseorang diberi angka 1 jika sarjana dan 0 jika bukan sarjana, nilai 1 jika laki-laki dan 0 jika perempuan, nilai 1 jika periode krisis ekonomi dan 0 jika tidak krisis ekonomi, nilai 1 untuk sesudah pemberlakuan UU dan 0 untuk sebelum pemberlakuan UU, dan lain sebagainya.
Regresi dengan Dua atau Lebih Variabel Kualitatif

Teknik persamaan regresi dengan menggunakan variabel dummy dapat diperluas seandainya kita ingin memasukkan lebih dari satu variabel kualitatif. Misalnya bahwa gaji karyawan selain ditentukan oleh masa kerja juga oleh jenis kelamin (laki-laki / perempuan), akan tetapi selain jenis kelamin sebagai variabel dummy-nya juga memasukkan variabel jenjang pendidikan, yaitu S1 atau bukan, yang mempengaruhi gaji.

Maka, model persamaan regresinya adalah :
Y_i = β₀+ β₁ D_1i + β₂ D_2i+ β₃ X_i + e_i
Dimana: Y_i = gaji karyawan tahunan

X_i = masa kerja karyawan (tahun)

D_1i = 1 jika laki-laki

= 0, jika lainnya (perempuan)

D_2i = 1, jika S1

= 0, jika lainnya
Kita perhatikan bahwa masing-masing dari dua variabel kualitatif, yaitu jenis kelamin dan tingkat pendidikan, mempunyai dua kategori atau kelas. Sehingga hanya memerlukan dua variabel dummy saja, yaitu D₁ dan D₂. Dalam hal ini, kategori dasarnya (the base category) adalah karyawan bukan S1.

EVALUASI

Apa yang dimaksud dengan variabel dummy? Dan apa gunanya?
Jika kita mempunyai data bulanan beberapa tahun, berapa variabel dummy yang harus kita masukkan dalam model regresi untuk menguji hipotesis berikut?

Semua bulan (12 bulan) dalam setiap tahunnya menunjukkan pola musiman.
Jika hanya bulan Maret, Juni, Agustus, dan November yang menunjukkan pola musiman.

Jika diperoleh suatu model persamaan regresi berikut ini terkait dengan pengaruh beberapa variabel kualitatitf terhadap penentuan sewa kamar kosan mahasiswa di Bandung adalah:

Y = 3,13 + 4,69 D₁ – 2,55 D₂ + 16,22 X₁ + 0,48 X₂

(1,44) (2,04) (1,13) (3,51) (0,25)
R² = 0,89 (angka dalam kurung adalah standard error)
Dimana :

Y = sewa kamar kosan (satuan mata uang)

D₁ = letak rumah kosan

= 1, dekat kampus

= 0, jauh dari kampus

D₂ = tempat mandi di dalam kamar

= 1, jika ada tempat mandi di dalam kamar

= 0, tidak ada tempat mandi di dalam kamar

X₁ = biaya renovasi (satuan mata uang)

X₂ = pajak bumi bangunan (PBB) (satuan mata uang)

Coba Anda jelaskan maksud arti dari setiap koefisien dari regresi di atas!
Masuk akalkah menurut Anda jika variabel X₂ dimasukkan dalam model tersebut?

Diketahui data pendapatan triwulanan selama 5 tahun (dalam ribu rupiah) dari pemasukan tiket masuk Kebun Binatang di Kota Bandung, diketahui juga data belum bebas dari pengaruh musiman, adalah sebagai berikut:

Tahun	TRIWULANAN
Tahun	I	II	III	IV
1	22123	19445	28456	24278
2	20467	19759	28679	23668
3	24666	17388	29043	23677
4	23821	17123	30274	24116
5	24111	16899	32723	23994

Dengan mengikuti model sebagai berikut:

Y_t = a₀ + a₁ D₁ + a₂ D₂ + a₃ D₃ + e_t
Dimana :

Y = pendapatan

D₁ = 1, untuk triwulan II

= 0, lainnya

D₂ = 1, untuk triwulan III

= 0, lainnya

D₃ = 1, untuk triwulan IV

= 0, lainnya

Buatlah regresi dari data di atas !
Bagaimana menginterpretasikan koefisien arah dari masing-masing variabel dummy ?
Bagaimana menggunakan perkiraan koefisien arah untuk membebaskan data dari pengaruh musiman ?

MATERI 5
MULTIKOLINEARITAS

TUJUAN
Menjelaskan dan memahami pelanggaran asumsi klasik : multikolinearitas

KOMPETENSI
Setelah mempelajari bab ini, Anda akan dapat:

Memahami sifat dan konsekuensi dari multikolinearitas
Memahami cara mendeteksi multikolinearitas
Memahami cara penyembuhan multikolinearitas

URAIAN MATERI
Sifat Multikolinearitas

Istilah kolinearitas ganda (multicollinearity) diciptakan oleh Ragner Frish di dalam bukunya: Statistical confluence analysis by means of Complete Regression System. Aslinya, istilah multikolinearitas itu berarti adanya hubungan linear yang sempurna atau eksak (perfect or exact) di antara variabel-variabel bebas dalam model regresi. Istilah kolinearitas ganda (multicollinearity) menunjukkan adanya lebih dari satu hubungan linear yang sempurna.

Konsekuensi dari Multikolinearitas
Konsekuensi sebuah model yang mengandung multikolinearitas adalah variannya akan terus naik atau membesar. Dengan varian yang semakin naik atau membesar maka standar error β₁ dan β₂ juga naik atau membesar. Oleh karena itu, dampak adanya multikolinearitas di dalam model regresi jika kita menggunakan teknik estimasi dengan metode kuadrat terkecil (OLS) adalah:

Meskipun penaksir OLS mungkin bisa diperoleh dan masih dikatakan BLUE, tapi kesalahan standarnya cenderung semakin besar dengan meningkatnya tingkat korelasi antara peningkatan variabel sehingga sulit mendapatkan penaksir yang tepat.
Karena besarnya kesalahan standar, selang atau interval keyakinan untuk parameter populasi yang relevan cenderung lebih besar dan nilai hitung uji statistik t akan kecil sehingga membuat variabel independen secara statistik tidak signifikan mempengaruhi variabel independen.
Atas dasar no.2, dalam kasus multikolinearitas yang tinggi, data sampel mungkin sesuai dengan sekelompok hipotesis yang berbeda-beda, jadi probabilitas untuk menerima hipotesis yang salah (yaitu kesalahan tipe II) meningkat.
Selama multikolinearitas tidak sempurna, penaksiran koefisien regresi adalah mungkin tetapi taksiran dan kesalahan standarnya menjadi sangat sensitif terhadap sedikit perubahan dalam data.
Jika multikolinearitas tinggi, seseorang mungkin memperoleh R² yang tinggi tetapi tidak satupun atau sangat sedikit koefisien yang ditaksir yang penting secara statistik, jadi mutikolinearitas yang tinggi membuat tidak mungkin mengisolasi pengaruh individual dari variabel yang menjelaskan.

Cara Mendeteksi Multikolinearitas

Ada beberapa cara mendeteksi ada tidaknya multikolinearitas, yaitu melalui:

Nilai R² Tinggi Tetapi Hanya Sedikit Variabel Independen yang Signifikan
Regresi Auxiliary

Cara Penyembuhan Multikolinearitas

Tanpa Ada Perbaikan
Ketika dihadapkan dengan multikolinearitas yang parah, satu cara yang “paling sederhana” untuk dilakukan adalah mengeluarkan satu dari variabel yang berkoliner. Tetapi dalam mengeluarkan suatu variabel dari model, kita mungkin melakukan bias spesifikasi, atau kesalahan spesifikasi.
Kombinasi dari cross-sectional dan time series) dikenal sebagai penggabungan (pooling the data) merupakan salah satu perbaikan ketika ada masalah multikolinearitas.

EVALUASI

Jelaskan apa yang dimaksud dengan kondisi multikolinearitas?
Jika model kita terkena multikolinearitas, apa memang pengaruhnya ?
Apa yang dimaksud dengan “hight” but not “perfect” multicollinearity? Masalah apa yang akan terjadi?
Apa yang dimaksud dengan BLUE? Masih BLUE –kah jika model kita terkena multikolinearitas?
Jika model kita terkena multikolinearitas, boleh tidak model tersebut kita lanjutkan saja tanpa perbaikan? Mengapa? Jelaskan!
Bagaimana kita dapat mengetahui suatu model terkena multikolinearitas?
Jika model kita kena multikolinearitas dan ingin menyembuhkannya, bagaimana cara penyembuhannya?

Diketahui data-data ekonomi Indonesia periode 1980-2008 sbb:

TAHUN	FDI	GDP	OPEN	INF
1980	5.85	13.26	48.36	15.97
1981	5.94	13.34	45.75	7.09
1982	6.13	13.36	43.40	9.69
1983	6.25	13.37	50.58	11.46
1984	5.82	13.44	42.88	8.76
1985	6.39	13.46	33.63	4.31
1986	6.19	13.52	40.79	8.83
1987	6.58	13.57	39.00	8.9
1988	6.36	13.62	39.50	5.47
1989	6.53	13.70	41.28	5.97
1990	6.56	13.76	45.87	9.53
1991	6.97	13.83	48.18	9.52
1992	7.57	13.89	48.59	4.94
1993	8.64	13.96	45.52	9.77
1994	8.24	14.03	41.46	9.24
1995	8.81	14.11	43.69	8.64
1996	8.44	14.18	41.50	6.47
1997	8.15	14.23	70.47	11.05
1998	8.49	14.09	63.97	77.63
1999	9.02	14.11	46.92	2.01
2000	9.20	14.14	72.55	9.35
2001	8.16	14.18	61.85	12.55
2002	8.03	14.23	43.37	10.03
2003	8.60	14.27	39.35	5.06
2004	8.43	14.32	47.79	6.4
2005	9.10	14.38	50.80	17.11
2006	8.70	14.43	43.72	6.6
2007	9.24	14.49	44.90	6.59
2008	9.61	14.55	50.13	11.06

Dimana :

FDI	=	Investasi asing langsung (nilai realisasi investasi asing langsung dalam bentuk ln)
GDP	=	Pertumbuhan ekonomi (di-proxy dengan ln PDB riil)
OPEN	=	Rasio ekspor dan impor terhadap PDB (keterbukaan ekonomi)
INF	=	Inflasi (%)

Coba Anda regresikan FDI terhadap GDP, OPEN, dan INF dengan periode mulai tahun 1980 sampai 1996. Jelaskan makna dari koefisien masing-masing variabel tersebut!
Uji deteksi multikolinearitas dari hasil regresi a) tersebut melalui Nilai R² , Korelasi Parsial Antarvariabel Independen, Regresi Auxiliary, dan Tolerance (TOL) serta Variance Inflation Factor (VIF). Apakah terjadi multikolinearitas atau tidak?
Kemudian coba Anda regresikan kembali FDI terhadap GDP, OPEN, dan INF dengan periode mulai tahun 1980 sampai 2008. Lalu uji deteksi multikolinearitas dari hasil regresi tersebut melalui Nilai R² , Korelasi Parsial Antarvariabel Independen, Regresi Auxiliary, dan Tolerance (TOL) serta Variance Inflation Factor (VIF). Apakah terjadi multikolinearitas atau tidak?
Menurut Anda mana hasil yang lebih baik, hasil regresi model a) atau hasil regresi model c) ? Jelaskan alasannya!
Jika model tersebut kena multikolinearitas, bagaimana cara penyembuhannya? Jelaskan !

MATERI 6
HETEROSKEDASTISITAS

TUJUAN
Menjelaskan dan memahami pelanggaran asumsi klasik : heteroskedastisitas
KOMPETENSI
Setelah mempelajari bab ini, mahasiswa akan dapat:

Memahami sifat dan konsekuensi dari heteroskedastisitas
Memahami cara mendeteksi heteroskedastisitas
Memahami beberapa cara mendeteksi heteroskedastisitas dengan metode formal melalui metode Park, metode Glejser, metode korelasi Spearman, metode Goldfeld-Quandt, metode Breusch-Pagan-Godfrey, dan metode White.
Memahami cara penyembuhan heteroskedastisitas

URAIAN MATERI
Sifat dan Konsekuensi dari Heteroskedastisitas
Satu asumsi yang penting dalam model regresi linear klasik ialah bahwa kesalahan pengganggu

mempunyai varian yang sama, artinya Var (

) =

untuk semua i, i = 1, 2, ..... n. Asumsi ini disebut HOMOSKEDASTIK (homoscedastic).
Ada beberapa alasan mengapa varians u_i mungkin variabel (tidak konstan), yaitu :

Sejalan proses belajar (the errorlearning models) manusia, kesalahan (error) perilaku makin mengecil seiring berjalannya waktu. Dalam kasus ini, σ_i² akan mengecil.
Dengan income meningkat, maka orang akan lebih mempunyai kebebasan dan akan lebih banyak pilihan untuk menggunakan income-nya itu. Sehingga σ_i²akan meningkat sejalan dengan peningkatan pendapatannya.
Perbaikan teknik pengumpulan data akan menurunkan σ_i²
Kesalahan spesifikasi model, ini disebabkan:

Kesalahan spesifikasi model yang dikarenakan menghilangkan variabel penting dalam model.
Dalam fungsi permintaan jika tidak dimasukkan harga komoditi complementary (komplementer) maka σ_i² tidak konstan.
Kesalahan tranformasi data (misal, Rasio / first difference).
Kesalahan bentuk fungsi (misal, linear atau log-linear model)

Jika terkena heteroskedastisitas maka dengan demikian estimator

tidak lagi mempunyai varian yang minimum apabila kita menggunakan motode OLS. Oleh karena itu, estimator

yang kita dapatkan akan mempunyai karakteristik sebagai berikut :

Estimator metode kuadrat terkecil masih linear (linear).
Estimator metode kuadrat terkecil masih tidak bias (unbiased).
Tetapi, estimator metode kuadrat terkecil tidak mempunyai varian yang minimum lagi (no longer best).

Jadi kesimpulannya, dengan adanya heteroskedastisitas maka estimator OLS tidak menghasilkan estimator yang Best Liniar Unbiased Estimator (BLUE) hanya mungkin baru sampai Linear Unbiased Estimator (LUE).

Apa konsekuensinya jika estimator tidak mempunyai varian yang minimum ? Maka jika kita tetap menggunakan metode OLS maka konsekuensinya adalah :

Jika varian tidak minimum maka menyebabkan perhitungan standard error metode OLS menjadi tidak bisa dipercaya kebenarannya.
Akibat dari no 1 di atas, maka interval estimasi maupun uji hipotesis yang didasarkan pada distribusi t maupun uji F tidak bisa lagi dipercaya untuk evaluasi hasil regresi.

Yüklə 232,77 Kb.

Dostları ilə paylaş:

1 2 3 4