Geographically Weighted Ridge Regression dalam Kasus Multikolinearitas Pada Indeks Pembangunan Manusia di Kabupaten/Kota Provinsi Jawa Timur
on
Jurnal Matematika Vol. 7, No. 2, Desember 2017, pp. 124-131 ISSN: 1693-1394
Article DOI: 10.24843/JMAT.2017.v07.i02.p89
Geographically Weighted Ridge Regression dalam Kasus Multikolinearitas Pada Indeks Pembangunan Manusia di Kabupaten/Kota Provinsi Jawa Timur
Yani Arthayanti
Program Studi Matematika, Fakultas MIPA – Universitas Udayana Email: yaniarthayanti@gmail.com
I Gusti Ayu Made Srinadi
Program Studi Matematika, Fakultas MIPA – Universitas Udayana Email: srinadi@unud.ac.id
G.K. Gandhiadi
Program Studi Matematika, Fakultas MIPA – Universitas Udayana
Email: gandhiadigk@yahoo.com
Abstract: Linear Regression Analysis is a statistical method for modeling relation between two variable, response and explanatory variable. Geograpically Weighted Regression (GWR) is the development of linier regression analysis if the case of spatial divers case. Local multicollinearity is a condition when explanatory variables had correlated with each observation location. Geograpically Weighted Ridge Regression (GWRR) is a method used to model data containing local multicollinearity on spatial data. GWRR model was developed from ridge regression by adding weight as additional information. The study aims to model spatial data containing local multicollinearity to the Human Development Index (HDI) in the districts/municipalities of eastern Java Province in 2015. The result of this study was indicate that the indicator of the average length of school is a dominant indicator that affects HDI.
Keywords: GWR, GWRR, HDI, Local Multicollinearity, Spatial Data
Analisis Regresi merupakan metode statistika yang digunakan untuk memodelkan hubungan variabel respon dengan variabel penjelas. Menurut Anselin [1], apabila menggunakan model regresi linear pada pengamatan yang dipengaruhi oleh faktor geografis atau data spasial, maka dapat menyebabkan kesimpulan yang kurang tepat karena unsur spasial tidak tercakup di dalamnya. Metode yang digunakan untuk data yang dipengaruhi faktor geografis adalah regresi spasial.
Menurut Fotheringham et.al.[2] metode statistika yang dapat digunakan untuk
memodelkan hubungan variabel respon dan penjelas pada data yang mengandung heteroskedastisitas adalah Geograpically Weighted Regression (GWR). Dalam metode GWR digunakan matriks pembobot yang besarnya tergantung pada kedekatan antar lokasi pengamatan. Semakin dekat suatu lokasi pengamatan maka pengaruh bobotnya akan semakin besar.
Dalam aplikasi GWR terkadang ditemukan adanya variabel penjelas yang saling berkorelasi, permasalahan tersebut dinamakan multikolinearitas lokal. Multikolinearitas lokal adalah suatu kondisi dengan variabel penjelas saling berkorelasi di setiap lokasi pengamatan. Adanya multikolinearitas dapat menyebabkan pendugaan parameter dari model yang dihasilkan memiliki varians yang besar, sehingga dapat menyebabkan terjadinya kesalahan dalam menginterpretasikan parameter.
Menurut Hastie et.al. [3] Regresi Ridge merupakan metode yang dapat digunakan pada data yang mengandung multikolinearitas. Regresi ridge merupakan pengembangan dari metode kuadrat terkecil yaitu meminimumkan jumlah kuadrat galat dengan menambahkan tetapan bias. Pada data spasial yang mengandung multikolinearitas lokal dapat digunakan modifikasi regresi ridge dan GWR yang disebut dengan Geographically Weighted Ridge Regression (GWRR). GWRR merupakan pengembangan dari regresi ridge yaitu dengan menambahkan unsur pembobot sebagai informasi tambahan.
Indeks Pembangunan Manusia merupakan indikator kinerja pembangunan yang dibentuk melalui pendekatan tiga dimensi dasar. Tiga dimensi tersebut terdiri dari kesehatan, pengetahuan, dan kehidupan yang layak (BPS [4]). Jawa Timur merupakan salah satu provinsi besar di Indonesia dengan jumlah penduduk mencapai 38 juta jiwa lebih dan juga merupakan provinsi yang memiliki kabupaten/kota terbanyak di Indonesia yaitu 38 kabupaten/kota (BPS [5]). IPM di Jawa Timur pada tahun 2015 menduduki peringkat 16 sebesar 68,95[4]. Pembangunan pada kabupaten/kota di Jawa Timur masih belum merata, karena terdapat kesenjangan yang cukup tinggi. Berdasarkan [4] nilai IPM pada kota Malang sebesar 80,05 merupakan nilai IPM terbesar di Jawa Timur, sedangkan nilai IPM terendah adalah di kabupaten Sampang hanya sebesar 58,18. Maka dari itu perlu dilakukan penelitian terhadap factor-faktor yang berpengaruh terhadap Indeks Pembangunan Manusia di Provinsi Jawa Timur
Berdasarkan uraian di atas, penulis akan mengaplikasikan metode GWRR dalam memodelkan Indeks Pembangunan Manusia di kabupaten/kota Provinsi Jawa Timur tahun 2015. Adapun variabel respon yang digunakan dalam penelitian ini adalah nilai IPM kabupaten/kota Provinsi Jawa Timur sedangkan variabel penjelas yang digunakan adalah Angka Harapan Hidup (AHH), Angka Melek Huruf (AMH), Rata-rata Lama Sekolah (RLS), Pengeluaran per Kapita (PPK), Angka Kematian Bayi (AKB) dan Penduduk usia di atas 15 tahun yang bekerja (PK).
Data yang digunakan dalam penelitian ini adalah berupa data sekunder yang diperoleh dari Badan Pusat Statistika (BPS) Provinsi Jawa Timur berupa data Indeks Pembangunan Manusia (IPM) dan faktor-faktor yang memengaruhi IPM pada tahun 2015.
Metode Analisis Data
Berikut merupakan tahapan – tahapan analisis dalam penelitian ini, yaitu :
- 
1. Mendeskripsikan variabel respon dan variabel - variabel penjelas Indeks Pembangunan Manusia. 
- 
2. Menguji heteroskedastisitas pada data dengan menggunakan uji Glejser. 
- 
3. Menentukan model GWR dan mendeteksi multikolinearitas lokal dengan menggunakan Variance Inflance Factor (VIF) dengan rumus 
VIFk =---ξ⅛----
K 1 -R2k (ui,vi)
(1)
(2)
2 ∑∣=iwιj(yj-2jf
(uIv) ∑^1wij(y j-y)k .
- 
4. Melakukan pemodelan Geographically Weighted Ridge Regression (GWRR) dengan tahapan sebagai berikut: 
- 
a. Menghitung jarak euclidean serta menduga nilai bandwidth dan tetapan bias c dengan metode iterasi Cross Validation (CV) dengan rumus CV = ∑Γ=⅛ -y*(b)}2. __________________ (3) (4) 
- 
b. Menghitung jarak Euclidean dengan rumus d y = √ (u i — u))2 + (v- — VjY dan menentukan matriks pembobot untuk setiap lokasi pengamatan dengan fungsi fixed exponential yaitu dengan rumus: 
" =M-Ct)]-
(5)
- 
5. Menduga nilai parameter model regresi setiap lokasi pengamatan berdasarkan matriks pembobot dengan rumus: 
PrU, Vd = [X*τW{ui, v)X* + c/]- 1 X*W{ui, vi)Y* .
- 
6. Melakukan pengujian serentak pada model Geographically Weighted Ridge ( ) Regression (GWRR) dengan rumus: *T * yjy 
 ^hitung 
 y *τ(I-GFd-Gyy* “1 
 (7) 
dan pengujian parsial pada model Geographically Weighted Ridge Regression (GWRR) dengan rumus: ^■hitung = ̂ ̂√( = , =) .
√
(8)
- 
7. Interpretasikan Model. 
Langkah awal dalam penelitian ini adalah melakukan analisis deskripsi untuk masing-masing variabel penjelas dan variabel respon. Analisis deskriptif disajikan pada Tabel 1.
Tabel 1. Analisis Desriptif
| Variabel | N | Min | Maks | Standar Deviasi | 
| Y | 38 | 58.18 | 80.05 | 5.405 | 
| 38 | 65.73 | 73.85 | 2.079 | |
| ^2 | 38 | 78.03 | 98.86 | 5.272 | 
| 38 | 4.84 | 11.22 | 1.587 | |
| 38 | 532525 | 1722999 | 276347.03 | |
| *5 | 38 | 16.05 | 56.24 | 11.369 | 
| *6 | 38 | 63806 | 1365180 | 311294.05 | 
Tabel 1 menunjukkan bahwa terdapat kesenjangan nilai IPM terbesar dan terendah di Jawa Timur yaitu nilai Indeks Pembangunan Manusia (Y) di Provinsi Jawa Timur tahun 2015 terbesar yaitu 80.05 berada di kota Malang sedangkan nilai IPM terendah berada pada kabupaten Sampang yaitu sebesar 58.18. Dapat diketahui bahwa nilai IPM di provinsi Jawa Timur sebesar 68.95 [4].
Heteroskedastisitas
Untuk mengetahui adanya ketaksamaan varians dari residual pengamatan satu ke pengamatan lainnya dilakukan uji heterokedastisitas. Uji yang digunakan adalah uji glejser yaitu dengan meregresikan nilai dari absolute residual pengamatan terhadap variabel penjelas. Langkah awal untuk memperoleh residual pengamatan adalah meregresikan variabel-variabel penjelasnya terhadap variabel respon. Dengan bantuan software SPSS 23, diperoleh p-value sebesar 0.036. Jika p-value kurang dari taraf kepercayaan α = 0.05 maka data pengamatannya mengandung heterokedastisitas, karena p-value 0.036 sehingga p value lebih kecil dari 0.05 maka data tersebut mengandung heterokedastisitas.
Multikolinearitas
Mendeteksi adanya multikolinearitas lokal dengan menggunakan kriteria VIF. Jika variabel penjelas memiliki nilai VIF lebih besar dari lima maka variabel tersebut mengandung multikolinearitas (Montgomery & Peck, 1992). Dengan menggunakan software R 3.2.5, diperoleh bahwa pada variabel penjelas yang mengalami multikolinearitas lokal adalah Angka Harapan Hidup ( ^l), Angka Melek Huruf (^2 ), Rata-Rata Lama Sekolah (X^), dan Pengeluaran Perkapita (X4). Oleh sebab itu digunakan metode Geographically Weighted Ridge Regression (GWRR).
Pemodelan Geographically Weighted Ridge Regression
Pemodelan data spasial yang mengandung multikolinearitas dapat menggunakan Geographically Weighted Ridge Regression yaitu dengan menambahkan tetapan bias c tertentu pada matriks XTX. Pada GWRR nilai tetapan bias c diperoleh secara bersamaan dengan metode iterasi untuk setiap bandwidth (b) yaitu tetapan bias c dan bandwidth (b) yang terpilih adalah yang meminimumkan nilai CV (Cross Validation)[6].
Langkah awal pada metode ini adalah membentuk matriks pembobot yaitu dengan menggunakan fungsi kernel exponential. Dengan bantuan software R versi 3.2.5, diperoleh nilai bandwidth optimum sebesar 362203 dan tetapan bias c yang optimum adalah 0.01419 untuk setiap lokasi pengamatan. Jika suatu lokasi semakin jauh dari titik lokasi pengamatan maka nilai pembobotnya semakin menurun sehingga pengaruhnya semakin kecil dan juga sebaliknya. Untuk memperoleh pembobot masing-masing lokasi pengamatan dengan rumus Persamaan 5, yaitu:
*-( ⅛ )+
Wij =
= *- (362203)+
Dengan di j merupakan jarak Euclid masing-masing lokasi pengamatan. Sebagai
contoh matriks pembobot untuk lokasi pengamatan di Kabupaten Ponorogo adalah:
0.8623457 0 … 0
| W(U1,Vi)=[ | 0.8623457 0 … 0 0 1… 0 0 0 … 0.7249052 | 
Lebih lanjut lagi adalah pendugaan parameter model GWRR. Pemodelan GWRR dapat diselesaikan dengan bantuan software R versi 3.2.5, nilai bandwidth dan tetapan bias c digunakan dalam pendugaan parameter pada model GWRR. Sebagai contoh model GWRR untuk Kabupaten Ponorogo adalah sebagai berikut:
̂ Ponorogo = 49.8637 - 0.0417X1 + 0.011X2 + 2.4365X3+3.76×10 ^6X4 - 0.0389 X5+1.23×10 -7X6
Uji Serentak GWRR
Uji serentak dilakukan untuk mengetahui signifikansi variabel-variabel penjelas pada model GWRR secara serentak. Dengan menggunakan software R versi 3.2.5 diperoleh Ffiitung yaitu sebesar 18.57733. Dengan derajat bebas sebesar 38 dan 37.43246 maka diperoleh Ftabel sebesar 1.725073. Karena Fhitung lebih desar dari Ftabel maka kesimpulannya menolak H0 yang artinya bahwa variabel – variabel penjelas signifikan berpengaruh terhadap model GWRR.
Uji Parsial GWRR
Setelah diketahui bahwa terdapat hubungan antara variabel-variabel penjelas dengan model GWRR selanjutnya dilakukan uji parsial. Uji parsial dilakukan untuk mengetahui parameter di setiap lokasi pengamatan yang berpengaruh signifikan terhadap Indeks Pembangunan Manusia di Jawa Timur tahun 2015.
Pengujian parsial menggunakan taraf kepercayaan α = 0.05 dan derajat bebas sebesar 37 menghasilkan nilai ^tabel sebesar 2.02619, apabila nilai ^hitung di setiap lokasi pengamatan lebih besar dari ^tabel maka kesimpulannya menolak H0 yang berarti variabel penjelas tersebut berpengaruh signifikan terhadap Indeks Pembangunan Manusia. Sebagai contoh untuk Kabupaten Ponorogo diperoleh hasil sebagai berikut:
Tabel 2. ^hitung untuk Kabupaten Ponorogo
| Variabel | ^-hitung | Keterangan | 
| Xl | -0.1880 | Tidak signifikan | 
| X2 | 0.1598 | Tidak signifikan | 
| X3 | 5.0345 | Signifikan | 
| X4 | 2.3241 | Signifikan | 
| X5 | -0.6428 | Tidak signifikan | 
| X6 | 0.0850 | Tidak signifikan | 
Berdasarkan Tabel 2 variabel penjelas yang berpengaruh signifikan terhadap Indeks Pembangunan Manusia di Kabupaten Ponorogo adalah variabel Rata-rata lama sekolah ( ^3 ) dan Pendapatan Perkapita (^4).
Interpretasi Model
Setelah diperoleh model GWRR untuk setiap lokasi pengamatan dan dilakukan pengujian signifikansi. Maka selanjutnya adalah interpretasi model GWRR yang telah diperoleh. Contoh interpretasi model GWRR pada Kabupaten Ponorogo yaitu:
̂ Ponorogo = 49.8637 - 0.0417X1 + 0.011X2 + 2.4365X3+3.76×10 ^6X4
- 0.0389 X5+1.23×10 ^7X6
Model GWRR Indeks Pembangunan Manusia di Kabupaten Ponorogo, menunjukkan bahwa variabel yang dominan dan signifikan memengaruhi Indeks Pembangunan Manusia adalah variabel rata-rata lama sekolah (X^).
Berdasarkan pemodelan GWRR pada Indeks Pembangunan Manusia di Provinsi Jawa Timur, secara umum diperoleh indikator yang dominan memengaruhi IPM di masing-masing Kabupaten/Kota Provinsi Jawa Timur tahun 2015 adalah rata-rata lama sekolah.
Berdasarkan hasil dan pembahasan diperoleh beberapa kesimpulan yaitu:
- 
1. Berdasarkan pemodelan GWRR pada Indeks Pembangunan Manusia di Provinsi Jawa Timur diperoleh 38 model GWRR berbeda di setiap lokasinya. Selanjutnya diperoleh indikator yang secara umum dominan memengaruhi IPM adalah rata-rata lama sekolah. Berdasarkan variabel penjelas yang berpengaruh signifikan di masing-masing Kabupaten/Kota dibagi menjadi dua kelompok. 
- 
2. Faktor – faktor yang berpengaruh terhadap Indeks Pembangunan Manusia tahun 2015 di setiap Kabupaten/Kota Provinsi Jawa Timur adalah variabel Rata-rata Lama Sekolah (X^), sedangkan untuk variabel Pengeluaran Perkapita (X4 ) berpengaruh di beberapa kebupaten/Kota di Jawa Timur kecuali di Kabupaten Pacitan, Blitar dan Kota Blitar. 
Saran
Berdasarkan hasil analisis pada pembahasan, peneliti menggunakan modifikasi Regresi Ridge pada GWR untuk memodelkan data yang mengandung multikolinearitas sehingga diharapkan untuk penelitian selanjutnya yang menggunakan pemodelan GWR dengan kasus multikolinearitas dapat menggunakan modifikasi dengan metode lain seperti Principal Component Analysis (PCA) atau Lasso. Selanjutnya juga dapat dilakukan penelitian lanjutan dengan menggunakan variabel penelitian lain atau menambahkan variabel penjelas lain.
Daftar Pustaka
- 
[1] Anselin, L., 1988. Spatial Econometrics : Methods and Models. The Netherlands: Kluwer Academic Publishers. 
- 
[2] Fotheringham, A. C. M. d. B. C., 2002. Geographically Weighted Regression : The Analyse os Spatially Varying Relationships. England: John Wiley and Sons Ltd. 
- 
[3] Hastie, T., Tibshirani, R. & Friedman, J., 2009. The Elements of Statistical Learning Data Mining, Inference, and Prediction. New York: Springer. 
- 
[4] BPS, 2016. Indeks Pembangunan Manusia 2015. In: Jakarta: Badan Pusat Statistika. 
- 
[5] BPS, Jawa Timur, 2016. Jawa Timur Dalam Angka 2016. In: Surabaya: BPS Provinsi Jawa Timur. 
- 
[6] Wheeler, D. C., 2007. Diagnostic Tools and A Remedial Method for Collinearity in Geographically Weighted Regression. Environment and Planning A, Volume 39, pp. 2464-2481. 
131
Discussion and feedback