Estimasi Model Seemingly Unrelated Regression (SUR) dengan Metode Generalized Least Square (GLS)
on
Jurnal Matematika Vol. 4 No. 2, Desember 2014. ISSN: 1693-1394
Estimasi Model Seemingly Unrelated Regression (SUR) dengan Metode Generalized Least Square (GLS)
Ade Widyaningsih
Jurusan Matematika, FMIPA, Universitas Udayana e-mail: ade.strobery@gmail.com
Made Susilawati
Jurusan Matematika, FMIPA, Universitas Udayana e-mail: susilawati.made@gmail.com
I Wayan Sumarjaya
Jurusan Matematika, FMIPA, Universitas Udayana e-mail: sumarjaya@unud.ac.id
Abstract: Regression analysis is a statistical tool that is used to determine the relationship between two or more quantitative variables so that one variable can be predicted from the other variables. A method that can used to obtain a good estimation in the regression analysis is ordinary least squares method. The least squares method is used to estimate the parameters of one or more regression but relationships among the errors in the response of other estimators are not allowed. One way to overcome this problem is Seemingly Unrelated Regression model (SUR) in which parameters are estimated using Generalized Least Square (GLS). In this study, the author applies SUR model using GLS method on world gasoline demand data. The author obtains that SUR using GLS is better than OLS because SUR produce smaller errors than the OLS.
Keywords: Multiple Linear Regression, Ordinary Least Square, Seemingly Unrelated Regression, Generalized Least Square
Model regresi merupakan model yang paling umum digunakan untuk menunjukkan hubungan antara variabel yang satu dengan variabel lainnya. Metode yang digunakan untuk mendapatkan penduga yang baik dalam analisis regresi adalah metode kuadrat terkecil (MKT).
Konsep Metode Kuadrat Terkecil (MKT) adalah meminimumkan jumlah kuadrat galat sehingga diperoleh penduga dengan varians terkecil. MKT digunakan untuk mengestimasi parameter dari satu persamaan regresi atau lebih, tetapi tidak dibolehkan terdapat hubungan antara galat pada penduga respons yang satu dengan penduga
respons yang lain. Namun, sering diju103mpai galat pada model regresi yang berbeda saling berkolerasi sehingga estimasi menggunakan metode kuadrat terkecil menjadi tidak efisien untuk digunakan (Zellner [5]). Salah satu cara yang untuk mengatasi permasalahan tersebut adalah dengan model Seemingly Unrelated Regression (SUR) yang parameternya diestimasi menggunakan Generalized Least Square (GLS).
Model SUR dengan metode GLS lebih baik digunakan karena galat yang dihasilkan lebih kecil daripada galat yang dihasilkan MKT (Alaba, et. al [1]). Estimasi parameter pada model SUR dilakukan secara bersamaan dengan memanfaatkan korelasi kesebayaan (contemporaneous correlation). Korelasi kesebayaan merupakan korelasi yang terjadi apabila galat pada model yang berbeda saling berkorelasi pada waktu yang sama.
Berdasarkan uraian di atas peneliti ingin menerapkan model Seemingly Unrelated Regression (SUR) pada data makro permintaan bensin dunia dari beberapa negara yang tergabung dalam Organisasi untuk Kerja Sama dan Pembangunan Ekonomi atau Organisation for Economic Co-operation and Development (OECD) yang telah dipublikasiakan oleh NYU Stern (2012) melalui internet [4].
Analisis regresi merupakan suatu metode untuk menentukan hubungan sebab-akibat antara variabel satu dengan variabel lainnya. Analisis regresi berkenaan dengan studi ketergantungan satu variabel yaitu variabel terikat, pada satu atau lebih variabel bebas.
Selain untuk melihat hubungan antara variabel bebas (independent variable) dengan variabel terikat (dependent variable), analisis regresi juga bertujuan untuk melihat kontribusi relatif dari masing-masing variabel bebas terhadap variabel terikat dan melakukan prediksi terhadap nilai dari variabel terikat dengan variabel bebas yang diketahui.
Misalkan terdapat P-1 variabel bebas^l , ^2 ,…,^P-1 . Model regresi linear yang terbentuk dengan P-1 variabel bebas tersebut adalah
Yi = + βlXil+⋯+βp-lXtp-l + Si (1)
Selanjutnya untuk mempermudah komputasi model regresi linear tersebut dapat dinyatakan dalam bentuk matriks. Variabel dapat didefinisikan sebagai matriks-matriks berikut:

Vektor-vektor Y merupakan vektor variabel terikat, β adalah vektor parameter regresi, sedangkan X adalah matriks yang mengandung vektor kolom 1 dan vektor kolom nilai-nilai variabel bebas X untuk setiap variabel di dalam model regresi, dan e adalah vektor variabel acak normal bebas dengan nilai harapan E{e}=0.
Model regresi linear umum untuk persamaan di atas dapat disajikan dalam bentuk matriks sebagai berikut:
-
Y= +e . (2)
Ada beberapa asumsi dalam analisis regresi yang harus terpenuhi agar nilai dugaan bersifat Best Linear Unbiased Estimator (BLUE). Asumsi-asumsi tersebut meliputi residual mempunyai distribusi normal, ragam homogen (homoskedastisitas), tidak terjadi autokorelasi, dan tidak terjadi multikolinearitas. Untuk mengetahui dalam analisis regresi asumsi sudah terpenuhi atau tidak terpenuhi, maka akan dilakukan beberapa uji yang meliputi: uji kenormalan, uji heteroskedastisitas, uji autokorelasi, dan uji multikolinearitas.
Tujuan dari metode kuadrat terkecil adalah meminimumkan jumlah kuadrat dari galat (sum squared error). Misalkan terdapat p parameter dan n pengamatan maka model yang akan diperoleh sebagai berikut:
1
= O+ 1^11+⋯+ p-1^1,p-1 + 61
^
2
= O+ 1^21+⋯+ p-l¾,P-I + e2
^
n
= o+ i^ni+⋯+ p-ι%n,p-i + en
yang dapat ditulis secara ringkas dalam notasi matriks sebagai: Y= ̂+e
(3)
Pendugaan MKT untuk kasus n amatan dapat diperoleh dengan meminimumkan n
∑ eI =∑[(Y1-(β0 + ̂i^ii+⋯+ ̂p-i^ip-1))] 2.
dengan ∑ eI merupakan jumlah kuadrat galat.
Notasi matriks untuk meminimumkan eτe dari persamaan (3) diperoleh:
e= -X ̂.
oleh karena itu,
eτe=(Y-X ̂) τ(Y-X̂) = -2 ̂τXτY + ̂τxτx̂.
dengan menggunakan sifat-sifat transpos suatu matriks, yaitu (X̂) = ̂τxτ dan karena ̂τXτY merupakan suatu skalar maka bentuk itu sama dengan transposnya YτX̂ . Untuk menaksir parameter βl , βl,…,βp-l maka ∑F=ι ei harus sekecil mungkin. Hal tersebut dicapai dengan menurunkan persamaan eτe terhadap ̂ dan membuatnya sama dengan nol. Selanjutnya diperoleh:
eτe = -2 ̂τXτY + ̂ τxτx ̂
⅞ =-2 ̂τXτY + ̂ τxτx̂=0
= -2XτY+2xτx̂=0 xτx̂=XτY
̂=(xτx) ~1XτY
-
2.2 Model Seemingly Unrelated Regression (SUR)
Secara umum model SUR dapat dinyatakan sebagai himpunan G buah persamaan yang berhubungan karena galat antara persamaan yang berbeda saling berkorelasi. Model SUR dapat ditulis ke dalam bentuk persamaan regresi linear sebagai berikut:
Ylt = + βll%ll,t+⋯+ , + eu
Ylt = + β21^11,t+⋯+β2κ2x2κ , + e2t
Yct = + β Gl^Gl,t+⋯+ , + eGt
untuk t=1,2,3…n. Persamaan tersebut apabila disajikan dalam notasi matriks diperoleh sebagai berikut:

= ∗β∗+e∗
Y∗
[ …
3C2 ∗= O X2 …
⋮ …
O
Xg
∗ ∗ - ]
β∗= : , dan e∗=
lβc∖ leG\
dengan Y∗ adalah vektor kolom nilai variabel terikat yang berukuran n×1,x∗ adalah matriks nilai variabel bebas yang berukuran n× ^i ,β∗ adalah vektor parameter model SUR yang berukuran Ki ×1, Ki adalah dimensi vektor sedangkan e ∗ adalah vektor kolom galat yang berukuran n×1 berdistribusi normal multivariat ,e~N(0, Ω).
Korelasi kesebayaan (contemporaneous correlation) merupakan ukuran hubungan antara galat dari G persamaan yang berbeda pada waktu yang sama (Dofour [2]). Korelasi ini dapat diuji menggunakan statistik uji Lagrange Multiplier, sebagai berikut
G i-i
λ = ∑∑rij
i=2 j=i
2
dengan rH = yang merupakan korelasi galat antara persamaan ke-i dan persamaan
-
1 σiiσJJ
ke-j, σij merupakan varians persamaan ke-i dengan persamaan ke-j, σii merupakan varians antara persamaan ke-i, dan σjj adalah varians antara persamaan ke-j.
Penduga yang baik harus memenuhi syarat Best Linear Unbiased Estimator (BLUE) yang didapat dengan MKT yang memenuhi asumsi homoskedastisitas dan tidak terdapat autokorelasi. Penduga GLS adalah sebagai berikut:
̂=(Xt Ω~1X) ~1XτΩ~1Y =[Xt (∑-1 ⊗I)X] ~1Xτ(∑-1 ⊗I)Y.
Sumber data yang digunakan dalam penelitian ini merupakan data sekunder yaitu data mengenai permintaan bensin dunia dari beberapa negara yang tergabung dalam OECD. Pada penelitian ini yang menjadi variabel terikat (Y) adalah logaritma konsumsi bensin per mobil, sedangkan variabel bebasnya adalah logaritma rata-rata pendapatan (X1), logaritma harga bensin (X2) dan logaritma rata-rata jumlah mobil (X3).
Terdapat tiga tahap estimasi parameter model SUR dengan metode GLS (Hill, et. al [3]). Adapun tahapan dalam mengestimasi parameter model SUR dengan menggunakan GLS sebagai berikut:
-
1. Menggunakan Metode Kuadrat Terkecil (MKT) untuk mengestimasi masing-masing persamaan secara terpisah.
-
2. Menggunakan galat pada langkah 1 untuk mengestimasii σij , berdasarkan rumus:
3.
1
√(n-K)=)(n- κi ) ̂i( MKT ) ̂i( MKT )
1
√(n- K1)(n- κi )
∑
t=l
CitCjt.
Menggunakan hasil estimasi varians dan kovarians pada persamaan (2) untuk
membentuk matriks varians-kovarians S dan W.
'σll σ12 … σ21 σ22 …
σGl σG2 …
dengan
σll^
W= ⊗ =
σ21^
σGl^
σ12^ …
σ22^ …
σG2^ …
Menggunakan matriks W dari langkah 3
dalam perhitungan untuk memperoleh
parameter model SUR sebagai:
̂ GLS=(XτW~1X)~1XtW~1Y =[Xt ( ⊗I)X] ~1Xτ( ⊗I) Y (
Sebelum menganalisis data dengan menggunakan SUR terlebih dahulu dilakukan analisis regresi dengan menggunakan MKT untuk memperoleh galat dari masing-masing persamaan. Tabel 1 merupakan hasil analisis regresi dengan menggunakan MKT yang terbentuk untuk Negara Austria, Negara Belgia, Negara Kanada, Negara Belanda, dan Negara Amerika Serikat.
Tabel 1. Model Regresi Menggunakan MKT
Negara |
Model Regresi |
Austria |
̂ = 2,75 - 0,503 Х? – 0,120 Х 3 |
Belgia |
̂ = 2,07 - 0,215 Х3 I |
Kanada |
̂ = 3,51– 0,534 Х2 - 0,0984 Х 3 |
Belanda |
̂ = 0,037 – 0,459 Х3 |
Amerika Serikat |
̂ = 4,45 – 0,303 Х2 I |
Setelah memperoleh persamaan regresi linear dengan menggunakan MKT, selanjutnya menggunakan galat pada persamaan regresi yang telah diperoleh untuk memperoleh estimasi dari varians-kovarians σij . Setelah melakukan perhitungan tersebut maka akan diperoleh diperoleh matriks variansi-kovarians sebagai berikut:
0,263306 0,143508
0,003546
-0,000657 0,009896
0,143508
0,280567
-0,033416
0,047878
0,014521
0,003546
-0,033416
0,036514
0,031259
0,014696
-0,000657 0,047878 0,031259 0,200883 0,035488
0,009896
0,014521
0,014696
0,035488
0,024250
Langkah selanjutnya adalah melakukan uji Lagrange Multiplier untuk mengetahui korelasi kesebayaan. dengan menggunakan rumus λ= ∑i=2 ∑ }=ι rU , dengan =
̂ I
yang merupakan korelasi antara persamaan ke-i dan persamaan ke-j, ̂ ii
̂âJ J j
merupakan varians antara persamaan ke-i dengan persamaan ke-j, ̂ U merupakan varians antara persamaan ke-i dan ̂fj adalah varians antara persamaan ke-j. Perhitungan tersebut dilakukan dari i-1 dan j =1 sampaii,j=19, setelah melakukan
perhitungan tersebut maka diperoleh nilai λ = 21,12307. Untuk menguji terdapat korelasi kesebayan atau tidak dengan menggunakan hipotesis sebagai berikut: Hq : Semua kovarians bernilai nol (tidak terdapat korelasi kesebayaan)
H^ : Minimal ada satu kovarians tidak sama dengan nol (terdapat korelasi kesebayaan).
-
■ 9zG(G-I)
Nilai ∕2 ( ,a) dengan menggunakan a = 0,05 diperoleh ∕2 = 18,31 , karena
λ> Z2 maka tolak Hq sehingga dapat disimpulkan bahwa terdapat korelasi kesebayaan antara galat dari persamana yang berbeda. Hal tersebut yang mendasari penggunaan model SUR menggunakan metode GLS.
-
4.2 Model Seemingly Unrelated Regression (SUR)
Estimasi model SUR metode GLS dengan bantuan program SAS 9 diperoleh sebagai berikut:
Tabel 2. Model SUR Metode GLS
Negara |
Model Regresi |
Austria |
̂ = 2,623383 - 0,57424 Х2 - 0,13044 Х 3 |
Belgia |
̂ = 2,068192 - 0,21483 Х 3 |
Kanada |
̂ = 3,429504 – 0,57004 Х2 - 0,10329 Х 3 |
Belanda |
̂ = – 0,01071 - 0,46399 Х3 |
Amerika Serikat |
̂ = 4,540948 – 0,23032 Х2 I |
Tabel 2 menunjukkan model SUR dengan menggunakan metode GLS untuk Negara Austria, Negara Belgia, Negara Kanada, Negara Belanda, dan Negara Amerika Serikat. Berikut ini akan dijelaskan model SUR untuk Negara Austria. Model yang terbentuk untuk Negara Austria adalah ̂=2,623383-0,57424 Х2 - 0,13044 Х3.
Nilai koefisien ̂2 = -0,57424 menunjukkan bahwa apabila logaritma harga bensin (X2) mengalami kenaikan sebesar 1 satuan maka logaritma permintaan bensin (Y) akan mengalami penurunan sebesar 0,57424 jika variabel bebas lainnya tetap. Nilai koefisien ̂3 = -0,13044 menunjukkan bahwa apabila logaritma rata-rata jumlah mobil (X3) mengalami kenaikan sebesar satu satuan maka logaritma permintaan bensin (Y) akan menurun sebesar 0,13044 jika variabel bebas lainnya diasumsikan konstan atau tetap. Pada model untuk negara lainnya juga memiliki cara interpretasi yang sama dengan Negara Austria
Tabel 3. Perbandingan Model SUR metode GLS dan Metode Kuadrat Terkecil (MKT)
Negara |
Var. bebas |
Model SUR dengan metode GLS |
Model Regresi dengan MKT | ||
Estimasi koefisien |
Standar error |
Estimasi koefisien |
Standar error | ||
Kons |
2,6 |
0,29 |
2,75 |
0,33 | |
Austria |
X2 |
-0,57 |
0,13 |
-0,50 |
0,17 |
X3 |
-0,13 |
0,03 |
-0,12 |
0,03 | |
Kons |
2,07 |
0,25 |
2,07 |
0,26 | |
Belgia |
X3 |
-0,21 |
0,03 |
0,21 |
0,03 |
Kons |
3,42 |
0,31 |
3,51 |
0,43 | |
Kanada |
X2 |
-0,57 |
0,09 |
-0,53 |
0,13 |
X3 |
-0,10 |
0,03 |
-0,10 |
0,04 | |
Kons |
-0,01 |
0,13 |
0,04 |
0,15 | |
Belanda |
X3 |
-0,46 |
0,02 |
-0,46 |
0,02 |
Amerika |
Kons |
4,54 |
0,07 |
4,45 |
0,08 |
Serikat |
X2 |
-0,23 |
0,06 |
-0,30 |
0,07 |
Apabila diperhatikan Tabel 3 akan terlihat bahwa perhitungan dengan menggunakan model SUR metode GLS menghasilkan galat yang lebih kecil dari MKT. Hal tersebut menunjukkan bahwa penggunaan model SUR metode GLS akan menghasilkan galat yang lebih kecil daripada penggunaan MKT apabila terdapat korelasi antara galat pada persamaan yang berbeda.
Berdasarkan pembahasan tersebut dapat disimpulkan bahwa model SUR metode GLS akan menghasilkan galat yang lebih kecil daripada penggunana model regresi dengan MKT.
Daftar Pustaka
-
[1] Alaba, O.O., E.O. Olubusoye dan S.O.Ojo. 2010 Efficiency of Seemingly Unrelated Regression Estimator over the Ordinary Least Square. European Journal of Scientific Research, Vol.39, No.1, pp. 153-160.
-
[2] Dofour,J.M. 2000. Exact Test for Contemporaneous Correlation of Distrubances
in Seemingly Unrelated Regressions. Ciarano Montreal.
-
[3] Hill, Carter, R., Griffiths, W.E., dan Guay C.Lim. 2012. Principles of Econometrics, 4th edition. John Wiley and Sos, Inc.
-
[4] NYU Stern. 2012. Panel Data Econometrics, Panel Data Sets. [Online] Available at: http://stern.nyu.edu/~wgreene [Accessed 1 Februari 2014].
-
[5] Zellner. 1962. An Efficient Method of Estimating Seemingly Unrelated Regression and Test for Aggregation Bias. Journal of the American Association, 57, 298 pp.348 – 368.
110
Discussion and feedback