E-Jurnal Matematika Vol. 2, No.2, Mei 2013, 6-10

ISSN: 2303-1751

PENERAPAN REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA REGRESI POISSON

Putu Susan Pradawati1, Komang Gde Sukarsa2,

  • I    Gusti Ayu Made Srinadi3

Abstract

Poisson regression was used to analyze the count data which Poisson distributed. Poisson regression analysis requires state equidispersion, in which the mean value of the response variable is equal to the value of the variance. However, there are deviations in which the value of the response variable variance is greater than the mean. This is called overdispersion. If overdispersion happens and Poisson Regression analysis is being used, then underestimated standard errors will be obtained. Negative Binomial Regression can handle overdispersion because it contains a dispersion parameter. From the simulation data which experienced overdispersion in the Poisson Regression model it was found that the Negative Binomial Regression was better than the Poisson Regression model.

Keywords: Poisson Regression, Overdispersion, Negative Binomial Regression, best model.

  • 1.    Pendahuluan

Analisis Regresi Poisson adalah suatu model yang digunakan untuk menganalisis hubungan antara variabel respon yang berdistribusi Poisson dengan variabel-variabel bebasnya. Pada model Regresi Poisson disyaratkan keadaan yang equidispersi yaitu nilai mean dan varians dari variabel respon sama. Kadangkala terjadi kasus nilai varians lebih besar dari meannya yang disebut overdispersi. Sedangkan. jika nilai varians lebih kecil dari nilai meannya disebut underdispersi (McCullagh & Nelder [2]).

Penerapan Regresi Poisson pada data yang mengandung overdispersi akan menghasilkan galat baku yang lebih kecil dari nilai sesungguhnya (underestimate) (Pamungkas [4]). Salah satu metode yang dapat digunakan untuk mengatasi overdispersi pada Regresi Poisson adalah Regresi Binomial Negatif, karena distribusi Binomial Negatif tidak mengharuskan nilai varians sama dengan meannya. Pada penelitian ini penulis akan menentukan model Regresi Poisson dan model Regresi Binomial Negatif pada data yang mengalami overdispersi serta

  • 1    Mahasiswa Jurusan Matematika FMIPA Universitas Udayana

  • 2 ,3 Staf Pengajar Jurusan Matematika FMIPA Universitas Udayana

membandingkan kedua model tersebut yang mengetahui model yang lebih baik berdasarkan kriteria nilai AIC, Devians, Pearson Chi-square, Log likelihood, dan Likelihood Ratio.

Regresi Poisson menyaratkan keadaan nilai mean dan varians dari variabel respon sama (Myers et al. [3]), pada kenyataannya sering terjadi nilai varians yang lebih besar dari meannya yang disebut overdispersi. Overdispersi dapat dideteksi dari taksiran dispersi yaitu nilai Devians/db dan Pearson Chi-square/db yang lebih besar dari 1. Pengujian taksiran dispersi (α) secara statistik dapat dilakukan dengan uji nilai Devians, dengan hipotesis : H0 : a = 1 H1 : a > 1. Statistik uji nilai Deviansnya: G = 2 ∑^ 1[yi ln ( — )- (yi-yi)]. Penolakan terhadap H0 jika G > X(n-k-1),a. Hal ini berarti terjadi overdispersi pada Regresi Poisson. Metode Regresi Binomial Negatif dapat mengatasi overdispersi pada Regresi Poisson karena memiliki parameter dispersi (κ). Pemilihan model terbaik dapat dilihat dari beberapa kriteria, yaitu nilai AIC dan BSC yang lebih kecil, nilai Devians dan Pearson Chi-square yang lebih mendekati satu, nilai Log Likelihood yang lebih besar, dan pengujian secara statistik dengan Likelihood Ratio. Perumusan hipotesis pada pengujian dengan Likelihood Ratio sebagai berikut: Ho =model Regresi Poisson = model Regresi Binomial Negatif, H1 : model Regresi Binomial Negatif lebih baik dari model Regresi Poisson, uji statistik Likelihood Ratio T = 2(l1 — l0). Dengan I1 dan I0 adalah log likelihood masing-masing model pada hipotesis. Penolakan H0 pada taraf signifikansi a jika T > X(1-2a,1) (Ismail & Jemain [1]). Perbandingan antara Regresi Poisson dan Regresi Binomial Negatif disajikan dalam Tabel 1 berikut.

Tabel 1. Perbandingan antara Regresi Poisson dan Regresi Binomial Negatif

Kriteria

Regresi Poisson

Regresi Binomial Negatif

Peubah respon

YilldPoi (μi) s~

YiiidBN (μi,κ) s~

Fungsi distribusi peluang

p~μ n y

p(y; μ) = y, (Myers et al. [3])

f/■        ∖     r(y-1)

f^∙ μ∙*) = y !Γ(t-1) • ( κμ )y (  1  )1κ

k1+κμ'v++κμj

Rata-rata dan Ragam

E(Yi) = Var(Yi) = μ i

E(Yi) = μ i

Var(Yi) = μi + κμ 2

Penaksir parameter Fungsi Log Likelihood

Maximum Likelihood Estimator = -ilntiμ(xi ∖β} — ∑= tιμ(xι ^-∑f=1ln(yi) !

Maximum Likelihood

Estimator

logΓ(κ-1 + yi)

— logΓ(κ-1) κμi  \

+yi log (i .      I

1 + κμi∕

1A

+ κ 1log I11     I

\1 + κμi∕

Model Regresi

μι = x'β + εi

μi = x'iβ + εi

  • 2.    Metode Penelitian

Data yang digunakan dalam penelitian ini adalah data simulasi yang diperoleh dengan membangkitkan data berdistribusi Binomial Negatif yang mengalami overdispersi pada Regresi Poisson dengan menggunakan software SAS 9.1.3. Tahapan penelitian diawali dengan melakukan pembangkitan data variabel bebas X1 dan variabel bebas X2 berdistribusi Gamma, variabel respon (Y) berdistribusi Binomial Negatif, dengan amatan masing-masing sebanyak 200, pada software SAS 9.1.3. Langkah selanjutnya menganalisis data dengan menggunakan metode Regresi Poisson. Kemudian memeriksa terjadinya overdispersi pada Regresi Poisson. Jika terjadi overdispersi pada Regresi Poisson, akan dilanjutkan menganalisis data dengan menggunakan metode Regresi Binomial Negatif. Langkah terakhir mengidentifikasi kebaikan model Regresi Poisson dan Regresi Binomial Negatif dengan melihat nilai AIC, Devians, Pearson Chi-square, Log likelihood, dan Likelihood Ratio dalam permasalahan overdispersi.

  • 3.    Hasil dan Pembahasan

Deskripsi data variabel bebas X1 dan X2 serta variabel respon (Y) yang digunakan pada penelitian ini dapat dilihat pada Tabel 2.

Tabel 2. Deskripsi data variabel respon serta variabel-variabel bebasnya

Peubah

N

Rata-rata

(X)

Standar

Deviasi

Minimum

Maksimum

Ragam/ rata-rata

X1

200

0.9108

0.8629

0.0000337

4.3748

0.8175

X2

200

1.1154

0.9840

0.00408

5.3650

0.004343

Y

200

1.950

1.8590

0.00000

8.0000

1.7722

Hasil analisis Regresi Poisson untuk data tersebut diperoleh model sebagai berikut μ = expi'(-0.2988 + 0.4270 * X1 + 0.3891 * X2). Selanjutnya, pengecekan overdispersi pada Regresi Poisson dapat dilihat dari taksiran dispersi yaitu nilai Devians/DB dan Pearson Chi-square /DB pada Tabel 3 berikut.

Tabel 3. Taksiran Dispersi pada Regresi Poisson

Kriteria

DB

Nilai

Nilai/DB

Devians

197

265.7390

1.3489

Pearson Chi-square

197

227.7251

1.1560

Dari Tabel 3 terlihat bahwa nilai Devians/DB sebesar 1.3489 dan nilai Pearson Chi-square/DB sebesar 1.1560. Kedua nilai tersebut lebih besar dari 1 sehingga dapat disimpulkan pada data respon (Y) terjadi overdispersi. Pengujian taksiran dispersi (α) secara statistik dengan hipotesis: H0 : a = 1 H1 : a > 1 dengan nilai Devians sebesar 265.7390 dan Xo.o5;197 = 230.746. Nilai Devians lebih besar dari X197;o.o5, sehingga dapat diputuskan menolak H0 yang artinya

terjadi overdispersi pada Regresi Poisson. Hal ini berarti penggunaan model Regresi Poisson kurang tepat digunakan untuk menganalisi data tersebut, untuk itu dilakukan analisis dengan Regresi Binomial Negatif. Hasil analisis Regresi Binomial Negatif untuk data tersebut diperoleh model sebagai berikut:

μ = expE(-0,3796 + 0.4601 * X1 + 0.4231 * X2).

Penentuan model yang lebih baik antara model Regresi Poisson dan model Regresi Binomial Negatif pada data yang digunakan dapat dilihat dari hasil uji model terbaik Tabel 4 berikut

Tabel 4. Uji Model Terbaik

Kriteria

Regresi Poisson

Regresi Binomial Negatif

Devians/DB

1.3489

1.1503

Pearson Chi-square/DB

1.1560

0.9661

AIC

666.25

664.09

Log-likelihood

-65.8503

-63.7705

Tabel 4 memperlihatkan bahwa dari kriteria model terbaik berdasarkan nilai Devians/DB dan Pearson Chi-square/DB yang lebih mendekati 1, nilai AIC yang lebih kecil, dan nilai Log Likelihood yang lebih besar model Regresi Binomial Negatif lebih baik dibandingkan model Regresi Poisson.

Pengujian secara statistik dengan menggunakan nilai Likelihood Ratio dengan hipotesis sebagai berikut : H0 : κ = 0 (model Regresi Poisson = model Regresi Binomial Negatif), H1 : κ >0 (model Regresi Binomial Negatif lebih baik dari model Regresi Poisson). Berdasarkan Tabel 3.3 diperoleh nilai Likelihood Ratio = 2 × (-63.7705 - (-65.8503)) = 4.1596.

Dengan menggunakan taraf nyata a = 5%, nilai tabel /2.90;1 = 2.706, maka nilai Likelihood Ratio > 2.706, sehingga H0 ditolak yang berarti model Regresi Binomial Negatif lebih baik dibandingkan model Regresi Poisson.

  • 4.    Kesimpulan

Berdasarkan data simulasi yang dibangkitkan dari Software SAS 9.1.3 model Regresi Poisson untuk data tersebut adalah

μ = expi'(-0.2988 + 0.4270 * X1 + 0.3891 * X2)

sedangkan model Regresi Binomial Negatif untuk data tersebut adalah

μ = expE(-0,3796 + 0.4601 * X1 + 0.4231 * X2).

Berdasarkan nilai Devians, Pearson Chi-square, AIC, Log-likelihood, dan Likelihood Ratio diperoleh bahwa model Regresi Binomial Negatif lebih baik dibandingkan model Regresi Poisson.

Berdasarkan kesimpulan di atas disarankan pembangkitan data yang mengalami overdispersi pada Regresi Poisson perlu dilakukan dengan

membangkitkan parameter overdispersinya (κ). Selain itu, perlu dilakukan penelitian lanjutan untuk mengetahui kriteria data yaitu tingkat overdispersi yang cocok digunakan metode Regresi Binomial Negatif untuk mengatasi overdispersi pada Regresi Poisson.

Daftar Pustaka

  • [1]    Ismail, N. & Jemain, A.A. 2007. “Handling Overdispersion with Binomial Negative and Generalized Poisson Regression Models”. Casualty Actuarial Society Forum Casualty Actuarial Society – Arlington. Virginia:Winter,                                               103-158.

http://www.casact.org/pubs/forum/07wforum/07w109.pdf . Diakses 1 April 2012

  • [2]    McCullagh, P. & Nelder, J.A. 1989. Generalized Linier Models, second edition. London: Chapman & Hall.

  • [3]    Myers, R.H., Montgomery, D.C., Vining, G.G., & Robinson, T.J. 2010. Generalized Linier Models with Aplications in Engineering and the Sciences. Canada : A John Wiley & Sons, Inc., Publication.

  • [4]    Pamungkas, Dimas Haryanto. 2003. Kajian Pengaruh Overdispersi dalam Regresi Poisson. [Skripsi]. Tersedia : http://repository.ipb.ac.id.pdf. Diakses 18 September 2012.

10