UJI KENORMALAN UNIVARIAT: SUATU KAJIAN PUSTAKA
on
Jurnal Matematika, Vol. 1, No. 1, 2010, 21—30
UJI KENORMALAN UNIVARIAT: SUATU KAJIAN PUSTAKA
I WAYAN SUMARJAYA
Jurusan Matematika, FMIPA, Universitas Udayana Email: [email protected]
INTISARI
Sebagian besar prosedur statistika terutama inferensi statistika mengasumsikan distribusi sampel adalah normal. Asumsi kenormalan ini harus diuji untuk menjamin penggunaan statistik uji yang benar dan sesuai, sehingga nantinya diperoleh simpulan yang sahih. Penelitian ini membahas perkembangan uji-uji kenormalan univariat: uji berdasarkan fungsi distribusi empiris, uji berdasarkan momen, uji berdasarkan korelasi atau regresi, uji berdasarkan entropi sampel, uji berdasarkan metode kernel, uji berdasarkan karakteristik Polya, dan uji berdasarkan metode nonparametrik. Penelitian ini juga membahas uji kenormalan yang mampu mendeteksi pencilan dan uji omnibus yang mampu memberikan informasi tambahan tentang ketidaknormalan. sdfsdllflsdflskdflsklfkslfksdllskflskflsllsdfs
Kata kunci: uji kenormalan univariat, uji kenormalan omnibus.
UNIVARIATE NORMALITY TEST: A LITERATURE STUDY
I WAYAN SUMARJAYA
Mathematics Department, FMIPA, Udayana University Email: [email protected]
ABSTRACT
Almost all statistical procedures, especially statistical inference, assumed that the sample distribution is normally distributed. This normality assumption must be tested to ensure the correct use of the test statistic, hence resulting a correct conclusion. This research discusses some univariate normality tests: test based on empirical distribution function, test based on moments, test based on correlation or regression, test based on sample entropy, test based on kernel method, test based on Polya characteristics, and test based on nonparametric method. This research also discuss normality test that capable of detecting outliers and discuss omnibus test that can give additional information about nonnormality.
Keywords: univariate normality test, omnibus normality test.
Sebagian besar prosedur statistika terutama inferensi statistika mengasumsikan distribusi sampel adalah normal. Asumsi kenormalan ini perlu diuji untuk menjamin penggunaan statistik uji yang benar dan sesuai, sehingga nantinya diperoleh simpulan yang sahih, misalnya pada bidang kesehatan (lihat Lumley, 2002)
Secara umum, uji kenormalan dapat dikelompokkan ke dalam beberapa kategori: uji berdasarkan fungsi distribusi empiris, uji berdasarkan momen, uji berdasarkan korelasi atau regresi, uji berdasarkan entropi, uji berdasarkan karakteristik Polya, uji berdasarkan metode kernel, dan uji berdasarkan metode nonparametrik.
Studi komprehensif perbandingan uji-uji kenormalan telah dilakukan antara lain oleh Stephens (1972), Koziol (1986), Dufour et al.(1998), Seier (2002), Coin dan Corradetti (2006), Farrell dan Rogers-Stewart (2006), Yazici dan Yolacan (2007), Tanweer-ul-Islam (2008), Breton et al. (2008), dan Tanweer-ul-Islam dan Zaman (2008).
Penelitian ini juga membahas uji kenormalan yang mampu mendeteksi pencilan dan uji omnibus yang mampu memberikan informasi tambahan tentang ketidaknormalan distribusi alternatif.
-
2. METODE-METODE UJI KENORMALAN
UNIVARIAT
Uji tentang kenormalan dimulai pada awal 1900 oleh Karl Pearson (lihat Yazici dan Yolacan, 2007). Selanjutnya beberapa dekade setelah itu banyak peneliti mengembangkan statistik uji untuk uji kenormalan.
Uji fungsi distribusi empiris, disebut pula uji jarak (distance test), berdasarkan perbandingan antara fungsi distribusi empiris Fn (xi) = i / n dan
distribusi hipotesis di bawah kenormalan Zi yang biasanya didefinisikan sebagai
-
Z1 =φ{ x x ^ (1)
k s )
dengan x dan s masing-masing menyatakan rata-rata sampel dan simpangan baku sampel (lihat Dufour, et al. 1998; Lee, 1998). Secara umum uji fungsi distribusi empiris terbagi atas dua kelompok (Lee, 1998). Pertama, uji yang melibatkan supremum seperti uji Kolmogorov-Smirnov. Kedua, uji yang menghitung kuadrat perbedaan seperti uji Cramér-von Mises. Berikut akan diberikan uji-uji yang termasuk ke dalam kedua kelompok tersebut beserta modifikasinya.
Cramér (1928) mengusulkan statistik uji
VM = ∑n=i [z‘ - (2i — 1)/2n]2 +1 /(12n), (2)
dengan zi = Φ(e;in / s), i = 1, k , n; e:in adalah statistik terurut sisaan dan s = [(n - k)~1∑"=ι e2 ] 1/2. Statistik uji (2) disebut pula statistik uji Cramér-von Mises. Selanjutnya, Watson (lihat Stephens, 1972) memodifikasi statistik Cramér-von Mises pada persamaan (2) dan mengusulkan statistik
W = VM2 - n(z -1/2)2, (3)
dengan z = (1/ n)∑"=1 zi.
Uji fungsi distribusi empiris selanjutnya diusulkan oleh Kolmogorov (1933) dengan statistik uji berikut:
D+ = max[(i / n) - z i ], 1 ≤ i ≤ n;
D- = max[ z i - (i -1)/ n ], 1 ≤ i ≤ n; (4)
D = max( D+, D- );
dengan zˆi menyatakan distribusi normal standar dan n menyatakan jumlah sampel. Nilai-nilai kritis untuk uji Kolmogorov-Smirnov dapat dilihat pada Kolmogorov (1933).
Kemudian Anderson dan Darling (1952, 1954) mengusulkan statistik uji
AD = - n-1 ∑i=1(2 i-1)[ln zi+ ln(1 - z n ^)] - n, (5) dengan zi menyatakan peluang normal standar (lihat juga Yacizi dan Yolacan, 2007; Stephens, 1972; dan
Dufour et al. ,1998). Hipotesis nul akan ditolak apabila statistik uji (5) lebih dari 2,492 (lihat Yazici dan Yolacan, 2007).
Ajne (1968) mengusulkan statistik uji
AJ=(n /4)- (2/ n )∑n=2 ∑j=1 m ιj (6)
dengan nilai mj = xj -xi, jika χj -xi ≤ 1/2;
mj = 1 -(xj -xi) jika χj -xi > 1/2 .
Selanjutnya akan dibahas beberapa modifikasi terhadap statistik Kolmogorov-Smirnov.
-
2.1.1 Beberapa modifikasi terhadap statistik Kolmogorov-Smirnov dan Lilliefors
Kuiper (1962) memodifikasi statistik Kolmogorov-Smirnov pada persamaan (4), dengan statistik
V = D+ + D-. (7)
Selanjutnya modifikasi terhadap statistik Kuiper pada persamaan (7) dilakukan oleh Stephens (1970) dengan mengusulkan statistik
V* = V( n1/2 + 0,155 + 0,24n "1/2). (8)
Untuk menolak hipotesis nol, statistik uji pada persamaan (8) dibandingkan dengan 1,747 (lihat Yazici dan Yolacan, 2007).
Lilliefors (1967) mengamati bahwa jika satu atau lebih parameter harus diestimasi maka uji tabel standar Kolmogorov-Smirnov tidak lagi berlaku. Selanjutnya Lilliefors (1967) mengusulkan statistik uji
D* = max| F*(x) - Sn(x) |, (9)
x
dengan F* (x) menyatakan fungsi distribusi normal kumulatif dengan nilai tengah μ = x serta varians σ2 = s2 dan Sn (x) menyatakan fungsi distribusi kumulatif sampel. Secara paralel van Soest juga memodifikasi statistik Kolmogorov-Smirnov (lihat Molin dan Abdi, 1998; Abdi dan Molin, 2007). Modifikasi lain statistik uji Kolmogorov-Smirnov dilakukan oleh Stephens (1970) dengan statistik
V* = D( n1/2 + 0,12 + 0,11 n "1/2), (10)
dengan D menyatakan statistik Kolmogorov-Smirnov. Untuk menolak hipotesis nol nilai pada persamaan (10) dibandingkan dengan 1,358 (lihat Yazici dan Yolacan, 2007).
Drezner et al. (2008) juga memodifikasi statistik Kolmogorov-Smirnov dan mengusulkan statistik D(μ,σ) dengan vektor (μ, σ) adalah solusi yang meminimunkan masalah
min[ D (μ ,σ)], (11)
μ,σ
dengan
D (μ ,σ) = max[n-- φ('F J φ('F)- k-11 i ≤ k ≤ n
Nilai-nilai kritis untuk statistik (11) dapat dilihat pada Drezner et al. (2008).
Arcones dan Wang (2005) mengusulkan perbaikan terhadap statistik uji Lilliefors dengan mengenalkan dua uji berdasarkan proses-U, yaitu ~
statistik Dn,m dan statistik Dn,m . Statistik Dn,m didefinisikan sebagai
= E(X - μ)4 = E(X - μ)4 = [E(X-μ2)2]2 = σ4
D
n,m
= sup
t ∈ R
(n - m)!
n!
∑I(d∙ ≤ t)-Φ(t)
, (12)
(i 1, K,im )∈ Im
dengan nilai d * = σn^mml12 ∑ m=1(Xij- Xn ) ,
dari distribusi N(0,1) adalah 0 dan 3. Konsep momen ini dimunculkan pertama kali oleh Karl Pearson. Selanjutnya, momen ketiga disebut kepencongan (skewness) dan momen keempat disebut kurtosis. Dengan demikian penyimpangan dari kenormalan dapat diketahui dari nilai momen-momen yang diduga menggunakan sampel, yakni koefisien kepencongan b1 dan koefisien kurtosis
b2 yang dihitung sebagai
1"m = {(i1K; im ) ∈ Nm :1 ≤ ij≤ n, ij≠ ik } jika
j ≠ k
dan
dan
![](https://jurnal.harianregional.com/media/2905-1.png)
m3 (m2)3/2
‘" m)! Σ m- (∑' (X, ~ X, )f.
=Λ ij n
n! (<.., im )∈ Im
b2 =
m4 (m2)2
(18)
(19)
Menurut Arcones dan Wang (2005) hipotesis nol akan ditolak apabila untuk 0 < α < 1, nilai statistik
Uji Dn,m > bn,m,α dengan
bnmα = ιnf{Λ≥ 0: ∣Φ{Dnm < λ} ≥ 1 - α}.
~
Selanjutnya statistik Dn,m didefinisikan sebagai
~
D
n,m
= sup
t ∈ R
∑I(d** ≤ t)-d*** ≤ t, (13)
(i1, K,im )∈Im
dengan nilai d = m 1/2 ∑,=1( Xj — Xn) dan nilai
d ** = n 1∑ n=11 (Xj — Xn). Untuk statistik uji
dengan m j = (1/ n )∑ in (xi - x )j . Kepencongan
dan kurtosis dapat diukur dengan lebih dari satu cara. Salah satu ukuran kurtosis diusulkan oleh Geary (1947). Untuk pembahasan lebih lanjut tentang kepencongan dan kurtosis lihat DeCarlo (1997) dan Doric et al. (2009).
Uji-uji berdasarkan momen biasanya bersifat omnibus, artinya mampu memberikan informasi tambahan tentang ketidaknormalan distribusi alternatif melalui nilai kepencongan dan kurtosis (lihat Poitras, 2006).
Uji berdasarkan momen pertama kali diusulkan oleh Geary (1947) dengan statistik uji
persamaan (13), hipotesis nol akan ditolak apabila
~
Dn >C cntna dengan n , im n , im,
c.rn,„ = ιnf{λ ≥ 0: Pφ{D,,,m < λ} ≥ 1 - α}. (14)
a (c ) =
n-1∑/,∣
1 i=1
xi
![](https://jurnal.harianregional.com/media/2905-2.png)
- x |
![](https://jurnal.harianregional.com/media/2905-3.png)
/2 ,
(20)
2.1.2 Beberapa Modifikasi Terhadap Statistik Ajne
Stephens (1970) memodifikasi statistik yang diusulkan Ajne dengan statistik
AJ* = [AJ - (0,7/ n) + (0,9 / n 2)][1 + (1,23 / n)]. (15) Selanjutnya untuk menolak hipotesis nol statistik uji ini dibandingkan dengan 0,656 (lihat Yazici dan Yolacan, 2007).
dengan x menyatakan rata-rata sampel dan c adalah bilangan real taknegatif.
D’Agostino dan Pearson mengusulkan statistik uji menggunakan momen Pearson (lihat D’Agostino et al., 1990)
K2 = Z2 (√bT)+ Z2 (b2), (21)
yang berdistribusi χ 2(2). Pada persamaan (21) nilai Z2 ("Jb) dan Z2 (b 2) adalah pendekatan-pendekatan
normal terhadap b1 dan b2 .
2.2 Uji Kenormalan Berdasarkan Momen
Konsep uji berdasarkan momen adalah bahwa momen ketiga dan momen keempat yang diberikan oleh
Pendekatan pengujian menggunakan kepencongan b1 dan kurtosis b2 juga diusulkan
oleh Jarque dan Bera (1980, 1987) dan Bera dan
Jarque (1981) dengan statistik uji
E(X - μ)3 _ E(X - μ)2
[E(X -^2)2]3/2 = σ3
(16)
JB = n
W + (b2 - 3)2
6 24
Statistik JB secara asimtotis berdistribusi χ2 (2). Hipotesis nol akan ditolak apabila statistik JB lebih besar daripada nilai χ2 (2).
Hosking (1990) mengusulkan statistik uji berdasarkan momen-L. Misalkan Xi:n menyatakan statistik terurut tingkat ke-i dari suatu sampel berukuran n. Definisikan
Statistik pertama yang diusulkan Desmoulins-Lebeault (2004) untuk alternatif kepencongan positif adalah
∆1 = (d 12/ σss) + (d 22/ σsk). (28)
Untuk alternatif kepencongan negatif, statistik yang diusulkan adalah
λ = (1/2)E(X2:2 - X1J, λ3 = (1/3)E(X3:3 - 2X2:3 + X1:3).
(23)
Kepencongan-L didefinisikan sebagai T3 = λ3/ λ2. Menurut Hosking (1990) statistik
[(0,1866n 1 + 0,8n 2)'2∣τ (24)
berdistribusi normal.
Bontemps dan Meddahi (2002) mengusulkan model berdasarkan momen rampat (generalized method of moments). Misalkan suatu sampel x1 ,K, xn dari peubah acak X . Amatan ini bisa bebas atau tidak bebas. Diasumsikan distribusi
A2 = (d3 / σss ) + (d42/ σsk ).
Selanjutnya statistik ketiga
A3 = (max(| m+ |,| m |) - d5)2 (σss ) 1 + (max(| m4 |,| m- |) - d6)2(σskΓ1.
(29)
(30)
Menurut Desmoulins-Lebeault (2004) distribusi pengambilan sampel pasti dari distribusi semimomen tersebut belumlah diketahui. Oleh karena itu
Desmoulins-Lebeault (2004) menyediakan tabel nilai kritis untuk masing-masing ukuran sampel.
Lobato dan Velasco (2004) mengusulkan statistik kepencongan dan kurtosis rampat untuk data berkorelasi yakni
marjinal X adalah N(0,1) . Misalkan f1,K, fp adalah fungsi terdiferensialkan sedemikian hingga fi terdeferensialkan. Untuk setiap bilangan real x ∈ Rp dengan komponen (fi (x) - xf (x)) untuk i = 1, k , p . Didefinisikan matriks
∑ = ∑+LE [ g (x) g (x-h) T ]• (25) dan misalkan pula
a = n~1l2∑n=1g(x) → N(0,∑). (26) Bontemps dan Meddahi (2002) mendefinisikan statistik uji
aτΣ-1 a ~ χ2(p). (27)
Desmoulins-Lebeault (2004) mengusulkan tiga statistik uji berdasarkan metode semi-momen. Misalkan m- menyatakan penduga semi-
c= nμ3 n(/Z4 - 3∕z2)2
6 F<3 24 F(4)
(31)
dengan F( k) = ∑ ”J_n γ( J)k dan
Y(k) = n 1 ∑^1jl (xt - x)(xt+∣j∣ - x) .
Rana et al. (2009) mengusulkan uji momen diskala ulang tangguh (robust rescaled moment test) dengan statistik uji
3
RRM = — B1 l
2
Jn J
4 Λ \
+ ncΓ T -3
B 2 l Jn J
(32)
kepencongan kiri, m4 menyatakan penduga semikurtosis kanan, dan n adalah banyaknya amatan sampel yang diuji dan definisikan:
d 1 = m3 + [ n /(n +1)](2/π)12,
∑n
i=1∣ xi -med(xi)|, A = (π/2)1/2, m3 adalah momen sampel tingkat ketiga, mˆ 4 adalah momen sampel tingkat keempat, med(xi) adalah median sampel, nilai B1 dan B2 diperoleh dari simulasi Monte Carlo. Untuk tingkat signifikansi α = 0,05, Rana et al. (2009) merekomendasikan B1 = 6 dan B 2 = 64.
2.2.1 Beberapa modifikasi uji statistik Geary
d2 = m4+- [(n -1)/(n +1)](3∕2),
d 3 = m3+- [ n /(n +1)](2/π)1/2,
d4 = m^4-- [(n -1)/(n +1)](3/2),
d 5 = [ n /(n +1)](2/π)1/2,
d6 = [(n -1)/(n +1)](3/2), σss = 1,743795n-1 -10,062152n “2, σsk = 21,558373n 1 - 209,049576n .
Bonnet dan Seier (2002) mengusulkan dua uji omnibus menggunakan ukuran momen Geary, yaitu
G. = [z (JbJf + (z. )2 (33)
dan
G. = a (Jb )f + (-z J2 (34)
dengan a = n /[(n -2)^6/(n +1)],
τ = n∑n=1l xi-x l, σ = n∑n=1(xi-x)2 ,
ω = 13,29(lnσ - lnτ), dan
Zw = (n + 2)1'2(ω - 3)∕3,54. (35) Hipotesis nol akan ditolak jika statistik uji I zw l> zα/2 .
Cho dan Im (2002) memodifikasi statistik uji Geary dengan mengambil dua momen sampel pertama smj , yakni
smj = (1 / n)∑n=11 sgn(x - x)(x - x)j ∣, (36) untuk j = 1,2,3, κ.; selanjutnya jika dimisalkan aj = smj / σj, j = 1,2, k akan diperoleh statistik
(α1 - (2/^)1'2)2 a 2
. (1 - (3/ π)) + (3 - (8/π)) _
. (37)
Dalam kondisi kenormalan, statistik G mendekati distribusi χ 2(2) seiring dengan membesarnya
ukuran sampel.
Urzúa (2007) mengusulkan dua uji omnibus untuk kenormalan menggunakan ukuran kepencongan Pearson dan kurtosis Geary, yakni statistik
![](https://jurnal.harianregional.com/media/2905-4.png)
de
dan
U2
bb↑ (w - 3)
d ’ Te J
(38)
(39)
dengan d = 6(n - 2) /[(n +1)(n + 3)],
1^ = (w1, k , Iwk) adalah penduga dari nilai tengah asimtotik w = (w1, k , wk ). Statistik
BHS = n(ι^ - w)T Σk1 (ι^ - w)~ χ2(k), (41) dengan Σk adalah matriks kovarians dari distribusi bersama ukuran kepencongan dan kurtosis.
Chen dan Kuan (2003) mengusulkan versi uji JB rampat untuk normalitas bersyarat, yakni fungsi nilai tengah bersyarat berisi intersep tetapi tidak bergantung kepada galat masa lalu dan galat bersyarat bersifat heteroskedastik. Statistik yang diusulkan Chen dan Kuan (2003) adalah
CH = n[Sn Kn - 3]Σn1[Sn Kn - 3]T, (42) dengan n menyatakan banyak sampel, Sn = n 1 ∑^ , Kn = n-1 ∑^, dan ∑n1 adalah penduga konsisten matriks varians-kovarians asimtotik.
Bai dan Ng (2005) mengembangkan uji JB untuk deret waktu atau data tidak bebas. Statistik yang diusulkan Bai dan Ng (2005) adalah
π34 = π3 + π4. (43) Pada persamaan (43) nilai π3 = (n1l2∕^3)/s(/Z3), π4 = π4(3) = (n 1/2(k- κ))/s(κ), dan s (^ = (βΩΩβ/σ2)1/2.
Stfelec dan Stehlik (2009) mengusulkan kelas statistik tangguh JB yang didefinisikan oleh
e = 3,54/(n + 2), w = -6ln( a )'ln(π /2), dan
RT = ⅛) (Mj
Ci m α2/, 1 k i 2,j2 J
2.2.2 Beberapa modifikasi statistik uji JB
dengan Mi,j. =(1 ∕ n)∑" =1 φj (Xm - m(i)),
Urzúa (1996) mengusulkan modifikasi uji Jarque-Bera dengan statistik
JBU =
![](https://jurnal.harianregional.com/media/2905-5.png)
v1)2
v2 v3
(40)
i ∈ {0,1} menyatakan rata-rata aritmetika M0 = X atau median M1 = Mn, j ∈ {0,1,2,3,4} , dan φ0 = (π/2)1'2∣ x |. Selanjutnya φ1 = x, φ2 = x2, φ3 = x3, dan φ4 = x4 . Nilai C1 dan C2 diperoleh dengan simulasi Monte Carlo (lihat Stfelec dan Stehlík,2009).
Pada persamaan (40) nilai V1 = 3(n -1)/(n +1), v2 = 6(n - 2) /[(n +1)(n + 3)], dan
v3 = 24n(n - 2)(n - 3)/[(n +1)2(n + 3)(n + 5)].
Statistik JBU secara asimtotis juga berdistribusi χ 2(2).
Brys et al. (2004, 2008) mengamati bahwa uji berdasarkan momen memiliki kelemahan apabila data mengandung pencilan. Selanjutnya Brys et al. (2004) mengusulkan bentuk statistik uji JB rampat yang mampu menangai pencilan. Misalkan
2.3. Uji Kenormalan Berdasarkan Korelasi atau Regresi
Konsep dasar uji ini adalah plot peluang normal, yaitu teknik grafik untuk menentukan kenormalan data dengan melihat kelinearan dalam suatu plot dari amatan terurut melawan nilai harapan dari statistik terurut normal standar (Lee, 1998). Selanjutnya untuk menentukan kelinearan dapat digunakan teknik regresi atau teknik korelasi. Jika data normal maka kemiringan akan memberikan nilai simpangan baku
data dan intersep akan memberikan nilai tengah data
(Lee,1998).
melihat kelemahan statistik SW dan mengusulkan statistik
Shapiro dan Wilk (1965) mengusulkan statistik
⅛ n-1 aiX^ ∑( y- y )2
(44)
∑'-,[i -(n +1)/2]yi n2s
(49)
dengan yi menyatakan amatan terurut dan s
dengan
T / a mTV-1
a -(α,,K,an) - (mTv—1v-1m)l/2 , (45) mT - (m1,., mn) menyatakan vektor nilai harapan
normal standar statistik terurut, V - (v j) adalah
matriks kovarians n × n , dan yT — (y1,κ, Un)
menyatakan varians sampel.
Modifikasi selanjutnya dilakukan oleh Shapiro dan Francia (1972) yang menyarankan untuk mengabaikan suku kovarians dalam formula untuk mendapatkan berat, yakni memperlakukan amatan terurut seperti halnya saling bebas (lihat juga Dufour et al., 1998; Lee, 1998). Statistik yang diusulkan berbentuk
menyatakan vektor amatan acak terurut. Jika data normal maka statistik SW akan mendekati 1. Namun,
![](https://jurnal.harianregional.com/media/2905-6.png)
( n - k) s
(50)
jika data tidak normal maka SW akan lebih kecil daripada 1.
Tiku (1974) mengusulkan statistik yang membandingkan simpangan baku sampel dan
dengan bT - (b1,...,bn) - cT/(cTc)l/2. Statistik SF
simpangan baku statistik tersensor. Statistik ini dinyatakan sebagai
(46)
dengan A — 1 — q1 — q2, σ adalah simpangan baku
sampel, dan σc adalah simpangan baku yang dihitung dari sampel tersensor (lihat Tiku ,1974)
De Wet dan Venter (1972) mengusulkan statistik uji DW berdasarkan koefisien korelasi sampel antara data dan kuantil distribusi normal standar
DW - r2(x, h) (47) dengan r(x,h) adalah koefisien korelasi sampel antar x dan h . Vektor h pada persamaan (47) adalah vektor berdimensi n dengan elemen ke-sama dengan i /(n +1) kuantil distribusi normal standar.
Filliben (1975) mengusulkan statistik uji FI yang dihitung berdasarkan korelasi antar data dan median statistik terurut ke-i, yakni med(xi )
∑n
FI - i-1 (xi -x)(med(xi) -med(xf))
n
V∑i-1 (X -x)(med(Xi) -med(Xi))
(48)
2.3.1 Beberapa modifikasi terhadap statistik SW
Bobot yang diusulkan oleh Shapiro dan Wilk (1965) pada statistik uji (44) adalah berat optimal pendugaan kuadrat terkecil rampat dan sulit dihitung (lihat Dufour, et al. 1998). Shapiro dan Wilk (1965) memberikan tabel bobot dan titik-titik signifikan untuk ukuran sampel n ≤ 50. D’Agostino (1971)
mengganti V dengan I pada persamaan (50). Selanjutnya Weisberg dan Bingham (1975) memodifikasi statistik SF dengan mengganti nilai c dengan
1
i - (3/8) n + (1/4)
i -1,...,n;
(51)
dengan Φ-1 menyatakan inversi dari fungsi distribusi kumulatif normal (lihat Dufour et al., 1998; Lee, 1998). Pendekatan ini telah ditunjukkan sesuai untuk sampel kecil.
Sarkadi (1980) mengusulkan untuk melakukan transformasi sebelum menerapkan statistik SW. Lebih lanjut Sarkadi (1980) mengusulkan statistik uji untuk kasus multisampel. Misalkan untuk i -1,., r dan j - 1,k, ni peubah Xj menyatakan peubah-peubah acak bebas dengan fungsi distribusi F[(X -μi)/σi] dengan μi dan σi tidak diketahui.
Untuk kasus homoskedastik, yakni σ1 - ... - σr - σ
dengan ukuran sampel ni ≥ 2, Sarkadi (1980)
mengusulkan statistik dengan transformasi dua tahap, yakni
Yj- Xj- U1, dengan
∑ n-1 χi X
u. - ■ '—-+—in-
‘ ni+ (n)1/2 (ni)1/2
untuk i -1, k , r dan j -1,., ni - 2.
melakukan
(52)
(53)
Untuk kasus heteroskedastik dengan ukuran sampel ni ≥ 3 , Sarkadi (1980) mengusulkan statistik
Y -(X1- Ui) SY^ ij ij i S
dengan
dengan
U =
y ni-2 x.
Δ-∣ i=1 j
n + (2 n)
ini
-1
ini
(2ni)1/2
,
Vm,n(x1,
, xn)
S1= ]∑n=1( Xj- U)2 ,
= n 1∑ n=1log[( n/2 m)(x (t+m)
, (60) x( i - m))]
SYi = Ψ
ini
Si
\
1
m adalah bilangan bulat positif (lihat Baklizi dan Eidous, 2008).
Arizono, et al. (1989) mengusulkan uji entropi berdasarkan entropi Renyi. Entropi Renyi didefinisikan oleh
dengan ψn (x) adalah fungsi naik tegas sedemikian
hingga SY ~ (Si /σi)
Chen dan Shapiro (1995) dan Chen (2003) memodifikasi statistik SW dan mengusulkan statistik QH berdasarkan spacing yang dinormalkan, yakni
QH =
1 yn -1 y+ι - y t
(n -1) s ∑t=1 Hm - Hi’
(55)
dengan Hi =Φ 1[(i — 3/8)/(n +1/4)], Φ 1 adalah
inversi distribusi normal standar, s adalah
simpangan baku, dan yi adalah statistik terurut. Menurut Seier (2002) uji SW memiliki kelemahan apabila terjadi pembulatan terhadap data. Seier (2002) juga menemukan hal yang sama pada statistik QH dan mengusulkan modifikasi dengan bentuk
QH* = (1 - QH) n1/2. (56)
Coin (2008) memodifikasi statistik SW agar mampu menangani pencilan dengan menggunakan pencarian maju (forward search). Statistik yang diusulkan Coin (2008) adalah
WF= (ws ,κ,Ws ,κ,Ws ), (57) v S [(n+1)/2] ’ Sk S^n> v 7
dengan Sk adalah subsampel dari xLMS yakni penduga regresi kuadrat terkecil dari k amatan pertama.
-
2.4 Uji Kenormalan Berdasarkan Entropi Sampel
Entropi Shannon dari suatu fungsi distribusi F dengan fungsi densitas peluang f didefinisikan sebagai
f∞
f(x)lnf(x) dx (58)
"
(lihat Arizono et al., 1998; Park dan Park, 2003; Baklizi dan Eidous, 2008; Choi, 2008). Entropi dari 2
distribusi normal dengan varians σ adalah (2πeσ 2)1/2.
Vasicek (1975) mengusulkan uji entropi sampel dengan statistik uji exp[V (x , K,x )] m,n 1, , n
m,n ,
σ( x1,K, xn )
berdasarkan
(59)
H, (.f) = (1 - /l' ln f_[ f (x)]γ d■ (61)
dengan / > 0 dan / ≠ 1. Entropi ini disebut entropi tingkat / dari fungsi densitas peluang f. Apabila γ → 0, entropi Renyi akan tereduksi menjadi entropi Shannon. Selanjutnya Arizono, et al. (1989) mengusulkan statistik uji berdasarkan entropi Renyi
1
H,(f) = (1 - /) ln∫n[- F (P H1y dp. (62) 0 dp
Arizono et al. (1989) memperoleh nilai dugaan untuk (62)
//(/-1)
Hmn = ln n^ Σn=1(x+ m - X1-m t ^ ] 1/(1—^^)
Choi (2008) mengusulkan statistik uji untuk entropi sampel yang didefinisikan oleh
H'.- = R h ‘.Z X(t+m) - X(t-m))] ',!. (64)
Sn-1
dengan
Rm, n = exp[-(1 - 2 m / n )ψ(2 m) + ψ( n +1)
-
- 2/n∑m=1ψ(k + m -1)] ( )
dan Sn-1 = [n/(n -1)]1/2Sn.
-
2.5 Uji Kenormalan Berdasarkan Karakterisik Polya
Muliere dan Nikitin (2002) dan Litnova dan
Nikitin (2006) mengusulkan dua statistik uji kenormalan berdasarkan karakteristik Polya. Misalkan fungsi distribusi empiris dinyatakan oleh
Gn (t) = n- ∑n=11{Xt < t}, t ∈ R1, (66)
dan fungsi distribusi statistik-V dinyatakan oleh Rm, n (t) =
n-m (m!)-1 Σ (∑σI{aσ(⅜)X1 + L + aσ(m)Xm < t}) . 1'1 ,k, 1'm=1
Selanjutnya statistik uji yang diusulkan Litnova dan Nikitin (2006) berbentuk
B2,n =∫" [R2,n(t)-Gn(t)]dGn(t) (67)
"
dan
Cm, n =∫"[ Rmn (t) - Gn (t)] d Gn (t )■ m > 2. (68) "
untuk t ∈ R1.
wv* *
ii jj
= w(2)
( v. .* ii
v* jj
b
(75)
Ahmad dan Mugdadi (2003) mengusulkan metode kernel untuk menguji kenormalan. Misalkan x1, K ,xn adalah sampel acak dari suatu fungsi distribusi F dengan densitas f. Misalkan uii* = xi + xi* dengan fungsi densitas peluang h1 dan
vii* = xi - xi* dengan fungsi densitas peluang h2 . Misalkan pula h(u, v) menyatakan densitas bersama *
u dan v untuk semua i ≠ i = 1, K ,n . ii ii*
Selanjutnya penduga kernel h1 , h2 , dan h diberikan
oleh
h1(u) =
1
n(n -1)b
y..
i≠i
*
( u — u * ii
dan
hˆ2(v) =
1
n(n -1)b
∑
i≠i
*
( v
w
h(u, v) =
*
w
b
\
b
w
(69)
(70)
v-v ii
b
(71)
dengan b = bn adalah konstanta positif yang disebut
bandwidth dan w(.) adalah densitas terbatas simetrik yang disebut kernel. Diasumsikan w memiliki nilai tengah 0 dan varians tertentu µ2 (w) dan b → 0 sebagaimana n → ∞ . Selanjutnya apabila ingin 2
menguji H0 : f adalah N(µ,σ ) melawan
Ha : f bukan N(µ,σ2) maka ukuran δ yang
didefinisikan oleh
i∞ r∞
[h(u,v) - h1(u)h2(v)]2 du dv, (72)
-∞ -∞
dapat digunakan untuk mengukur kenormalan. Menurut Ahmad dan Mugdadi (2003) δ ≥ 0 dan δ= 0 jika dan hanya jika hipotesis nol benar. Lebih lanjut Ahmad dan Mugdadi (2003) memperoleh dugaan untuk (72)
wu* *
i≠i* j≠ j* l≠l* r≠r* ii jj
[wv + wv - 2wv ]
ii* jj* ll*rr* ii*ll*
dengan
wu
ii jj
= w(2)
( u... ii
b
(73)
(74)
Masing-masing statistik uji kenormalan memiliki keunggulan dan kelemahan masing-masing. Studi komprehensif menunjukkan bahwa uji yang berdasarkan fungsi distribusi empiris secara umum tidak mampu memberikan informasi lain tentang ketidaknormalan. Sebaliknya uji yang berdasarkan momen bersifat omnibus, tetapi tidak terlalu bagus untuk sampel berukuran kecil dan data yang berisi pencilan (lihat Poitras, 2006; Urzúa, 1996; Urzúa, 2007). Uji yang berdasarkan regresi atau korelasi biasanya memerlukan komputasi yang itensif pada saat menentukan bobot. Demikian pula dengan uji-uji yang berdasarkan entropi sampel, kernel, dan karakteristik Polya cenderung memberikan statistik uji yang memerlukan komputasi intensif, terutama simulasi Monte Carlo. Uji kenormalan akan senantiasa berkembang sesuai dengan cara pandang terhadap kenormalan. Sebagai contoh uji kenormalan berdasarkan transformasi proses empiris (Cabaña dan Cabaña, 2003), uji berdasarkan informasi Fisher (Lee, 1998), uji menggunakan statistik Q (Zhang, 1999), dan uji berdasarkan jarak L2 - Wasserstein (Del Barrio, et al. 1999).
DAFTAR PUSTAKA
Abdi, H. and Molin, P. 2007. Lilliefors/Van Soest’s Test of Normality. In Neil Salkind (Ed.) Encyclopedia of Measurements and Statistics. Thousand Oaks (CA); Sage
Ahmad, I. A. and Mugdadi, A. R. 2003. Testing for Normality Using Kernel Methods. Nonparametric Statistics. 58(3): 273—288.
Ajne, B. 1968. A Simple Test for Uniformity of a Circular Distribution. Biometrika. 55: 343—354.
Anderson, T. W. and Darling, D. A. 1952. Asymptotic Theory of Certain “Goodness of Fit” Criteria Based on Stochastic Process. The Annals of Mathematical Statistics. 23: 193–212.
Anderson, T. W. and Darling, D.A. 1954. A Test of Goodness-of-fit. Journal of American Statistical Association. 49:765—769.
Arcones, M. A. and Wang, Y. 2006. Some New Tests for Normality Based on U-process. Statistics and Probability Letters. 76:69—82.
Arizono, I., Kittaka, A., and Ota, H. 1989. A Test of Normality Based on Generalized Entropy. Bulletin of University of Osaka Prefecture. Series A. Engineering and Natural Sciences. 37(2): 153—160.
Bai, J. and Ng, S. 2005. Tests for Skewness, Kurtosis, and Normality for Time Series Data. Journal of Business and Economic Statistics. 23(1): 49—60.
Baklizi, A. and Eidous, O. 2008. Goodness of Fit Tests for Normality Based on Kernel Entropy Estimators. Bulletin of Statistics and Economics. 2(A08): 19—25.
Bera, A. K. and Jarque, C. M. 1981. Efficient Tests for Normality, Homoscedasticity and Serial Independence of Regression Residuals: Monte Carlo Evidence. Economics Letters. 7: 313—318.
Bonett, D. G. and Seier, E. 2002. A Test of Normality with High Uniform Power. Computational Statistics and Data Analysis. 40: 435—445.
Bontemps, C. and Meddahi, N. 2002. Testing Normality: A GMM Approach. Cahier 2002-14. Alamat https://papyrus.bib.umontreal.ca:8443/dspace/bits tream/1866/485/1/2002-14.pdf diakses tanggal 30 April 2010.
Breton, M. D., Devore, M. D., and Brown, D. E. 2008. A Tool for Systematically Comparing the Power of Tests for Normality. Journal of Statistical Computation and Simulation. 78(7): 623—638.
Brys, G., Hubert, M., and Struyf, A. 2004. A Robustification of the Jarque-Bera Test of Normality. In COMPSTAT’ 2004 Symposium. 753—760.
Brys, G., Hubert, M., and Struyf, A. 2008. Goodness-of-fit Tests Based on a Robust Measure of Skewness. Computational Statistics. 23:429—442.
Cabaña, A. and Cabaña, E. M. 2003. Tests of Normality Based on Transformed Empirical Process. Methodology and Computing in Applied Probability. 5: 309—335.
Chen, L. 2003. C470. Normality Tests Based on Weighted Order Statistics. In Comments, Conjectures, and Conclusion. Section Editor: I. J. Good. Journal of Statistical Computation and Simulation. 73(8): 603—617.
Chen, L. and Shapiro, S. S. 1995. An Alternative Test for Normality Based on Normalized Spacings. Journal of Statistical Computation and Simulation. 53: 269—288.
Chen, Y-T. and Kuan, C-M. 2003. A Generalized Jarque-Bera Test of Conditional Normality. IEAS Working Paper IEAS Institute of Economics, Academia Sinica, Taipei, Taiwan. Alamat http://idv.sinica.edu.tw/ckuan/pdf/jb01.pdf diakses tanggal 30 April 2010, 1—11.
Cho, D. W. and Im, K. S. 2002. A Test of Normality Using Geary’s Skewness and Kurtosis Statistics. Alamat http://www.bus.ucf.edu/wp/content/archives/nor malit.PDF diakses tanggal 30 April 2010.
Choi, B. 2008. Improvement of Goodness-of-fit Test for Normal Distribution Based on Entropy and Power Comparison. Journal of Statistical Computation and Simulation. 78(9):781—788.
Coin, D. 2008. Testing Normality in the Presence of Outliers. Statistical Methods and Applications. 17: 3—12.
Coin, D. and Corradetti, R. 2006 Tests for Normality: Comparison of Powers (Test di Normalità: Confronto delle Potenze). Alamat http://sis-statistica.it/files/pdf/atti/Spontanee2006_177-
180.pdf diakses tanggal 30 April 2010. 177— 180.
Cramér, H. 1928. On the Composition of Elementary Errors. Skandinavsk Aktuarietidskrift. 11: 141— 180.
D’Agostino, R. B. 1971. An Omnibus Test of Normality for Moderate and Large Size Samples. Biometrika. 58(2): 341—348.
D’Agostino, R. B., Belanger, A. and D’Agostino Jr., R. B. 1990. A Suggestion for Using Powerful and Informative Tests of Normality. The American Statistician. 44 (4): 316—321.
De Wet, T. and Venter, J. H. 1972. Asymptotic Distribution of Certain Test Criteria of Normality. South African Statistics Journal. 6: 135—149.
DeCarlo, L. T. 1997. On the Meaning and Use of Kurtosis. Psychological Methods. 2(3): 292—307.
Del Barrio, E. Cuesta-Albertos, J. A., Matrán, C. and Rodríguez- Rodríguez, J. M. 1999. Tests of Goodness of Fit Based on the L2 Distance. The Annals of Statistics. 27(4): 1230—1239.
Desmoulins-Lebeault, F. 2004. Semi-moments Based Tests of Normality and the Evolution of Stock Returns Towards Normality. French Finance Association Meeting 16—17 December 2004. BNP—PARIBAS. Paris. Alamat http://www.en.affi.asso.fr/uploads/Externe/36/CT R_FICHIER_108_1226315203.pdf diakses tanggal 30 April 2010.
Doric, D., Nikolic-Doric, E., Jevremovic, V., and Malisic. 2009. On Measuring Skewness and Kurtosis. Qual. Quant. 43: 481—493.
Drezner, Z., Turel, O., and Zerom, D. 2008. A Modified Kolmogorov-Smirnov Test for Normality. Munich Personal RePEc Archive (MPRA) Paper No. 14385. Alamat http://mpra.ub.uni-muenchen.de/14385 diakses tanggal 30 April 2010.
Dufour, J-M., Farhat, A., Gardiol, L. and Khalaf, L. 1998. Simulation-based Finite Sample Normality Tests in Linear Regressions. Econometrics Journal. 1: 154—173.
Farrell, P. J. and Rogers-Stewart, K. 2006. Comprehensive Study of Tests for Normality and Symmetry: Extending the Spiegelhalter Test. Journal of Statistical Computation and Simulation. 76(9): 803—816.
Filliben, J. J. 1975. The Probability Plot Correlation Coefficient Test for Normality. Technometrics. 17(1): 111—117.
Geary, R. C. 1947. Testing for Normality. Biometrika. 34(3/4):209—242.
Hosking, J. R. M. 1990. L-moments: Analysis and Estimation of Distributions using Linear Combination of Order Statistics. Journal of the Royal Statistical Society, Series B. 52: 105—124.
Jarque, C. M. and Bera, A. K. 1980. Efficient Tests for Normality, Homoscedasticity and Serial Independence of Regression Residuals. Economics Letters. 6. 255—259.
Jarque, C. M. and Bera, A. K. 1987. A Test for Normality of Observations and Regression Residuals. International Statistical Review. 55(2):163—172.
Kolmogorov, A. N. 1933. Sulla Determinazione Empirica di Une Legge di Distribuzione. Giornale dell’Intituo Italiano degli Attuari. 4: 83—91.
Koziol, J. A. 1986. Relative Efficiencies of Goodness of Fit Procedures for Assessing Univariate Normality. Annals of the Institute of Statistical Mathematics. 38(Part A): 485—493.
Kuiper, N. H. 1962. Test Concerning Random Points on a Circle. Proceedings of the Koninklijks Nederlandse Akademie van Wetenschappen, Series A. 63. 38—47.
Lee, Y-H. 1998. Fisher Information Test of Normality. PhD Thesis. Virginia Polytechnic Institute and State University.
Litvinova, V. V. and Nikitin, Y. Y. 2006. Two Families of Normality Tests Based on Polya-Type Characterization and Their Efficiencies. Journal of Mathematical Sciences. 139(3): 6582—6588.
Lilliefors, H. W. 1967. On the Kolmogorov-Smirnov Test for Normality with Mean and Variance Unknown. Journal of the American Statistical Association. 62(318): 399—402.
Lobato, I. N. and Velasco, C. 2004. A Simple Test of Normality for Time Series. Econometric Theory. 20. 671—689.
Lumley, T., Diehr, P., Emerson, S., and Chen, L. 2002. The Importance of the Normality Assumption in Large Public Health Data Sets. Annual Review of Public Health. 23: 151—169.
Molin, P., and Abdi, H. 1998. New Tables and Numerical Approximation for the Kolmogorov-Smirnov/Lilliefors/Van Soest Test of Normality. Technical Report University of Bourgogne. Alamat
http://www.utd.edu/~herve/MolinAbdi1998-LillieforsTechReport.pdf diakses tanggal 30 April 2010.
Muliere, P. and Nikitin, Y. 2002. Scale-invariant Test of Normality Based on Polya’s Characterization. Metron. 60 (1-2): 21—33.
Park, S. and Park, D. 2003. Correcting Moments for Goodness of Fit Tests Based on Two Entropy Estimates. Journal of Statistical Computation and Simulation. 73(9): 685—694.
Poitras, G. 2006. More on the Correct Use of Omnibus Tests for Normality. Economic Letters. 90:304— 309.
Rana, M. S., Midi, H., and Rahamtullah, A.H.M. 2009. A Robust Rescaled Moment Test for Normality in Regression. Journal of Mathematics and Statistics. 5(1): 54—62.
Sarkadi, K. 1980. Testing for Normality. Mathematical Statistics Banach Center Publications. 6: 281— 287.
Seier, E. 2002. Comparison of Tests for Univariate Normality. InterStat. Alamat http://interstat.statjournals.net/YEAR/2002/article s/0201001.pdf diakses tanggal 30 April 2010.
Shapiro, S. S. and Francia, R. S. 1972. An Approximate Analysis of Variance Test for Normality. Journal of the American Statistical Association. 67:215— 217.
Shapiro, S. S. and Wilk, M.B. 1965. An Analysis of Variance Test for Normality (Complete Samples). Biometrika. 52(3/4): 591—611.
Stephens, M. A. 1970. Use of Kolmogorov-Smirnov, Cramér-von Mises and Related Statistics without Extensive Tables. Journal of Royal Statistical Society, Series B. 32(1): 115—122.
Stephens, M. A. 1972. EDF Statistics for Goodness-of-Fit: Part I. Technical Report No. 186. Stanford University California.
Strelec, L. and Stehlik, M. 2009. On Robust Testing for Normality. Proceedings of the Sixth St. Petersburg Workshop on Simulation. 755—759.
Tanweer-ul-Islam. 2008. Normality Testing—A New Direction. Munich Personal RePEc Archive (MPRA) Paper No. 16452. Alamat http://mpra.ub.uni-muenchen.de/16452 diakses tanggal 30 April 2010.
Tanweer-ul-Islam and Zaman A. 2008. Normality Testing—A New Direction. Alamat http://www.economics.smu.edu.sg/femes/2008/C S_info/papers/418.pdf diakses tanggal 30 April 2010.
Thadewald, T. and Büning, H. 2007. Jarque-Bera Test and Its Competitors for Testing Normality—A Power Comparison. Journal of Applied Statistics. 34(1): 87—105.
Tiku, M. L. 1974. Testing Normality and Exponentiality in Multi-sample Situations. Communications in Statistics. 3(8): 777—794.
Urzúa, C. M. 1996. On the Correct use of Omnibus Tests for Normality.Econometric Letters.53: 247—251.
Urzúa, C. M. 2007. Portable and Powerful Tests for Normality. Latin American Meeting of the Econometric Society. Universidad de los Andes. Bogotá. Colombia. Octubre. Internacional. Alamat http://www.webmeets.com/files/papers/LACEA-LAMES/2007/591/Portable.pdf diakses tanggal 30 April 2010.
Vasicek, O. 1975. A Test for Normality Based on Sample Entropy. Journal of the Royal Statistical Society, Series B, 38: 54—59.
Weisberg, S. and Bingham, C. 1975. An Approximate Analysis of Variance Test for Non-normality Suitable for Machine Calculation. Technometrics. 17: 133—134.
Yazici, B. and Yolacan, S. 2007. A Comparison of Various Tests of Normality. Journal of Statistical Computation and Simulation. 77(2): 175—183.
Zhang, P. 1999. Omnibus Test of Normality Using the Q Statistic. Journal of Applied Statistics. 26(4): 519—528
Discussion and feedback