BOOTSTRAP AGGREGATING (BAGGING) REGRESI LOGISTIK ORDINAL UNTUK MENGKLASIFIKASIKAN STATUS GIZI BALITA DI KABUPATEN KLUNGKUNG
on
E-Jurnal Matematika Vol. 5 (3), Agustus 2016, pp. 103-110
ISSN: 2303-1751
BOOTSTRAP AGGREGATING (BAGGING) REGRESI LOGISTIK ORDINAL UNTUK MENGKLASIFIKASIKAN STATUS GIZI BALITA DI KABUPATEN KLUNGKUNG
Palupi Purnama Sari1§, Made Susilawati2, I Gusti Ayu Made Srinadi3
1Jurusan Matematika, Fakultas MIPA – Universitas Udayana [Email: [email protected]] 2Jurusan Matematika, Fakultas MIPA – Universitas Udayana [Email: susilawati.made@gmail.com] 3Jurusan Matematika, Fakultas MIPA – Universitas Udayana [Email: [email protected]]
§Corresponding Author
ABSTRACT
This research was conducted to determine the variables that significantly influence nutritional status of children based on indicators that defined as height for age (H/A) and to classify children nutritional status into normal, short or very short categories. Height for age (H/A) is indicator used to describe the circumstances of malnutrition short. Short children (stunting) is children who fail to reach optimal growth. The secondary data was list of 116 data of children aged 24-59 months at UPT. Puskesmas Klungkung I in 2015. The method was used was ordinal logistic regression and bagging ordinal logistic regression. Based on the research results, it was obtained variables children body length at birth, birth weight, and length of mid-upper arm circumference (MUAC) in pregnant woman were significantly affects the nutritional status of children by the classification accuracy level of ordinal logistic regression 62,86% and misclassification 37,14%. Classification accuracy of ordinal logistic regression can be improved by bagging ordinal logistic regression method. Bagging works well on classification method which has unstable procedures. One of classification method which has unstable procedures is ordinal logistic regression. Bagging ordinal logistic regression method by 501 times replication capable to improve classification accuracy of ordinal logistic regression model from 62,86% to 68,57%, increased 5,71%.
Keywords: Bootstrap Aggregating (bagging), Ordinal Logistic Regression
Klasifikasi regresi logistik yang didasarkan pada pendekatan analisis regresi linear, merupakan metode yang sangat populer dalam mengatasi masalah-masalah klasifikasi (Subianto, 2009). Regresi logistik dengan variabel respons kategori berskala ordinal biasa disebut dengan regresi logistik ordinal. Ketepatan suatu klasifikasi regresi logistik ordinal dapat dihitung dengan menggunakan alat ukur apparent error rate (APER) (Johnson & Winchern, 2007). Peningkatan ketepatan klasifikasi dapat dilakukan dengan pendekatan bootstrap aggregating (bagging). Bagging bekerja dengan baik pada metode klasifikasi yang menghasilkan parameter tidak stabil, yang mana perubahan kecil pada data set akan
menghasilkan perubahan besar pada model yang diperoleh (Breiman, 1996). Salah satu metode klasifikasi yang tidak stabil adalah regresi logistik ordinal.
Pada penelitian sebelumnya, berkaitan dengan peningkatan klasifikasi dengan metode bagging telah dilakukan oleh Insani, et al (2015) yang mengaplikasikan metode bootstrap aggregating regresi logistik ordinal untuk memperoleh model dan peningkatan ketepatan klasifikasi regresi logistik ordinal pada kasus kanker serviks. Selanjutnya, Akbar, et al (2010) melakukan perbandingan klasifikasi status gizi balita dengan metode cluster dan WHO-NCHS berdasarkan survei kekurangan energi protein (KEP) di Kabupaten Nganjuk, untuk memperoleh model dan peningkatan klasifikasi dilakukan dengan pendekatan bagging regresi
logistik ordinal. Berdasarkan penelitian sebelumnya, diperoleh hasil bahwa bagging dapat meningkatkan ketepatan klasifikasi dari model data set tunggal (regresi logistik ordinal).
Penelitian ini dilakukan untuk
mengaplikasikan metode bootstrap aggeragting (bagging) regresi logistik ordinal untuk mendapatkan model dan mengklasifikasi status gizi balita di Kabupaten Klungkung ke dalam kategori normal, pendek dan sangat pendek. Kemudian, dibandingkan ketepatan klasifikasi antara regresi logistik ordinal dan bagging regresi logistik ordinal untuk dilihat adanya peningkatan tingkat ketepatan klasifikasi.
Salah satu indikator kesehatan yang dinilai pencapaiannya dalam Millenium Development Goals (MDG’s) adalah status gizi balita (Dinas Kesehatan Provinsi Bali, 2014) Status gizi berdasarkan indikator tinggi badan menurut umur (TB/U) digunakan untuk menggambarkan keadaan kurang kronis, yaitu gizi pendek (stunting). Prevalensi balita stunting di Provinsi Bali meningkat sebesar 1,6% yaitu dari 31% pada tahun 2007 menjadi 32,6% pada tahun 2013 di Indonesia. Hasil Riskesdas tahun 2013, Kabupaten Klungkung memiliki prevalensi stunting sebesar 19,3% yang berada pada urutan kelima di Provinsi Bali (Kementerian Kesehatan, 2013).
Analisis data kategori menggunakan regresi logistik bertujuan untuk mendapatkan model terbaik dan sederhana untuk menjelaskan hubungan antara keluaran dari variabel respons (K) dengan variabel-variabel prediktornya (X) (Hosmer & Lemeshow, 2000). Regresi Logistik adalah model regresi yang digunakan apabila variabel respons bersifat kualitatif. Suatu variabel respons Y berskala ordinal dapat terdiri dari X + 1 nilai dinyatakan dengan 0,1,2,..., K. Ekspresi umum peluang bersyarat Y — p: pada vektor dari variabel prediktor adalah
P[ Y — k∖x] — φ k(x). Misalkan φ k(x~) —
πk(x), maka untuk K — 0,1,2, model yang terbentuk dijelaskan oleh persamaan berikut:
1
p (Y — 0∖χ) —-----—-----— — φ (x)
1 + egiw + ggzCO ^ov j
e g i W
P ( Y — 1∖x) —------rr:-----— — φ 1(χ)
1 + egi⅛) + eg2⅛) n j
eg 2 CO
p( Y — 2∖χ) — ------—-----— — φ2(x) ,
1 + egι(O + eg2(O a
sehingga bentuk persamaan tersebut adalah sebagai berikut:
eg k (O
P(Y — k∖x) — ∑^ eg.w , (1)
dengan g 0(x) — 0,dan k — 0,1,..., K.
Pada regresi logistik ordinal, model dapat diperoleh dengan model odds proporsional (proportional odds model). Model logit ini merupakan model yang didapatkan dengan membandingkan peluang kumulatif yaitu peluang kurang dari atau sama dengan kategori respons ke- pada variabel prediktor yang dinyatakan dalam vektor x, P( Y ≤ ⅛∖x), dengan peluang yang lebih besar dari kategori respons ke-⅛, P(Y > ⅛∖x) yang didefinisikan sebagai berikut:
logit P0'≤⅛) = ⅞(x) = ln|gg| ( •'Λ.∣Λ)J
= 1 r φ0ω+Φιω+■+Φkω 1
[Φfc+1 (x)+φk+2(χ++■■•+Φ,fh)J
— ⅞ + x'β,
(2)
untuk k — 0,1,2,... K — 1.
Metode yang paling umum digunakan untuk menduga parameter pada model regresi logistik adalah metode maksimum likelihood (method of maximum likelihood). Bentuk umum dari likelihood untuk sampel dari amatan yang saling bebas (zi,xi),i. — 1,2,... ,n; adalah sebagai berikut
l(β) — ∏F=1EΦo(xi)z° i × φι(xi)zii × . × φκ(χiyκi],
(3) dengan ( ) merupakan fungsi dari parameter yang tidak diketahui dan — ( , ,. ) dibentuk dari respons yang ordinal.
Metode kemungkinan maksimum memberikan nilai penduga dari vektor βk, — ( , ,. ) dengan memaksimumkan fungsi kemungkinan bersama pada persamaan (3). Logaritma dari fungsi kemungkinan bersamanya dapat ditulis sebagai berikut:
L(β) — ∑?= 0Z0 iln [φo(xt)] + ■ + zm ln[φh(¾)]∙
Pengujian terhadap parameter-parameter estimasi model dilakukan untuk mengetahui peran seluruh variabel prediktor baik secara
simultan (bersama-sama) maupun secara parsial. Untuk pengujian parameter secara bersama dapat digunakan uji keberartian model yaitu uji G. Statistik uji G dinotasikan sebagai berikut:
G = -2 ln[⅛
Sedangkan pengujian parameter β secara parsial dilakukan dengan membandingkan model terbaik yang dihasilkan oleh uji simultan terhadap model tanpa variabel bebas di dalam model terbaik. Statistik ujinya adalah:
^ SE (βf
Statistik uji Wald mengikuti sebaran normal baku Z, H0 akan ditolak jika W > Za/2 atau PvaIue < a-
Estimasi model logit regresi logistik ordinal dibentuk berdasarkan pengujian secara parsial. Berdasarkan persamaan model logit, akan dilakukan prosedur pengklasifikasian status gizi balita.
Prosedur klasifikasi adalah suatu evaluasi untuk melihat peluang kesalahan klasifikasi (misclassification) dari fungsi klasifikasi. Prosedur klasifikasi yang baik ditentukan dengan nilai misklasifikasi yang kecil. Terdapat alat ukur yang dapat digunakan untuk menentukan kesalahan klasifikasi yaitu apparent error rate (APER). Penentuan kesalahan pengklasifikasian dapat diketahui melalui tabel klasifikasi (Johnson & Wichern, 2007).
Tabel 1. Tabel Klasifikasi
Keanggotaan sebenarnya |
Keanggotaan prediksi |
Total | ||
π1 |
^2 |
π3 | ||
πi |
ni2 |
ni3 |
A | |
π2 |
¾1 |
n22 |
n23 |
B |
π3 |
∏31 |
n32 |
n33 |
C |
Total |
D |
E |
F |
G |
Sehingga kesalahan klasifikasi dapat dirumuskan dalam:
ApER = («n + no+ihi+^^
Nilai ketepatan klasifikasi (correct
classification) dirumuskan dalam: 1 — A P ER.
Bootstrap Aggregating (Bagging) merupakan sebuah metode yang diusulkan oleh Breiman. Metode ini digunakan sebagai alat untuk memperbaiki stabilitas dan kekuatan prediksi dengan cara mereduksi variansi dari suatu prediktor pada metode klasifikasi dan regresi yang penggunaannya tidak dibatasi hanya untuk memperbaiki estimator. Versi berganda dibentuk dengan replikasi bootstrap dari sebuah data set.
Ambil bootstrap sampel dengan pengulangan {L(b)} dari data set L dan membentuk { ((XiE^b))}. Jika y merupakan data numerik, diberikan φB sebagai
φ B (x) = averageBp(x,Lw) (4)
Jika y merupakan kelas label, maka untuk menentukan kategori dengan melakukan voting atau average pada { p(x,L(B))} dari pB(x). Metode bootstrap yang seperti ini dinamakan bootstrap aggregating (bagging).
Bagging bekerja dengan baik pada metode klasifikasi yang menghasilkan parameter yang tidak stabil, yang mana perubahan kecil pada data set akan menghasilkan perubahan besar pada model yang diperoleh. Beberapa metode yang tidak stabil adalah neural networks, regresi, klasifikasi, dan regresi pohon (regression tree). Sedangkan contoh metode yang stabil adalah k-nearest neighboor (Breiman, 1996).
Data yang digunakan pada penelitian ini adalah data sekunder dari penelitian Suciari (2015). Penelitian ini mengenai status gizi balita berdasarkan indikator tinggi badan menurut umur (TB/U) yang menggambarkan keadaan kurang gizi pendek (stunting), dengan objek balita umur 24-59 bulan di UPT. Puskesmas Klungkung I pada tahun 2015. Variabel respons yang digunakan pada penelitian ini terdiri atas normal, pendek, dan sangat pendek. Sedangkan variabel prediktor yang digunakan meliputi umur balita, jenis kelamin balita, panjang badan balita saat lahir, berat badan lahir, umur pemberian MP-ASI (UMPASI), status anemia
ibu saat hamil, panjang lingkar lengan atas (LILA) ibu saat hamil, pendidikan ibu, status pekerjaan ibu, dan umur ibu.
Pada penelitian ini digunakan metode bagging regresi logistik ordinal dengan replikasi bootstrap (B). Replikasi B yang digunakan adalah 51, 61, 71, 81, 91, 101, 151, 201, 301, 401, dan 501. Adapun tahapan analisis data penelitian, yaitu:
-
1. Melakukan persiapan data dan membagi data menjadi data training dan testing masing-masing sebanyak 70% dan 30%.
-
2. Menentukan estimasi model regresi logistik ordinal pada data training.
-
3. Melakukan pengujian signifikansi parameter terhadap variabel respons secara simultan dan parsial.
-
4. Menentukan prediksi variabel respons dari model bagging regresi logistik ordinal dan menghitung tingkat ketepatan klasifikasi pada data testing.
-
5. Mengambil data (ℒB) dari data training ℒ untuk setiap replikasi sebanyak B.
-
6. Menentukan estimasi model bagging regresi logistik ordinal hasil sampel bootstrap ℒB.
-
7. Menentukan prediksi variabel respons dari model bagging regresi logistik ordinal untuk setiap replikasi menggunakan data testing.
-
8. Mengulang langkah 5 sampai langkah 7 sebanyak B kali.
-
9. Menentukan prediksi kelas maksimum dengan majority voting dan menghitung nilai kesalahan klasifikasi bagging ( ̅B) pada data testing.
-
10. Memperoleh model bagging regresi logistik ordinal pada setiap replikasi B kali.
-
11. Membandingkan tingkat ketepatan
klasifikasi model regresi logistik ordinal dan bagging regresi logistik ordinal.
Analisis Regresi Logistik Ordinal
Pembentukan estimasi model regresi logistik ordinal, menggunakan data training sebanyak 70% dari 116 data status gizi balita.
Pengujian koefisien regresi secara simultan bertujuan untuk mengetahui pengaruh variabel prediktor terhadap variabel respons secara simultan (bersama-sama). Untuk pengujian parameter secara simultan dapat digunakan uji keberartian model yaitu uji G dengan hipotesis sebagai berikut:
H0 : = =⋯= =0 (tidak ada pengaruh sekumpulan variabel prediktor terhadap variabel respons),
H^ : minimal ada satu βi≠0.
Tabel 2. Statistik Uji G
Model |
-2 Likelihood Ratio |
Chisquare |
df |
Pr (Chi) |
Model1 Model2 |
133,5428 102,0224 |
31,5204 |
10 |
0,000481 |
Berdasarkan nilai Pr(Chi) pada Tabel 2 sebesar 0,000481 < a = 0,05, maka keputusan tolak Hq dan terima H^ . Hal ini berarti terdapat minimal satu variabel respons yang berpengaruh terhadap status gizi balita.
Selanjutnya, dilakukan uji parsial. Hipotesis yang digunakan untuk pengujian secara parsial yaitu:
Hq : =0 (tidak ada pengaruh variabel bebas
yang diuji terhadap variabel respons),
H^ : ≠0 (terdapat pengaruh variabel bebas
yang diuji terhadap variabel respons).
Hasil pada Tabel 3. menunjukkan bahwa hasil pengujian parameter secara parsial menjelaskan variabel panjang badan lahir (X3), berat badan lahir (X4), dan panjang LILA ibu saat hamil ( ^7 ) memiliki nilai signifikansi a < 0,05 atau dengan kata lain tolak Hq , sehingga dapat diketahui bahwa variabel-variabel tersebut memiliki pengaruh signifikan terhadap status gizi balita.
Model logit regresi logistik ordinal atau model regresi logistik ordinal berganda yang dapat dibentuk berdasarkan pengujian secara parsial adalah sebagai berikut:
C1 (X) =-24,844-0,3181X3 - 0,0022X^ + 0,3442x7 ,
(5)
c3 (X) = -22,231 - 0,3181X3 - 0,0022Xi + 0,3442χ7 .
(6)
Tabel 3. Pengujian Parameter Secara Parsial
Variabel |
Koefisien |
Std.error |
t-value |
p-value |
■^1 : umur balita |
-0,064 |
0,0319 |
-0,1991 |
0,8422 |
■^2 : jenis kelamin |
-0,834 |
0,5608 |
-1,4871 |
0,1370 |
Jf 3 : panjang badan lahir |
-0,3181 |
0,0909 |
-3,4994 |
0,00047 |
Jf 4 : berat badan lahir |
-0,0022 |
0,0007 |
-3,3694 |
0,00075 |
Jfg : kondisi awal pemberian MP-ASI |
0,9905 |
0,6242 |
1,5868 |
0,1126 |
X^ : status anemia saat hamil |
-0,2651 |
0,2817 |
-0,9410 |
0,3467 |
Xy : panjang ingkar lengan atas (LILA) ibu saat hamil |
0.3442 |
0,1746 |
1,9710 |
0,0487 |
¾ : pendidikan ibu |
-0,3969 |
0,3219 |
-1,2330 |
0,2176 |
Jfg : status pekerjaan ibu |
-0.6056 |
0,5692 |
-1,0640 |
0,2873 |
Jf^O : umur ibu |
0,0384 |
0,0470 |
0,8162 |
0,4144 |
Konstanta 1 |
-24,844 |
0,0013 |
-1874,87 |
0,0000 |
Konstanta 2 |
-22,231 |
0,5190 |
-42,8305 |
0,0000 |
Berdasarkan model logit regresi logistik (5) dan (6), didapatkan persamaan model regresi logistik ordinal sebagai berikut:
Φι(x)
exp(-24,844 - 0,3181X3 - 0,0022χ⅛ + 0,3442X7 )
= 1 + exp(-24,844 - 0,3181X3 - 0,0022χi + 0,3442x? ),
φ2 (X)
exp(-22,231 - 0,3181χ2 - 0,0022×i + 0,3442χ2 )
= 1 + exp(-22,231 - 0,3181χ2 - 0,0022Xi + 0,3442χ2).
Pada proses pengklasifikasian digunakan data testing sebanyak 30% dari 116 data status gizi balita. Berikut ini merupakan hasil pengklasifikasian status gizi balita untuk kelompok normal, pendek, atau sangat pendek.
Tabel 4. Ketepatan Klasifikasi Data set Tunggal Status Gizi Balita
Actual Group |
Prediction Group |
Total | ||
Normal |
Pendek |
Sangat pendek | ||
Normal |
21 |
4 |
1 |
26 |
Pendek |
6 |
1 |
0 |
7 |
Sangat pendek |
2 |
0 |
0 |
2 |
Total |
29 |
5 |
1 |
35 |
Berdasarkan Tabel 4. dapat dihitung besarnya tingkat kesalahan klasifikasi:
4+1+6+0+2+0
APER=( 35 )=0,3714
Dengan ketepatan klasifikasi sebesar
1-APER=1-0,3714=0,6286.
Sehingga didapatkan persentase ketepatan klasifikasi berdasarkan data testing secara keseluruhan sebesar 62,86%. Sedangkan kesalahan klasifikasinya adalah sebesar 37,14%.
Pengklasifikasian Status Gizi Balita dengan Bagging Regresi Logistik Ordinal
Fungsi klasifikasi (5) dan (6) merupakan model data set tunggal. Parameter yang dihasilkan oleh model regresi logistik ordinal cenderung tidak stabil (Breiman, 1996). Untuk melihat kestabilan pada data dan memperoleh keakuratan model yang lebih baik maka digunakan resampling pada data. Resampling yang melibatkan beberapa variabel respons dan prediktor dengan metode bagging yang merupakan pengambilan sampel dengan pengembalian. Variabel-variabel tersebut adalah variabel pada model logit regresi logistik ordinal (5) dan (6). Sampel bootstrap diambil sebanyak ½ dari data training. Kemudian, direplikasi bootstrap sebanyak 51, 61, 71, 81, 91, 101, 151, 201, 301, 401, dan 501 kali. Pada setiap replikasi B akan dibentuk model bagging regresi logistik ordinal dari setiap replikasi bootstrap. Penentuan prediksi untuk setiap replikasi B menggunakan data testing berdasarkan model bagging regresi logistik ordinal.
Majority voting digunakan untuk
mendapatkan prediksi variabel respons
maksimum pada replikasi B, kemudian kesalahan klasifikasi bagging regresi logistik ordinal ditentukan berdasarkan prediksi maksimum pada replikasi B. Sehingga, kesalahan klasifikasi bagging regresi logistik ordinal untuk replikasi B kali adalah ̅B.
Ketepatan Klasifikasi Bagging Regresi Logistik Ordinal tersebesar yaitu 71,43% pada replikasi bootstrap 81 kali dengan misklasifikasi sebesar 28,57%. Keberhasilan bagging diukur dari seberapa besar bagging dapat menurunkan misklasifikasi dari model data set tunggal.
Perbandingan Tingkat Ketepatan Klasifikasi Metode Regresi Logistik Ordinal dan Bagging Regresi Logistik Ordinal
Perbandingan tingkat ketepatan klasifikasi metode RLO dan Bagging RLO dijabarkan pada Tabel 5.
Tabel 5. Perbandingan Ketepatan Klasifikasi
Ketepatan Klasifikasi RLO |
Bagging RLO |
Kenaikan Tingkat Ketepatan Klasifikasi | |
Replikasi Bootstrap |
Ketepatan Klasifikasi | ||
62,86% |
51 |
68,57% |
5,71% |
61 |
68,57% |
5,71% | |
71 |
68,57% |
5,71% | |
81 |
71,43% |
8,57% | |
91 |
65,71% |
2,85% | |
101 |
68,57% |
5,71% | |
151 |
68,57% |
5,71% | |
201 |
68,57% |
5,71% | |
301 |
68,57% |
5,71% | |
401 |
68,57% |
5,71% | |
501 |
68,57% |
5,71% |
Berdasarkan Tabel 5 diketahui bahwa persentase tingkat ketepatan klasifikasi bagging regresi logistik ordinal terbesar pada replikasi bootstrap 81 kali yaitu sebesar 71,43%. Persentase tingkat ketepatan klasifikasi menunjukkan kestabilan pada replikasi bootstrap 51, 61, 71, 101, 151, 201, 301, 401, dan 501 kali, yaitu sebesar 68,57% dengan misklasifikasi sebesar 31,43%. Dengan demikian, dapat diketahui bahwa ukuran bootstrap B tidak berpengaruh terhadap tingkat ketepatan klasifikasi, namun menunjukkan
kekonvergenan tingkat ketepatan klasifikasi. Keberhasilan bagging diukur dari seberapa besar bagging dapat menurunkan misklasifikasi dari model data set tunggal. Penurunan misklasifikasi dapat diukur dengan membandingkan tingkat ketepatan klasifikasi bagging regresi logistik ordinal dan regresi logistik ordinal.
Berikut ini merupakan nilai AIC bagging regresi logistik ordinal yang dibentuk berdasarkan pada replikasi bootstrap pada replikasi B kali, yaitu:
Tabel 6. Nilai AIC Bagging Regresi Logistik Ordinal
Replikasi |
AIC |
Replikasi |
AIC |
51 |
57,722 |
151 |
61,657 |
61 |
61,867 |
201 |
60,309 |
71 |
58,219 |
301 |
50,976 |
81 |
56,582 |
401 |
48,886 |
91 |
52,049 |
501 |
48,551 |
101 |
60,159 |
Model terbaik dapat ditentukan dengan melihat nilai AIC terkecil. Berdasarkan model logit bagging regresi logistik ordinal pada Tabel 6 dapat diketahui pada replikasi 501 kali memiliki nilai AIC yang lebih kecil dibandingkan dengan replikasi B lainnya. Hal ini berarti bahwa model tersebut merupakan model terbaik. Dengan demikian, replikasi 501 kali lebih tepat digunakan untuk mengklasifikasikan status gizi balita di Kabupaten Klungkung.
Interpretasi Koefisien Bagging Regresi Logistik Ordinal
Estimasi model logit bagging regresi logistik ordinal pada replikasi bootstrap 501 kali yang diperoleh adalah sebagai berikut:
Cl (X) = -32,797 - 0,500 X3 - 0,0035 X4 + 0,419X7 ,
C3 (X) = -30,848 - 0,500 X3 - 0,0035 X4 + 0,419χ7 .
Sehingga estimasi model bagging regresi logistik yang dapat dibentuk adalah:
Φl (X)
exp(-32,797 - 0,500 χ3 - 0,0035 X4 + 0,419χ3 )
= 1 + exp(-32,797 - 0,500 χ3 - 0,0035 χi + 0,419X7 ),
φ2 (X)
exp(-30,848 - 0,500 x3 - 0,0035 xi + 0,419X3 )
= 1 + exp(-30,848 - 0,500 X3 - 0,0035 Xt + 0,419Xt ).
Pada model estimasi logit bagging regresi logistik ordinal, yang digunakan untuk interpretasi koefisien adalah odds ratio. Nilai odds ratio merupakan rasio antara kecenderungan (risiko) terjadinya suatu peristiwa. Nilai odds ratio pada bagging regresi logistik ordinal dapat dilihat dari nilai exp(βi).
Nilai odds ratio masing-masing koefisien pada model terbaik yang diperoleh yaitu model status gizi balita yang dipengaruhi oleh variabel panjang badan lahir (X^), berat badan lahir ( X4), dan panjang LILA ibu saat hamil (Xγ ) seperti tampak pada Tabel 7.
Tabel 7. Nilai Odds Ratio masing-masing Variabel
Variabel |
Koefisien |
exp(βi ) |
X^ : panjang badan lahir |
-0,500 |
0,607 |
X^, : berat badan lahir |
-0,0035 |
0,997 |
^7 : panjang lingkar lengan atas (LILA) ibu saat hamil |
0,419 |
1,520 |
Berdasarkan Tabel 7 dapat diinterpretasikan sebagai berikut:
-
i. Odds ratio X^ (panjang badan lahir) = 0,607, artinya dengan kenaikan panjang badan lahir sebesar 1 cm, akan menurunkan risiko tingkat status gizi balita sangat pendek sebesar 0,607 kali.
-
ii. Odds ratio X4 (berat badan lahir) = 0,997, artinya setiap peningkatan berat badan lahir sebesar 1 gram, maka risiko menurunnya tingkat status gizi balita sangat pendek adalah sebesar 0,997 kali.
-
iii. Odds ratio Xγ (panjang LILA
ibu saat hamil) = 1,520, artinya ibu hamil yang memiliki LILA dengan kategori
normal berisiko memiliki balita berstatus gizi normal lebih besar dibandingkan dengan ibu hamil yang memiliki LILA dengan KEK atau dengan kata lain, risiko balita memiliki status gizi sangat pendek akan menurun sebesar 1,520 kali.
Kesimpulan
Berdasarkan hasil dan pembahasan diperoleh model logit bagging regresi logistik ordinal, dan tiga variabel prediktor yang signifikan berpengaruh terhadap variabel respons, yaitu tinggi badan lahir (X^), badan lahir (X^), dan panjang LILA ibu saat hamil (^7).
Tingkat ketepatan klasifikasi pada data testing dengan metode regresi logistik ordinal sebesar 62,86%. Tingkat ketepatan klasifikasi dengan metode bagging regresi logistik ordinal untuk mengklasifikasikan status gizi balita umur 24-59 bulan di UPT. Puskesmas Klungkung I pada replikasi 501 kali dapat meningkatkan ketepatan klasifikasi dari model regresi logistik ordinal atau dengan kata lain bagging dapat memperlihatkan peningkatan ketepatan
klasifikasi sebesar 5,71%. Hal ini berarti, bagging regresi logistik ordinal dapat mengklasifikasikan status gizi balita lebih baik dibandingkan dengan regresi logistik ordinal.
Saran
Pada penelitian dengan masalah pengklasifikasian dapat digunakan metode bagging untuk menaikkan tingkat ketepatan klasifikasi. Untuk ibu hamil dianjurkan menjaga panjang lingkar lengan atas (LILA) pada masa kehamilan tetap normal, yaitu pada ukuran LILA ≥ 23,5 cm.
DAFTAR PUSTAKA
Akbar, M. S., Mukarromah, A., dan Paramita.
-
2010. Klasifikasi Status Gizi Balita dengan Bagging Regresi Logistik Ordinal. Media Statistika, Volume 3, No. 2, Hal. 103-114.
Breiman, L., 1996. Bagging Predictors.
Technical University of California.
Dinas Kesehatan Provinsi Bali. 2014. Profil Kesehatan Provinsi Bali Tahun 2013. Bali: Dinas Kesehatan Provinsi Bali.
Hosmer, D. W., and Lemeshow, S., 2000.
Applied Logistic Regression. New York: John Wiley & Sons, Inc.
Insani, Fitrah., AF, Saleh., dan LP, Talangko. 2015. Metode Bootstrap Aggregating Regresi Logistik untuk Peningkatan Ketepatan Klasifikasi Regresi Logistik Ordinal. Jurnal Statistika FMIPA UNHAS.
Johnson, R. A., and Winchern, D.W., 2007. Applied Multivariate Statistical Analysis. USA: Prentice Hall. Inc
Suciari, L.S. 2015. Hubungan antara Status Gizi Ibu saat Hamil, Panjang Badan, Berat Badan Lahir dan Umur Awal Pemberian MP-ASI. Denpasar: Tugas Akhir Universitas
Udayana.
Kementerian Kesehatan. 2013. Riset Kesehatan Dasar, RISKESDAS dalam Angka Provinsi Bali 2013. Jakarta: Lembaga Penerbitan Badan Litbangkes Kementerian Kesehatan RI.
Subianto, Muhammad. 2009. Understanding Classification. Universitas Utrecht.
110
Discussion and feedback