PREDIKSI KELULUSAN MAHASISWA PROGRAM STUDI MATEMATIKA UNIVERSITAS UDAYANA MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK
on
E-Jurnal Matematika Vol. 12(3), Agustus 2023, pp. 242-247
DOI: https://doi.org/10.24843/MTK.2023.v12.i03.p425
ISSN: 2303-1751
PREDIKSI KELULUSAN MAHASISWA PROGRAM STUDI MATEMATIKA UNIVERSITAS UDAYANA MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK
Muhammad Rizki Nur Ihsan1§, G. K. Gandhiadi2, Luh Putu Ida Harini3
1Program Studi Matematika – FMIPA – Universitas Udayana [e-mail: [email protected]]
-
2Program Studi Matematika – FMIPA – Universitas Udayana [e-mail: [email protected]]
-
3Program Studi Matematika – FMIPA – Universitas Udayana [e-mail: [email protected]]
§Corresponding Author
ABSTRACT
Based on the rules of the BAN-PT Study Program Accreditation Instrument 4.0 (IAPS 4.0), one of the study program accreditation assessment indicators is the percentage of students who graduate on time. The percentage of Udayana University Mathematics Study Program students who graduated on time during the graduation period from 2002 to 2019 was 52.5%. It can be seen that many students fail to complete their studies on time, which has an impact on the study program accreditation assessment. Based on these problems, this study aims to help academics increase the percentage of Udayana University Mathematics Study Program graduates by predicting the graduation of mathematics study program students using the backpropagation neural network method. This study uses data on alumni of students of the 2002-2017 mathematics study program. With the BNN 5-3-1 architecture, the predicted results of graduation for students of the Udayana University mathematics study program are 73%.
Keywords: Accreditation, graduation, percentage, prediction, BNN.
Menurut buku Statistik Pendidikan Tinggi Indonesia tahun 2020 yang dipublikasi oleh Dirjen Dikti, dikatakan bahwa program sarjana di Indonesia pada tahun 2020 menerima mahasiswa baru sebanyak 1.617.869 mahasiswa dan meluluskan mahasiswanya sebanyak 1.042.844 mahasiswa. Hal ini dapat kita cermati bahwa mahasiswa yang lulus tidak sesuai dengan mahasiswa yang masuk. Sehingga, dapat disimpulkan bahwa tidak semua mahasiswa lulus tepat waktu. Berdasarkan standar pendidikan kompetensi lulusan FMIPA apabila mahasiswa program sarjana menyelesaikan masa studi kurang dari 5 tahun atau 10 semester maka mahasiswa tersebut dinyatakan lulus tepat waktu.
Mahasiswa Program Studi Matematika Fakultas MIPA Universitas Udayana yang lulus pada periode wisuda dari tahun 2002 hingga 2019 sebanyak 527 mahasiswa dan presentase mahasiswa yang lulus tepat waktu sebesar 52,5% (Srinadi & Nilakusmawati, 2020). Persentase mahasiswa yang lulus tepat waktu
ini menjadi salah satu indikator penilaian akreditasi program studi. Hal ini diatur BANPT pada paparan Instrumen Akreditasi Program Studi 4.0 (IAPS 4.0) kriteria Luaran dan Capaian Tridharma. Berdasarkan peraturan tersebut, untuk meningkatkan nilai mutu akreditasi suatu program studi, mengharuskan program studi di semua perguruan tinggi melakukan pemantauan dan evaluasi kegiatan akademik untuk mengambil langkah yang konkret agar mahasiswanya lulus tepat waktu. Dengan demikian, diperlukan suatu metode yang dapat memprediksi seorang mahasiswa dapat lulus dengan tepat waktu atau tidak.
Maka tujuan penelitian ini adalah memprediksi waktu kelulusan mahasiswa Program Studi Matematika Universitas Udayana menggunakan metode Backpropagation Neural Network (BNN). Backpropagation atau perambatan balik adalah salah satu ANN yang sering digunakan untuk menyelesaikan masalah peramalan atau prediksi. Metode backpropagation ini dikenal sebagai metode pelatihan ANN dengan
supervisi (Sutikno et al., 2016). Metode backpropagation menggunakan data pelatihan untuk menyesuaikan bobot dan ambang batas neuron sehingga dapat meminimalkan kesalahan pada prediksi jaringan (Gershenson, 2003). Penelitian ini menggunakan lima buah variabel input berupa nilai Indeks Prestasi Semester 1-5, dan satu buah variabel output berupa lama masa studi. Pada penelitian ini arsitektur BNN yang dipilih untuk diujikan digunakan Rules of Thumb yang akan menentukan jumlah neuron pada hidden layer (Heaton, 2008). Beberapa arsitektur BNN yang didapat menggunakan Rules of Thumb selanjutnya akan dilakukan pelatihan untuk mendapatkan satu arsitektur BNN yang digunakan untuk menguji akurasi model prediksi.
Data penelitian ini merupakan data sekunder yang bersumber dari data arsip yang dimiliki oleh Fakultas Matematika dan Ilmu Pengetahuan Alam Universi-tas Udayana (FMIPA UNUD).
Penelitian menggunakan lima variabel input dan satu variabel output yang ditunjukkan pada tabel berikut.
Tabel 1. Variabel Penelitian
Variabel |
Keterangan |
Satuan |
Variabel Input | ||
X1 |
IP Semester I |
Angka (0-4) |
X2 |
IP Semester II |
Angka (0-4) |
X3 |
IP Semester III |
Angka (0-4) |
X4 |
IP Semester IV |
Angka (0-4) |
X5 |
IP Semester V |
Angka (0-4) |
Variabel Output | ||
Y |
Lama Masa Studi |
Semester |
Berdasarkan jenis data yang diperoleh, sehingga tahapan teknik analisis data sebagai berikut:
-
1. Tahap data preparation: penghapusan data yang tidak lengkap.
-
2. Tahap pengelompokkan data:
mengelompokkan 630 data menjadi data train dan data test. Penelitian ini
menggunakan kombinasi 80% data train dan 20% data test.
-
3. Tahap normalisasi data: Menormalisasi data menjadi rentang 0-1 untuk mengaktifkan fungsi aktivasi yang akan digunakan.
-
4. Tahap penentuan arsitektur BNN:
menentukan arsitektur BNN yang memiliki 5 neuron masukan, 1 neuron
luaran dan variasi banyaknya neuron
pada hidden layer yang ditentukan oleh Rules of Thumb.
-
5. Tahap penentuan fungsi aktivasi, optimizer dan stopping condition: menentukan fungsi aktivasi yang akan digunakan, karena penelitian ini berupa prediksi maka, penggunaan fungsi aktivasi sigmoid biner sangat cocok karena memiliki range nilai 0 sampai 1. optimizer atau learning rate dengan nilai random sebesar 0.1, dan setelah beberapa percobaan pelatihan dengan berbagai jumlah epoch, didapat epoch sebanyak 100 epoch yang menghasilkan output yang optimal.
-
6. Tahap pelatihan BNN: menerapkan
algoritma BNN pada proses data latih beberapa arsitektur yang telah ditentukan pada tahap ke-3 dan memilih arsitektur BNN dengan nilai Loss terkecil.
-
7. Tahap pengujian dan perhitungan akurasi model BNN: menggunakan arsitektur yang telah terpilih pada tahap ke-5 untuk menguji model BNN dengan
memasukkan data uji pada tahap ke-2. Kemudian dihitung nilai akurasi model tersebut dengan metode confusion matrix.
-
3. HASIL DAN PEMBAHASAN
-
3.1. Data Preparation
-
Data preparation yang dilakukan berupa identifikasi data, menghapus data yang hilang. Data yang diperoleh merupakan data alumni mahasiswa Program Studi Matematika Universitas Udayana dari angkatan tahun 2001 sampai 2017.
Tabel 2. Deskripsi Data
IPS 1 |
IPS 2 |
IPS 3 |
IPS 4 |
IPS 5 |
Masa Studi | |
Count |
646 |
641 |
637 |
638 |
637 |
646 |
Mean |
3.16352 9 |
3.11454 0 |
3.07847 7 |
2.94727 3 |
3.12609 1 |
10.02167 2 |
Max |
4 |
4 |
4 |
4 |
4 |
42 |
Min |
2.06 |
1.83 |
1.5 |
1.33 |
0 |
7 |
Stand ar devias i |
0.34423 9 |
0.41001 5 |
0.43187 3 |
0.52113 1 |
0.55703 2 |
3.009467 |
Pada Tabel 2 baris Count dapat dilihat jumlah data pada data input tidak konsisten hal ini berarti terdapat beberapa missing value. Sehingga perlu dilakukan identifikasi data dan menghapus seluruh baris pada data yang hilang (Angga Ginanjar Mabrur, 2012). Setelah dilakukan identifikasi data dan menghapus seluruh baris pada data yang hilang didapatkan deskripsi data yang baru.
Tabel 3. Hasil Preparasi Data
IPS 1 |
IPS 2 |
IPS 3 |
IPS 4 |
IPS 5 |
Masa Studi | |
Coun t |
631 |
631 |
631 |
631 |
631 |
631 |
Mean |
3.16664 0 |
3.11900 2 |
3.08185 4 |
2.94735 3 |
3.12828 8 |
9.77337 6 |
Max |
4 |
4 |
4 |
4 |
4 |
14 |
Min |
2.06 |
1.83 |
1.8 |
1.33 |
0 |
7 |
Std |
0.34252 6 |
0.40726 4 |
0.42856 3 |
0.51876 6 |
0.55613 8 |
1.55358 9 |
Menormalisasi data menjadi rentang 0-1 untuk mengaktifkan fungsi aktivasi sigmoid biner. Sedangkan pada variabel target, nilai diubah menjadi 1 untuk masa studi kurang dari sama dengan 9 semester dan 0 untuk masa studi lebih dari 9 semester.
Sebanyak 631 data yang dihasilkan dari proses preparasi data selanjutnya dibagi menjadi data train dan data test. Penelitian ini menggunakan kombinasi 80% data train dan 20% data test dan menghasilkan sebanyak 504
data train dan 127 data test. Pembagian data dilakukan menggunakan train_test_split pada python sehingga pembagian data dilakukan secara random.
Arsitektur BNN yang terdiri dari layar masukan, layar tersembunyi, dan layar luaran memiliki jumlah neuron yang berbeda. Jumlah neuron pada layar masukan sebanyak variabel input, jumlah neuron pada layar luaran sebanyak variabel target, sedangkan untuk banyaknya neuron pada layar tersembunyi, jumlah neuron ditentukan didasarkan pada tiga rules of thumb sebagai berikut (Heaton, 2008):
-
1. Rule yang pertama dikatakan “jumlah neuron pada hidden layer harus berada di antara ukuran input layer dan ukuran output layer”. Jumlah neuron layar masukan pada penelitian ini adalah 5 dan jumlah neuron layar luaran adalah 1. Maka banyaknya neuron pada layar tersembunyi berada pada interval [1,5];
-
2. Rule yang kedua dikatakan “jumlah neuron pada hidden layer harus sebanyak 2/3 ukuran input layer, dan ditambahkan ukuran output layer”. Maka, banyak neuron pada layar tersembunyi harus sebanyak f2
-
— × 5 +1 = 3.33 +1 = 4.33 neuron;
k 3 J
-
3. Rule yang ketiga dikatakan “jumlah neuron pada hidden layer harus kurang dari dua kali ukuran input layer”. Maka, jumlah neuron pada layar tersembunyi harus
kurang dari 10 neuron. Sehingga
banyaknya neuron pada layar tersembunyi berada pada interval [1,9].
Berdasarkan rules of thumb, [1,5]⊂[1,9], dan 4.33∈[1,9], maka arsitektur BNN yang digunakan adalah 5 neuron masukan, 1 neuron luaran, dan beragam jumlah neuron pada layar tersembunyi sebanyak 1 sampai 9 neuron.
Sembilan arsitektur BNN yang didapat pada 3.4 selanjutnya dilatih menggunakan algoritma Backpropagation Neural Network dengan banyaknya iterasi sebanyak 100 iterasi dan learning rate sebesar 0,1. Proses pelatihan tersebut dilakukan menggunakan software jupyter notebook.
Berdasarkan hasil yang diperoleh di setiap arsitektur BNN akan dipilih satu arsitektur
dengan rataan nilai fungsi loss terkecil dengan nilai paling konstan dari seluruh arsitektur BNN (Sapitri et al., 2020).
Tabel 4. Rataan Nilai Cross-Entrophy Loss
Arsitektu r BNN |
Cross-Entrophy Loss | ||
Percobaan 1 |
Percobaan 2 |
Percobaan 3 | |
5-1-1 |
0.270307803 3 |
0.27027019 6 |
0.27033457 4 |
5-2-1 |
0.269482722 4 |
0.27144118 2 |
0.26862764 6 |
5-3-1 |
0.266603884 7 |
0.26618291 9 |
0.26922957 3 |
5-4-1 |
0.268853361 2 |
0.27045683 6 |
0.26979884 4 |
5-5-1 |
0.269646890 8 |
0.26958721 8 |
0.26880165 4 |
5-6-1 |
0.271100181 5 |
0.27108005 5 |
0.26912338 4 |
5-7-1 |
0.269761603 0 |
0.26813119 5 |
0.27003080 2 |
5-8-1 |
0.268638369 2 |
0.27034109 9 |
0.27019314 9 |
5-9-1 |
0.270979742 1 |
0.26887818 3 |
0.26952108 6 |
Berdasarkan tabel 4, diperoleh informasi bahwa arsitektur 5-3-1 memiliki rataan nilai Cross-Entrophy Loss terkecil dan paling stabil pada setiap percobaan. Oleh karena itu, arsitektur 5-3-1 terpilih sebagai arsitektur terbaik dan akan digunakan dalam proses prediksi data uji.
Setelah didapatkan arsitektur terbaik pada tabel 4, kemudian bobot dan bias akhir pada setiap layer menghasilkan suatu persamaan sebagai berikut:
r
Zj = f I Σ Wjxi+ b0j
V i=1
Keterangan:
Zj : Nilai output pada hidden layer
Wij : Nilai bobot akhir hidden layer
Xi : Input
B0j : Nilai bias akhir hidden layer
i = jumlah unit input layer
j = jumlah unit hidden layer
yk = f ∑ w^Zi + bo k
Keterangan:
Yk : Nilai output
Wjk : Nilai bobot akhir ouput layer
Zj : Input hidden layer
B0k : Nilai bias akhir output layer
j = jumlah unit hidden layer k = jumlah unit output layer
Data test yang telah ditentukan sebelumnya kemudian digunakan untuk menghitung Cross-Entrophy Loss dan proses BNN dengan arsitektur BNN 5-3-1 yang terpilih. Nilai CEL tersebut disajikan pada tabel sebagai berikut:
Tabel 5. Nilai CEL
k |
Nilai Aktual (tk) |
Nilai Prediksi ( yk ) |
tk log (yk) |
1 |
0 |
0.60966198 |
0 |
2 |
1 |
0.78408838 |
-0.24323353 |
. |
. |
. |
. |
126 |
1 |
0.8389876500 |
-0.17555929 |
127 |
1 |
0.6371366400 |
-0.45077115 |
127 -∑ tk log (yk) k=1__________________ 127 Ket: tk = nilai aktual yk = nilai prediksil k = jumlah data |
0.20776363 |
Dari Arsitektur BNN 5-3-1 yang terpilih selanjutnya digunakan untuk menguji akurasi model pelatihan. Pengujian dilakukan dengan cara memasukkan hasil model prediksi pada data testing kedalam metode Confusion Matrix untuk mengukur performa prediksi yang diteliti dengan cara membandingkan nilai prediksi dan nilai aktual.
Pengukuran jumlah ketepatan algoritma yang dipakai menggunakan matrix 2x2 yang disebut confusion matrix (Hizham et al., 2018). Disajikan pada tabel 6 sebagai berikut (Widodo et al., 2013):
Tabel 6. Confusion Matrix
Kelas Aktual | |||
True |
False | ||
Kelas Prediksi |
True |
TP (True Positive) |
FP (False Positive) |
False |
FN (False Negative) |
TN (True Negative) |
TP 33 33
Recall = --------- =------= — = 0.76744186046
(TP + FN) 33 + 10 43
= 76.744186046% * 77%
(2 × recall × presisi)
F-Measure = —--------------—
(recall + presisi)
_ 2 × 0.76744186046 × 0.57894736842 _ 0.8886168911 0.76744186046 + 0.57894736842 ^ 1.346389229
= 0.66 = 66%
Keterangan:
-
1. True Positive (TP): Jika data prediksi memiliki nilai positif yang sesuai dengan nilai sebenarnya (positif)
-
2. False Positive (FP): Jika data prediksi tidak sesuai dengan nilai sebenarnya
-
3. False Negative (FN): Jika data prediksi bernilai negatif dan data sebenarnya bernilai positif
-
4. True Negative (TN): jika data prediksi dan data sebenarnya bernilai negative.
Hasil dari pengujian model prediksi menggunakan python terhadap data test menggunakan metode confusion matrix dapat disajikan sebagai berikut:
Berdasarkan perhitungan uji performansi diatas dapat disimpulkan bahwa penggunaan metode Backpropagation Neural Network untuk memprediksi waktu kelulusan mahasiswa Prodi Matematika Universitas Udayana memiliki 73% nilai akurasi, 58% nilai presisi, 77% nilai recall, dan 66% nilai F-Measure. Hal tersebut dapat diartikan bahwa model prediksi tersebut dapat digunakan untuk memprediksi kelulusan mahasiswa Program Studi Matematika FMIPA Unud.
Tabel 7. Hasil Akurasi
Kelas Aktual | |||
True |
False | ||
Kelas Prediksi |
True |
33 |
24 |
False |
10 |
60 |
Selanjutnya
akan
dilakukan
uji
3.7. Prediksi Kelulusan Mahasiswa
Matematika Unud
Arsitektur BNN 5-3-1 yang telah terpilih selanjutnya digunakan untuk memprediksi waktu kelulusan mahasiswa Prodi Matematika Unud. Prediksi dilakukan dengan cara memasukkan data mahasiswa Program Studi Matematika Unud angkatan 2018. Data yang terkumpul sebanyak 5 data.
Hasil prediksi yang dilakukan dengan metode Backpropagation yang menggunakan arsitektur terpilih 5-3-1 adalah sebagai berikut:
performansi berdasarkan confusion matrix dari model prediksi, dengan rumus sebagai berikut:
1. |
. (TP + TN) Akurasi = (TP + FP + FN + TN) |
2. |
_ . . TP |
(TP + FP) | |
3. |
TP Recall =--------- (TP + FN) |
4. |
(2 × recall × presisi) F-Measure = ----------------- |
Tabel 8. Hasil Prediksi
Data ke- |
Nilai Aktual |
Nilai Prediksi |
1 |
1 |
0.667067234 ≈ 1 |
2 |
1 |
0.059419126 ≈ 0 |
3 |
1 |
0.054674362 ≈ 0 |
4 |
1 |
0.884415635 ≈ 1 |
5 |
1 |
0.181567513 ≈ 0 |
(recall + presisi)
Perhitungan akurasi, presisi, recall dan F-Measure sebagai nilai uji performansi tersebut adalah sebagai berikut:
Akurasi =
(TP + TN')
33 + 60
93
(TP + FP + FN + TN) 33 + 24 + 10 + 60 127
Berdasarkan pada Tabel 7, dari kelima data yang digunakan dalam proses prediksi, hanya ada 2 data yang sesuai dengan nilai aktual, sehingga akurasi prediksi didapatkan hanya sebesar 40%.
4. SIMPULAN DAN SARAN
= 0.732283465 = 73.2283465% ≈ 73%
TP
33
Presisi = τ-------- =-------
(TP + FP) 33 + 24
33
— = 0.57894736842
Ξ7
= 57.894736842% ≈ 58%
4.7. Simpulan
Berdasarkan hasil penelitian mengenai metode Backpropagation Neural Network dalam memprediksi waktu kelulusan mahasiswa Program Studi Matematika Universitas Udayana dapat disimpulkan:
-
1. Model BNN terbaik yang digunakan dalam memprediksi kelulusan mahasiswa Program Studi Matematika Universitas Udayana yaitu model BNN dengan arsitektur 5 neuron pada layar masukan, 3 neuron layar tersembunyi, dan 1 neuron layar luaran dengan menghasilkan nilai cross-entrophy loss sebesar 0.20776363.
-
2. Metode confusion matrix digunakan untuk menghitung tingkat akurasi dalam penelitian ini. Nilai yang dihasilkan berupa nilai uji performansi dengan nilai akurasi sebesar 73%, presisi sebesar 58%, recall sebesar 77%, dan F-Measure sebesar 66%, Maka hasil tersebut berarti model prediksi dapat digunakan untuk memprediksi kelulusan mahasiswa Prodi Matematika FMIPA Unud.
-
3. Prediksi yang dilakukan pada data mahasiswa angkatan 2018 sebanyak lima mahasiswa mendapatkan hasil prediksi sebesar 40% hal ini berarti model yang digunakan untuk memprediksi kelulusan mahasiswa tepat waktu sebanyak lima data masih kurang baik.
Adapun saran yang dapat disampaikan berdasarkan temuan penelitian ini adalah sebagai berikut:
-
1. Atribut masukan yang digunakan dalam penelitian ini masih sangat terbatas, dan faktor yang memengaruhi mahasiswa lulus tepat waktu cukup banyak sehingga hal ini perlu dikaji ulang dengan atribut masukan yang lebih luas.
-
2. Disarankan untuk melakukan studi lebih lanjut mengenai prediksi kelulusan mahasiswa pada studi kasus yang lebih luas menggunakan metode BNN dengan jumlah variabel yang lebih banyak dan kompleks.
DAFTAR PUSTAKA
Angga Ginanjar Mabrur, L. R. (2012).
Penerapan Data Mining Untuk Memprediksi Kriteria Nasabah Kredit. Jurnal Komputer Dan Informatika (KOMPUTA), 1(1), 53–57.
BAN-PT. (2019). Instrumen Akreditasi
Program Studi 4.0. Risetdikti, April, 1–69.
Gershenson, C. (2003). Artificial Neural Networks for Beginners.
Heaton, J. (2008). Introduction to Neural Networks with C# (Vol. 99).
Hizham, F. A., Nurdiansyah, Y., &
Firmansyah, D. M. (2018). Implementasi Metode Backpropagation Neural Network (BNN) dalam Sistem Klasifikasi Ketepatan Waktu Kelulusan Mahasiswa (Studi Kasus: Program Studi Sistem Informasi Universitas Jember). Berkala Sainstek, 6(2), 97.
PDDikti. (2020). Higher Education Statistics 2020. 81–85.
Sapitri, N. K. E., Kencana, I. P. E. N., & Harini, L. P. I. (2020). Penerapan Artificial Neural Network (ANN) untuk Memprediksi Perubahan Derajat Miopia pada Manusia. Jurnal Matematika, 10(1), 53.
Srinadi, I. G. A. M., & Nilakusmawati, D. P. E. (2020). Analisis Waktu Kelulusan Mahasiswa Fmipa Universitas Udayana Dan Faktor-Faktor Yang
Memengaruhinya. E-Jurnal Matematika, 9(3), 205.
Sutikno, Indriyanti, Sukmawati, N. E., Priyo, S.
S., Helmie, A. W., Indra, W., Nurdin, B., & K, T. W. (2016). Backpropagation dan Aplikasinya. 135–146.
Widodo, P. P., Handayanto, R. T., & Herlawati. (2013). Penerapan Data Mining dengan Matlab. In Rekayasa Sains.
247
Discussion and feedback