Prediksi Paket Return Menggunakan Metode Decision Tree Menerapkan Algoritma C4.5 Berbasis Website
on
JNATIA Volume 1, Nomor 3, Mei 2023
Jurnal Nasional Teknologi Informasi dan Aplikasinya
p-ISSN: 2986-3929
Prediksi Paket Return Menggunakan Metode Decision Tree Menerapkan Algoritma C4.5 Berbasis Website
Oskar Maha Kasia1, Agus Muliantaraa2
aProgram Studi Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Udayana
Jalan Raya Kampus Udayana, Bukit Jimbaran, Kuta Selatan, Badung, Bali Indonesia 1[email protected] 2[email protected]
Abstract
The development of e-commerce technology has provided significant benefits in facilitating online transactions. However, one of the problems that is often faced by e-commerce companies is the management of return packages, where customers return goods that have been purchased. In order to optimize the package return management process, an effective prediction method is needed to estimate the possibility of returning packages by customers. With a website-based package return prediction system, e-commerce companies can take appropriate actions to manage return packages more efficiently. For example, they can adjust their inventory strategy, improve product quality, or provide special promotional offers to customers who have a high probability of returning packages. This can help increase customer satisfaction, reduce the cost of managing return packages, and increase the overall operational efficiency of the company.
Keywords: Prediksi Paket Return, Decision Tree, Algoritma C4.5
Dalam dunia bisnis dan e-commerce, kegiatan pengembalian paket atau return merupakan suatu hal yang lazim terjadi. Pengembalian paket dapat terjadi karena berbagai alasan, seperti barang rusak, ukuran yang tidak sesuai, atau keinginan pelanggan untuk mengembalikanproduk yang tidak memenuhi harapan mereka. Mengelola proses pengembalian paket dengan efisien sangat penting bagi perusahaan untuk menjaga kepuasan pelanggan dan meminimalkan kerugian.Dalam menghadapi tantangan tersebut, penggunaan metode prediksi dapat menjadi solusi yang efektif. Salah satu metode yang umum digunakan dalam prediksi paket return adalah metode decision tree (pohon keputusan). Decision tree adalah suatu model prediktif yang menggunakan struktur pohon untuk menggambarkan keputusan dan konsekuensi yang mungkin terjadi. Metode ini mampu memecahkan masalah klasifikasi dan prediksi dengan menggabungkan serangkaian aturan dan kondisi. Dalam penelitian ini, penulis akan menggunakan metode decision tree dengan algoritma C4.5 untuk memprediksi paket return. Algoritma C4.5 adalah salah satu algoritma pembentukan pohon keputusan yang populer dan efisien. Algoritma ini mampu menghasilkan pohon keputusan yang optimal dengan mempertimbangkan faktor-faktor seperti informasi gain dan perhitungan rasio gain. Selain itu, kami juga akan menerapkan prediksi paket return berbasis website. Dengan menggunakan platform berbasis website, perusahaan dapat mengintegrasikan sistem prediksi ini ke dalam infrastruktur mereka, sehingga memungkinkan penggunaan yang mudah dan aksesibilitas yang lebih luas. Tujuan dari penelitian ini adalah untuk mengembangkan suatu sistem prediksi paket return yang akurat dan efisien menggunakan metode decision tree dengan algoritma C4.5. Dengan adanya sistem ini, perusahaan dapat mengidentifikasi dan mengantisipasi paket yang berpotensi untuk mengalami pengembalian, sehingga dapat mengambil tindakan yang diperlukan untuk mengurangi dampak negatif dari pengembalian paket.
Pre processing data
Menghitung Entropy
Menghitung Gain
Membuat pohon keputusan
Gambar 1. Tahapan Penelitian
Pada Gambar 1, dapat dilihat tahapan dari penelitian yang akan dibuat. penelitian diawali dengan melakukan mencari dataset dilanjutkan dengan preprocessing data, menghitung entropy serta gain sehingga dapat menghasilkan urutan node yang tepat sehingga akhirnya akan menjadi pohon keputusan.
Pengumpulan dataset dilakukan dengan cara mengumpulkan data historis pengembalian paket dari data paket pengembalian perusahaan. Data ini harus mencakup berbagai atribut yang relevan, seperti karakteristik produk, informasi pelanggan, alasan pengembalian, dan status pengembalian.
Algoritma yang akan digunakan pada penelitian ini adalah Decision Tree dengan menggunakan algoritma C4.5 yang akan dibandingkan
Root fiJotλς,
Gambar 2. Cara Kerja dari Metode Decision Tree
Decision Tree merupakan sekian dari banyak metode di dalam data mining, dimana data mining adalah proses mengekstrak data dengan menggunakan metode dan algoritma tertentu untuk menghasilkan informasi yang lebih berguna sehingga dapat menjadi dasar dalam pengambilan keputusan (Firmansyah & Yulianto, 2021). Diperkenalkan pertama kali oleh J. Ross Quinlan di awal tahun 1980 168 dengan nama ID3. Decision tree adalah flowchart yang memiliki struktur pohon dimana masing-masing nodenya memiliki atribut, setiap cabang menggambarkan keluaran dari pengujian dan setiap daun memiliki label (Han et al., 2012). Pada tahun-tahun berikutnya barulah Quinlan memperkenalkan C4.5 sebagai algoritma supervised learning yang lebih baru sebagai penyempurnaan dari ID3.
Algoritma C4.5 adalah salah satu algoritma pembentukan pohon keputusan yang dikembangkan oleh Ross Quinlan pada tahun 1993. Algoritma ini merupakan pengembangan dari algoritma sebelumnya yang dikenal sebagai ID3 (Iterative Dichotomiser 3). Algoritma C4.5 memiliki keunggulan dalam mengatasi atribut kontinu, menangani data yang hilang, dan menggunakan gain rasio untuk pemilihan atribut pembagi. Ini membantu dalam menghasilkan pohon keputusan yang lebih akurat dan lebih efisien.Dalam konteks prediksi paket return, algoritma C4.5 dapat digunakan untuk membangun pohon keputusan yang dapat memprediksi kemungkinan pengembalian paket berdasarkan atribut-atribut yang relevan, seperti karakteristik produk, informasi pelanggan, dan alasan.
Salah satu tahapan dalam proses penelitian yang sudah dijelaskan pada gambar 1 adalah preprocessing dan pemodelan data. Pada penelitian ini, penulis akan melakukan perancangan model data. Pada tahap metode yang akan digunakan adalah sebagai berikut
MSE merupakan rata rata kuadrat kesalahan yang dihitung dengan menjumlahkan semua kesalahan atau eror prediksi yang dihasilkan oleh suatu model kemudian dikuadratkan dan
membaginya dengan jumlah periode prediksi [10]. Berikut merupakan persamaan matematis dari MSE :
n
GAIN(S,A) = Entropy(S) -
∑ Entropy(Si) i
(1)
MAE merupakan selisih absolut antara nilai prediksi dan nilai yang sebenarnya kemudian akan dihitung rata rata dari selisih tersebut. MAE dapat memberikan gambaeran rata rata prediksi dengan nilai yang sebenarnya. Berikut merupakan persamaan matematis dari MAE :
n
Entropy(S) =
∑Pi*Log2Pi i
(2)
Pada penelitian ini, jumlah total data yang digunakan adalah sebanyak 50591 baris memuat kolom yang meliputi Id, alamat, provinsi, kabupaten, kecamatan/kota, umur, nilai transaksi, ekspedisi, dll. Dataset yang digunakan merupakan dataset historis penjualan dari suatu perusahaan.
![](https://jurnal.harianregional.com/media/102481-2.jpg)
Gambar 3. Dataset yang Digunakan dalam Perancangan Model
Data yang sudah dipersiapkan kemudian akan dicari nilai entropy dan gain sehingga dapat melanjutkan step selanjutnya yaitu pembuatan node. Berikut hasil yang telah didapatkan setelah melakukan perhitungan entropy dan gain.
Jumlah kasus |
Tidak |
Ya |
Entropy |
Info gain |
Split info |
Gain Ration | ||||
Umur |
-26769,91948 |
0,753200875 |
-35541,54059 | |||||||
<= 20 tahun |
12165 |
2163 |
10002 |
-0,86305143 | ||||||
>= 20 tahun |
40418 |
6910 |
33508 |
-0,876016718 | ||||||
Alamat |
-22133,22729 |
0,854115163 |
-25913,63348 | |||||||
<= 80 character |
14495 |
2776 |
11719 |
-0,838110367 | ||||||
>= 80 character |
36624 |
6050 |
30574 |
-0,887236729 | ||||||
Ekspedisi | ||||||||||
JNE |
8384 |
1878 |
6506 |
-0,783998024 |
-0,210051675 |
0,98699925 | ||||
JNT |
29344 |
4538 |
24806 |
-0,908440394 | ||||||
SAP |
289 |
239 |
50 |
-0,302868602 | ||||||
SICEPAT |
434 |
177 |
257 |
-0,569873286 | ||||||
Nilai COD |
-2691,441352 |
0,864409849 |
-3113,617174 | |||||||
<= 200k |
36174 |
5952 |
21567 |
-2,275208468 | ||||||
>= 200k |
14740 |
2838 |
9235 |
-1,73740876 | ||||||
Total |
50593 |
8727 |
41863 |
-0,873486703 |
Gambar 4. Hasil Perhitungan Entropy dan Gain
Pada penelitian ini, peneliti menggunakan framework laravel sebagai backend sedangkan NextJs yang digunakan dalam pembuatan antaramuka sistem sehingga dapat mempermudah seller dalam melakukan prediksi paket return.
© Tokuby
Q. ∩ ^⅞ Aneska M.
a Dashboard
Q Orders
Q Shipping
@ Expedition & Payment method
Paket berpotensi return
Select expedition
Select payment
— JNEExpress
COD
θ Detaiiorder
CU Accounts
Sub total
Rp. 313.000
S Reports
0 Analytics
© Settings
Ridho attoriq
JL G∏. Lebah No. 4, Tegal Harum
![](https://jurnal.harianregional.com/media/102481-3.jpg)
Serum tokuby
Rp. 99.000
Rp. 445.000
Rp. 125.000
Shipping fee
Rp. 10.000
PPN 11%
Rp. 3.553
Total
Rp. 326.553
Checkout
![](https://jurnal.harianregional.com/media/102481-4.jpg)
Tabel 1. Integration Testing
No |
Integration Testing |
Status |
1 |
Pengujian pada input order |
Succeed |
2 |
Pengujian tombolquantity item tambah dan kurang Succeed | |
3 |
Pengujian pada tombol checkout |
Succeed |
4 |
Kesesuaian hasil prediksi dengan prediksi model |
Succeed |
Createorder
Gambar 5. Tampilan Antarmuka Sistem Berpotensi Return
Jurnal Nasional Teknologi Informasi dan Aplikasinya
0 τokuby < Createorder
Q. £1 ^⅞ Aneska M.
π Dashboard
Q Orders
θ Shipping θ Expedition & Payment method
Paket tidak berpotensi return
@ Detaiiorder
® Accounts
Q Reports
0 Analytics
© Settings
Sub total
Rp. 313.000
![](https://jurnal.harianregional.com/media/102481-5.jpg)
Oskar maha kasi Select expedition Select payment
Jalan Raya PKP No. 24 Kelapa DUa
— JNEExpress ~ 4 COD
Wetani Ciracasl sebelah kantor desa
![](https://jurnal.harianregional.com/media/102481-6.jpg)
Shipping fee
Rp. 10.000
Rp. 3.553
PPN 11%
Rp. 326.553
Total
![](https://jurnal.harianregional.com/media/102481-7.jpg)
Gambar 6. Tampilan Antarmuka Sistem Tidak Berpotensi Return
Berdasarkan percobaan yang dilakukan pada algoritma Decision Tree dengan menggunakan algoritma C4.5 dapat disimpulkan bahwa metode prediksi paket return menggunakan decision tree dengan algoritma C4.5 mampu memberikan prediksi yang cukup akurat. Model yang dikembangkan berhasil memperoleh tingkat akurasi yang memadai dalam memprediksi apakah suatu paket akan mengalami pengembalian atau tidak. Hal ini dapat memberikan manfaat yang signifikan bagi perusahaan pengiriman dalam mengoptimalkan pengelolaan dan pengendalian proses pengiriman. perlu diperhatikan bahwa untuk mendapatkan prediksi yang akurat dengan menggunakan Decision Tree, prediksi bergantung pada seberapa banyak variasi data yang digunakan dan seberapa baik preprocessing data sebelum data diuji. Secara keseluruhan, penelitian ini menggambarkan bahwa metode decision tree dengan algoritma C4.5 dan penerapannya dalam lingkungan berbasis website dapat menjadi alternatif yang efektif untuk memprediksi paket return.
Daftar Pustaka
-
[1] M. D. Kahfi, F. R. Umbara, and H. Ashaury, “Prediksi Pengangguran Menggunakan Decision Tree Dengan Algoritma C5.0 Pada Data Penduduk Kecamatan Caringin Kabupaten Bogor,” Informatics and Digital Expert (INDEX), vol. 4, no. 2, pp. 75–80, Jan. 2023, doi: 10.36423/index.v4i2.913.
-
[2] Y. Dwiyanti, A. Herdiani, and S. Y. Puspitasari, “Memprediksi Status Berlangganan Klien Bank Pada Kampanye Pemasaran Langsung Dengan Menggunakan Metode Klasifikasi Dengan Algoritma C5.0” eProceedings of Engineering,
-
[3] View of Prediksi Customer Churn dengan Algoritma Decision Tree C4.5 Berdasarkan Segmentasi Pelanggan untuk Mempertahankan Pelanggan pada Perusahaan Retail. https://jurnal.instiki.ac.id/index.php/jurnalresistor/article/view/219/91
-
[4] A. Nurzahputra, A. R. Safitri, and M. A. Muslim, “Klasifikasi Pelanggan pada Customer
Churn Prediction Menggunakan Decision Tree” PRISMA, Prosiding
-
[5] Y. R. Putri, “Prediksi Pola Kecelakaan Kerja Pada Perusahaan Non Ekstraktif
Menggunakan Algoritma Decision Tree: C4.5 Dan C5.0
802
Discussion and feedback