JNATIA Volume 1, Nomor 3, Mei 2023

Jurnal Nasional Teknologi Informasi dan Aplikasinya

p-ISSN: 2986-3929

Prediksi Paket Return Menggunakan Metode Decision Tree Menerapkan Algoritma C4.5 Berbasis Website

Oskar Maha Kasia1, Agus Muliantaraa2

aProgram Studi Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Udayana

Jalan Raya Kampus Udayana, Bukit Jimbaran, Kuta Selatan, Badung, Bali Indonesia 1[email protected] 2[email protected]

Abstract

The development of e-commerce technology has provided significant benefits in facilitating online transactions. However, one of the problems that is often faced by e-commerce companies is the management of return packages, where customers return goods that have been purchased. In order to optimize the package return management process, an effective prediction method is needed to estimate the possibility of returning packages by customers. With a website-based package return prediction system, e-commerce companies can take appropriate actions to manage return packages more efficiently. For example, they can adjust their inventory strategy, improve product quality, or provide special promotional offers to customers who have a high probability of returning packages. This can help increase customer satisfaction, reduce the cost of managing return packages, and increase the overall operational efficiency of the company.

Keywords: Prediksi Paket Return, Decision Tree, Algoritma C4.5

  • 1.    Pendahuluan

Dalam dunia bisnis dan e-commerce, kegiatan pengembalian paket atau return merupakan suatu hal yang lazim terjadi. Pengembalian paket dapat terjadi karena berbagai alasan, seperti barang rusak, ukuran yang tidak sesuai, atau keinginan pelanggan untuk mengembalikanproduk yang tidak memenuhi harapan mereka. Mengelola proses pengembalian paket dengan efisien sangat penting bagi perusahaan untuk menjaga kepuasan pelanggan dan meminimalkan kerugian.Dalam menghadapi tantangan tersebut, penggunaan metode prediksi dapat menjadi solusi yang efektif. Salah satu metode yang umum digunakan dalam prediksi paket return adalah metode decision tree (pohon keputusan). Decision tree adalah suatu model prediktif yang menggunakan struktur pohon untuk menggambarkan keputusan dan konsekuensi yang mungkin terjadi. Metode ini mampu memecahkan masalah klasifikasi dan prediksi dengan menggabungkan serangkaian aturan dan kondisi. Dalam penelitian ini, penulis akan menggunakan metode decision tree dengan algoritma C4.5 untuk memprediksi paket return. Algoritma C4.5 adalah salah satu algoritma pembentukan pohon keputusan yang populer dan efisien. Algoritma ini mampu menghasilkan pohon keputusan yang optimal dengan mempertimbangkan faktor-faktor seperti informasi gain dan perhitungan rasio gain. Selain itu, kami juga akan menerapkan prediksi paket return berbasis website. Dengan menggunakan platform berbasis website, perusahaan dapat mengintegrasikan sistem prediksi ini ke dalam infrastruktur mereka, sehingga memungkinkan penggunaan yang mudah dan aksesibilitas yang lebih luas. Tujuan dari penelitian ini adalah untuk mengembangkan suatu sistem prediksi paket return yang akurat dan efisien menggunakan metode decision tree dengan algoritma C4.5. Dengan adanya sistem ini, perusahaan dapat mengidentifikasi dan mengantisipasi paket yang berpotensi untuk mengalami pengembalian, sehingga dapat mengambil tindakan yang diperlukan untuk mengurangi dampak negatif dari pengembalian paket.

  • 2.    Metode Penelitian

Pre processing data

Menghitung Entropy

Menghitung Gain

Membuat pohon keputusan

Gambar 1. Tahapan Penelitian

Pada Gambar 1, dapat dilihat tahapan dari penelitian yang akan dibuat. penelitian diawali dengan melakukan mencari dataset dilanjutkan dengan preprocessing data, menghitung entropy serta gain sehingga dapat menghasilkan urutan node yang tepat sehingga akhirnya akan menjadi pohon keputusan.

  • 2.1    Pengumpulan Data

Pengumpulan dataset dilakukan dengan cara mengumpulkan data historis pengembalian paket dari data paket pengembalian perusahaan. Data ini harus mencakup berbagai atribut yang relevan, seperti karakteristik produk, informasi pelanggan, alasan pengembalian, dan status pengembalian.

  • 2.2    Pemilihan Algoritma

Algoritma yang akan digunakan pada penelitian ini adalah Decision Tree dengan menggunakan algoritma C4.5 yang akan dibandingkan

  • a.    Decision Tree

Root fiJotλς,

Gambar 2. Cara Kerja dari Metode Decision Tree

Decision Tree merupakan sekian dari banyak metode di dalam data mining, dimana data mining adalah proses mengekstrak data dengan menggunakan metode dan algoritma tertentu untuk menghasilkan informasi yang lebih berguna sehingga dapat menjadi dasar dalam pengambilan keputusan (Firmansyah & Yulianto, 2021). Diperkenalkan pertama kali oleh J. Ross Quinlan di awal tahun 1980 168 dengan nama ID3. Decision tree adalah flowchart yang memiliki struktur pohon dimana masing-masing nodenya memiliki atribut, setiap cabang menggambarkan keluaran dari pengujian dan setiap daun memiliki label (Han et al., 2012). Pada tahun-tahun berikutnya barulah Quinlan memperkenalkan C4.5 sebagai algoritma supervised learning yang lebih baru sebagai penyempurnaan dari ID3.

  • b.    Algoritma C4.5

Algoritma C4.5 adalah salah satu algoritma pembentukan pohon keputusan yang dikembangkan oleh Ross Quinlan pada tahun 1993. Algoritma ini merupakan pengembangan dari algoritma sebelumnya yang dikenal sebagai ID3 (Iterative Dichotomiser 3). Algoritma C4.5 memiliki keunggulan dalam mengatasi atribut kontinu, menangani data yang hilang, dan menggunakan gain rasio untuk pemilihan atribut pembagi. Ini membantu dalam menghasilkan pohon keputusan yang lebih akurat dan lebih efisien.Dalam konteks prediksi paket return, algoritma C4.5 dapat digunakan untuk membangun pohon keputusan yang dapat memprediksi kemungkinan pengembalian paket berdasarkan atribut-atribut yang relevan, seperti karakteristik produk, informasi pelanggan, dan alasan.

  • 2.3    Pemodelan Decision Tree

Salah satu tahapan dalam proses penelitian yang sudah dijelaskan pada gambar 1 adalah preprocessing dan pemodelan data. Pada penelitian ini, penulis akan melakukan perancangan model data. Pada tahap metode yang akan digunakan adalah sebagai berikut

  • a.    Perhitungan Gain

MSE merupakan rata rata kuadrat kesalahan yang dihitung dengan menjumlahkan semua kesalahan atau eror prediksi yang dihasilkan oleh suatu model kemudian dikuadratkan dan

membaginya dengan jumlah periode prediksi [10]. Berikut merupakan persamaan matematis dari MSE :

n


GAIN(S,A) = Entropy(S) -


Entropy(Si) i


(1)


  • b.    Menghitung Nilai Entropy

MAE merupakan selisih absolut antara nilai prediksi dan nilai yang sebenarnya kemudian akan dihitung rata rata dari selisih tersebut. MAE dapat memberikan gambaeran rata rata prediksi dengan nilai yang sebenarnya. Berikut merupakan persamaan matematis dari MAE :

n


Entropy(S) =


∑Pi*Log2Pi i


(2)


  • 3.    Hasil dan Diskusi

    • 3.1    Perancangan Model

Pada penelitian ini, jumlah total data yang digunakan adalah sebanyak 50591 baris memuat kolom yang meliputi Id, alamat, provinsi, kabupaten, kecamatan/kota, umur, nilai transaksi, ekspedisi, dll. Dataset yang digunakan merupakan dataset historis penjualan dari suatu perusahaan.


Gambar 3. Dataset yang Digunakan dalam Perancangan Model

Data yang sudah dipersiapkan kemudian akan dicari nilai entropy dan gain sehingga dapat melanjutkan step selanjutnya yaitu pembuatan node. Berikut hasil yang telah didapatkan setelah melakukan perhitungan entropy dan gain.

Jumlah kasus

Tidak

Ya

Entropy

Info gain

Split info

Gain Ration

Umur

-26769,91948

0,753200875

-35541,54059

<= 20 tahun

12165

2163

10002

-0,86305143

>= 20 tahun

40418

6910

33508

-0,876016718

Alamat

-22133,22729

0,854115163

-25913,63348

<= 80 character

14495

2776

11719

-0,838110367

>= 80 character

36624

6050

30574

-0,887236729

Ekspedisi

JNE

8384

1878

6506

-0,783998024

-0,210051675

0,98699925

JNT

29344

4538

24806

-0,908440394

SAP

289

239

50

-0,302868602

SICEPAT

434

177

257

-0,569873286

Nilai COD

-2691,441352

0,864409849

-3113,617174

<= 200k

36174

5952

21567

-2,275208468

>= 200k

14740

2838

9235

-1,73740876

Total

50593

8727

41863

-0,873486703

Gambar 4. Hasil Perhitungan Entropy dan Gain

  • 3.2    Integrasi Backend dengan Frontend

Pada penelitian ini, peneliti menggunakan framework laravel sebagai backend sedangkan NextJs yang digunakan dalam pembuatan antaramuka sistem sehingga dapat mempermudah seller dalam melakukan prediksi paket return.

© Tokuby


Q. ∩ ^⅞ Aneska M.


a Dashboard


Q Orders


Q Shipping


@ Expedition & Payment method


Paket berpotensi return


Select expedition


Select payment


— JNEExpress


COD


θ Detaiiorder


CU Accounts


Sub total


Rp. 313.000


S Reports


0 Analytics


© Settings


Ridho attoriq

JL G∏. Lebah No. 4, Tegal Harum

Serum tokuby


Rp. 99.000


Rp. 445.000


Rp. 125.000


Shipping fee


Rp. 10.000


PPN 11%


Rp. 3.553


Total


Rp. 326.553


Checkout



Tabel 1. Integration Testing

No

Integration Testing

Status

1

Pengujian pada input order

Succeed

2

Pengujian tombolquantity item tambah dan kurang Succeed

3

Pengujian pada tombol checkout

Succeed

4

Kesesuaian hasil prediksi dengan prediksi model

Succeed

Createorder

Gambar 5. Tampilan Antarmuka Sistem Berpotensi Return

Jurnal Nasional Teknologi Informasi dan Aplikasinya

0 τokuby < Createorder

Q. £1 ^⅞ Aneska M.


π Dashboard


Q Orders


θ Shipping            θ Expedition & Payment method


Paket tidak berpotensi return


@ Detaiiorder


® Accounts

Q Reports

0 Analytics

© Settings


Sub total


Rp. 313.000



Oskar maha kasi              Select expedition         Select payment

Jalan Raya PKP No. 24 Kelapa DUa

— JNEExpress ~     4 COD

Wetani Ciracasl sebelah kantor desa


Shipping fee


Rp. 10.000


Rp. 3.553

PPN 11%

Rp. 326.553

Total


Gambar 6. Tampilan Antarmuka Sistem Tidak Berpotensi Return

  • 4.    Kesimpulan

Berdasarkan percobaan yang dilakukan pada algoritma Decision Tree dengan menggunakan algoritma C4.5 dapat disimpulkan bahwa metode prediksi paket return menggunakan decision tree dengan algoritma C4.5 mampu memberikan prediksi yang cukup akurat. Model yang dikembangkan berhasil memperoleh tingkat akurasi yang memadai dalam memprediksi apakah suatu paket akan mengalami pengembalian atau tidak. Hal ini dapat memberikan manfaat yang signifikan bagi perusahaan pengiriman dalam mengoptimalkan pengelolaan dan pengendalian proses pengiriman. perlu diperhatikan bahwa untuk mendapatkan prediksi yang akurat dengan menggunakan Decision Tree, prediksi bergantung pada seberapa banyak variasi data yang digunakan dan seberapa baik preprocessing data sebelum data diuji. Secara keseluruhan, penelitian ini menggambarkan bahwa metode decision tree dengan algoritma C4.5 dan penerapannya dalam lingkungan berbasis website dapat menjadi alternatif yang efektif untuk memprediksi paket return.

Daftar Pustaka

  • [1]    M. D. Kahfi, F. R. Umbara, and H. Ashaury, “Prediksi Pengangguran Menggunakan Decision Tree Dengan Algoritma C5.0 Pada Data Penduduk Kecamatan Caringin Kabupaten Bogor,” Informatics and Digital Expert (INDEX), vol. 4, no. 2, pp. 75–80, Jan. 2023, doi: 10.36423/index.v4i2.913.

  • [2]    Y. Dwiyanti, A. Herdiani, and S. Y. Puspitasari, “Memprediksi Status Berlangganan Klien Bank Pada Kampanye Pemasaran Langsung Dengan Menggunakan Metode Klasifikasi Dengan Algoritma C5.0” eProceedings of Engineering,

  • [3]    View of Prediksi Customer Churn dengan Algoritma Decision Tree C4.5 Berdasarkan Segmentasi Pelanggan untuk Mempertahankan Pelanggan pada Perusahaan Retail. https://jurnal.instiki.ac.id/index.php/jurnalresistor/article/view/219/91

  • [4]   A. Nurzahputra, A. R. Safitri, and M. A. Muslim, “Klasifikasi Pelanggan pada Customer

Churn Prediction Menggunakan Decision Tree” PRISMA, Prosiding

  • [5]   Y.  R. Putri, “Prediksi Pola Kecelakaan Kerja Pada Perusahaan  Non  Ekstraktif

Menggunakan Algoritma Decision Tree: C4.5 Dan C5.0

802