p-ISSN: 1979-5661

e-ISSN: 2622-321X

Jurnal Ilmu Komputer VOL. 14 No. 2

Implementasi Data Mining Menggunakan Algoritma Apriori Pada Penjualan Suku Cadang Motor

Ainul Mardiaha1, Yuliaa2

aUniversitas Putera Batam, Teknik Informatika Jln. R. Soeprapto, Muka Kuning, Batam, Indonesia 1[email protected] 2[email protected]

Abstract

This research was carried out to simplify or assist Candra Motor workshop owners in managing data and archives of motorcycle parts sales by applying a data mining a priori algorithm method. Data mining is an operation that uses a particular technique or method to look for different patterns or shapes in a selected data. Sales data for a year with the number of 15 items selected using the priori algorithm method. A priori algorithm is an algorithm for taking data with associative rules (association rule) to determine the associative relationship of an item combination. In a priori algorithm, it is determined frequent itemset-1, frequent itemset-2, and frequent itemset-3 so that the association rules can be obtained from previously selected data. To obtain the frequent itemset, each selected data must meet the minimum support and minimum confidence requirements. In this study using minimum support ≥ 7 or 0.583 and minimum confidence of 90%. So that some rules of association were obtained, where the calculation of the search for association rules manually and using WEKA software obtained the same results.By fulfilling the minimum support and minimum confidence requirements, the most sold spare parts are inner tube, Yamaha oil and MPX oil.

Keywords: Data Mining, Motor Parts Sales, Apriori Algorithms

  • 1.    Pendahuluan

Berbicara mengenai segala hal yang berhubungan dengan perkembangan teknologi tidak akan ada habis-habisnya sama sekali. Setiap tahunnya pasti akan mengalami perkembangan, dimana perkembangan dari teknologi tersebut memiliki tujuan agar tercipta suatu teknologi yang lebih baik lagi dan bisa membuat perubahan dalam mempermudah semua tugas termasuk dalam pengolahan data penjualan. Salah satu teknologi yang banyak digunakan oleh masyarakat untuk membantu mempermudah pekerjaan mereka dalam pengolahan data penjualan adalah data mining [1].

Setiap aktivitas penjualan memiliki banyak data yang harus diolah agar data tersebut menjadi bermanfaat dan tidak hanya menjadi tumpukan data saja. Salah satu tempat yang selalu melakukan banyak transaksi penjualan adalah bengkel motor. Bengkel motor merupakan tempat penyedia jasa service motor serta penjualan suku cadang motor [2]. Bengkel bergerak dibidang dunia bisnis, dimana yang setiap harinya akan terjadi transaksi, baik transaksi service motor ataupun penjualan suku cadang motor. Karena setiap harinya terjadi transaksi penjualan, maka kemungkinan besar data transaksi yang diperoleh akan sangat banyak dan menumpuk. Data transaksi yang diperoleh sering kali hanya digunakan sebagai arsip ataupun bukti penjualan, selain itu data tersebut sudah tidak memiliki fungsi lagi bagi bengkel tersebut, maka data tersebut hanya akan menjadi tumpukan data yang tidak berguna. Dengan adanya perkembangan teknologi, maka data tersebut dapat memberi keuntungan bagi bengkel Candra Motor agar dapat meminimalisir waktu kerja pengguna data mining [3].

Data mining adalah suatu operasi yang menggunakan teknik atau metode tertentu untuk mencari pola atau bentuk yang berbeda dalam sebuah data yang terpilih [4]. Penelitian

data mining ini menggunakan algoritma apriori. Algoritma apriori adalah algoritma pengambilan data dengan aturan asosiatif (association rule) untuk menentukan hubungan asosiatif suatu kombinasi item. Association rule yang dimaksud dilakukan melalui mekanisme penghitungan support dan confidence dari suatu hubungan item [5]. Jika strategi penjualan suku cadang motor tidak direncanakan dengan baik dan benar, maka strategi penjualan suku cadang motor tersebut akan membutuhkan waktu yang lama atau menghabiskan banyak waktu, biaya dan tenaga. Dengan adanya bantuan perkembangan teknologi seharusnya bisa meminimalisir waktu, biaya dan tenaga manusia yang digunakan. Misalnya mempermudah pekerjaan untuk mengetahui barang apa saja yang dibeli oleh para konsumen, sehingga waktu pelayanan terhadap konsumen menjadi lebih efektif. Salah satunya adalah dengan mengimplementasikan penggunaan data mining [6].

  • 2.    Metodologi Penelitian

    2.1    Desain Penelitian

Dalam melakukan suatu penelitian, sangat diperlukan suatu perencanaan ataupun perancangan penelitian, agar penelitian tersebut dapat berjalan dengan baik dan sistematis. Suatu perencanaan ataupun perancangan penelitian tentang data mining ini dipresentasikan di dalam sebuah desain penelitian yang dijelaskan pada gambar 1 berikut.

Gambar 1. Desain Penelitian


Tahapan-tahapan penelitian sebagai berikut :

  • a)    Analisis Data

Setelah data selesai diseleksi, kemudian data dianalisis kembali, agar data yang diperoleh lebih akurat. Data yang digunakan adalah data transaksi penjualan suku cadang motor di bengkel candra dari transaksi barang yang banyak terjual.

  • b)    Mengolah Data dengan data mining

Data-data yang sudah dianalisis kemudian diolah menggunakan data mining dengan algoritma apriori sehingga mendapatkan rule assosiasi. Pada tahap ini akan dilakukan perhitungan nilai support dan confidence dan akan dilihat apakah pada frequent tersebut dapat memenuhi syarat minimum support dan syarat minimum confidence [7].

Support (A) = Jumlah transaksi mengandung A                     (1)

Total Transaksi

Confidence = P(B|A) = ∑ Transaksi mengandung A dan B (2)

∑ Transaksi mengandung A

  • c)    Implementasi Sistem

Pengujian data yang dilakukan dengan aplikasi WEKA, untuk memperoleh kecocokan data yang diolah secara manual dengan sistem.

  • d)    Hasil

Dari semua proses yang sudah dilakukan maka diperoleh suatu hasil dari data penelitian tersebut berupa item set yang paling banyak terjual. Sehingga terbentuk rule assosiasi dari penjualan suku cadang motor.

  • 2.2    Operasional Variabel

Menurut [8] definisi operasional adalah penentuan data atau sifat yang akan dipelajari sehingga menjadi variabel yang dapat diukur. Definisi operasional menjelaskan cara tertentu yang digunakan untuk meneliti dan mengoperasikan konstrak, sehingga memungkinkan bagi peneliti yang lain untuk melakukan replikasi pengukuran dengan cara yang sama atau mengembangkan cara pengukuran konstrak yang lebih baik. Adapun variabel-variabel yang diambil sebagai sumber data adalah sebagai berikut :

  • a)    Jumlah Transaksi

Jumlah transaksi yaitu banyaknya jumlah penjualan stok suku cadang motor dalam kurun waktu perbulan selama setahun terakhir. Dari data jumlah transaksi ini dapat menentukan item set yang paling banyak terjual.

  • b)    Nama Suku Cadang Motor

Nama suku cadang motor merupakan nama-nama produk ataupun barang yang tersedia di bengkel Candra Motor dan produk atau barang mana saja yang paling banyak terjual. Adapun nama-nama produk atau barang yang tersedia adalah oli mesin, oli samping, ban dalam, ban luar, kampas rem belakang, dll.

  • 2.4    Metode Analisis dan Perancangan Sistem

  • a)    Metode Analisis

Metode analisis merupakan suatu hal yang terpenting dalam melakukan sebuah penelitian. Jika metode sebuah penelitian tidak mempunyai metode analisis, maka keakuratan hasil dari sebuah penelitian tersebut masih diragukan. Metode analisis sangat mempengaruhi hasil dari sebuah penelitian tersebut. Sehingga pada penelitian ini menggunakan data mining dengan metode apriori.

  • b)    Perancangan Sistem

Adapun metode perancangan sistem yang digunakan dapat dijelaskan pada gambar yang di bawah ini.

Gambar 2. Perancangan Sistem

Pada gambar 2 dapat dijelaskan bahwa mengumpulkan data penjualan suku cadang pada bengkel Candra Motor akan dilakukan seleksi data untuk memilih data yang layak untuk dijadikan sampel. Data yang digunakan adalah penjualan perhari, perbulan, pertahun kemudian akan diolah menggunakan algoritma apriori dan dan diimplementasikan dengan aplikasi WEKA.

  • 3.    Hasil dan Pembahasan

    3.1    Analisa Data

Bengkel merupakan tempat yang menyediakan jasa perbaikan (service) motor serta penjualan berbagai suku cadang motor. Pada bengkel Candra Motor, data transaksi penjualan item suku cadang motor akan diolah dengan data mining algoritma apriori yang akan menemukan item suku cadang motor yang paling sering terjual. Adapun jenis suku cadang motor yang dijual dapat dikelompokkan menjadi beberapa macam. Jenis suku cadang motor tersebut dapat dilihat pada tabel 1 berikut.

Tabel 1. Daftar Item suku cadang motor

No.

Nama Item

Kode

1

Ban Dalam

BD

2

Kampas Kramol

KK

3

Oli Mestran

OM

4

Kampas

K

5

Kain Jok

KJ

6

Oli Gerbok

OG

7

Batu Arang Stater

BAS

8

Oli Castrol

OC

9

Oli MPX

OMP

10

Kampas Cakram

KC

11

Bola Lampu

BL

12

Oli Yamalub

OY

13

Busi

B

14

Oli Ultratec

OU

15

Aki Air

AA

16

Sel Sock

SS

17

Rantai

R

18

Oli SGO

OS

19

Oli TOP1

OT

Pada Daftar item suku cadang motor pada tabel 1 di atas adalah data awal yang akan dipakai dalam transaksi penjualan suku cadang motor. Sampel yang digunakan sebanyak 12 transaksi penjualan suku cadang motor, data yang diambil adalah item yang terjual > 6 perbulannya. Transaksi penjualan suku cadang motor dapat dilihat pada tabel 2 berikut.

Tabel 2. Data Set Awal Penjualan Suku Cadang Motor

No Transaksi

Suku Cadang

1 Juni

BD, OM, K, KJ, OG, OC, OMP, KC, BL, OY, B

  • 2    Juli

  • 3   Agustus

  • 4    September

  • 5    Oktober

  • 6   November

  • 7    Desember

  • 8    Januari

  • 9    Februari

  • 10    Maret

  • 11    April

  • 12    Mei

BD, KK, K, OG, OMP, OY, B, OU, OS

BD, KK, OM, K, KJ, OG, OC, OMP, KC, OY,

BD, OM, KJ, OG, OC, OMP, OY,

BD, KK, OM, K, KJ, OG, OMP, KC, BL, OY, B, R, OS

BD, OM, K, OG, OMP, BL, OY, B,

BD, OM, K, OG, OMP, KC, BL, OY, B, R

BD, OG, OMP, OY

BD, KK, OM, OG, OMP, KC, OY, B

BD, KK, OM, OG, OMP, OY, B

BD, OMP, OY, B

OMP

Setelah data set awal penjualan suku cadang motor sudah dikelompokkan ke dalam sebuah tabel, untuk lebih mempermudah data dapat dibaca maka jenis transaksi akan diberikan kode pada setiap transaksi, adapun kode tersebut dapat dilihat pada tabel 3 berikut.

Tabel 3. Kode Transaksi

No.   Transaksi    Kode

  • 1      Januari      Jan

  • 2     Februari     Feb

  • 3     Maret      Mar

  • 4       April        Apr

  • 5       Mei        Mei

  • 6      Juni       Jun

  • 7         Juli          Jul

  • 8     Agustus     Agus

  • 9   September   Sept

  • 10    Oktober     Okt

  • 11   November    Nov

  • 12   Desember    Des

Di dalam sebuah proses KDD tahapan awalnya adalah pembersihan data (data cleaning), pembersihan data (data cleaning) sudah selesai dilakukan pada tahapan sebelumnya [9]. Setelah data cleaning, maka tahapan berikutnya adalah integrasi data (penggabungan data dari beberapa penjualan). Hasil dari integrasi data transaksi dapat dilihat pada tabel 4 di bawah

ini.

Tabel 4. Hasil integrasi data transaksi

Transaksi BD KK

OM K KJ OG OC OMP KC BL OY B OU R OS

Jun      Y   N

Jul      Y   Y

Y  Y Y   Y   Y   Y   Y  Y  Y Y N  N  N

N  Y N   Y   N   Y   N   N   Y Y Y  N  Y

Agus     Y   Y

Sept     Y   N

Okt     Y   Y

Y  Y  Y   Y   Y   Y   Y  N   Y  N  N  N  N

Y  N  Y   Y   Y    Y    N   N   Y  N  N  N  N

Y  Y  Y  Y   N   Y   Y  Y  Y  Y  N  Y  Y

Nov

Y

N

Y

Y

N

Y

N

Y

N

Y

Y

Y

N

N

N

Des

Y

N

Y

Y

N

Y

N

Y

Y

Y

Y

Y

N

Y

N

Jan

Y

N

N

N

N

Y

N

Y

N

N

Y

N

N

N

N

Feb

Y

Y

Y

N

N

Y

N

Y

Y

N

Y

Y

N

N

N

Mar

Y

Y

Y

N

N

Y

N

Y

N

N

Y

Y

N

N

N

Apr

Y

N

N

N

N

N

N

Y

N

N

Y

Y

N

N

N

Mei

N

N

N

N

N

N

N

Y

N

N

N

N

N

N

N

Keterangan :

Y       : Yes (item terjual)

N       : No (item tidak terjual)

  • 3.2    Hasil Pengujian

Penjualan suku cadang motor mengakumulasikan data transaksi penjualan menggunakan data mining dengan teknik association rule. Algoritma apriori digunakan untuk mencari aturan yang mempunyai support ≥ minsup dan confidence ≥ minconf, dimana minsup adalah ambang batas support, sedangkan minconf adalah ambang batas confidence [10].

  • 3.2.1    Pengujian Secara Manual

Algoritma apriori menggunakan pendekatan secara interaktif yang diketahui juga dengan level-wise search dimana k-item digunakan untuk mencari (k+1) itemset . Langkah pertama adalah mencari set dari frequent 1- itemset, set ini dilambangkan sebagai F1 dimana F1 digunakan untuk menemukan F2, dari frequent 2- itemset, akan digunakan untuk F3 dan seterusnya sampai tidak ada lagi frequent k-itemset yang ditemukan. Proses untuk menemukan setiap frequent (Fk) dengan melakukan satu kali pemeriksaan menyeluruh pada database yang artinya apabila k ada tiga atau lebih, maka pemeriksaan terhadap database dilakukan sebanyak tiga kali atau lebih sampai k [11].

Dari data transaksi suku cadang motor diasumsikan frequent item > 7 atau dengan support 0,583 seperti pada tabel 5 berikut.

Tabel 5. Frequent 1-itemset

C1

No.

Itemset

Frequent Item

Support

1

BD(Y)

11

0.917

2

BD(N)

1

0.083

3

KK(Y)

5

0.417

4

KK(N)

7

0.583

5

OM(Y)

8

0.67

6

OM(N)

4

0.33

7

K(Y)

6

0.5

8

K(N)

6

0.5

9

KJ(Y)

4

0.33

10

KJ(N)

8

0. 67

11

OG(Y)

10

0.83

12

OG(N)

2

0.17

13

OC(Y)

3

0.25

14

OC(N)

9

0.75

15

OMP(Y)

11

0.917

16

OMP(N)

1

0.083

17

KC(Y)

5

0.417

18

KC(N)

7

0.583

19

BL(Y)

4

0.33

20

BL(N)

8

0.67

21

OY(Y)

11

0.917

22

OY(N)

1

0.083

23

B(Y)

8

0.67

24

B(N)

4

0.33

25

OU(Y)

1

0.083

26

OU(N)

11

0.917

27

R(Y)

2

0.17

28

R(N)

10

0.83

29

OS(Y)

2

0.17

30

OS(N)

10

0.83

Pada tabel 5 itemset nomor 2 {BD(N)}, nomor 3 {KK(Y)}, nomor 6 {OM(N)}, nomor 7 {K(Y)}, nomor 8 {K(N)}, nomor 9 {KJ(Y)}, nomor 12 {OG(N)}, nomor 13 {OC(Y)}, nomor 16 {OMP(N)}, nomor 17 {KC(Y)}, nomor 19 {BL(Y)}, nomor 22 {OY(N)}, nomor 24 {B(N)}, nomor 25 {OU(Y)}, nomor 27 {R(Y)} dan nomor 29 {OS(Y)} bukan termasuk frequent item, karena tidak memenuhi syarat frequent 1-itemset sehingga tidak termasuk pada tabel F1. Selanjutnya algoritma akan mencari semua transaksi untuk menghitung transaksi penjualan suku cadang motor yang muncul pada setiap item sampai frequent 3-itemset (F3).

C3


Tabel 6. Frequent 3-Itemset

No.

Itemset

Frequent Item

Support

Confidence

1

BD(Y),OM(Y),KJ(N)

4

0.33

50%

2

BD(Y),OM(Y),OG(Y)

8

0.67

100%

3

BD(Y),OM(Y),OC(N)

5

0.417

63%

4

BD(Y),OM(Y),OMP(Y)

8

0.67

100%

5

BD(Y),OM(Y),BL(N)

4

0.33

50%

6

BD(Y),OM(Y),OY(Y)

8

0.67

100%

7

BD(Y),OM(Y),B(Y)

6

0.5

75%

8

BD(Y),OM(Y),OU(N)

8

0.67

100%

9

BD(Y),OM(Y),R(N)

6

0.5

75%

10

BD(Y),OM(Y),OS(N)

7

0.583

88%

11

KK(N),OMP(Y),OU(N)

7

0.583

100%

12

KK(N),OMP(Y),OS(N)

7

0.583

100%

13

OM(Y),OG(Y),OMP(Y)

8

0.67

100%

14

OM(Y),OG(Y),OY(Y)

8

0.67

100%

15

OM(Y),OG(Y),OU(N)             8            0.67      100%

16

OM(Y),OG(Y),OS(N)             7            0.583     88%

17

KJ(N),OC(N),OMP(Y)            8            0.67      100%

18

KJ(N),OC(N),OY(Y)              7            0.583     88%

19

KJ(N),OC(N),OU(N)              7            0.583     88%

20

KJ(N),OC(N),R(N)                7            0.583      88%

21

KJ(N),OC(N),OS(N)              7            0.583     88%

22

OG(Y),OC(N),OMP(Y)            7            0.583     100%

23

OG(Y),OC(N),OY(Y)             7            0.583     100%

24

OG(Y),OC(N),B(Y)                6             0.5       86%

25

OG(Y),OC(N),OU(N)             6             0.5      86%

26

OG(Y),OC(N),R(N)               5           0.417     71%

27

OG(Y),OC(N),OS(N)             5           0.417     71%

28

OC(N),OY(Y),B(Y)                7            0.583      88%

29

OC(N),OY(Y),OU(N)             7            0.583     88%

30

OC(N),OY(Y),R(N)               6             0.5      75%

31

OC(N),OY(Y),OS(N)             6             0.5      75%

32

OMP(Y),KC(N),BL(N)            6             0.5      86%

33

OMP(Y),KC(N),OY(Y)            6             0.5      86%

34

OMP(Y),KC(N),B(Y)              4            0.33      57%

35

OMP(Y),KC(N),OU(N)            6             0.5      86%

36

OMP(Y),KC(N),R(N)             7            0.583     100%

37

OMP(Y),KC(N),OS(N)           6            0.5      86%

38

KC(N),R(N),OS(N)                6             0.5       86%

39

BL(N),OY(Y),OU(N)              6             0.5      86%

40

BL(N),OY(Y),R(N)                7            0.583      100%

41

OY(Y),B(Y),OU(N)                7            0.583      88%

42

OY(Y),B(Y),R(N)                  6             0.5       75%

43

OY(Y),B(Y),OS(N)                6             0.5       75%

44

B(Y),OU(N),R(N)                 4             0.33      57%

45

OU(N),R(N),OS(N)               9            0.75      100%

Dari tabel 6 di atas kandidat C3 dari frequent 3-itemset, terdapat 45 pasang itemset. Dan yang hanya memenuhi syarat minimum support dan minimum confidence 15 itemset yang terbentuk. Dengan munculnya frequent 3- itemset (F3) tersebut maka calon aturan assosiasi dengan 2 antecedent yang memenuhi syarat mincoft 90%.

  • 3.2.2    Pengujian Menggunakan WEKA

  • 1)    Sebelum data diolah menggunakan WEKA, maka salin data penjualan suku cadang motor pada MS.Excel terlebih dahulu.

2) Buka aplikasi WEKA, kemudian klik menu “explore”.

  • 3)    Setelah muncul tampilan seperti gambar yang dibawah ini, pilih type data yang kita gunakan, type data yang dipakai adalah CSV.

  • 4)    Lalu hasil dari pengolahan data tersebut akan tampil seperti pada gambar di

bawah ini.

  • 4.    Kesimpulan

Data mining Algoritma apriori dapat digunakan untuk mengolah data hasil transaksi penjualan suku cadang motor pada bengkel Candra Motor, sehingga dapat menentukan rule asosiasi antar barang yang terjual sehingga memudahkan pengguna jumlah barang yang terjual. Data mining algoritma apriori memberikan keputan yang tepat pengolahan data secara manual maupun menggunakan software WEKA 3.9, maka suku cadang motor yang paling banyak terjual adalah ban dalam, oli Yamaha, dan oli MPX dengan nilai minimum support 90% dan minimum confidence 100%.

Daftar Pustaka

  • [1]    D. S. Purnia and A. I. Warnilah, “Implementasi Data Mining Pada Penjualan Kacamata Menggunakan Algoritma Apriori,” vol. 2, no. 2, pp. 31–39, 2017.

  • [2]    A. H. Elyas and J. Prayoga, “Implementasi Data Mining Pola penjualan Sparepart Motor Honda Pada Pt Rotella Persada Mandiri Dengan Menggunakan Algoritma Apriori,” vol. 1, no. 1, pp. 22–31, 2020.

  • [3]    Y. Yulia and N. Azwanti, “Penerapan Algoritma C4.5 Untuk Memprediksi Besarnya Penggunaan Listrik Rumah Tangga di Kota Batam,” Resti, vol. 2, no. 2, pp. 584–590, 2018.

  • [4]    E. Buulolo, “Implementasi Algoritma Apriori Pada Sistem Persediaan Obat ( Studi Kasus : Apotik Rumah Sakit Estomihi Medan ),” pp. 71-83, 2013.

  • [5]    R. Yanto and R. Khoiriah, “Implementasi Data Mining dengan Metode Algoritma Apriori dalam Menentukan Pola Pembelian Obat,” pp. 102–113, 2015.

  • [6]    S. B. A. Saputra, R. Dwiana, W. D. N. Oktaviani, R. D. Isnaeni’, T. Astuti, and Nurfaizah, “Implementasi Data Mining Algoritme Apriori pada Penjualan Suku Cadang Motor Delta Motor,” Citisee, pp. 108–113, 2016.

  • [7]    R. Ristianinggrum and S. Sulatri, “Implementasi data mining menggunakan algoritma apriori 1,2,” Pros. SINTAK, pp. 372–382, 2017.

  • [8]    Sugiyono, No Title. 2014.

  • [9]    J. L. Putra et al., “IMPLEMENTASI ALGORITMA APRIORI TERHADAP DATA PENJUALAN,” vol. 15, no. 1, pp. 85–90, 2019.

  • [10]    H. Kusumo, E. Sediyono, and M. Marwata, “Analisis Algoritma Apriori Untuk Mendukung Strategi Promosi Perguruan Tinggi,” vol. 1, no. 1, pp. 51–62, 2019.

  • [11]    M. P. Tana, F. Marisa, I. D. Wijaya, J. T. Informatika, and F. T. U. Widyagama, “Penerapan Metode Data Mining Market Basket Analysis Terhadap Data Penjualan Produk Pada Toko Oase Menggunakan Algoritma Apriori,” vol. 3, no. 2, pp. 17–22, 2018.

134