JNATIA Volume 1, Nomor 1, November 2022

Jurnal Nasional Teknologi Informasi dan Aplikasinya

Analisis Clustering Paket Data Internet di Indonesia Menggunakan Metode K-Means

I Putu Ananta Wijayaa1, I Gede Santi Astawaa2

aProgram Studi Informatika, Universitas Udayana Badung, Indonesia

1[email protected]

2[email protected]

Abstract

Disruption of technology and the impact of the recent pandemic has made people access the internet longer than before, especially with smartphones. Before accessing the internet, users must purchase a data package provided by an internet service provider. Various data packages are provided by internet service providers. Starting from network coverage, speed, number of quotas, active period, to tariffs are the choices of each operator. These various offerings often make users confused because they have to adjust to economic conditions. The existence of knowledge analysis in the database, grouping data packets can be done using the k-means method. K-means groups data by iterating and creating groups based on the closest distance of the data to the center point. K-means is very widely used because of its simplicity. Before clustering, the data will go through a preprocessing process. The end result is four clusters that have their own characteristics. For example, cluster four has the characteristics of a small quota with a long active period, which is suitable for the typical community who only wants to stay connected to the internet for communication.

Keywords: K-means, Internet Quota, Clustering, Internet Provider Indonesia, Data Mining

  • 1.    Pendahuluan

Internet menghubungkan banyak orang di seluruh dunia. Di Indonesia, 19,5% masyarakatnya menghabiskan waktu lebih dari 8 jam sehari untuk mengakses internet. Hal ini dibuktikan dengan hasil survei Asosiasi Penyelenggara Jasa Internet Indonesia (APJII) periode 2019-kuartal II/2020. Ditambah lagi, pandemi Covid-19 yang mendisrupsi cara kerja masyarakat menjadi online, membuat internet seakan-akan menjadi kebutuhan primer. We Are Social menyebutkan terjadi peningkatan sebesar 2,1 juta pengguna internet pada Januari 2022 dibandingkan tahun sebelumnya. Per Januari 2022, terdapat 205 juta pengguna internet di Indonesia, yaitu 73,7% dari populasi Indonesia yang telah menggunakan internet. We Are Social juga menyebutkan 94,1% pengguna internet Indonesia mengakses internet menggunakan handphone[2].

Salah satu cara mengakses internet adalah melalui penyedia layanan internet. Banyak penyedia layanan internet di Indonesia. Sebelum mengakses internet, pengguna harus membeli paket data yang disediakan oleh penyedia layanan internet. Akibat kebutuhan internet meningkat pesat, kebutuhan paket data atau kuota internet pun semakin besar. Beragam paket data pun disediakan oleh penyedia layanan internet. Mulai dari cakupan jaringan, kecepatan, jumlah kuota, masa aktif, hingga tarif menjadi pilihan masing-masing operator (penyedia layanan internet). Dengan beragamnya skema tarif internet yang ditawarkan dan penyedia layanan internet yang ada, terkadang pelanggan justru bingung memilih paket data yang ada.

Salah satu langkah analisis dalam penemuan pengetahuan di dalam basis data adalah data mining. Pengetahuan yang dimaksud adalah pola data atau relasi antar data yang tidak diketahui sebelumnya. Dapat dikatakan, data mining adalah teknik analisis data untuk mendapatkan informasi yang tersembunyi dari data yang kompleks dalam jumlah besar. Salah satu tugas data mining berdasarkan fungsionalitasnya adalah clustering (klasterisasi)[3]. Clustering merupakan metode analisis yang bersifat tanpa arahan (unsupervised) yang bertujuan mengelompokkan data sesuai dengan ukuran kemiripannya. Salah satu algoritma pengelompokkan data adalah k-

means. K-means digunakan karena memiliki kelebihan yaitu implementasi algoritma yang mudah, waktu komputasi yang relatif cepat dan telah digunakan secara luas untuk menyelesaikan berbagai persoalan komputasi[4]. Implementasi algoritma k-means dimulai dengan memilih k objek data secara acak sebagai titik pusat (centroid) awal, memasukkan setiap objek yang bukan centroid ke klaster terdekat berdasarkan ukuran jarak, memperbaharui setiap centroid berdasarkan rata-rata dari objek yang ada di setiap klaster, iterasi ulang hingga centroid stabil [5].

Penelitian tentang clustering sebelumnya pernah dilakukan oleh Y. Darmi, dkk(2022) menggunakan klasterisasi dalam mengelompokkan penjualan produk menjadi dua klaster, yaitu produk yang laku dan tidak laku. Selain itu, disimpulkan semakin banyak data di input, maka centroid yang dapat terbentuk semakin banyak[6]. Z. Mustakim, dkk(2021) dalam mengelompokkan kualitas manajemen pendidikan sekolah di Indonesia, dimana mengelompokkan provinsi dengan hasilnya terdapat tiga klaster dengan karakteristik berupa kategori pendidikan yang baik, sedang, dan kurang[7]. Penelitian kali ini mengelompokkan paket data internet menggunakan metode k-means. Hasil dari penelitian ini berupa beberapa klaster dengan karakteristiknya masing-masing. Karakteristik ini bisa digunakan untuk menentukan paket data yang sesuai dengan kebutuhan pembeli.

  • 2.    Reseach Methods

    2.1    Pengumpulan Data

Penelitian ini bekerja dengan pendekatan kuantitatif dan menggunakan data sekunder yang didapat melalui internet, dengan mengakses website resmi penyedia layanan internet. Data yang didapatkan adalah tarif paket data penyedia layanan internet di Indonesia khususnya untuk pengguna mobile yaitu Tri, Indosat Ooredoo, XL, Axis, Telkomsel, dan Smartfren. Karakteristik data dapat dilihat pada Tabel 1.

Tabel 1. Karakteristik Data Paket Data Internet

Provider

Nama Paket

Besar Kuota (GB)

Masa Aktif (Hari)

Pembagian Waktu Kuota (Ya/Tidak)

Harga

4G only (Ya/Tida k)

Pembagian

Kuota    ke

App Khusus (Tiktok, Facebook, Webex, dll)

3

Happy 2GB 1

Hari

2

1

Tidak

4000

Tidak

Tidak

3

Happy 7GB 1

Hari

7

1

Tidak

10000

Tidak

Tidak

3

Happy 7GB 3

Hari

7

3

Tidak

15000

Tidak

Tidak

3

Happy 11GB 30 Hari

11

30

Tidak

30000

Tidak

Tidak

XL

Xtra On 17GB PB

17

mengikuti masa kartu

Tidak

88946

Tidak

Tidak

XL

Xtra On 20GB PB

20

mengikuti masa kartu

Tidak

93862

Tidak

Tidak

Telkomsel

Telkomsel    4

GB/30 Hari

4

30

Tidak

50300

Tidak

Tidak

Telkomsel

Telkomsel    5

GB/30 Hari

5

30

Tidak

56550

Tidak

Tidak

Axis

Bronet 3 GB 60

Hari

3

60

Tidak

32485

Tidak

Tidak

Axis

Bronet 5 GB 60

Hari

5

60

Tidak

48465

Tidak

Tidak

Indosat

Indosat    Data

Pure 100 MB 30 Hari

0.1

30

Tidak

1200

Tidak

Tidak

Smartfren

Unlimited

Nonstop 6 GB

30 Hari

6

30

Tidak

29500

Tidak

Ya

Total data yang didapatkan sebanyak 233 baris dengan kolom data berupa nama provider, nama paket, besar kuota, masa aktif, pembagian waktu kuota, harga kuota, cakupan paket (4G saja/tidak), dan pembagian kuota ke aplikasi lain. Data yang diberikan adalah harga paket data provider internet Indonesia per September 2022.

2.2 Flowchart Penelitian

Flowchart algoritma k-means dapat dilihat pada gambar 1.

Gambar 1. Flowchart k-means [7]

Algoritma k-means adalah algoritma pengelompokan iteratif yang melakukan partisi set data ke dalam sejumlah K cluster yang sudah ditetapkan di awal. K-means dapat diterapkan pada data yang direpresentasikan dalam r-dimensi ruang[8]. K-means digunakan ketika terdapat data yang belum berlabel (berkategori). Data akan di klasterisasi berdasarkan kesamaan fiturnya. Perhitungan k-means dapat dilakukan dengan langkah-langkah berikut:

  • 1.    Data Processing

Pada tahap ini dilaksanakan pembersihan data berupa membersihkan data yang duplikat, data yang tidak relevan dan error, kolom yang tidak diperlukan, data yang tidak konsisten, dan outliers. Selain itu, pada tahap ini dilakukan penanganan terhadap data yang hilang, integrasi data, transformasi data, dan reduksi data.

  • 2.    Tentukan Jumlah Cluster

Algoritma k-means bergantung pada pencarian jumlah cluster dan label data untuk nilai K yang telah ditentukan sebelumnya. Untuk mendapatkan jumlah cluster dalam data, jalankan k-means untuk nilai K dan membandingkan hasilnya. Setelah itu, dipilih nilai K yang optimal (memberikan kinerja terbaik). Ada berbagai teknik yang tersedia dalam menemukan nilai K, salah satu yang paling umum adalah metode elbow.

  • • Metode Elbow

Metode ini memplot nilai fungsi biaya yang dihasilkan oleh nilai K yang berbeda. Secara sederhana, metode ini melakukan perulangan beberapa kali dengan meningkatkan jumlah cluster (misalnya dari 1 hingga 10) dan melakukan plot skor pengelompokan sebagai fungsi dari jumlah cluster. Skor pengelompokan

adalah jumlah kuadrat jarak sampel ke pusat klaster terdekat. Elbow adalah titik pada plot yang nilai pengelompokannya jatuh ke bawah dan nilai cluster pada titik plot memberikan nilai optimum.

  • 3.    Tentukan Titik Pusat Cluster

Titik pusat cluster dibangkitkan secara acak dari beberapa objek yang tersedia sebanyak jumlah dari k cluster. Untuk menghitung titik pusat cluster ke-i, rumus yang digunakan sebagai berikut.

Σ xi                                                                                    (1)

v = -i≡^- i = 1, 2, 3, ...n

Keterangan

v = titik pusat cluster

xi = objek ke-i

n = banyaknya jumlah objek yang menjadi anggota cluster

  • 4.    Hitung Jarak Data Terhadap Pusat Cluster

Perhitungan jarak data terhadap pusat cluster dilakukan dengan rumus euclidean distance :

lKx∙ y) ~ x ~ y ~ ^∖∣ ∑ ^χi - ^ ^ i ~ ^' 2, 3, -n                           (2)

Keterangan

xi = objek ke-i

yi = data y ke-i

n = banyaknya objek

  • 5.    Pengelompokkan Data sesuai Minimum Jarak Ke Pusat Cluster

Setelah mendapatkan jarak minimum ke pusat cluster, kelompokkan data ke pusat cluster terdekat.

  • 6.    Lakukan Iterasi

Lakukan iterasi ke-i, ulangi langkah c - e. Perulangan akan berhenti jika rasio tidak lebih besar dari nilai rasio sebelumnya hingga hasil perhitungan di masing-masing data konvergen.

  • 3.    Hasil dan Pembahasan

    • 3.1    Preprocessing Data

Pada tahap ini, dilakukan penghapusan kolom yang tidak digunakan saat klasterisasi. Kolom yang dihapus adalah nama provider, pembagian waktu kuota, cakupan paket (4G saja/tidak), dan pembagian kuota ke aplikasi lain. Sehingga kolom yang tersisa adalah nama paket, harga paket, masa aktif, harga paket. Kolom (fitur) ini sudah cukup menjadi indikator utama pertimbangan pelanggan akan membeli paket data tersebut. Selain itu, terdapat dua baris data yang dihapus karena isinya tidak lengkap. Terdapat nilai yang tidak relevan pada data kolom masa aktif karena terdapat paket yang mengikuti masa aktif, akibatnya ditulis “mengikuti masa aktif”. Dilakukan perubahan terhadap data tersebut menjadi 60 hari karena nilai tertinggi data lain ada pada 60 hari serta masa aktif kartu berada pada kisaran 60 hari jika tidak diisi ulang.

49

Tri 30GB 24 Jam

30

30

65,000.00

50

Tri 65GB 24 Jam

65

30

100,000.00

51

Tri Rp 25.000

52

Rp 10.000

53

Tri IlOGB 24 Jam

110

30

130,000.00

54

Tri (NEW) 40GB 30 Hari

40

30

70,000.00

55

Xtra Combo Mini 1.5GB

1.5

7

9,600.00

56

Xtra Combo Mini 2.5GB

2.5

7

13,650.00

Gambar 2. Dataset Tidak Lengkap

31

∏AON Full 40GB

40

mengikuti masaak

99,000.00

32

AON Unlimited 26GB

26

30

73,000.00

33

Iaon Full 12gb

12

mengikuti masaak

55,000.00

34

Iaon Full ogb

9

mengikuti masaak

45,000.00

35

Iaon fu∣i θgb

6

mengikuti masaak

31,000.00

36

∏AON Full 3.5GB

3.5

mengikuti masaak

21,000.00

37

Iaon Full 2.sgb

2.5

mengikuti masaak

15,500.00

38

I Home 15OGB

150

30

150,000.00

Gambar 3. Dataset pada Kolom Masa Aktif Tidak Relevan

Selain itu dilakukan pengecekan terhadap outlier, dimana bisa dilihat dengan cara mencari mean, median, dan modus, serta melihat hasil visualisasinya.

[32]:

df.describe()

Besar Kuota (GB) Masa Aktif (Hari)          Harga

count

231.000000

231.000000

231.000000

mean

20.191775

27.008658

59609.965308

std

31.139864

14.365415

56752.279439

min

0.100000

1.000000

1200.000000

25%

3.000000

28.000000

16212.500000

50%

7.500000

30.000000

45675.000000

75%

24.000000

30.000000

86180.000000

max

235.000000

60.000000

450000.000000

Gambar 4. Deskripsi Dataset

Dari kedua gambar di atas, kolom besar kuota dan harga memiliki outlier. Pada gambar 5 ditunjukan oleh nilai means/75% sangat jauh dengan max. Pada gambar 6 ditunjukkan oleh adanya persebaran data yang tidak merata. Oleh karena itu, dilakukan penghapusan data yang memiliki outliers. Untuk mendeteksi outliers menggunakan pendekatan standar deviasi, yaitu hapus nilai-nilai yang merupakan sejumlah standar deviasi dari rata-rata, jika data memiliki distribusi Gaussian. Praktik industri yang umum adalah menggunakan 3 standar deviasi dari mean untuk membedakan outlier dari non-outlier. Dengan menggunakan 3 standar deviasi dapat menghapus data ekstrim sebanyak 0,3%. Hasilnya, jumlah baris data berubah menjadi 221 baris dengan nilai max yang berubah juga.

Gambar 6. Visualisasi Dataset Setelah Penghapusan Outliers

Besar Kuota

Masa Aktif

Harga

count

221.000000

221.000000

221.000000

mean

16.164253

26 882353

52875.823529

&td

21.925275

14.675109

43723.693124

min

0.100000

1.000000

1200.000000

25%

3.000000

28.000000

15500.000000

50%

7.000000

30.000000

44505.000000

75%

20.000000

30.000000

78410.000000

max

110.000000

60.000000

199360.000000

Gambar 7. Deskripsi Dataset Setelah Penghapusan Outliers

Tabel 2. Hasil Preprocessing Data

Nama Paket Data

Besar    Kuota

(GB)

Masa     Aktif

(Hari)

Harga (Rp.)

XL Data Pure 4GB

4

30

34050

Telkomsel 12 GB/30 Hari

12

30

103105

Bronet 8 GB 30 Hari

8

30

43850

Happy 2GB 1 Hari

2

1

4000

Freedom Internet 6,5 GB 30 Hari

6.5

30

36125

Unlimited FUP 500 MB/Hari 28 Hari

14

28

50845

  • 3.2    Tentukan jumlah cluster

Penentuan jumlah cluster dilakukan menggunakan metode elbow. Konfigurasi yang digunakan adalah maksimal iterasi per kluster adalah 300. Hasilnya bisa dilihat pada gambar 8. Dari gambar, terlihat nilai yang bisa digunakan (perbedaan sudut garis) adalah 4 cluster.


Gambar 8. Grafik Metode Elbow

  • 3.3    Hasil Cluster dengan K-means

Dengan menggunakan algoritma k-means didapatkan hasil empat cluster. Klaster pertama dengan karakteristik harga murah hingga sedang (0 - Rp. 32.000), kuota sedikit (0 - 11 GB), masa aktif sebentar hingga lama (1 - 60 hari). Klaster kedua dengan karakteristik harga mahal (Rp. 79.000 - Rp. 110.000), kuota murah hingga mahal (6 - 100 GB), masa aktif sedang hingga lama (7 - 60 hari). Klaster ketiga dengan karakteristik harga sangat mahal (Rp. 125.000 - Rp. 180.000), masa aktif lama (28 - 60 hari), kuota sedang hingga banyak (12 - 110 GB). Klaster keempat dengan karakteristik harga sedang (Rp. 34.000 - Rp. 70.000), masa aktif lama (14 - 60 hari), kuota sedikit hingga sedang (1,5 - 40 GB). Total data pada klaster 1 adalah 94 data, klaster 2 sebanyak 42 data, klaster 3 sebanyak 16 data, klaster 4 sebanyak 59 data. Hasil klasterisasi ditampilkan pada gambar 9, gambar 10, gambar 11, dan gambar 12.

1 ∖

>Jaιna Paket

⅝¾⅛¾!⅛⅛

VfessAfcLit

⅛¾Q⅞

Na∏>a!⅛)<S_____

gg⅞¾!Wri

JW AfelI

lri≡

Nama R&el

Happy 2GB 1 Hari

2

1

4∞0

XL Data Pure 0.8GB

0.8

30

7025

QOMBGB

4

30

286∞

3

Happy 7GB 1 Hsfcri

7           1

l□∞0

XLDataPurelGB

30

8550

Freedom Internet 2 GB/1 Hari

2

1        7925

Happy 7GB 3 Hari

3

15∞0

XL Data Pure 2GB

2

30

17000

Freedom Internet 2,S GB/5 Hari

2.5

5

11475

5

Happy 11GB 30 ∏ a ri

11

30

300∞

XL Data Pure 3GB

3

30

24450

Freedom Internet 5 GB/3 HQji

5

3

14925

6

Happy 7GB 30 Hgri

7

30

3000C

XL HQJggtj 05GB

0.5

7

5430

Freedom Internet 2 GB/30 IJari

2

30

1650C

7 I

Happy 3GB 30H,Qri

3

30

150∞

XL HQtRQd 15GB

1

7

8130

Freedom Internet 3 GB/30 Hari

3

30

177∞

8

HappyOGB 10 Haji

9

10

31∞0

XLHQtRQdlSGBJHari

1.5

3

9320

Freedom internet 7 GB/5 Haji

5      20895

9

Happy 5GB 7 Hapi

5

7

20000

XLHQdBAdIGe

1

7

9345

Freedom Internet 4 GB/30 Hari

30

27300

10

Happy 1.5GB 7 Hari

1.5

7

9∞0

XLHqW 1.5GB

1

7

9450

Freedom Internet 5,5 GB/30 Haji

S-S

30

27855

11 I

Happy 6GB 5 Hari

6

5

21∞0

XL HW 25GB

2.5

7

11475

IiflQSaL Data Pure 100 MB 30 HJ

0.1

30

12∞

Tl

Happy 3.5GB 5 Hari

3.5

5

16000

XLUWHθB

4

7

14660

DdD5ai Data Pure 200 MB 30 H?

0.2

30

2025

13

Happy 5GB3Hari

5

3

150∞

XL HW∣ 2GB

2

7

14780

JldQSril Data Pure 250 MB 30 HR

0.25

30

2450

1⅛

Happy 3GB3 Haq

3

3

ll∞O

XL HQWQdI 3GB

3

1 DIDF

∏⅛>sal Data Pure 300 MB 30 HJ

0.3

30

2950

15

Happy SGB 1 HAT!

5

1

10∞0

XL HqJBqsI 6GB

s

7

Ddosai Data Pure 500 MB 30 ⅛?

0.5

30

45∞

16

Happy 2.5GB 1 Hari

2.5

1

55∞

XL HJW OSGB

0.8

30

∣Π⅛P5ai Data Pure 750 MB 30 Har

0.75

30

6355

17

Happy 1.5GB 1 Hap;

1.5

1

4∞0

XL Xtpa Combo Flex 4GB

4

30

13975

∣ntaat Data Pure 1GB 30 Hari

1

30

8525

18

1?

20

AQN Full 6GB

AQN Full 35GB

AON Full 25GB

6

3.5

2.5

60

60

60

31000

21∞0

15500

Xl XJra Combo Flex 75»

XL xtχa Combo Flex 13G J⅞∣fcW⅞⅞1500 MB∕15⅛

7.5

13

0.5

30

30

15

25005

32500

8650

ljy⅛5j⅛ Data Pure 1,5 GB 30 Han QtariJ Data Pure 2 GB 30 HaR dQos,at Data Pure 3 GB 30 Hari

1.5

2

3

30

30

30

12500

15850

20100

Ri (NEW) 25GB 1 H⅛ri

2.5

1

4000

R⅜ro⅞s≡ι IGBriJOHari

1

30

16425

D⅛osqJ Data Pure 5 GB 30 Hjri

5

30

31025

Ri(NEW) 4GB 3 HSri

4

3

100∞

IglfcQIJiSgL 2 GB/30 ∏arj

2

30

32350

Freedom combo 6 GB

4

30

30175

Rj (NEW) 10GB5HSri

10

5

20∞0

SJQJigt 1GB 30 HSri

1

30

9830

Yellow 1GB 1 Haji

1

1        4640

24

XHa Combo Mini 15GB

1.5

7

9600

HJQIJgt 1r5 GB 30 HSri

1.5

30

13360

Yellow 1 GB 2 HaR

1

2

53∞

25 ∣

XHa Combo Mini 25Gf

2.5

13650

KSDgJ 2 GB 30 Usri

2

30

17355

YellOW 1 GB 7 Hari

97∞

26

XRaCombo Mini 4GB

4

175∞

gJQT∣gi 3 GB 30 HSri

3

30

23505

Yellow 1GB 15 Hari

IS

117∞

27

XJra Combo Mini 6GB

6

22250

KAHgtSGB 30 l∣arι

5

30

29873

Freedom ‰q⅛ Harijjp 7 GB 7 H?

7

26655

28

£«0n 1GB

1

60

13450

KSDgt 2 GB 60 Ilari

2

60

25825

SijarJfren 1 GB 7 HQji

1

7

75∞

28 I

Xtra on 2GB

2

30

14855

Bronot 3 GB 60 Hari

3

60

32485

Smartfren 3 GB/5 HaR

3

5

9355

30

⅜GO∏2GB

2

60

225∞

Mini 7 Haril GB∕7∏ari

1

7

9368

Smartfren 1.5 GB 7 Hari

1.5

7

9905

31

XL Data Pure 05GB

0.5

30

450C

Mini 7 Hari 1.5 GB/7 Halt

1.5

7

14475

UnlimitedFUPiGBjHari 7 Han

7

7

22247

32 ∣

Mini2GB∕l ∏ari

2

1

7600

unlimited Nonstop 2 GB10 Hari

2

10

10192

33

Mini3GB∕l Hari

3

1

8500

34

STO ⅛ GB

2

30

16750

35

Gambar 9. Klaster 1


Gambar 10. Klaster 2


Gambar 11. Klaster 3

Gambar 12. Klaster 4

4. Kesimpulan

Dari hasil penelitian yang telah dilakukan, dapat diambil beberapa kesimpulan.

  • 1.    Klasterisasi paket data internet berbagai operator Indonesia dapat dikelompokkan menjadi empat kategori dengan karakteristik berupa harga, besar kuota, dan masa aktif. Klaster pertama cocok bagi pelanggan yang tidak terlalu sering menggunakan internet dan kebutuhan biaya sedikit. Klaster kedua cocok bagi pelanggan yang sering menggunakan internet dan mampu membeli paket data dengan harga mahal. Klaster keempat cocok bagi pelanggan yang menggunakan internet dalam taraf standar.

  • 2.    Klasterisasi di atas dibentuk menjadi empat kategori, tetapi masih ada data yang berbeda dengan yang lainnya, contohnya pada klaster 1, terdapat satu paket data dengan masa aktif cuma 7 hari sedangkan data yang lain masa aktifnya di atas 28 hari. Disarankan menggunakan jumlah yang lebih dari empat.

  • 3.    Outliers pada data paket data sangat mungkin terjadi karena karakteristik data paket data internet sangat tidak menyebar. Hal ini dibuktikan saat penggambaran diagram visualisasi. Hal ini dapat diatasi dengan menghilangkan outliers.

Referensi

  • [1]      -, “APJII”, 2019. [Online]. Available: https://apjii.or.id/survei2019x [1 Oktober 2022]

  • [2]     -,    “We    Are    Social”,    26    January    2022.    [Online].    Available:

https://wearesocial.com/uk/blog/2022/01/digital-2022-another-year-of-bumper-growth-2/. [1 October 2022]

  • [3]     Suyanto, Data Mining untuk Klasifikasi dan Klasterisasi Data, First ed., Bandung:

Informatika, 2019, pp. 4.

  • [4]     D. Triyansyah and D. Fitrianah, “Analisis Data Mining Menggunakan Algoritma K-Means

Clustering Untuk Menentukan Strategi Marketing” IncomTech Jurnal Telekomunikasi dan Komputer, vol. 8, no. 3, p. 164, 2018.

  • [5]     Suyanto, Machine Learning Tingkat Dasar dan Lanjut, First ed., Bandung: Informatika,

2018, pp. 205.

  • [6]     Y.  Darmi  and A.  Setiawan,  “Penerapan Metode Clustering  K-Means dalam

Pengelompokkan Penjualan Produk” Jurnal Media Infotama, vol. 12, no. 2, p. 157, 2016.

  • [7]    R. Muliono and Z. Sembiring, “DATA MINING CLUSTERING MENGGUNAKAN

ALGORITMA K-MEANS UNTUK KLASTERISASI TINGKAT TRIDARMA PENGAJARAN DOSEN” CESS (Journal of Computer Engineering System and Science), vol. 4, no. 2, p. 274, 2019.

  • [8]    F. Nur, M. Zarlis, and B. Benyamin, “PENERAPAN ALGORITMA K-MEANS PADA

SISWA BARU SEKOLAH MENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN” Jurnal Nasional Informatika dan Teknologi Jaringan, vol. 1, no. 2, p. 101, 2017.

416