Implementasi Algoritma K-Means Clustering dalam Penentuan Klasifikasi Tingkat Pembangunan Perekonomian di Provinsi Bali

Written by Wijaya Kusuma Sandi, Ida Bagus Gede Dwidasmara
on January 31, 2023

JNATIA Volume 1, No 2, Februari 2023

Jurnal Nasional Teknologi dan Aplikasinya

Implementasi Algoritma K-Means Clustering dalam Penentuan Klasifikasi Tingkat Pembangunan Perekonomian di Provinsi Bali

I Wayan Wijaya Kusuma Sandi^a1, Ida Bagus Gede Dwidasmara^a2

Informatics Department, Faculty of Math and Science, Udayana University South Kuta, Badung, Bali, Indonesia

¹wijayakusumasandi@gmail.com ²dwidasmara@unud.ac.id

Abstract

Inequality in economic development is one of the problems faced by regencies/cities in Bali Province. Even though Bali is one of the provinces with a fairly large economic contribution in Indonesia, most of its economic resources are still centered in one area. This study aims to form a cluster of districts/cities in Bali Province based on the performance of regional human and economic development using the K-Means Clustering method in order to support an even distribution of economic development in Bali by making regional-based policies that are in adaptability to the level of the economy. The study result showed that three clusters were formed with the first cluster consisting of Klungkung, Karangasem, Bangli, and Jembrana regencies, the second cluster consisting of Badung Regency and Denpasar City, and the third cluster consisting of Gianyar, Buleleng and Tabanan regencies.

Keywords: Pembangunan Ekonomi, K-Means Clustering, Bali.

1. Pendahuluan

Perekonomian merupakan salah satu prioritas utama dalam pelaksanaan pembangunan nasional, salah satu ciri negara maju adalah sistem perekonomian yang kuat dan berkeadilan. Pembangunan ekonomi adalah serangkaian upaya yang dilakukan dalam perekonomian untuk mengembangkan kegiatan ekonomi guna meningkatkan taraf hidup masyarakat. Pembangunan ekonomi nasional tidak dapat dipisahkan dari pembangunan ekonomi daerah [1], oleh karena itu pembangunan ekonomi daerah harus menjadi salah satu prioritas negara untuk menjadi negara yang lebih maju.

Keberhasilan pembangunan ekonomi daerah dapat diukur dengan beberapa indikator. Indikator utama yang digunakan adalah produk domestik bruto per kapita (PDB) daerah yang dapat digunakan sebagai indikator kegiatan ekonomi secara umum sebagai ukuran kemajuan daerah. Indikator kesejahteraan manusia juga harus dipadukan dengan Indeks Pembangunan Manusia (IPM). IPM dapat memberikan wawasan tentang harapan hidup, pendidikan dan standar hidup di wilayah tersebut. Indikator lain yang dapat digunakan untuk mengukur efisiensi pembangunan ekonomi suatu daerah adalah rasio gini dan pengeluaran per kapita.

Provinsi Bali merupakan salah satu daerah di kawasan Indonesia yang mengalami pertumbuhan ekonomi yang melambat di saat pandemi, perubahan tingkat perekonomian yang terjadi juga berpengaruh pada kesenjangan-kesenjangan perekonomian antar kabupaten/kota di Provinsi Bali [2]. Kesenjangan tersebuat akan lebih mudah diatasi apabila setiap daerah memiliki kebijakan - kebijakan yang sesuai dengan tiingkat perekonomian daerah tersebut, sehingga perekonomian bali tidak hanya ditopang oleh kota-kota besar seperti kabupaten Badung dan kota Denpasar.

Berangkat dari hal tersebut, kajian ini bertujuan untuk membentuk kluster wilayah/kota berdasarkan aktivitas pada tingkat ekonomi wilayah. Melalui klaster yang akan dibentuk, pemerintah pusat dan daerah dapat memantau dan mengevaluasi kinerja perekonomian masing-masing kabupaten/kota. Dengan demikian, perbedaan pembangunan antar kabupaten/kota di Provinsi Bali tidak bertambah. Metode K-Means clustering digunakan dalam penelitian ini untuk membentuk cluster wilayah/kota karena metode ini dapat memperkenalkan model yang lebih

fleksibel dan memudahkan penyelesaian perhitungan masalah yang dirumuskan.

1.1. Data Mining

Data mining adalah proses pencarian informasi dalam kumpulan data yang memiliki kapasitas yang besar [3]. Data mining bertujuan untuk mencari relasi dan informasi yang terdapat dalam data sehingga dapat dijadikan ilmu pengetahuan yang berguna. Secara garis besar metode dalam data mining dapat dibagi kedalam lima bagian yaitu klasifikasi, prediksi, asosiasi, estimasi dan klastering.

1.2. Clustering

Clustering adalah metode membagi dataset menjadi beberapa kelompok sesuai dengan karakteristik data [4]. Dalam proses clustering, objek-objek dibagi menjadi dua atau lebih cluster sehingga objek-objek dalam satu cluster sangat mirip satu sama lain. Dengan clustering, lebih mudah untuk menemukan pola distribusi dalam data dan juga lebih mudah untuk menentukan hubungan antar atribut data. Beberapa persyaratan pengelompokan penambangan data meliputi skalabilitas, kemampuan untuk menangani berbagai jenis atribut, kemampuan untuk menangani dimensi tinggi, menangani data yang berisik dan mudah diterjemahkan.

1.3. K-Means Clustering

K-Means Clustering merupakan metode clustering yang paling umum digunakan, K-Means merupakan salah satu metode pembelajaran unsupervised data mining, yang membagi data menjadi beberapa kelompok, sehingga data dalam sebuah cluster memiliki sifat yang sama [5]. Algoritma K-Means dikenal karena kemampuannya untuk mempartisi sejumlah besar data dan outlier dengan cepat dan mudah. K-Means bekerja dengan memecah data menjadi beberapa cluster dan mengelompokkannya berdasarkan seberapa mirip data tersebut dengan data centroid. Algoritma K-Means adalah metode non-hierarkis yang terlebih dahulu mengambil beberapa komponen populasi untuk bertindak sebagai pusat cluster awal. Pada langkah awal algoritma K-Means, centroid dipilih secara acak dari kumpulan data, setelah itu data diuji kesamaannya dengan setiap centroid yang membentuk cluster. Posisi pusat dihitung kembali hingga semua komponen data pada setiap cluster terklasifikasi dan akhirnya terbentuk pusat cluster baru.

2. Metode Penelitian

Penelitian ini menggunakan data sekunder dari Badan Pusat Statistik (BPS). Unit analisis mencakup 9 kabupaten/kota di Provinsi Bali dengan acuan waktu tahun 2020. Variabel yang digunakan dalam penelitian ini adalah produk domestik bruto per kapita (PDRB/kapita), pertumbuhan pengeluaran per kapita, rasio gini, angka harapan hidup, rata-rata tahun sekolah dan IPM. Tahapan penelitian ditunjukkan pada Gambar 1.

Gambar 1. Flowchart Alur Penelitian

2.1. Identifikasi Permasalahan

Pada penelitian ini identifikasi permasalahan dilakukan dengan tujuan untuk mengklasifikasikan wilayah di provinsi bali berdasarkat tingkat perekonomian. Hal ini bertujuan agar peneliti dan pembaca mengetahui tingkat perekonomian setiap daerah sehingga masyarakat dan pemerintah dapat mengambil kebijakan yang tepat untuk mengatasi kesenjangan perekonomian setiap daerah di Provinsi Bali.

2.2. Pengumpulan Data dan Studi Literatur

Pada tahapan ini dilakukan studi literatur untuk memperdalam pengetahuan dasar dalam memahami metode yang digunakan, yang mana data dalam penelitian ini merupakan data kondisi perekonomian bali. Data tersebut bersumber dari Badan Pusat Statistik Provinsi Bali pada tahun 2020, rincian dari data yang digunakan dapat dilihat dalam Tabel 1.

Table 1. Data Pertumbuhan Perekonomian Provinsi Bali

Kabupaten Kota	PDRB (Milyar)	Umur Harapan Hidup	Pertumbuhan Pengeluaran Perkapita (%)	Gini Ratio	IPM	Rata-Rata Lama Sekolah
Jembrana	13.465	72,35	14,99	0,353	72,36	8,23
Tabanan	22.332	73,65	8,08	0,324	76,17	8,88
Badung	49.215	75,1	4,04	0,317	81,6	10,39
Gianyar	25.915	73,68	4,54	0,317	77,36	9,04
Klungkung	8.469	71,25	6,32	0,358	71,73	8,13
Bangli	6.722	70,52	12,65	0,283	69,36	7,17
Karangasem	16.453	70,47	14,97	0,327	67,35	6,32
Buleleng	33.359	71,83	4,3	0,285	72,55	7,24
Denpasar	49.583	74,82	12,37	0,33	83,93	11,47

2.3. Pemrosesan Awal Data

Pada tahapan ini, data yang diperoleh akan diproses menggunakan metode K-Means Clustering. Sebelumnya data tersebut akan diubah kedalam bentuk integer dan akan dinormalisasi untuk mempermudah pemrosesan. Dalam penelitian ini software yang digunakan untuk membantu proses pengolahan data adalah aplikasi Rapid Miner, aplikasi tersebut digunakan untuk menentukan pengelompokan data sehingga dapat menampilkan hasil akhir pengelompokan clustering.

2.4. Implementasi Algoritma K-Means

Gambar 2. Flowchart Algoritma K-Means

Algoritma K-Means pada penelitian ini digunakan dalam proses klasterisasi data, langkah-langkah dalam implementasinya dapat dilihat sebagai berikut:

1. Tentukan jumlah klaster yang diinginkan
2. Pada iterasi awal, tentukan centroid secara acak
3. Hitung jarak setiap titik ke centroid menggunakan rumus Euclidian Distance
4. Hitung ulang centroid menggunakan nilai rata-rata setiap variabel dari masing-masing cluster
5. Ulangi langkah ketiga dan keempat hingga nilai centroid tidak berubah, jika anggota dari masing-masing custer tidak terdapat perubahan maka proses klasterisasi sudah selesai

3. Hasil dan Pembahasan

3.1 Seleksi Data

Pada tahap pemilihan data, data yang dipakai adalah data tinjauan perekonomian provinsi Bali pada tahun 2020 yang terdiri dari 7 variabel yaitu nama kabupaten/kota, PDRB, umur harapan hidup, pertumbuhan pengeluaran perkapita, gini ratio, IPM dan rata-rata lama sekolah. Data yag didapakan bia langsng diolah tanpa harus melawati preprocessing terlbih dahulu.

3.2 Centroid Data

Centroid merupakan titik pusat data yang akan digunakan sebagai perhitungan dalam menentukan cluster, pada iterasi pertama nilai centroid ditentukan secara acak, berikut merupakan centroid awal dalam penelitian ini:

Table 2. Centroid Awal Data

Kabupaten Kota	PDRB (Milyar)	Umur Harapan Hidup	Pertumbuhan Pengeluaran Perkapita (%)	Gini Ratio	IPM	Rata-Rata Lama Sekolah
Jembrana	13.465	72,35	14,99	0,353	72,36	8,23	C0
Gianyar	25.915	73,68	4,54	0,317	77,36	9,04	C1
Denpasar	49.583	74,82	12,37	0,33	83,93	11,47	C2

3.3 Menghitung Jarak Data ke Titik Pusat Cluster

Langkah selanjutnya adalah menghitung jarak setiap datum dari centroid asal dengan menggunakan persamaan jarak Euclidean. Pada titik ini, jarak terpendek antara data dengan cluster menentukan apakah data berada di cluster 0, cluster 1, atau cluster 2. Berikut adalah hasil perhitungan jarak data pada iterasi pertama:

Table 3. Hasil Iterasi pertama

Kabupaten/Kota	C0	C1	C2	Output
Jembrana	0	12449,96549	36118,56218	C0
Tabanan	8867,22363	3582,74195	27251,34159	C1
Badung	35750,35304	23300,39047	368,3132727	C2
Gianyar	12449,96549	0	23668,60236	C1
Klungkung	4995,937685	17445,89119	41114,49255	C0
Bangli	6742,931405	19192,89373	42861,49291	C0
Karangasem	2987,935402	9462,041979	33130,63494	C0
Buleleng	19894,1129	7444,152005	16224,45683	C1
Denpasar	36118,56218	23668,60236	0	C2

3.4 Menghitung Nilai Centroid Baru

Langkah berikutnya hitung nilai centroid baru mengunakan nilai rata-rata setiap variabel dari masing-masing cluster. Jika nilai centroid berubah, ulangi kembali proses iterasi sehingga nilai centroid dan cluster tidak lagi ada perbubahan

Table 4. Centroid Data Baru

C0	11277,1775	71,1475	12,2325	0,33025	70,2	7,4625
C1	27202,00667	73,05333333	5,64	0,308666667	75,36	8,386666667
C2	49399,365	74,96	8,205	0,3235	82,765	10,93

3.5 Hasil Akhir Iterasi

Setelah tidak terdapat perubahan dari hasil cluster maupun centroid maka hasil akhir dari perhitungan sudah bisa didapatkan. Berikut merupakan hasil akhir yang didapatkan dari perhitungan:

Table 4. Hasil Akhir Cluster

Kabupaten/Kota	C0	C1	C2	Output
Jembrana	2187,735769	13737,10023	35934,4572	C0
Tabanan	11054,95527	4869,87744	27067,2358	C1
Badung	37938,08542	22013,25443	184,1541884	C2
Gianyar	14637,69658	1287,139042	23484,49591	C1
Klungkung	2808,204222	18733,02715	40930,38667	C0
Bangli	4555,197649	20480,02897	42677,38758	C0
Karangasem	5175,664179	10749,17424	32946,5297	C0
Buleleng	22081,84406	6157,014315	16040,34915	C1
Denpasar	38306,29535	22381,46623	184,160388	C2

3.6 Implementasi Algoritma K-Means Menggunakan RapidMiner

Untuk menerapkan metode K-Means pada data yang telah disiapkan, dataset harus diimpor terlebih dahulu ke dalam aplikasi RapidMiner. Kemudian beralih ke desain proses, yang mencakup implementasi dan pengujian menggunakan metode operator RapidMiner yang ada. Penjelasan lebih rinci tentang langkah-langkah ini adalah sebagai berikut.

1. Data yang sudah disimpan dalam fomat *.xls diimport terlebih dahulu ke dalam RapidMiner

sesuai dengan lokasi penyimpanan data. Selanjutnya tentukan atribut yang digunakan sebagai label indikator, dalam penelitian ini label indikator yang digunakan adalah kabupaten/kota

Gambar 3. Import Data ke Dalam RapidMiner

2. Setelah diimport, data diinput ke dalam desain proses dan dilanjutkan dengan memilih

metode yang akan digunakan untuk pemrosesan data, yang mana dalam penelitian ini menggunakan metode K-Means

Gambar 4. Desain Proses Pada RapidMiner

3.

Tahapan selanjutnya adalah menentukan jumlah cluster yang diinginkan dan maksimal iterasi yang dilakukan dalam proses. Untuk lebih jelasnya dapat dilihat dalam gambar berikut

Gambar 5. Input Parameter K-Means

4.

Setelah parameter klasterisasi ditentukan maka proses siap dijalankan. Hasil Clustering dari algoritma K-Means dapat dilihat pada gambar 6 dan 7

Open in	Turbo Prep ∣^	I AutoModei	Filter (9/9 examples):					all

.. kJ	KatMipatenA-	duster	PDRB<Mi∣yar)	Umur Harap...	Pertumbuha..,	Gini Ralio	IPM	Rata-Rata L-
1	Jembrana	duster_O	13464 910	72.350	14.990	0.353	72.360	8230
2	Tabanan	cluster_2	22332.130	73.650	8.080	0.324	76.170	9 880
3	Badung	cluster_1	49215.260	75.100	4.040	0.317	81.600	10.390
4	Gianyar	cluster_2	25914 970	73.680	4.540	0317	77 360	9 040
5	Klungftjng	duster_O	8468 990	71.250	6.320	0.358	71.730	8130
6	Bangll	ChisierJ)	6721.990	70.520	12.650	0.283	69.360	7.170
. 7	Karangasem	cluster_O	16452.940	70.470	14.970	0.327	67.350	6.320
8	Buleleng	CiusterjZ	33359 020	71.830	4.300	0285	72550	7240
9	Denpasar	ChJStei-I	49583 470	74.820	12 370	0330	83930	11470

Gambar 6. Hasil Clustering Dalam Bentuk Tabel

Gambar 7. Hasil Clusterisasi Dalam Bentk Plot

Dari gambar 5 dapat dilihat hasil klasterisasi terbagi menjadi 3 kelompok, Cluster 0 terdiri dari kabupaten Jembrana, Klungkung, Bangli dan Karangasem, Cluster 1 terdiri dari kabupaten Badung dan kota Denpasar dan yang terakhir Cluster 2 terdiri kabupaten Tabanan, Gianyar dan Buleleng

3.7 Rata-Rata Variabel Pada Masing - Masing Klaster

Table 4. Rata-Rata Variabel Pada Klaster

CLuster	PDRB (Milyar)	Umur Harapan Hidup	Pertumbuhan Pengeluaran Perkapita (%)	Gini Ratio	IPM	Rata-Rata Lama Sekolah
C0	11.277	71,14	12,23	0,33025	70,2	7,46
C1	49.399	74,96	8,20	0,3235	82,76	10,93
C3	27.202	73,05	5,64	0,3086	75,36	8,38

Berdasarkan Tabel 7 dapat diketahui karakteristik setiap cluster berdasarkan enam variabel yang digunakan dengan rata-rata dari setiap variabel dari setiap cluster yang terbentuk. Karakteristik masing-masing cluster dijelaskan di bawah ini:

1. Klaster 0 dicirikan dengan rata-rata tingkat pembangunan perekonomian paling rendah

tinggi, dimana rata-rata PDRB pada klaster ini hanya menyumbang 12% dari rata-rata keseluruhan PDRB Provinsi Bali. Rata-rata pertumbuhan pengeluaran perkapita Klaster ini merupakan yang terbesar pada tahun 2020 dikarenakan klaster ini tidak mengalami penurunan penghasilan yang signifikan karena pandemi covid-19. Dari sisi pendidikan penduduknya, kabupaten/kota dalam Klaster 0 memiliki rata – rata RLS sebesar 7,46 tahun. Gini Ratio pada klaster ini merupakan yang paling tinggi, hal tersebut

mengindikasikan bahwa distribusi pendapatan kabupaten/kota Klaster 0 memiliki

ketimpangan yang paling tinggi dibandingkan klaster-klaster lainnya.

2. Klaster 1 merupakan klaster yang terdiri dari dua wilayah, yaitu Kabupaten Badung dan

Kota Denpasar. Rata-rata PDRB cluster 1 merupakan yang tertinggi diantara klaster lainnya, namun secara pertumbuhan pendapatan perkapita masih lebih kecil jika dibandingkan dengan klaster 0. umur harapan hidup klaster 1 relatif tinggi dibandingkan klaster yang lain, dan kualitas pendidikan penduduk juga berapa pada posisi paling tinggi dengan rata-rata bernilai sebesar 10,93 tahun.

3. Klaster 2 dicirikan dengan gini ratio yang paling rendah, yang berarti bahwa ketimpangan

pendapatan pada klaster ini lebih rendah dari dua klaster lainnya. Rata-rata pertumbuhan

pendapatan kabupaten/kota klaster ini pada tahun 2020 adalah sebesar 5,64%. PDRB per kapita pada klaster ini berada posisi kedua setelah klaster 1 j, yaitu bernilai 27,202 milyar per tahun. Sama seperti PDRB-nya, secara pendidikan klaster ini berapa pada posisi kedua dengan RLS 8,38 tahun.

4. Kesimpulan

Berdasarkan penelitian yang sudah dilakukan sebelumnya, klasterisasi indeks tingkat pembangunan perekonomian di Provinsi bali dapat dibagi menjadi 3 klaster yaitu klaster C0 yang terdiri dari Kabupaten Klungkung, Jembrana, Karangasem dan Bangli, klaster C1 yang terdiri dari Kabupaten Badung dan Kota Denpasar, dan yang terakhir klaster C2 yang terdiri dari Kabupaten Tabanan, Gianyar dan Buleleng. Penelitian ini juga membuktikan metode Clustering dengan algoritma KMeans dapat digunakan untuk mengelompokkan tingkat pembangunan perekonomian kabupaten/kota di Provinsi Bali. Adanya penelitian ini diharapkan dapat meningkatkan kesadaran masyarakat dan pemerintah akan ketimpangan sosial yang terjadi sehingga kebijakan yang tepat dapat diambil sesuai dengan kebutuhan dan tingkat pembangunan perekonomian masing-masing daerah.

Daftar Pustaka

[1] Fatmawati, K., & Windarto, A. P., Data Mining: Penerapan Rapidminer Dengan K-Means Cluster Pada Daerah Terjangkit Demam Berdarah Dengue (DBD) Berdasarkan Provinsi, CESS (Journal of Computer Engineering System and Science), Vol. 3, No. 2, 2018
[2] Adnyani, N. K. S., & Agustini, D. A. E. Digitalisasi Sebagai Pemulihan Perekonomian Di Sektor Kerajinan Dalam Mendukung Kebangkitan Umkm Di Provinsi Bali. Jurnal Pengabdian Kepada Masyarakat Media Ganesha FHIS, 1(2), 87-96. 2020
[3] Jollyta, D., Ramdhan, W., & Zarlis, M. Konsep Data Mining Dan Penerapan. Deepublish. 2020
[4] Dharmayanti, D., Bachtiar, A. M., & Prasetyo, A. C. Penerapan Metode Clustering Untuk Membentuk Kelompok Belajar Menggunakan Di Smpn 19 Bandung. Komputa: Jurnal Ilmiah Komputer dan Informatika, 6(2), 49-56. 2017
[5] Nabila, Z., Isnain, A. R., Permata, P., & Abidin, Z. Analisis Data Mining Untuk Clustering Kasus Covid-19 Di Provinsi Lampung Dengan Algoritma K-Means. Jurnal Teknologi Dan Sistem Informasi, 2(2), 100-108. 2021

halaman ini sengaja dibiarkan kosong

770

Implementasi Algoritma K-Means Clustering dalam Penentuan Klasifikasi Tingkat Pembangunan Perekonomian di Provinsi Bali

Implementasi Algoritma K-Means Clustering dalam Penentuan Klasifikasi Tingkat Pembangunan Perekonomian di Provinsi Bali

1. Pendahuluan

1.1. Data Mining

1.2. Clustering

1.3. K-Means Clustering

2. Metode Penelitian

2.1. Identifikasi Permasalahan

2.2. Pengumpulan Data dan Studi Literatur

2.3. Pemrosesan Awal Data

2.4. Implementasi Algoritma K-Means

3. Hasil dan Pembahasan3.1 Seleksi Data

3.2 Centroid Data

3.3 Menghitung Jarak Data ke Titik Pusat Cluster

3.4 Menghitung Nilai Centroid Baru

3.5 Hasil Akhir Iterasi

3.6 Implementasi Algoritma K-Means Menggunakan RapidMiner

3.7 Rata-Rata Variabel Pada Masing - Masing Klaster

4. Kesimpulan

Daftar Pustaka

Discussion and feedback

3. Hasil dan Pembahasan

3.1 Seleksi Data