Implementasi Algoritma K-Means Clustering dalam Penentuan Klasifikasi Tingkat Pembangunan Perekonomian di Provinsi Bali
on
JNATIA Volume 1, No 2, Februari 2023
Jurnal Nasional Teknologi dan Aplikasinya
Implementasi Algoritma K-Means Clustering dalam Penentuan Klasifikasi Tingkat Pembangunan Perekonomian di Provinsi Bali
I Wayan Wijaya Kusuma Sandia1, Ida Bagus Gede Dwidasmaraa2
Informatics Department, Faculty of Math and Science, Udayana University South Kuta, Badung, Bali, Indonesia
1[email protected] 2[email protected]
Abstract
Inequality in economic development is one of the problems faced by regencies/cities in Bali Province. Even though Bali is one of the provinces with a fairly large economic contribution in Indonesia, most of its economic resources are still centered in one area. This study aims to form a cluster of districts/cities in Bali Province based on the performance of regional human and economic development using the K-Means Clustering method in order to support an even distribution of economic development in Bali by making regional-based policies that are in adaptability to the level of the economy. The study result showed that three clusters were formed with the first cluster consisting of Klungkung, Karangasem, Bangli, and Jembrana regencies, the second cluster consisting of Badung Regency and Denpasar City, and the third cluster consisting of Gianyar, Buleleng and Tabanan regencies.
Keywords: Pembangunan Ekonomi, K-Means Clustering, Bali.
Perekonomian merupakan salah satu prioritas utama dalam pelaksanaan pembangunan nasional, salah satu ciri negara maju adalah sistem perekonomian yang kuat dan berkeadilan. Pembangunan ekonomi adalah serangkaian upaya yang dilakukan dalam perekonomian untuk mengembangkan kegiatan ekonomi guna meningkatkan taraf hidup masyarakat. Pembangunan ekonomi nasional tidak dapat dipisahkan dari pembangunan ekonomi daerah [1], oleh karena itu pembangunan ekonomi daerah harus menjadi salah satu prioritas negara untuk menjadi negara yang lebih maju.
Keberhasilan pembangunan ekonomi daerah dapat diukur dengan beberapa indikator. Indikator utama yang digunakan adalah produk domestik bruto per kapita (PDB) daerah yang dapat digunakan sebagai indikator kegiatan ekonomi secara umum sebagai ukuran kemajuan daerah. Indikator kesejahteraan manusia juga harus dipadukan dengan Indeks Pembangunan Manusia (IPM). IPM dapat memberikan wawasan tentang harapan hidup, pendidikan dan standar hidup di wilayah tersebut. Indikator lain yang dapat digunakan untuk mengukur efisiensi pembangunan ekonomi suatu daerah adalah rasio gini dan pengeluaran per kapita.
Provinsi Bali merupakan salah satu daerah di kawasan Indonesia yang mengalami pertumbuhan ekonomi yang melambat di saat pandemi, perubahan tingkat perekonomian yang terjadi juga berpengaruh pada kesenjangan-kesenjangan perekonomian antar kabupaten/kota di Provinsi Bali [2]. Kesenjangan tersebuat akan lebih mudah diatasi apabila setiap daerah memiliki kebijakan - kebijakan yang sesuai dengan tiingkat perekonomian daerah tersebut, sehingga perekonomian bali tidak hanya ditopang oleh kota-kota besar seperti kabupaten Badung dan kota Denpasar.
Berangkat dari hal tersebut, kajian ini bertujuan untuk membentuk kluster wilayah/kota berdasarkan aktivitas pada tingkat ekonomi wilayah. Melalui klaster yang akan dibentuk, pemerintah pusat dan daerah dapat memantau dan mengevaluasi kinerja perekonomian masing-masing kabupaten/kota. Dengan demikian, perbedaan pembangunan antar kabupaten/kota di Provinsi Bali tidak bertambah. Metode K-Means clustering digunakan dalam penelitian ini untuk membentuk cluster wilayah/kota karena metode ini dapat memperkenalkan model yang lebih
fleksibel dan memudahkan penyelesaian perhitungan masalah yang dirumuskan.
Data mining adalah proses pencarian informasi dalam kumpulan data yang memiliki kapasitas yang besar [3]. Data mining bertujuan untuk mencari relasi dan informasi yang terdapat dalam data sehingga dapat dijadikan ilmu pengetahuan yang berguna. Secara garis besar metode dalam data mining dapat dibagi kedalam lima bagian yaitu klasifikasi, prediksi, asosiasi, estimasi dan klastering.
Clustering adalah metode membagi dataset menjadi beberapa kelompok sesuai dengan karakteristik data [4]. Dalam proses clustering, objek-objek dibagi menjadi dua atau lebih cluster sehingga objek-objek dalam satu cluster sangat mirip satu sama lain. Dengan clustering, lebih mudah untuk menemukan pola distribusi dalam data dan juga lebih mudah untuk menentukan hubungan antar atribut data. Beberapa persyaratan pengelompokan penambangan data meliputi skalabilitas, kemampuan untuk menangani berbagai jenis atribut, kemampuan untuk menangani dimensi tinggi, menangani data yang berisik dan mudah diterjemahkan.
K-Means Clustering merupakan metode clustering yang paling umum digunakan, K-Means merupakan salah satu metode pembelajaran unsupervised data mining, yang membagi data menjadi beberapa kelompok, sehingga data dalam sebuah cluster memiliki sifat yang sama [5]. Algoritma K-Means dikenal karena kemampuannya untuk mempartisi sejumlah besar data dan outlier dengan cepat dan mudah. K-Means bekerja dengan memecah data menjadi beberapa cluster dan mengelompokkannya berdasarkan seberapa mirip data tersebut dengan data centroid. Algoritma K-Means adalah metode non-hierarkis yang terlebih dahulu mengambil beberapa komponen populasi untuk bertindak sebagai pusat cluster awal. Pada langkah awal algoritma K-Means, centroid dipilih secara acak dari kumpulan data, setelah itu data diuji kesamaannya dengan setiap centroid yang membentuk cluster. Posisi pusat dihitung kembali hingga semua komponen data pada setiap cluster terklasifikasi dan akhirnya terbentuk pusat cluster baru.
Penelitian ini menggunakan data sekunder dari Badan Pusat Statistik (BPS). Unit analisis mencakup 9 kabupaten/kota di Provinsi Bali dengan acuan waktu tahun 2020. Variabel yang digunakan dalam penelitian ini adalah produk domestik bruto per kapita (PDRB/kapita), pertumbuhan pengeluaran per kapita, rasio gini, angka harapan hidup, rata-rata tahun sekolah dan IPM. Tahapan penelitian ditunjukkan pada Gambar 1.
Gambar 1. Flowchart Alur Penelitian
Pada penelitian ini identifikasi permasalahan dilakukan dengan tujuan untuk mengklasifikasikan wilayah di provinsi bali berdasarkat tingkat perekonomian. Hal ini bertujuan agar peneliti dan pembaca mengetahui tingkat perekonomian setiap daerah sehingga masyarakat dan pemerintah dapat mengambil kebijakan yang tepat untuk mengatasi kesenjangan perekonomian setiap daerah di Provinsi Bali.
Pada tahapan ini dilakukan studi literatur untuk memperdalam pengetahuan dasar dalam memahami metode yang digunakan, yang mana data dalam penelitian ini merupakan data kondisi perekonomian bali. Data tersebut bersumber dari Badan Pusat Statistik Provinsi Bali pada tahun 2020, rincian dari data yang digunakan dapat dilihat dalam Tabel 1.
Table 1. Data Pertumbuhan Perekonomian Provinsi Bali
Kabupaten Kota |
PDRB (Milyar) |
Umur Harapan Hidup |
Pertumbuhan Pengeluaran Perkapita (%) |
Gini Ratio |
IPM |
Rata-Rata Lama Sekolah |
Jembrana |
13.465 |
72,35 |
14,99 |
0,353 |
72,36 |
8,23 |
Tabanan |
22.332 |
73,65 |
8,08 |
0,324 |
76,17 |
8,88 |
Badung |
49.215 |
75,1 |
4,04 |
0,317 |
81,6 |
10,39 |
Gianyar |
25.915 |
73,68 |
4,54 |
0,317 |
77,36 |
9,04 |
Klungkung |
8.469 |
71,25 |
6,32 |
0,358 |
71,73 |
8,13 |
Bangli |
6.722 |
70,52 |
12,65 |
0,283 |
69,36 |
7,17 |
Karangasem |
16.453 |
70,47 |
14,97 |
0,327 |
67,35 |
6,32 |
Buleleng |
33.359 |
71,83 |
4,3 |
0,285 |
72,55 |
7,24 |
Denpasar |
49.583 |
74,82 |
12,37 |
0,33 |
83,93 |
11,47 |
Pada tahapan ini, data yang diperoleh akan diproses menggunakan metode K-Means Clustering. Sebelumnya data tersebut akan diubah kedalam bentuk integer dan akan dinormalisasi untuk mempermudah pemrosesan. Dalam penelitian ini software yang digunakan untuk membantu proses pengolahan data adalah aplikasi Rapid Miner, aplikasi tersebut digunakan untuk menentukan pengelompokan data sehingga dapat menampilkan hasil akhir pengelompokan clustering.
Gambar 2. Flowchart Algoritma K-Means
Algoritma K-Means pada penelitian ini digunakan dalam proses klasterisasi data, langkah-langkah dalam implementasinya dapat dilihat sebagai berikut:
-
1. Tentukan jumlah klaster yang diinginkan
-
2. Pada iterasi awal, tentukan centroid secara acak
-
3. Hitung jarak setiap titik ke centroid menggunakan rumus Euclidian Distance
-
4. Hitung ulang centroid menggunakan nilai rata-rata setiap variabel dari masing-masing cluster
-
5. Ulangi langkah ketiga dan keempat hingga nilai centroid tidak berubah, jika anggota dari masing-masing custer tidak terdapat perubahan maka proses klasterisasi sudah selesai
Pada tahap pemilihan data, data yang dipakai adalah data tinjauan perekonomian provinsi Bali pada tahun 2020 yang terdiri dari 7 variabel yaitu nama kabupaten/kota, PDRB, umur harapan hidup, pertumbuhan pengeluaran perkapita, gini ratio, IPM dan rata-rata lama sekolah. Data yag didapakan bia langsng diolah tanpa harus melawati preprocessing terlbih dahulu.
Centroid merupakan titik pusat data yang akan digunakan sebagai perhitungan dalam menentukan cluster, pada iterasi pertama nilai centroid ditentukan secara acak, berikut merupakan centroid awal dalam penelitian ini:
Table 2. Centroid Awal Data
Kabupaten Kota |
PDRB (Milyar) |
Umur Harapan Hidup |
Pertumbuhan Pengeluaran Perkapita (%) |
Gini Ratio |
IPM |
Rata-Rata Lama Sekolah | |
Jembrana |
13.465 |
72,35 |
14,99 |
0,353 |
72,36 |
8,23 |
C0 |
Gianyar |
25.915 |
73,68 |
4,54 |
0,317 |
77,36 |
9,04 |
C1 |
Denpasar |
49.583 |
74,82 |
12,37 |
0,33 |
83,93 |
11,47 |
C2 |
Langkah selanjutnya adalah menghitung jarak setiap datum dari centroid asal dengan menggunakan persamaan jarak Euclidean. Pada titik ini, jarak terpendek antara data dengan cluster menentukan apakah data berada di cluster 0, cluster 1, atau cluster 2. Berikut adalah hasil perhitungan jarak data pada iterasi pertama:
Table 3. Hasil Iterasi pertama
Kabupaten/Kota |
C0 |
C1 |
C2 |
Output |
Jembrana |
0 |
12449,96549 |
36118,56218 |
C0 |
Tabanan |
8867,22363 |
3582,74195 |
27251,34159 |
C1 |
Badung |
35750,35304 |
23300,39047 |
368,3132727 |
C2 |
Gianyar |
12449,96549 |
0 |
23668,60236 |
C1 |
Klungkung |
4995,937685 |
17445,89119 |
41114,49255 |
C0 |
Bangli |
6742,931405 |
19192,89373 |
42861,49291 |
C0 |
Karangasem |
2987,935402 |
9462,041979 |
33130,63494 |
C0 |
Buleleng |
19894,1129 |
7444,152005 |
16224,45683 |
C1 |
Denpasar |
36118,56218 |
23668,60236 |
0 |
C2 |
Langkah berikutnya hitung nilai centroid baru mengunakan nilai rata-rata setiap variabel dari masing-masing cluster. Jika nilai centroid berubah, ulangi kembali proses iterasi sehingga nilai centroid dan cluster tidak lagi ada perbubahan
Table 4. Centroid Data Baru
C0 |
11277,1775 |
71,1475 |
12,2325 |
0,33025 |
70,2 |
7,4625 |
C1 |
27202,00667 |
73,05333333 |
5,64 |
0,308666667 |
75,36 |
8,386666667 |
C2 |
49399,365 |
74,96 |
8,205 |
0,3235 |
82,765 |
10,93 |
Setelah tidak terdapat perubahan dari hasil cluster maupun centroid maka hasil akhir dari perhitungan sudah bisa didapatkan. Berikut merupakan hasil akhir yang didapatkan dari perhitungan:
Table 4. Hasil Akhir Cluster
Kabupaten/Kota |
C0 |
C1 |
C2 |
Output |
Jembrana |
2187,735769 |
13737,10023 |
35934,4572 |
C0 |
Tabanan |
11054,95527 |
4869,87744 |
27067,2358 |
C1 |
Badung |
37938,08542 |
22013,25443 |
184,1541884 |
C2 |
Gianyar |
14637,69658 |
1287,139042 |
23484,49591 |
C1 |
Klungkung |
2808,204222 |
18733,02715 |
40930,38667 |
C0 |
Bangli |
4555,197649 |
20480,02897 |
42677,38758 |
C0 |
Karangasem |
5175,664179 |
10749,17424 |
32946,5297 |
C0 |
Buleleng |
22081,84406 |
6157,014315 |
16040,34915 |
C1 |
Denpasar |
38306,29535 |
22381,46623 |
184,160388 |
C2 |
Untuk menerapkan metode K-Means pada data yang telah disiapkan, dataset harus diimpor terlebih dahulu ke dalam aplikasi RapidMiner. Kemudian beralih ke desain proses, yang mencakup implementasi dan pengujian menggunakan metode operator RapidMiner yang ada. Penjelasan lebih rinci tentang langkah-langkah ini adalah sebagai berikut.
-
1. Data yang sudah disimpan dalam fomat *.xls diimport terlebih dahulu ke dalam RapidMiner
sesuai dengan lokasi penyimpanan data. Selanjutnya tentukan atribut yang digunakan sebagai label indikator, dalam penelitian ini label indikator yang digunakan adalah kabupaten/kota
Gambar 3. Import Data ke Dalam RapidMiner
-
2. Setelah diimport, data diinput ke dalam desain proses dan dilanjutkan dengan memilih
metode yang akan digunakan untuk pemrosesan data, yang mana dalam penelitian ini menggunakan metode K-Means

-
Gambar 4. Desain Proses Pada RapidMiner
3.
Tahapan selanjutnya adalah menentukan jumlah cluster yang diinginkan dan maksimal iterasi yang dilakukan dalam proses. Untuk lebih jelasnya dapat dilihat dalam gambar berikut

-
Gambar 5. Input Parameter K-Means
4.
Setelah parameter klasterisasi ditentukan maka proses siap dijalankan. Hasil Clustering dari algoritma K-Means dapat dilihat pada gambar 6 dan 7
Open in |
Turbo Prep ∣^ |
I AutoModei |
Filter (9/9 examples): |
all | ||||
.. kJ |
KatMipatenA- |
duster |
PDRB<Mi∣yar) |
Umur Harap... |
Pertumbuha.., |
Gini Ralio |
IPM |
Rata-Rata L- |
1 |
Jembrana |
duster_O |
13464 910 |
72.350 |
14.990 |
0.353 |
72.360 |
8230 |
2 |
Tabanan |
cluster_2 |
22332.130 |
73.650 |
8.080 |
0.324 |
76.170 |
9 880 |
3 |
Badung |
cluster_1 |
49215.260 |
75.100 |
4.040 |
0.317 |
81.600 |
10.390 |
4 |
Gianyar |
cluster_2 |
25914 970 |
73.680 |
4.540 |
0317 |
77 360 |
9 040 |
5 |
Klungftjng |
duster_O |
8468 990 |
71.250 |
6.320 |
0.358 |
71.730 |
8130 |
6 |
Bangll |
ChisierJ) |
6721.990 |
70.520 |
12.650 |
0.283 |
69.360 |
7.170 |
. 7 |
Karangasem |
cluster_O |
16452.940 |
70.470 |
14.970 |
0.327 |
67.350 |
6.320 |
8 |
Buleleng |
CiusterjZ |
33359 020 |
71.830 |
4.300 |
0285 |
72550 |
7240 |
9 |
Denpasar |
ChJStei-I |
49583 470 |
74.820 |
12 370 |
0330 |
83930 |
11470 |
-
Gambar 6. Hasil Clustering Dalam Bentuk Tabel
Gambar 7. Hasil Clusterisasi Dalam Bentk Plot
Dari gambar 5 dapat dilihat hasil klasterisasi terbagi menjadi 3 kelompok, Cluster 0 terdiri dari kabupaten Jembrana, Klungkung, Bangli dan Karangasem, Cluster 1 terdiri dari kabupaten Badung dan kota Denpasar dan yang terakhir Cluster 2 terdiri kabupaten Tabanan, Gianyar dan Buleleng
Table 4. Rata-Rata Variabel Pada Klaster
CLuster |
PDRB (Milyar) |
Umur Harapan Hidup |
Pertumbuhan Pengeluaran Perkapita (%) |
Gini Ratio |
IPM |
Rata-Rata Lama Sekolah |
C0 |
11.277 |
71,14 |
12,23 |
0,33025 |
70,2 |
7,46 |
C1 |
49.399 |
74,96 |
8,20 |
0,3235 |
82,76 |
10,93 |
C3 |
27.202 |
73,05 |
5,64 |
0,3086 |
75,36 |
8,38 |
Berdasarkan Tabel 7 dapat diketahui karakteristik setiap cluster berdasarkan enam variabel yang digunakan dengan rata-rata dari setiap variabel dari setiap cluster yang terbentuk. Karakteristik masing-masing cluster dijelaskan di bawah ini:
-
1. Klaster 0 dicirikan dengan rata-rata tingkat pembangunan perekonomian paling rendah
tinggi, dimana rata-rata PDRB pada klaster ini hanya menyumbang 12% dari rata-rata keseluruhan PDRB Provinsi Bali. Rata-rata pertumbuhan pengeluaran perkapita Klaster ini merupakan yang terbesar pada tahun 2020 dikarenakan klaster ini tidak mengalami penurunan penghasilan yang signifikan karena pandemi covid-19. Dari sisi pendidikan penduduknya, kabupaten/kota dalam Klaster 0 memiliki rata – rata RLS sebesar 7,46 tahun. Gini Ratio pada klaster ini merupakan yang paling tinggi, hal tersebut
mengindikasikan bahwa distribusi pendapatan kabupaten/kota Klaster 0 memiliki
ketimpangan yang paling tinggi dibandingkan klaster-klaster lainnya.
-
2. Klaster 1 merupakan klaster yang terdiri dari dua wilayah, yaitu Kabupaten Badung dan
Kota Denpasar. Rata-rata PDRB cluster 1 merupakan yang tertinggi diantara klaster lainnya, namun secara pertumbuhan pendapatan perkapita masih lebih kecil jika dibandingkan dengan klaster 0. umur harapan hidup klaster 1 relatif tinggi dibandingkan klaster yang lain, dan kualitas pendidikan penduduk juga berapa pada posisi paling tinggi dengan rata-rata bernilai sebesar 10,93 tahun.
-
3. Klaster 2 dicirikan dengan gini ratio yang paling rendah, yang berarti bahwa ketimpangan
pendapatan pada klaster ini lebih rendah dari dua klaster lainnya. Rata-rata pertumbuhan
pendapatan kabupaten/kota klaster ini pada tahun 2020 adalah sebesar 5,64%. PDRB per kapita pada klaster ini berada posisi kedua setelah klaster 1 j, yaitu bernilai 27,202 milyar per tahun. Sama seperti PDRB-nya, secara pendidikan klaster ini berapa pada posisi kedua dengan RLS 8,38 tahun.
Berdasarkan penelitian yang sudah dilakukan sebelumnya, klasterisasi indeks tingkat pembangunan perekonomian di Provinsi bali dapat dibagi menjadi 3 klaster yaitu klaster C0 yang terdiri dari Kabupaten Klungkung, Jembrana, Karangasem dan Bangli, klaster C1 yang terdiri dari Kabupaten Badung dan Kota Denpasar, dan yang terakhir klaster C2 yang terdiri dari Kabupaten Tabanan, Gianyar dan Buleleng. Penelitian ini juga membuktikan metode Clustering dengan algoritma KMeans dapat digunakan untuk mengelompokkan tingkat pembangunan perekonomian kabupaten/kota di Provinsi Bali. Adanya penelitian ini diharapkan dapat meningkatkan kesadaran masyarakat dan pemerintah akan ketimpangan sosial yang terjadi sehingga kebijakan yang tepat dapat diambil sesuai dengan kebutuhan dan tingkat pembangunan perekonomian masing-masing daerah.
Daftar Pustaka
-
[1] Fatmawati, K., & Windarto, A. P., Data Mining: Penerapan Rapidminer Dengan K-Means Cluster Pada Daerah Terjangkit Demam Berdarah Dengue (DBD) Berdasarkan Provinsi, CESS (Journal of Computer Engineering System and Science), Vol. 3, No. 2, 2018
-
[2] Adnyani, N. K. S., & Agustini, D. A. E. Digitalisasi Sebagai Pemulihan Perekonomian Di Sektor Kerajinan Dalam Mendukung Kebangkitan Umkm Di Provinsi Bali. Jurnal Pengabdian Kepada Masyarakat Media Ganesha FHIS, 1(2), 87-96. 2020
-
[3] Jollyta, D., Ramdhan, W., & Zarlis, M. Konsep Data Mining Dan Penerapan. Deepublish. 2020
-
[4] Dharmayanti, D., Bachtiar, A. M., & Prasetyo, A. C. Penerapan Metode Clustering Untuk Membentuk Kelompok Belajar Menggunakan Di Smpn 19 Bandung. Komputa: Jurnal Ilmiah Komputer dan Informatika, 6(2), 49-56. 2017
-
[5] Nabila, Z., Isnain, A. R., Permata, P., & Abidin, Z. Analisis Data Mining Untuk Clustering Kasus Covid-19 Di Provinsi Lampung Dengan Algoritma K-Means. Jurnal Teknologi Dan Sistem Informasi, 2(2), 100-108. 2021
halaman ini sengaja dibiarkan kosong
770
Discussion and feedback