PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN
on
E-Jurnal Matematika Vol. 5 (2), Mei 2016, pp. 38-43
ISSN: 2303-1751
PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN
Ni Wayan Aris Aprilia A.P§1, I Gusti Ayu Made Srinadi2, Kartika Sari3
1Jurusan Matematika, Fakultas MIPA - UniversitasUdayana [Email:[email protected]]
2Jurusan Matematika, Fakultas MIPA - UniversitasUdayana [Email:[email protected]] 3Jurusan Matematika, Fakultas MIPA - UniversitasUdayana [Email:[email protected]] §Corresponding Author
ABSTRACT
Cluster analysis is one of data analysis used to classify objects in clusters which has objects with the same characteristics, whereas the other cluster has different characteristics. One part of the method of analysis cluster is hierarchy method. In a hierarchical method there are methods of linkage in the form of incorporation. Generally, methods of linkage is divided into 5 methods: single linkage, complete linkage, average linkage, Ward and centroid. The purpose of this study was to determine the best method of linkage among the method of single linkage, complete linkage, average linkage, and Ward, using Euclidean and Pearson proximity distance. Base on the smallest value of CTM (Cluster Tightness Measure), the best method of linkage as a result of this research was average linkage in Pearson distance.
Keywords: Euclidean distance, Pearson distance, Linkage methods, CTM
i ke gerombol w dan dari gerombol j ke gerombol w,D( ij)W merupakan jarak terdekat antara gerombol i dan w serta gerombol j dan w. Misalkan dimiliki matriks jarak objek 1 sampai dengan objek 5 seperti matriks berikut.
1 2 |
0 | ||
9 |
0 | ||
D = dij |
= 3 |
⎢3 |
70 |
4 |
⎢6 |
590 |
5⎣11102 8 0⎦
Objek dengan jarak terdekat digabung menjadi satu yaitu objek 3 dan 5 menjadi (35), selanjutnya dilakukan pembentukan matriks jarak dengan metode pautan single lingkage dengan perhitungan sebagai berikut:
d(35) 1 = min{^31 , ⅛1} = min{3,11} = 3
d(35)2 = min{⅛2 , d⅛ι} = min{7,10} = 7
d(35)4 = min{d34, d54} =min{9,8} =8
Matriks jarak baru yang terbentuk adalah:
Jarak terdekat adalah objek (35) disimbulkan objek (3*) dengan objek 1, selanjutnya objek (3*) digabung dengan objek 1 membentuk (3*1). Prosedur perhitungan matriks jarak baru identik dengan yang dilakukan sebelumnya, dengan perhitungan:
d(3∗1)2 = min{d3 ∗2, ⅛2} =min{7,9} =7
d(3∗1)4 = min{^3 ∗4, ⅛4} =min{8,6} =6
Matriks jarak baru menjadi:
4650
Prosedur ini akan dilakukan sampai semua
pasangan objek dengan jarak minimum
diperoleh dan bergabung menjadi satu gerombol. Hasil perhitungan digambarkan dalam bentuk dendogram.
Pada metode complete linkage, pembentukan matriks jarak baru berdasarkan jarak maksimum antara dua objek atau gerombol. Average linkage menggunakan jarak rata-rata antara dua gerombol. Metode Ward ditentukan dari jumlah kuadrat jarak dari dua gerombol berdasarkan semua variabel. Jarak dalam metode centroid merupakan jarak antara dua gerombol yang didefinisikan sebagai jarak Euclidean antara vektor mean (Rencher [2]).
Pendidikan merupakan salah satu unsur penting dalam pembangunan. Untuk mengetahui karakteristik tingkat pendidikan desa/kelurahan di Kota Denpasar dilakukan pengelompokan berdasarkan data indikator pendidikan. Indikator-indikator pendidikan dalam penelitian ini meliputi banyak sekolah TK, SD, SMP, SMA/SMK, banyak siswa TK, SD, SMP, SMA/SMK, dan banyak guru TK, SD, SMP, SMA/SMK. Penelitian ini bertujuan untuk mengetahui metode pautan terbaik di antara metode single linkage, complete linkage, average linkage, dan Ward dalam mengelompokkan desa/kelurahan di Kota Denpasar menurut indikator pendidikan.
Kriteria yang digunakan dalam penentuan metode terbaik adalah Cluster Tightness Measure (CTM). CTM adalah ukuran perkiraan efektivitas dalam kelompok, rancangan ukuran
antar kelompok, dan ukuran pemisahan dalam suatu kelompok. CTM diukur berdasarkan simpangan baku pada masing-masing kelompok seperti ditulis dalam persamaan berikut (Sutanto[3]):
CTM = ∑ (⅛ ∑ 5 )
dengan r : banyaknya kelompok p : banyaknya variabel
Stm : simpangan baku pada kelompok ke-t untuk variabel ke-m
Sm : simpangan baku variabel ke-m
Pemilihan metode pautan terbaik dilihat berdasarkan nilai CTM terkecil.
-
2. METODE PENELITIAN
Data yang digunakan dalam penelitian ini adalah data sekunder yang berasal dari publikasi Badan Pusat Statistik (BPS) yaitu data Dinas Pendidikan Pemuda dan Olahraga, yaitu data indikator pendidikan pada 43 desa/kelurahan di Kota Denpasar tahun 2013. Indikator pendidikan yang menjadi variabel penelitian sebanyak 12 variabel yaitu banyak sekolah TK, SD, SMP, SMA/SMK, banyak siswa TK,SD
SMP,SMA/SMK, dan banyak guru TK, SD, SMP, SMA/SMK.
Langkah-langkah analisis data sebagai berikut:
-
1. Melakukan standarisasi data.
-
2. Melakukan pngecekan korelasi.
-
3. Jika ada korelasi yang signifikan antara variabel dilakukan analisis komponen utama untuk membentuk komponen-komponen yang saling bebas, selanjutnya skor komponen yang diperoleh dipandang sebagai variabel untuk analisis lebih lanjut, jika tidak ada korelasi yang signifikan maka dilanjutkan ke langkah 4.
-
4. Mengukur kesamaan obyek (similarity) menggunakan jarak Euclidean [2] dengan rumus:
dfj = √∑ fc = l (xki - Xkj )2 (1)
dan jarak Pearson yang menggunakan rumus (Sutanto [3]):
√∑ (xki xkj) 2_
-^^-∙k=l var (Xk)
(2)
-
5. Menjelaskan setiap anggota kelompok yang terbentuk pada masing-masing metode pautan yaitu single linkage (Johnson & Wichern [4]) dengan rumus:
complete linkage [4] dengan rumus:
average linkage [4] dengan rumus: n =∑n∑k ^nk
serta metode ward (Rencher [2]) menggunakan rumus:
SSEij = ∑ k=l( Yk-̅ij )′( Yk - ̅ ij ) (6)
-
6. Melakukan pemilihan metode terbaik berdasarkan nilai CTM terkecil.
-
7. Interpretasi hasil.
Desa/kelurahan di Kota Denpasar ada sebanyak 43 dengan beberapa indikator pendidikan saling berkorelasi secara signifikan. Terlebih dahulu dilakukan analisis komponen utama untuk memperoleh skor komponen yang saling bebas. Skor komponen-skor komponen yang selanjutnya dianalisis dengan analisis gerombol untuk mengelompokkan
desa/kelurahan di Kota Denpasar.
-
3.2 Penentuan Gerombol dengan Metode
Single Linkage
Pengelompokan dilakukan berdasarkan kedua jarak kedekatan (jarak Euclidean dan Pearson). Pada jarak Euclidean, plot diagram pencar memperlihatkan bahwa banyak gerombol yang terbentuk adalah 7, seperti pada Gambar 1.
Scatterplot of Distance level vs Number of cluster
Cluster = 7, distance = 2,754
Number of cluster
Gambar 1. Diagram Pencar Metode Single Linkage pada Jarak Euclidean
Pada jarak Pearson, banyak gerombol yang terbentuk adalah 3 seperti pada Gambar 2.
Scatterplot of Distance level vs Number of cluster
Cluster=3, Distance= 4,871
£4
1
0
10 20 30
Number of cluster
Io 3
40
Gambar 2. Diagram Pencar Metode Single Linkage pada Jarak Pearson
Proses penggerombolan dan pembentukan matriks jarak baru menggunakan persamaan (4). Sedangkan plot diagram pencar digunakan untuk menentukan banyaknya gerombol seperti pada Gambar 3 dan Gambar 4.
Scatterplot of Distance level vs Number of cluster
Cluster = 5, distance = 6,241
6
Number of cluster
Gambar 3. Plot Diagram Pencar Metode Complete Linkage pada Jarak Euclidean
Gambar 4. Plot Diagram Pencar Metode Complete Linkage pada Jarak Pearson
Terbentuk 5 gerombol dengan metode Complete Linkage pada jarak Euclidean dan jarak Pearson.
-
3.4 Penentuan Banyak Gerombol dengan
Metode Average Linkage
Banyaknya gerombol yang terbentuk pada metode average linkage dilihat berdasarkan plot diagram pencar antara jarak Euclidean dan Pearson, dilihat pada Gambar 5 dan Gambar 6.
Terbentuk 5 gerombol pada jarak Euclidean dan 4 gerombol pada jaran Pearson dengan metode Average Linkage.
Pada metode Ward, dengan menggunakan plot diagram pencar untuk jarak Euclidean banyak gerombol yang terbentuk dapat dilihat pada Gambar 7. Gambar 8 menunjukkan banyak gerombol yang terbentuk pada jarak Pearson.
Scatterplot of Distance level vs Number of cluster
35
30
25
S 20 U U C 2 15 U) a
10
5 0
Cluster = 5, Distance= 9,340
0 10 20 30 40
Number of cluster
Scatterplot of Distance level vs Number of cluster
Gambar 5. Plot Diagram Metode Average Linkage pada Jarak Euclidean
Scatterplot of Distance level vs Number of cluster
20
Number of cluster
Gambar 6. Plot Diagram Pencar Metode Average Linkage pada Jarak Pearson
Cluster = 4, distance = 5,894
Gambar 7. Plot Diagram Pencar Metode Ward pada Jarak Euclidean
Scatterplot of Distance level vs Number of cluster
Cluster = 7, Distance= 8,304
0 10 20 30 40
Number of cluster
Gambar 8. Plot Diagram Pencar Metode Ward pada Jarak Pearson
Dengan metode Ward, pada jarak Euclidean terbentuk 5 gerombol dan 7 gerombol terbentuk pada jarak Pearson.
Pemilihan metode terbaik dengan menggunakan kriteria Cluster Tightness Measure (CTM) terkecil. Hasil perhitungan CTM pada masing-masing metode pautan dapat dilihat pada Tabel 1
Tabel 1. Metode Terbaik Menggunakan CTM
Metode |
Nilai CTM dari Jarak | |
Euclidean |
Pearson | |
Single Linkage |
0,0909 |
0,0196 |
Complete Linkage |
0,0409 |
0,0411 |
Average Linkage |
0,0399 |
0,0183 |
Ward |
0,0663 |
0,0535 |
Berdasarkan Tabel 1 dapat dilihat bahwa metode pautan terbaik dalam mengelompokkan desa/kelurahan di kota Denpasar berdasarkan indikator pendidikan metode average linkage pada jarak kedekatan Pearson. Dendogram hasil pengelompokan metode average linkage pada jarak Pearson dapat dilihat pada Gambar 9.
Dendrogram
Average Linkage; Pearson Distance
Gambar 9. Dendogram Hasil Pengelompokan
Average Linkage pada Jarak Pearson
Dengan jarak kedekatan Pearson, metode pautan Average Lingkage, 43 desa/kelurahan di kota Denpasar dikelompokkan dalam 4 kelompok. Satu kelompok beranggotakan 40 desa/kelurahan dan 3 desa/kelurahan lainnya masing-masing merupakan kelompok tersendiri, diuraikan pada Tabel 2.
Hasil pengelompokan ini menunjukkan bahwa Desa Sumerta Klod, Desa Dangin Puri Kauh, dan Desa Dangin Puri Kangen memiliki indikator pendidikan dengan karakteristik yang berbeda dari ke-40 desa/kelurahan lainnya di kota Denpasar yang tergabung dalam kelompok 1. Pada kelompok 1, variabel yang dominan menentukan karakteristik pendidikan pada kelompok ini adalah variabel ^l (banyak sekolah TK).
Tabel 2. Pengelompokan Desa/Kelurahan dengan Metode Average Linkage pada Jarak Pearson
Kel |
Anggota Kelompok | |
I |
Klod
|
|
II |
Desa Sumerta Klod | |
III |
Desa Dangin Puri Kauh | |
IV |
Desa Dangin Puri Kangin |
Berdasarkan kriteria nilai CTM terkecil diperoleh bahwa metode pautan terbaik yang digunakan dalam pengelompokan desa/kelu-rahan di kota Denpasar berdasarkan indikator pendidikan adalah metode average linkage.
DAFTAR PUSTAKA
-
[1] Hair, Joseph.F. et.al. 1995. Multivariate Data Analysis with Readings Fourth Edition. United State of America: Prentice-Hall International, Inc.
-
[2] Rencher, A.C. 2002. Methods of Multivariate Analysis Second Edition. New York: John Wiley and Son, Inc.
-
[3] Sutanto, H.T. 2009. Cluster Analysis. http://core.ac.uk/download/pdf/1106 4649.pdf. Diakses 14 April 2015
-
[4] Johnson, R.A. & Dean.W.Wichern. 2007. Applied Multivariate Statistical Analysis Sixth Edition. United State of America: Pearson Education, Inc.
43
Discussion and feedback