E-Jurnal Matematika Vol. 5 (2), Mei 2016, pp. 38-43

ISSN: 2303-1751

PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN

Ni Wayan Aris Aprilia A.P§1, I Gusti Ayu Made Srinadi2, Kartika Sari3

1Jurusan Matematika, Fakultas MIPA - UniversitasUdayana [Email:[email protected]]

2Jurusan Matematika, Fakultas MIPA - UniversitasUdayana [Email:[email protected]] 3Jurusan Matematika, Fakultas MIPA - UniversitasUdayana [Email:[email protected]] §Corresponding Author

ABSTRACT

Cluster analysis is one of data analysis used to classify objects in clusters which has objects with the same characteristics, whereas the other cluster has different characteristics. One part of the method of analysis cluster is hierarchy method. In a hierarchical method there are methods of linkage in the form of incorporation. Generally, methods of linkage is divided into 5 methods: single linkage, complete linkage, average linkage, Ward and centroid. The purpose of this study was to determine the best method of linkage among the method of single linkage, complete linkage, average linkage, and Ward, using Euclidean and Pearson proximity distance. Base on the smallest value of CTM (Cluster Tightness Measure), the best method of linkage as a result of this research was average linkage in Pearson distance.

Keywords: Euclidean distance, Pearson distance, Linkage methods, CTM

i ke gerombol w dan dari gerombol j ke gerombol w,D( ij)W merupakan jarak terdekat antara gerombol i dan w serta gerombol j dan w. Misalkan dimiliki matriks jarak objek 1 sampai dengan objek 5 seperti matriks berikut.

1

2

0

9

0

D = dij

= 3

3

70

4

⎢6

590

5⎣11102 8 0⎦

Objek dengan jarak terdekat digabung menjadi satu yaitu objek 3 dan 5 menjadi (35), selanjutnya dilakukan pembentukan matriks jarak dengan metode pautan single lingkage dengan perhitungan sebagai berikut:

d(35) 1 = min{^31 , ⅛1} = min{3,11} = 3

d(35)2 = min{⅛2 , d⅛ι} = min{7,10} = 7

d(35)4 = min{d34, d54} =min{9,8} =8

Matriks jarak baru yang terbentuk adalah:

(35)  1  24

(35) 0  3  78

dij=13096

27905

48650

Jarak terdekat adalah objek (35) disimbulkan objek (3*) dengan objek 1, selanjutnya objek (3*) digabung dengan objek 1 membentuk (3*1). Prosedur perhitungan matriks jarak baru identik dengan yang dilakukan sebelumnya, dengan perhitungan:

d(31)2 = min{d32, ⅛2} =min{7,9} =7

d(3∗1)4 = min{^3 ∗4, ⅛4} =min{8,6} =6

Matriks jarak baru menjadi:

(31)  24

d- ■    (31) 0 76

=   2  [7 05

4650

Prosedur ini akan dilakukan sampai semua

pasangan objek dengan jarak minimum

diperoleh dan bergabung menjadi satu gerombol. Hasil perhitungan digambarkan dalam bentuk dendogram.

Pada metode complete linkage, pembentukan matriks jarak baru berdasarkan jarak maksimum antara dua objek atau gerombol. Average linkage menggunakan jarak rata-rata antara dua gerombol. Metode Ward ditentukan dari jumlah kuadrat jarak dari dua gerombol berdasarkan semua variabel. Jarak dalam metode centroid merupakan jarak antara dua gerombol yang didefinisikan sebagai jarak Euclidean antara vektor mean (Rencher [2]).

Pendidikan merupakan salah satu unsur penting dalam pembangunan. Untuk mengetahui karakteristik tingkat pendidikan desa/kelurahan di Kota Denpasar dilakukan pengelompokan berdasarkan data indikator pendidikan. Indikator-indikator pendidikan dalam penelitian ini meliputi banyak sekolah TK, SD, SMP, SMA/SMK, banyak siswa TK, SD, SMP, SMA/SMK, dan banyak guru TK, SD, SMP, SMA/SMK. Penelitian ini bertujuan untuk mengetahui metode pautan terbaik di antara metode single linkage, complete linkage, average linkage, dan Ward dalam mengelompokkan desa/kelurahan di Kota Denpasar menurut indikator pendidikan.

Kriteria yang digunakan dalam penentuan metode terbaik adalah Cluster Tightness Measure (CTM). CTM adalah ukuran perkiraan efektivitas dalam kelompok, rancangan ukuran

antar kelompok, dan ukuran pemisahan dalam suatu kelompok. CTM diukur berdasarkan simpangan baku pada masing-masing kelompok seperti ditulis dalam persamaan berikut (Sutanto[3]):

CTM =  ∑  (⅛   5 )

dengan r : banyaknya kelompok p : banyaknya variabel

Stm : simpangan baku pada kelompok ke-t untuk variabel ke-m

Sm : simpangan baku variabel ke-m

Pemilihan metode pautan terbaik dilihat berdasarkan nilai CTM terkecil.

  • 2.    METODE PENELITIAN

Data yang digunakan dalam penelitian ini adalah data sekunder yang berasal dari publikasi Badan Pusat Statistik (BPS) yaitu data Dinas Pendidikan Pemuda dan Olahraga, yaitu data indikator pendidikan pada 43 desa/kelurahan di Kota Denpasar tahun 2013. Indikator pendidikan yang menjadi variabel penelitian sebanyak 12 variabel yaitu banyak sekolah TK, SD, SMP, SMA/SMK,    banyak    siswa    TK,SD

SMP,SMA/SMK, dan banyak guru TK, SD, SMP, SMA/SMK.

Langkah-langkah analisis data sebagai berikut:

  • 1.    Melakukan standarisasi data.

  • 2.    Melakukan pngecekan korelasi.

  • 3.    Jika ada korelasi yang signifikan antara variabel dilakukan analisis komponen utama untuk membentuk komponen-komponen yang saling bebas, selanjutnya skor komponen yang diperoleh dipandang sebagai variabel untuk analisis lebih lanjut, jika tidak ada korelasi yang signifikan maka dilanjutkan ke langkah 4.

  • 4.    Mengukur kesamaan obyek (similarity) menggunakan jarak Euclidean [2] dengan rumus:

dfj = √∑ fc = l (xki - Xkj )2        (1)

dan jarak Pearson yang menggunakan rumus (Sutanto [3]):

√∑    (xki xkj) 2_

-^^-∙k=l var (Xk)

(2)


  • 5.    Menjelaskan setiap anggota kelompok yang terbentuk pada masing-masing metode pautan yaitu single linkage (Johnson & Wichern [4]) dengan rumus:

D(i j)W = min{ ^iw , djw }

complete linkage [4] dengan rumus:

D(i j)W = max{ ^iw , djw }

average linkage [4] dengan rumus: n =nk ^nk

( )W=    (y) Nw(5)

serta metode ward (Rencher [2]) menggunakan rumus:

SSEij = ∑ k=l( Yk-̅ij )( Yk - ̅ ij ) (6)

  • 6.    Melakukan pemilihan metode terbaik berdasarkan nilai CTM terkecil.

  • 7.    Interpretasi hasil.

  • 3.    HASIL DAN PEMBAHASAN

    • 3.1    Deskripsi Data

Desa/kelurahan di Kota Denpasar ada sebanyak 43 dengan beberapa indikator pendidikan saling berkorelasi secara signifikan. Terlebih dahulu dilakukan analisis komponen utama untuk memperoleh skor komponen yang saling bebas. Skor komponen-skor komponen yang selanjutnya dianalisis dengan analisis gerombol      untuk      mengelompokkan

desa/kelurahan di Kota Denpasar.

  • 3.2    Penentuan Gerombol dengan Metode

Single Linkage

Pengelompokan dilakukan berdasarkan kedua jarak kedekatan (jarak Euclidean dan Pearson). Pada jarak Euclidean, plot diagram pencar memperlihatkan bahwa banyak gerombol yang terbentuk adalah 7, seperti pada Gambar 1.

Scatterplot of Distance level vs Number of cluster

Cluster = 7, distance = 2,754

Number of cluster

Gambar 1. Diagram Pencar Metode Single Linkage pada Jarak Euclidean


Pada jarak Pearson, banyak gerombol yang terbentuk adalah 3 seperti pada Gambar 2.

Scatterplot of Distance level vs Number of cluster

Cluster=3, Distance= 4,871

£4

1

0

10             20             30

Number of cluster


Io 3


40

Gambar 2. Diagram Pencar Metode Single Linkage pada Jarak Pearson

  • 3.3    Penentuan Banyak Gerombol dengan Metode Complete Linkage

Proses penggerombolan dan pembentukan matriks jarak baru menggunakan persamaan (4). Sedangkan plot diagram pencar digunakan untuk menentukan banyaknya gerombol seperti pada Gambar 3 dan Gambar 4.

Scatterplot of Distance level vs Number of cluster

Cluster = 5, distance = 6,241

6

Number of cluster

Gambar 3. Plot Diagram Pencar Metode Complete Linkage pada Jarak Euclidean

Gambar 4. Plot Diagram Pencar Metode Complete Linkage pada Jarak Pearson


Terbentuk 5 gerombol dengan metode Complete Linkage pada jarak Euclidean dan jarak Pearson.

  • 3.4    Penentuan Banyak Gerombol dengan

Metode Average Linkage

Banyaknya gerombol yang terbentuk pada metode average linkage dilihat berdasarkan plot diagram pencar antara jarak Euclidean dan Pearson, dilihat pada Gambar 5 dan Gambar 6.

Terbentuk 5 gerombol pada jarak Euclidean dan 4 gerombol pada jaran Pearson dengan metode Average Linkage.

  • 3.5    Penentuan Banyak Gerombol dengan Metode Ward

Pada metode Ward, dengan menggunakan plot diagram pencar untuk jarak Euclidean banyak gerombol yang terbentuk dapat dilihat pada Gambar 7. Gambar 8 menunjukkan banyak gerombol yang terbentuk pada jarak Pearson.

Scatterplot of Distance level vs Number of cluster

35

30

25

S 20 U U C 2 15 U) a

10

5 0

Cluster = 5, Distance= 9,340


0               10              20              30              40

Number of cluster


Scatterplot of Distance level vs Number of cluster

Gambar 5. Plot Diagram Metode Average Linkage pada Jarak Euclidean


Scatterplot of Distance level vs Number of cluster

20

Number of cluster

Gambar 6. Plot Diagram Pencar Metode Average Linkage pada Jarak Pearson


Cluster = 4, distance = 5,894

Gambar 7. Plot Diagram Pencar Metode Ward pada Jarak Euclidean

Scatterplot of Distance level vs Number of cluster

Cluster = 7, Distance= 8,304



0               10              20              30              40

Number of cluster

Gambar 8. Plot Diagram Pencar Metode Ward pada Jarak Pearson

Dengan metode Ward, pada jarak Euclidean terbentuk 5 gerombol dan 7 gerombol terbentuk pada jarak Pearson.

  • 3.6    Penentuan Metode Terbaik

Pemilihan metode terbaik dengan menggunakan kriteria Cluster Tightness Measure (CTM) terkecil. Hasil perhitungan CTM pada masing-masing metode pautan dapat dilihat pada Tabel 1

Tabel 1. Metode Terbaik Menggunakan CTM

Metode

Nilai CTM dari Jarak

Euclidean

Pearson

Single Linkage

0,0909

0,0196

Complete Linkage

0,0409

0,0411

Average Linkage

0,0399

0,0183

Ward

0,0663

0,0535

Berdasarkan Tabel 1 dapat dilihat bahwa metode pautan terbaik dalam mengelompokkan desa/kelurahan di kota Denpasar berdasarkan indikator pendidikan metode average linkage pada jarak kedekatan Pearson. Dendogram hasil pengelompokan metode average linkage pada jarak Pearson dapat dilihat pada Gambar 9.

Dendrogram

Average Linkage; Pearson Distance

Gambar 9. Dendogram Hasil Pengelompokan

Average Linkage pada Jarak Pearson

Dengan jarak kedekatan Pearson, metode pautan Average Lingkage, 43 desa/kelurahan di kota Denpasar dikelompokkan dalam 4 kelompok. Satu kelompok beranggotakan 40 desa/kelurahan dan 3 desa/kelurahan lainnya masing-masing merupakan kelompok tersendiri, diuraikan pada Tabel 2.

Hasil pengelompokan ini menunjukkan bahwa Desa Sumerta Klod, Desa Dangin Puri Kauh, dan Desa Dangin Puri Kangen memiliki indikator pendidikan dengan karakteristik yang berbeda dari ke-40 desa/kelurahan lainnya di kota Denpasar yang tergabung dalam kelompok 1. Pada kelompok 1, variabel yang dominan menentukan karakteristik pendidikan pada kelompok ini adalah variabel ^l (banyak sekolah TK).

Tabel 2. Pengelompokan Desa/Kelurahan dengan Metode Average Linkage pada Jarak Pearson

Kel

Anggota Kelompok

I

  • 1. Desa Pemogan

  • 2.  Kel. Pedungan

  • 3.  Kel.Sesetan

  • 4. Desa Serangan

  • 5.  Desa Sidakarya

  • 6.  Kelurahan Panjer

  • 7. Kelurahan Renon

  • 8. Desa Sanur Kauh

  • 9.  Kelurahan Sanur

  • 10. Desa Sanur Kaja

  • 11. Desa.Dangin Puri

Klod

  • 12.    Desa Dauh Puri Kaja

  • 13.    Desa Dangin Puri Kaja

  • 14.    Kel. Tonja

  • 15.    Kel. Peguyangan

  • 16.    Kelurahan Ubung

  • 17.    Desa Ubung Kaja

  • 18.    Desa Peguyangan Kaja

  • 19.    Desa Peguyangan Kangin

  • 20.    Desa Padangsambian Klod

  • 21.    Desa Pemecutann Klod

  • 22.    Kelurahan Kesiman

  • 23.    Desa Kesiman Petilan

  • 24.    Desa Kesiman Kertalangu

  • 25.    Kelurahan Sumerta

  • 26.    Desa Sumerta Kaja

  • 27.    Desa Sumerta Kauh

  • 28.    Kelurahan Dangin Puri

  • 29.    Kelurahan Penatih

  • 30.    Desa Penatih Dangin Puri

  • 31.    Desa Pemecutan Kaja

  • 32.    Desa Dauh Puri Kauh

  • 33.    Desa Dauh Puri Klod

  • 34.    Kelurahan Dauh Puri

  • 35.    Desa Dauh Puri Kangin

  • 36.    Kelurahan Pemecutan

  • 37.    Desa Tegal Arum

  • 38.    Desa Tegal Kerta

  • 39.    Kelurahan Padangsambian

  • 40.    Desa Padangsambian Kaja

II

Desa Sumerta Klod

III

Desa Dangin Puri Kauh

IV

Desa Dangin Puri Kangin

  • 4.    KESIMPULAN

Berdasarkan kriteria nilai CTM terkecil diperoleh bahwa metode pautan terbaik yang digunakan dalam pengelompokan desa/kelu-rahan di kota Denpasar berdasarkan indikator pendidikan adalah metode average linkage.

DAFTAR PUSTAKA

  • [1]    Hair, Joseph.F. et.al. 1995. Multivariate Data Analysis with Readings Fourth Edition. United State of America: Prentice-Hall International, Inc.

  • [2]    Rencher, A.C. 2002. Methods of Multivariate Analysis Second Edition. New York: John Wiley and Son, Inc.

  • [3]    Sutanto, H.T. 2009. Cluster Analysis. http://core.ac.uk/download/pdf/1106 4649.pdf. Diakses 14 April 2015

  • [4]    Johnson, R.A. & Dean.W.Wichern. 2007. Applied Multivariate Statistical Analysis Sixth Edition. United State of America: Pearson Education, Inc.

43