PENGELOMPOKAN TINGKAT KRIMINALITAS DENGAN METODE AGGLOMERATIVE DAN K-MEANS SERTA PEUBAH PENCIRINYA

Written by NYOMAN GDE PRAJNAWIWEKA RATMASA TARAM, I KOMANG GDE SUKARSA, I GUSTI AYU MADE SRINADI
on May 31, 2019

E-Jurnal Matematika Vol. 8(2), Mei 2019, pp.102-111

DOI: https://doi.org/10.24843/MTK.2019.v08.i02.p241

ISSN: 2303-1751

PENGELOMPOKAN TINGKAT KRIMINALITAS DENGAN METODE AGGLOMERATIVE DAN K-MEANS SERTA PEUBAH PENCIRINYA

Nyoman Gde Prajnawiweka Ratmasa Taram ^1§, I Komang Gde Sukarsa², I Gusti Ayu Made Srinadi³

¹Program studi Matematika, Fakultas MIPA – Universitas Udayana [Email: prajna.wiweka@gmail.com ]

²Program studi Matematika, Fakultas MIPA – Universitas Udayana [Email: gedesukarsa@unud.ac.id]

³Program studi Matematika, Fakultas MIPA – Universitas Udayana [Email: srinadi@unud.ac.id]

^§Corresponding Author

ABSTRACT

The purpose of this research is it define the classification of crime rate based on the type of crime and its characterization variable. The data used in this research are secondary data in form of data on the number of crime rates based on the type of crime in 32 regional police in the province with 12 variables. This research is used Agglomerative and K-Means method along with Biplot Analysis. The result shows that there are three classification based upon Single Linkage as the best method which each characteristic of every classification is the crime of family abuse, crime of minor mistreatment and crime of corruption.

Keywords : Classification, Agglomerative, K-Means, Biplot Analysis, Single Linkage, Crime

1. PENDAHULUAN

Tingkat kriminal adalah skala atau gambaran profil yang dapat mengukur kriminalitas gerombol (masyarakat) di suatu daerah. Semakin tinggi angka kriminalitas menunjukkan semakin banyak tindak kejahatan pada masyarakat yang merupakan indikasi bahwa masyarakat merasa semakin tidak aman. Dalam analisis statistika, indikator-indikator tersebut dinyatakan sebagai variabel. Untuk meringkas data dengan peubah banyak, dapat digunakan analisis gerombol untuk mengelompokkan obyek-obyek pengamatan menjadi beberapa gerombol berdasarkan pengukuran peubah-peubah yang diamati.

Gerombol atau cluster dapat diartikan sebagai kelompok, pada dasarnya analisis gerombol akan menghasilkan sejumlah kelompok (gerombol). Analisis gerombol merupakan salah satu metode dalam analisis statistika peubah ganda yang digunakan untuk mengelompokkan obyek-obyek ke dalam suatu gerombol berdasarkan karakteristik yang dimiliki, sehingga obyek-obyek dalam satu kelompok memiliki ciri-ciri yang lebih homogen dibandingkan dengan obyek dalam gerombol

lain. Untuk mendapatkan gerombol yang sehomogen mungkin, maka yang digunakan sebagai dasar untuk mengelompokkan adalah kesamaan skor nilai yang dianalisis (Gudono, 2011).

Secara umum terdapat dua metode pengelompokan dalam analisis gerombol yaitu metode hierarki dan metode non-hierarki. Metode penggerombolan berhierarki dibedakan menjadi dua metode yaitu metode penggabungan (agglomerative) dan metode pemisah (divisive). Dalam metode agglomerative terdapat beberapa ukuran jarak antar gerombol, antara lain jarak minimum antar gerombol atau pautan tunggal (single linkage), jarak maksimum antar gerombol atau pautan lengkap (complete linkage) dan rata-rata dari semua jarak atau pautan rataan (average lingkage) (Everitt, 2011).

Pengelompokan menggunakan metode single linkage dengan melihat jarak antar gerombol yang ada kemudian memilih jarak yang paling dekat atau jarak minimum. Menurut Johnson dan Wichern (2007) jarak minimum antara gerombol i dengan gerombol w dan gerombol j dengan gerombol w dapat ditulis sebagai

( ) = min{ , } (1)

Pada metode complete linkage, jarak antar gerombol ditentukan oleh jarak terjauh atau jarak maksimum antara dua obyek dalam

gerombol yang berbeda. Menurut Johnson dan Wichern (2007) jarak maksimum antara

gerombol dengan gerombol dan gerombol

dengan gerombol dapat ditulis sebagai:

( ) = max{ , } (2)

dengan dan masing-masing adalah jarak terjauh antara gerombol dengan gerombol dan juga gerombol dan gerombol .

Pengelompokan dengan metode average linkage dengan menghitung jarak antara dua gerombol yang disebut sebagai jarak rata-rata antara semua anggota dalam satu gerombol dengan semua anggota gerombol lain. Jarak rata-rata antara gerombol ( ) dengan gerombol lain yaitu dapat ditulis sebagai :

^∑∑

( ) = _{( )} (3)

dengan adalah jarak obyek n (pada

gerombol dan gerombol dengan gerombol tersebut membentuk gerombol tunggal ( ), dengan obyek k pada gerombol , sedangkan ( ) dan berturut-turut merupakan jumlah

obyek dalam gerombol ( ) dan

Metode pengelompokkan non hierarki digunakan jika banyaknya kelompok yang akan dibentuk sudah diketahui sebelumnya. Metode non hierarki sering disebut sebagai metode k-means. Prosedur pada metode non hierarki dimulai dengan memilih pusat kelompok (centroid) kemudian menentukan jarak setiap objek dengan setiap centroid. Perhitungan jarak minimum antar objek dengan centroid menggunakan persamaan jarak Euclidean.

Tujuan penelitian ini adalah untuk mengetahui metode pengelompokan terbaik diantara metode single linkage, complete linkage, average linkage dan k-means serta perubah penciri dari kelompok yang dihasilkan.

Metode pengelompokan yang baik mempunyai nilai simpangan baku dalam kelompok ( ) yang minimum dan nilai simpangan baku antar kelompok ( ) yang

maksimum (Barakbah & Kohei, 2004). Menurut Bunkers, et al (1996) rumus simpangan baku dalam kelompok adalah sebagai berikut :

= ∑ (4)

dengan

: Banyaknya kelmpok yang terbentuk

: Simpangan baku kelompok ke-

Jika diberikan gerombol , dimana = 1,2,.,k dan setiap gerombol memiliki anggota , dimana = 1,2,..,n dan n adalah jumlah anggota dari setiap gerombol, dan ̅ adalah rata-rata dari gerombol maka untuk mencari nilai digunakan rumus sebagai berikut:

=√ ∑ ( - ̅ ) (5)

Jika terdapat rata-rata variabel dalam setiap _

gerombol ( ) maka komponen setiap

gerombol berbeda dan simpangan baku antar kelompok ( ) dapat dirumuskan berikut :

=[_{( )}∑ ( ̅ - ̅) ] ^/ (7)

dengan

= Banyak kerompok yang terbentuk _

= Rataan kelompok ke_

= Rataan keseluruhan kelompok

Menurut Barakbah dan Kohei (2004), pengelompokan yang baik memiliki nilai minimum dan maksimum dapat dirumuskan sebagai berikut :

= ×100% (8)

Sb

Analisis biplot merupakan dua dimensi dari suatu matriks data X yang menampilkan titik untuk masing-masing vector pengamatan n bersama dengan titik untuk masing-masing p peubah (Rencher, 2002). Dengan demikian biplot dibangun dari suatu matriks data X, dengan masing-masing baris mewakili objek penelitian dan masing-masing kolom mewakili suatu peubah. ⋯

= [⋮ ⋱ ⋮ ] (9)

^⋯

Matriks X memuat peubah-peubah yang akn diteliti sebanyak p dan objek penelitian ebanyak n.

Analisis Biplot didasarkan pada penguraian nilai singular. Suatu matriks TlXp yang dapat di uraikan menjadi :

TiXp ⁼ ′r xp (10)

Menurut Jollife (2002), terdapat dua nlai α yang digunakan untuk medefinisikan G= dan H′=L¹~^aA′, yaitu α = 0 dan α = 1. Kedua nilai α tersebut berguna dalam interpretasi biplot.

a. Parameter α = 0

Jika α = 0, maka G= dan H′=X~^aA′, ini berarti bahwa

X'X=(GH^,)’(GH^,)

=

= ′ (11)

Secara keseluruhan pemilihan α = 0, akan memberikan gambaran mengenai jarak antara kolom dan akan memberikan informasi mengenai keragaman peubah, hubungan antara peubah serta mendapatkan informasi mengenai pola objek.

b. α = 1

Jika α = 0, maka G= dan H′=L^r~^aA′, ini berarti bahwa

X’X=(GH’)(GH’)′

= ′HG′

= ′AG′

= ′ (12)

Secara keseluruhan, pemilihan α = 1, akan memberikan gambaran tentang jarak antara pasangan baris, sehingga lebih memfokuskan falam penggambaran kedekatan objek2 daripada keragaman dan hubungan peubah.

2. METODE PENELITIAN

Jenis data yang digunakan dalam penelitian ini adalah data kuantitiatif, yaitu data yang berupa angka-angka dan dapat dihitung. Data yang dikumpulkan adalah data sekunder yang diperoleh dari Badan Pusat Statistik (BPS) berupa data jumlah kriminalitas menurut jenis kejahatan pada tahun 2016 yang terdiri dari 32 Polda di provinsi. Variabel yang digunakan dalam penelitian ini merupakan faktor-faktor yang turut mempengaruhi tingkat kriminalitas

meliputi jumlah kejahatan pembunuhan (X1), jumlah kejahatan penganiayaan berat (X2), jumlah kejahatan penganiayaan ringan (X3), jumlah kejahatan KDRT (X4), jumlah kejahatan perkosaan (X5), jumlah kejahatan pencabulan (X6), jumlah kejahatan penculikan (X7), jumlah kejahatan pencurian (X8), jumlah kejahatan narkotika dan psikotropika (X9), jumlah kejahatan penipuan (X10), jumlah kejahatan penggelapan (X11), dan jumlah kejahatan korupsi (X12).

Tahapan analisis yang digunakan dalam penelitian ini adalah sebagai berikut.

1. Penyiapan data

Pada tahap penyiapan data, hal yang perlu diperhatikan adalah satuan pengukuran untuk masing-masing variabel. Bila variabel-varibael yang diperoleh memiliki satuan pengukuran yang sama maka data tidak perlu distandarisasi.

2. Melakukan analisis gerombol

Pada tahap ini meliputi :

a. Mengukur jarak kemiripan

Pada tahap ini dilakukan pengukuran kemiripan objek dari data jumlah tingkat kriminalitas menurut jenis kejahatan pada 32 Polda di provinsi menggunakan jarak Euclidean dengan menggunakan

persamaan

d_li =√∑L₁ ( - ; )(13) Semakin kecil jarak Euclidean maka semakin mirip kedua variabel.

b. Menentukan jumlah kelompok yang akan di bentuk.

Banyak kelompok yang dihasilkan akan ditentukan berdasarkan tingkat

kriminalitasnya. Menurut Mustofa (2011) tingkat kriminalitas dibagi menjadi tiga, yaitu tingkat kriminalitas rendah, tingkat kriminalitas sedang, dan tingkat kriminalitas tinggi.

c. Metode pengelompokkan yang akan digunakan.

Metode yang akan digunakan dalam penelitian ini adalah metode

Agglomerative dan metode K-Means. Dalam metode Agglomerative akan digunakan metode pautan yang terdiri dari

pautan tunggal (Single Linkage), pautan lengkap (Complete Linkage) dan pautan rataan (Average Lingkage).

3. Pemilihan metode terbaik

Pada tahap ini akan dilakukan pemilihan metode terbaik. Hasil dari tahap ini akan dilanjutkan dengan metode biplot untuk mengetahui peubah pencirinya.

4. Melakukan analisis biplot

Pada tahap ini meliputi :

a. Penentuan parameter

Sesuai dengan tujuan penelitian, maka α yang dipilih adalah α = 0, karena

pemilihan α = 0 memberikan kesesuaian optimal untuk data dan keragaman. Pada α = 0, tampilan biplot mampu

menggambarkan keragaman peubah, hubungan antar peubah serta mendapatkan informasi mengenai objek, sehingga sesuai dengan tujuan penelitian.

b. Penguraian nilai singular

Melalui penguraian nilai singular akan diperoleh:

- Vektor-vektor eigen yang memberikan informasi mengenai peubah-peubah yang digunakan.
- Nilai-nilai eigen yang berisi informasi tentang keragaman komponen-

komponen Bersama dari masing-masing vektor eigen.

- Koordinat-koordinat dimensi peragaan biplot.

c. Pembuatan plot

Pada pembuatan plot ini akan menunjukkan presentase banyaknya informasi yang bias dijelaskan oleh biplot atau nilai kelayakan analisis biplot.

5. Interpretasi Hasil.

3. HASIL DAN PEMBAHASAN
- 3.1 Data Penelitian

Data yang digunakan dalam penelitian ini adalah data sekunder yang diambil dari Badan Pusat Statistik (BPS) berupa data jumlah kriminalitas menurut jenis kejahatan pada tahun 2016. Peneliti menggunakan 32 provinsi tiap Polda sebagai objek amatan dengan jenis

kejahatan yang diamati sebanyak 12 amatan terangkum dalam lampiran 1. Satuan pengukuran yang digunakan untuk menyatakan jumlah dari setiap jenis kejahatan yang terjadi adalah sama maka tidak perlu dilakukan standarisasi data.

Jumlah kejahatan pembunuhan maksimum terjadi pada provinsi Sumatera Utara, sedangkan jumlah kejahatan pembunuhan minimum terjadi pada provinsi Papua Barat. Jumlah kejahatan pembunuhan berat maksmimum terjadi pada Provinsi Sumatera Utara sedangkan jumlah kejahatan pembunuhan berat minimum terjadi pada Provinsi Bali.

3.2 Pengukuran Jarak Euclidean

Berdasarkan data yang diperoleh, dengan menggunakan persamaan jarak Euclidean, hasil perhitungan jarak Euclidean antara Provinsi Aceh dengan Provinsi Sumatera Utara adalah 5.929,24, sedangkan jarak Euclidean Provinsi Aceh dengan Provinsi Sumatera Barat adalah 1.064,17. Hal ini menunjukkan bahwa Provinsi Aceh memiliki karakteristik yang lebih mirip dengan Provinsi Sumatera Barat karena jarak Euclidean Provinsi Aceh lebih dekat dengan Provinsi Sumatera Barat dibandingkan dengan jarak Euclidean Provinsi Aceh ke Provinsi Sumatera Barat.

Demikian pula untuk penafsiran jarak Euclidean provinsi lainnya, semakin kecil jarak kedua provinsi maka akan semakin mirip karakteristik dari kedua objek tersebut. Berdasarkan perhitungan yang diperoleh, jarak terdekat adalah 228,17 yang merupakan jarak antara Provinsi Maluku Utara (nomor urut 30) dan Provinsi Papua Barat (nomor urut 31).

3.3 Pengelompokan dengan Metode Single

Linkage

Proses penggabungan dengan metode pautan Single Linkage dengan melihat jarak antar gerombol yang ada kemudian memilih jarak minimum. Berdasarkan jarak penggabungan antara Provinsi Maluku Utara (nomor urut 30) dan Provinsi Papua Barat (nomor urut 31) maka diperoleh jarak antar gerombol (30,31) dengan gerombol lain menggunakan persamaan (2.2).

Sebagai contoh diberikan perhitungan antara gerombol (30,31) dengan gerombol 1,2 dan 3. d(3031)⁼min{^301 ^, ^3111}=

min{2.624,32,2.477,76}=2.477,76

d(3031)⁼

min{^302 , ^t^313} =min{7.983,40, 7.904,59} = 7.904,59

d(3031)⁼

min{^303 , ^c⅛14} =min{2.971,25, 2.797,79} = 2.797,76

Setelah beberapa provinsi bergabung selanjutnya dilakukan lagi perhitungan jarak sehingga terbentuk matriks jarak yang telah tereduksi. Demikian proses dilakukan sehingga seluruh provinsi membentuk tiga gerombol seperti diultrasikan dalam dendogram pada gambar 1.

Maluku Utara

Papus Barat Bangka Belitung

Maluku

Banten

Bengkulu

Nusa Tenggara Barat Kepulauan Riau Kalltriantan Barat Dl Yogyakarta Sulawesi T enggara Gorontalo

Ball

Kalimantan Tengah

Jambi

Papua Lampung

Nusa Tenggara Timur

Kalimantan Timur Sulawesi Utara Kalimantan Selatan Jawa Tengah Sumatera Barat Sulawesi Tengah Aceh

Sulawesi Selatan Sumatera Selatan Jawa Barat Jakarta

Sumatera Utara Jawa Timur

Dendrogram using Single Linkage

Gambar 1. Dendogram Single Linkage

Berdasarkan gambar 1 dibentuk tabel 1 menyajikan hasil pengelompokan provinsi berdasarkan jenis kejahatan dengan metode Single Linkage.

Tabel 1. Pengelompokan Provinsi dengan Metode Single Linkage

Kelompok	Anggota Kelompok
1	Aceh	Nusa Tenggara Barat
	Sumatera Barat	Nusa Tenggara Timur
	Riau	Kalimantan Barat
	Jambi	Kalimantan Tengah
	Sumatera Selatan	Kalimantan Selatan
	Bengkulu	Kalimantan Timur
	Lampung	Sulawesi Utara
	Bangka Belitung	Sulawesi Tengah
	Kepulauan Riau	Sulawesi Selatan
	Jakarta	Sulawesi Tenggara
	Jawa Barat	Gorontalo
	Jawa Tengah	Maluku
	DI Yogyakarta	Maluku Utara
	Banten	Papua Barat
	Bali	Papua
2	Sumatera Utara
3	Jawa Timur

Sumber : Data Sekunder (2018), diolah

3.4 Pengelompokan Dengan Metode Complete Linkage

Pada metode Complete Linkage, proses penggabungan dilakukan dengan objek yang mempunyai jarak maksimum atau jarak terjauh antar objek. Untuk membentuk gerombol pada metode ini dimulai dengan jarak Euclidean yang paling dekat antar provinsi berdasarkan lampiran 2 adalah Provinsi Maluku Utara (nomor urut 30) dan Provinsi Papua Barat (nomor urut 31) maka diperoleh jarak antar gerombol (30,31). Berikut perhitungan jarak maksimum gerombol (30,31) dengan gerombol 1,2 dan 3 sebagai contoh.

d(3031)⁼

max{^301 ^, ^3111}=

min{2.624,32,2.477,76}=2.624,32

d(3031)⁼

max{d-302, ^c^313} =min{7.983,40, 7.904,59} = 7.983,40

d(3031)⁼

max{^303 , ⅛14} =min{2.971,25, 2.797,79} = 2.971,25

Demikian seterusnya, perhitungan jarak maksimum dilakukan sehingga seluruh provinsi tergabung menjadi tiga gerombol seperti diilustrasikan di dalam gambar 2.

3.5 Pengelompokan Dengan Metode Average Linkage

Pada metode Average Linkage menghitung jarak antar objek yang disebut sebagai jarak rata-rata dimana jarak tersebut dihitung pada masing-masing gerombol. Berdasarkan persamaan (2.4) dilakukan perhitungan jarak antara gerombol (30,31) dengan gerombol lain. Diberikan contoh perhitungan antara gerombol (30,31) dengan gerombol 1,2, dan 3, yaitu.

d(3031),1

d(3031),2

d(3031),3

^(301) +d (311) 2

^(302) +d (312) 2

¹L (303) +d (313)

2

2.624,32 + 2.477,76

2

2.551,04

7^. 983 ^, 40÷7 ^. 904 ^, 59 =7.944,00

2.971,25 + 2.797,79

2

=2.884,52

Gambar 2. Dendogram Complete Linkage

Gambar 2 tampak bahwa provinsi yang tergabung dalam tiga gerombol dituliskan dalam tabel 2.

Demikian seterusnya, proses perhitungan dilakukan dengan cara yang sama sehingga semua gerombol tergabung dalam tiga gerombol seperti tampak pada gambar 3 sebagai berikut.

Tabel 2. Pengelompokan Provinsi dengan Metode Complete Linkage

Kelompok	Anggota Kelompok
1	Aceh	Nusa Tenggara Timur
	Sumatera Barat	Kalimantan Barat
	Riau	Kalimantan Tengah
	Jambi	Kalimantan Selatan
	Sumatera Selatan	Kalimantan Timur
	Bengkulu	Sulawesi Utara
	Lampung	Sulawesi Tengah
	Bangka Belitung	Sulawesi Selatan
	Kepulauan Riau	Sulawesi Tenggara
	Jawa Barat	Gorontalo
	Jawa Tengah	Maluku
	DI Yogyakarta	Maluku Utara
	Banten	Papua Barat
	Bali	Papua
	Nusa Tenggara Barat
2	Sumatera Utara Jawa Timur
3	Jakarta

Sumber : Data Sekunder (2018), diolah

Maluku Utara

Papua Barat

Bangka Belitung

Maluku

Bsnten

Bali

Kalimantan Tengah

Bengkulu

Nusa Tenggara Barat

Kepulauan Riau

Kalimantan Barat

Dl Yogyakarta

Jambi

Lampung

Sulawesi Tenggara

Gorontalo

Papua

Nusa Tenggara Timur

Kalimantan Timur

Kalimantan Selatan

Jawa Tengah

Sulawesi Utara

Sumatera Barat

Sulawesi Tengah

Sulawesi Selatan

Sumatera Selatan

Jawa Barat

Sumatera Utara

Jawa Timur

Jakarta

Gambar 3. Dendogram Average Linkage

Pada gambar 3 dapat dilihat bahwa hasil pengelompokan pada metode Average Linkage disajikan dalam tabel 3.

Tabel 3. Pengelompokan Provinsi dengan Metode Average Linkage

Kelompok	Anggota Kelompok
1	Aceh	NTT
	Sumatera Barat	Kalimantan Barat
	Riau	Kalimantan Tengah
	Jambi	Kalimantan Selatan
	Sumatera Selatan	Kalimantan Timur
	Bengkulu	Sulawesi Utara
	Lampung	Sulawesi Tengah
	Bangka Belitung	Sulawesi Selatan
	Kepulauan Riau	Sulawesi Tenggara
	Jawa Barat	Gorontalo
	Jawa Tengah	Maluku
	DI Yogyakarta	Maluku Utara
	Banten	Papua Barat
	Bali	Papua
	NTB
2	Sumatera Utara Jawa Timur
3	Jakarta

Sumber : Data Sekunder (2018), diolah

3.6 Pengelompokan Dengan Metode K-Means

Banyaknya gerombol yang ingin dibentuk dengan metode K-Means pada penelitian ini adalah tiga. Sehingga terdapat tiga buah centroid (pusat gerombol) dimana C₁ (centroid pertama), ¾ (centroid kedua), £3 (centroid ketiga) dengan bantuan SPSS, nilai centroid dapat diliat pada tampilan initial cluster center pada tabel 4.

Tabel 4. Initial Cluster Center

Initial Cluster Centers
Jenis Kejahatan	Cluster
Jenis Kejahatan	1	2	3
X1	69	49	23
X2	1.601	688	167
X3	404	496	0
X4	1.324	491	52
X5	70	56	18
X6	210	195	64
X7	67	17	2
X8	1.642	854	69
X9	5.569	7.523	27
X10	5.969	1.693	36
X11	2.432	666	16
X12	52	112	35

Sumber : Data Sekunder (2018), diolah

Sehingga diperoleh C₁ merupakan nilai dari tiap variabel untuk Provinsi Jakarta, ¾ merupakan nilai dari tiap variabel untuk Provinsi Jawa Timur, C₃ merupakan nilai dari tiap

variabel untuk Provinsi Maluku Utara dengan nilai masing-masing seperti pada tabel 5.

Perhitungan jarak setiap objek dengan C₁ , ¾ , dan £3 menggunakan persamaan Jarak Euclidean. Demikian seterusnya sehingga proses ini memperoleh nilai centroid terbaru yang sama dengan final cluster centers output dari SPSS diuraikan dalam tabel 5 sebagai berikut.

Tabel 5. Final Cluster Center

Final Cluster Centers
Jenis Kejahatan	Cluster
Jenis Kejahatan	1	2	3
X1	69	105	34
X2	1601	1824	313
X3	404	1620	595
X4	1324	246	316
X5	70	121	44
X6	210	98	111
X7	67	48	7
X8	1642	1500	751
X9	5569	6557	706
X10	5969	1881	604
X11	2432	1838	494
X12	52	84	37

Sumber : Data Sekunder (2018), data diolah

Dapat dilihat nilai ketiga centroid baru tersebut sudah tetap atau tidak mengalami perubahan, maka proses pengelompokan berhenti. Sehingga untuk kelompok yang terbentuk pada tabel 6.

Tabel 6. Pengelompokan Provinsi dengan Metode K-Means

Kelompok	Anggota Kelompok
1	Jakarta
2	Sumatera Utara	Jawa Timur
3	Aceh	NTT
	Sumatera Barat	Kalimantan Barat
	Riau	Kalimantan Tengah
	Jambi	Kalimantan Selatan
	Sumatera Selatan	Kalimantan Timur
	Bengkulu	Sulawesi Utara
	Lampung	Sulawesi Tengah
	Bangka Belitung	Sulawesi Selatan
	Kepulauan Riau	Sulawesi Tenggara
	Jawa Barat	Gorontalo
	Jawa Tengah	Maluku
	DI Yogyakarta	Maluku Utara
	Banten	Papua Barat
	Bali	Papua
	NTB

Sumber : Data Sekunder (2018), diolah

3.7 Pemilihan Metode Terbaik

Pada tahap ini akan dilakukan pemilihan metode terbaik pada metode Single Linkage,

Complete Linkage, Average Linkage, dan K-Means yang telah dijelaskan sebelumnya telah diperoleh tiga kelompok atau gerombol. Hasil perhitungan nilai rasio S_w terhadap $b pada masing-masing metode dapat dilihat pada tabel 7.

Tabel 7. Perbandingan Nilai Rasio Simpangan Baku (S)

No	Metode	Nilai Simpangan Baku (S)
1	Single Linkage	0,18
2	Complete Linkage	0,34
3	Average Linkage	0,34
4	K-Means	0,34

Sumber : Data Sekunder (2018), data diolah

3.8 Analisis Biplot

Setelah terbentuknya kelompok-kelompok provinsi, maka akan dilihat vektor jenis akan dilihat vektor jenis kejahatan mana yang memberikan sumbangan keragaman relative besar terhadap masing-masing kelompok provinsi yang selanjutnya disebut sebagai peubah penciri dari masing-masing kelompok provinsi tersebut. Untuk itu akan dilakukan pembentukan plot uda dimensi, dimana data yang digunakan merupakan data nilai rata-rata dari setiap jenis kejahatan yang dimiliki masing-masing kelompok.

Untuk memperoleh plot dua dimensi dari masing-masing kelompok provinsi dan jenis kejahatan, maka langkah awal yang perlu dilakukan adalah mencari titik koordinat dari masing-masing kelompok provinsi dan jenis kejahatan. Koordinat dari masing-masing kelompok provinsi dapat diperoleh dari matriks G, sedangkan koordinat dari masing-masing jenis kejahatan dapat diperoleh dari matriks H.

Dengan menggunakan bantuan program R, maka diperoleh matriks G yang memuat skor komponen dari dua komponen utama dari data sebagai berikut.

Tabel 9. Skor Komponen 1 dan Komponen 2

Kelompok	Skor Komponen 1	Skor Komponen 2
Kelompok 1	-0.8159858	0.02887711
Kelompok 2	0.3829846	-0.72110296
Kelompok 3	0.4330012	0.69222585

Sumber : Data Sekunder (2018), data diolah

Untuk memperoleh matriks H dilakukan dengan hal yang sama dengan menggunakan bantuan R, maka diperoleh matriks H yang memuat dua vektor eigen pertama yang merupakan titik-titik koordinat dari masing-masing jenis kejahatan disajikan pada tabel 10 sebagai berikut.

Tabel 10. Tabel Vektor Eigen 1 dan Vektor Eigen 2

Jenis Kejahatan	Vektor eigen 1	Vektor eigen 2
X1	53.804002	-81.14962
X2	1140.852913	-1647.21868
X3	785.193724	-1617.65098
X4	-72.909832	349.98699
X5	59.065752	-94.07172
X6	-9.182813	138.29711
X7	30.215811	-44.93738
X8	554.163239	-933.05773
X9	4690.051125	1201.00817
X10	886.435541	-296.70132
X11	984.700445	-1692.63612
X12	39.074529	38.23995

Sumber : Data Sekunder (2018), data diolah

Setelah diperoleh koordinat dari masing-masing kelompok provinsi dan jenis kejahatan, maka selanjutnya dibentuk plot untuk masing-masing kelompok dan jenis kejahatannya. Berikut ini adalah penggambaran biplot yang menampilkan titik untuk setiap kelompok provinsi dan jenis kejahatan.

Gambar 4. Hasil Pemetaan Biplot

Pada gambar 4 merupakan hasil pengelohan dari analisis yang memliki keragaman data atau ukuran kesesuaian biplot yang diterangkan oleh dua sumbu utama biplot yaitu sebersar 66,66%, dimana sumbu pertama (PC1) mampu menerangkan keragaman data sebesar 33,33% dan sumbu kedua (PC2) mampu menerangkan keragaman 33,33%. Hal ini menunjukkan bahwa analisis biplot hanya mampu menjelaskan informasi sebersa 66,66% dari keseluruhan data dan terdapat kehilangan informasi sebesar 33,34%.

Untuk mengetahui jenis kejahatan yang menjadi penciri dari masing-masing kelompok provinsi maka akan dilakukan proyeksi ortogonal dari masing-masing kelompok provinsi terhadap setiap vektor jenis kejahatan untuk mengetahui panjang proyeksi verktor dimana semakin besar panjang proyeksinya hal ini berarti semakin besar juga ciri yang diwakili kelompok provinsi berdasarkan peubah atau jenis kejahatan yang bersesuaian.

Tabel 11. Panjang Proyeksi Vektor

Jenis Kejahatan	Kelompok 1	Kelompok 2	Kelompok 3
X1	-0.4749777	0.8126385	-0.3376608
X2	-0.4883362	0.8108654	-0.3225292
X3	-0.3822941	0.8159578	-0.4336637
X4	0.1946849	-0.7840544	0.5893695
X5	-0.4583579	0.814355	-0.3559971
X6	0.0828754	-0.7448926	0.6620172
X7	-0.4792744	0.8121073	-0.3328329
X8	-0.4415097	0.8155673	-0.3740577
X9	-0.7833159	0.1921283	0.5911877
X10	-0.782957	0.5920621	0.1908949
X11	-0.4352816	0.8158861	-0.3806045
X12	-0.5629858	-0.2306449	0.7936308

Sumber : Data Sekunder (2018), data diolah

Berdasarkan tabel 11 dapat dilihat bahwa kelompok 1 memiliki pangjan proyeksi vektor pada jenis kejahatan X4 atau jenis kejahatan kekerasan dalam rumah tangga (KDRT), sehingga untuk peubah penciri pada kelompok 1 yaitu jenis kejahatan KDRT. Kemudian untuk peubah penciri setiap kelompok akan dirangkum dalam tabel 12.

Tabel 12. Peubah Penciri Setiap Kelompok

Kelompok	Peubah Penciri
1	Jenis Kejahatan Kekerasa Dalam Rumah Tangga (X4)
2	Jenis Kejahatan Penganiayaan Ringan (X3)
3	Jenis Kejahatan Korupsi (X12)

Sumber : Data Sekunder (2018), data diolah

4. KESIMPULAN DAN SARAN
- 4.1 Kesimpulan

Berdasarkan hasil penelitian yang dilakukan pada bab sebelumnya bahwa untuk pengelompokan tingkat kriminalitas dengan metode Agglomerative dan K-Means pada 32 provinsi dapat disimpulkan untuk metode terbaik dalam pengelompokan tingkat kriminalitas yaitu metode Single Linkage.

Terdapat tiga kelompok dalam metode Single Linkage. Kelompok pertama terdiri dari Provinsi Aceh, Sumatera Barat, Riau, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kepulauan Riau, Jakarta, Jawa Barat, Jawa, DI Yogyakarta, Banten, Bali, NTB, NTT, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Maluku, Maluku Utara, Papua Barat, dan Papua. Sedangkan untuk kelompok kedua dan ketiga yaitu Provinsi Sumatera Utara dan Provinsi Jawa Timur. Kemudian untuk peubah penciri pada ketiga kelompok tersebut yaitu kelompok pertama perubah pencirinya adalah jenis kejahatan KDRT sedangkan untuk kelompok kedua peubah pencirinya yaitu jenis kejahatan penganiayaan ringan dan untuk kelompok ketiga peubah pencirinya adalah jenis kejahatan korupsi.

4.2 Saran

Pada penelitian ini hanya mengkaji tentang empat metode pengelompokan dalam analisis gerombol yaitu Single Linkage, Complete Linkage, Average Linkage, dan metode K-Means dengan penentuan jumlah kelompok adalah tiga kelompok. Bagi peneliti yang ingin melanjutkan tentang analisis gerombol dapat menggunakan

metode-metode analisis gerombol yang lain seperti metode Ward dan Two Step Cluster sebagai perbandingan.

DAFTAR PUSTAKA

Barakbah, Ali & Arai, Kohei. 2004. Determining Constraints Of Moving Variance to Find Global Optimum and Make Automatic Clustering. Industrial Electronics Seminar, 409-413.

Bunkers WJ, et al. 1996. Definition of Climate Regions in the Northern Plains Using an Objective Cluster Modification Technique. J.Climate 9:130-146.

Everitt, Brian.S.et.al. 2011. Cluster Analisis. 5^thEdition. United Kingdom. John Wiley and Son,Ltd.

Gudono. 2011. Analisis Data Multivariat. Edisi Pertama. Yogyakarta: BPFE.

Jollife, I.T 2002. Principal Component Analysis. Springer-verlag. New York.

Johnson, R.A.&.Dean.W.Wichern. 2007. Applied Multivariate Statitical Analysis. Sixth Edition. United State of America: Pearson Education Inc.

Rencher, A.C. 2002. Methods of Multivariate Analysis Second Edition. New Yowk: John Wiley And Son,Inc.

111

PENGELOMPOKAN TINGKAT KRIMINALITAS DENGAN METODE AGGLOMERATIVE DAN K-MEANS SERTA PEUBAH PENCIRINYA

PENGELOMPOKAN TINGKAT KRIMINALITAS DENGAN METODE AGGLOMERATIVE DAN K-MEANS SERTA PEUBAH PENCIRINYA

ABSTRACT

1. PENDAHULUAN

2. METODE PENELITIAN

3.1 Data Penelitian

3.2 Pengukuran Jarak Euclidean

3.4 Pengelompokan Dengan Metode Complete Linkage

3.5 Pengelompokan Dengan Metode Average Linkage

3.6 Pengelompokan Dengan Metode K-Means

3.7 Pemilihan Metode Terbaik

4.1 Kesimpulan

4.2 Saran

DAFTAR PUSTAKA

Discussion and feedback