E-Jurnal Matematika Vol. 8(2), Mei 2019, pp.102-111

DOI: https://doi.org/10.24843/MTK.2019.v08.i02.p241

ISSN: 2303-1751

PENGELOMPOKAN TINGKAT KRIMINALITAS DENGAN METODE AGGLOMERATIVE DAN K-MEANS SERTA PEUBAH PENCIRINYA

Nyoman Gde Prajnawiweka Ratmasa Taram , I Komang Gde Sukarsa2, I Gusti Ayu Made Srinadi3

1Program studi Matematika, Fakultas MIPA – Universitas Udayana [Email: [email protected]]

2Program studi Matematika, Fakultas MIPA – Universitas Udayana [Email: [email protected]]

3Program studi Matematika, Fakultas MIPA – Universitas Udayana [Email: [email protected]]

§Corresponding Author

ABSTRACT

The purpose of this research is it define the classification of crime rate based on the type of crime and its characterization variable. The data used in this research are secondary data in form of data on the number of crime rates based on the type of crime in 32 regional police in the province with 12 variables. This research is used Agglomerative and K-Means method along with Biplot Analysis. The result shows that there are three classification based upon Single Linkage as the best method which each characteristic of every classification is the crime of family abuse, crime of minor mistreatment and crime of corruption.

Keywords : Classification, Agglomerative, K-Means, Biplot Analysis, Single Linkage, Crime

  • 1.    PENDAHULUAN

Tingkat kriminal adalah skala atau gambaran profil yang dapat mengukur kriminalitas gerombol (masyarakat) di suatu daerah. Semakin tinggi angka kriminalitas menunjukkan semakin banyak tindak kejahatan pada masyarakat yang merupakan indikasi bahwa masyarakat merasa semakin tidak aman. Dalam analisis statistika, indikator-indikator tersebut dinyatakan sebagai variabel. Untuk meringkas data dengan peubah banyak, dapat digunakan analisis gerombol untuk mengelompokkan obyek-obyek pengamatan menjadi beberapa gerombol berdasarkan pengukuran peubah-peubah yang diamati.

Gerombol atau cluster dapat diartikan sebagai kelompok, pada dasarnya analisis gerombol akan menghasilkan sejumlah kelompok (gerombol). Analisis gerombol merupakan salah satu metode dalam analisis statistika peubah ganda yang digunakan untuk mengelompokkan obyek-obyek ke dalam suatu gerombol berdasarkan karakteristik yang dimiliki, sehingga obyek-obyek dalam satu kelompok memiliki ciri-ciri yang lebih homogen dibandingkan dengan obyek dalam gerombol

lain. Untuk mendapatkan gerombol yang sehomogen mungkin, maka yang digunakan sebagai dasar untuk mengelompokkan adalah kesamaan skor nilai yang dianalisis (Gudono, 2011).

Secara umum terdapat dua metode pengelompokan dalam analisis gerombol yaitu metode hierarki dan metode non-hierarki. Metode penggerombolan berhierarki dibedakan menjadi dua metode yaitu metode penggabungan (agglomerative) dan metode pemisah (divisive). Dalam metode agglomerative terdapat beberapa ukuran jarak antar gerombol, antara lain jarak minimum antar gerombol atau pautan tunggal (single linkage), jarak maksimum antar gerombol atau pautan lengkap (complete linkage) dan rata-rata dari semua jarak atau pautan rataan (average lingkage) (Everitt, 2011).

Pengelompokan menggunakan metode single linkage dengan melihat jarak antar gerombol yang ada kemudian memilih jarak yang paling dekat atau jarak minimum. Menurut Johnson dan Wichern (2007) jarak minimum antara gerombol i dengan gerombol w dan gerombol j dengan gerombol w dapat ditulis sebagai

( )  = min{    ,    }             (1)

Pada metode complete linkage, jarak antar gerombol ditentukan oleh jarak terjauh atau jarak maksimum antara dua obyek dalam

gerombol yang berbeda. Menurut Johnson dan Wichern (2007)  jarak maksimum  antara

gerombol dengan gerombol dan gerombol

dengan gerombol   dapat ditulis sebagai:

( )  = max{ ,    }        (2)

dengan dan masing-masing adalah jarak terjauh antara gerombol dengan gerombol dan juga gerombol dan gerombol .

Pengelompokan dengan metode average linkage dengan menghitung jarak antara dua gerombol yang disebut sebagai jarak rata-rata antara semua anggota dalam satu gerombol dengan semua anggota gerombol lain. Jarak rata-rata antara gerombol ( ) dengan gerombol lain yaitu dapat ditulis sebagai :

∑∑

( )   =    ( )                     (3)

dengan       adalah jarak obyek n (pada

gerombol dan gerombol dengan gerombol tersebut membentuk gerombol tunggal ( ), dengan obyek k pada gerombol , sedangkan ( ) dan     berturut-turut merupakan jumlah

obyek dalam gerombol ( ) dan

Metode pengelompokkan non hierarki digunakan jika banyaknya kelompok yang akan dibentuk sudah diketahui sebelumnya. Metode non hierarki sering disebut sebagai metode k-means. Prosedur pada metode non hierarki dimulai dengan memilih pusat kelompok (centroid) kemudian menentukan jarak setiap objek dengan setiap centroid. Perhitungan jarak minimum antar objek dengan centroid menggunakan persamaan jarak Euclidean.

Tujuan penelitian ini adalah untuk mengetahui metode pengelompokan terbaik diantara metode single linkage, complete linkage, average linkage dan k-means serta perubah penciri dari kelompok yang dihasilkan.

Metode pengelompokan yang baik mempunyai nilai simpangan baku dalam kelompok ( ) yang minimum dan nilai simpangan baku antar kelompok ( ) yang

maksimum (Barakbah & Kohei, 2004). Menurut Bunkers, et al (1996) rumus simpangan baku dalam kelompok adalah sebagai berikut :

=  ∑                (4)

dengan

: Banyaknya kelmpok yang terbentuk

: Simpangan baku kelompok ke-

Jika diberikan gerombol , dimana = 1,2,.,k dan setiap gerombol memiliki anggota , dimana = 1,2,..,n dan n adalah jumlah anggota dari setiap gerombol, dan ̅ adalah rata-rata dari gerombol maka untuk mencari nilai digunakan rumus sebagai berikut:

=√   ∑   (  - ̅ )         (5)

Jika terdapat rata-rata variabel dalam setiap _

gerombol     (  ) maka komponen setiap

gerombol berbeda dan simpangan baku antar kelompok (  ) dapat dirumuskan berikut :

=[(   )∑   ( ̅ - ̅) ] /      (7)

dengan

= Banyak kerompok yang terbentuk _

= Rataan kelompok ke_

= Rataan keseluruhan kelompok

Menurut Barakbah dan Kohei (2004), pengelompokan yang baik memiliki nilai minimum dan maksimum dapat dirumuskan sebagai berikut :

=  ×100%               (8)

Sb

Analisis biplot merupakan dua dimensi dari suatu matriks data X yang menampilkan titik untuk masing-masing vector pengamatan n bersama dengan titik untuk masing-masing p peubah (Rencher, 2002). Dengan demikian biplot dibangun dari suatu matriks data X, dengan masing-masing baris mewakili objek penelitian dan masing-masing kolom mewakili suatu peubah.

= [⋮    ⋱    ⋮ ]          (9)

Matriks X memuat peubah-peubah yang akn diteliti sebanyak p dan objek penelitian ebanyak n.

Analisis Biplot didasarkan pada penguraian nilai singular. Suatu matriks TlXp yang dapat di uraikan menjadi :

TiXp =                ′r xp        (10)

Menurut Jollife (2002), terdapat dua nlai α yang digunakan untuk medefinisikan G= dan H′=L1~aA, yaitu α = 0 dan α = 1. Kedua nilai α tersebut berguna dalam interpretasi biplot.

  • a.    Parameter α = 0

Jika α = 0, maka G= dan H′=X~aA, ini berarti bahwa

X'X=(GH,)’(GH,)

=

=

=    ′                       (11)

Secara keseluruhan pemilihan α = 0, akan memberikan gambaran mengenai jarak antara kolom dan akan memberikan informasi mengenai keragaman peubah, hubungan antara peubah serta mendapatkan informasi mengenai pola objek.

  • b.    α = 1

Jika α = 0, maka G= dan H′=Lr~aA, ini berarti bahwa

X’X=(GH’)(GH’)′

=   ′HG

=   ′AG

=   ′                       (12)

Secara keseluruhan, pemilihan α = 1, akan memberikan gambaran tentang jarak antara pasangan baris, sehingga lebih memfokuskan falam penggambaran kedekatan objek2 daripada keragaman dan hubungan peubah.

  • 2.    METODE PENELITIAN

Jenis data yang digunakan dalam penelitian ini adalah data kuantitiatif, yaitu data yang berupa angka-angka dan dapat dihitung. Data yang dikumpulkan adalah data sekunder yang diperoleh dari Badan Pusat Statistik (BPS) berupa data jumlah kriminalitas menurut jenis kejahatan pada tahun 2016 yang terdiri dari 32 Polda di provinsi. Variabel yang digunakan dalam penelitian ini merupakan faktor-faktor yang turut mempengaruhi tingkat kriminalitas

meliputi jumlah kejahatan pembunuhan (X1), jumlah kejahatan penganiayaan berat (X2), jumlah kejahatan penganiayaan ringan (X3), jumlah kejahatan KDRT (X4), jumlah kejahatan perkosaan (X5), jumlah kejahatan pencabulan (X6), jumlah kejahatan penculikan (X7), jumlah kejahatan pencurian (X8), jumlah kejahatan narkotika dan psikotropika (X9), jumlah kejahatan penipuan (X10), jumlah kejahatan penggelapan (X11), dan jumlah kejahatan korupsi (X12).

Tahapan analisis yang digunakan dalam penelitian ini adalah sebagai berikut.

  • 1.    Penyiapan data

Pada tahap penyiapan data, hal yang perlu diperhatikan adalah satuan pengukuran untuk masing-masing variabel. Bila variabel-varibael yang diperoleh memiliki satuan pengukuran yang sama maka data tidak perlu distandarisasi.

  • 2.    Melakukan analisis gerombol

Pada tahap ini meliputi :

  • a.    Mengukur jarak kemiripan

Pada tahap ini dilakukan pengukuran kemiripan objek dari data jumlah tingkat kriminalitas menurut jenis kejahatan pada 32 Polda di provinsi menggunakan jarak Euclidean    dengan    menggunakan

persamaan

dli =√∑L1 ( - ; )(13) Semakin kecil jarak Euclidean maka semakin mirip kedua variabel.

  • b.    Menentukan jumlah kelompok yang akan di bentuk.

Banyak kelompok yang dihasilkan akan ditentukan      berdasarkan      tingkat

kriminalitasnya. Menurut Mustofa (2011) tingkat kriminalitas dibagi menjadi tiga, yaitu tingkat kriminalitas rendah, tingkat kriminalitas sedang, dan tingkat kriminalitas tinggi.

  • c.    Metode pengelompokkan yang akan digunakan.

Metode yang akan digunakan dalam penelitian     ini     adalah     metode

Agglomerative dan metode K-Means. Dalam metode Agglomerative akan digunakan metode pautan yang terdiri dari

pautan tunggal (Single Linkage), pautan lengkap (Complete Linkage) dan pautan rataan (Average Lingkage).

  • 3.    Pemilihan metode terbaik

Pada tahap ini akan dilakukan pemilihan metode terbaik. Hasil dari tahap ini akan dilanjutkan dengan metode biplot untuk mengetahui peubah pencirinya.

  • 4.    Melakukan analisis biplot

Pada tahap ini meliputi :

  • a.    Penentuan parameter

Sesuai dengan tujuan penelitian, maka α yang dipilih adalah α =  0, karena

pemilihan α = 0 memberikan kesesuaian optimal untuk data dan keragaman. Pada α =   0, tampilan biplot mampu

menggambarkan keragaman peubah, hubungan antar peubah serta mendapatkan informasi mengenai objek, sehingga sesuai dengan tujuan penelitian.

  • b.    Penguraian nilai singular

Melalui penguraian nilai singular akan diperoleh:

  • -    Vektor-vektor eigen yang memberikan informasi mengenai peubah-peubah yang digunakan.

  • -    Nilai-nilai eigen yang berisi informasi tentang    keragaman    komponen-

komponen Bersama dari masing-masing vektor eigen.

  • -    Koordinat-koordinat dimensi peragaan biplot.

  • c.    Pembuatan plot

Pada pembuatan plot ini akan menunjukkan presentase banyaknya informasi yang bias dijelaskan oleh biplot atau nilai kelayakan analisis biplot.

  • 5.    Interpretasi Hasil.

  • 3.    HASIL DAN PEMBAHASAN

    • 3.1    Data Penelitian

Data yang digunakan dalam penelitian ini adalah data sekunder yang diambil dari Badan Pusat Statistik (BPS) berupa data jumlah kriminalitas menurut jenis kejahatan pada tahun 2016. Peneliti menggunakan 32 provinsi tiap Polda sebagai objek amatan dengan jenis

kejahatan yang diamati sebanyak 12 amatan terangkum dalam lampiran 1. Satuan pengukuran yang digunakan untuk menyatakan jumlah dari setiap jenis kejahatan yang terjadi adalah sama maka tidak perlu dilakukan standarisasi data.

Jumlah kejahatan pembunuhan maksimum terjadi pada provinsi Sumatera Utara, sedangkan jumlah kejahatan pembunuhan minimum terjadi pada provinsi Papua Barat. Jumlah kejahatan pembunuhan berat maksmimum terjadi pada Provinsi Sumatera Utara sedangkan jumlah kejahatan pembunuhan berat minimum terjadi pada Provinsi Bali.

  • 3.2    Pengukuran Jarak Euclidean

Berdasarkan data yang diperoleh, dengan menggunakan persamaan jarak Euclidean, hasil perhitungan jarak Euclidean antara Provinsi Aceh dengan Provinsi Sumatera Utara adalah 5.929,24, sedangkan jarak Euclidean Provinsi Aceh dengan Provinsi Sumatera Barat adalah 1.064,17. Hal ini menunjukkan bahwa Provinsi Aceh memiliki karakteristik yang lebih mirip dengan Provinsi Sumatera Barat karena jarak Euclidean Provinsi Aceh lebih dekat dengan Provinsi Sumatera Barat dibandingkan dengan jarak Euclidean Provinsi Aceh ke Provinsi Sumatera Barat.

Demikian pula untuk penafsiran jarak Euclidean provinsi lainnya, semakin kecil jarak kedua provinsi maka akan semakin mirip karakteristik dari kedua objek tersebut. Berdasarkan perhitungan yang diperoleh, jarak terdekat adalah 228,17 yang merupakan jarak antara Provinsi Maluku Utara (nomor urut 30) dan Provinsi Papua Barat (nomor urut 31).

  • 3.3    Pengelompokan dengan Metode Single

Linkage

Proses penggabungan dengan metode pautan Single Linkage dengan melihat jarak antar gerombol yang ada kemudian memilih jarak minimum. Berdasarkan jarak penggabungan antara Provinsi Maluku Utara (nomor urut 30) dan Provinsi Papua Barat (nomor urut 31) maka diperoleh jarak antar gerombol (30,31) dengan gerombol lain menggunakan persamaan (2.2).

Sebagai contoh diberikan perhitungan antara gerombol (30,31) dengan gerombol 1,2 dan 3. d(3031)= min{^301 , ^3111}=

min{2.624,32,2.477,76}=2.477,76

d(3031)=

min{^302 , t^313} =min{7.983,40, 7.904,59} = 7.904,59

d(3031)=

min{^303 , c⅛14} =min{2.971,25, 2.797,79} = 2.797,76

Setelah beberapa provinsi bergabung selanjutnya dilakukan lagi perhitungan jarak sehingga terbentuk matriks jarak yang telah tereduksi. Demikian proses dilakukan sehingga seluruh provinsi membentuk tiga gerombol seperti diultrasikan dalam dendogram pada gambar 1.

Maluku Utara

Papus Barat Bangka Belitung

Maluku

Banten

Bengkulu

Nusa Tenggara Barat Kepulauan Riau Kalltriantan Barat Dl Yogyakarta Sulawesi T enggara Gorontalo

Ball

Kalimantan Tengah

Jambi

Papua Lampung

Nusa Tenggara Timur

Kalimantan Timur Sulawesi Utara Kalimantan Selatan Jawa Tengah Sumatera Barat Sulawesi Tengah Aceh

Sulawesi Selatan Sumatera Selatan Jawa Barat Jakarta

Sumatera Utara Jawa Timur

Dendrogram using Single Linkage


Gambar 1. Dendogram Single Linkage

Berdasarkan gambar 1 dibentuk tabel 1 menyajikan hasil pengelompokan provinsi berdasarkan jenis kejahatan dengan metode Single Linkage.

Tabel 1. Pengelompokan Provinsi dengan Metode Single Linkage

Kelompok

Anggota Kelompok

1

Aceh

Nusa Tenggara Barat

Sumatera Barat

Nusa Tenggara Timur

Riau

Kalimantan Barat

Jambi

Kalimantan Tengah

Sumatera Selatan

Kalimantan Selatan

Bengkulu

Kalimantan Timur

Lampung

Sulawesi Utara

Bangka Belitung

Sulawesi Tengah

Kepulauan Riau

Sulawesi Selatan

Jakarta

Sulawesi Tenggara

Jawa Barat

Gorontalo

Jawa Tengah

Maluku

DI Yogyakarta

Maluku Utara

Banten

Papua Barat

Bali

Papua

2

Sumatera Utara

3

Jawa Timur

Sumber : Data Sekunder (2018), diolah

  • 3.4    Pengelompokan Dengan Metode Complete Linkage

Pada metode Complete Linkage, proses penggabungan dilakukan dengan objek yang mempunyai jarak maksimum atau jarak terjauh antar objek. Untuk membentuk gerombol pada metode ini dimulai dengan jarak Euclidean yang paling dekat antar provinsi berdasarkan lampiran 2 adalah Provinsi Maluku Utara (nomor urut 30) dan Provinsi Papua Barat (nomor urut 31) maka diperoleh jarak antar gerombol (30,31). Berikut perhitungan jarak maksimum gerombol (30,31) dengan gerombol 1,2 dan 3 sebagai contoh.

d(3031)=

max{^301 , ^3111}=

min{2.624,32,2.477,76}=2.624,32

d(3031)=

max{d-302, c^313} =min{7.983,40, 7.904,59} = 7.983,40

d(3031)=

max{^303 , ⅛14} =min{2.971,25, 2.797,79} = 2.971,25

Demikian seterusnya, perhitungan jarak maksimum dilakukan sehingga seluruh provinsi tergabung menjadi tiga gerombol seperti diilustrasikan di dalam gambar 2.


3.5 Pengelompokan Dengan Metode Average Linkage

Pada metode Average Linkage menghitung jarak antar objek yang disebut sebagai jarak rata-rata dimana jarak tersebut dihitung pada masing-masing gerombol. Berdasarkan persamaan (2.4) dilakukan perhitungan jarak antara gerombol (30,31) dengan gerombol lain. Diberikan contoh perhitungan antara gerombol (30,31) dengan gerombol 1,2, dan 3, yaitu.


d(3031),1


d(3031),2


d(3031),3


^(301) +d (311) 2


^(302) +d (312) 2


1L (303) +d (313)

2


2.624,32 + 2.477,76

2


2.551,04


7. 983 , 40÷7 . 904 , 59 =7.944,00


2.971,25 + 2.797,79

2


=2.884,52


Gambar 2. Dendogram Complete Linkage

Gambar 2 tampak bahwa provinsi yang tergabung dalam tiga gerombol dituliskan dalam tabel 2.


Demikian seterusnya, proses perhitungan dilakukan dengan cara yang sama sehingga semua gerombol tergabung dalam tiga gerombol seperti tampak pada gambar 3 sebagai berikut.


Tabel 2. Pengelompokan Provinsi dengan Metode Complete Linkage


Kelompok

Anggota Kelompok

1

Aceh

Nusa Tenggara Timur

Sumatera Barat

Kalimantan Barat

Riau

Kalimantan Tengah

Jambi

Kalimantan Selatan

Sumatera Selatan

Kalimantan Timur

Bengkulu

Sulawesi Utara

Lampung

Sulawesi Tengah

Bangka Belitung

Sulawesi Selatan

Kepulauan Riau

Sulawesi Tenggara

Jawa Barat

Gorontalo

Jawa Tengah

Maluku

DI Yogyakarta

Maluku Utara

Banten

Papua Barat

Bali

Papua

Nusa Tenggara Barat

2

Sumatera Utara Jawa Timur

3

Jakarta

Sumber : Data Sekunder (2018), diolah


Maluku Utara

Papua Barat

Bangka Belitung

Maluku

Bsnten

Bali

Kalimantan Tengah

Bengkulu

Nusa Tenggara Barat

Kepulauan Riau

Kalimantan Barat

Dl Yogyakarta

Jambi

Lampung

Sulawesi Tenggara

Gorontalo

Papua

Nusa Tenggara Timur

Kalimantan Timur

Kalimantan Selatan

Jawa Tengah

Sulawesi Utara

Sumatera Barat

Sulawesi Tengah

Sulawesi Selatan

Sumatera Selatan

Jawa Barat

Sumatera Utara

Jawa Timur

Jakarta



Gambar 3. Dendogram Average Linkage


Pada gambar 3 dapat dilihat bahwa hasil pengelompokan pada metode Average Linkage disajikan dalam tabel 3.


Tabel 3. Pengelompokan Provinsi dengan Metode Average Linkage

Kelompok

Anggota Kelompok

1

Aceh

NTT

Sumatera Barat

Kalimantan Barat

Riau

Kalimantan Tengah

Jambi

Kalimantan Selatan

Sumatera Selatan

Kalimantan Timur

Bengkulu

Sulawesi Utara

Lampung

Sulawesi Tengah

Bangka Belitung

Sulawesi Selatan

Kepulauan Riau

Sulawesi

Tenggara

Jawa Barat

Gorontalo

Jawa Tengah

Maluku

DI Yogyakarta

Maluku Utara

Banten

Papua Barat

Bali

Papua

NTB

2

Sumatera Utara

Jawa Timur

3

Jakarta

Sumber : Data Sekunder (2018), diolah

  • 3.6    Pengelompokan Dengan Metode K-Means

Banyaknya gerombol yang ingin dibentuk dengan metode K-Means pada penelitian ini adalah tiga. Sehingga terdapat tiga buah centroid (pusat gerombol) dimana C1 (centroid pertama), ¾ (centroid kedua), £3 (centroid ketiga) dengan bantuan SPSS, nilai centroid dapat diliat pada tampilan initial cluster center pada tabel 4.

Tabel 4. Initial Cluster Center

Initial Cluster Centers

Jenis

Kejahatan

Cluster

1

2

3

X1

69

49

23

X2

1.601

688

167

X3

404

496

0

X4

1.324

491

52

X5

70

56

18

X6

210

195

64

X7

67

17

2

X8

1.642

854

69

X9

5.569

7.523

27

X10

5.969

1.693

36

X11

2.432

666

16

X12

52

112

35

Sumber : Data Sekunder (2018), diolah

Sehingga diperoleh C1 merupakan nilai dari tiap variabel untuk Provinsi Jakarta, ¾ merupakan nilai dari tiap variabel untuk Provinsi Jawa Timur, C3 merupakan nilai dari tiap

variabel untuk Provinsi Maluku Utara dengan nilai masing-masing seperti pada tabel 5.

Perhitungan jarak setiap objek dengan C1 , ¾ , dan £3 menggunakan persamaan Jarak Euclidean. Demikian seterusnya sehingga proses ini memperoleh nilai centroid terbaru yang sama dengan final cluster centers output dari SPSS diuraikan dalam tabel 5 sebagai berikut.

Tabel 5. Final Cluster Center

Final Cluster Centers

Jenis

Kejahatan

Cluster

1

2

3

X1

69

105

34

X2

1601

1824

313

X3

404

1620

595

X4

1324

246

316

X5

70

121

44

X6

210

98

111

X7

67

48

7

X8

1642

1500

751

X9

5569

6557

706

X10

5969

1881

604

X11

2432

1838

494

X12

52

84

37

Sumber : Data Sekunder (2018), data diolah

Dapat dilihat nilai ketiga centroid baru tersebut sudah tetap atau tidak mengalami perubahan, maka proses pengelompokan berhenti. Sehingga untuk kelompok yang terbentuk pada tabel 6.

Tabel 6. Pengelompokan Provinsi dengan Metode K-Means

Kelompok

Anggota Kelompok

1

Jakarta

2

Sumatera Utara

Jawa Timur

3

Aceh

NTT

Sumatera Barat

Kalimantan Barat

Riau

Kalimantan Tengah

Jambi

Kalimantan Selatan

Sumatera Selatan

Kalimantan Timur

Bengkulu

Sulawesi Utara

Lampung

Sulawesi Tengah

Bangka Belitung

Sulawesi Selatan

Kepulauan Riau

Sulawesi Tenggara

Jawa Barat

Gorontalo

Jawa Tengah

Maluku

DI Yogyakarta

Maluku Utara

Banten

Papua Barat

Bali

Papua

NTB

Sumber : Data Sekunder (2018), diolah

  • 3.7    Pemilihan Metode Terbaik

Pada tahap ini akan dilakukan pemilihan metode terbaik pada metode Single Linkage,

Complete Linkage, Average Linkage, dan K-Means yang telah dijelaskan sebelumnya telah diperoleh tiga kelompok atau gerombol. Hasil perhitungan nilai rasio Sw terhadap $b pada masing-masing metode dapat dilihat pada tabel 7.

Tabel 7. Perbandingan Nilai Rasio Simpangan Baku (S)

No

Metode

Nilai Simpangan Baku (S)

1

Single Linkage

0,18

2

Complete Linkage

0,34

3

Average Linkage

0,34

4

K-Means

0,34

Sumber : Data Sekunder (2018), data diolah

3.8 Analisis Biplot

Setelah terbentuknya kelompok-kelompok provinsi, maka akan dilihat vektor jenis akan dilihat vektor jenis kejahatan mana yang memberikan sumbangan keragaman relative besar terhadap masing-masing kelompok provinsi yang selanjutnya disebut sebagai peubah penciri dari masing-masing kelompok provinsi tersebut. Untuk itu akan dilakukan pembentukan plot uda dimensi, dimana data yang digunakan merupakan data nilai rata-rata dari setiap jenis kejahatan yang dimiliki masing-masing kelompok.

Untuk memperoleh plot dua dimensi dari masing-masing kelompok provinsi dan jenis kejahatan, maka langkah awal yang perlu dilakukan adalah mencari titik koordinat dari masing-masing kelompok provinsi dan jenis kejahatan. Koordinat dari masing-masing kelompok provinsi dapat diperoleh dari matriks G, sedangkan koordinat dari masing-masing jenis kejahatan dapat diperoleh dari matriks H.

Dengan menggunakan bantuan program R, maka diperoleh matriks G yang memuat skor komponen dari dua komponen utama dari data sebagai berikut.

Tabel 9. Skor Komponen 1 dan Komponen 2

Kelompok

Skor

Komponen 1

Skor

Komponen 2

Kelompok 1

-0.8159858

0.02887711

Kelompok 2

0.3829846

-0.72110296

Kelompok 3

0.4330012

0.69222585

Sumber : Data Sekunder (2018), data diolah

Untuk memperoleh matriks H dilakukan dengan hal yang sama dengan menggunakan bantuan R, maka diperoleh matriks H yang memuat dua vektor eigen pertama yang merupakan titik-titik koordinat dari masing-masing jenis kejahatan disajikan pada tabel 10 sebagai berikut.

Tabel 10. Tabel Vektor Eigen 1 dan Vektor Eigen 2

Jenis

Kejahatan

Vektor eigen 1

Vektor eigen 2

X1

53.804002

-81.14962

X2

1140.852913

-1647.21868

X3

785.193724

-1617.65098

X4

-72.909832

349.98699

X5

59.065752

-94.07172

X6

-9.182813

138.29711

X7

30.215811

-44.93738

X8

554.163239

-933.05773

X9

4690.051125

1201.00817

X10

886.435541

-296.70132

X11

984.700445

-1692.63612

X12

39.074529

38.23995

Sumber : Data Sekunder (2018), data diolah

Setelah diperoleh koordinat dari masing-masing kelompok provinsi dan jenis kejahatan, maka selanjutnya dibentuk plot untuk masing-masing kelompok dan jenis kejahatannya. Berikut ini adalah penggambaran biplot yang menampilkan titik untuk setiap kelompok provinsi dan jenis kejahatan.

Gambar 4. Hasil Pemetaan Biplot

Pada gambar 4 merupakan hasil pengelohan dari analisis yang memliki keragaman data atau ukuran kesesuaian biplot yang diterangkan oleh dua sumbu utama biplot yaitu sebersar 66,66%, dimana sumbu pertama (PC1) mampu menerangkan keragaman data sebesar 33,33% dan sumbu kedua (PC2) mampu menerangkan keragaman 33,33%. Hal ini menunjukkan bahwa analisis biplot hanya mampu menjelaskan informasi sebersa 66,66% dari keseluruhan data dan terdapat kehilangan informasi sebesar 33,34%.

Untuk mengetahui jenis kejahatan yang menjadi penciri dari masing-masing kelompok provinsi maka akan dilakukan proyeksi ortogonal dari masing-masing kelompok provinsi terhadap setiap vektor jenis kejahatan untuk mengetahui panjang proyeksi verktor dimana semakin besar panjang proyeksinya hal ini berarti semakin besar juga ciri yang diwakili kelompok provinsi berdasarkan peubah atau jenis kejahatan yang bersesuaian.

Tabel 11. Panjang Proyeksi Vektor

Jenis Kejahatan

Kelompok 1

Kelompok 2

Kelompok 3

X1

-0.4749777

0.8126385

-0.3376608

X2

-0.4883362

0.8108654

-0.3225292

X3

-0.3822941

0.8159578

-0.4336637

X4

0.1946849

-0.7840544

0.5893695

X5

-0.4583579

0.814355

-0.3559971

X6

0.0828754

-0.7448926

0.6620172

X7

-0.4792744

0.8121073

-0.3328329

X8

-0.4415097

0.8155673

-0.3740577

X9

-0.7833159

0.1921283

0.5911877

X10

-0.782957

0.5920621

0.1908949

X11

-0.4352816

0.8158861

-0.3806045

X12

-0.5629858

-0.2306449

0.7936308

Sumber : Data Sekunder (2018), data diolah

Berdasarkan tabel 11 dapat dilihat bahwa kelompok 1 memiliki pangjan proyeksi vektor pada jenis kejahatan X4 atau jenis kejahatan kekerasan dalam rumah tangga (KDRT), sehingga untuk peubah penciri pada kelompok 1 yaitu jenis kejahatan KDRT. Kemudian untuk peubah penciri setiap kelompok akan dirangkum dalam tabel 12.

Tabel 12. Peubah Penciri Setiap Kelompok

Kelompok

Peubah Penciri

1

Jenis Kejahatan Kekerasa Dalam Rumah Tangga (X4)

2

Jenis Kejahatan Penganiayaan Ringan (X3)

3

Jenis Kejahatan Korupsi (X12)

Sumber : Data Sekunder (2018), data diolah

  • 4.    KESIMPULAN DAN SARAN

    • 4.1    Kesimpulan

Berdasarkan hasil penelitian yang dilakukan pada bab sebelumnya bahwa untuk pengelompokan tingkat kriminalitas dengan metode Agglomerative dan K-Means pada 32 provinsi dapat disimpulkan untuk metode terbaik dalam pengelompokan tingkat kriminalitas yaitu metode Single Linkage.

Terdapat tiga kelompok dalam metode Single Linkage. Kelompok pertama terdiri dari Provinsi Aceh, Sumatera Barat, Riau, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kepulauan Riau, Jakarta, Jawa Barat, Jawa, DI Yogyakarta, Banten, Bali, NTB, NTT, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Maluku, Maluku Utara, Papua Barat, dan Papua. Sedangkan untuk kelompok kedua dan ketiga yaitu Provinsi Sumatera Utara dan Provinsi Jawa Timur. Kemudian untuk peubah penciri pada ketiga kelompok tersebut yaitu kelompok pertama perubah pencirinya adalah jenis kejahatan KDRT sedangkan untuk kelompok kedua peubah pencirinya yaitu jenis kejahatan penganiayaan ringan dan untuk kelompok ketiga peubah pencirinya adalah jenis kejahatan korupsi.

  • 4.2    Saran

Pada penelitian ini hanya mengkaji tentang empat metode pengelompokan dalam analisis gerombol yaitu Single Linkage, Complete Linkage, Average Linkage, dan metode K-Means dengan penentuan jumlah kelompok adalah tiga kelompok. Bagi peneliti yang ingin melanjutkan tentang analisis gerombol dapat menggunakan

metode-metode analisis gerombol yang lain seperti metode Ward dan Two Step Cluster sebagai perbandingan.

DAFTAR PUSTAKA

Barakbah, Ali & Arai, Kohei. 2004. Determining Constraints Of Moving Variance to Find Global Optimum and Make Automatic Clustering. Industrial Electronics Seminar, 409-413.

Bunkers WJ, et al. 1996. Definition of Climate Regions in the Northern Plains Using an Objective Cluster Modification Technique. J.Climate 9:130-146.

Everitt, Brian.S.et.al. 2011. Cluster Analisis. 5th Edition. United Kingdom. John Wiley and Son,Ltd.

Gudono. 2011. Analisis Data Multivariat. Edisi Pertama. Yogyakarta: BPFE.

Jollife, I.T 2002. Principal Component Analysis. Springer-verlag. New York.

Johnson, R.A.&.Dean.W.Wichern. 2007. Applied Multivariate Statitical Analysis. Sixth Edition. United State of America: Pearson Education Inc.

Rencher, A.C. 2002. Methods of Multivariate Analysis Second Edition. New Yowk: John Wiley And Son,Inc.

111