Jurnal Matematika Vol. 10, No.2, Desember 2020, pp. 67-77

Article DOI: 10.24843/JMAT.2020.v10.i02.p124

ISSN: 1693-1394

Data Mining Pada Faktor-Faktor Potensi Daerah di Kabupaten Sidoarjo Provinsi Jawa Timur

Trianingsih Eni Lestari

Jurusan Matematika, FMIPA – Universitas Negeri Malang e-mail: trianingsih.eni.fmipa@um.ac.id

Hendro Permadi

Jurusan Matematika, FMIPA – Universitas Negeri Malang e-mail: hendro.permadi.fmipa@um.ac.id

Sri Susilowati

Jurusan Matematika, FMIPA – Universitas Negeri Malang e-mail: shusilw@gmail.com

Abstract: Sidoarjo is one of the districts located in East Java that has developed rapidly. The remarkable progress can be achieved due to several potentials had by its people, for instance, industries, trades, small and medium businesses. Therefore, this research aims to find out the information regarding dominating factors had by the Sidoarjo using data mining. The result shows that Keboansikep, Sawotratap, Tebel, Keboananom, Gedangan, Keboguyang, Ketajen, Sidomulyo, Terik, Ponokawan, Sedengan Mijen, and Barengkrajan villages are the most potential villages in Sidoarjo. Based on the classification method, it is found that the villages of Keboansikep, Sawotratap, Tebel, Keboananom, Gedangan, and Ketajen (Gedangan District) have local potential in the form of agricultural factors such as rice and secondary crops. All residences in Keboguyang Village (Jabon District) already have an IMB. Meanwhile, the villages of Sidomulyo, Terik, Ponokawan, Sedengan Mijen, and Barengkrajan (Krian District) have high early childhood education factors such as kindergarten students, kindergarten teachers, and kindergarten schools

Keywords: Biplot Analysis, Data Mining, Local Potential

Abstrak: Kabupaten Sidoarjo merupakan salah satu kabupaten yang terletak di provinsi Jawa Timur dan merupakan daerah yang mengalami perkembangan cukup pesat. Keberhasilan ini dicapai karena berbagai potensi yang ada di wilayahnya. Artikel ini bertujuan untuk mengetahui faktor-faktor yang mendominasi potensi daerah Kabupaten Sidoarjo dengan menggunakan data mining. Hasil penelitian menunjukkan bahwa Desa Keboansikep, Sawotratap, Tebel, Keboananom, Gedangan, Keboguyang, Ketajen, Sidomulyo, Terik, Ponokawan, Sedengan Mijen dan Barengkrajan merupakan desa yang memiliki potensi daerah terbaik di Kabupaten Sidoarjo. Berdasarkan metode klasifikasi diperoleh Desa Keboansikep, Sawotratap, Tebel, Keboananom, Gedangan, dan Ketajen (Kecamatan Gedangan) memiliki potensi daerah berupa faktor pertanian yakni hasil panen padi dan palawija. Seluruh hunian di Desa Keboguyang (Kecamatan Jabon) telah memiliki IMB. Sedangkan Desa Sidomulyo, Terik, Ponokawan, Sedengan Mijen

dan Barengkrajan (Kecamatan Krian) mempunyai faktor pendidikan usia dini yang tinggi yakni murid TK, Guru TK dan Sekolah TK.

Kata Kunci: Analisis Biplot, Data Mining, Potensi Daerah

  • 1.    Pendahuluan

Pertumbuhan Big Data bertambah pesat di era modern ini. Big Data semakin populer seiring dengan semakin majunya teknologi, informasi dan komunikasi. Big Data terdiri dari himpunan data dengan jumlah besar dan tidak terstruktur sehingga sukar untuk ditangani secara manual. Big Data dapat menghasilkan informasi yang lebih cepat sehingga pengumpulan data seperti survey sudah mulai ditinggalkan (Maryanto, 2017).

Data mining merupakan proses untuk mendapatkan informasi berdasarkan himpunan data dengan jumlah besar atau Big Data yang dapat digunakan untuk mengambil sebuah keputusan (Sulianta & Juju, 2010). Data mining dapat dikatakan sebagai inovasi dalam ilmu statistika. Perkembangan data mining tidak lepas dari perkembangan teknologi (Santosa & Umam, 2018). Teknologi mempunyai peran dalam merubah pola pikir individu, sehingga dapat digunakan untuk menentukan suatu kebijakan pemerintah dalam jangka panjang. data mining memiliki beberapa fungsi yaitu klasifikasi, clustering, asosiasi, dan estimasi (Kusrini & Luthfi, 2009). Klasifikasi digunakan untuk menemukan model untuk kepentingan tertentu. Clustering digunakan untuk mengelompokkan data berdasarkan kemiripan. Tingkat akurasi pada masing-masing teknik memiliki perbedaan dari setiap model yang dihasilkan. Asosiasi digunakan untuk mengidentifikasi suatu kombinasi item yang dapat muncul secara bersamaan. Estimasi digunakan untuk mengestimasi suatu nilai yang belum diketahui. Penelitian terdahulu tentang data mining pernah dibahas oleh (Jain & Singh, 2013) yang menerapkan dalam sektor primer, sekunder dan tersier pada Produk Domestik Negara di India. Selain itu, data mining juga diterapkan pada Produk Domestik Bruto di masa yang akan datang berdasarkan pertanian, jasa dan hasil produksi (Kunda & Chihana, 2017).

Kabupaten Sidoarjo adalah salah satu daerah yang mengalami perkembangan cukup pesat di Jawa Timur. Potensi daerah seperti pariwisata, perdagangan, industri, serta usaha kecil yang dapat dikemas secara terarah menjadi faktor keberhasilan bagi Kabupaten Sidoarjo (Sungai et al., 1994). Dukungan sumber daya manusia yang memadai, menjadikan daerah yang strategis bagi pengemban perekonomian regional (Supriyati et al., 2017). Jumlah penduduk yang meningkat setiap tahun dan seimbang dengan lapangan pekerjaan membuat Kabupaten Sidoarjo menjadi daerah yang sejahtera (Kustanto & Sholihah, 2018). Perkembangan teknologi, informasi dan komunikasi telah membuat Kabupaten Sidoarjo semakin membaik. Seluruh data akan semakin meningkat setiap tahun dan membutuhkan ruang penyimpanan data yang cukup besar (Santoso, 2010). Jika

hal ini tidak diatasi maka akan kesulitan untuk mengelola Big Data. Sehingga tidak dapat diketahui faktor-faktor apa saja yang mendominasi potensi daerah di Kabupaten Sidoarjo. Dengan begitu, tujuan dari penelitian ini adalah untuk menganalisis Big Data dengan menggunakan data mining sehingga dapat membantu Pemerintah Daerah Kabupaten Sidoarjo untuk membuat suatu kebijakan lebih lanjut mengenai faktor-faktor yang mendominasi potensi daerah di Kabupaten Sidoarjo.

  • 2.    Metode Penelitian

Data yang digunakan adalah data primer dan data sekunder. Adapun data primer diperoleh dengan melakukan survei di 4 kecamatan dengan 71 desa (Kecamatan Gedangan, Kecamatan Jabon, Kecamatan Krian, dan Kecamatan Tarik) di Kabupaten Sidoarjo. Sedangkan data sekunder berasal dari Badan Pusat Statistik Kabupaten Sidoarjo berdasarkan Desa tahun 2019.

Variabel yang diamati dalam penelitian ini dikelompokkan menjadi beberapa faktor berdasarkan karakteristik yang dimiliki oleh setiap variabel antara lain:

  • 1.    Faktor Pemerintahan: jumlah dusun (X1), jumlah perangkat desa (X2), jumlah hansip (X3), jumlah RW (X4), jumlah RT (X5), jarak ke kecamatan (X6).

  • 2.    Faktor Kependudukan: jumlah kepala keluarga (X7), jumlah penduduk (X8), jumlah pendatang (X9), jumlah kepindahan (X10).

  • 3.    Faktor Jumlah Guru: guru TK (X11), guru SD (X12), guru SMP (X13), guru SMA (X14).

  • 4.    Faktor Jumlah Murid: murid TK (X15), murid SD (X16), murid SMP (X17), murid SMA (X18).

  • 5.    Faktor Fasilitas Pendidikan: TK (X19), SD (X20), SMP (X21), SMA(X22).

  • 6.    Faktor Pertanian: padi (X23), palawija (X24), buah (X25), populasi ternak (X26), populasi unggas (X27).

  • 7.    Faktor Kendaraan: mobil (X28), bus (X29), truck (X30), sepeda (X31), becak (X32), kendaraan lain (X33).

  • 8.    Faktor Pekerjaan: PNS (X34), ABRI (X35), petani (X36), buruh tani (X37), buruh swasta(X38), pedagang (X39), usaha industri (X40), usaha angkutan (X41).

  • 9.    Faktor Pemukiman dan Wilayah: non IMB (X42), IMB (X43),  hunian (X44). .

Tahap analisis data yang akan dilakukan dalam penelitian ini sebagai berikut:

  • 1.    Seleksi data.

Seleksi data dilakukan berdasarkan variabel yang akan diteliti menggunakan analisis faktor. Langkah-langkah dalam seleksi data sebagai berikut:

  • a.    Asumsi-asumsi yang harus dipenuhi adalah:

  • -    Nilai Uji Kaiser-Meyer-Olkin (KMO) > 0,5.

  • -    Nilai Measure of Sampling Adequacy > 0,5.

  • -    Nilai Uji Barlett Test of Sphericity < 0,5.

  • b.    Menentukan jumlah faktor yang dapat diekstrak.

  • c.    Menentukan jumlah faktor yang terbentuk dengan melihat nilai eigen. Faktor signifikan jika nilai eigen yang dihasilkan lebih besar dari 1.

  • d.    Menggunakan metode Varimax untuk rotasi faktor. Hal ini bertujuan agar faktor lebih mudah untuk diinterpretasikan.

  • e.    Melakukan interpretasi faktor dengan cara mengelompokkan variabel.

  • 2.    Data Mining

Proses data mining mencakup klasifikasi, clustering, asosiasi dan estimasi., dimana tahapannya dijelaskan sebagai berikut:

  • a. Klasifikasi

Tahap klasifikasi dilakukan dengan cara mengelompokkan variabel hasil dari seleksi data berdasarkan karakteristik yang dimilki untuk menemukan model atau fungsi untuk menggambarkan konsep dari suatu data dan merupakan proses yang digunakan untuk mendeskripsikan data yang penting.

b.


Clustering

Setelah mendapatkan variabel yang dominan, tahap selanjutnya adalah melakukan analisis cluster berdasarkan variabel yang dominan. Teknik analisis cluster yang digunakan adalah hierarki dengan menggunakan metode Single Linkage, Complete Linkage, Average Linkage, Centorid dan Ward’s (Johnson & Wichern, 2007). Adapun penentuan metode terbaik menggunakan kriteria RMSSTD terkecil. Semakin kecil nilai RMSSTD maka semakin tinggi kehomogenan kelompok yang terbentuk. Adapun rumus nilai RMSSTD sebagai berikut:

rmsstd- Ei1∑‰‰^

  • = √          -1)

Keterangan:

Xuv X-u ^a rb c. Asosiasi


= nilai obyek ke-v pada kelompok ke-u

= nilai pusat kelompok ke-u (centroid)

= jumlah kelompok yang terbentuk

= banyaknya obyek yang termasuk ke dalam kelompok ke-b

Tahap asosiasi dilakukan dengan analisis biplot berdasarkan variabel yang dominan dalam analisis faktor. Analisis biplot merupakan metode multivariat yang bertujuan untuk mendeskripsikan data dengan cara membuat pemetaan dalam tampilan plot. seperti yang pernah dilakukan oleh (Srinadi & Sumarjaya, 2016) yang memetakan posisi dan karakeristik usaha pariwisata di Provinsi Bali. Analisis biplot banyak diterapkan untuk melihat kedekatan antar objek berdasarkan variabel penyusunnya. Penelitian sebelumnya tentang penerapan analisis biplot antara lain pernah diterapkan pada indikator kesejahteraan di Provinsi Bali (Sukarsa & Gandhiadi, 2020).

Perhitungan dengan analisis biplot berdasarkan pada dekomposisi nilai singular (SVD) terhadap matriks data (Jolliffe, 2002). Matriks X dinyatakan sebagai SVD seperti berikut:

X = ULAb

Keterangan:

X = Matriks berukuran n x p dengan n obyek pengamatan dan p peubah.

U = Matriks berukuran n x r dengan kolom-kolomnya disebut vektor singular kolom dan matriks U merupakan matriks orthonormal.

L = Matriks berukuran r x r dengan unsur diagonal utama adalah nilai dari singular matriks X yang merupakan hasil darinilai eigen matriks X'X.

A = Matriks berukuran r x p dengan kolom-kolomnya disebut vektor eigen dari matriks X'X Kolom pada matriks A disebut vektor singular baris dan matriks A merupakan matriks orthonormal.

Langkah-langkah dalam metode ini sebagai berikut:

  • 1.    Menentukan variabel yang akan diteliti berdasarkan variabel yang dominan dalam analisis faktor.

  • 2.    Membuat matriks U, L dan A dengan menggunakan metode Singular Value Decomposition (SVD).

  • 3.    Melakukan pemetaan karakteristik berdasarkan variabel yang dominan yaitu dengan cara melakukan proyeksi orthogonal pada setiap objek terhadap semua vektor yang ada di dalam tampilan analisis biplot.

  • 4.    Uji kesesuaian keragaman data dengan syarat keragaman data ≥ 70%.

  • 5.    Interpretasi hasil analisis biplot.

  • d. Estimasi

Tahap estimasi dilakukan dengan analisis analisis korelasi berdasarkan variabel

yang dominan dalam analisis faktor. Langkah-langkah dalam metode ini adalah

sebagai berikut:

  • 1.    Analisis korelasi dengan variabel dominan yang diperoleh dari analisis faktor.

    2.

    3.

    4.

    5.


Menentukan variabel yang memiliki korelasi (r) yang tertinggi dengan varia-

bel yang lain.


Menentukan hubungan antar variabel berdasarkan kategori:

  • a.    Korelasi kuat secara negatif

    : -1,00 ≤ r ≤ -0,80

    : -0,79 ≤ r ≤ -0,50

    : -0,49 ≤ r ≤ 0,49

    : 0,50 ≤ r ≤ 0,79

    : 0,80 ≤ r ≤ 1,00


  • b.    Korelasi sedang secara negatif

  • c.    Korelasi lemah

  • d.    Korelasi sedang secara positif

Korelasi kuat secara positif

Mencari distribusi terbaik dari variabel tersebut.

  • 6.    Menghitung nilai estimasi dan interpretasi hasil

  • 3.    Hasil dan Pembahasan

    3.1    Seleksi Data

Tahapan seleksi data dilakukan untuk mengetahui variabel-variabel utama yang akan diproses ke dalam tahapan selanjutnya. Sebanyak 44 variabel akan dilakukan seleksi menggunakan analisis faktor. Hasil seleksi variabel pada Kabupaten Sidoarjo ditampilkan pada Tabel 1. Berdasarkan Tabel 1, diperoleh bahwa seluruh faktor telah memenuhi asumsi yakni nilai KMO > 0,5, nilai Barlett’s Test < 0,5 dan nilai MSA > 0,5 serta terbentuk variabel utama pada masing-masing faktor. Setelah dilakukan analisis dengan variabel-variabel utama, nilai MSA pada variabel Petani (X36) < 0,5 sehingga variabel tersebut harus dikeluarkan dari analisis. Setelah itu, uji kembali variabel yang telah memenuhi asumsi karena masing-masing nilainya harus lebih dari 0,5

Tabel 1. Hasil Uji Seleksi Big Data di Kabupaten Sidoarjo Tahun 2019

No

Faktor

KMO

Bar-lett’s

Nilai MSA

Kumulatif

Variabel Utama

1

Pemerintahan

0,634

0

Memenuhi

60%

Jumlah RT (A5)

2

Kependudukan

0,502

0

Memenuhi

79,7%

KK (A7)

3

Jumlah Guru

0,602

0

Memenuhi

72,9%

Guru TK (X11)

4

Jumlah Murid

0,511

0

Memenuhi

71%

Murid TK (X15)

5

Fasilitas Pendidikan

0,661

0

Memenuhi

81,3%

TK ‰)

6

Pertanian

0,509

0

Memenuhi

66,7%

Padi (X23)

Palawija (X24)

7

Kendaraan

0,705

0

Memenuhi

63,3%

Becak (X32)

9

Pemukiman dan Wilayah

0,562

0,001

Memenuhi

82,3%

Non IMB (X42)

Hasil lainnya adalah nilai Eigen dari variabel-variabel terbaik yang disajikan dalam Tabel 2.

Tabel 2. Nilai Eigen Variabel-variabel Terbaik

Component

Initial Eigenvalues

Total

% of Variance

Comulative (%)

1

4,167

46,302

46,302

2

1,625

18,053

64,356

3

1,301

14,451

78,807

4

0,681

7,569

86,376

5

0,599

6,656

93,032

6

0,295

3,280

96,312

7

0,189

2,104

98,416

8

0,082

0,916

99,332

9

0,060

0,668

100,000

Berdasarkan Tabel 2, terdapat 3 komponen yang memiliki nilai eigen > 1, sehingga dapat disimpulkan bahwa keragaman data dengan menggunakan 3 komponen yaitu sebesar 78,807%.

  • 3.2    Klasifikasi

Berdasarkan hasil dari seleksi data dengan menggunakan metode analisis faktor, hasil klasifikasi dari variabel terbaik berdasarkan karakteristik yang dimiliki oleh variabel-variabel tersebut adalah sebagai berikut:

  • 1.    Pendidikan Usia Dini, terdiri dari variabel Guru TK (X11), Murid TK (X15) dan

Sekolah TK (X19).

  • 2.    Sosial, terdiri dari variabel Jumlah RT (X5), Jumlah Kepala keluarga (X7), Non IMB (X42).

  • 3.    Pertanian, terdiri dari variabel Padi (X23) dan Palawija (X24).

  • 4.    Kendaraan, terdiri dari variabel Becak(X32).

  • 3.3    Clustering

Tahap clustering dilakukan dengan menggunakan metode Cluster Hierarki. Pada metode hierarki, analisis cluster dilakukan dengan metode Single Linkage, Complete Linkage, Average Linkage, Centroid dan Ward. Berdasarkan lima metode tersebut, akan dipilih satu metode yang memiliki nilai RMSSTD terkecil untuk jumlah kelompok (cluster) yang terpilih. Nilai RMSSTD dari kelima metode disajikan pada Tabel 3. Berdasarkan Tabel 3, metode terbaik yang daapat digunakan adalah metode Complete Linkage karena memiliki nilai RMSSTD terkecil yaitu 3,581

Tabel 3. Nilai RMSSTD Metode Cluster Hierarki

Kelompok

Metode

Single Linkage

Complete Linkage

Average

Linkage

Centroid

Ward

1

27,062

27,062

27,062

27,062

27,062

2

26,676

26,676

26,676

26,676

20,532

3

26,286

13,153

26,286

26,286

13,577

4

25,914

9,633

25,890

25,890

7,580

5

25,530

3,581

25,135

25,496

6,728

Setelah terpilih metode Complete Linkage yang memiliki nilai RMSSTD terkecil maka berikutnya akan disajikan hasil pengelompokan dari potensi daerah Kabupaten Sidoarjo pada Tabel 4. Hasil pengelompokan yang terbentuk menggunakan metode Complete Linkage adalah 71 desa membentuk 5 kelompok dimana ada satu kelompok yaitu kelompok 5 yang hanya terdiri dari satu desa saja Krian. Penjelasan kelompok mana yang termasuk kelompok dengan potensi daerah terbaik, maka digunakan peringkat dari masing-masing variabel. Hasil peringkat disajikan dalam Tabel 5 dibawah ini.

Tabel 4. Hasil Pengelompokan dengan Metode Complete Linkage

Kelompok

Desa

Kelompok 1

Sruni, Tarik, Kedungcangkring, Kramat Temenggung, Gempolklutuk, Singogalih, Kedinding, Gampingrowo, Balongmacekan, Miriprowo, Klantingsari, Mindugading, Sebani, Gemurung, Gamping, Kemasan, Junwangi, Semambung, Tempel, Jatikalang, Tropodo, Karangbong, Punggul, Bangah, Wedi, Kragan, Terung Wetan, Permisan, Tambak-kalisogo, Jeruk Gamping, Sidomojo, Keborahan, Pejarakan, Ganting, Kendalsewu

Kelompok 2

Keboansikep, Sawotratap, Tebel, Keboananom, Gedangan, Keboguyang, Ketajen, Sidomulyo, Terik, Ponokawan, Sedengan Mijen, Barengkrajan

Kelompok 3

Jemirahan, Panggreh, Dukuhsari, Semambung, Balongtani, Kedungpan-dan, Trompoasri, Kedungrejo, Kupang, Watugolong, Terung Kulon, Tambak Kemerak, Kraton, Katrungan

Kelompok 4

Mergobener, Mergosari, Banjarwungu, Kedungbocok, Kalimati, Sego-dobancang, Janti, Kemuning, Sidorejo

Kelompok 5

Krian

Tabel 5. Rata-rata Setiap Kelompok hasil clustering dari variabel-variabel Terbaik

Variabel

Kelompok 1

Kelompok 2

Kelompok 3

Kelompok 4

Kelompok 5

X5

20,25

34

18

22,5

40

X7

1385,88

2796,25

1836,55

1294,3

3445

X11

7,51

15,91

12,28

5,1

15

X15

88,71

172,08

119,85

47,8

221

X19

2,4

3,08

2,78

2,3

3

X23

81,16

55,8

154,28

208,5

24

X24

45,98

3,83

1,14

207,84

0

X32

9,77

20,5

13,5

9,5

178

X42

1059,57

1676,9

1251,07

1131,67

2153

Berdasarkan Tabel 5, diperoleh bahwa kelompok 2 adalah kelompok dengan potensi daerah sangat tinggi, kelompok 5 dengan potensi daerah tinggi, kelompok 4 dengan potensi daerah sedang, kelompok 1 dengan potensi daerah rendah, dan kelompok 3 dengan potensi daerah sangat rendah.

  • 3.4    Asosiasi

Pada tahap asosiasi dihasilkan analisis biplot pada Gambar 1. Hasil analisis biplot diperoleh keragaman data sebesar 77,3%. Berdasarkan Gambar 1, didapatkan hasil bahwa vektor yang paling panjang adalah variabel Jumlah Kepala Keluarga (X7). Hal ini menunjukkan bahwa jumlah kepala keluarga yang ada di 71 desa di Kabupaten Sidoarjo tahun 2019 memiliki keragaman paling besar artinya jumlah kepala keluarga yang ada di 71 desa di Kabupaten Sidoarjo tahun 2019 menyebar secara heterogen diantara variabel lainnya. Vektor yang memiliki panjang terkecil adalah variabel Sekolah TK (X19). Hal ini

menunjukkan bahwa jumlah Sekolah TK yang ada di 71 desa di Kabupaten Sidoarjo tahun 2019 memiliki keragaman paling kecil dan menyebar secara homogen

2.000-


Kedungbocok Tarik o      O

O Mergosari mergobener O

Kupang


BalongmacekaRedungcangkrjngCKeboguyang


Mindugading

•j amat Temenggung .

GempoIkIutukJemirahan


. Sedengan Mijen .

θX19 XU o Kraton

1×24 τeriPukuhsar' o BarengkrajanGedangan


Sempolklutuk Balongtani v23


oPermisan'

Kendalsewu Q


0OCiinanrt TrθpθdθΦ Krstθ∏O > ⅛,L3¾43   „   1 . 0

Barengkraan Tebe|Oedangan


Krian


000“


τ Keboan^nom etajeι¼etajen


Sidorejo


Keclincling   j=ll⅛⅛

  • - KJantingsan                       _ .

Segodofencang se∏Sfcunα□                ° β ^"H M^"1bak Kemerakan

o Sen®®bungD               τerung κulol Keboananom

Miriprowo ^    ° Gemurung ^1

^~xwuπgu OGanting Trompoasri Tempel O Singogalih(φSjcomoj0o Sidomojo   Semambung


Sanjarwungu



-2.000“


Pejarakan cKragan T erung Wetan PennisanPanggreh O

KedungbocokPejarakan Kendalsewu



  • j. 1 „    . Karangbong

jeruk Gampmg


Punggul o Bangah

Karangbong O


Sidorejo


Sawotratap


Krian


oO

Sawotratapfeboansikep


----1-------------------1-------------------1-------------------1-------------------1-------------------1—

-2.000        -1.000         .000         1.000         2.000        3.000

Gambar 1. Hasil Analisis Biplot

Hasil lainnya adalah berdasarkan sudut antar variabel. Sudut antara dua variabel didapatkan hasil bahwa sudut Murid TK (X15) dengan Guru TK (X11), Sekolah TK (X19) dan Jumlah KK (X7) kurang dari 90° artinya berkorelasi positif. Hal ini menunjukkan jika jumlah murid TK meningkat maka akan meningkatkan jumlah guru TK dan sekolah TK. Sebaliknya, sudut Jumlah KK (X7) dengan Padi (X23) dan Palawija (X24) lebih dari 90° sehingga berkorelasi negatif.

Gambar 2. Grafik Nilai Estimasi Variabel Padi dan Palawija Tahun 2021


Hasil estimasi dari variabel padi dan palawija disajikan Gambar 2. Berdasarkan Gambar 2, diperoleh bahwa pada tahun 2021 hasil panen padi dan palawija setiap desa di Kabupaten Sidoarjo mengalami kenaikan, hal ini menunjukkan bahwa semakin banyak

hasil panen padi maka semakin banyak pula hasil panen palawija yang ada di kabupaten Sidoarjo tahun 2021.

  • 4.    Kesimpulan dan Saran

Hasil data mining pada kasus Big Data terhadap potensi daerah di Kabupaten Sidoarjo tahun 2019 pada bab sebelumnya dengan menggunakan metode cluster didapatkan 5 kelompok desa. Berdasarkan hasil seluruh analisis diperoleh Desa Keboansikep, Sawotratap, Tebel, Keboananom, Gedangan, Keboguyang, Ketajen, Sidomulyo, Terik, Ponokawan, Sedengan Mijen, dan Barengkrajan merupakan desa yang memiliki potensi daerah terbaik di Kabupaten Sidoarjo.

Berdasarkan metode klasifikasi diperoleh Desa Keboansikep, Sawotratap, Tebel, Ke-boananom, Gedangan, dan Ketajen (Kecamatan Gedangan) memiliki potensi daerah berupa faktor pertanian yakni hasil panen padi dan palawija. Seluruh hunian di Desa Keboguyang (Kecamatan Jabon) telah memiliki IMB. Sedangkan Desa Sidomulyo, Terik, Ponokawan, Sedengan Mijen dan Barengkrajan (Kecamatan Krian) mempunyai faktor pendidikan usia dini yang tinggi yakni murid TK, Guru TK dan Sekolah TK.

Hasil metode menggunakan analisis biplot berdasarkan panjang vektor diperoleh variabel Kepala Keluarg (X7) memiliki keragaman paling besar atau paling heterogen dan variabel Sekolah TK (X19) paling homogen. Sedangkan berdasarkan sudut yang terbentuk Sudut Murid TK (X15) dengan Guru TK (X11), Sekolah TK (X19) dan Jumlah Kepala Keluarga (X7) kurang dari 90° artinya berkorelasi positif, jadi jika jumlah murid TK meningkat maka akan meningkatkan jumlah guru TK dan sekolah TK. Sudut Jumlah Kepala Keluarga (X7) dengan Padi (X23) dan Palawija (X24) lebih dari 90° artinya berkorelasi negatif, jadi jika jumlah kepala keluarga meningkat akan menurunkan hasil panen padi dan palawija karena tingkat konsumsi akan meningkat.

Hasil estimasi untuk tahun 2021 diperoleh bahwa hasil panen padi (X23) dan palawija (X24) setiap desa di Kabupaten Sidoarjo mengalami peningkatan artinya semakin bertambah hasil panen padi maka semakin bertambah pula hasil panen palawija di Kabupaten Sidoarjo tahun 2021.

Saran untuk penelitian berikutnya adalah data mining dapat diterapkan pada daerah yang lain untuk mengetahui faktor-faktor yang mendominasi potensi daerah sehingga bisa memberikan masukan dalam pengambilan kebijakan.

Ucapan Terima Kasih

Artikel ini merupakan bagian dari penelitian yang didanai PNBP UM tahun 2020. Terimakasih kepada Universitas Negeri Malang yang telah mendukung dan mendanai penelitian ini

Daftar Pustaka

Jain, R., & Singh, D. (2013). Data Mining and Analysis of Economic Data. International Journal of Advanced Research in Computer Science and Software Engineering, 3(August 2013), 683–688.

Johnson, R., & Wichern, D. W. (2007). Applied Multivariate Statistical Analysis. Pearson Prentice Hall.

Jolliffe, I. T. (2002). Principal Component Analysis, Second Edition. New York:

Springer.

Kunda, D., & Chihana, S. (2017). Analysis of value added services on GDP Growth rate using Data Mining Techniques. Database System Journal, 8 No 2, 29–43.

Kusrini, & Luthfi, E. (2009). Algoritma Data Mining. CV.Andi Offset.

Kustanto, M., & Sholihah, F. (2018). Data Dinamis Kabupaten Sidoarjo triwulan 1

2018. Bappeda.

Maryanto, B. (2017). Big Data dan Pemanfaatannya. Media Informatika, 16(2), 14–19.

Santosa, B., & Umam, A. (2018). Data Mining dan Big Data Analytics: Teori dan Implementasi Menggunakan Python & Apache Spark Edisi 2. Penebar Media Pustaka.

Santoso, S. (2010). Mahir Statistik Multivariat dengan SPSS. PT Gramedia.

Srinadi, I. G. A. M., & Sumarjaya, I. W. (2016). Analisis Biplot untuk Pemetaan Posisi dan Karakteristik Usaha Pariwisata di Provinsi Bali. Jurnal Matematika, 6(1), 34– 45.

Sukarsa, I. K., & Gandhiadi, G. (2020). Indikator Kesejahteraan di Provinsi Bali: Suatu

Pendekatan Analisis Biplot. 10(1), 22–31.

https://doi.org/10.24843/JMAT.2020.v10.i01.p120

Sulianta, F., & Juju, D. (2010). Data Mining: Meramalkan Bisnis Perusahaan. PT Elex Media Komputindo.

Sungai, D. A. N. M., Mansyur, A., & Tonnek, S. (1994). Prospek budi daya bandeng dalam karamba jaring apung laut dan muara sungai. 129, 79–85.

Supriyati, Meliza, & Anik. (2017). Industrialisasi Pertambakkan Kabupaten Sidoarjo Sebagai Upaya Peningkatan Kemakmuran Masyarakat. Jurnal Pengabdian LPPM Untag Surabaya, 02(03), 26–32.

77