PREDIKSI KUNJUNGAN WISATAWAN DENGAN RECURRENT NEURAL NETWORK EXTENDED KALMAN FILTER
on
Jurnal Ilmiah
ILMU KOMPUTER
Universitas Udayana
Vol. X, No. 1, April 2017
ISSN 1979 - 5661
PREDIKSI KUNJUNGAN WISATAWAN DENGAN
RECURRENT NEURAL NETWORK EXTENDED KALMAN FILTER
Ahmad Ashril Rizal1, Sri Hartati2
1Program Studi Informatika, STMIK Bumigora Mataram 2Jurusan Ilmu Komputer dan Elektronika, FMIPA UGM, Yogyakarta e-mail: 1ashril.rizal@stmikbumigora.ac.id, 2shartati@ugm.ac.id
ABSTRAK
Prediksi adalah salah satu unsur yang sangat penting dalam pengambilan keputusan, sebab efektif atau tidaknya suatu keputusan umumnya tergantung dari beberapa faktor yang tidak dapat kita lihat pada waktu keputusan diambil yang didasarkan pada data yang ada pada waktu sekarang dan waktu lampau. Dalam melakukan prediksi terdapat dua pendekatan yang digunakan. Pendekatan pertama disebut dengan time-series yaitu model yang tidak memperlihatkan kecenderungan dari data masa lalu yang tersedia, sedangkan pendekatan yang kedua adalah pendekatan yang memperlihatkan hubungan sebab akibat (cause-effects method) atau pendekatan yang menjelaskan terjadinya suatu keadaan (eksplanatory method) oleh sebab-sebab tertentu. Permasalahan yang muncul kemudian adalah bagaimana melakukan prediksi. Pada awalnya untuk melakukan prediksi digunakan metode peramalan seperti Autoregressive Integrated Moving Average (Arima). Metode ini memiliki keterbatasan pada pengabaian kemungkinan hubungan non-linear serta stationeritas data dan homokedastitas residual. Metode peramalan data dengan time-series telah berkembang dengan pendekatan Neural Network. Penelitian ini mengkaji data time-series pada kunjungan wisatawan di pulau Lombok menggunakan pendekatan Recurrent Neural Network (RNN). Prediksi time series dengan RNN memberikan akurasi prediksi terbaik pada saat training sebesar 64.37% dan hasil prediksi terbaik pada saat testing sebesar 62.91%.
Kata Kunci — Recurrent Neural Network, Prediksi, Time Series
ABSTRACT
Prediction is one very important element in decision-making, because the effectiveness of a decision usually depends on several factors that we can not see at the time the decision was taken based on the existing data on the present and the past. Predictions can be done with two approaches. The first approach is a time-series approach. Time series model does not show the tendency of past data available. The second approach is the approach of showing a causal relationship (cause-effects method) or approaches that explain the occurrence of a situation (an explanatory method) by specific causes. The problem is how to make predictions model. In the beginning, to make predictions used forecasting methods such as Autoregressive Integrated Moving Average (Arima). This method has limitations on waiver possibility of non linear relationship, stationeritas data and residual homokedastitas. Forecasting methods of data with time-series has evolved with Neural Network approach. This research reviewing the time-series data on tourist arrivals on Lombok using Recurrent Neural Network (RNN) approach. Prediction time series by RNN able to provide a prediction accuracy of 64.37% for training and 62.91% for testing.
Keyword — Recurrent Neural Network, Prediction, Time Series
Peranan pariwisata dalam pembangunan ekonomi tidak perlu dipertanyakan lagi. Dengan tidak tersedianya sumber daya alam seperti migas, hasil hutan ataupun industri manufaktur yang berskala besar di provinsi Nusa Tenggara Barat, pada pulau Lombok khususnya, maka pariwisata telah menjadi sektor andalan dalam pembangunan. Kontribusi sektor pariwisata menunjukkan trend yang semakin meningkat dari tahun ke tahun. Penukaran valuta asing dan pengeluaran Wisatawan di daerah pariwisata menjadi implikasi yang baik terhadap pendapatan masyarakat.
Pengaruh jumlah Wisatawan mancanegara dan lama tinggal secara parsial berpengaruh positif terhadap penerimaan Produk Domestik Regional Bruto Industri pariwisata di kota Badung, Bali (Wijaya, 2011). Selain itu industri pariwisata juga menyumbang peran terhadap pendapatan masyarakat. Di pulau Bali, jika ditinjau dari kesempatan kerja maka hampir seluruh kesempatan kerja yang ada di Bali dikontribusikan oleh pariwisata. Hal ini bisa saja terjadi karena kesempatan kerja yang ditimbulkan oleh pengeluaran Wisatawan dan akibat investasi di sektor pariwisata. Dampak positif pengeluaran Wisatawan terhadap perekonomian terdistribusikan ke berbagai sektor, bukan saja hotel dan restoran. Distribusi tersebut juga terserap ke sektor pertanian, sektor industri dan kerajinan, sektor pengangkutan dan komunikasi, sektor jasa dan sebagainya. Hal ini sejalan dengan data mengenai distribusi pengeluaran Wisatawan. Data menunjukan bahwa selama berkunjung, pengeluran Wisatawan yang terserap ke dalam perekonomian rakyat cukup tinggi (Putra, 2011). Dari beberapa penelitian terkait dapat digeneralisasi bahwa peran Wisatawan memiliki pengaruh positif terhadap perekonomian di Indonesia.
Pemerintah Daerah mempersiapkan wisata daerah secara optimal hanya pada event tertentu. Sementara itu kunjungan Wisatawan tidak hanya akan terpusat saat terdapat event tertentu. Begitu juga dengan pelaku pariwisata, misalnya dari hotel,
penyedia jasa wisata atau akomodasi. Jika kunjungan wisatawan dapat diprediksi maka pelaku pariwisata dapat lebih mempersiapkan diri dengan optimal.
Prediksi adalah salah satu unsur yang sangat penting dalam pengambilan keputusan, sebab efektif atau tidaknya suatu keputusan umumnya tergantung dari beberapa faktor yang tidak dapat kita lihat pada waktu keputusan diambil yang didasarkan pada data yang ada pada waktu sekarang dan waktu lampau (Setyaningsih, 2010).
Dalam melakukan prediksi terdapat dua pendekatan yang digunakan. Pendekatan pertama disebut dengan timeseries yaitu model yang tidak memperlihatkan kecenderungan dari data masa lalu yang tersedia, sedangkan pendekatan yang kedua adalah pendekatan yang memperlihatkan hubungan sebab akibat (cause-effects method) atau pendekatan yang menjelaskan terjadinya suatu keadaan (eksplanatory method) oleh sebab-sebab tertentu. Permasalahan yang muncul kemudian adalah bagaimana melakukan prediksi. Pada awalnya untuk melakukan prediksi digunakan metode peramalan seperti Autoregressive Integrated Moving Average Model (Arima). Metode ini memiliki keterbatasan pada pengabaian kemungkinan hubungan non linear serta stationeritas data dan homokedastitas residual (Adnyani,2012). Kini metode peramalan data dengan timeseries telah berkembang dengan pendekatan Neural Network. Model Arima dan Neural Network memiliki perbedaan yaitu Arima baik digunakan untuk meramal data time series yang linear sementara Neural Network baik digunakan untuk data linear maupun non linear (Munarsih, 2012).
Penelitian sebelumnya terkait prediksi kunjungan wisatawan menggunakan pendekatan Arima, Sarima, Jaringan Saraf Tiruan dengan Algoritma Genetika. Penelitian ini mencoba melakukan peramalan dengan mengkaji data timeseries pada kunjungan Wisatawan di pulau Lombok dengan menggunakan pendekatan Recurrent Neural Network (RNN) dengan algoritma training Extended Kalman Filter (EKF). Di antara beberapa algoritma
training untuk RNN seperti RTRL, BPTT dan EKF, EKF secara signifikan lebih cepat menuju konvergensi dari total nilai epoch (Terbaticky, 2005).
-
2. RUMUSAN MASALAH
Berdasarkan paparan pada pendahuluan, rumusan masalah dalam penelitian ini adalah bagaimanakah model prediksi kunjungan Wisatawan di pulau Lombok dengan menerapkan Recurrent Neural Network dengan algoritma training Extended Kalman Filter.
-
3. KAJIAN PUSTAKA
Dalam penelitian ini, digunakan beberapa referensi sumber pustaka yang berasal dari penelitian yang sudah dilakukan sebelumnya. Adapun beberapa penelitian mengenai prediksi menggunakan pendekatan neural network akan dibahas pada bab ini.
Prediksi data time-series dilakukan oleh Munarsih (2011) mengenai model hybrid Arima dengan Neural Network untuk memprediksi data time-series. Model Arima baik digunakan untuk prediksi data time-series yang mengandung komponen linear. Hasil penelitian menunjukkan bahwa JST dapat digunakan untuk prediksi data time-series dengan komponen non linear. Model hybrid dari Arima-NN memiliki tingkat akurasi prediksi yang lebih akurat dibandingkan dengan model Arima tradisional. Sementara itu Rumagit (2011) melakukan melakukan pengujian sistem terhadap implementasi metode Arima dan Artificial Neural Network (ANN) serta penggabungan Arima dan ANN. Data yang tidak stationer akan didifferencingkan terlebih dahulu dengan menggunakn ACF (Autocorelation Function) dan PACF (Partial Autocorelation Function). Dari hasil penelitian dinyatakan bahwa perhitungan error MSE dan MAPE dengan menggunakan ANN adalah yang paling besar. Nilai
MSE dan MAPE saat menggunakan penggabungan Arima dan ANN menunjukkan hasil yang beragam dari tiap inputan. Di tahun berikutnya, Adnyani (2012) melakukan penelitian dengan metode General Regression Neural Network (GRNN) untuk memprediksi IHSG. Dari hasil penelitian menghasilkan MSE untuk insample dan outsample prediksi IHSG berturut-turut adalah 0.0136 dan 0.0135. GRNN menghasilkan nilai MSE prediksi yang lebih kecil dari Arima. Keunggulan dari GRNN adalah lebih cepat dalam proses perhitungan dan tidak memerlukan adanya asumsi data.
Prediksi lainnya yang menerapakan RNN dilakukan oleh Susanti dkk. (2011) mengenai peramalan harga saham menggunakan RNN dengan Algoritma Backpropagation Through Time (BPTT). Peramalan harga saham secara time-series dari hasil uji coba yang dilakukan mengenai peramalan harga saham menggunakan RNN-BPTT menghasilkan nilai error yang berbeda-beda. Dengan menerapkan metode Elman Recurrent Neural Network (ERNN) dan Principal Component Analysis (PCA) Rahmawati (2013) melakukan peramalan komsumsi listrik. PCA untuk setiap jenis peramalan sudah dapat diketahui faktor-faktor dominan yang memengaruhi konsumsi listrik dan pemodelan Arima Box Jenkins sudah dapat digunakan untuk menentukan laglag input. Hasil pelatihan dengan jaringan dengan menggunakan ERNN untuk setiap jenis peramalan memiliki parameter yang berbeda. Hasil pengujian forecasting insample untuk periode peramalan 5 tahun diperoleh nilai rata-rata dari MAPE untuk peramalan konsumsi total 1 sebesar 0.33%, konsumsi total 2 sebesar 0.64%, rumah tangga 1.21%, industri 2.62%, bisnis 3.25%, sosial 0.77% dan publik 0.49%.
Prediksi dengan menerapkan RNN dilakukan oleh Perez-Ortiz (2001). Fokus penelitian ini adalah prediksi secara online, tugas yang dikerjakan jauh lebih sulit daripada inferensi gramatikal dengan jaringan saraf secara offline. Analisis pekerjaan ini penggunaan discrete-time RNN dan kemampuan RNN untuk memprediksi simbol berikutnya secara berurutan. Barbounis (2007) melakukan prediksi kecepatan angin dengan menggunakan informasi spasial dari stasiun pengukuran jarak jauh. Metode yang digunakan adalah Local Recurrent Neural Network. Untuk meningkatkan ketepatan prediksi, digunakan algoritma pembelajaran online berdasarkan Recursive Prediction Error (RPE). Skema RPE dikembangkan dengan semua bobot diperbaharui secara bersamaan. Hasil simulasi ekstensif menunjukkan bahwa model ini menunjukkan hasil prediksi yang lebih baik dibandingkan dengan jenis jaringan lain yang disarankan dalam literatur pada penelitian tersebut.
Penerapan Neural Network dengan Extended Kalman Filter telah dilakukan oleh Zhang, et.al (2007) untuk meneliti Market Clearing Price (MCP) Prediction dengan menerapkan Multi Layer Perceptron dengan pelatihan bobot menggunakan EKF. Karena prediksi MCP adalah masalah dengan proses non-stationer maka digunakan EKF sebagai pembelajaran adaptif dengan metode estimasi convidence interval. Penelitian yang menerapkan NN-EKF dilakukan juga oleh Adnan, et.al (2013) dalam memprediksi banjir dengan menggunakan ANN dengan EKF. Penelitian ini menekankan pada ANN untuk mendapatkan model yang paling baik dalam akurasi prediksi banjir. Setelah itu di tahun berikutnya Chernodub (2014) melakukan klasifikasi dengan menggunakan
Feedforward Neural Network dengan EKF. Hasil penelitian memberikan hasil perbandingan dengan klasifikasi menggunakan gradient descent. EKF memberikan hasil yang lebih baik dalam melakukan klasifikasi.
Penelitian mengenai prediksi kunjungan Wisatawan sebelumnya dilakukan oleh Setyaningsih (2011) mengenai prediksi kunjungan Wisatawan Mancanegara di Museum Kota Yogyakarta dengan menerapkan Arima, Algoritma Genetika (AG) dan Neural Network (NN). Data tersebut merupakan data time-series yang tidak stasioner sehingga prediksi dengan menggunakan Arima tidak dapat langsung dilakukan, oleh sebab itu harus dilakukan differencing terlebih dahulu. Sementara itu pembentukan kromosom pada model AG menggunakan model Arima ditujukan untuk mendapatkan parameter model yang diambil dari koefesien-koefisien Arima. Pengujian peramalan pada model NN tidak perlu melakukan pengenalan pola data seperti pada Arima. Di tahun berikutnya Lestari (2012) melakukan penelitian peramalan jumlah kunjungan Wisatawan yang masuk ke dalam suatu daerah di Kusuma Agrowisata Batu Malang. Metode yang digunakan dalam penelitian ini adalah metode Box Jenkins dengan pendekatan model Sarima sebagai pengembangan dari model Arima. Langkah pertama yang dilakukan adalah melihat kestasioneran data. Selanjutnya identifikasi model dari perhitungan ACF dan PACF. Dari perhitungan ACF dan PACF bisa dibentuk model Arima sementara, kemudian estimasi parameter model dan langkah yang terakhir adalah pemeriksaan diagnostik dengan melihat hasil residual dan normalitas.
Penelitian ini mencoba untuk melakukan prediksi kunjungan wisatawan mancanegara di pulau
dengan pendekatan RNN yang dilatih dengan EKF. Sebagai validasi, dilakukan perbandingan hasil prediksi dengan pendekatan Arima dan Artificial Neural Network.
Sistem yang dibuat untuk memprediksi jumlah kunjungan Wisatawan dengan menggunakan Recurrent Neural Network. Proses prediksi kunjungan Wisatawan diawali dengan tahap penentuan data input yang digunakan untuk prediksi. Variabel dependent yang digunakan adalah jumlah kunjungan Wisatawan perbulan dari Januari 2009 hingga Desember 2014.
Sementara itu variabel independent untuk prediksi adalah kurs jual Rupiah terhadap Dollar, ketersediaan akses internet, ketersediaan penginapan atau hotel, tarif penginapan atau hotel, tarif masuk ke lokasi wisata, ketersediaan akomodasi dan tarif akomodasi. Data input tersebut diberikan proses pembelajaran pada jaringan Recurrent Neural Network dengan algoritma pelatihan Extended Kalman Filter untuk melakukan prediksi. Hasil training akan diuji dengan data testing untuk menentukan validasi hasil prediksi.
Variabel data masukan berupa data yang memengaruhi kunjungan Wisatawan. a. Kurs jual Rupiah terhadap Dollar
Kurs jual merupakan kurs yang digunakan jika bank atau money changer menjual valuta asing atau digunakan jika menukarkan Rupiah dengan valuta asing yang dibutuhkan. Kurs yang digunakan dalam penelitian ini adalah kurs jual Rupiah terhadap Dollar US. Data Kurs jual Rupiah terhadap Dollar dapat diunduh di laman resmi Bank Indonesia di http://www.bi.go.id/id/moneter/ informasi-kurs/transaksi-bi/Default.aspx b. Ketersediaan Penginapan atau Hotel
Ketersediaan penginapan atau hotel adalah jumlah penyedia hotel atau penginapan di pulau Lombok. Data penginapan atau hotel diperoleh dari Dinas Kebudayaan dan Pariwisata Provinsi Nusa Tenggara Barat.
-
c. Ketersediaan Akomodasi
Ketersediaan akomodasi adalah jumlah jasa angkutan yang disediakan Dinas Perhubungan untuk akomodasi di pulau Lombok. Data ketersediaan akomodasi diperoleh dari Badan Pusat Statistik provinsi NTB.
-
d. Ketersediaan Akses Internet
Ketersediaan akses internet merupakan jasa yang disediakan oleh pemerintah provinsi NTB dalam memberikan layanan informasi dan telekomunikasi di pulau Lombok. Data yang merupakan rekapitulasi data informasi pos dan telekomunikasi se-NTB tahun 2014. Data diperoleh dari Dinas Perhubungan Komunikasi dan Informatika provinsi NTB.
Pada rancangan sistem pada Recurrent Neural Network dilakukan beberapa tahapan yaitu perancangan arsitektur, menentukan inisialisasi bobot awal, inisialisasi parameter, vektor input, vektor output dan penetapan target jaringan. Arsitektur RNN-EKF merupakan algoritma pembelajaran terawasi. Bobot dalam RNN dilatih dengan menggunakan algoritma Extended Kalman Filter untuk meminimalkan error dari keluaran yang diharapkan.
-
4.2.1 Arsitektur Recurrent Neural Network
Recurrent Neural Network merupakan jaringan saraf berulang. Dikatakan jaringan saraf berulang karena nilai neuron pada hidden layer sebelumnya akan digunakan kembali sebagai data input. Penggunaan neuron pada hidden layer akan disimpan ke dalam sebuah layer yang dinamakan context layer. Nilai neuron pada context layer akan terus update hingga kondisi RNN terpenuhi.
Gambar 1 menunjukkan arsitektur RNN yang digunakan. Jumlah neuron dalam input layer adalah lima buah neuron
dan sebuah neuron bias. Penambahan bias pada neuron di input layer dan hidden layer diberikan untuk membantu proses pembelajaran. Pada dasarnya penambahan bias akan menambah beban perhitungan namun bisa membantu pergerakan neuron pada ambang fungsi aktivasi yang digunakan.

Gambar 1. Arsitektur RNN
Dalam tulisan ini jumlah neuron pada hidden layer dan context layer yang digunakan adalah sama yaitu sejumlah k neuron. Jumlah neuron yang sama pada hidden layer dengan context layer mengikuti arsitektur yang menerapkan Elman Recurrent Neural Network.
-
4.2.2 Rancangan Extended Kalman
Filter
EKF memiliki dua tahapan yaitu time update dan measurement update. Time update merupakan tahapan untuk memproyeksikan state saat ini dan residual estimasi untuk menghasilkan estimasi bobot pada langkah selanjutnya. Sementara itu measurement update menghasilkan estimasi bobot yang akan digunakan pada iterasi berikutnya. Gambar 2 merupakan arsitektur dari RNN pada sistem.

Gambar 2 Arsitektur RNN-EKF
Data training adalah data yang digunakan selama proses training dalam sistem RNN-EKF. Dari total dataset yang ada, persentase data training adalah 70% dari total data tersebut. Data training yang masuk ke dalam jaringan sebanyak 300 titik data. Tiap neuron dalam input layer mewakili vektor input yang melibatkan 60 data training.
-
4.3.2 Preprocessing
Preprocessing dalam penelitian meliputi normalisasi data training. Sebelum diproses data-data input tersebut akan dinormalisasi. Normalisasi data dilakukan agar keluaran jaringan sesuai dengan fungsi aktivasi yang digunakan. Data-data tersebut dinormalisasi ke dalam interval [-1,1]. Interval tersebut merupakan batas nilai untuk fungsi aktivasi hyprbolic tangent. Proses Normalisasi ditunjukkan pada persamaan 4.1
-
n. = !(Cl-^ - 1 (4.1)
-
xmax Xmin
Keterangan:
ni = Data hasil normalisasi
-
xi = Data ke-i
xmin = Data dengan nilai minimum
xmax = Data dengan nilai maksimum
Dalam arsitektur RNN yang digunakan terdapat tiga jenis bobot yang digunakan. Nilai dari bobot awal dari RNN yang dibangun adalah nilai random dari pada interval [0,10].
Adapun bobot-bobot dalam RNN yang digunakan adalah bobot dari input layer ke hidden layer (wih), bobot dari hidden layer ke output layer (who) dan bobot dari context layer ke hidden layer yang diinisialisasi dengan wch. Jumlah node c sama dengan node h karena dalam arsitektur yang digunakan jumlah neuron pada hidden layer sama dengan jumlah neuron pada context layer.
Parameter pembelajaran dalam RNN pada adalah nilai learning rate, epoch dan fungsi aktivasi. Besarnya nilai learning rate
yang digunakan adalah 0.2, 0.3 dan 0.5 dengan maksimum epoch 5000. Pemilihan besar learning rate diharapan mampu membuat proses pembelajaran yang dikerjakan sistem bisa berjalan lebih baik.
Fungsi aktivasi yang digunakan dalam RNN ini adalah fungsi aktivasi linear dan fungsi aktivasi hyperbolic tangent. Pada input layer digunakan fungsi aktivasi linear. Sementara itu pada hidden layer dan output layer diterapkan fungsi aktivasi hyperbolic tangent. Fungsi aktivasi linear dan hyperbolic tangent dilakukan dengan menerapkan persamaan 4.2 dan 4.3.
f(x) = x (4.2)
x-p-x
w = e^ (4.3)
f(x) = Fungsi aktivasi linear
h(x) = Fungsi aktivasi hyperbolic tangent x = Data
e = Fungsi eksponensial
Fungsi hyperbolic tangent dalam beberapa penelitian dinyatakan sebagai fungsi aktivasi yang paling baik digunakan pada RNN.
Proses training RNN dengan EKF ditujukan pada flowchart dalam Gambar 3. Proses training meliputi beberapa tahapan, mulai dari tahap load data training, normaliasasi, inisialisasi input dan output, perhitungan forward pass, update bobot dengan Extended Kalman Filter,
perhitungan mean square error,
denormalisasi data, hingga perhitungan akurasi hasil prediksi.
Proses training akan dihentikan ketika nilai mean square error memenuhi target atau iterasi maksimal yang telah ditetapkan terpenuhi.
Tahapan training dengan RNN-EKF selengkapnya adalah sebagai berikut:
-
(1) Load data training
-
(2) Menginisialisasi data training ke dalam sebuah variabel matriks
-
(3) Normalisasi Matriks Data Training (4) Inisialisasi matriks input dari data training yang telah dinormalisasi
-
(5) Inisialisasi matriks Output dari data training yang telah dinormalisasi
-
(6) Inisialisasi Neuron pada Hidden Layer
-
(7) Inisialisasi Neuron pada Context Layer
-
(8) Inisialisasi bobot awal
-
(9) Inisialisasi nilai Learning Rate
-
(10) Inisialisasi nilai Epoch
-
(11) Melakukan perhitungan forward pass
-
(12) Hitung Mean Square Error (MSE)
-
(13) Stop Kriteria
Proses ini dutujukan untuk melakukan iterasi hingga hasil prediksi yang diharapkan bisa lebih baik. Parameter dalam proses iterasi ini adalah MSE dan Epoch.
Proses iterasi akan dihentikan hingga MSE yang diharapkan terpenuhi atau maksimum epoch terpenuhi.
-
(14) Simpan nilai bobot final dalam sistem RNN

Gambar 3. Flowchart Proses Training RNN-EKF
Extended Kalman Filter adalah estimasi bobot berikutnya atau koreksi bobot dari sistem RNN. Proses EKF ditunjukkan dalam Gambar 4.4.
EKF melakukan estimasi dengan dua tahapan yaitu time update dan measurement update. EKF adalah perluasan dari Kalman Filter yang merupakan algoritma yang digunakan untuk mengestimasi variabel keadaan dari suatu sistem dinamik stokastik
non linear. EKF mengestimasi w dengan cara melinearkan proses atau pengukuran dengan menggunakan deret Taylor di sekitar mean dan kovarian. Estimasi keadaan untuk sistem non-linear diperoleh dengan proses linearizing menggunakan Kalman Filter.

Gambar 4. Proses Update Bobot RNN dengan EKF
Setelah proses training pada data training selesai, maka sistem akan menyimpan bobot dan nilai context layer pada sistem RNN. Bobot akhir dari proses training yang dihasilkan akan diterapkan sebagai sebuah sistem RNN untuk melakukan prediksi. Sebagai pengujian dari akurasi hasil prediksi, dilakukan proses testing. Proses testing merupakan pengujian dengan menguji 30% dari dataset untuk diterapkan dalam sistem RNN.
Sebelum menghitung akurasi hasil prediksi, terlebih dahulu dilakukan proses Denormaliasi hasil output dari RNN. denomalisasi dilakukan untuk mendapatkan nilai real dari hasil prediksi yang diberikan. Sementara itu akurasi dihitung dengan melihat persen akurasi dari hasil prediksi. Proses Denormalisasi dihitung dengan persamaan 4.4
y = (y+1)* ⅛⅛^ Xm.n (4.4)
xmin = Nilai Minimum dari data awal yang diinputkan pada saat training
y = Output hasil prediksi dengan RNN-EKF
Y = Output hasil denormalisasi
Sementara itu hasil akurasi prediksi dihitung dengan melihat persen akurasi. Persamaan perhitungan persentase hasil prediksi ditunjukkan pada persamaan 4.5.
^ N ∖^reaJ-∖^reaJ-^ akurasi = -------^21---- (4.5)
N
.
Satuan yang digunakan dari akurasi hasil prediksi adalah persen (%).
-
5. Pembahasan
-
5.1 Analisis Hasil Training Prediksi dengan RNN-EKF
Hasil training RNN dengan EKF terhadap data training memiliki tingkat akurasi yang cukup baik. Untuk kasus prediksi kunjungan wisatawan ini, akurasi hasil prediksi terbaik mencapai 64.38%. Akurasi hasil training dihitung dari data yang telah didenormalisasi. MSE terbaik untuk kasus prediksi mencapai 0.098585.
Rangkuman nilai MSE berdasarkan learning rate tertentu diberikan dalam tabel 5.1.
Tabel 5.1 Hasil Training RNN
|
No |
Learning Rate |
Epoch |
MSE |
Akurasi |
|
1. |
0.2 |
1430 |
0.098585 |
64.37% |
|
2. |
0.3 |
2000 |
0.195716 |
57.36% |
|
3. |
0.5 |
2000 |
0.130657 |
58.85% |
Grafik hasil training RNN ditunjukkan pada Gambar 5. Sementara itu grafik nilai epoch yang dipenuhi pada saat training ditunjukkan pada Gambar 6. Hasil training tersebut tentunya bukan merupakan hasil yang memuaskan. Ketika proses training berjalan, kondisi yang dipenuhi saat update bobot adalah kondisi ketika nilai maksimum epoch terpenuhi. Sementara itu proses training tidak mencapai target error yang diinginkan.
Keterangan:
xmax = Nilai Maximum dari data awal yang diinputkan pada saat training

Gambar 5. Hasil Training dengan RNN-EKF
Jika ditinjau dari data training yang dilakukan, tidak baiknya prediksi disebabkan karena faktor data yang digunakan pada saat training. Pada data training terdapat beberapa variabel dengan nilai yang statis (tidak ada perubahan) dalam kurun waktu yang panjang. Di sisi lain, variabel kunjungan wisatawan tiap bulannya selalu berbeda.

Gambar 6. Nilai MSE pada tiap Iterasi
Nilai epoch yang dipenuhi di setiap training rata-rata mencapai epoch maksimum. Dari grafik yang ditunjukkan pada Gambar 6, training RNN dengan EKF terlihat cukup baik karena mampu menuju konvergensi ke satu nilai tertentu. Namun demikian, nilai MSE dari tiap epoch tidak menunjukkan adanya konvergensi menuju nilai MSE yang diharapkan. Bahkan di setiap learning rate yang diujikan proses training tidak dapat menuju ke titik konvergensi yang diharapkan. Hasil training juga menunjukkan perubahan MSE dari satu epoch ke epoch berikutnya sangat tinggi.
Tesing dilakukan sebagai validasi dari sistem yang telah dibangun. Proses testing merupakan proses untuk mengidentifikasi seberapa baik sistem prediksi yang telah dibuat dengan RNN-EKF pada penilitian ini. Data yang digunakan sebagai data testing adalah 30% dari keseluruhan dataset. Hasil testing selengkapnya ditunjukan pada Tabel 5.2.
Tabel 5.2 Hasil Testing dengan RNN
|
No. |
Learning Rate |
MSE |
Akurasi |
|
1. |
0.2 |
0.102695 |
62.91% |
|
2. |
0.3 |
0.238298 |
58.51% |
|
3. |
0.5 |
0.215051 |
59.29% |
Proses testing sistem RNN-EKF memberikan hasil prediksi dengan akurasi terbaik sebesar 62.91%. Hasil tersebut diperoleh ketika prediksi diterapkan pada jaringan yang telah dibangun dengan learning rate 0.2. Sementara itu, testing yang diterapkan pada sistem yang telah dibangun dengan learning rate sebesar 0.3 memberikan akurasi yang paling buruk, yaitu sebesar 58.52%. Hasil testing dengan membandingkan hasil prediksi dengan data aktual ditunjukan pada Gambar 7.

Gambar 7. Hasil Testing RNN-EKF
Berdasarkan hasil penelitian yang dilakukan terhadap sistem prediksi kunjungan Wisatawan dengan Recurrent Neural Network menggunakan algoritma training Extended Kalman Filter, maka dapat diperoleh kesimpulan sebagai berikut:
-
1. Training Recurrent Neural Network
dengan Extended Kalman Filter untuk prediksi memiliki tingkat akurasi terbaik sebesar 64.37%.
-
2. Hasil testing RNN-EKF pada kasus
prediksi memberikan hasil akurasi terbaik sebesar 62.91%
Berdasarkan hasil dan kesimpulan yang diperoleh, maka dapat diberikan saran untuk penelitian selanjutnya. Adapun saran-saran untuk penelitian selanjutnya adalah sebagai berikut:
-
1. Melakukan penelitian dengan
algoritma training yang lain untuk prediksi dengan menggunakan Recurrent Neural Network. Dengan metode training yang berbeda dimungkinkan kekurangan yang terdapat prediksi dengan RNN-EKF memberikan hasil dengan tingkat akurasi yang lebih baik.
-
2. Melakukan penelitian terkait
perhitungan Kalman Gain untuk mencari solusi pengganti proses inversi karena pada training dengan Extended Kalman Filter, terdapat
proses inversi yang mengakibatkan hasilnya terkadang tidak selesai karena pada saat training menghasilkan matriks singular.
-
3. Melakukan penelitian terkait optimasi penentuan bobot awal sehingga proses training dapat berjalan lebih cepat.
Adnan, R., Ruslan, F.A., Samad, A.M. dan Zain, Z.M., 2013, New Artificial
Neural Network and Extended Kalman Filter Hybrid Model of Flood Prediction System, IEEE 9th International Colloquium on Signal Processing and its Applications, 8 -10 Mac. 2013, Kuala Lumpur, Malaysia.
Adnyani, L.P.W., 2012, General Regression Neural Network (GRNN) Pada Peramalan Data Time Series, Tesis, S2 Matematika UGM, Yogyakarta.
Barbouniz, T.G and Teocharis, J.B., 2006, Locally Recurrent Neural Networks
For Wind Speed Prediction Using Spatial Correlation, Science Direct, Elsevier Inc., Information Sciences 177, pp.5775-5797.
Bozarth, C. and Handfield, R., Introduction to Operations and Supply Chain Management 2nd Edition. Pearson Prentice-Hall, Upper Saddle River, NJ., 2008.
Cernansky, M. and Benuskova, L., 2003, Simpe Recurrent Neural Network Trained By RTRL and Extended Kalman Filter Algorithms, Neural Network Wolrd, 13(3), pp.223-234.
Cernodub, A.N., 2014, Training Neural
Networks for Classification Using the Extended Kalman Filter: A
Comparative Study, SSN 1060 992X, Optical Memory and Neural Networks (Information Optics), Vol. 23, No. 2, pp. 96-103, Allerton Press, Inc.
Fajri, N., 2011, Prediksi Suhu dengan
Menggunakan Algoritma-Algortima yang Terdapat pada Artificial Neural Network, Tesis, Bandung, Indonesia, Institut Teknologi Bandung.
Fauset, L., 1994, Fundamental of Neural Network: Architecture, Algorithms and Application, Pretice-Hall: New Jersey.
Haykin, S., 2001, Kalman Filtering and Neural Network, John Willey & Sons, Inc., Canada.
Hermawan, A., 2006, Jaringan Saraf
Tiruan: Teori dan Aplikasi, Andi, Yogyakarta.
Jaeger, H., 2013, Tutorial On Training
Recurrent Neural Networks, Covering BPPT, RTRL, EKF And The "Echo State Network" Approach, GMD Report 159, National Research Center for Information Technology, (pp. 48), German.
Leonardo, I., 2004, Pemrograman
Database dengan Java, Elex Media Komputindo, Jakarta, 2004.
Lestari, N. dan Wahyuningsih, N., 2012, Peramalan Kunjungan Wisatawan dengan Pendekatan Model SARIMA (Studi Kasus: Kusuma Agrowisata), Jurnal Sains dan Seni ITS, Vol.1, No.1, ITS, Surabaya.
Makridakis, S. dan Steven, W., 1993,
Metode dan Aplikasi Peramalan, Jakarta : Penerbit Erlangga.
Mandic, D. and Chambers, J., 2001.
Recurrent Neural Network For Prediction, John Wiley & Sons, L.td., England.
Munarsih, E., 2011, Penerapan Model
Arima-Neural Network Hybrid Untuk Peramalan Data Time Series, Tesis, Program Studi S2 Matematika, Universitas Gadjah Mada,
Yogyakarta.
Nugroho, A.S., 2007, Menggairahkan Riset Soft-Computing di Indonesia, Seminar Nasional Riset Teknologi Informasi STIMIK AKAKOM, Yogyakarta.
Oka, Yoeti, A., Oka.,1996, Pengantar Ilmu Pariwisata Edisi Revisi, Penerbit Angkasa, Bandung.
Perez-Ortiz, J.A., Calera-Rubio, J. and Forcada, M.L., 2001, Online Text
Prediction with Recurrent Neural Network, Neural Processing Letter 12: 127-140, Kluwer Academic
Publisher, Netherlands.
Putra, I.W.G.S, 2011, Pengaruh Jumlah Kunjungan Wisatawan Terhadap Penerimaan Retribusi Obyek Wisata, Pendapatan Asli Daerah Dan Anggaran Pembangunan Kab. Gianyar Tahun 1991-2010, Tesis, Kajian Pariwisata, Universitas Udayana, Denpasar.
Rahmawati, T., 2013, Penerapan Metode Elman Recurrent Neural Network dan Principal Component Analysis (PCA) Untuk Peramalan Komsumsi Listrik, Tesis, Program Studi S2 Ilmu Komputer, Universitas Gadjah Mada, Yogyakarta.
Riswanto, 2012, Faktor Yang
Mempengaruhi Frekuensi Kunjungan Wisatawan Ke Objek Wisata Owabong Kabupaten Purbalingga, Tesis, Magister Ekonomika
Pembangunan, Universitas Gadjah Mada, Yogyakarta.
Rumagit, S.E., 2012, Prediksi Pemakaian Listrik dengan Menggunakan Jaringan Saraf Tiruan dan ARIMA di Wilayah Suluttenggo, Tesis, Program
Studi S2 Ilmu Komputer, Universitas Gadjah Mada, Yogyakarta.
Setyaningsih, F.A., 2010, Perbandingan
Algoritma Genetika, Neural Network dan Statistika Arima untuk Prediksi Data Time Series (Studi Kasus: Kunjungan Museum di Kota Yogyakarta), Tesis, Program Studi S2 Ilmu Komputer, Universitas Gadjah Mada, Yogyakarta.
Subagyo, Pangestu, 1986, Forecasting: Konsep dan Aplikasi Edisi Kedua, BPFE, Yogyakarta.
Susanti, L., Fariza A., Setiawardhana, 2011, Peramalan Harga Saham
Menggunakan Recurrent Neural
Network dengan Algoritma
Backpropagation Through Time (BPTT), Politeknik Elektronika Negeri Surabaya, Institut Teknologi Sepuluh Nopember, Surabaya.
Trebaticky, P., 2005, Recurrent Neural
Network Training with Extended Kalman Filter, M.Bielikova (Ed.), IIT.SRC 2005, April 27, 2005, pp. 57-64.
Wang, X. dan Huang, Y., 2011,
Convergence Study in Extended Kalman Filter-based Training of Recurrent Neural Networks, IEEE Transactions On Neural Networks, Vol. 22, No. 4.
Warsito, B. dan Sumiyati, S., 2007, Prediksi Curah Hujan Kota Semarang Dengan Feedforward Neural Network Menggunakan Algoritma Quasi Newton BFGS dan Levenberg-Marquardt, Jurnal PRESIPITASI,
Semarang, 3, 2, September 2007.
Wijaya, I.N., 2011, Pengaruh Jumlah
Wisatawan Mancanegara, Lama Tinggal, Dan Kurs Dolar Amerika Terhadap Penerimaan Produk Domestik Regional Bruto Industri Pariwisata Kabupaten Badung Tahun 1997-2010, Tesis, Program
Pascasarjana Universitas Udayana, Denpasar.
Zhang, L. and Peter, B.R., 2005, Neural Network-Based Market Clearing Price Prediction and Confidence Interval Estimation With an
Improved Extended Kalman Filter
Method, IEEE Transactions On
Power Systems, Vol. 20, No. 1.4
Discussion and feedback