Analisis Penentuan Respons Twitter sebagai Media Komunikasi dan Informasi Pemerintah Berbasis Metode Rabin-Karp
on
Majalah Ilmiah Teknologi Elektro, Vol.22, No.2, Juli-Desember 2023
DOI: https://doi.org/10.24843/MITE.2023.v22i02.P15 265
Analisis Penentuan Respons Twitter sebagai Media Komunikasi dan Informasi Pemerintah Berbasis Metode
Rabin-Karp
Luh Ayu Fernita1, N. P. Sastra2, Rukmi Sari Hartati3
[Submission: 23-07-2023, Accepted: 14-09-2023]
Abstract— Social media in this digital era, especially Twitter, has an important role in the interaction between government and society. Given the wide variety of activities within government circles, the task of monitoring and responding to messages is complex and time-consuming. Therefore, this study aims to develop an effective approach in determining the appropriate response from the government to people's tweets. This study proposes using a combination of the Rabin-Karp method to quickly determine relevant responses. The Rabin-Karp method, known for its efficiency in pattern matching, is used to match tweets to a set of tweets that have already been given a response. Furthermore, the Word2Vec technique is used to improve understanding of the meaning of the text. The use of the Rabin-Karp method with the addition of the Word2Vec method shows that the response accuracy rate is 74.55%. The results of this study also show that the lower the K-Gram value, the higher the similarity value, and vice versa. These results are expected to contribute in the context of government that is responsive to societal issues discussed on Twitter.
Intisari— Media sosial dalam era digital ini, khususnya Twitter, memiliki peran penting dalam interaksi antara pemerintah dan masyarakat. Adanya beragam kegiatan di lingkungan pemerintahan menimbulkan tugas memantau dan menanggapi pesan menjadi rumit dan memakan waktu. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan pendekatan yang efektif dalam menentukan respons yang tepat dari pemerintah terhadap tweet masyarakat. Penelitian ini, mengusulkan penggunaan kombinasi metode Rabin-Karp untuk menentukan respons yang relevan dengan cepat. Metode Rabin-Karp, yang dikenal karena efisiensinya dalam pencocokan pola, digunakan untuk mencocokkan tweet dengan kumpulan tweet yang sudah diberikan respons. Selanjutnya, digunakan teknik Word2Vec untuk meningkatkan pemahaman makna teks. Penggunaan metode Rabin-Karp dengan penambahan metode Word2Vec menunjukkan tingkat akurasi respons adalah 74,55 %. Hasil penelitian ini juga menunjukkan bahwa semakin rendah nilai K-Gram maka semakin tinggi nilai similaritasnya, begitu pula sebaliknya. Hasil ini diharapkan memberikan kontribusi dalam konteks pemerintahan yang responsif terhadap isu-isu masyarakat yang dibahas di Twitter.
penelitian ini juga menunjukkan bahwa nilai K-Gram yang semakin rendah, menyebabkan nilai similarity akan semakin tinggi, begitu juga sebaliknya.
Kata Kunci— Rabin-Karp;Word2Vec;Twitter, Respons
Perkembangan pesat internet telah mengubah lanskap media sosial dengan cepat. Media sosial memberikan wadah online yang memudahkan pengguna dalam hal komunikasi dan informasi [1][2]. Salah satu media sosial yang populer adalah Twitter yang telah menjadi sarana penting untuk menyampaikan aspirasi dan berkomunikasi antara masyarakat dan pemerintah [3]. Dalam konteks pelayanan publik, keterlibatan aktif masyarakat dan respons cepat dari pemerintah sangat penting untuk meningkatkan kualitas layanan [4]. Namun, terdapat tantangan dalam mengelola dan merespons volume besar tweet yang masuk ke akun pemerintah. Oleh karena itu, diperlukan metode yang efektif untuk mengidentifikasi dan menentukan respons yang sesuai terhadap tweet yang berkaitan dengan pemerintah.
Penelitian ini bertujuan untuk mengatasi tantangan tersebut dengan memanfaatkan metode Rabin-Karp dalam analisis teks tweet. Metode Rabin-Karp adalah algoritma pencarian string yang menggunakan fungsi hashing untuk mendeteksi pola dalam teks. Keunggulan utama metode ini adalah Rabin-Karp dapat mencocokkan lebih dari satu pola secara efisien dengan menggunakan pendekatan rolling hash [5]. Hal ini memungkinkan pencarian simultan untuk beberapa pola dalam teks yang sama. Dalam penelitian ini, metode Rabin-Karp akan diterapkan untuk menemukan kesamaan teks pada media Twitter, dengan fokus pada tweet yang terkait dengan akun pemerintah.
Studi kasus dalam penelitian ini adalah Pemerintahan Kabupaten Badung, yang telah menjadi salah satu kota menuju smart city. Kabupaten Badung memiliki kebutuhan yang tinggi dalam merespons aspirasi masyarakat melalui media sosial, terutama Twitter. Dengan menerapkan metode Rabin-Karp, diharapkan dapat ditemukan tweet dengan kesamaan teks tertinggi, yang kemudian akan dijadikan acuan untuk menentukan respons yang tepat dari akun pemerintah. Penelitian ini memiliki potensi untuk meningkatkan efisiensi dan efektivitas komunikasi antara masyarakat dan pemerintah melalui media Twitter, sehingga memberikan kontribusi positif dalam pelayanan publik dan pengambilan keputusan pemerintah yang.
Luh Ayu Fernita: Analisis Penentuan Respons Twitter…
p-ISSN:1693 – 2951; e-ISSN: 2503-2372

9 772503 2371 BO
Penelitian ini terdiri dari empat tahap penelitian yang meliputi koleksi data, pra-pemrosesan teks, metode kesamaan, dan penentuan hasil. Rincian dari setiap tahapan tersebut dijelaskan secara lebih lanjut pada Gambar 1.
-
A. Koleksi Data
Data yang digunakan pada penelitian ini diperoleh dari twitter, lebih detailnya adalah data yang berhubungan dengan Pemerintah Kabupaten Badung. Dari kumpulan data tersebut akan dibagi menjadi data latih dan data uji. Data yang didapatkan sudah diberikan respons dan kategori untuk masing-masing tweet. Adapun kategori yang diberikan dibagi menjadi 3 yaitu informasi, pertanyaan dan pengaduan
-
B. Text Preprocessing
Text preprocessing merupakan proses yang dilakukan untuk memperoleh informasi yang berkualitas tinggi dari kumpulan teks [6][7]. Adapun tahapan yang dilakukan pada proses ini dijelaskan pada Gambar 2 [8].
-
C. Metode Similarity
Tahap berikutnya adalah pencarian similarity data twitter antara data uji dan data latih. Metode similarity yang digunakan adalah metode Rabin-Karp. Proses-proses yang dilakukan pada tahapan ini dijelaskan pada Gambar 3.
Gambar 3. Tahapan Metode Rabin Karp
-
D. Penentuan Hasil Similarity
Penentuan hasil dilakukan setelah mendapatkan persentase similarity dengan masing-masing data tweet dari twitter pada data latih. Selanjutnya akan dicari persentase tertinggi dan jika nilai tersebut lebih dari 80%, proses dilanjutkan dengan menentukan jenis respons twitter. Sebaliknya jika nilai kurang dari 80%, data akan ditambahkan ke daftar uncategorized untuk selanjutnya data tersebut direspons secara manual. Tipe tweet dalam penelitian ini dibagi menjadi tiga, yaitu pertanyaan, pengaduan, dan informasi. Setiap tweet akan diberikan respons sesuai dengan tipe tweet dengan kemiripan tertinggi.
-
A. Hasil Pengumpulan Data
Data yang digunakan dalam penelitian ini diperoleh melalui proses pengumpulan yang hati-hati dari tiga sumber utama: Twitter, Aplikasi Sidumas, dan melalui konsultasi dengan Bidang Pengelolaan Informasi Publik (PIP) di Pemerintahan Kabupaten Badung. Langkah-langkah yang dilakukan dalam pengumpulan data ini diuraikan sebagai berikut:
Pengumpulan Data dari Twitter (@PemkabBadung)
Data diperoleh dengan menggunakan antarmuka pemrograman aplikasi (API) yang disediakan oleh Twitter untuk mengambil tweet yang mencantumkan " @PemkabBadung" sebagai mention. Respons atau tanggapan yang diberikan oleh akun @PemkabBadung untuk masing-masing tweet diverifikasi untuk mendapatkan data yang akurat dan valid.
Pengumpulan Data dari Aplikasi Sidumas
Data yang berasal dari aplikasi Sidumas, platform pengaduan yang dimiliki oleh Pemerintah Badung, diperoleh melalui akses ke sistem tersebut. Data pengaduan akan dijadikan sebagai alternatif data tweet.
Majalah Ilmiah Teknologi Elektro, Vol.22, No.2, Juli-Desember 2023 DOI: https://doi.org/10.24843/MITE.2023.v22i02.P15
TABEL III
Contoh Hasil Tokenizing
Konsultasi dengan Bidang PIP
Melalui pertemuan dan konsultasi dengan Bidang Pengelolaan Informasi Publik (PIP), informasi langsung diperoleh dari sumber yang memiliki wewenang di dalam Pemerintahan Kabupaten Badung. Pertanyaan-pertanyaan yang diajukan melalui konsultasi dari bidang tersebut digunakan sebagai sumber informasi yang sah. Data pertanyaan ini dijadikan sebagai data tambahan tweet
Validasi dan Pemberian Respon Data
. Validasi lintas-sumber dilakukan dengan membandingkan dan memeriksa konsistensi data dari ketiga sumber. Data kemudian diklasifikasikan berdasarkan kategori yang telah ditentukan. Setiap data diberikan respon dan kategori yang disuaikan isi tweet. Berdasarkan pencarian data yang dilakukan dari tahun 2021 dan 2022 didapatkan data sejumlah 485. Data tersebut akan dibagi menjadi 2 bagian, 30% digunakan sebagai data uji dan 70% digunakan sebagai data latih. Semua data tersebut diberikan respons yang sudah dikoordinasikan dengan pihak terkait sehingga setiap tweet memiliki jawaban masing-masing.
-
B. Hasil Text Preproccesing
Text prepocessing merupakan tahap pada pengolahan data yang memiliki tujuan untuk dapat membersihkan dan mempersiapkan data teks mentah (raw text) sebelum dilakukan analisis atau diolah lebih lanjut [9]. Adapun tahapan yang dilakukan dengan contoh salah satu data yang digunakan adalah sebagai berikut.
Case Folding
Tahapan ini adalah tahapan pengubahan karakter dalam teks menjadi huruf lowercase atau huruf kecil [10]. Contoh proses case folding ditunjukkan pada Tabel I.
TABEL I
Contoh Hasil Case Folding
Kata Awal |
Hasil Kata |
lampu penerangan jalan padam dan sangat membahayakan pada malam hari Mohon pihak terkait membantu |
lampu penerangan jalan padam dan sangat membahayakan pada malam hari mohon pihak terkait membantu |
Kata Awal |
Hasil Kata |
lampu penerangan jalan padam dan sangat membahayakan pada malam hari mohon pihak terkait membantu |
{lampu}, {penerangan}, {jalan}, {padam}, {dan}, {sangat}, {membahayakan}, {pada}, {malam}, {hari}, {mohon}, {pihak}, {terkait}, {membantu} |
Filtering
Tahapan ini menyeleksi kata-kata yang signifikan dari hasil proses tokenisasi, yaitu kata-kata yang dapat mewakili konten suatu dokumen[12]. Adapun contoh dari filtering ditunjukkan pada Tabel III.
TABEL IIIII
Contoh Hasil Filtering
Kata Awal |
Hasil Kata |
{lampu}, {penerangan}, {jalan}, {padam}, {dan}, {sangat}, {membahayakan}, {pada}, {malam}, {hari}, {mohon}, {pihak}, {terkait}, {membantu} |
{lampu}, {penerangan}, {jalan}, {padam}, {sangat}, {membahayakan}, {malam}, {hari}, {mohon}, {pihak}, {terkait}, {membantu} |
Pos Tagging
Pemberian label kelas kata merupakan proses yang dilakukan pada tahapan Pos Tangging, hal ini akan dilakukan dengan otomatis terhadap suatu kata pada rangkaian kalimat [13]. Khusus untuk kata verb, pada penelitian ini akan dilakukan Word2Vec karena kata kerja mengandung informasi penting tentang tindakan atau kegiatan. Hasil proses ini ditunjukkan pada Tabel IV.
TABEL IVV
Contoh Hasil pos tagging
Kata |
Pos Tagger |
lampu |
JJ |
penerangan |
NN |
jalan |
NN |
padam |
VB |
sangat |
RB |
membahayakan |
VB |
malam |
NN |
hari |
NN |
mohon |
NN |
pihak |
NN |
terkait |
VB |
membantu |
VB |
Tokenizing
Tokenizing adalah tahapan pemisahaan kumpulan kata pada kalimat, paragraf atau halaman menjadi potongan kalimat tunggal atau token yang akan menjadi data kata yang berdiri sendiri [11]. Contoh hasil tokenizing ditunjukkan pada Tabel II.
Luh Ayu Fernita: Analisis Penentuan Respons Twitter…
Word2Vec
Word2vec merupakan pemodelan Natural Language Processing (NLP) yang digunakan untuk menghasilkan representasi vektor kata-kata dalam teks [14]. Tahapan Word2Vec bertujuan untuk menambah kata-kata yang memiliki makna serupa atau terkait [15]. Arsitektur yang digunakan pada metode ini adalah Continuous Bag-of-Words
p-ISSN:1693 – 2951; e-ISSN: 2503-2372

(CBOW). Penelitian ini menggunakan Library Gensim, yaitu library dalam bahasa pemrograman Python yang digunakan untuk NLP dan pemodelan topik [16]. Contoh script yang digunakan adalah sebagai berikut.
from gensim.models import Word2Vec
sentences = Word2vec.load(‘Model file Location’)
model = Word2Vec(sentences, min_count=1)
word ={word}
similar_words = model.wv.most_similar(word)
Sedangkan contoh hasil dari Word2Vec ini ditunjukkan pada Tabel V.
TABEL V
Contoh Hasil Word2Vec
Kata Awal |
Hasil Kata |
padam |
{mati},{tewas},{berhenti},{hilang}, {berhenti} |
membahayakan |
{'merugikan}, {mengganggu}, {mengancam}, {merusak}, {membebani}, {mempersulit}, {berbahaya}, {menyulitkan}, {menganggu}, {menggangu'} |
terkait |
{'berkaitan}, {berkenaan}, {berhubungan}, {sehubungan}, {kaitannya}, {menyangkut}, {dikaitkan}, {mengaitkan}, {bertalian'} |
membantu |
{'membantunya}, {mendorong}, {menolong}, {memotivasi}, {mengawasi}, {berusaha}, {mempercepat}, {mempermudah}, {berupaya}, {memberdayakan'} |
Hasil dari Word2Vec akan ditambahkan kedalam text prepocessing untuk meningkatkan kualitas analisis teks dengan memungkinkan model memahami makna kata-kata dalam konteks yang lebih luas dan lebih mendalam. Adapun hasil text prepocessing setelah Word2Vec yaitu
{lampu}, {penerangan}, {jalan}, {mati},{tewas},{berhenti},{hilang}, {berhenti}}, {sangat}, {membahayakan},{'merugikan}, {mengganggu}, {mengancam}, {merusak}, {membebani}, {mempersulit}, {berbahaya}, {menyulitkan}, {menganggu}, {menggangu'}, {malam}, {hari}, {mohon}, {pihak}, {terkait}{'berkaitan}, {berkenaan}, {berhubungan}, {sehubungan}, {kaitannya}, {menyangkut}, {dikaitkan}, {mengaitkan}, {bertalian'}, {membantu}, {'membantunya}, {mendorong}, {menolong}, {memotivasi}, {mengawasi}, {berusaha}, {mempercepat}, {mempermudah}, {berupaya}, {memberdayakan'}
Stemming
Steamming merupakan tahapan untuk mengubah struktur kata ke bentuk dasar atau mengidentifikasi akar kata dari hasil kata setelah melalui proses refleksi [17]. Contoh hasil steamming ditunjukkan padad Tabel VI.
TABEL VI
Contoh Hasil Steamming
Kata Awal |
Kata Hasil |
Kata Awal |
Kata Hasil |
lampu |
lampu |
pihak |
pihak |
penerangan |
terang |
berkaitan |
kait |
jalan |
jalan |
berkenaan |
kena |
mati |
mati |
berhubungan |
hubung |
tewas |
tewas |
sehubungan |
hubung |
berhenti |
berhenti |
kaitan |
kait |
hilang |
hilang |
menyangkut |
sangkut |
merugikan |
rugi |
dikaitkan |
kait |
mengganggu |
ganggu |
bertalian |
tali |
mengancam |
ancam |
membantunya |
bantu |
merusak |
rusak |
mendorong |
dorong |
membebani |
beban |
menolong |
tolong |
mempersulit |
sulit |
memotivasi |
motivasi |
berbahaya |
bahaya |
mengawasi |
awas |
menyulitkan |
sulit |
berusaha |
usaha |
menganggu |
ganggu |
mempercepat |
cepat |
malam |
malam |
mempermudah |
mudah |
hari |
hari |
berupaya |
upaya |
mohon |
mohon |
memberdayakan |
daya |
-
C. Hasil Metode Similarity
Metode similarity Rabin-Karp digunakan untuk menentukan kemiripan text. Langkah-langkah yang dilakukan adalah sebagai berikut.
K-Gram
K-Gram adalah serangkaian istilah dengan panjang k. K-Gram digunakan untuk mengekstrak huruf-huruf karakter sejumlah k dari sebuah kata yang terus-menerus dibaca dari teks sumber hingga akhir dokumen [18]. Contoh penerapan K-Gram dengan nilai k = 5 adalah sebagai berikut.
-
• Kata hasil text prepoccessing
{lampu}, {terang}, {jalan}, {mati}, {tewas}, {berhenti}, {hilang}, {rugi}, {ganggu}, {ancam}, {rusak}, {beban}, {sulit}, {bahaya}, {sulit}, {ganggu}, {malam}, {hari}, {mohon}, {pihak}, {kait}, {kena}, {hubung}, {hubung}, {kait}, {sangkut}, {kait}, {tali}, {bantu}, {dorong}, {tolong}, {motivasi}, {awas}, {usaha}, {cepat}, {mudah}, {upaya}, {daya}
-
• Kata digabungkan
lamputerangjalanmatitewasberhentihilangrugigangguan camrusakbebansulitbahayasulitganggumalamharimoho npihakkaitkenahubunghubungkaitsangkutkaittalibantud orongtolongmotivasiawasusahacepatmudahupayadaya
-
• Hasil kata dengan panjang K-Gram
{'lampu}, {ampu}, {mpute}, {puter}, {utera}, {teran}, {erang}, {rangj}, {angja}, {ngjal}, {gjala}, {jalan}, {alanm}, {lanma}, {anmat}, {nmati}, {matit}, {atite}, {titew}, {itewa}, {tewas}, {ewasb}, {wasbe}, {asber}, {sberh}, {berhe}, {erhen}, {rhen}, {henti}, {entih}, {ntihi}, {tihil}, {ihil}, {hilan}, {ilang}, {langr}, {angru}, {ngrug}, {grugi}, {rugig}, {ugiga}, {gigan}, {igang}, {gangg}, {anggu}, {nggua}, {gguan},
{gguan}, {guanc}, {uancam}, {ancam}, {ncamr},
{camru}, {amrus}, {mrusa}, {rusak}, {usakb}, {sakbe}, {akbeb}, {kbeba}, {bebans}, {ebans},
DOI: https://doi.org/10.24843/MITE.2023.v22i02.P15
{bansu}, {ansul}, {nsuli}, {sulit}, {ulitb}, {litba}, {itbah}, {tbaha}, {bahay}, {ahaya}, {hayas}, {ayas}, {yasul}, {asuli}, {sulit}, {ulitg}, {litga}, {itgan}, {tgang}, {gangg}, {anggu}, {nggum}, {gguma}, {gumal}, {umala}, {malam}, {alah}, {lahar}, {ahari}, {harim}, {arimo}, {rimoh}, {imoho}, {mohon}, {ohonp}, {honpi}, {onpih}, {npika}, {pikai}, {ika}, {kaitk}, {aitke}, {itken}, {tkena}, {kenah}, {ena}, {nahub}, {ahubu}, {hubun}, {ubung}, {bungk}, {ungka}, {ngkai}, {gkait}, {kaitt}, {aitta}, {ittal}, {ttali}, {talib}, {aliba}, {liban}, {ibant}, {bantu}, {antud}, {ntudo}, {tudor}, {udoro}, {doron}, {orong},
{rongt}, {ongto}, {ngtol}, {gtolo}, {tolon}, {olong},
{longt}, {ongto}, {ngtol}, {gtolo}, {tolon}, {olong},
{longm}, {ongmo}, {ngmot}, {gmoti}, {motiv}, {otiva}, {tivas}, {ivasi}, {vasia}, {asias}, {siasu},
{iasaw}, {asawa}, {sawas}, {awasu}, {wasus},
{asusa}, {susah}, {usahc}, {sahce}, {ahcep}, {hcepa}, {cepat}, {epatm}, {patmu}, {atmud}, {tmuda},
{mudah}, {udahu}, {dahup}, {ahupa}, {hupay},
{upaya}, {payad}, {ayada}, {yaday}, {aday}, {daya'}
Hashing
Hasing merupakan proses mengubah pola (pattern) dan bagian-bagian teks menjadi nilai hash yang merepresentasikan kumpulan karakter tersebut [19]. Fungsi hash yang digunakan mengonversi urutan karakter menjadi bilangan bulat yang unik menggunakan persamaan (1).
h(s) = (s[i] × b(n~1 + s[i + 1] × b(n~2 + + s[i + n - 1])mod q. (1)
dengan
s = ASCII string yang dicari
i = nilai iterasi
b = angka prima
n = number pada string yang sedang dicari
q = modulus.
Sebagai contoh, perhitungan untuk tahapan hasing adalah sebagai berikut.
htiαmpu) = ((108 x 7<s"1>) + (97 x 7<s"2>) + (109 x 7<s"3>)
+ (112 x7(5-4)) + (117 ×7(s"s>))mod 1007
h -.∙. = ((108x 74) + (97 x 73) + (109 x 72) + (112 x 71)
+ (117 × 100)) mod 1007
h(iampu) = ((108 x 2401) + (97 x 343) + (109 x 49) + (112 x 7)
+ (117 × 1 )) mod 1007
h(iαmpu) = ((259308) + (33271) + (5341) + (784 )
+ (117)) mod 1007
h(iampu) = 298821 mod 1007
h((ampu) = 749
Luh Ayu Fernita: Analisis Penentuan Respons Twitter…
Setiap kata yang diperoleh dari proses K-gram dilakukan hashing. Sebagai contoh, hasil hashing dari kata sesuai dengan hasil text prepocessing sebelumnya ditunjukkan pada Tabel VII. Selanjutnya akan dibandingkan dengan setiap data training, salah satu contoh dari data training yaitu sebagai berikut :
” Mohon pihak terkait untuk memperbaiki lampu penerangan jalan yang sudah mati sekitar setahun lebih tidak ditindaklanjuti”
dan mendapatkan hasil teks setelah prepoccessing, yaitu
” mohon pihak hubung kait kena hubung kait sangkut kait tali meminimalisir pulih optimal tingkat stabil sempurna rekonstruksi lampu penerangan jalan mati tewas berhenti hilang setahun lebih kuat jelas tegas realisasi direspon tuju syah tindak verifikasi lanjut”.
Hasil hashing teks pembanding dapat dilihat pada Tabel VIII.
TABEL VII
Contoh Hasil hashing teks
Kata |
hash |
Kata |
hash |
Kata |
hash |
Kata |
hash |
Kata |
hash |
lampu |
749 |
rugig |
511 |
itgan |
664 |
nghub |
331 |
olong |
718 |
amput |
789 |
ugiga |
976 |
tgang |
252 |
ghubu |
502 |
longm |
494 |
mpute |
643 |
gigan |
145 |
gangg |
800 |
hubun |
515 |
ongmo |
6 |
puter |
357 |
igang |
23 |
anggu |
594 |
ubung |
911 |
ngmot |
552 |
utera |
281 |
gangg |
800 |
nggum |
293 |
bungk |
694 |
gmoti |
23 |
teran |
315 |
anggu |
594 |
gguma |
216 |
ungka |
286 |
motiv |
191 |
erang |
234 |
nggua |
281 |
gumal |
525 |
ngkai |
345 |
otiva |
197 |
rangj |
25 |
gguan |
145 |
umala |
663 |
gkait |
599 |
tivas |
881 |
angja |
595 |
guanc |
19 |
malam |
974 |
kaits |
192 |
ivasi |
170 |
ngjal |
299 |
uanca |
142 |
alamh |
650 |
aitsa |
587 |
vasia |
816 |
gjala |
258 |
ancam |
348 |
lamha |
673 |
itsan |
245 |
asiaw |
353 |
jalan |
821 |
ncamr |
590 |
amhar |
255 |
tsang |
340 |
siawa |
608 |
alanm |
662 |
camru |
301 |
mhari |
937 |
sangk |
413 |
iawas |
978 |
lanma |
757 |
amrus |
886 |
harim |
396 |
angku |
622 |
awasu |
450 |
anmat |
845 |
mrusa |
311 |
arimo |
86 |
ngkut |
496 |
wasus |
298 |
nmati |
32 |
rusak |
40 |
rimoh |
760 |
gkutk |
640 |
asusa |
38 |
matit |
422 |
usakb |
701 |
imoho |
719 |
kutka |
461 |
susah |
424 |
atite |
811 |
sakbe |
225 |
mohon |
644 |
utkai |
464 |
usaha |
679 |
titew |
815 |
akbeb |
294 |
ohonp |
362 |
tkait |
595 |
sahac |
69 |
itewa |
707 |
kbeba |
195 |
honpi |
12 |
kaitt |
193 |
ahace |
212 |
tewas |
565 |
beban |
621 |
onpih |
412 |
aitta |
594 |
hacep |
643 |
ewasb |
972 |
ebans |
800 |
npiha |
354 |
ittal |
292 |
acepa |
794 |
wasbe |
151 |
bansu |
977 |
pihak |
653 |
ttali |
671 |
cepat |
693 |
asber |
33 |
ansul |
264 |
ihakk |
349 |
talib |
707 |
epatm |
603 |
sberh |
389 |
nsuli |
1000 |
hakka |
55 |
aliba |
958 |
patmu |
605 |
berhe |
438 |
sulit |
149 |
akkai |
714 |
liban |
828 |
atmud |
6 |
erhen |
521 |
ulitb |
769 |
kkait |
133 |
ibant |
335 |
tmuda |
193 |
rhent |
30 |
litba |
697 |
kaitk |
184 |
bantu |
984 |
mudah |
388 |
henti |
638 |
itbah |
413 |
aitke |
535 |
antud |
305 |
udahu |
589 |
p-ISSN:1693 – 2951; e-ISSN: 2503-2372
entih |
766 |
tbaha |
503 |
itken |
888 |
ntudo |
286 |
dahup |
459 |
ntihi |
727 |
bahay |
561 |
tkena |
807 |
tudor |
184 |
ahupa |
272 |
tihil |
244 |
ahaya |
362 |
kenah |
658 |
udoro |
332 |
hupay |
65 |
ihila |
738 |
hayas |
689 |
enahu |
848 |
doron |
672 |
upaya |
776 |
hilan |
777 |
ayasu |
129 |
nahub |
287 |
orong |
762 |
payad |
749 |
ilang |
731 |
yasul |
58 |
ahubu |
194 |
rongt |
809 |
ayada |
4 |
langr |
732 |
asuli |
1004 |
hubun |
515 |
ongto |
55 |
yaday |
203 |
angru |
671 |
sulit |
149 |
ubung |
911 |
ngtol |
887 |
adaya |
1004 |
ngrug |
826 |
ulitg |
774 |
bungh |
691 |
gtolo |
360 | ||
grugi |
934 |
litga |
732 |
unghu |
285 |
tolon |
528 |
TABEL VVII
Contoh Hasil teks pembanding
Kata |
hash |
Kata |
hash |
Kata |
hash |
Kata |
hash |
Kata |
hash |
Kata |
hash |
mohon |
644 |
gkutm |
642 |
imalk |
57 |
ruksi |
779 |
arsul |
629 |
sasid |
665 |
ohonp |
362 |
kutme |
479 |
malku |
45 |
uksil |
849 |
rsulu |
546 |
asidi |
360 |
honpi |
12 |
utmem |
594 |
alkur |
199 |
ksila |
250 |
sulut |
233 |
sidir |
674 |
onpih |
412 |
tmemi |
487 |
lkura |
537 |
silam |
1005 |
uluts |
367 |
idire |
419 |
npiha |
354 |
memin |
438 |
kuran |
306 |
ilamp |
733 |
lutse |
908 |
dires |
563 |
pihak |
653 |
emini |
927 |
urang |
384 |
lampu |
749 |
utset |
895 |
iresp |
8 |
ihakh |
346 |
minim |
851 |
rangt |
35 |
ampup |
785 |
tseta |
572 |
respo |
703 |
hakhu |
54 |
inima |
789 |
angti |
673 |
mpupe |
615 |
setah |
20 |
espon |
319 |
akhub |
700 |
nimal |
125 |
ngtin |
847 |
pupen |
157 |
etahu |
892 |
spont |
630 |
khubu |
36 |
imali |
55 |
gting |
72 |
upene |
899 |
tahun |
607 |
pontu |
127 |
hubun |
515 |
malis |
29 |
tingk |
523 |
pener |
617 |
ahunl |
269 |
ontuj |
694 |
ubung |
911 |
alisi |
78 |
ingka |
677 |
enera |
87 |
hunle |
24 |
ntuju |
334 |
bungk |
694 |
lisir |
714 |
ngkat |
356 |
neran |
7 |
unleb |
490 |
tujus |
521 |
ungka |
286 |
isirm |
537 |
gkats |
675 |
erang |
234 |
nlebi |
766 |
ujusy |
687 |
ngkai |
345 |
sirmi |
372 |
katst |
725 |
ranga |
16 |
lebih |
513 |
jusya |
123 |
gkait |
599 |
irmin |
328 |
atsta |
290 |
angan |
545 |
ebihk |
135 |
usyah |
806 |
kaitk |
184 |
rmini |
923 |
tstab |
168 |
nganj |
954 |
bihku |
350 |
syaht |
975 |
aitke |
535 |
minim |
851 |
stabi |
214 |
ganja |
815 |
ihkua |
899 |
yahti |
516 |
itken |
888 |
inima |
789 |
tabil |
227 |
anjal |
690 |
hkuat |
903 |
ahtin |
187 |
tkena |
807 |
nimal |
125 |
abils |
637 |
njala |
953 |
kuatj |
609 |
htind |
456 |
kenat |
670 |
imalp |
62 |
bilse |
586 |
jalan |
821 |
uatje |
489 |
tinda |
492 |
enata |
912 |
malpu |
80 |
ilsem |
549 |
alanl |
661 |
atjel |
762 |
indak |
470 |
natal |
745 |
alpul |
438 |
lsemp |
463 |
lanla |
750 |
tjela |
450 |
ndakv |
923 |
atali |
367 |
lpuli |
204 |
sempu |
802 |
anlal |
788 |
jelas |
184 |
dakve |
602 |
talit |
725 |
pulih |
990 |
empur |
321 |
nlala |
632 |
elast |
238 |
akver |
283 |
alite |
81 |
ulihh |
691 |
mpurn |
638 |
lalap |
590 |
laste |
48 |
kveri |
126 |
liten |
731 |
lihhi |
159 |
purna |
305 |
alapn |
677 |
asteg |
904 |
verif |
130 |
itent |
663 |
ihhil |
679 |
urnar |
941 |
lapny |
886 |
stega |
437 |
erifi |
572 |
tenta |
239 |
hhila |
351 |
rnare |
898 |
apnya |
722 |
tegas |
788 |
rifik |
378 |
entan |
716 |
hilan |
777 |
narek |
674 |
pnyal |
181 |
egasr |
535 |
ifika |
45 |
ntang |
375 |
ilang |
731 |
areko |
883 |
nyala |
56 |
gasre |
113 |
fikas |
966 |
tangs |
808 |
lango |
729 |
rekon |
303 |
yalak |
581 |
asrea |
800 |
ikasi |
425 |
angsa |
658 |
angop |
645 |
ekons |
545 |
alako |
643 |
sreal |
727 |
kasil |
598 |
ngsan |
742 |
ngopt |
657 |
konst |
198 |
lakob |
625 |
reali |
794 |
asila |
408 |
gsang |
344 |
gopti |
758 |
onstr |
646 |
akoba |
909 |
ealis |
961 |
silan |
1006 |
sangk |
413 |
optim |
292 |
nstru |
1005 |
kobar |
489 |
alisa |
70 |
ilanj |
734 |
angku |
622 |
ptima |
521 |
struk |
175 |
obars |
670 |
lisas |
659 |
lanju |
756 |
ngkut |
496 |
timal |
433 |
truks |
968 |
barsu |
166 |
isasi |
148 |
anjut |
838 |
Matching
Matching atau string matching adalah proses perbandingan nilai hash dari teks input dengan nilai hash pada teks yang dapat dibandingkan dengan menggunakan persamaan 2.
2 X C
A+B
(2)
dengan
S = Nilai Kesamaan
A + B = Jumlah hash pada string A dan string B
C = Jumlah hash yang sama antara string A dan
string B
Hasil matching antara teks yang diuji dengan teks pembanding memiliki hasil seperti berikut.
2 x 168
S =-------
195 + 221
336
S =-- 416
S = 0,8076
Perhitungan Persentase Similarity
Persentase similarity didapatkan dengan pengalian hasil matching dengan 100% sehingga menghasilkan nilai persentase sebesar 80,76%.
Penentuan Respons
Setelah mendapatkan nilai persentase similarity, setiap data uji twitter akan dibandingkan dengan masing-masing data latih twitter. Nilai persentase tertinggi akan dijadikan sebagai acuan untuk mennetukan respons. Jika nilai persentase melebihi 70%, data tweet tersebut dianggap valid dijadikan sebagai penentu dan hasil pemetaan jawaban untuk tweet tersebut akan dijadikan hasil respons. Berdasarkan dari pengujian dengan data training sejumlah 485 data tweet yang sudah dilakukan didapatkan hasil kesamaan tweet dengan persentase tertinggi adalah 80,76 % dengan tweet
” Mohon pihak terkait untuk memperbaiki lampu penerangan jalan yang sudah mati sekitar setahun lebih tidak ditindaklanjuti”
Hasil pemetaan respons dari data pelatihan yang sebelumnya telah dilakukan pada tweet tersebut menghasilkan respons sebagai berikut:
” Terima kasih telah mengajukan pengaduan. Pengaduan Anda akan dikirim ke aplikasi Sidumas.”
-
D. Pengujian
Data respons dari hasil metode Rabin-Karp selanjutnya diujikan untuk penentuan pengaruh Word2Vec dan pengujian K-Gram. Data tweet akan mendapatkan respons jika memiliki nilai persentase kesamaan lebih dari 70%. Jika tidak memenuhi syarat tersebut, data tersebut tidak akan menerima respons secara otomatis. Dalam pengujian kesesuaian, respons akan diperiksa oleh Bidang PIP Kabupaten Badung untuk memastikan kebenaran dan keseuaiannya. Nilai akurasi di
DOI: https://doi.org/10.24843/MITE.2023.v22i02.P15 diperoleh dari perbadingan nilai data uji yang benar dengan total data uji sejumlah 110 data . Nilai akurasi menggunakan persamaan 3
_ JumlahDataBenart^QQ0/
Jumlah Semua Data
Pengujian implementasi Word2Vec
Pengujian yang menggunakan 110 data uji ini akan melihat pengaruh penerapan metode Word2Vec dalam penentuan respons dengan menggunakan metode Rabin-Karp. Hasil akhirnya adalah tingkat perbedaan nilai kemiripan sebelum dan setelah penggunaan Word2Vec yang ditunjukkan pada Tabel VIII.
TABEL VVIII Hasil Pengujian Pengaruh Word2Vec | |||
Pengujian |
Kesamaan > 70% |
Kesesuaian |
Akurasi (%) |
Tidak Menggunakan Word2Vec |
17 |
13 |
11,81 |
Menggunakan Word2Vec |
101 |
82 |
74,55 |
Tabel VIII menunjukkan bahwa Word2Vec sangat memengaruhi hasil kemiripan tweet, tingkat akurasi yang diperoleh adlaah 74,55%.
Pengujian K-Gram
Pengujian ini dilakukan untuk mengetahui interpretasi yang berbeda dari setiap nilai k pada K-Gram. Untuk hasil pengujian K-Gram dengan jumlah data uji sebanyak 110 dijelaskan pada Tabel IX.
TABEL VVIIII
Hasil Pengujian K-Gram
K-Gram |
Kesamaan > 70% |
Kesesuaian |
Akurasi Kesesuaian (%) |
3 |
101 |
82 |
74,55 |
4 |
57 |
49 |
44,55 |
5 |
48 |
40 |
36,36 |
6 |
45 |
37 |
33,64 |
Berdasarkan hasil pengujian yang telah dilakukan diperoleh semakin tinggi nilai K-Gram yang digunakan, semakin rendah pula nilai kemiripan yang didapatkan.
Sejumlah sumber referensi dan data pendukung diperlukan dalam pelaksanaan penelitian ini sebagai pijakan utama untuk pengembangan dan perbandingan dengan penelitian sebelumnya. Oleh karena itu, berbagai rujukan penelitian terdahulu yang relevan berikut ini dianggap penting dan perlu diperhatikan.
Luh Ayu Fernita: Analisis Penentuan Respons Twitter…
Penelitian terdahulu yang pernah dilakukan untuk metode Rabin-Karp adalah penelitian [20]. Penelitian tersebut membahas pengembangan media penilaian otomatis menggunakan algoritma Rabin-Karp dengan pendekatan Synonym Recognition. Perhitungan akhir skor siswa yang dilakukan secara otomatis menghasilkan nilai rata-rata sebesar 76,28, sedangkan untuk hasil penilaian yang dilakukan secara manual diperoleh nilai rata-rata sebesar 74,15.
Billhaqi, dkk. [21] telah melakukan penelitian tentang text similarity. Dalam penelitian ini, diusulkan solusi penilaian otomatis menggunakan algoritma Rabin-Karp dan Winnowing untuk menjawab pertanyaan esai dengan tipe deskripsi bebas dan terbatas. Hasil penelitian menunjukkan tingkat akurasi penggunaan algoritma Rabin-Karp lebih baik jika dibandingkan dengan Algoritma Winnowing. Penggunaan Rabin-Karp menghasilkan perbedaan 27,81%, sedangkan penggunaan Winnowing menghasilkan perbedaan 44,32% jika dibandingkan dengan penilaian manual. Penelitian ini memberikan kontribusi penting dalam meningkatkan efisiensi dan tujuan pembelajaran online.
Penelitian yang dilakukan oleh Wijaya, dkk [22] merupakan studi yang membandingkan deteksi plagiarisme menggunakan algoritma BM25 dan Rabin-Karp pada artikel berbahasa Indonesia. Kesimpulan dari penelitian ini bahwa dari segi performa, terutama waktu eksekusi, algoritma Rabin-Karp memiliki performa yang lebih baik dibandingkan dengan algoritma BM25.
Berdasarkan beberapa penelitian tersebut, dapat disimpulkan bahwa metode Rabin-Karp memberikan hasil yang baik dalam penggunaannya untuk kemiripan teks. Dengan penambahan Word2Vec sebagai representasi kata, kinerja Rabin Karp meningkat.
Metode Rabin-Karp efektif dalam menentukan respons berdasarkan data tweet dengan tingkat kemiripan tertinggi. Penggunaan metode Rabin-Karp yang digabungkan dengan metode Word2Vec menghasilkan tingkat akurasi 74,55%. Hasil pengujian K-Gram menunjukkan bahwa semakin rendah nilai K-Gram, maka nilai similarity akan semakin tinggi, begitu juga sebaliknya.
Penelitian ini diharapkan dapat memberikan kontribusi dalam konteks pemerintahan yang responsif terhadap isu-isu masyarakat yang dibahas di Twitter. Untuk itu, hasil yang diperoleh ini perlu divalidasi dengan penambahan data latih dengan tujuan untuk meningkatkan kesesuaian jawaban.
Referensi
-
[1] K. Q. Fredlina, K. T. Werthi, N. P. Widiari, and K. L. Subagia,
“Sosialisasi dan Pelatihan Perlindungan Data Privasi Bagi Siswa di SMKN 3 Denpasar,” JIIP - J. Ilm. Ilmu Pendidik., vol. 4, no. 2, 2021, doi: 10.54371/jiip.v4i2.212.
-
[2] P. A. Permatasari, L. Linawati, and L. Jasa, “Survei Tentang Analisis
Sentimen Pada Media Sosial,” Maj. Ilm. Teknol. Elektro, vol. 20, no. 2, 2021, doi: 10.24843/mite.2021.v20i02.p01.
p-ISSN:1693 – 2951; e-ISSN: 2503-2372
-
[3] R. H. Dwiwina and K. Y. S. Putri, “The Use of the Auto Base
no. 1, doi: 10.1088/1742-6596/1810/1/012032.
Accounts on Twitter as A Media for Sharing Opinions,” Ultim. J. Ilmu Komun., 2021, doi: 10.31937/ultimacomm.v13i1.1603.
-
[4] A. A. Pailendra and T. Gunarto, “Analisis Pengaruh Peran
Masyarakat dan Pemerintah terhadap Pariwisata Curug Klawas Di Lampung Utara,” E-journal F. Econ. Bus. Entrep., vol. 1, no. 3, pp. 237–244, Oct. 2022, doi: 10.23960/efebe.v1i3.40.
-
[5] Y. Astuti and I. R. Wulandari, “An arrangement of the number of K-
grams in the performance of Rabin Karp algorithm in text adjustment,” Indones. J. Electr. Eng. Comput. Sci., vol. 26, no. 3, 2022, doi: 10.11591/ijeecs.v26.i3.pp1388-1394.
-
[6] F. Husain and O. Uzuner, “Investigating the Effect of Preprocessing
Arabic Text on Offensive Language and Hate Speech Detection,” ACM Trans. Asian Low-Resource Lang. Inf. Process., vol. 21, no. 4, 2022, doi: 10.1145/3501398.
-
[7] V. A. Flores, L. Jasa, and L. Linawati, “Analisis Sentimen untuk
Mengetahui Kelemahan dan Kelebihan Pesaing Bisnis Rumah Makan Berdasarkan Komentar Positif dan Negatif di Instagram,” Maj. Ilm. Teknol. Elektro, vol. 19, no. 1, 2020, doi:
10.24843/mite.2020.v19i01.p07.
-
[8] S. Juniarsih, E. F. Ripanti, and E. E. Pratama, “Implementasi Naive
Bayes Classifier pada Opinion Mining Berdasarkan Tweets Masyarakat Terkait Kinerja Presiden dalam Aspek Ekonomi,” J. Sist. dan Teknol. Inf., vol. 8, no. 3, 2020, doi: 10.26418/justin.v8i3.39118.
-
[9] S. Styawati, A. Nurkholis, A. A. Aldino, S. Samsugi, E. Suryati, and
-
R. P. Cahyono, “Sentiment Analysis on Online Transportation Reviews Using Word2Vec Text Embedding Model Feature Extraction and Support Vector Machine (SVM) Algorithm,” 2022, doi: 10.1109/ISMODE53584.2022.9742906.
-
[10] R. Kosasih and A. Alberto, “Sentiment analysis of game product on
shopee using the TF-IDF method and naive bayes classifier,” Ilk. J. Ilm., vol. 13, no. 2, 2021, doi: 10.33096/ilkom.v13i2.721.101-109.
-
[11] B. R. Lidiawaty, M. E. Zulfaqor, O. Diyantara, and D. R. S. Dewi,
“Keywords Generator From Paragraph Text Using Text Mining in Bahasa Indonesia,” 2022, doi: 10.1109/IRTM54583.2022.9791753.
-
[12] I. D. Wahyono et al., “Shared Nearest Neighbour in Text Mining for
Classification Material in Online Learning Using Mobile Application,” Int. J. Interact. Mob. Technol., vol. 16, no. 4, 2022, doi: 10.3991/ijim.v16i04.28991.
-
[13] S. K. Bharti, R. K. Gupta, S. Patel, and M. Shah, “Context-Based
Bigram Model for POS Tagging in Hindi: A Heuristic Approach,” Ann. Data Sci., 2022, doi: 10.1007/s40745-022-00434-4.
-
[14] Y. Qiao, W. Zhang, X. Du, and M. Guizani, “Malware Classification
Based on Multilayer Perception and Word2Vec for IoT Security,” ACM Trans. Internet Technol., vol. 22, no. 1, 2022, doi:
10.1145/3436751.
-
[15] S. Wang, C. Aggarwal, and H. Liu, “Beyond word2vec: Distance
graph tensor factorization for word and document embeddings,” 2019, doi: 10.1145/3357384.3358051.
-
[16] K. A. Sekarwati, L. Y. Banowosari, I. M. Wiryana, and D. Kerami,
“Pengukuran Kemiripan Dokumen dengan Menggunakan Tools Gensim,” Pros. SNST ke-6 Tahun 2015, 2015.
-
[17] I. Z. Simanjuntak, “Analisa Kombinasi Algoritma Stemming Dan
Algoritma Soundex Dalam Pencarian Kata Bahasa Indonesia,” Inf. dan Teknol. Ilm., vol. 10, no. 1, 2022.
-
[18] S. L. B. Ginting, Y. R. Ginting, S. Sutono, and W. A. Sirait, “Aplikasi
Deteksi Kemiripan Kata Menggunakan Algoritma Rabin-Karp,” J. Teknol. dan Inf., vol. 12, no. 2, 2022, doi: 10.34010/jati.v12i2.6947.
-
[19] A. C. D. Sitepu, “Representasi Teknik Information Retrieval Pada
Perhitungan Rabin-Karp Menggunakan Stemming Nazief-Adriani,” JUTISAL J. Tek. Inform. Univers., vol. 2, no. 1, 2022.
-
[20] E. Hamir, D., & Ekohariadi, “MENGGUNAKAN ALGORITMA
RABIN KARP UNTUK MATA PELAJARAN INFORMATIKA DI MA KANJENG SEPUH Dimas Tifli Irhami Hamir Ekohariadi Abstrak,” J. Inf. Technol. Educ., pp. 19–27, 2018.
-
[21] T. T. I. Billhaqqi, G. W. Wicaksono, and C. S. K. Aditya,
“Comparison analysis of Rabin-Karp and Winnowing algorithms in automated essay answer assessment system,” in AIP Conference Proceedings, 2022, vol. 2453, doi: 10.1063/5.0095186.
-
[22] I. N. S. W. Wijaya, K. A. Seputra, and W. G. S. Parwita,
“Comparison of the BM25 and rabinkarp algorithm for plagiarism detection,” in Journal of Physics: Conference Series, 2021, vol. 1810,
ISSN 1693 – 2951
Luh Ayu Fernita: Analisis Penentuan Respons Twitter…
Discussion and feedback