Jurnal Ilmu Komputer VOL. XI No. 2

p-ISSN: 1979-5661

e-ISSN: 2622-321X

Klasifikasi Musik Berdasarkan Genre dengan Metode K-Nearest Neighbor

Gst. Ayu Vida Mastrika Giri

Program Studi Teknik Informatika, Fakultas MIPA, Universitas Udayana Kampus Unud Bukit Jimbaran, Bali, Indonesia [email protected]

Abstrak

Bertambahnya jumlah musik dalam bentuk digital secara pesat menyebabkan pemberian label genre secara manual menjadi tidak efektif. Pemberian label genre secara otomatis dapat dilakukan dengan menerapkan algoritma kecerdasan buatan yang dapat menglasifikasi musik-musik berdasarkan genre dengan menggunakan fitur-fitur musik. Penelitian ini membahas tentang klasifikasi musik berdasarkan genre (classical, EDM, hip-hop, metal, pop, punk, R&B, rap, dan rock) dengan metode K-Nearest Neighbor dengan menggunakan 11 fitur musik (speechiness, energy, danceability, loudness, tempo, mode, valence, instrumentalness, acoustic-ness, dan liveliness). Nilai akurasi klasifikasi pada penelitian ini adalah 44,8%. Nilai tertinggi ada pada genre classical, dengan total akurasi 100% dan nilai terendah ada pada genre pop dengan akurasi 25%.

Kata Kunci: klasifikasi musik, genre musik, k-nearest neighbor

  • 1.    Pendahuluan

Perkembangan dan penyebaran musik secara digital saat ini sangat mudah, hal ini didukung oleh kemajuan teknologi yang pesat. Dengan bertambahnya jumlah musik dalam bentuk digital, terjadi sebuah masalah yaitu bagaimana cara mengorganisasi musik-musik tersebut. Data musik bisa diorganisasi/diatur berdasarkan artis/penyanyi, album, tahun rilis, atau berdasarkan genre.

Genre musik adalah salah satu cara yang sangat umum digunakan untuk mengatur database musik digital[1]. Database/katalog musik yang diorganisasi berdasarkan genre musik memberikan kemudahan pada pendengar musik untuk mencari musik-musik sejenis yang sesuai dengan preferensinya.

Bertambahnya jumlah musik dalam bentuk digital secara pesat menyebabkan pemberian label genre secara manual menjadi tidak efektif. Pemberian label genre secara otomatis dapat dilakukan dengan menerapkan algoritma kecerdasan buatan yang dapat menglasifikasi musik-musik berdasarkan genre dengan menggunakan fitur-fitur musik.

Berbagai teknik klasifikasi dan fitur musik telah digunakan untuk klasifikasi musik berdasarkan genre. Salah satunya adalah klasifikasi musik berdasarkan genre dilakukan oleh [3]. Pada penelitian tersebut, penulis menggunakan algoritma backpropagation untuk klasifikasi musik berdasarkan genre dengan menggunakan 5 fitur musik yaitu key, mode, loudness, energy, dan tempo yang didapat menggunakan EchoNest API (saat ini telah berubah menjadi Spotify API https://developer.spotify.com/web-api/) Dengan menggunakan metode dan fitur tersebut, 56% musik diklasifikasi ke genre yang sesuai.

Penelitian ini membahas tentang klasifikasi musik berdasarkan genre dengan metode K-Nearest Neighbor dengan menggunakan fitur musik dan genre yang lebih beragam dibandingkan dengan yang telah dilakukan oleh [3]. Metode K-Nearest Neighbour digunakan karena metode tersebut lebih sederhana jika dibandingkan dengan jaringan syaraf tiruan yang digunakan oleh [3] dan menghasilkan hasil akurasi yang lebih tinggi seperti ditunjukkan pada penelitian yang dilakukan oleh [2].

  • 2.    Kajian Pustaka

    • 2.1    Genre

Istilah genre biasa digunakan dalam pengelompokan/penglasifikasian musik. Secara sederhana, istilah genre berarti tipe, kelas, atau jenis dari musik. Musik-musik yang termasuk dalam genre yang sama biasanya memiliki bunyi musik yang mirip dan durasi musik yang hamper sama. Para pendengar pun akan mempunyai perilaku/tanggapan yang berbeda jika mendengar musik dari genre yang berbeda.

Genre musik adalah label yang digunakan oleh manusia untuk mengelompokkan dan mendekripsikan dunia musik yang luas. Genre musik tidak memiliki definisi dan batasan yang tegas karena genre muncul melalui interaksi yang kompleks antara masyarakat, pemasaran, sejarah, dan faktor budaya. [2].

Pada era Mozart, ada lima genre utama, yaitu symphony, string quartet, sonata, concerto, dan opera [4]. Pada era musik modern, musik dapat dibagi menjadi berbagai genre seperti classical, electronic, pop, metal, dan rock.

Genre classical adalah kumpulan dari genre musik pada era Mozart dengan bentuk seperti symphony, string quartet, sonata, concerto, dan opera. Musik classical biasa dimainkan dengan alat-alat musik tertentu seperti biola, yang telah ada sejak pertengahan abad ke-19.

Genre electronic adalah musik yang menggunakan alat musik elektronik dan teknologi musik elektronik dalam produksinya. Contoh alat produksi suara electromechanical adalah telharmonium dan gitar elektrik.

Genre metal mengutamakan permainan gitar dan biasanya dimainkan dengan tempo lagu yang sangat cepat. Genre rock mirip dengan metal, mengutamakan permainan gitar tetapi memiliki tempo lagu yang lebih lambat dari genre metal.

Genre hip hop adalah genre musik yang terdiri dari musik berirama dan disertai dengan rap. Genre R&B (Rhythm and Blues) adalah genre musik populer yang menggabungkan jazz, gospel, dan blues. Genre soul adalah sebuah genre musik yang menggabungkan musik gospel dan R&B.

Musik yang berada pada genre yang sama biasanya memiliki kemiripan karakteristik tertentu yang terkait dengan instrumendasi, struktur ritmis, dan pitch musik [2].

  • 2.2    Fitur Musik

Musik terdiri dari fitur-fitur musik seperti mode, harmoni, tempo, ritme, dan dinamik (loudness)[5]. Fitur-fitur lainnya adalah energi, key, timbre, pitch, dan lainnya.

Fitur musik yang digunakan didapat menggunakan Spotify API. Spotify API, atau yang sebelumnya disebut dengan EchoNest API menggunakan signal processing dan machine learning untuk mengekstrak semua fitur dalam musik. Teknik machine learning ini menyimulasikan bagaimana orang mendengar musik, menggabungkan prinsip psychoacoustics, persepsi musik, dan pembelajaran adaptif untuk memodelkan proses fisik dan kognitif dari pendengaran manusia.

Spotify API dapat digunakan untuk mengambil nilai 11 fitur musik yaitu speechiness, energy, danceability, loudness, tempo, mode, valence, instrumentalness, acousticness, dan liveliness.

  • 2.3    K-Nearest Neighbor

Algoritma K-Nearest Neighbor (K-NN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut. Algoritma K-NN menghitung jarak (atau kemiripan) antara tiap data uji dan semua data awal untuk menghitung daftar nearest neighbor-nya. Berikut adalah algoritma K-NN [6].

  • 1.    Diketahui k adalah jumlah nearest neighbor dan D adalah himpunan data awal.

  • 2.    for setiap data awal z = (x’,y’):

  • 3.    Hitung d(x’, x), jarak antara z dengan tiap data, (x, y) D.

  • 4.    Pilih Dz D, sejumlah k data dengan jarak terdekat dengan z.

  • 5.    y' = argmax y' = αrgmαx ∑(x.yi)ez I(v = yi)

    (1)


  • 6.    end for

Pada persamaan (1) v adalah label class, yi adalah label class dari satu nearest neighbor, dan I adalah sebuah fungsi indikator yang mengembalikan nilai 1 jika argumen bernilai benar dan 0 jika argumen bernilai salah. Jarak yang dipakai antara tiap data uji dan semua data awal adalah euclidean distance yang ditunjukkan pada persamaan (2) dengan x dan dan y adalah data uji dan data awal, n adalah jumlah dimensi, xk dan yk adalah atribut ke-k dari x dan y.

(2)


^ (x,y)   ^∑k=l(xk  yk)2

  • 3.    Metode Penelitian

    3.1    Dataset

Musik yang dipergunakan sebagai dataset dalam penelitian ini berasal dari Spotify, berjumlah 40 musik untuk setiap genre. Genre yang digunakan berjumlah 10, yaitu classical, EDM, hiphop, metal, pop, punk, R&B, rap, dan rock. Total musik yang digunakan dalam penelitian ini adalah 400 musik.

Sejumlah 11 fitur musik digunakan pada penelitian ini, yaitu speechiness, energy, danceability, loudness, tempo, mode, valence, instrumentalness, acoustic-ness, dan liveliness yang diambil dengan menggunakan Spotify API.

  • 3.2    Tahap Klasifikasi

Tahap klasifikasi menggunakan metode K-NN, dengan menggunakan jumlah K yang bervariasi dari 3 sampai 10 dengan tujuan utuk mencari nilai K dengan akurasi klasifikasi yang tertinggi. Hasil klasifikasi tiap genre pada klasifikasi dengan akurasi tertinggi akan diteliti lagi untuk melihat genre mana yang akurasinya tertinggi.

  • 4.    Hasil Penelitian

Dataset yang telah terkumpul terdiri dari 400 musik dari 10 genre berbeda. Tiap data musik terdiri dari 11 fitur musik. Gambar 1 menunjukkan persebaran data dilihat dari 3 fitur musik, yaitu acousticness, energy, dan speechiness.

Gambar 1. Persebaran data


Tahap klasifikasi telah dilakukan dengan menggunakan metode K-NN. Tahap klasifikasi pada awalnya bertujuan untuk menentukan nilai K yang akan digunakan. Nilai K yang digunakan adalah yang memiliki error terkecil. Gambar 2 menunjukkan error klasifikasi dengan jumlah K yang berbeda.

Gambar 2. Grafik error dengan nilai K berbeda

Pada Gambar 2 ditunjukkan bahwa error tertinggi ada pada K = 3 dengan nilai 0,67. Pada K = 4 sampai dengan K = 7 terjadi fluktuasi nilai error. Pada K = 8 sampai K = 10, nilai error terus menurun. Nilai akurasi terbaik atau error terkecil ada pada nilai K = 10.

Menggunakan metode K-NN dengan nilai K = 10, musik-musik pada dataset diklasifikasi dan menghasilkan nilai error 55,2% yang berarti sebanyak 55,2% musik diklasifikasi pada kelas yang salah. Dengan kata lain, akurasi klasifikasi penelitian ini hanya 44,8%. Detail akurasi tiap genre dapat dilihat pada Tabel 1.

Tabel 1. Detail klasifikasi tiap genre

Genre

Akurasi

Classical

100,0%

EDM

32,5%

Hip-Hop

75,0%

Metal

42,5%

Pop

25,0%

Punk

35,0%

R&B

40,0%

Rap

30,0%

Rock

30,0%

Soul

37,5%

Rata-rata

44,8%

Genre classical menempati posisi paling tinggi dengan akurasi 100%, yang berarti semua musik classical diklasifikasi dengan benar. Genre pop menempati posisi terendah dengan akurasi 25%, hanya 10 musik yang berhasil diklasifikasi benar.

Fitur acousticness, instrumental-ness, dan energy dari genre classical membuat musik-musik dari genre ini mudah dibedakan dengan genre lainnya. Seperti yang ditunjukkan pada Gambar 3 dan Gambar 4, nilai fitur acousticness dan instrumentalness jauh melebihi genre-genre lainnya.

Gambar 3. Grafik fitur acousticness

Gambar 4. Grafik fitur instrumentalness

Sedangkan fitur energy yang dimiliki genre classical jauh lebih rendah dari genre lainnya, seperti yang ditunjukkan pada Gambar 5.

Rendahnya rata-rata akurasi pada penelitian ini dapat terjadi karena fitur musik yang dipilih tidak melambangkan ciri-ciri dari genre tertentu. Dapat dilihat pada Gambar 6, fitur tempo pada setiap genre berada pada nilai yang hampir sama.

K.M

Gambar 5. Grafik fitur energy

tow

Gambar 6. Grafik fitur tempo

Diperlukan sebuah tahapan seleksi fitur untuk memilih fitur-fitur mana saja yang digunakan dalam penelitian, agar dapat mencapai nilai akurasi klasifikasi berdasarkan genre yang lebih tinggi.

  • 5.    Kesimpulan

Nilai rata-rata klasifikasi musik berdasarkan genre (classical, EDM, hip-hop, metal, pop, punk, R&B, rap, dan rock) yang didapat dengan menggunakan fitur speechiness, energy, danceability, loudness, tempo, mode, valence, instrumentalness, acoustic-ness, dan liveliness adalah 44,8%.

Nilai tertinggi ada pada genre classical, dengan total akurasi 100% dan nilai terendah ada pada genre pop dengan akurasi 25%. Rendahnya rata-rata akurasi pada penelitian ini dapat terjadi karena fitur musik yang dipilih tidak melambangkan ciri-ciri dari genre tertentu.

Pada penelitian selanjutnya dapat dilakukan seleksi fitur untuk menentukan fitur mana saja yang dipakai untuk klasifikasi musik berdasarkan genre, sehingga bisa dicapai nilai akurasi yang lebih tinggi.

Referensi

  • [1]    Loris Nanni, Yandre M.G. Costa, Alessandra Lumini, Moo Young Kim, and Seung Ryul Baek, "Combining Visual and Acoustic Features for Music Genre Classification," Expert System with Applications, vol. 45, pp. 108-117, 2016.

  • [2]    Pang Ning Tan, Michael Steinbach, and Vipin Kumar, Introduction to Data Mining.: Pearson Addison Wesley, 2006.

  • [3]    Rismanda Dewanti, Kadek Cahya Dewi, and Agus Muliantara, "Music Classification Based on Genre using Backpropagation and Social Tagging in Web Music Database," in The 2nd ACIKITA International Conference on Science and Technology (AICST), Jakarta, 2012.

  • [4]    C Wricht, Listening to Music. Boston: Schimer, 2011.

  • [5]    O. Meyers, A Mood-Based Music Classification and Exploration System.: Master of Science in Media Arts and Sciences, 2007.

  • [6]    George Tzanetakis and Perry Cook, "Musical Genre Classification of Audio Signals," IEEE Transactions on Speech and Audio Processing, vol. 10, no. 5, pp. 293-302, 2002.

108