KLASIFIKASI DAN RETRIEVAL MUSIK BERDASARKAN GENRE (SEBUAH STUDI PUSTAKA)
on
Jurnal Ilmiah
ILMU KOMPUTER
Universitas Udayana
Vol. X, No. 1, April 2017
ISSN 1979 - 5661
KLASIFIKASI DAN RETRIEVAL MUSIK BERDASARKAN GENRE (SEBUAH STUDI PUSTAKA)
Gst. Ayu Vida Mastrika Giri 1
Program Studi Teknik Informatika, Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Udayana E-mail: vida.mastrika@cs.unud.ac.id1
ABSTRAK
Genre musik adalah cara yang paling umum digunakan untuk mengorganisasi database musik digital. Mengaitkan genre dengan sebuah musik dapat membantu pendengar musik untuk menemukan musik yang dicari di sebuah database musik yang sangat besar. Pengenalan genre musik adalah hal penting yang telah dipelajari mendalam oleh komunitas Music Information Retrieval (MIR). Musik yang berada pada genre yang sama biasanya memiliki kemiripan karakteristik tertentu yang terkait dengan instrumentasi, struktur ritmis, dan pitch musik. Fitur-fitur akustik musik yang dapat digunakan untuk klasifikasi berdasarkan genre adalah timbre, rhythm, melody/harmony, dan pitch. Teknik-teknik klasifikasi yang dapat digunakan untuk mengimplementasi klasifikasi genre otomatis adalah sistem pakar, klasifikasi supervised, dan klasifikasi unsupervised. Tantangan klasifikasi musik berdasarkan genre adalah tidak adanya konsep yang jelas mengenai genre musik, banyaknya genre musik baru yang muncul, dan pemilihan fitur klasifikasi.
Kata Kunci: Genre, Klasifikasi, Music Information Retrieval.
ABSTRACT
Musical genre is the most common way used to organize music in digital music database. Associating a music with a genre can help music listeners to find music in a very large music database. Musical genre recognition is an important thing that have been studied in depth by Music Information Retrieval (MIR) community. Music that are in the same genre have similar characteristics which are normally associated with a particular instrumentation, rhythmic structure, and the pitch of the music. Music acoustic features that can be used for music genre classification are timbre, rhythm, melody / harmony, and pitch. Classification techniques that can be used to implement an automatic genre classification are expert system, supervised classification and unsupervised classification. Challenges of music genre classification is the absence of clear concept of musical genres, many new musical genre that emerged, and classification feature selection.
Keywords: Classification, Genre, Music Information Retrieval.
Distribusi musik secara elektronik menyebabkan katalog musik menjadi
semakin besar seiring berjalannya waktu. Saat ini tersedia jutaan musik yang bisa dinikmati secara online dengan menggunakan servis dari penyedia streaming musik. Genre musik adalah cara
yang paling umum digunakan untuk mengorganisasi database musik digital (Nanni, et al., 2016). Mengaitkan genre dengan sebuah musik dapat membantu pendengar musik untuk menemukan musik yang dicari di sebuah katalog musik yang sangat besar. Pengenalan genre musik adalah hal penting yang telah dipelajari mendalam oleh komunitas Music Information Retrieval (MIR) sejak tahun 2002.
Pemberian genre pada musik dilakukan secara manual oleh seorang ahli (Tzanetakis & Cook, 2002). Saat ini, dengan bertambahnya jumlah musik yang beredar, pemberian genre secara manual untuk ditampilkan secara online akan membutuhkan waktu dan tenaga ahli. Pemberian genre secara otomatis dapat membantu, mengurangi, atau mengganti peran manusia dalam pemberian genre pada sebuah musik.
Studi pustaka ini membahas tentang genre musik, fitur akustik musik, teknik yang digunakan untuk klasifikasi musik berdasarkan genre, review penelitian dalam bidang klasifikasi musik berdasarkan genre, serta pembahasan tentang tantangan-tantangan yang dihadapi dalam proses klasifikasi musik berdasarkan genre.
Genre musik adalah label yang digunakan oleh manusia untuk mengelompokkan dan mendekripsikan dunia musik yang luas. Genre musik tidak memiliki definisi dan batasan yang tegas karena genre muncul melalui interaksi yang kompleks antara masyarakat, pemasaran, sejarah, dan faktor budaya. (Tzanetakis & Cook, 2002).
Musik yang berada pada genre yang sama biasanya memiliki kemiripan karakteristik tertentu yang terkait dengan instrumendasi, struktur ritmis, dan pitch musik (Tzanetakis & Cook, 2002).
AllMusic (www.allmusic.com) menyajikan musik dalam 21 genre berbeda, yaitu Avant-Garde, Blues, Children’s, Classical, Comedy/Spoken, Country, Easy Listening, Electronic, Folk, Holiday, International, Jazz, Latin, New Age,
Pop/Rock, R&B, Rap, Reggae, Religious, Stage & Screen, dan Vocal.
Genre musik yang disediakan oleh AllMusic berbeda dengan genre yang ada pada Dataset ISMIR 2004. Dataset ISMIR 2004 merupakan salah satu dataset yang paling sering digunakan dalam bidang penelitian retrieval informasi (Nanni, et al., 2016). Dataset ini terdiri dari 1458 musik yang diklasifikasi ke dalam enam genre, yaitu classical, electronic, jazz/blues, metal/punk, rock/pop, dan world.
Tzanetakis dan Cook (2002) membuat sebuah dataset GTZAN yang terdiri dari 10 kelas genre, yaitu blues, classical, country, disco, hip hop, jazz, metal, popular, reggae, dan rock.
Penggunaan fitur akustik (dalam mencari kemiripan musik) dibenarkan oleh fakta bahwa potongan musik yang mirip menggunakan instrumen serupa dan memiliki tekstur suara yang mirip (Shao et al., 2009).
Mengekstrak fitur-fitur adalah langkah pertama dalam sistem pengenalan pola. Setelah fitur-fitur signifikan ditentukan, proses klasifikasi bisa dilakukan. Tzanetakis (2002) membagi fitur-fitur musik yang dapat digunakan untuk klasifikasi berdasarkan genre menjadi tiga jenis, yaitu timbre, rhythm, dan pitch. Sedangkan Scaringella (2006) membagi fitur-fitur musik menjadi tiga jenis, yaitu timbre, melody/harmony, dan rhythm.
-
3.1 Timbre
Timbre didefinisikan sebagai fitur persepsi dari not musik atau suara yang membedakan berbagai jenis suara, seperti suara manusia atau bunyi alat musik. Timbre membuat dua suara dengan pitch dan loudness yang sama terdengar berbeda (Scaringella et al., 2006).
Timbre adalah karakteristik suara atau bunyi yang menunjukkan keunikan dari tiap suara atau bunyi tersebut. Perbedaan timbre pada masing-masing alat musik atau sumber bunyi lain dipengaruhi oleh beberapa hal, seperti perbedaan cara memainkan alat musik, perbedaan alat
resonansi pada sumber bunyi, serta perbedaan materi atau bahan pembuat sumber bunyi (bahan alat musik atau pita suara seseorang).
-
3.2 Rhythm
Rhythm didefinisikan sebagai susunan sistematis suara musik, terutama sesuai dengan durasi dan penekanan periodik. Fitur ini menyarankan variasi dari keteraturan atau kerumitan dari pola ritmik pada potongan musik yang menicu respon emosional (Meyers, 2007).
Pengertian rhythm secara sederhana adalah perulangan bunyi-bunyian menurut pola tertentu dalam sebuah musik. Perulangan bunyi-bunyian ini juga menimbulkan keindahan dan membuat sebuah musik menjadi enak didengar.
-
3.3 Melody, Harmony
Melody didefinisikan sebagai rangkaian nada yang terdengar berurutan serta berirama dan mengungkapkan suatu gagasan, sedangkan harmony dikatakan sebagai paduan nada, yaitu paduan bunyi nyanyian atau permainan musik yang menggunakan dua nada atau lebih yang berbeda tinggi nadanya dan dibunyikan secara serentak. Melody dan harmony digambarkan menggunakan fitur audio tingkat menengah (misalnya, fitur chroma) (Scaringella, et al., 2006).
Pitch adalah tinggi rendah nada dalam suatu bunyi/suara. Pitch berkaitan dengan getaran yang dihasilkan oleh instrumen musik atau suara manusia. Bila getarannya semakin banyak, maka nada yang dihasilkan akan semakin tinggi.
Berikut adalah teknik-teknik klasifikasi yang dapat digunakan untuk mengimplementasi klasifikasi genre otomatis; diantaranya adalah sistem pakar, klasifikasi supervised, dan klasifikasi unsupervised.
-
4.1 Sistem Pakar
Sistem pakar didasarkan pada sekumpulan aturan atau rule yang didefinisikan oleh para ahli. Penerapan sistem pakar dalam klasifikasi musik berdasarkan genre menggunakan sistem pakar dilakukan dengan cara membuat aturan yang memberikan karakteristik tertentu pada sebuah musik yang termasuk pada genre tertentu. Sayangnya pendekatan ini belum bisa diaplikasikan karena tidak ada taksonomi genre yang pasti dan tidak ada karakteristik yang didefinisikan untuk membedakan genre musik satu dengan lainnya.
Pendekatan klasifikasi yang terawasi atau supervised untuk musik berdasarkan genre adalah pendekatan yang paling banyak digunakan untuk klasifikasi musik berdasarkan genre (Kaminskas & Ricci, 2012). Walaupun paling banyak digunakan, tetapi masalah dalam klasifikasi ini sama dengan yang dihadapi teknik sistem pakar, yaitu tidak ada taksonomi genre yang pasti. Masalah ini bisa diatasi dengan membatasi genre yang digunakan dalam sebuah penelitian. Peneliti dalam bidang Music Information Retrieval biasanya menggunakan taksonomi genre yang sederhana yang terdiri dari sekitar 10 genre musik (Kaminskas & Ricci, 2012).
Kelebihan klasifikasi supervised jika dibandingkan dengan sistem pakar adalah klasifikasi supervised dapat menggunakan metode seperti k-Nearest Neighbor (kNN), Support Vector Machine (SVM), atau jaringan syaraf tiruan lainnya seperti Backpropagation yang tidak menggunakan aturan/rule seperti sistem pakar.
Klasifikasi musik berdasarkan genre dengan menggunakan teknik pengelompokan yang tidak terawasi atau unsupervised lebih realistis jika dibandingkan dengan teknik sistem pakar dan klasifikasi supervised karena teknik ini tidak memerlukan taksonomi genre yang pasti.
Kemiripan musik berdasarkan fiturnya dicari dengan menghitung jarak Euclidean atau Cosine. Metode clustering yang sering digunakan adalah K-Means, Self-Organizing Maps (SOM) (Rauber et al., 2003), dan Growing Hierarchial SelfOrganizing Maps (GHSOM) (Rauber et al., 2002).
Hasil dari pengelompokan musik secara unsupervised adalah berupa clustercluster musik tiap cluster-nya terdiri dari musik-musik yang memiliki kemiripan fitur musik. Kelemahan metode ini adalah cluster-cluster yang dihasilkan tidak mempunyai label genre struktur hierarkis, karena musik-musik dikelompokkan hanya berdasarkan kemiripan fiturnya.
Tzanetakis dan Cook (2002) menetapkan standar untuk klasifikasi suara otomatis berdasarkan genre. Mereka mengusulkan tiga set fitur yang mewakili timbre, rhythm, dan pitch. Fitur timbre sebelumnya digunakan untuk pengenalan suara, sedangkan rhythm dan pitch khusus dirancang untuk mewakili aspek musik-rhythm dan harmony (melody). Tzanetakis dan Cook (2002) menggunakan kNN dan GMM untuk mengklasifikasikan musik ke dalam 10 genre. Akurasi klasifikasi genre pada penelitian ini mencapai 61%.
Panchwagh dan Katkar (2016) menggunakan fitur Mel Frequency Cepstrum Coefficients (MFCC), Linear Predictive Coefficient (LPC), dan Zero Crossing Rate (ZCR). Fitur-fitur musik yang telah diekstrak tersebut diklasifikasi dengan menggunakan pembelajaran supervised dan unsupervised (Panchwagh & Katkar, 2016). Classifier yang digunakan adalah Naïve Bayes, Bayes Net, J48, SMO dan Logistic. Classifier tersebut diimplementasikan menggunakan library Java-Weka. Hasil eksperimen menunjukkan bahwa classifier SMO dengan metode preprocessing PKIDiscretize menghasilkan akurasi terbaik, mencapai 100% saat menggunakan fitur MFCC. Dari tiga fitur yang dipakai, MFCC menghasilkan tingkat akurasi tertinggi.
Scrwach dan Stasiak (2016) dalam penelitiannya menggunakan dua classifier, yaitu jaringan syaraf tiruan feed-forward dan kNN. Algoritma Genetika pada penelitian ini digunakan untuk menentukan jumlah nearest neighbor pada kNN dan fitur suara (Serwach & Stasiak, 2016). Fitur yang digunakan adalah timbre, rhythm, dan pitch. Hasil dari penelitian ini menunjukkan bahwa jaringan syaraf tiruan yang berupa non-linear multilayer perceptron memberikan hasil yang jauh lebih baik dibandingkan dengan algoritma kNN. Klasifikasi musik ke dalam 10 dan 11 genre menunjukkan efisiensi sebanyak 60%. Tetapi, dalam pengenalan sub-genre, jaringan syaraf tiruan hanya mencapai 30% dan kNN hanya mencapai 16%. Penelitian ini juga menyatakan bahwa fitur timbre, khususnya MFCC, memberikan pengaruh yang lebih tinggi dalam pengenalan genre musik.
Tantangan utama dalam klasifikasi musik berdasarkan genre adalah tidak adanya konsep yang jelas mengenai genre musik. Hingga saat ini belum ada taksonomi general yang didefinisikan untuk genre musik (Kaminskas & Ricci, 2012). Hal tersebut dapat disebabkan karena genre musik yang terus berkembang dan bertambah seiring berkembangnya industri musik.
Genre musik yang baru sering muncul dan bisa saja berupa hasil gabungan (merge) dari berbagai genre berbeda, misalnya genre psychobilly adalah hasil gabungan dari genre rockabilly dan punk (Scaringella et al., 2006). Tantangannya adalah sistem klasifikasi yang dibuat harus bisa mengakomodasi perubahan dan atau penggabungan dari genre-genre tersebut.
Scrwach dan Stasiak (2016) menyatakan bahwa kesalahan klasifikasi sering berhubungan dengan asal dari sebuah genre, contohnya genre rock terkadang dikenali sebagai genre blues, yang bisa berawal dari fakta bahwa musik rock secara umum adalah turunan dari musik blues. Pengamatan ini mendukung kesulitan-
kesulitan yang terkait dengan
pengenalan/klasifikasi sub-genre.
Pemilihan fitur untuk klasifikasi genre sendiri bisa menjadi tantangan, karena tiap penelitian menggunakan kombinasi fitur akustik musik yang berbeda. Tidak hanya fitur akustik dari musik yang dapat digunakan untuk klasifikasi genre. Informasi visual yang terdapat dalam video musik beserta fitur akustik musiknya dapat digunakan untuk klasifikasi musik berdasarkan genre (Schindler & Rauber, 2015).
Fitur-fitur akustik musik yang dapat digunakan untuk klasifikasi berdasarkan genre adalah timbre, rhythm,
melody/harmony, dan pitch. Fitur akustik musik terbaik yang dapat digunakan adalah Mel Frequency Cepstrum Coefficients (MFCC). Teknik-teknik klasifikasi yang dapat digunakan untuk mengimplementasi klasifikasi genre otomatis adalah sistem pakar, klasifikasi supervised, dan klasifikasi unsupervised.
Tantangan klasifikasi musik berdasarkan genre adalah tidak adanya konsep yang jelas mengenai genre musik, banyaknya genre musik baru yang muncul, dan pemilihan fitur klasifikasi. Fitur klasifikasi yang dapat digunakan tidak hanya berasal dari fitur akustik musik, fitur lainnya juga dapat digunakan, seperti fitur visual yang terdapat dalam video musik.
Kaminskas, M. & Ricci, F., 2012.
Contextual Music Information Retrieval and Recommendation: State of The Art and Challenges. Computer Science Review, 6(2-3), pp. 89-119.
Meyers, O., 2007. A Mood-Based Music Classification and Exploration System. s.l.:Master of Science in Media Arts and Sciences.
Nanni, L. et al., 2016. Combining Visual and Acoustic Features for Music Genre Classification. Expert System with Applications, Volume 45, pp. 108-117.
Panchwagh, M. M. & Katkar, V. D., 2016. Music Genre Classification using Data Mining Algorithm. 2016 Conference on Advances in Signal Processing (CASP), pp. 49-53.
Rauber, A., Pampalk, E. & Merkl, D., 2002. Using Psycho-Acoustic Models and Self-Organizing Maps to Create a Hierarchical Structuring of Music by Sound Similarity. Paris, s.n.
Rauber, A., Pampalk, E. & Merkl, D., 2003. The SOM-enhanced JukeBox: Organization and Visualization of Music Collection Based on Perceptual Models. Journal of New Music Research, pp. 193-210.
Scaringella, N., Zoia, G. & Mlynek, D., 2006. Automatic Genre Classification of Music Content: A Survey. IEEE Signal Processing Magazine, 23(2), pp. 133-141.
Schindler, A. & Rauber, A., 2015. An Audio-Visual Approach to Music Genre Classification through Affective Color Features. Advances in Information Retrieval, pp. 61-67.
Serwach, M. & Stasiak, B., 2016. GAbased Parameterization and Feature Selection for Automatic Music Genre Recognition. Computational Problems of Electrical Engineering (CPEE), 2016 17th International Conference.
Shao, B., Wang, D., Li, T. & Ogihara, M., 2009. Music Recommendation Based on Acoustic Features and User Access Patterns. IEEE Transactions on Audio, Speech, and Language Processing, 17(8), pp. 1602-1611.
Tzanetakis, G. & Cook, P., 2002. Musical Genre Classification of Audio Signals. IEEE Transactions on Speech and Audio Processing, 10(5), pp. 293-302.
Discussion and feedback