JNATIA Volume 1, Nomor 4, Agustus 2023

Jurnal Nasional Teknologi Informasi dan Aplikasinya

p-ISSN: 2986-3929

Ekstraksi Fitur pada Nada Gundhul Pacul

Roger Julian Sitorus1, I Gede Santi Astawa2

aProgram Studi Informatika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Udayana

Jalan Raya Kampus Udayana, Bukit Jimbaran, Kuta Selatan, Badung, Bali Indonesia

1roger.v.sitorus@gmail.com

Abstract

MFCC is an effective method in audio feature extraction, including in song and music analysis. This method involves converting the frequency spectrum of the audio signal into the Mel scale, which is more in line with human auditory perception, and then calculating the cepstral coefficient. The results of the MFCC feature extraction on the song "Gundhul Pacul" show the pattern of the song's spectral and rhythmic characteristics. By using the MFCC representation, it is possible to see changes in energy and frequency patterns in audio signals at various time intervals. The results of the MFCC show that there are 13 resulting cepstral coefficients. However, the number of cepstral coefficients can be adjusted depending on the application and specific needs.

Keywords: Features Extraction, MFCC, Gundhul Pacul

  • 1.    Pendahuluan

Dalam dunia musik, analisis lagu dapat memberikan wawasan yang berharga tentang karakteristik musik, struktur harmonik, dan perbedaan genre. Salah satu pendekatan yang digunakan untuk menganalisis lagu adalah ekstraksi fitur audio dengan menggunakan Mel-frequency Cepstral Coefficients (MFCCs). Dalam konteks ini, pendahuluan akan fokus pada penggunaan MFCCs untuk ekstraksi fitur pada lagu "Gundhul Pacul". "Gundhul Pacul" adalah salah satu lagu tradisional yang populer di Indonesia. Lagu ini memiliki sejarah dan keunikan tersendiri, baik dalam hal melodi maupun liriknya. Dalam konteks ini, ekstraksi fitur dengan MFCCs dapat membantu dalam mengidentifikasi karakteristik spektral dan ritmis lagu "Gundhul Pacul". MFCC adalah metode ekstraksi fitur audio yang telah terbukti efektif dalam berbagai aplikasi pengenalan suara dan pemrosesan bahasa alami. Metode ini melibatkan konversi spektrum frekuensi sinyal audio ke dalam skala Mel, yang lebih sesuai dengan persepsi pendengaran manusia, dan kemudian menghitung koefisien cepstral. Dengan menggunakan MFCCs, fitur-fitur spektral dan ritmis lagu "Gundhul Pacul" dapat diekstraksi dengan lebih efektif dan menggambarkan ciri khasnya. Penelitian terkait dengan MFCC pada data musik telah dilakukan. Penelitian yang dilakukan adalah. Data yang digunakan adalah file musik instrumental sebanyak 200 dataset. 200 file musik tersebut memiliki 4 kategori mood, yaitu relax, sad, happy, angry. Fitur yang akan diektraksi ada 13 koefisien MFCC. setiap file akan berdurasi 60s dengan panjang frame 40ms dan overlap 40%. kemudian hasil akurasi cross validation knn sebesar 85,5%, precision 87,34% dan recall 85,5% dan nilai k=5 dan metode jarak yang digunakan adalah manhattan disctance [1]. Penelitian lainnya dilakukan oleh. Peneliti melakukan Deteksi Nada Dasar Alat Musik Panting. Metode yang digunakan dalam penelitian ada 3 ,yaitu compressive sensing, Mel-Frequency Cepstral Coefficient dan Support Vector Machine. Data yang digunakan adalah nada dasar do, re, mi, fa, sol, la, si yang didapatkan dari alat musik Panting. Sampel data yang digunakan dalam penelitian ada 140 nada dengan 20 sampel per nada. Durasi audio untuk setiap nada adalah 1 detik. Sampel audio dibagi kedalam 6 rasio, antara lain, 0.625%, 1.25%, 2.5%, 5%, 10%, dan rasio normal. Ada 4 parameter ciri yang digunakan dalam ekstraksi ciri MFCC, yaitu zero crossing rate (ZCR), spectral rolloff, ciri MFCC sebanyak 20, dan mel-spectogram. Hasil akurasi terbaik diperoleh oleh audio terkompresi 2.5% yang memiliki akurasi dan f1-score 98%. Hasil MAE 0.05 dalam waktu klasifikasi 0,062 detik [2]. Dalam penelitian ini, tujuan utama adalah menerapkan ekstraksi fitur dengan MFCCs pada lagu "Gundhul Pacul".

Kami berharap bahwa dengan menggunakan teknik ini, kita dapat menggali lebih dalam tentang pola karakteristik dan kesamaan antara nada-nada dalam lagu ini. Dengan demikian, kita dapat memahami struktur musik "Gundhul Pacul" secara lebih mendalam, serta mengidentifikasi perbedaan atau variasi dalam ekspresi vokal dan instrumen yang digunakan. Melalui penelitian ini, diharapkan kita dapat memberikan sumbangan kepada pemahaman kita tentang lagu "Gundhul Pacul" secara musikal dan memperkaya budaya musik tradisional Indonesia. Dengan menggunakan ekstraksi fitur MFCCs, kita dapat memberikan wawasan baru tentang lagu ini, memungkinkan analisis yang lebih dalam dan pemahaman yang lebih luas tentang karakteristik dan keunikan musik tradisional ini.

  • 2.    Metode Penelitian

Dalam melakukan ekstraksi fitur pada musik gundhul pacul diperlukan berbagai tahapan yang harus dilakukan untuk bisa mendapatkan luaran yang memiliki tingkat akurasi yang cukup tinggi. Adapun tahapan-tahapan tersebut, antara lain:

  • a.    Studi Literatur

Pada tahap ini dilakukan pencarian referensi terkait penelitian yang dilakukan. Tahapan ini penulis melakukan studi mengenai topik yang akan dibahas. Hal ini ditujukan agar penulis dapat memahami secara mendalam mengenai ekstraksi fitur pada kasus yang akan dilakukan. Dengan hasil studi tersebut, penulis mendapatkan metode ataupun kombinasi metode yang cocok untuk digunakan dalam penelitian. Dalam pembahasan ekstraksi fitur pada nada lagu gundhul pacul diperoleh beberapa referensi terkait. Metode MFCC telah banyak digunakan untuk ekstraksi fitur pada data audio,termasuk data musik.

  • b.    Pengumpulan Data

Pada penelitian kali ini, data yang akan digunakan adalah gabungan data primer dan sekunder. Data tersebut berupa WAV audio lagu gundhul pacul. Data mp3 tersebut diperoleh dari youtube video yang dikonversi menjadi format WAV dan terdapat data yang diperoleh dari memainkan nada lagu dari gundhul pacul.

  • c.    Perancangan Sistem

Sistem yang akan dibangun adalah ekstraksi fitur lagu gundhul pacul. Data yang akan digunakan pada sistem adalah data mentah. Jadi, akan dilakukan pemotongan sinyal audio menjadi beberapa bagian frame. Hasil dari pemotongan tersebut akan dilakukan ekstraksi fitur dengan metode MFCC.

Gambar 1. Flowchart Pembuatan Sistem

  • d.    Ekstraksi Fitur

Ekstraksi fitur suara adalah proses yang bertujuan mendapatkan vektor ciri dari sebuah suara. Pada penelitian ini ekstraksi fitur suara dilakukan menggunakan algoritma MFCC yang didasarkan pada persepsi sistem pendengaran manusia. Secara umum MFCC mempunyai lima

proses yaitu frame blocking, windowing, FFT, mel-frequency wrapping, dan cepstrum. Flowchart ekstraksi fitur menggunakan algoritma MFCC dapat dilihat pada gambar 2 [3].

  • a.    Frame Blocking

Pada tahap pertama metode MFCC adalah melakukukan frame blocking. Frame blocking adalah proses dimana sinyal pada audio akan dipotong menjadi beberapa yang disebut frame. Proses pertama MFCC adalah frame blocking di mana sinyal dipotong menjadi beberapa bagian yang disebut dengan frame. Sinyal yang diterima dipisahkan dalam Frames dan kemudian diambil sampelnya. Setiap frame berisi Sampel 'N' dan berlanjut hingga sampel N-M dan berlanjut hingga sinyal ucapan selesai. Sampel 'N' memiliki nilai 256 dan 'M' memiliki nilai 1000 [4].

  • b.    Windowing

Terakhir, meruncingkan sampel di setiap jendela untuk mengurangi diskontinuitas di tepi jendela sangat bermanfaat. Itu melakukan transformasi berikut pada sampel di jendela sn, n = 1, N [5].

(1)


S'n = {θ.54 - 0.46 cos (2η(ZΓΓ))} Sn

Gambar 2. Rumus

  • c.    Fast Fourier Transform (FFT)

Proses selanjutnya adalah fast fourier transform (FFT) merupakan metode analisis fourier. Analisis fourier adalah metode yang berguna untuk melakukan analisa kepada sinyal yang dimasukkan berupa spectrogram [3].

  • d.    Mel-Frequency Wrapping

Untuk setiap frame ini, spektrum magnitudo dihitung menggunakan Fast Fourier Transform (FFT) dan diubah menjadi kumpulan output dari bank filter skala mel. Analisis bank filter membuat mendapatkan resolusi frekuensi non-linear yang sesuai jauh lebih mudah. Amplitudo bank filter, di sisi lain, sangat berkorelasi, membuat penggunaan transformasi cepstral hampir wajib dalam skenario ini. Pada skala mel, bank filter berbasis transformasi Fourier sederhana dirancang untuk memberikan resolusi yang setara [5].

MEL5PEC


Gambar 3. Mel Scale Filter Bank

  • e.    Cepstrum

Proses terakhir adalah cepstrum yaitu sebuah teknik untuk meningkatkan kualitas pengenalan sinyal suara.

Gambar 4. Flowchart MFCC

  • 3.    Hasil dan Pembahasan

  • a.    Frame Blocking

Pada tahap frame blocking, didapatkan hasil jumlah frame pada audio gundhul pacul adalah 15360. Ukuran frame yang digunakan pada pengujian adalah 1024 dan jarak antara frame adalah 512.

  • b.    Windowing

Original Frames

Gambar 5. Hasil Dari Windowing

  • 1.    Sumbu X (Time): Sumbu horizontal pada gambar menunjukkan waktu dalam unit yang sesuai (misalnya, detik atau milidetik). Setiap titik pada sumbu ini merepresentasikan waktu relatif di sinyal audio.

  • 2.    Sumbu Y (Amplitudo atau Energi): Sumbu vertikal menunjukkan amplitudo atau energi sinyal audio pada setiap frame waktu. Setiap titik atau garis pada sumbu ini merepresentasikan amplitudo atau energi yang terkait dengan frame-frame tersebut.

  • 3.    Frame-frame: Pada gambar, frame-frame sinyal audio ditampilkan sebagai titik-titik atau garis-garis yang berurutan dalam sepanjang sumbu X. Setiap frame mewakili segmen waktu pendek dari sinyal audio yang akan dianalisis secara terpisah.

  • 4.    Windowing: Proses windowing telah diterapkan pada setiap frame untuk mengurangi efek sisi atau transisi yang tajam di batas-batas frame. Fungsi window yang umum digunakan, seperti Hamming atau Hann, memberikan bentuk kurva yang halus pada setiap frame.

  • 5.    Overlap: Biasanya, frame-frame tersebut tumpang tindih satu sama lain untuk mempertahankan kontinuitas informasi waktu di sepanjang sinyal audio. Dengan melakukan tumpang tindih, analisis dapat melibatkan informasi dari beberapa frame sebelumnya dan setelahnya, sehingga memberikan gambaran yang lebih lengkap tentang sinyal audio.

  • c.    Fast Fourier Transform (FFT)

Magnitude

Gambar 6. Fast Fourier Transform (FFT)

d. Mel-Frequency Wrapping


Gambar 7. Mel-Frequency Wrapping


e. Cepstrum


Cepstrum

Magnitude

Gambar 8. Cepstrum


f. MFCC

Gambar 9. MFCC

Dengan menggunakan representasi MFCC, gambar ini memberikan informasi tentang fitur akustik dari sinyal audio. Misalnya, perbedaan intensitas warna antara koefisien MFCC pada berbagai waktu dapat menggambarkan perubahan energi atau pola frekuensi dalam sinyal audio. Pada gambar ini, Anda dapat melihat pola spektral yang ditampilkan oleh koefisien MFCC pada setiap frame waktu. Hal ini memberikan informasi tentang distribusi energi frekuensi dalam sinyal audio pada berbagai interval waktu. Juga, perubahan pola atau bentuk dalam representasi MFCC dapat mengindikasikan perubahan dalam karakteristik audio, seperti perubahan nada, timbre, atau ucapan dalam sinyal audio. Dalam gambar MFCC, terlihat bahwa terdapat 13 koefisien cepstral yang dihasilkan. Namun, jumlah koefisien cepstral dapat disesuaikan tergantung pada aplikasi dan kebutuhan spesifik.

  • 6.    Kesimpulan

Pada penelitian ini, ekstraksi fitur MFCC akan digunakan untuk mengekstraksi fitur pada lagu daerah gundhul pacul. Hasil dari MFCC menunjukkan bahwa ada 13 koefisien cepstral yang dihasilkan. Dihasilkan juga grafik amplitude dan intensitas warna pada grafik MFCC. Grafik tersebut menggambarkan distribusi energi frekuensi pada sinyal audio.

Daftar Pustaka

  • [1]    F. F. Surenggana, A. Aranta, and F. Bimantoro, "Klasifikasi Mood Musik Menggunakan K-Nearest Neighbor Denganmel Frequency Cepstral Coefficients," Jurnal Teknologi Informasi, Komputer dan Aplikasinya, vol. 4, No. 2, September 2022.

  • [2]    A. S. Sankoh, A. R. Musthafa, M. I. Rosadi, and A. Z. Arifin, "Klasterisasi Jenis Musik Menggunakan Kombinasi Algoritma Neural Network, K-Means dan Particle Swarm Optimization," Jurnal Buana Informatika, Volume 6, Nomor 3, Juli 2015: 183-194.

  • [3]    H. Lana, N. A. Sanjaya, I. D. W. B. Atmaja, A. A. I. N. E. Karyawati, I. M. Widiartha, I. G. A. G. A. Kadyanan, "Aplikasi Identifikasi Nada Darbuka Dengan Onset Detection, MFCC, Dan KNN," Jurnal Elektronik Ilmu Komputer Udayana, vol. 11, No.1, Agustus 2022.

  • [4]    H. M. O. A. Marzuqi, S. M. Hussain, Dr. A. Frank, "Device Activation based on Voice Recognition using Mel Frequency Cepstral Coefficients (MFCC’s) Algorithm," International

Research Journal of Engineering and Technology (IRJET), vol. 6, No. 3, Maret 2019.

  • [5]    P. Aurchana, S. Prabavathy, "Musical Instruments Sound Classification using GMM," London Journal of Social Sciences, vol. 1, No. 1, 2021.

1070