Implementasi Algoritma K-Means Clustering Berdasarkan Karakteristik Suara untuk Pengelompokan Gender pada Data Audio Waveform
Abstract
Penelitian ini mengimplementasikan algoritma K-Means Clustering untuk mengidentifikasi gender berdasarkan karakteristik suara. Metodologi melibatkan pre-processing data audio, ekstraksi fitur menggunakan Mel-Frequency Cepstral Coefficients (MFCC), dan pengelompokan dengan K-Means. Hasil menunjukkan keberhasilan dalam memisahkan suara menjadi dua cluster: 70.2% suara perempuan dan 29.8% suara laki-laki. Kombinasi MFCC dan K-Means terbukti efektif dalam menangkap perbedaan karakteristik frekuensi antar gender. Metode ini menunjukkan potensi signifikan untuk aplikasi pengenalan suara berbasis gender tanpa memerlukan label awal.