Modifikasi Metode MFCC untuk Identifikasi Pembicara di Lingkungan Ber-Noise

Authors

  • Yanuar Risah Prayogi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Nahdlatul Ulama Sidoarjo

DOI:

https://doi.org/10.31328/jointecs.v4i1.999

Keywords:

identifikasi pembicara, Mel Frequency Cepstral Coefficient (MFCC) termodifikasi,

Abstract

Beberapa metode ekstraksi fitur untuk sistem identifikasi pembicara memiliki kelemahan yaitu ketika dilingkungan berderau hasil akurasinya menurun. Metode ekstraksi fitur Mel-Frequency Cepstral Coefficient (MFCC) merupakan metode ekstraksi sinyal suara yang peka terhadap derau. Metode MFCC menghasilkan akurasi yang tinggi ketika dilingkungan yang bersih. Sebaliknya ketika di lingkungan yang berderau akurasi yang dihasilkan turun drastis. Penelitian ini mengusulkan metode ekstraksi fitur menggunakan MFCC digabung dengan algoritma deteksi endpoint. Algoritma deteksi endpoint memisahkan daerah speech dan nonspeech. Daerah nonspeech biasanya lebih banyak berisi derau sehingga bisa dijadikan informasi derau. Informasi derau diekstrak dan menghasilkan magnitude frekuensi derau. Uji coba metode yang diusulkan menghasilkan nilai akurasi yang lebih tinggi pada semua tipe derau dan tingkat SNR. Akurasi yang dihasilkan oleh metode yang diusulkan lebih tinggi 14.69% dibanding metode MFCC, 6.4% dibanding metode MFCC+wiener, dan 2.74% dibanding metode MFCC+Spectral Subtraction (SS).

References

P. M. Chauhan and N. P. Desai, “Mel Frequency Cepstral Coefficients (MFCC) based speaker identification in noisy environment using wiener filter.â€

S. Gupta, J. Jaafar, W. wan Ahmad, and A. Bansal, “Feature Extraction Using Mfcc.â€

Wei Han, Cheong-Fat Chan, Chiu-Sing Choy, and Kong-Pang Pun, “An efficient MFCC extraction method in speech recognition.â€

J. Wu and J. Yu, “An improved arithmetic of MFCC in speech recognition system.â€

T. Kinnunen et al., “Low-variance multitaper MFCC features: A case study in robust speaker verification.â€

C. G. K. Leon, “Robust computer voice recognition using improved MFCC algorithm.â€

J. S. Lim and A. V. Oppenheim, “Enhancement and Bandwidth Compression of Noisy Speech.â€

M. Jaafar, A. Ahmad, Z. Sakawi, M. Abdullah, N. Sulaiman, and Normukhnun Mokhtar, “Indeks Kualiti Air ( IKA ) Sg . Selangor pasca pembinaan Water Quality Index ( WQI ) of the Selangor River after the construction of the Selangor River Dam.â€

Bing-Fei Wu and Kun-Ching Wang, “Robust endpoint detection algorithm based on the adaptive band-partitioning spectral entropy in adverse environments.â€

G. Rigoll, “Speaker adaptation using improved speaker Markov models.â€

C. Leimin, “Performance Comparison of New Endpoint Detection Method in Noise Environments.â€

Y. Wang, B. Li, X. Jiang, F. Liu, and L. Wang, “Speaker recognition based on dynamic MFCC parameters.â€

Y. Zhang and W. H. Abdulla, “Robust speaker identification in noisy environment using cross diagonal GTF-ICA feature.â€

W. U. Zunjing and C. A. O. Zhigang, “Improved MFCC-based feature for robust speaker identification.â€

Downloads

Published

2019-07-12

Issue

Section

Articles