2009-10-24 8 views
9

Zaten mikrofon girişinden gerçek zamanlı olarak hesaplanan FFT ve pitch + mutlak frekansa sahibim. Şimdi tını hesaplamak istiyorum.Mel Frequency Cepstrum Katsayıları Nasıl Çalışır?

Mel Frequency Cepstrum Katsayılarını - MFCC'leri gördüm ama çok iyi anlamadım. birisi bu konuda bana bazı ipuçları verebilir ..

cevap

7

MFCC'ler insan işitme konunun değerlendirilmesini birleştirmek (logaritmik frekans algılama, mel scale) ve müzik aletlerinin fiziği (bu sistemler harmonic çoğu zaman iyi tanımlanmış olan imalar - hangi MFCC'lerin, FFT'nin FFT'sini kullanmasının nedeni, bir enstrümanın tınığının basit bir temsilini vermek (temel frekans ve ses şiddetinin dışa vurulduğu).

Bu konuyla ilgili çok sayıda bitmeyen sayfa yazılabilir ve web'de çok sayıda kullanılabilir, dolayısıyla bilmek istediğiniz şeyi net bir şekilde açıklayan daha spesifik bir soru yardımcı olabilir. MFCC'lerin hesaplanması için algoritma, wikipedia page'un üstünde listelenmiştir. Yanıt için

+0

tks. Bu nedenle, tınıyı elde etmek istersem, MFCC doğru gitmenin yoludur? –

+1

Evet, sanırım, özellikle de problemin ilk saldırısı olarak. Uygulanması çok kolaydır, bunun hakkında çok şey yazılmıştır ve diğer yaklaşımların karşılaştırıldığı bir standarttır (ve genellikle bu karşılaştırmalarda iyidir), bu yüzden iyi bir seçimdir. – tom10

+0

wiki'de algoritma: 1. Bir sinyalin (pencereli bir alıntı) Fourier dönüşümünü yapın. 2. Üçgen üst üste binen pencereleri kullanarak yukarıda elde edilen spektrumun güçlerini, mel ölçeğine eşleyin. 3. Gç frekanslarının her birinde güçlerin kayıtlarını alın. 4. Mel log güçlerinin listesinin ayrık kosinüs dönüşümünü, bir sinyalmiş gibi alın. 5. MFCC'ler, ortaya çıkan spektrumun genlikleridir. Her şeyi anlıyorum ama adım 2: üçgen örtüşen pencereleri kullanma Ne yapmalıyım, sıklığı mel ölçeğine aktar, ancak bu üçgen örtüşen pencere nedir? –