2013-01-02 23 views
6

Büyük bir proje başlatmak istiyorum ve eşleşme yüzdesini almak için iki ses dosyasını karşılaştırmak gerekiyor.iki ses dosyasını karşılaştırır. ses eşleşmesi

Örnek:

  1. ses A orijinal sestir.

  2. AUDO B mikrofondan kaydedilir. Ben yüzdeler A ne kadar yakın olduğunu B bilmek istiyorum

  3. (herşey sesle dışında ses A'da aynıdır). (% 100 = aynı)

Bunu nasıl yapacağını bilen birileri var mı?

Belki .. dosya B'nin spektrumu ile dosya A'nın spektrumunu karşılaştırarak olası olabilir benim lisans ders projesine ancak görüntü dosyaları ile bu tür bir şey yapmış

+1

Her şey "iki ses dosyasını karşılaştırmak" ile neyi kastediyorsunuz? % 100 hayal etmek kolay ama ne hakkında% 0? Gördüğünüz gibi, "ses dosyalarının karşılaştırılması" tanımı iyi tanımlanmamıştır, böylece çözümünüz de tanımlanmayacaktır. Karşılaştırma, bir algı bakış açısıyla hesaplanmalı mı (her iki ses dosyasında da benzer olan sesler) veya sadece bayt-byte aritmetik bir farka dayanmalıdır? –

+0

Ses işleme ve karşılaştırmaya ilişkin bir kitap yazabilirsiniz, bu nedenle 'aşırı geniş' olarak kapanmaya oy verin. –

+0

Karşılaştırma sizin için ne anlama geliyor? Vokal ve enstrümanı kontrol etmelisin. Bu yardımcı olabilir mi? http://stackoverflow.com/questions/3673042/algorithm-to-remove-vocal-from-sound-track – SomeJavaGuy

cevap

2

. Bakmak istediğiniz şey Cross-correlation. İki sinyal arasındaki benzerlikleri ölçebilirsiniz. Ayrıca, ses dosyalarını önceden işlemek isteyebilirsiniz yani: normalleştirin, gürültüyü gidermek için biraz alçak geçiren filtre uygulayın. Ben Oppenheim'in Dijital Sinyal İşleme öneririm

sinyal işleme derin bir anlayış elde etmek.

Ama yopu bulmak istediğiniz benzerlikleri ne tür bilmek kadar tekrar bu teknikler, oldukça belirsiz

.

+0

Görüntü karşılaştırmasını takip etmek için, bir vektörü temel alarak görüntüleri karşılaştırmak için bir uygulamaya sahip bir şirket (LTU) var ve daha sonra vektörler karşılaştırıldı, bu 2 resim arasındaki farkı yansıtır. Bu bir bayt/bayt karşılaştırması değildir, kırpılmış ve tersine çevrilmiş resimlerle eşleşir. Belki de teknikleri ses dosyalarına uyarlanabilir. Dedi ki, elinizi algolarına götürebileceğinizden şüpheliyim. –

+0

@ Nick.T Ancak, bence bu şeyleri yapmak için bazı açık kaynak projeleri olmalı. –

+0

Sadece biliyorum çünkü bir müşteri bana "Ben LTU istiyorum" dedi. Yani benim için açık kaynak projeleri yok. Bir açık kaynak projesinde bu tür algoların bulunması gerektiğine katılıyorum. Belki de soru "matematiksel" yığınında yeniden yazılabilir ve istenebilir ... –