2010-11-01 15 views
12

Konuşulan bir kaydı bilinen bir metne göre senkronize etmek istiyorum. Bunu kolaylaştıracak bir konuşma-metin/doğal dil işleme kütüphanesi var mı? Sözcük sınırlarını tespit etmek ve bir adayın aday eşleşmelerini hesaplamak istediğimi hayal ediyorum. SO üzerinde bulduğum soruların çoğu yazılı dil ile ilgilidir.Metin ve ses senkronizasyonu. Bunu yapmak için bir NLP/konuşma-metin kütüphanesi var mı?

İstenilen, ancak gerekli değildir: Amerikan İngilizcesi ile

  • Uyumlu

    • Açık Kaynak dışı-box
    • Çapraz platform
    • iyice belgelenmiş

    Düzenleme : Bunun çok geniş, hatta saf bir soru olduğunu anlıyorum, bu yüzden rehberlik için şimdiden teşekkürler.

    Ben şimdiye kadar bulduğum Ne:

  • +0

    Aynı şeyi yapmak istiyorum, Sphinx aşırı büyük ve düzensiz belgelenmiş görünüyor. Sonunda neler olup bittiğini merak ediyorsanız ve daha güncel bir şeyden haberdarsanız - bu sorunun 2 yıl geri gittiğini görüyorum, o zamandan beri işler değişmeli mi? –

    +0

    Tartışmaya daha fazla katkıda bulunmak için yeterince öğrenmeden önce projeden ayrıldım. – Justin

    +1

    Kayıt için: Python/C zorunlu hizalayıcısını şu durumlarda koruyorum: https://github.com/readbeyond/aeneas/ –

    cevap

    10

    Zorla Hizalama forced alignment yapmak istiyorum gibi geliyor

    ses ve bilinen metin arasında.

    Zorunlu hizalama, ses ve transkript arasında phone seviye hizalaması bulunmayan veriler hakkında bir tanıma sisteminin eğitiminin önemli bir parçası olduğu için, hemen hemen tüm araştırma/endüstri notu konuşma tanıma sistemleri bunu yapabileceklerdir.

    Hizalama CMUSphinx

    , Carnegie Mellon Üniversitesi'nin açık kaynak konuşma tanıma sisteminin Sphinx4-1.0 beta 5 release artık transkript ve uzun konuşma kayıtları arasındaki uyum nasıl yapılacağına ilişkin bir demo içerir.

    +0

    Fantastik. Burnumun altında olduğunu farketmedim. – Justin

    +0

    Bu Sphinx oldukça kullanışlı görünümlü bir kütüphanedir, ancak iPhone'da nasıl kullanılacağına dair talimatlar oldukça tarihlenmiş (iOS 3?) Ve yorumlar iOS4'te uygulanmasının kolay olmadığını göstermektedir. Bu konuda daha güncel bilgiler var mı acaba? –

    İlgili konular