2012-11-30 13 views
5

Bu kılavuzu speech recognition numaralı telefondan okuyordum ve konuşma tanıma için üç öğeye ihtiyacım olduğunu belirtti: Akustik model, Dil Modeli, Fonetik Sözlük.PocketSphinx python ve akustik modeli mi ayarlıyorsunuz?

Mikrofondan yakalamak ve 8kHz, 16 bit PCM sesi yeniden örneklemek için Gstreamer kullanan bu python demo ile oynamaya başlamak istedim.

Ben dil modeli ve fonetik sözlük belirtebildiklerinden görüyorum ve [CMU tarafından sağlanan] birini kullanın:

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/ 

Ama akustik modeli belirtin gereken yerde karıştı? Gstreamer'ın örtülü olarak kullandığım kendi akustik modeline sahip mi? Ben biraz daha iyi sonuçlar için buraya sağlanan akustik modeli kullanmak umuyordum:

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Acoustic%20Model/ 

(. Köprüler hakkında ben 10'dan az temsilcisi ile 2'den fazla link gönderemezsiniz Maalesef)

cevap

3

Ama Akustik modeli belirtmem gereken yerde kafam karıştı mı?

Modeli, gstreamer öğesinin hmm özelliği ile belirtebilirsiniz. o

asr.set_property('lm', '/home/user/mylanguagemodel.lm') 

öğretici

kaplı Tıpkı Sen

asr.set_property('hmm', '/home/user/acoustic_model_folder') 

gstreamer ben örtük kullanıyorum kendi akustik modeli var mı kullanabilir?

Evet, varsayılan olarak dağıtımından ABD İngiliz modeli hub4wsj_sc_8k kullanır

İlgili konular