Yapmak istediğim şey, insan konuşmasını IPA (Uluslararası Fonetik Alfabe) biçimine çeviren bir API oluşturmaktır. Sorum şu: konuşma sesini orijinal ses dalga biçimi seviyesinde çözmenin kaynakları. Bir API aradım ama bulduğum şeyin çoğu doğrudan doğruya düz alfabeye çeviriyor. Ses fonetiklerini ayırt etme becerisinde biraz daha doğru bir şey yaratmaya çalışıyorum.Konuşma girişini deşifre etme
5
A
cevap
4
Bu projenin, düşündüğünüzden çok daha zor ve karmaşık olduğunu söyleyerek başlamak istiyorum. Metin işlemeye yönelik konuşma, çok büyük ve karmaşık bir alan olup, üzerine yapılan büyük miktarda araştırmadır. Çoğu ayrıştırıcının bir şeyi doğrudan roman karakterlerine yollamasının nedeni, işlenmelerinin çoğunun, hangi kelimelerin birlikte anlamlandığını tahmin etmek için belirsiz seslerin bağlamı ile belirsiz seslerin olasılıksal bir eşlemesi olmasından kaynaklanmaktadır. IPA yerine size Soundex verecek bir şey bulmanız daha olasıdır. Bununla birlikte, bu birkaç cephede yaklaşılan bir sorundur. En iyi bahisten muhtemelen CMU’nun Sfenks projesidir. iyi bir başlangıç vermek, ancak konuşma işleme metne dair bir varsayım yapacak
http://cmusphinx.sourceforge.net/wiki/start
o aslında çok daha gelişmiş olduğunu ve birlikte dalga yoluyla IPA konuşmayı çevirme basit bir yolu yoktur her türlü doğruluk. Sfenks çok modüler ve tamamen açık bir kaynaktır ve bu yüzden size parmaklarınızın ucunda büyük miktarda güç verir ve bu noktada bu işin nasıl yapılacağını anlamanızın mümkün olup olmadığını anlayabilirsiniz. Bu herhangi bir şekilde çözülmüş bir problem değildir.
İlgili konular
- 1. Haskell'deki Okları Deşifre Etme
- 2. Metin girişini reactJs ile simüle etme TestUtils
- 3. Raylar üzerinde omniauth ile facebook girişini entegre etme
- 4. UI iOS'u Test Etme, Güvenli Metin Girişini Seçme textField
- 5. Spring Restful Web Hizmeti'nde JSON girişini Kabul Etme?
- 6. Konuşma Tanıma (Metin Konuşma) android 4.2.2
- 7. Sesli Konuşma kullanarak Metin-Konuşma Sesler
- 8. Konuşma çevirisi
- 9. Google Asistanına metin girişini nasıl gönderebiliriz?
- 10. Windows 8 konuşma metni ve konuşma metni API
- 11. Metin-konuşma (ses üretimi) ve konuşma-metin (ses tanıma) API'ları?
- 12. Clojure için konuşma ve konuşma tanıma kitaplıkları hangi metinleri mevcuttur?
- 13. web konuşma api konuşma sentezi - sesli liste alma
- 14. Metin-konuşma "konuşma" yöntemi için birim nasıl ayarlanır?
- 15. Android Vietnamca Konuşma Metni?
- 16. Vista'da konuşma metni
- 17. Kinect'teki Konuşma Tanıma
- 18. Google konuşma API'si
- 19. TensorFlow kullanarak metinle konuşma
- 20. Konuşma Programına Esnek Metin
- 21. Android için konuşma tanıma
- 22. C# Konuşma Tanıma
- 23. Konuşma tanıma API Android
- 24. Microsoft Konuşma Tanıma Hızı
- 25. OSX'teki Konuşma Tanıma
- 26. Web konuşma API'si,
- 27. Heyecan Dişli Konuşma
- 28. Konuşma metni ayarlaLanguage() çalışmıyor
- 29. C++ şablonunun hata mesajlarının deşifre edilmesi
- 30. Rebol 2 esmtp, AUTH parametresini deşifre edemiyor
Yapmaya değer bir şey gibi geliyor, o zaman. <--> Metindeki konuşmada kullanılan yöntemlerle ilgili bilinenlerden herhangi biri belgelendi mi? – josiah
Hemen hemen tüm cmu sfenks, oldukça kapsamlı bir deney ve modifikasyon günlüğüne sahipler, böylece sadece şu anda en son ve en büyük olarak uygulananları göremezsiniz, aynı zamanda özellikleri bulmaya çalışırken denedikleri deneyleri de görebilirsiniz. optimum performans. http://sourceforge.net/projects/cmusphinx/forums/forum/5470 –
Güzel kaygan. Bu projeyi sabırsızlıkla bekliyorum. Teşekkürler! – josiah