14

Masaüstü veya tarayıcı ortamları için bilinen API'lerin kapsamlı bir listesi var mı?Metin-konuşma (ses üretimi) ve konuşma-metin (ses tanıma) API'ları?

+0

yazılmıştır. API'larla veya uygulamalarla ilgileniyor musunuz? Bunu sınırlandırmak için yapabileceğiniz dil veya platform seçenekleri var mı? –

+0

Gerçekten çok az iyi çözümün bulunduğunu biliyorum, bu yüzden platformu (geniş anlamda) ve iyi bir metinden konuşmaya ve onlar için konuşma metnine bağlı olarak programlama dilini seçmeye karar verdim. – Halst

cevap

29

Speech recognition in C or Java or PHP?'dan bir yanıt alacak ve güncelleştireceğim. etraflı tarafından bu, ama birkaç ay için bu soruları izlerken itibaren


için bir başlangıç ​​olabilir diye gördüğüm en geliştirici seçimler böyle yıkmak:

, Windows millet - kullanımını .Net veya Microsoft.Speech'in System.Speech özellikleri ve Microsoft'un sağladığı ücretsiz tanıyıcıları yükleyin. Windows 7 tam bir konuşma motoru içerir. Diğerleri ücretsiz olarak indirilebilir. SAPI olarak bilinen motorlara C++ API var. http://msdn.microsoft.com/en-us/magazine/cc163663.aspx'da bakın. veya http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx. Windows için Microsoft altyapıları hakkında daha fazla bilgi What is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?

Linux folks - Sphinx'in iyi bir izlenimi var gibi görünüyor. Nuance, Loquendo, AT&T, IBM, diğerlerini - http://cmusphinx.sourceforge.net/ ve http://cmusphinx.sourceforge.net/wiki/

Ticari ürünlere bakın. Her biri çeşitli diller için kendi SDK'larını ve kütüphanelerini sağlar. Çevrimiçi hizmet - Nuance, Yapme, ispeech.org, vlingo, others. Nuance geliştirici programını geliştirdi ve şimdi geliştirme için size free access to their services verecektir. Yap (inanıyorum) son zamanlarda purchased by Amazon idi, bu yüzden orada bazı değişiklikler görebiliriz.

Tabii bu da yararlı olabilir - http://en.wikipedia.org/wiki/List_of_speech_recognition_software

bir Java konuşma API vardır. Java Speech API http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html'da javax.speech.recognition konusuna bakın. Yine de bu API'yi destekleyen bir konuşma motoru bulmanız gerektiğine inanıyorum. Ben Sfenks tamamen onu destekleyen düşünmüyorum - http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi

diğer SO quesitons sürü vardır: Need text to speech and speech recognition tools for Linux ve yaklaşık http://code.google.com/p/pyspeech/ konuşur pyspeech (python) - Transcribe mp3 files?. Ayrıca,

+1

Kaçırdığınız başka bir resmi olmayan çevrimiçi hizmet ise Google'ın Konuşma API'sı. İşte Java'daki bazı API kancalarına bağlantı: https://github.com/The-Shadow/java-speech-api – Skylion

+2

Google'ın konuşma API'sini herkes tarafından erişilebilir hale getirdiğine inanmıyorum. İnsanlar ters mühendislik yaptı ve kullandılar, ancak Google'ın 3. taraf kullanımı için desteklediğine inanmıyorum. Yalnızca Chrome tarayıcısı veya Android işletim sistemi tarafından kullanılması gerektiğine inanıyorum. Http://stackoverflow.com/a/12727910/90236 veya http://stackoverflow.com/a/7889565/90236 –

+0

Google'ın API'sine Chrome'da ücretsiz olarak erişebilirsiniz. Web-app uygulamasının uygulaması: https://speechlogger.appspot.com –

2

'a bakmak isteyebilirsiniz. Konuşmanın (ses üretimi) önde gelen API satıcıları YAKiToMe! ve iSpeech'tir. YAKiToMe! kullanıyorum çünkü ses kalitesini en iyi ve en az pahalı (çoğunlukla ücretsiz) seviyorum. Birden çok dilde erkek ve dişi konuşmacıları destekliyorlar. Acapella, Nuance, Loquendo ve iVona gibi ses sağlayıcıların bazıları iyi seslere sahiptir, ancak kullanımı pahalı olma eğilimindedir.

1

İşte bunu nasıl yapabileceğiniz: Not: Google'dan bir api, bu nedenle yalnızca Chrome tarayıcısında çalışır.

bir düğme

<input id="speech" type="text" speech="speech" x-webkit-speech="x-webkit-speech" onspeechchange="processspeech();" onwebkitspeechchange="processspeech();" /> 

tanımlayabilir ve bir işlevde sen ne yapmak istediğinizi define (canlı demo izleyin ve burada http://purpledesign.in/blog/?p=33 tam kaynak kodu indirin) senin Bu gibi javascript dosya

İşte

function processspeech() 
    { 
    var speechtext=$("#speech").val(); 
    var elem = document.getElementById("test"); 
    elem.value = speechtext; 
    var notification="\"<span style=\"color:#F00; text-transform:uppercase;\">"+ speechtext + "</span>\" <br />*Is this what you said???"; 
    notify(notification); 
} 

<textarea> id="test"></textarea> 

konuşma textarea gerçekten geniş bir soru olduğunu

+1

Bağlantı, boş bir barındırılan sayfaya yönlendirir. –

İlgili konular