2017-05-01 21 views
5

Şu anda google yardımcısı SDK ses girişini kabul ediyor, bu da benim soruğumun oldukça basit olduğu anlamına geliyor: Google asistanıyla sohbet etmek istiyorum ancak ses kullanma, sohbet etme. Bu, örneğin, Google Allo'da olabilir. Google, metin girişi için bir API'ya sahip mi?Google Asistanına metin girişini nasıl gönderebiliriz?

+1

arasında v1alpha2 sürümünde artık destekleniyor henüz mümkün değil O ama ([Bu tartışmayı] katılmaya teşvik https://plus.google.com/101852559274654726533/posts/ Google+ topluluğunda bu konuda BskrFscRYdh). – proppy

cevap

2

Google'ın Yardımcısı SDK Servis

0

SDK için henüz bir metin seçeneği yoktur. Gelecekte belki.

+0

Sen de kullanarak çalıştırmak için komut izni vermek için hatırlamak _references_ veya _proof_ –

1

Bu yüzden sdk metni kabul ediyor gibi görünüyor, ancak bir ses dosyası girişi kabul ediyor. Hatta bir ses dosyası olarak çıktılar.

python -m pushtotalk -i somefile.wav -o outputfile.wav 

Bu

beni düşündürdü ve ben bir senaryo yazdım:

echo $1 >> query.txt 
espeak -f query.txt -w audio_query.wav 
python -m pushtotalk -i audio_query.wav -o audio_response.wav &> pushtotalk.log 
pocketsphinx_continuous -infile audio_response.wav 2> pocketsphinx.log > response.txt 
cat response.txt 

rm response.txt query.txt audio_query.wav audio_response.wav pocketsphinx.log pushtotalk.log 

Bu sadece bir kabuk, ancak bu muhtemelen çok piton dönüştürülebilir. Bunu kullanmak için, komut dosyasını pushtotalk_script.sh olarak kaydedin ve ./pushtotalk_script.sh "how tall is mount kilamanjaro?'u çalıştırın. Metni wav dosyasına dönüştürmek için espeak kullanıyorum. Daha sonra yanıt almak için yardımcı sdk'yi kullanın. Burada durabilir ve cevabı oynayabilirsin. Pocketsphinx CMU tarafından oluşturulan bir ses transcriber motorudur. Apt-get kullanarak bu araçlar için paketler bulabilirsiniz, ancak OSX üzerindeyseniz, pocketsphinx paketi çalışmaz ve bu formulas'a dokunmanız gerekir. Ayrıca, burada espeak kullanmak için bir python module. Ve bir python modülü olarak pocketsphinx için bir repo var ama ikiden fazla bağlantıyı bağlayamıyorum.

Google'ın Yardımcısı kadar sorun ESpeak çıktı anlama sahip görünmemektedir. PocketSphinx ancak genellikle metin transkripsiyonu sorun biraz var. Ancak basit yanıtlar için iyi çalışır. soru uzunluğu ve tepki ses dosyaları bağlı olarak, tüm işlem yaklaşık 5 ila 10 saniye sürer.

+0

ile cevap desteklemelidir '' 'ben bile konuşma sentezleme düşünce, bu inelegant-- bilmiyorum hissediyor –

+0

chmod'''. –

İlgili konular