2011-01-16 30 views

cevap

20

gerçek dünya durumda arıyorsanız bu bir automatically assigns priority to bugs göz atın.

Ayrıca, üretimde nasıl kullanabileceğimi hissetmek için birkaç test projesi hazırladım. Stackoverflow soruları için bunlardan biri suggests tags

Bunun için model sadece 1 etiketi olan sorular (veri dökümünden) ile eğitildi. Bu, belirli bir etiketin özelliklerini tanımaya yardımcı olur. Kod ve düzyazı, ayrı özelliklere ayrıldı; bunlardan biri sonuç üzerinde daha büyük bir etkiye sahip olabilir. Bir soru sorulduğunda, ilk 10 etiket önerisini döndürür; gerçek etiketler karşılaştırma için dahil edilmiştir.

"tag","code blocks(200 chars)","body text(200 chars)" 

Bazı karakterler eğitim hataları neden code dışarı filtrelenen: []^|~

Yapısı bir CSV dosyası oldu. Bunlardan hangisinin sorunlara yol açtığından emin değilim.

Test listesine eklenmiş belirli bir soru görmek isterseniz, bana bildirin. Açıkçası, kodun daha iyi olduğunu tahmin eden sorular.

Diğer proje, IMDB verilerine ve yönetmen/aktörlere dayalı olarak movie ratings değerini tahmin ediyor. Etiket suggesterinden farklı olarak, bu canlıdır, böylece ne tahmin edeceğini görmek için farklı kombinasyonları deneyebilirsiniz. Burada

Yapısı oldu: Her iki Google App Engine üzerinde çalışan

rating,"directorId","actorId actorId actorId" 

böylece piton arka sonudur. Belirli bir API kullanmıyorum; Sadece Nick Johnson example code'un bazılarını takip etti.

+0

Harika! Tam olarak görmek istediğim şey! – user94154

+4

Maalesef cevaptaki bağlantılar artık çevrimiçi değil. Bazı güncellenmiş örneklerin var mı? –

3

Bu API'yi kullanmadım. Ama onların website lists aşağıda usecases

  • Öneri sistemleri (demo kodu)
  • Spam algılama (demo kodu)
  • Müşteri duygu analizi
  • Satisi fırsat analizi
  • İleti yönlendirme kararları
  • Teşhis
  • Belge ve e-posta sınıflandırma
  • Şüpheli etkinlik kimlik
  • Yayık analizi
  • Dil kimlik
+0

Yanıt için teşekkürler, ancak Google çalışanlarının bunu/nasıl yaptıkları (yani, hangi dil/kitaplık, veri toplama işlemlerini nasıl yaptıkları, verileri nasıl yapılandırdıkları vb.) Için kullandıklarıyla ilgileniyorum. – user94154