Hem sayısal özellikler hem de metin özellikleri temelinde bir sosyal ağdaki bir gönderideki beğenilme sayısını tahmin etmeye çalışıyorum. Şimdi gerekli özelliklere sahip veri karemem var, ancak yazı metinleriyle ne yapacağımı bilmiyorum. Uygun bir tren matrisini elde etmek için bunu/vektörünü başkalaştırmalı mıyım? Analiz için LinearSVC'yi sklearn'den kullanacağım.nasıl makine öğrenimi için eğitim setinde metin ve sayısal özelliklerini birleştirmek?
cevap
metninizi dönüştürebilir farklı pek çok yolu sayısal olanları içine özellikleri vardır. En yaygın yöntemlerden
biri Kelimeler yaklaşımın Çanta olduğunu. Metninizi, her kelimenin oluşumları ile bir diziye dönüştürdüğünüz yer.
scikit-learn kullanıyorsanız, onların Text Feature extraction User Guide numaralarını okumanızı öneririz.
Ayrıca metin verilerini işlemek için daha karmaşık yollar NLTK toolkit bak.
Cevabınız için teşekkür ederiz. Anladığım kadarıyla, bir Böcek Sözüne ihtiyacım var. Mesajların metin verilerini şimdiden parçalara ayırdım ve ön işlem yaptım. Ben gelecek SVM analizi için bir matris içine katılmasına nasıl sonra ne hiçbir fikrim yok. – dbulgakov
senin fikrin var ve benim kodunda donuk hatalar bulundu. Cevabınız için teşekkür ederim:) – dbulgakov
- 1. Makine öğrenimi için özellikler nasıl oluşturulur
- 2. Scikit'te Doğrusal Regresyon ve Degrade İniş Öğrenimi/Pandalar? Makine öğrenimi için
- 3. Ben Azure Makine Öğrenimi Studio sınamak çalışıyorum Azure Makine Öğrenimi Studio
- 4. Google Cloud - Compute Engine VS Makine Öğrenimi
- 5. Sayısal dizilerde değerleri birleştirmek
- 6. El yazısıyla yazılmış metin için eğitim tesseract
- 7. Metin ve sayısal özelliklerin kombinasyonu nasıl ele alınır?
- 8. Aynı şekildeki iki sayısal dizgiyi koşullu olarak birleştirmek için:
- 9. Transfer öğrenimi için keras.applications'dan modeller nasıl kullanılır?
- 10. Takviye öğrenimi için kerastaki ağırlıklar nasıl güncellenir?
- 11. Tessaract OCR, varsayılan eğitim mekanizması olarak nöronal ağları kullanır
- 12. Eğitim Tesseract OCR belirsizlikler için
- 13. Sayısal girişi sağa ve metin girişini sola nasıl hizalarım?
- 14. Python'dan Ruby öğrenimi;
- 15. Php makine öğrenme kütüphanesi?
- 16. SQL sorgusu için nerede ve sipariş birleştirmek için nasıl
- 17. Vowpal Wabbit eğitim ve test veri formatları
- 18. Unix'teki bir metin dosyasından satırları birleştirmek mi?
- 19. tesseract Eğitim -
- 20. UDF değerleri birleştirmek için
- 21. birden fazla jQuery olayını birleştirmek için kullanabilir ve kullanabiliriz
- 22. Eğitim ve test için Caffe matlab örnekleri CNN
- 23. Ben birleştirmek nasıl aes() ve aes_string() seçenekleri
- 24. Sayısal dizide boyutlar nasıl birleştirilir?
- 25. Doğrusal regresyon tahmini, eğitim verilerini eşleştirmiyor
- 26. yerel makine
- 27. Dizeleri birleştirmek için boşluklar nasıl kaldırılır
- 28. Listelerdeki TFRecord özelliklerini nasıl yazıyorsunuz?
- 29. 2 bit sütunları birleştirmek için nasıl
- 30. App.config değerlerini nasıl okuyabilirim ve özelliklerini Wix
Hangi macnine öğrenme yöntemini kullanmayı planlıyorsunuz? Metin özellikleriyle uğraştığınız için SVM'ler iyi bir seçim olabilir. –
Üzgünüz, bundan bahsetmedim, evet, SVM kullanacağım. Doğrusal SVC. – dbulgakov