Geçerli Mahout 0.8-SNAPSHOT, Topic Modelleme için bir Daralmış Değişken Bayes (cvb) sürümü içerir ve Gizli Yönlendirme Analizi (lda) yaklaşımını kaldırır, çünkü cvb daha iyi bir şekilde paralelleştirilebilir. Ne yazık ki, bir örnek nasıl çalıştırılacağı ve anlamlı bir çıktı elde edileceği konusunda sadece lda belgesi bulunmaktadır.mahout'da çalışma cvb 0.8
Böylece istediğim için:
- preprocess doğru
- cvb ait cvb0_local sürümünü çalıştırmak bazı metinler
- oluşturulan konuların her birinde üst n kelimeleri bakarak sonuçları incelemek
eache konular documen alınamadı için herhangi bir yolu var mı: --maxIterations (-m) maxIterations
Ben -m 20 kullanmak ve onu
çalışır bakın ts? ya da başka bir şekilde, belge konularını geri almak için? –