Amacım, sözcükleri bir metin belgeleri kümesine göre ne kadar benzediğine göre kümelendirmektir. Her bir çift kelime arasında Jaccard Benzerliği hesapladım. Başka bir deyişle, benimle kullanılabilir bir seyrek mesafe matrisi var. Birisi bana girdi matrisini girdi olarak alan herhangi bir kümeleme algoritmasına (ve muhtemelen Python'daki kütüphanesine) işaret edebilir mi? Ayrıca önceden küme sayısını bilmiyorum. Sadece bu kelimeleri kümelemek ve hangi kelimelerin bir araya toplandığını bulmak istiyorum.Mesafe Matrisine Dayalı Kümeleme Metodu
cevap
Scipy kümeleme paketi yararlı olabilir (scipy.cluster). scipy.cluster.hierarchy'da hiyerarşik kümeleme işlevleri vardır. Bununla birlikte, bunların giriş olarak bir yoğun matris gerektirdiğini unutmayın (mesafe matrisinin üst üçgeni). Umarım dokümantasyon sayfaları size yardımcı olacaktır.
Çoğu algoritmayı scikit-learn'de önceden hesaplanmış bir uzaklık matrisi ile kullanabilirsiniz. Ne yazık ki birçok algoritma için küme sayısına ihtiyacınız var. DBSCAN, küme sayısını gerektirmeyen ve aynı zamanda isteğe bağlı uzaklık matrislerini kullanan tek örnektir. MeanShift'u da deneyebilirsiniz, ancak bu mesafeleri koordinatlar olarak yorumlayacaktır - bu da işe yarayabilir.
Ayrıca affinity propagation da var, ama gerçekten iyi çalışmadığını görmedim. Çok sayıda küme istiyorsanız, bu yararlı olabilir.
Açıklama: Ben bir scikit-öğrenme çekirdek dev. : // www
kümeleri, giriş olarak bir mesafe matrisi kullanarak bir scikit öğrenme algoritmasının [yeniden üretilebilir bir örneği] (http://stackoverflow.com/help/mcve) sağlayabilir misiniz? – Bryan
Burada bir tane var: http://scikit-learn.org/dev/auto_examples/cluster/plot_segmentation_toy.html –
- 1. Başka bir başlangıç ve bitiş dizileri matrisine dayalı dizin matrisi
- 2. Google MAP API v3: computeDistanceBölüm metodu ve metrik formdaki mesafe
- 3. mesafe
- 4. mesafe?
- 5. Metodu
- 6. Flexclust'tan kümeleme performans istatistikleri nasıl oluşturulur?
- 7. Cassandra'da Kümeleme Anahtarları
- 8. R Kümeleme 'saflık' metriği
- 9. Solr kümeleme bileşeni nedir?
- 10. İskele oturumu kümeleme ClassNotFoundException
- 11. Çevrimiçi k-ortalamalar kümeleme
- 12. Java'da Markov kümeleme algoritması
- 13. HAVERSINE mesafe
- 14. Metodu mockito
- 15. Tuvalimin çeviri matrisine sınırları nasıl yerleştirebilirim?
- 16. k-Javascript'te kümeleme uygulaması mıdır?
- 17. mahout lucene belge kümeleme nasıl?
- 18. Nodejs Kümeleme ve ekspres oturumları
- 19. sns.clustermap önceden hesaplanmış bir uzaklık matrisine nasıl verilir?
- 20. 2 postcodes arasındaki mesafe
- 21. tarihinde Fit API Mesafe -
- 22. Adresler arasındaki mesafe
- 23. SWIFT Realm.io filtreye mesafe
- 24. hakkında Mesafe API
- 25. Java'da mesafe formülünü kullanma
- 26. mesafe matris içinde
- 27. Sözdizimsel benzerlik/mesafe nltk
- 28. Genişletme metodu ile sesli arama metodu arasında bağlantı kurabilirsiniz
- 29. Kümeleme - mesafe matrisi üzerinden kümeleri, nasıl SciPy içinde kümelenme konusunda herhangi yeterince basit öğreticiler veya açıklamalarını bulmak için dikiş olamaz
- 30. UITableViewController init metodu
http://code.google.com/p/em-python/ ve "http://en.wikipedia.org/wiki/Expectation-maximization_algorithm" bakmak – Moj
http da var .pymix.org/pymix/index.php? n = PyMix.Tutorial – Moj
@Moj Üzgünüm ... Bahsettiğiniz linklerde yer alan bilgilerin burada ilgili olduğunu öğrenmek istemiyorum – user2115183