run
parametresini anladığım kadarıyla, en iyi kümeleri almak için KMeans'in yinelenme sayısı ve maxIterations
her run
numaralı yineleme sayısıdır, doğru mu? 5000 veri noktası olması durumunda onlar için en iyi değerler hangileridir?MaxIterations ve MLlib KMeans içinde çalıştırmak arasındaki fark?
cevap
Cevabımı düzenlediğim yanıtı okudum.
i çalıştırmak kmeans optimum kümeleri ve maxIterations almak için tekrarlanır kaç kez her vadede yineleme sayısını ifade eder anlama gibi, Evet, bu doğru
olduğu doğrudur. Normalde sadece bir kez k-anlamına gelir. Maksimum yinelemeler, k-ortalamalarının merkezi güncellemesi döngüsünün gerçekleşmesine izin vereceğiniz maksimum yineleme sayısıdır.
Spark'in uygulaması, ile anlatılanları destekler, yani. sayısını kaç defa algoritmasını çalıştırabilirsiniz. Genellikle gerekli değildir. Özellikle k-araçları metriğinin optimizasyonu, gerçek hedefinizin ne olduğunu optimize etmediğinden dolayı.
5000 veri noktası olması durumunda bunlar için en iyi değerler hangileridir?
Bu tür sorular sormamalısınız, bunlar her zaman sorun ve veriye bağlıdır. Kullandığınız araçları ve ne anlama geldiklerini ve onlarla nasıl yineleneceğini daha iyi anlamak için çalışmalısınız. Bu, bu tür bir soruyu sormak istediğiniz ya da garanti edildiği takdirde, başka hangi bağlamın gerekli olduğu gibi bir durumun ortaya çıkmasından kaçınmanıza yardımcı olacaktır (sadece referans noktalarının sayısı, herhangi bir anlamlı tartışma için yeterli bağlam değildir).
- 1. mllib kmeans kümesindeki küme etiketlerini alın pyspark
- 2. kmeans I kmeans(), R işlevi kullanıyorum R
- 3. boyut uyumsuzluğu hatası kullanılarak Kıvılcım/MLLib kmeans aşağıdaki biçimde bir giriş dosyası var
- 4. R içinde `=` ve `<-` arasındaki fark nedir?
- 5. Node.js içinde path.normalize ve path.resolve arasındaki fark
- 6. R içinde glmnet() ve cv.glmnet() arasındaki fark?
- 7. matplotlib içinde plt.draw() ve plt.show() arasındaki fark
- 8. $ arasındaki fark nedir? ve PowerShell
- 9. Saniye içinde 2 tarih arasındaki fark ios
- 10. // düğümünde ve/descendant :: node içinde xpath arasındaki fark nedir?
- 11. Sequelize ORM içinde HasOne ve AitOF arasındaki fark
- 12. Java içinde Class.this ve bu arasındaki fark nedir?
- 13. arasındaki fark nedir: Args ve: Catalyst içinde CaptureArgs?
- 14. numba içinde jit ve autojit arasındaki fark nedir?
- 15. C içinde _Bool ve bool türleri arasındaki fark?
- 16. Angular4 içinde ActivatedRoute ve ActivatedRouteSnapshot arasındaki fark nedir?
- 17. sklearn.cross_validation içinde train_test_split ve cross_val_score kullanımı arasındaki fark
- 18. Log4Net içinde kaydedici ve kök düzeyi arasındaki fark nedir?
- 19. MariaDB/MySQL içinde utf8mb4_unicode_ci ve utf8mb4_unicode_520_ci collations arasındaki fark?
- 20. android ve g ++ ubuntu içinde g ++ arasındaki fark nedir?
- 21. SQLite içinde "Metin" ve "Dize" veri türü arasındaki fark
- 22. Kıvılcımlar içinde hdfs: // ve iplik kullanımı arasındaki fark
- 23. XeLaTeX ve pdfLaTeX arasındaki fark
- 24. javax.sql ve java.sql arasındaki fark?
- 25. netTcpContextBinding ve netTcpBinding arasındaki fark
- 26. Sürücü ve sağlayıcı arasındaki fark
- 27. HttpCookie ve Çerez arasındaki fark?
- 28. typedef arasındaki fark ve tanımlamak
- 29. Python'da {} ve [] arasındaki fark nedir?
- 30. Dize [] ve [dize] arasındaki fark