12 toplam çekirdek ve 44 GB bellek içeren 3 düğümlü küçük bir kümem var. Hdfs (5 mb) 'dan küçük bir metin dosyası okuyor ve üzerinde çalışan kmeans algoritması var. Yöneticilerin sayısını 3'e ayarlıyorum ve metin dosyamı üç bölüm halinde bölümlere ayırdım. Uygulama UI'si, yalnızca yöneticilerinden birinin tüm görevleri çalıştırdığını gösterir. İşte uygulama GUI enter image description here ekran görüntüsüdür Ve burada İşler UI: diğerleri boşta iken benim görevler hepsi tek uygulamakla çalışan neden enter image description here birileri beni anlamaya yardımcı olabilir misiniz? Teşekkürler. Dosyanızı 12 bölüme ayırmaya çalışın.kıvılcım bağımsız kümesi, bir çalıştırıcıda çalışan iş
0
A
cevap
1
3 bölümünüz varsa ve her düğümün 4 çekirdeği varsa, 1 düğümde tüm görevleri çalıştırmanız yeterli değildir. Spark, çalışmayı kabaca 1 çekirdeğe 1 bölme olarak ayırır.
İlgili konular
- 1. kıvrık çalışan işlerde kıvılcım ile çalışan
- 2. Tüm kıvılcım boyunca kıvılcım iletimi ile bir kıvılcım işinin çalıştırılması
- 3. Kıvılcım Spark içinde kıvılcım
- 4. Sadece bir iş parçacığında çalışan birkaç 'iş parçacığı' nasıl işlenir
- 5. PARTIAL_WAKE_LOCK ve bir hizmette çalışan iş parçacığı
- 6. Çalışan bir iş sırasında python değişkenlerini okuma
- 7. Kullanılmadığında dataproc kümesi nasıl sonlandırılır?
- 8. Kıvılcım: kıvılcım kabuklarından kıvılcım dosyasını nasıl çalıştırılır
- 9. Python 3 yerine python 2 ile çalışan kıvılcım.
- 10. CountdownTimer UI iş parçacığı güncelleştiren çalışan iş parçacığı içinde
- 11. Kıvılcım
- 12. Kıvılcım
- 13. Komut satırı bağımsız değişkenlerini Linux/Unix üzerinde çalışan bağımsız bir MATLAB çalıştırıcısına nasıl aktarabilirim?
- 14. Kıvılcım
- 15. SharePoint iş akışlarında çalışan parametreler nasıl alınır
- 16. İptal edilebilir çalışan iş parçacığı nasıl uygulanır
- 17. İleti aktarılan bağımsız değişkenleri bir Windows toplu iş dosyasına yönlendiriliyor
- 18. Bir kıvılcım RDD
- 19. Linux çekirdeğinde çalışan sunucu. Dinlemeyi bir iş parçacığında mı yapmalıyım?
- 20. ekran alıntısı çalışan iş parçacığı içinde bir ScrollView olsun
- 21. Bir çalışan iş parçacığındaki yığın taşmasını nasıl önleyebilirim veya kurtarırım?
- 22. Kıvılcım çalışanı belleği
- 23. Dışarıdan iş parçacığı içinde ayrı bir iş parçacığı içinde çalışan ileti kutusu
- 24. Kıvılcım sayfalarını csv dosyası olarak okuma kıvılcım
- 25. Bağımsız Yönetici Vs. İplik Vs. Mesos
- 26. Kıvılcım: dataframe
- 27. Kıvılcım saveAsTextFile yerine bir metin dosyası
- 28. Kıvılcım RDD
- 29. Yükseltme EMR Kümesi?
- 30. Java'da kıvılcım işi: bir kümede çalıştırıldığında 'kaynakların' dosyalarına nasıl erişileceği
Bu kadar büyük bir veri tabanı ve küçük küme için neden böyle bir yazılım yığını kullanıyorsunuz? –
Sadece, kıvılcım kodunun verilerin küçük bir alt kümesinde doğru şekilde çalışıp çalışmadığını ve daha büyük bir veri üzerinde çalıştırıp çalıştırmayacağını görmek istiyorum. –
Aslında araştırma için bir çeşit varyasyon çalışıyorum. Sadece kıvılcım kodunun verilerin küçük bir alt kümesinde doğru şekilde çalışıp çalışmadığını ve daha büyük bir veri üzerinde çalıştırıp çalıştırmayacağını test etmek istiyorum. Uygulamamın neden bu kadar çok iş yarattığını anlayamadım. Ama şimdi bunun hakkında daha fazla düşünürüm, algoritmamın asla yakınlaşmayacağını ve dolayısıyla kıvılcımın çok küçük işler yaratmasına neden olduğunu düşünüyorum. İş çok küçük olduğu için, işi yalnızca bir yürütücüde çalıştırıyor. Yardımın için teşekkürler. –