2016-04-14 16 views
0

12 toplam çekirdek ve 44 GB bellek içeren 3 düğümlü küçük bir kümem var. Hdfs (5 mb) 'dan küçük bir metin dosyası okuyor ve üzerinde çalışan kmeans algoritması var. Yöneticilerin sayısını 3'e ayarlıyorum ve metin dosyamı üç bölüm halinde bölümlere ayırdım. Uygulama UI'si, yalnızca yöneticilerinden birinin tüm görevleri çalıştırdığını gösterir. İşte uygulama GUI enter image description here ekran görüntüsüdür Ve burada İşler UI: diğerleri boşta iken benim görevler hepsi tek uygulamakla çalışan neden enter image description here birileri beni anlamaya yardımcı olabilir misiniz? Teşekkürler. Dosyanızı 12 bölüme ayırmaya çalışın.kıvılcım bağımsız kümesi, bir çalıştırıcıda çalışan iş

+0

Bu kadar büyük bir veri tabanı ve küçük küme için neden böyle bir yazılım yığını kullanıyorsunuz? –

+0

Sadece, kıvılcım kodunun verilerin küçük bir alt kümesinde doğru şekilde çalışıp çalışmadığını ve daha büyük bir veri üzerinde çalıştırıp çalıştırmayacağını görmek istiyorum. –

+0

Aslında araştırma için bir çeşit varyasyon çalışıyorum. Sadece kıvılcım kodunun verilerin küçük bir alt kümesinde doğru şekilde çalışıp çalışmadığını ve daha büyük bir veri üzerinde çalıştırıp çalıştırmayacağını test etmek istiyorum. Uygulamamın neden bu kadar çok iş yarattığını anlayamadım. Ama şimdi bunun hakkında daha fazla düşünürüm, algoritmamın asla yakınlaşmayacağını ve dolayısıyla kıvılcımın çok küçük işler yaratmasına neden olduğunu düşünüyorum. İş çok küçük olduğu için, işi yalnızca bir yürütücüde çalıştırıyor. Yardımın için teşekkürler. –

cevap

1

3 bölümünüz varsa ve her düğümün 4 çekirdeği varsa, 1 düğümde tüm görevleri çalıştırmanız yeterli değildir. Spark, çalışmayı kabaca 1 çekirdeğe 1 bölme olarak ayırır.

İlgili konular