2015-08-04 25 views
9

3 nodlu Spark/Hadoop kümesi üzerinde hangi zamanlayıcı (Yönetici) verimli çalışacak? Şu anda Standalone Manager kullanıyorum, ancak her bir kıvılcım işi için kaçınmak istediğim tüm kaynak parametrelerini (örneğin, çekirdekler, bellek vb.) Açıkça belirtmem gerekiyor. İpliği de denedim, ancak bağımsız yöneticiden 10 kat daha yavaş çalışıyor.Bağımsız Yönetici Vs. İplik Vs. Mesos

Can Mesos yardımcı olabilir mi?

Küme Detayları: Spark 1.2.1 ve ben sadece bağımsız yöneticisi ile gider 3 düğüm kümede Hadoop 2.7.1

+0

[Yasal Uyarı: Bir İplik uzmanı değil] Kümenize eklemeyi planladığınız gelecekteki iş yüküne büyük ölçüde bağlı olduğunu düşünüyorum. Mesos genel bir programlayıcıdır, Yarn ise Hadoop iş yükleri için daha uygundur. – rukletsov

+2

İlgili SE sorusuna bir göz atın: http://stackoverflow.com/questions/28664834/which-cluster-type-should-i-choose-for-spark/34657719#34657719 –

cevap

11

Apaçi Spark dört mod

çalışır
  • Yerel
  • Bağımsız
  • İplik
  • Mesos

Her üç bağımsız, İplik ve Mesos modları dağıtılır ortamı. Dağıtılmış ortamda, kaynak yönetimi, bilgi işlem kaynaklarını yönetmek için çok önemlidir. Dolayısıyla, bilgi işlem kaynaklarını verimli bir şekilde yönetmek için iyi bir kaynak yönetim sistemine veya Kaynak Çizelgesi'ne ihtiyacımız var.

Bağımsız, küçük kıvılcım kümeleri için iyidir, ancak daha büyük kümeler için iyi değildir (Küme düğümlerinde kıvılcımlar (ana + bağımlı) çalıştıran bir yük vardır). Bu daemonlar özel kaynak gerektirir. Dolayısıyla, daha büyük üretim kümeleri için bağımsız olarak önerilmez.

YARN ve Mesos modlarında, Spark bir uygulama olarak çalışır ve hiçbir ek yük kalmaz. Bu yüzden daha iyi performans ve Ölçeklenebilirlik için YARN veya Mesos kullanabiliriz.

YARN ve Mesos arasında, Hadoop kümesini (Apache/CDH/HDP) çalıştırıyorsanız, YARN kullanmak daha iyidir. Yepyeni bir proje durumunda, Mesos (Apache, Mesosfer) kullanmak daha iyidir. Ayrıca, Apache Myriad adlı proje kullanılarak her ikisini de ortak bir şekilde kullanmak için bir hüküm bulunmaktadır.

Her üç moddan da Apache Mesos, daha iyi bir kaynak yönetim yeteneklerine sahiptir.

Bu bağlantıya bakınız, Yarn vs Mesos hakkında ayrıntılı bilgi içermektedir. http://www.quora.com/How-does-YARN-compare-to-Mesos

+10

Ne sayıdaki düğümlerde Standalone'dan Mesos'a (veya İplik'e) geçmeye değer mi? –

6

ek işlemlerin yükü

ödemek olmaz
+0

Aslında, gelecekte daha fazla olacak 100 düğüm. Bu sadece test ortamıdır, ancak sadece burada her şeyi test etmek istiyorum. –