2015-10-07 16 views
8

Kıvılcım kullanarak bir iş çalıştırdığımda aşağıdaki günlükleri aldım?Spark günlüklerinde sahne ne anlama geliyor?

[Stage 0:> (0 + 32)/32]

İşte 32 ı istediler Renault Pilot Geliştirme bölümleri sayısına karşılık gelir. Bununla birlikte, neden birden çok aşama olduğunu ve her aşamada tam olarak ne olduğunu anlamıyorum.

Her aşamada görünüşe göre çok fazla zaman alır. Daha az aşamada yapılması mümkün mü?

+0

Oldukça iyi açıklanan bu sunuma bir göz atın https://spark-summit.org/2014/talk/a-deeper-understanding-of-spark-internals – ccheneson

cevap

4

Spark'daki bir aşama, yerel olarak tamamlanan DAG hesaplamanın bir bölümünü temsil eder. Bir aşamada, verilerin karıştırılması gerektiren bir işlem yapılır ve bu nedenle, Spark Kullanıcı Arabirimi'nde bu işlem tarafından adlandırılmış olarak görürsünüz. Eğer Spark 1.4+ kullanıyorsanız, o zaman bile DAG görselleştirme bölümünde kullanıcı arabiriminde bu görselleştirmek: Bölünmüş tam yürütme tamamlamak için karıştır gerektirir, reduceByKey cereyan ettiğine

enter image description here

Bildirimi .