6
pyspark RDD belgelerigöster bölümleri RDD
http://spark.apache.org/docs/1.2.1/api/python/pyspark.html#pyspark.RDD
bir RDD için bölüm bilgilerini görüntülemek için herhangi bir yöntem (ler) göstermez.
ek bir adım ör .:
myrdd.mapPartitions(lambda x: iter[1]).sum()
yukarıda yaptığı işlerde çalıştırmadan bu bilgileri almak için herhangi bir yolu var mı .. ama ekstra çaba gibi görünüyor.
DataFrames Spark 1.3 tanıtıldı ve sıklıkla yerine kullanılır) RDD'lerin Bu cevabı okuyanlar ve bir DataFrame için bölüm sayısını elde etmeye çalışanlar için, onu öncelikle bir RDD'ye dönüştürmelisiniz: 'myDataFrame.rdd.getNumPartitions()'. – dnlbrky