K/V çiftlerini değerlere göre sıralamak ve en büyük beş değeri almak istiyorum. Bunu ilk harita ile K/V'yi geri almayı, FALSE ile azalan sırada sıralamayı ve daha sonra key.value'yu orijinal (ikinci harita) olarak geri almayı ve sonra bigget olan ilk 5'i almayı başardım, kod şudur:almakAyrıntılı Pyspark
RDD.map(lambda x:(x[1],x[0])).sortByKey(False).map(lambda x:(x[1],x[0])).take(5)
i pySpark bir takeOrdered eylem olduğunu biliyorum, ama sadece değerler üzerinde bozdu (ve anahtar üzerinde) i sıralama bir inen nasıl bilmiyorum:
RDD.takeOrdered(5,key = lambda x: x[1])
RDD.takeOrdered (5, lambda (kelime, sayım): -count) – Tagar
https://spark.apache.org/docs/latest/api/python/pyspark.html#pyspark.RDD.takeSiparişli – arj