Spark için yeni bir soruyum ve aşağıdaki sorun beni bir süredir rahatsız ediyor., anahtar ve RDD değerleri listesi olan grupByKey RDD'nin çıktısını nasıl işleyebiliriz [K, Liste [v]]
Giriş dosyam virgülle ayrılmış bir dosyadır ve Anahtar olarak sakla ve değerlerin listesi olarak RDD'yi oluşturdu. Bir anahtar (benim durum ürünüm) birden fazla değere sahip olabilir. GroupByKey kullanarak RDD'yi gruplandırdım. Aynı anahtara giren tüm promosyonları getirmek için benim problemimi çözer. Buna kadar her şey yolunda. Şimdi, anahtarımın (mağazanın) belirli bir promosyona sahip olup olmadığını öğrenmek için her bir anahtarın değeri listesinde yinelemek istiyorum. anahtarım terfiyi bulursanız o zaman için bilmek istiyordu
yukarıdaki listede dayalıval firstRDD = sc.textFile(".....")
val secondRDD = firstRDD.map(line=>line.split(",")(0),line.split(",")(1))
val thirdRDD = secondRDD.groupByKey()
(1,(aaa,bbb,ccc,ddd))
(2,(aaa,ccc))
(3,(ddd,aaa))
mağazada (anahtar) ve tanıtım (değer) ile rekor yazma anahtar 1 değer aaa yok veya değilse bbb olup olmadığı aaa Var ya da değil .. Spark Scala'da bunu nasıl yapabilirim.
Harita kullanmadan önce bunu temel bir Scala işlemi olarak düşünün. Eğer bir tupliniz varsa, istediğiniz şeyi almak için nasıl işleyebilirdiniz? – eliasah