Tablodaki Product_IDs değişiklikleri olarak Sayılar dizisi sütununu (Seq_No) oluşturmak istiyorum. Giriş tablosumda sadece Product_ID'ler var ve Seq_No ile çıktı istiyorum. Scala desteklemediği için SQL'de bölüm üzerinden GropuBy veya Row Number kullanamazsınız. Geçerli PRODUCT_ID önceki Product_Ids eşit değildir olarakSpark Scala'da grupby kullanmadan sekans kimlikleri oluşturmanız gerekiyor
Logic : Seq_No = 1
for(i = 2:No_of_Rows)
when Product_IDs(i) != Product_IDs(i-1) then Seq_No(i) = Seq_No(i-1)+1
Else Seq_No(i) = Seq_No(i-1)
end as Seq_No
Product_IDs Seq_No
ID1 1
ID1 1
ID1 1
ID2 2
ID3 3
ID3 3
ID3 3
ID3 3
ID1 4
ID1 4
ID4 5
ID5 6
ID3 7
ID6 8
ID6 8
ID5 9
ID5 9
ID4 10
Yani Seq_No oluşturmak istiyorum. Giriş tablonun Product_ID'leri yalnızca bir sütunu var ve Spark Scala'yı kullanarak Seq_No ile Product_ID'leri istiyoruz.
gibi bir şey istiyorum düşünün. – Nikhil
Lütfen sorunuzunuzu düzeltin ve daha açık olun –