Apache Spark'da yeniyim ve çekirdek veri yapısının RDD olduğunu biliyorum. Şimdi eleman konum bilgisi gerektiren bazı uygulamalar yazıyorum. Örneğin, bir ArrayList'i bir (Java) RDD'ye dönüştürdükten sonra, RDD'deki her bir tam sayı için, onun (global) dizi alt dizisini bilmem gerekir. Bunu yapmak mümkün mü?Spark'in RDD'sinde Öğe Konumunu Nasıl Alabilirim?
Bildiğim kadarıyla RDD için (int) işlevini al, bu yüzden konum bilgilerinin hala RDD'de tutulduğuna inanıyorum.
Evet, RDD oluşturmadan önce ek bir öznitelik olarak dizi alt eklenmesi bu sorunu çözebilir. Bununla birlikte, iki ciddi sınırlama vardır: 1) Açıkça, bu ek indeks özniteliği, depolama maliyetini en azından ikiye katlayacak ve bu maliyet daha da fazla olabilir, örneğin, bir tamsayı/şamandıra dizisinde, endeks için uzun bir int alanı eklenir. 2) Ek endeks değerleri eklendiğinde Spark'e yüklenemediğinden, bu veri dönüşümü Spark ile de paralelleştirilemez. Böylece, dizin eklemek için diğer paralel teknikleri dahil etmeliyim. – SciPioneer