Bir RDD'm var ve ona daha fazla RDD eklemek istiyorum. Spark’de bunu nasıl yapabilirim? Aşağıda kodum var. RDD'yi sahip olduğum dStream'den geri almak istiyorum.Spark'deki mevcut RDD'ye nasıl RDD eklenir?
JavaDStream<Object> newDStream = dStream.map(this);
JavaRDD<Object> rdd = context.sparkContext().emptyRDD();
return newDStream.wrapRDD(context.sparkContext().emptyRDD());
ben çok dokümantasyonu Apache Kıvılcım tarafından sağlanan JavaDStream sınıfının yaklaşık wrapRDD yöntemini bulmuyorum.
JavaRDD Listesini tek bir JavaRDD'ye dönüştürebilir miyim? –
Evet. 'JavaRDD.union' kullanabilirsiniz. –
birliği bana Dstream'i verecek, ancak JavaRDD'yi yöntemimin geri dönüş tipi olduğu için istiyorum. –