Veri çerçevemi bir sütun üzerinde gruplandırmaya çalıştığımda, her bir gruplandırma için en az groupbyDatafram.min('timestampCol')
gruplamayı bulmaya çalıştığımda, bunu sayısal olmayan sütunlarda yapamıyorum. O zaman gruptaki asgari (en erken) tarihi nasıl doğru şekilde filtreleyebilirim?Spark groupBy veri çerçevesi aracılığıyla bir zaman damgası için minimum bulma
Veritabanını bir postgresql S3 örneğinden akışa veriyorum, böylece veriler zaten yapılandırıldı.
Teşekkürler, ama hata alıyorum: bulunamadı: min. –
Şunları deneyin: 'import org.apache.spark.sql.functions._' –
Teşekkürler, çok hızlı bir şekilde üzgünüm bu farklı bir soru ama org.apache.spark.sql.DataFrame = [MIN (ts): timestamp] olsun Tek bir sütunu bir DataFrame olarak döndürmemek için groupMy nesnesine col MIN (ts) eklemenin farzedildiğini düşündüm. Orijinal groupBy nesnesine bu şekilde katılmam gerekir mi? –