kullanarak min değerini içeren satırlar dışında Timestamp ve Machine Ids içeren bir Spark Data Frame var. Her gruptan en düşük zaman damgası değerini kaldırmak istiyorum. Ben kodu aşağıdaki çalıştı:Spark kullanarak HiveContext
sqlC <- sparkRHive.init(sc)
ts_df2<- sql(sqlC,"SELECT ts,Machine FROM sdf2 EXCEPT SELECT MIN(ts),Machine FROM sdf2 GROUP BY Machine")
Ama aşağıdaki hata geliyor:
16/04/06 06:47:52 ERROR RBackendHandler: sql on 35 failed
Error in invokeJava(isStatic = FALSE, objId$id, methodName, ...) :
org.apache.spark.sql.AnalysisException: missing EOF at 'SELECT' near 'EXCEPT'; line 1 pos 35
sorunu nedir? Eğer HiveContext EXCEPT anahtar sözcüğünü desteklemiyorsa, HiveContext'de aynı şeyi yapmanın yolu nedir?
sayesinde bir ton oluşturmak gerekir) (hariç sparkR yerleşik işlevini kullanabilirsiniz !! – ps30