Spark içinde DataFrames ile çalışırken, yalnızca bu DataFrame'deki belirli bir sütunun değerlerini düzenlemek zorundayım. Örneğin için. Veri çerçevemde count
alanım varsa ve count
her değerine 1
eklemek istiyorsam, DataFrames'ın withColumn
özelliğini kullanarak işi almak için özel bir e-posta yazabilirim veya map
yapabilirim DataFrame üzerinde ve sonra elde edilen RDD'den başka bir DataFrame ayıklayın.Harita ile kullanıcı arasındaki farklar
Bilmek istediğim, bir üferin aslında kaputun altında nasıl çalıştığını bilmek. Bu durumda bir harita/udf kullanarak bir karşılaştırma yapın. Performans farkı nedir?
Teşekkürler!
http://stackoverflow.com/q/38860808/1560062 – zero323