2016-03-21 21 views
1

Scala ve Spark için yeni. Düzenleme mesafesini hesaplayarak mevcut veri sütunlarından yeni bir sütun elde etmek istiyorum. Örneğin FNAME ve LNAME iki kare veri karesidir, FNAME ile LNAME arasındaki mesafeyi koruyan NAMESCORE adlı yeni sütun eklemek istediler. Lütfen bir çalışma veya sahte kod ile bildiriniz.Düzenleme mesafesi veri çerçeve sütunları türetilerek kıvılcımdaki veri çerçevesine yeni sütun ekleme (String)

Bağlantı kısmi bir cevabı aldım.

Derive multiple columns from a single column in a Spark DataFrame

cevap

0

Sen UDF kullanabilirsiniz:

def udfToFindEditDistance(col1 :String,col2 :String): String ={ 
    //find edit distance b/w col1 and col2 
    } 

UDF

val newUDF=udf(udfToFindEditDistance(_:String,_:String)) 

yeni bir sütun

val newDf=df.withColumn("newColumnName",newUDF(df("FNAME"),df("LNAME"))) 
ekleme Kayıt
İlgili konular