Lot yapı elemanları içeren karmaşık JSON veri kümesi için filtre işlevi yazıyorum. Tek tek sütunları geçmek çok hantal. SezgiselTüm Satır UDF'ye nasıl iletilir - Spark DataFrame süzgeci
val records:DataFrame = = sqlContext.jsonFile("...")
def myFilterFunction(r:Row):Boolean=???
sqlc.udf.register("myFilter", (r:Row)=>myFilterFunction(r))
bunun böyle çalışacak düşünüyorum:
records.filter("myFilter(*)=true")
gerçek sözdizimi nedir
Yani şu UDF ilan?
Eğer filtre işlevi daha biraz belirtebilir misiniz? 'Row' kullanarak' DataFrame' sizin için bir çok optimizasyon atar. – Reactormonk
Filtre oldukça karmaşıktır. Kaydın yapısı, içlerindeki anahtar-değer çiftleri içeren birkaç Harita alanıdır. –