Ben birkaç satır içine her satır patlayabilir istiyorum dizilerDiziler dizisini birden çok satıra nasıl düzleştirebilirim? Bazı jsons ayrıştırma sonra
scala> val jj =sqlContext.jsonFile("/home/aahu/jj2.json")
res68: org.apache.spark.sql.DataFrame = [r: array<bigint>]
scala> jj.first()
res69: org.apache.spark.sql.Row = [List(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)]
bir tek sütunluk DataFrame var. Nasıl?
düzenleme:
Orjinal json dosyası:
{"r": [0,1,2,3,4,5,6,7,8,9]}
{"r": [0,1,2,3,4,5,6,7,8,9]}
Bir RDD ya da 20 satır içeren bir DataFrame istiyorum.
Sadece burada flatMap kullanamazsınız - Ben kıvılcım ilgili komut ne olduğundan emin değilim:
scala> jj.flatMap(r => r)
<console>:22: error: type mismatch;
found : org.apache.spark.sql.Row
required: TraversableOnce[?]
jj.flatMap(r => r)
lütfen orjinal json örneğini gönderin ve sonucun örneğini bekliyor – vvladymyrov
@vvladymyrov düzenleniyor – dranxo