Ben anlık içeren JSON nesneleri adlı text türünde bir alanı olan bir cassandra tablo var RDD için JSON şemasında dönüşüm yapmak için bu RDD'nin alanını başka bir RDD'ye dönüştürmem gerekiyor.Kıvılcım JSON metin alanı
Bu doğru mu? Buna nasıl devam etmeliyim?
Düzenleme:
val conf = new SparkConf().setAppName("signal-aggregation")
val sc = new SparkContext(conf)
val sqlContext = new SQLContext(sc)
val snapshots = sc.cassandraTable[(String, String, String)]("listener", "snapshots")
val first = snapshots.first()
val firstJson = sqlContext.jsonRDD(sc.parallelize(Seq(first._3)))
firstJson.printSchema()
bana JSON şema gösterilmektedir: Şimdi ben tek bir metin alanından bir RDD oluşturmak başardı için. İyi!
Spark'a, bu şemanın, her bir satırdaki o anlık görüntü alanında bir RDD almak için Anlık görüntü tablosunun tüm satırlarında uygulanması gerektiğini anlatmaya nasıl devam edebilirim?
Eğer doğru anlamak içine json ile bir RDD [dize] geçmek istiyorum cassandra tablosunda her alanın içinde birkaç JSON nesnesi var ve her nesneyi bağımsız olarak hesaplamanız gerekiyor. –
Evet haklısın, ama Spark'un metin alanını json olarak anlayabildiğini ve bu jrumların bazı değerlerinde dönüşüm yapabileceğimi bir yerde okudum, bu doğru mu? – galex