SFDC'den basit bir satış paketi paketi kullanarak çıkarılan verilerle çalışıyorum. Komut dosyası ve Spark 1.5.2 için Python3 kullanıyorum. pyspark kullanarak tuples listesinden DataFrame oluştur
Ben aşağıdaki verileri içeren bir RDD oluşturuldu:[('Id', 'a0w1a0000003xB1A'), ('PackSize', 1.0), ('Name', 'A')]
[('Id', 'a0w1a0000003xAAI'), ('PackSize', 1.0), ('Name', 'B')]
[('Id', 'a0w1a00000xB3AAI'), ('PackSize', 30.0), ('Name', 'C')]
...
Bu veriler RDD denilen v_rdd
Benim şema şöyle görünür: Ben DataFrame oluşturmaya çalışıyorum
StructType(List(StructField(Id,StringType,true),StructField(PackSize,StringType,true),StructField(Name,StringType,true)))
Bu RDD'nin dışında:
benim DataFrame yazdırmak:
sqlDataFrame.printSchema()
Ve aşağıdaki olsun:
+--------------------+--------------------+--------------------+
| Id| PackSize| Name|
+--------------------+--------------------+--------------------+
|[Ljava.lang.Objec...|[Ljava.lang.Objec...|[Ljava.lang.Objec...|
|[Ljava.lang.Objec...|[Ljava.lang.Objec...|[Ljava.lang.Objec...|
|[Ljava.lang.Objec...|[Ljava.lang.Objec...|[Ljava.lang.Objec...|
böyle, gerçek verileri görmek için bekliyorum:
+------------------+------------------+--------------------+
| Id|PackSize| Name|
+------------------+------------------+--------------------+
|a0w1a0000003xB1A | 1.0| A |
|a0w1a0000003xAAI | 1.0| B |
|a0w1a00000xB3AAI | 30.0| C |
Bana tespit yardım edebilir Burada yanlış yapıyorum.
Python betiğimde uzun bir süre var, insanların eline geçmesinin elverişli bir durum olmadığından emin değilim, bu yüzden yalnızca sorun yaşadığım bölümleri gönderdim.
Teşekkür bir ton önceden!