Bir masa okumak için aşağıdaki kodu kullanarak, SparkSQL için Impala geçiş ediyorum: Nasıl SparkSQL yukarıda çağırmakSparkSQL - parke dosyasını oku doğrudan
my_data = sqlContext.read.parquet('hdfs://my_hdfs_path/my_db.db/my_table')
, bu yüzden böyle bir şey dönebilirsiniz:
'select col_A, col_B from my_table'
Gerekli (ya da iyi bir fikir) gerekli mi? Çünkü eğer veriler büyükse, her şeyi sürücüye toplamak istemiyoruz. – Edamame
sadece bir örnek nasıl sql kullanılabilir. Nasıl kullanmak istediğine bağlı. Sorguyu değiştirebilir veya .0 ( –