2015-02-19 22 views
9

cloudera'nın parke dokümanları, domuz/kovan/impala ile entegrasyon örneklerini göstermektedir. ama birçok durumda hata ayıklama amacıyla parke dosyasını okumak istiyorum.Bağımsız bir java kodunda parke dosyası nasıl okunmalı?

Parke dosyasını okumak için basit bir java okuyucu api var mı?

Teşekkür Yang

+0

Bu doğrudan bir yanıt değil, ancak Parquet dosyalarını okumak ve kendi Java uygulamanızdan neler arayabileceğinizi görmek için bir komut satırı aracını görüntüleyen parke araçları projesine katılarak biraz şansınız olabilir. https://github.com/apache/incubator-parquet-mr/tree/master/parquet-tools –

+0

ilgili: http://stackoverflow.com/questions/30565510/how-to-read-and-write-mapstring- nesne-dan-parşömen-dosya-içinde-java-or-scala – okigan

+1

@JeremyBeard Bu repo 1/17 – javadba

cevap

6

Sen parke-avro kütüphaneden AvroParquetReader kullanabilirsiniz AVRO GenericRecord nesneler kümesi olarak parke dosyasını okumak için.

+0

veya boş olanlar (hız için) itibariyle boştur. –

3

Eski yöntem: (kullanımdan kaldırıldı)

AvroParquetReader<GenericRecord> reader = new AvroParquetReader<GenericRecord>(file); 
GenericRecord nextRecord = reader.read(); 

Yeni yöntem:

AvroParquetReader<GenericRecord> reader = new AvroParquetReader.<GenericRecord>builder(file).build(); 
GenericRecord nextRecord = reader.read(); 

ben here bu var ve başarıyla benim test durumlarda bu kullanmışlardır.

İlgili konular