S3 üzerinde 17.7GB dosyam var. Bir Kovan sorgusunun çıktısı olarak üretildi ve sıkıştırılmadı.S3 üzerinde dosya sıkıştır
Sıkıştırarak bunu yaklaşık 2.2 GB (gzip) olacağını biliyorum. Aktarım darboğazı olduğunda (250kB/s) bu dosyayı olabildiğince hızlı bir şekilde nasıl yükleyebilirim.
S3 üzerinde dosyayı sıkıştırmak veya s3cmd, boto veya ilgili araçlarda aktarımda sıkıştırmayı etkinleştirmek için herhangi bir doğrudan yöntem bulamadım.
Bu dosyayı Yenile sorgunuzu yeniden çalıştırarak yeniden oluşturabilir misiniz? Evet ise, Hive sorgunuz için çıkış sıkıştırmasını etkinleştirmenizi tavsiye ederim. –
@CharlesMenguy: Bunu ilk kez yaptım (bence). Ancak ifadede bir “sipariş” vardı ve bu çıktıyı etkiledi. Normalde her harita işi için bir dosya alırdım, fakat bunun yerine, siparişin yapıldığı yer olduğunu düşündüğüm küçültmeden tek bir dosya aldım. –
Sorgunuzda çıktı sıkıştırmayı nasıl etkinleştirdiniz? Sanırım bir "siparişin" olup olmadığına bakılmaksızın, hemen hemen tüm Hive sorgusunun çıktılarını sıkıştırmanız gerekir. S3 'e' s3n: // ... ''üzerine bir' ekleme üzerine yazarak 'yazarak yazdığınızı sanıyorum. –