Yerel makinemin bir hdfs yüklemesi yok. Uzak bir hdfs kümesinden dosyaları almak istiyorum. Bunu başarmanın en iyi yolu nedir? get
dosyalarını hdfs'den küme makinelerinden birine dönüştürmem gerekiyor mu ve sonra bunları almak için ssh kullanmalı mıyım? Bu programatik olarak bir bash betiği ile yapabilmek istiyorum.Dosyaları uzaktaki HDFS'den alma
cevap
İşte adımlar şunlardır:
- bağlantı Barındırıcınıza ve
- istemcisi olarak konak tanımlayın, uyumlu Hadoop ikilileri yüklemeniz gerekir hedef küme arasında olduğundan emin olun. Ayrıca, sunucunuzun aynı işletim sistemini kullanarak çalışması gerekiyor.
- doğrudan
Ayrıca alternatifler vardır sen Dosyaları almak için hadoop fs -get
komutunu çalıştırabilirsiniz
- Webhdfs/httpFS yapılandırılmışsa, dosyaları kıvrılarak veya hatta tarayıcınızı kullanarak yükleyebilirsiniz. Webhdfs yapılandırılmışsa, bash scritps yazabilirsiniz.
Ana makineniz, istemci olarak Hadoop ikili dosyaları kurulu değilse, aşağıdaki yönergeleri kullanabilirsiniz.
- küme üzerinde düğümün sitelerinden birine ana bilgisayardan şifre az girişini etkinleştirmek
- çalıştırma komutu
ssh <user>@<host> "hadoop fs -get <hdfs_path> <os_path>"
- sonra scp komutu tek komut dosyaları
- Sen olabilir yukarıdaki 2 komutları kopyalamak
Bir takip sorusu. [HttpFS] (https://hadoop.apache.org/docs/r2.6.0/hadoop-hdfs-httpfs/index.html), performans açısından "client hadoop fs -get" çözümüyle nasıl karşılaştırılır? –
httpFS ve webhdfs aynıdır. Bunu kullanarak indirebilirsiniz, bunu yapmak için hadoop ikili dosyaları gerekmez. –
Performans açısından ne hakkında? HttpFS kullanmak yerine ikili dosyaları kullanmak daha mı hızlı? belki de başka bir iş parçacığı başlatmalıyım –
- 1. Uzaktaki dosyaları dosya nesnelerine aktarma
- 2. Uzaktaki dosyaları phpseclib ile nasıl kopyalarım veya taşırım?
- 3. Ortak anahtar kimlik doğrulaması kullanarak uzaktaki dosyaları Emacs ile düzenleme
- 4. Git: Uzaktaki nesneleri keşfetme
- 5. Tarayıcıları Önbelleğe Alma CSS Dosyaları Nasıl Önlenir?
- 6. tarayıcıda sabit dosyaları önbelleğe alma tarayıcı?
- 7. Python UDF - harici dosyaları alma/okuma
- 8. NoRouteToHostException/NoSuchHostException uzaktaki JMX çağrısında
- 9. UnauthorizedAccessException Uzaktaki dosya sunucusundaki Copy-Item kullanılarak
- 10. (OpenGL ES) Görünüm merkezinden uzaktaki nesneler gerilir
- 11. DbContext zaman aşımı uzaktaki sunucuda sadece
- 12. Cordova ve eklentilerini uzaktaki bir URL'de kullanma
- 13. , en az arabelleğe alma ile sıralanmış dosyaları birleştirir
- 14. Birden çok klasörden giriş dosyaları alma Hadoop işi
- 15. Akka uzaktaki aktörler, varsayılan yapıcı olmadan süper sınıf
- 16. Sorun alma önbelleğe alma
- 17. Yerel master'ı başka bir şubeden uzaktaki master'a güncelle
- 18. Uzaktaki bir makinede belirtilen kayıt defteri anahtarının LastWriteTime değerini döndürme
- 19. Master Branch dosyalarını uzaktaki Develop Branch ile nasıl değiştirebilirim?
- 20. Raylar 3, Uzaktaki URL'den ataş ve resim yükleme
- 21. Uzaktaki bir git dalı nasıl güvenli bir şekilde silerim?
- 22. "git push" uzaktaki "git getirme" ile aynı işi yapıyor
- 23. iOS'ta PhoneGap veya Cleaver'da (Cordova) uzaktaki html yükleme
- 24. Yük getirme bağımlılıklarının özel bir uzaktaki gitmesi mümkün mü?
- 25. dosyaları
- 26. Alma örneğini ActionBar içinde alma
- 27. JS ve CSS dosyaları, VM
- 28. SettingKey değerini alma [T]
- 29. çoklu katran (kaynak dosyaları) dosyaları
- 30. Sadece excel dosyaları filtreleme C#
DistCp'yi deneyin: https://hadoop.apache.org/docs/r1.2.1/distcp.html –