Bir düğümün Ana düğüm ve diğerinin Veri düğümü olduğu bir dolaşım kümem var mı? Köle düğümü, işleri paralel hale getirmek için yeterli çekirdek bulunduğundan emin olmak için 8 çekirdekli bir makinedir. Dosyayı hala 3 blok halinde bölebilir miyim ve köle düğümü tüm üç bloğu ayrı ayrı depolayabilir. Başka bir deyişle, "eğer bir kölelik kümesindeki bütün köle düğümlerini kullanmak istiyorsak", o zaman köle düğümlerinin sayısı ile bir dosyanın maksimum blok sayısı arasında bir 1: 1 ilişki var mı? Evet ise, o zaman böyle bir durumda haritayı nasıl azaltabilirsiniz. Ana düğüm, üç harita işini köle düğümüne gönderecek ve her bir eşleyici, köle düğümündeki her bir bloğu toplayacak mı? Sorumum farklı bir şekilde görülebilir. 3 veri düğümü içeren bir kümede 1GB'lık bir dosya varsa, 64 MB'lık bloklar nasıl bölünür ve üç düğüm arasında nasıl dağıtılır?Bir bağımlı düğümde aynı dosyada birden fazla blok var mı?
cevap
İkinci soru benim için daha anlaşılabilir gibi görünüyor, bu yüzden önce bunu alacağım. HDF'ler Perspektifinden
: Eğer çoğaltma faktörü olarak onlardan daha varsa bir 1GB dosya 16 blok oluşur 64MB blok boyutuyla
, bloklar, DataNodes arasında biraz rastgele depolanan, ancak bekleyebilirsiniz Verileri DN'lerden birinden yüklemezseniz, düğümler arasında eşit bir dağılım. Bunu yaparsanız, bu DN tüm bloklardan bir çoğaltma tutacaktır ve diğer DN'ler kalan replikaları eşit şekilde dağıtmaya devam edecektir (hala rastgele yerleştirilmiş). Evet, eğer bir dosyanız 16 bloktan oluşuyorsa ve 3 3'lük bir replikasyon faktörü ile sadece 3 DN, örneğin tüm 16 bloğu tutacaktır.
Eğer MapReduce işi çalıştırmak İplik bakış açısından : yapılandırılabilir bir bekleme süresi bu tür ücretsiz bir kap için, orada
İPLİK yerel veri içeren bir mapper için bir düğüm üzerinde bir konteyneri bulmaya çalışır YARN'den önceki düğümler, veriye sahip olmayan bir düğümdeki eşleştirmeyi başlatır.
YARN doğrudan fiziksel çekirdeklere dayanmaz, sanal çekirdek sayısını ve bir kabın kullandığı bellek miktarını ve bu değerleri temel alarak yapılandırabilirsiniz. YARN, bir NodeManager'da kullanılabilir kapsayıcıların miktarını tahsis edecektir. Ben size veri dosyaları bölmek için blok boyutunu tanımlayarak paralellik ulaşmak istediğiniz anlamak gibi sorunun birinci kısmından itibaren
: İPLİK ayar Ancak on Cloudera Engineering blog
üzerinde
Ek okumalar.
MapReduce HDFS blokları ile ilgilenmez, girişi bölmek için kendi soyutlaması vardır, buna InputSplit denir. InputSplits eşleştiricilere InputFormat tarafından beslenir. Ayrıca, InputSplits, bölmenin yerel olarak kullanılabilir olduğu yeri tanımlar, böylece YARN, yerel veri depolamada bölünmüş bir düğümde bulunan bir kapsayıcı bulabilir. API'yi ve ihtiyaçlarınızı tam olarak karşıladıkları için mevcut olan InputFormat uygulamalarını kontrol etmeyi öneririm, ancak eğer olmasalar bile kendi uygulamanızı yazabilir ve iş yapılandırması yoluyla belirtebilirsiniz.
- 1. Düğümde birden fazla sorgu JS
- 2. Highcharts.js - aynı sayfada birden fazla tema var mı?
- 3. Rails 3.1'de aynı formda birden fazla model var mı?
- 4. mediaelement.js Aynı sayfadaki birden fazla video var mı?
- 5. VIM aynı dosyada birden fazla dil algılamaya olanaklı
- 6. Aynı kaynaktan birden fazla ses kaynağını (MediaPlayer) aynı anda çalabilmemin bir yolu var mı?
- 7. startplanground için birden fazla çağrı var mı?
- 8. VIM'de bir blok geri alma var mı?
- 9. NodeJS - birden fazla nesne birden fazla dosya üzerinde aynı ad
- 10. Ruby'de bir yönteme birden fazla blok aktarmak mümkün mü? gibi
- 11. Makroları tanımlandıkları aynı dosyada kullanmak için herhangi bir numara var mı?
- 12. Bir Android Hizmeti'nde birden fazla İzin var mı?
- 13. Vim'den aynı anda birden fazla dosya açmanın bir yolu var mı?
- 14. Oracle optimizer aynı SELECT'te birden fazla İpucu kullanır mı?
- 15. Doctrine2/Symfony2 - Aynı tablodaki birden fazla varlık
- 16. Seaborn'da aynı arsada birden fazla grafik
- 17. Aynı yerde birden fazla işaretleyici - MarkerClusterer
- 18. Birden fazla marka aynı konumdaki konumunuzu göster
- 19. Aynı kutu üzerinde birden fazla PHP sürümü
- 20. Aynı estetik için birden fazla gösterge
- 21. Erlang: Aynı modülde tanımlanan birden fazla davranış?
- 22. Java: aynı sınıftaki birden fazla ActionListeners?
- 23. Aynı reaksiyon bileşeninin birden fazla örneği
- 24. Mongoose Aynı anda birden fazla veri silme
- 25. Aynı anda birden fazla R-betiği çalıştırın
- 26. Aynı zaman çizelgesini paylaşan birden fazla Storyboard veya Animasyon var mı?
- 27. Birden fazla uygulamanın Özel URL Uygulaması için aynı URL Tanımlayıcısı var mı?
- 28. Aynı içeriği birden fazla yönetici düzenlerken sayfayı kilitleme olasılığı var mı?
- 29. Birden fazla aynı Kafka Streams konularının birleştirilmesi
- 30. Birden Fazla Dosya Var mı Kontrol Ediyor? En iyi yol?