2016-09-18 19 views
6

için ben kesin Rehberi okuduysanız ve tam karıştırma ve gerçekleşmesi sıralama gelmez nerede bir hereKarıştır ve sıralama MapReduce

sorum Web'deki diğer bazı bağlantılar

mı?

benim anlayış başına gelince, onlar haritacılarla ve düşürücüler hem gerçekleşmektedir. Ancak bazı bağlantılar kargaşanın haritacılara ve redüktörlere göre sıralandığına işaret ediyor.

Anlayışımın doğru olup olmadığını birileri doğrulayabilir mi; eğer yapamazlarsa ek belgeler sağlayabilirler mi?

cevap

5

Karışık:

MapReduce her redüktör giriş anahtarı tarafından sıralandığını garanti etmez. Sistemin sıralama işlemini gerçekleştirdiği ve transfers map outputs to the reducers as inputs işleminin, karma olarak bilinir.

Sıralama:

Sıralama MapReduce programının çeşitli aşamalarında olur Yani can Harita bulunmaktadır ve evrelerini azaltın.

Harita yukarıdaki resme daha açıklama ekleme Bu diyagram enter image description here

de bakabilirsiniz ve evrelerini azaltın edin.

The Map Yan: Harita işlevi çıktı üreten başladığında

, sadece diske yazılmaz. Harita çıkışı diske yazmadan önce, ilk olarak divides the data into partitions corresponding to the reducers iş parçacığına gönderilir. Her bölümün içinde background thread performs an in-memory sort by key.

azaltın Yan: tüm harita çıkışları kopyalandığında

, sıralama harita üzerinde yürütülmüştür olarak görev düzgün birleştirme aşaması çağrılmalıdır sıralama fazına (giriyor azaltmak harita çıkışlarını birleştiren, sıralama düzenini koruyan, Bu mermi ile yapılacaktır.

Kaynak: Hadoop Kesin Kılavuz.

+0

doğru, hem sağ haritacılarımızdan ve düşürücüler üzerinde gerçekleşmesi tekrar orijinal soru shuffle'ınıza ve sıralama geliyor? – red

+0

evet! karıştırmak ve sıralama çeşitli senaryolarda hem eşleştiricisindeki ve düşürücüler meydana. – mrsrinivas