Bazı yerler, Hadoop işindeki varsayılan redüktör sayısıdır. 1 redüktör sayısını manuel olarak ayarlamak için mapred.reduce.tasks simgesini kullanabilirsiniz.Hive bir iş için redüktör sayısını nasıl seçer?
Bir Kovan işini çalıştırdığımda (Amazon EMR, AMI 2.3.3'de), birden fazla redüktöre birden büyüktür. İş ayarlarına baktığımızda, bir şey mapred.reduce.tasks ayarladı, ben Hive'ı farz ediyorum. Bu numarayı nasıl seçer?
Not: Bir ipucu olması gereken bir kovan işi çalıştırırken burada bazı mesajlar şunlardır:
...
Number of reduce tasks not specified. Estimated from input data size: 500
In order to change the average load for a reducer (in bytes):
set hive.exec.reducers.bytes.per.reducer=<number>
In order to limit the maximum number of reducers:
set hive.exec.reducers.max=<number>
In order to set a constant number of reducers:
set mapred.reduce.tasks=<number>
...
İyi soru. Özellikle, kovan ne zaman "derleme zamanında belirlenen azaltılmış görevlerin sayısı" nı yapmayı ve ne zaman girdi veri boyutundan tahmini yapılmasını seçmeyi seçer? – ihadanny
, aşağıdaki cevabın –