Sütunların bir alt kümesinde DISTINCT işlemi gerçekleştirmek istiyorum. documentation bu iç içe geçmiş bir foreach ile ulaşılabileceğini söyledi:Sütunların bir alt kümesinde Pig Latince DISTINCT nasıl gerçekleştirilir?
Sen alanların bir alt kümesi üzerinde DISTINCT kullanamazsınız; Bunu yapmak için, FOREACH ve yuvalanmış bir bloğu ilk önce alanları seçin ve sonra DISTINCT'ı uygulayın (Örnek: İç içe geçmiş blok).
sütunların tümü üzerinde DISTINCT işlemi gerçekleştirmek için basittir:
A = LOAD 'data' AS (a1,a2,a3,a4);
A_unique = DISTINCT A;
ben a1, a2 ve a3 genelinde farklı performans ilgileniyorum olduğunu düşünelim. Bu işlemin, belgelerde önerildiği gibi yuvalanmış bir foreach ile nasıl gerçekleştirileceğini gösteren bir örnek sağlanabilir mi?
İşte bir girişin örneği ve beklenen çıkışı var: Burada
A = LOAD 'data' AS(a1,a2,a3,a4);
DUMP A;
(1 2 3 4)
(1 2 3 4)
(1 2 3 5)
(1 2 4 4)
-- insert DISTINCT operation on a1,a2,a3 here:
-- ...
DUMP A_unique;
(1 2 3 4)
(1 2 4 4)
Eğer örnek girişi ve beklenen çıkışı verebilir misiniz? – zero323
İyi öneri, soruyu güncelledim. – Freerobots