design-by-contract

    0ısı

    1cevap

    Ben bana max değeri aldığı, tarif edildiği gibi x = LOAD 'file:///a/b/c.csv' USING PigStorage() AS (a: int, b: int, c: int); y = FOREACH x GENERATE a AS a: int, b AS b: int, c AS c: int, MAX(TOBAG(a,

    -1ısı

    1cevap

    4 sütun veri içeren ancak 250000 satır içeren bir csv dosyası var. A B C D Tom 1 x Blah Blah Blah Bob 2 y Blah <p> Blah Jane 3 z Blah, &p *£ Harry 4 a Blah "p" Blah Sütun 4'te çeş

    0ısı

    1cevap

    5'ten az puan alan öğrenci sayısını bulmalıyım. Dosyayı yükledim. için bir filtre kullanıyorum Sayımı şimdi nasıl alacağımı anlamıyorum. Herkes

    6ısı

    1cevap

    ile yapılandır WebDriverIO herkes WebDriverIO ile BrowserMobProxy nasıl yapılandırılacağı üzerinde düzgün bir örneği var mı? Bu yüzden ağ trafiğini yakalayabilirim. Daha önce aslında WebDriverIO bir k

    0ısı

    1cevap

    Karakterleri kaldırmaya çalışıyorum: \ n, \ t ve \ r, Pig'daki bir sütundan ancak yanlış çıktı alıyorum. İşte ne yapıyorum geçerli: qr_1 = LOAD 'hdfs://localhost:9000/sample.csv' USING PigStorage(',')

    0ısı

    1cevap

    ben apache domuz kullanarak veri yükleme hakkında bir sorun var Herkese merhaba, dosya biçimi gibidir: "1","2","xx,yy","a,sd","3" Yani birden sınırlayıcı kullanarak yüklemek istediğiniz "," 2double

    0ısı

    1cevap

    Aşağıdaki veriler örnek var: AGE,EDU,SEX,SALARY 67,10th,Male,<=50K 17,10th,Female,<=50K 40,Assoc-voc,Male,>50K 35,Assoc-voc,Male,<=50K 57,Assoc-voc,Male,<=50K 49,Assoc-voc,Male,>50K 42,Bachelor

    0ısı

    1cevap

    Bu sorguyu, 50000 kayıt içeren bir CSV dosyasından veri yüklemek için domuzda kullanıyorum. İşte A = LOAD '/home/user/q2.csv' using org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'YES_MULTILINE

    0ısı

    1cevap

    country_landmass_sorted = foreach country_landmass { country_landmass_count = foreach country generate group,COUNT(name) as r; sorted = ORDER country_landmass_count BY $1 DESC; GENERATE group, sort

    0ısı

    1cevap

    Birden fazla Domuz UDF tanımlamak istiyorum. Her biri verilerin farklı bir bölümünü çıkaracak. Benim durumumda, veri birçok iç içe JSON nesnesi içeren karmaşık bir yapıya sahip JSON belgeleridir. Soru