Veri kümesini özetlemek için dplyr öğesini kullanarak, bir sütundaki benzersiz örnek sayısını saymak için n_distinct öğesini çağırmak istiyorum. Bununla birlikte, başka bir sütundaki bir koşulun karşılandığı bir sütundaki tüm benzersiz oluşumlar için başka bir özet() yapmak istiyorum.dplyr n_distinct koşullu
Örnek dataframe adında "a":
count
3
:
A B
1 Y
2 N
3 Y
1 Y
a %>% summarise(count = n_distinct(A))
Ancak ben de B == "Y"
sonucu olmalıdır n_distinct(A)
sayımını eklemek istediğiniz Con eklediğinizde
olmalıdır sonucu dition:
count
2
elde etmek çalışıyorum Sonuçta her iki ifadeleri beni bu konuda gitmek için uygun bir yoldur ne
count_all count_BisY
3 2
gibi bir sonuç verir, bir aramanın birleştirilecek olan Dplyr ile? veren
library(dplyr)
library(data.table)
a %>% summarise(count_all = n_distinct(A), count_BisY = uniqueN(A[B == 'Y']))
:: Özetlersek gerçekleştiren bir alternatif dplyr iç data.table den uniqueN
fonksiyonunu kullanmaktır
a %>%
filter(B=="Y") %>%
summarise(count = n_distinct(A))
bir de OP beklenen çıktıya dayanarak
base R
den
aggregate
kullanın:%>% özetler (= n_distinct (A sayısı [B == 'Y']))? – Gopala@ user3949008 Hata: n_distinct() öğesine giriş, –
veri kümesinden tek bir değişken adı olmalıdır. Üzgünüz, bu, n_distinct (df $ A [df $ B == 'Y']) olarak çalışır. – Gopala