aşağıdaki gibi görünen bir dataframe vardır:alt kümesi dataframe
df <- data.frame(Site=rep(paste0('site', 1:5), 50),
Month=sample(1:12, 50, replace=T),
Count=(sample(1:1000, 50, replace=T)))
Ben sayımı tüm sitelerde maksimum aylık sayımı <% 5 her zaman tüm siteleri kaldırmak istiyorum. tüm sitelerde
maksimum aylık sayılar:
1 sayısıdır Site5 atanmışsalibrary(plyr)
ddply(df, .(Month), summarise, Max.Count=max(Count))
, ardından da sayar her zaman tüm siteler arasında maksimum aylık sayımların <% 5'tir. Bu yüzden site5'in kaldırılmasını istiyorum. Diğerleri>% 5 iken
df$Count[df$Site=='site5'] <- 1
Ancak site2 için yeni değerler atayarak sonra, onun sayıları bazı maksimum aylık sayımların <% 5'tir. Bu nedenle site2'nin kaldırılmasını istemem.
df$Count[df$Site=='site2'] <- ceiling(seq(1, 1000, length.out=20))
nasıl sayımları her zaman maksimum aylık sayımı <% 5'i hiçbir siteleri kaldırmak için dataframe alt küme olabilir? Sorunun belirsiz olup olmadığını bana bildirin ve düzelteceğim.
Yani siteler için tüm satırları kaldırmak nerede Jan içinde sayımı <% 5 max sayısı,
luciano
@RossAhmed, bunu yapmalı. – Arun