Sadece dplyr kullanmaya başladım ve group_by
ile çözülmesi kolay olan aşağıdaki iki problemi var, ama anlayamıyorum.R: group_by in dplyr uygulaması
data <- data.frame(cbind("year" = c(2010, 2010, 2010, 2011, 2012, 2012, 2012, 2012),
"institution" = c("a", "a", "b", "a", "a", "a", "b", "b"),
"branch.num" = c(1, 2, 1, 1, 1, 2, 1, 2)))
data
# year institution branch.num
#1 2010 a 1
#2 2010 a 2
#3 2010 b 1
#4 2011 a 1
#5 2012 a 1
#6 2012 a 2
#7 2012 b 1
#8 2012 b 2
veri hiyerarşik yapılandırılmıştır: Şöyle verilere sahip en üst düzeyde bir kurum 1.
Sorun 1 başlayarak numaralandırılmıştır bir kaç dallar, olabilir: İstiyorum her yıl için bir değer olan, sadece şubeler içeren satırları seçin, bu örnek verisi sadece Şube 1 Kurumunun 1, yani seçim 1, 4 ve 5 satırları olmalıdır.
Pronlem 2: İstiyorum Bir kurumun tüm yıl boyunca sahip olduğu ortalama şube sayısını bilmek.
sorun #: bu kurum için, örneğin bir (2 + 1 + 2)/3 = 1.67 ve için kurum b Burada (1 + 0 + 2)/3 = 1.