2016-03-21 14 views
1

Çok sayıda gözlem ve çok sayıda değişken içeren bir veri kümem var. Ancak bazı değişkenler sadece birkaç gözlem için gerçek değerlere sahiptir. 500 gözlemden daha az olan değişkenleri nasıl silebilirim?Birçok gözlemle sütunları seçin

dplyr bağlamında bunu yapmanın bir yolunu bulmaya çalışıyorum, ancak select() bu şekilde çalışmıyor gibi görünüyor.

Bu oldukça ya mantıklı değil, ama Düşünüyordum yöndür:

dat[,sum(!is.na) > 500] 
+0

NA sayma sayısı? –

+6

"dat [, colSums (! Is.na (dat))> 500]' gibi altkümeyi deneyin. Belki – Frank

+0

@Frank İşte bu kadar. Teşekkürler! – Hatshepsut

cevap

0

Biz vapply

dat[vapply(dat, function(x) sum(is.na(x)) <=500, 0)] 

Veya kullanabileceğiniz Filter

Filter(function(x) sum(is.na(x)) <= 500, dat)