2016-03-21 20 views
1

Bir veri çerçevesini çok fazla kopya ile bir veri kümesine her özel girişte yalnızca bir kez azaltmaya çalışıyorum, ancak "sayaç" adı verilen bir değişkenle bu değişkenin veri çerçevesinde ne sıklıkta ortaya çıktığı . Şimdi normal ifadeler ile bazı sorunları .. kh$gem[124] dataframe ne kadar sıklıklamodel regexp ile tam olarak nasıl belirtilir

length(grep(kh$gem[124],kh$gem)) 

sayımları var. Sorun şu ki

> kh$gem[124] 
[1] "Salzburg" 

ve

> grep(kh$gem[124],kh$gem) 
    [1] 120 124 125 126 127 128 134 141 144 146 148 

ama ben bu değişkenlere bakarsak orada bazı I gerçekten 'maç' Regexp'i, ama tam olarak değil aradığım bu.

> kh$gem[c(120,124,125,126,127,128,134,141,144,146,148)] 
[1] "Oberndorf bei Salzburg" "Salzburg" "Salzburg" "Salzburg"    
[5] "Salzburg" "Salzburg" "Salzburg" "Salzburg"    
[9] "Salzburg" "Oberndorf bei Salzburg" "Salzburg"  

"Oberndorf bei Salzburg" olanları nasıl yok edebilirim?

Yardımlarınız için teşekkürler. Saygılarımla!

+0

'toplam (kh $%%, kh $ gem [124])'? – Cath

cevap

1

Ankraj ekle.

grep(paste0("^" , kh$gem[124] , "$"),kh$gem)