Yalnızca seçili sütunlarla bir veri çerçevesindeki benzersiz

> 100 sütun içeren bir veri çerçevem var ve yalnızca iki sütunu karşılaştırarak benzersiz satırları bulacağım. Bunun kolay olduğunu umuyorum, ancak unique veya duplicated ile çalışamıyorum.Yalnızca seçili sütunlarla bir veri çerçevesindeki benzersiz

id id2 somevalue 
1 1   x 
3 4   z

ya:

id id2 somevalue 
1 1   y 
3 4   z

(ya ben elde etmek istiyorum

data.frame(id=c(1,1,3),id2=c(1,1,4),somevalue=c("x","y","z")) 

id id2 somevalue 
1 1   x 
1 1   y 
3 4   z

: Aşağıda ise

, ben sadece id ve ID2'nin kullanarak benzersiz istiyorum Benzersiz satırlardan hangisinin saklandığına dair tercihim yok

kaynak

2012-03-30 Ina

Sizin İstenen çıkış iyi tanımlanmamıştır. X'i dahil etmeyi nasıl seçersiniz, y değil? Bu karar her tekrarlanan sıranın her bir sütunu için yapılmalı ve nasıl yapılacağına dair hiçbir belirti vermediniz. – joran

'x' veya 'y' dahil olup olmadığından hiçbir tercihim yok. Soruyu güncelleyeceğim. – Ina

Tamam o seçtiğiniz olmayan çoğaltılamaz sütunda hangi değerin önemli değilse, bu oldukça kolay olmalıdır: duplicated çağrı İçinde

dat <- data.frame(id=c(1,1,3),id2=c(1,1,4),somevalue=c("x","y","z")) 
> dat[!duplicated(dat[,c('id','id2')]),] 
    id id2 somevalue 
1 1 1   x 
3 3 4   z

, ben sadece dat sadece bu sütunları geçiyorum o Ben çoğaltmak istemiyorum. Bu kod otomatik olarak her zaman belirsiz değerlerin ilk değerini seçecektir. (Bu durumda, x.)

kaynak

2012-03-30 14:38:53 joran

Bu web sitesine göre bir veritable – Ferroao

@Ferroao sürümü nedir, SQL http://www.dofactory.com/sql/select-distinct içinde mümkün değildir –

unique() kullanma:

dat <- data.frame(id=c(1,1,3),id2=c(1,1,4),somevalue=c("x","y","z"))  
dat[row.names(unique(dat[,c("id", "id2")])),]

kaynak

2015-10-22 18:35:48

Yalnızca seçili sütunlarla bir veri çerçevesindeki benzersiz

cevap

İlgili konular