Ben UA ile bir veri çerçevesi var ve satırla Nas değiştirmek istiyor

anlamına bulun ve satırla eksik değerlerin yerineBen UA ile bir veri çerçevesi var ve satırla Nas değiştirmek istiyor

c1 = c(1,2,3,NA) 
c2 = c(3,1,NA,3) 
c3 = c(2,1,3,1) 

df = data.frame(c1,c2,c3) 

> df 
    c1 c2 c3 
1 1 3 2 
2 2 1 1 
3 3 NA 3 
4 NA 3 1

demektir ki Çözümümün

kaynak

2013-07-23 Brian

> ind <- which(is.na(df), arr.ind=TRUE) 
> df[ind] <- rowMeans(df, na.rm = TRUE)[ind[,1]]

kaynak

2013-07-23 14:23:46

+1 oft-overlooked 'arr.ind' argüman –

iyi bir kullanım varsa, ben NA'ların tüm satırları varsa, bir hata oluşur. Bunu tamamen yeni bir soru olarak ortaya koymak doğru mu? – Brian

olduğunu

rwmns = rowMeans(df,na.rm=TRUE) 
df$c1[is.na(df$c1)] = rwmns[is.na(df$c1)] 
df$c2[is.na(df$c2)] = rwmns[is.na(df$c2)] 
df$c3[is.na(df$c3)] = rwmns[is.na(df$c3)] 
> df 
    c1 c2 c3 
1 1 3 2 
2 2 1 1 
3 3 3 3 
4 2 3 1

Özellikle çok sayıda sütunu olduğunda daha zarif bir yol var mı? apply kullanma umarım bu işe düşünüyorum

kaynak

2013-07-23 14:10:15 Brian

Büyük çalışmalarını aktaran sonra library(zoo) den na.aggregate olduğunu. '[[' Yerine dizin indeksini kullanabilirsiniz, böylece her satır 'df [[col_name]] olur [is.na (df [[col_name]])] <- rwmns [is.na (df [[col_name]]) '. Bu şekilde, bir başvuru ailesini, üzerinde değişiklik yapmak istediğiniz sütun adları üzerinde döngü yapabilir veya kullanabilirsiniz. – Justin

df[which(is.na(df), arr.ind=TRUE)] <- rowMeans(df[!complete.cases(df), ], na.rm=TRUE)

kaynak

2013-07-23 14:20:38 baptiste

+1 güzel çözüm! Tembelliğimden çok daha iyi! –

hem is.na hem de complete.cases kullanmak biraz gereksizdir; İki satırda muhtemelen daha verimli bir yol var – baptiste

Bunun gibi belki de? 'idx <- hangisi (is.na (df), arr.ind = TRUE); df [idx] <- rowMeans (df [idx [, 1],], na.rm = DOĞRU) ' –

(döndürülen nesne matrix olduğunu unutmayın):

t(apply(df , 1 , function(x) { x[ is.na(x) ] = mean(x , na.rm = TRUE); x })) 
    c1 c2 c3 
[1,] 1 3 2 
[2,] 2 1 1 
[3,] 3 3 3 
[4,] 2 3 1

Biz her satırda her NA değerlerini değiştirmek için herhangi bir anonim işlevini kullanın Bu satırın mean. Tek avantajı, satır sayısı arttıkça daha fazla yazmanız gerekmez. Bilişsel anlamda özellikle verimli veya hızlı değildir, ancak bilişsel anlamda daha fazladır (000,000 satırınız yoksa). @ Baptiste cevabı çok benzer

kaynak

2013-07-23 14:21:32

Diğer bir seçenek kendi çözüm ile geliyor veri kümesi

library(zoo) 
df[] <- t(na.aggregate(t(df))) 
df 
# c1 c2 c3 
#1 1 3 2 
#2 2 1 1 
#3 3 3 3 
#4 2 3 1

kaynak

2015-11-11 05:01:56 akrun

Ben UA ile bir veri çerçevesi var ve satırla Nas değiştirmek istiyor

cevap

İlgili konular