2016-03-22 25 views
0

Yaklaşık 10000 satır ve 10 sütun büyük bir veri kümesine sahibim. Bu veri kümesi üzerinde rpart paketi kullanarak sınıflandırma yapmak istiyorum. Ancak her sütunta birçok (50'den fazla) sınıf var. Yani R sadece kilitleniyor.Büyük veri kümesinde rpart paketini kullanma

Verilerin kapsamını sınırlamak veya her sütundaki sınıf sayısını azaltmak için seçeneklerim nelerdir?

cevap

0

Buna, veri kümesini azaltırken sınıfların oranının aynı kalmasını istediğiniz katmanlandırılmış örnekleme denir. Caret paketinden createDataPartition kullanın. o sorunu çözer eğer

table(iris$Species) 
library(caret) 
trainIndex <- createDataPartition(iris$Species, p = .8,list = FALSE,times = 1) 
table(iris[trainIndex,]$Species) 

sağ olarak veri kümesi adı

+0

Mark ile iris değiştirin. Teşekkürler –

+0

Parametrelerde herhangi bir şüphe varsa bana bildirin. Sorununuzu çözdü. Çalışırsa cevabı işaretle –

İlgili konular