CARET belgelerini dikkatle okuyorum: http://caret.r-forge.r-project.org/training.html, vinyetler, ve her şey oldukça açık (web sitesindeki örnekler çok yardımcı oluyor!), Ancak hala iki ilişki arasındaki karışıklık var. trainControl
için argümanlar:CARET. Veri bölme ve trainControl arasındaki ilişkiControl
method
index
ve şapka içinde trainControl
ve veri bölme fonksiyonları (örn createDataPartition
, createResample
, createFolds
ve createMultiFolds
)
daha iyi çerçevelemek için aralarında etkileşimi benim sorular, beni belgelerinden şu örneği kullanalım:
data(BloodBrain)
set.seed(1)
tmp <- createDataPartition(logBBB,p = .8, times = 100)
trControl = trainControl(method = "LGOCV", index = tmp)
ctreeFit <- train(bbbDescr, logBBB, "ctree",trControl=trControl)
Sorularım şunlardır:
I (O önyükleyici tabakalı gelmez varsayıyorum)
createDataPartition
kullanıyorsanız, yukarıdaki örnekte olduğu gibi,trainControl
içinindex
sonucunu iletiyorumtrainControl
aramamdaki yöntem olarakLGOCV
yöntemini kullanmam gerekir mi? Başka birini kullanırsam (ör.cv
) Ne fark eder? Kafamda,index
'u düzelttikten sonra, esas olarak çapraz doğrulama türünü seçiyorsunuz, bu yüzdenindex
'u kullanırsanız,method
rolünün ne olduğundan emin değilim.createDataPartition
vecreateResample
arasındaki fark nedir?createDataPartition
, katmanlanmış önyükleme yaparkencreateResample
yapmıyor mu?
3) I tabakalı k-kat (örneğin 10 misli) çapraz geçerlilik ile şapka yapabilir nasıl? Aşağıdaki yapar mı?
tmp <- createFolds(logBBB, k=10, list=TRUE, times = 100)
trControl = trainControl(method = "cv", index = tmp)
ctreeFit <- train(bbbDescr, logBBB, "ctree",trControl=trControl)
. Teşekkürler! Cevabımı sorularıma eşleştirmek için zor bir zaman geçiriyorum. Buna dayanarak, 'index' burada hangi rolü oynadı? –
@ user273158 İndeksin rolü nedir? indeks sadece tmp vektörüdür ... bölümleriniz .. – agstudy
Hmm, ama 'boot' (bootstrapping) gibi bir metod' index'te belirtilen bölümleri nasıl kullanır? Önyüklemeyi CV için bir yöntem olarak anlıyorum (trenle değiştirme ve neyin solda olduğunu ölçün), ama önyüklemede "index" in nasıl kullanıldığını değil. –