2016-04-06 15 views
2

Negatif binomal veri üretildikten sonra .007'ye eşit olarak ayarlandı. Bu sayıyı glm.nb() uyarından aldım ancak sadece aldatmakla."prob" parametresini glm.nb() dışında nasıl alabilirim?

library(MASS) 
counts<-data.frame(as.matrix(rnbinom(10000, prob = .007, size = 247))) 
names(counts)<-"y" 

head(counts) 

fitted_model<-glm.nb(y ~ 1, data = counts, link="identity") 

#Theta is the shape parameter of the negative binomial distribution. So this is "r". 
r<-theta.ml(fitted_model$y, fitted(fitted_model))[1]  
# the parameter r is referred to as the “dispersion parameter” or “shape parameter” 

mu<-coef(fitted_model) #This is the mean 

# mu=prob*r/(1-prob) according to https://en.wikipedia.org/wiki/Negative_binomial_distribution 
# so prob = 1/(r + mu) ? 
1/(r + mu) # Wrong! This isn't the prob I used to generate th data! 
r/(r + mu) # Right! But why does this get me the correct value of prob? 

#This has hints: http://www.wright.edu/~thaddeus.tarpey/ES714glm.pdf 

Takılan modelden "prob" değerini almak için hile yapmak istemiyorum. Herkes neden r/(r + mu) = prob olduğunu açıklayabilir mi? Eğer ?NegBinomial

Gamma(x+n)/(Gamma(n) x!) p^n (1-p)^x 

verilen tanımla Wikipedia'nın tanımı

C(k+r-1,k) (1-p)^r p^k 

karşılaştırırsanız

cevap

2

Eğer p ve 1-p rolleri açık ve göreceğiniz; Eğer NB'yi "bir başarısızlıktan önce meydana gelen n başarı olasılığı" olarak tanımlarsak, Vikipedi "başarısızlık" olasılığı olarak p'u tanımlamaktadır, R ise "başarı" olasılığı olarak p'u tanımlamaktadır. mu/(r+mu)mu/(r+mu) yerine r/(r+mu)'dan doğru sonucu aldım.

+0

Şimdi iki şey öğrendim: bu sorunun çözümü ve her iki sistemde pdf formüllerini her zaman karşılaştırması gereken kural. – rwinkel2000

İlgili konular