Çeşitli farklı spor takımlarından Tweets'e dayalı bir Word Cloud oluşturuyorum. Bu kod 10 kez başarıyla yaklaşık 1 yürütür:TermDocumentMatrix bazen hata atıyor
Error in simple_triplet_matrix(i = i, j = j, v = as.numeric(v), nrow = length(allTerms), :
'i, j, v' different lengths
In addition: Warning messages:
1: In mclapply(unname(content(x)), termFreq, control) :
all scheduled cores encountered errors in user code
2: In simple_triplet_matrix(i = i, j = j, v = as.numeric(v), nrow = length(allTerms), :
NAs introduced by coercion
Herhangi bir fikir adamlar:
10 kere, aşağıdaki hata atıyorhandle <- 'arsenal'
txt <- searchTwitter(handle,n=1000,lang='en')
t <- sapply(txt,function(x) x$getText())
t <- gsub('http.*\\s*|RT|Retweet','',t)
t <- gsub(handle,'',t)
t_c <- Corpus(VectorSource(t))
tdm = TermDocumentMatrix(t_c,control = list(removePunctuation = TRUE,stopwords = stopwords("english"),removeNumbers = TRUE, content_transformer(tolower)))
m = as.matrix(tdm)
word_freqs = sort(rowSums(m), decreasing=TRUE)
dm = data.frame(word=names(word_freqs), freq=word_freqs)
wordcloud(dm$word, dm$freq, random.order=FALSE, colors=brewer.pal(8, "Dark2"),rot.per=0.5)
diğer 9? Ben googled ettik, ama şimdiye kadar kısa geldi! Unutmayın ki R'de mutlak bir acemi! uğraşırken biraz aşağıdaki kod satırı tamamen benim sorunu belirlemiştir Yani sonra
Bu sorunun derhal giderilmesini onaylayabilir miyim (Mac'te çalışıyor). – timothyjgraham