2016-03-23 17 views
1

.pdf dosyalarını okumak için R, 'tm' paketini kullanmayla ilgili sorun yaşıyorum. bana hata veren ...Windows'ta pdftotext'i yükleme (R, 'tm' paketi ile kullanmak için)

library(tm) 
filename = "myfile.pdf" 

tmp1 <- readPDF(PdftotextOptions="-layout") 
doc <- tmp1(elem=list(uri=filename),language="en",id="id1") 
doc[1:15] 

: Özellikle, aşağıdaki kodu çalıştırmayı

Error in readPDF(PdftotextOptions = "-layout") : 
    unused argument (PdftotextOptions = "-layout") 

bu gerçeği nedeniyle olduğunu varsayalım o xpdf'te ait pdftotext programı (part , http://www.foolabs.com/xpdf/download.html) makinemde doğru şekilde yüklenmemiş, böylece R buna erişemiyor.

Yukarıdaki R kodu yürütülebilmesi için xpdf/pdftotext dosyasını doğru şekilde kurma adımları nelerdir? (Ben aynı soruyu zaten bildirilen farkındayım, ancak aynı sorunu ele almıyorlar)

+0

'-layout' seçeneği olmadan" readPDF "yi çağırırsanız ne olur? –

+0

pdftools paketini kullanmayı deneyin. Bu, xpdf'yi yükleme zorluğunu ortadan kaldırır. – phiver

+0

@Karsten: -layout ayarı olmadan kodu çalıştırmak bana şu hatayı verir: >>> Sistem2'de hata ("pdftotext", c (kontrol $ text, shQuote (x), "-"), stdout = TRUE): '"pdftotext"' bulunamadı <<< – SuperUser01

cevap

1

PdftotextOptionsreadPDF parametresinin bir parametresidir. readPDF, bir liste bekler bir control parametresi vardır. Yani doğru kullanımı olacaktır:

if(all(file.exists(Sys.which(c("pdfinfo", "pdftotext"))))) { 
    tmp1 <- readPDF(control = list(text = "-layout")) 
    doc <- tmp1(elem=list(uri=filename),language="en",id="id1") 
} 
+0

Bu ilk bakışta işe yarıyor gibi görünüyor. Cevabınızı daha sonra inceledikten hemen sonra kabul edeceğim. – SuperUser01

0

Seti Bana uyar

setwd('C:/xpdf/bin64')     

.

İlgili konular