Bunu yapmak için saf R şekilde düşünemiyorum, ancak muhtemelen örneğin,
the PDF toolkit, PDFtk için (favori PDF komut satırı aracını yüklemek ve en azından bazı almak için kullanabilirsiniz
veri aradığınız.
aşağıdaki pdftk kullanarak temel bir örnektir. Bu pdftk
yolunuzda erişilebilir olduğunu varsayar.
x <- getwd() ## I'll run this example in a tempdir to keep things clean
setwd(tempdir())
list.files(pattern="*.txt$|*.pdf$")
# character(0)
pdf(file = "SomeOutputFile.pdf")
plot(rnorm(100))
dev.off()
system("pdftk SomeOutputFile.pdf data_dump output SomeOutputFile.txt")
list.files(pattern="*.txt$|*.pdf$")
# [1] "SomeOutputFile.pdf" "SomeOutputFile.txt"
readLines("SomeOutputFile.txt")
# [1] "InfoBegin" "InfoKey: Creator"
# [3] "InfoValue: R" "InfoBegin"
# [5] "InfoKey: Title" "InfoValue: R Graphics Output"
# [7] "InfoBegin" "InfoKey: Producer"
# [9] "InfoValue: R 3.0.1" "InfoBegin"
# [11] "InfoKey: ModDate" "InfoValue: D:20131102170720"
# [13] "InfoBegin" "InfoKey: CreationDate"
# [15] "InfoValue: D:20131102170720" "NumberOfPages: 1"
# [17] "PageMediaBegin" "PageMediaNumber: 1"
# [19] "PageMediaRotation: 0" "PageMediaRect: 0 0 504 504"
# [21] "PageMediaDimensions: 504 504"
setwd(x)
Ben w belirtmek için orada diğer seçeneklerin ne içine bakmak istiyorum şapka meta verileri ayıklanır ve bu bilgileri sizin için daha yararlı bir forma dönüştürmek için uygun bir yol olup olmadığına bakın.
'readPDF' form tm paketine bir bakın. –
Teşekkürler - ışıl ışıl gözüküyor, ancak kullanımı açık değil, öznitelikleri, örneğin içerik yapımcısını yazmayı başarabildiğim zaman geri bildireceğim. –
'file.info()' bu bilgilerin bir kısmını size sağlayacak – GSee