2012-03-11 22 views
6

Tüm resimleri ben indirmek istiyorum this site ama fotoğrafları indirdikten sonra hepsi bozuk. Onları başarıyla indirmek için ne yapmalıyım?Download png/jpg with R

Kodum:

library(XML) 
dir.create('c:/photos') 
urls<-paste("http://thedevilsguard.tumblr.com/page/",1:1870,sep="") 
doc<-htmlParse(urls[1]) 
links<-unique(unlist(xpathApply(doc,'//div[@class="timestamp"]/a',xmlGetAttr,'href'))) 
for (i in 1:length(links)){ 
    doc2<-htmlParse(links[i]) 
    link<-xpathApply(doc2,'//div[@class="centre photopage"]//p//img',xmlGetAttr,'src')[[1]][1] 
    download.file(link,paste("C:/photos/",basename(link),"")) 
} 
+0

Ubuntu 11.10'da benim için iyi çalışıyor. –

cevap

12

Yani Windows altındasınız. İkili dosyaları indirdiğinizde, ikili olarak modunu belirtmeniz gerekir, ör.

download.file(link, ..., mode = 'wb') 

Detaylar için ?download.file görüyoruz.

+0

Teşekkür ederim, istediğim buydu. – Maciej

1

Birincisi, denemek ve birini indirin. Bunu yapın:

link = "http://29.media.tumblr.com/tumblr_m0q2g8mhGK1qk6uvyo1_500.png" 
download.file(link,basename(link)) 

Bu işe yarıyor mu?

Bir PNG'sini ve JPEG'I DEĞİLDİR, belki de JPEG olarak okumaya çalışıyorsunuzdur.

+0

Evet, elbette, jpg'yi png diye yazdım, üzgünüm, ama hala görüntülerin indirilmesinde bir sorun var. Gördüğüm gibi orada da png ve jpg dosyaları var. – Maciej

+0

Örneğin: http://25.media.tumblr.com/tumblr_m0q1huFBbw1qk6uvyo1_500.jpg. – Maciej

+0

Bu resim karşıdan yükleme tamam, ancak bir resim görüntüleyici ile görüntüleme bana bilinmeyen bir Exif (TIFF) türü hakkında bir uyarı veriyor. Görüntü kendisi (üç adam bir silah) iyi görünüyor. Yaşadığınız 'yolsuzluğun' doğası nedir? – Spacedman