R'de RCurl paketinin getURL işlevini kullanarak bir API'den sayfalarda veri kazımaya çalışıyorum. Sorun şu ki yanıtı yineleyemiyorum R'yi kullanarak istekte bulunduğumda Chrome’da URL’yi açtığımda görüyorum. Esasen, Chrome’daki API sayfasını (aşağıda URL) açtığımda iyi çalışıyor ancak R’de getURL’i kullanmamı istesem (veya gizli modunu kullanarak Chrome) '500 Dahili Sunucu Hatası' yanıtı alıyorum ve aradığım güzel JSON'u değil. Söz konusu'RCurl' [R] paketi, kazıma sırasında getURL web sayfası hatası API
benim (başarısız) [R] istek.
test2 <- fromJSON(getURL("http://www.bluenile.com/api/public/loose-diamond/diamond-details/panel?country=USA¤cy=USD&language=en-us&productSet=BN&sku=LD04077082", ssl.verifypeer = FALSE, useragent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.124 Safari/537.36"))
Araştırmam çok Uzak Öncelikle yığın bu önceki soruya bakıp (sorunu çözmek yoktu ama yine de gerekli olabilir) isteğine benim kullanıcı aracısı eklenen: ViralHeat API issues with getURL() command in RCurl package
Sonraki ÇözümHakkında R Disparity between browser and GET/getURL
benim Fikirler: Ben gerekçesini kılavuzluk bu yararlı yazı baktıBu benim uzmanlık alanım değil ama tahminim, isteğin, isteği tamamlamak için gereken bir çerez içermemesidir (bu nedenle tarayıcımda neden gizli modda çalışmıyor).
Başarılı isteği:
Başarısız istek:
Herkes herhangi bir fikir var ben başarısız isteğine başarılı isteği istekleri ve yanıtları karşılaştırıldı? Yaptığım 2. postada MrFlick tarafından önerilen RSelenium
paketini kullanmayı denemeliyim.
Muhteşem. Bir cookiejar ile çalışmayı denedim ama bu hiçbir şey dönmüyordu. Ön sayfalarını önce ziyaret etmeliydin. Zeki. Durumun böyle olduğunu nereden biliyordun? – stanekam
Krom gizli modun başarısız olması, açılış sayfasına bakmamı ve orada nelerin yapılmakta olduğunu gösterdi. – jdharrison
Bravo, mükemmel çalışıyor! Etkileyici problem çözme ve anlama. – Tom