Bu makale http://www.ajnr.org/content/30/7/1402.full numaralı makalede, html tablolarına, hasatla kazımak istediğiniz dört bağlantı içerir. css seçicinin yardımıylaR ve rasgele birden çok bağlantılı HTML tablolarını kazıyın
:
library("rvest")
html_session("http://www.ajnr.org/content/30/7/1402.full") %>%
follow_link(css="#T1 a") %>%
html_table() %>%
View()
css-seçici:
".table-inline li:nth-child(1) a"
yapar
"#T1 a"
böyle birinci tabloya almak mümkündür dört tabloya bağlanan etiketleri içeren dört html düğümünü seçmek mümkün:
library("rvest")
html("http://www.ajnr.org/content/30/7/1402.full") %>%
html_nodes(css=".table-inline li:nth-child(1) a")
Bu listeyi değiştirmek ve dört tabloyu tek seferde almak nasıl mümkün olabilir? En iyi yaklaşım nedir?
belki bu size yardımcı oluyor http://stackoverflow.com/questions/1395528/scraping-html- tablo-r-veri-çerçeveler-kullanarak-xml paketi –