Bir web sayfasının HTML kaynağındaki tüm Görüntü URL'lerinin listesini almak istiyorum (Hem müstehcen hem de göreli URL'ler). HTML'yi ayrıştırmak için Jsoup'u kullandım, ancak tüm görüntüleri vermiyor. Mesela ben onun gösteren google.com HTML kaynağını ayrıştırma am zaman sıfır images..In google.com HTML kaynak görüntü bağlantıları görüntüler bağlantılar şeklinde Tüm Görüntüleri HTML'den Ayıkla JAVA Kullanma
"background:url(/intl/en_com/images/srpr/logo1w.png)
Ve rediff.com içinde
vardır .. şeklindedir ..videoArr[j]=new Array("http://ishare.rediff.com/video/entertainment/bappi-da-the-first-indian-in-grammy-jury/2684982","http://datastore.rediff.com/h86-w116/thumb/5E5669666658606D6A6B6272/v3np2zgbla4vdccf.D.0.bappi.jpg","Bappi Da - the first Indian In Grammy jury","http://mypage.rediff.com/profile/getprofile/LehrenTV/12669275","LehrenTV","(2:33)"); j = 1 videoArr[j]=new Array("http://ishare.rediff.com/video/entertainment/bebo-shahid-jab-they-met-again-/2681664","http://datastore.rediff.com/h86-w116/thumb/5E5669666658606D6A6B6272/ra8p9eeig8zy5qvd.D.0.They-Met-Again.jpg","Bebo-Shahid : Jab they met again!","http://mypage.rediff.com/profile/getprofile/LehrenTV/12669275","LehrenTV","(2:17)");
tüm resimler "img" tags..I da yukarıdaki HTML kaynağı gösterildiği gibi "img" etiketleri bile olmayan görüntüleri ayıklamak istediğiniz yer ile değil.
Ben Teşekkür
Neden Java? Bir tarayıcı eklentisi geliştirmeyi düşündünüz mü? – fglez
Veya herhangi bir görüntüyü kaydeden bir proxy uygulayın? –