2016-04-03 15 views
0

Tüm web sitelerine yeniden kullanılabilir olması gerekir Jsoup html ayrıştırıcısını kullanarak farklı web sitelerinden veri okuma gereksinimim var (Örn: ad, şehir, eyalet, posta vb.). Verileri bir web sitesinden okuyabiliyorum. ama sorun benim kodum diğer web sitelerine yeniden kullanılabilir. ancak diğer web sitesinde elemanlar ve konumları ilk web sitesinden farklıdır. Bunu nasıl başarabilirim. lütfen herhangi bir desen veya herhangi bir örnek önerin. Teşekkürler.Jsoup örnek veri formu farklı html'nin sayfa (veya) web sitelerini okumak için?

+0

http://jsoup.org/ güzel bir belgeye sahip –

+0

tam bağlantı sağlayabilir misiniz lütfen? – Harinath

cevap

0

Bunu sizin için doğrudan alacağım, tüm web sitelerini kazımak için genel ayrıştırıcıya ulaşmak için YOK YOL YOKTUR. 30 web sitesini kazıdığım bir şirkette çalıştım. Ve her web sitesi için gerçekten bir tane yazmak zorunda kaldım. Ancak, 'un ayrıştırdığınız verileri işlemesi için'un size yardımcı olduğu genel yardımcı sınıfları oluşturabilirsiniz.

+0

evet biliyorum, ancak her web sitesi için öğeleri yapılandırmak ve buradan öğe verilerini okumak için herhangi bir xml veya json yapılandırma yolu. kod yeniden kullanılacak çünkü? – Harinath

+0

Evet, bunu yapabilir, her web sitesini kontrol edebilir ve eleman seçicilerini xml dosyasında eşleyebilirsiniz. Sonra web sitelerini kazıdığınızda, ilgili eleman seçicisini almak için xml'yi ayrıştırırsınız. Ancak bu yine de her web sitesinden geçmenizi gerektirir ... eğer senin için sorun yoksa :) –

+0

teşekkürler @Joel Min. anladım. Web sitesi URL'lerini ve öğelerini Json dosyasında yapıyorum. Oradan okudum. kod çok azaldı. Teşekkürler. – Harinath

İlgili konular