Son zamanlarda BeautifulSoup ile pythonda web kazıyıcıları geliştirmekteyim. Şimdi Java'da hangi kütüphanelerin en çok tercih edildiğini bilmek istiyorum. Bazı aramalar yaptım, çoğunlukla JTidy ve JSoup'u görüyorum. Onların arasındaki fark ne?JTidy veya Jsoup for Java
5
A
cevap
11
JTidy
daha yaygın <div><span>text</div>
den <div><span>text</span></div
için, örneğin, kapanmamış etiketler gibi, bozuk veya arızalı bir HTML düzeltmek için, yani, düzenli HTML için kullanılır.
JSoup
getElementById
gibi JavaScript ile kullandığınız öğelere eşdeğer DOM
methods kullanmanızı sağlar. JSoup'un gerçekten de Java'nın BeautifulSoup eşdeğeri olduğunu söyleyebilirim. Örneğin, JSoup ile bir Vikipedi maddesinin birinci paragrafı ayıklamak için şunu kullanabilirsiniz aşağıdaki:
String url = "http://en.wikipedia.org/wiki/Potato";
Document doc = Jsoup.connect(url).get();
Elements paragraphs = doc.select(".mw-content-ltr p");
String firstParagraph = paragraphs.first().text();
Ya da bu çok kendi soruya gelen başlık çıkaramadık:
Document doc = Jsoup.connect("http://stackoverflow.com/questions/12439078/jtidy-or-jsoup-for-java").get();
String question = doc.select("#question-header a").text(); // JTidy or Jsoup for Java
Güzel bir API, ha? :-)
İlgili konular
- 1. Java - Jsoup
- 2. jTidy ve TagSoup belgeleri
- 3. Jsoup
- 4. Java jsoup ayrıştırma özel etiketi
- 5. Jsoup Java HTML ayrıştırıcısı: javascript olaylarını yürütme
- 6. Ipairs veya for döngüsü kullanmalıyım
- 7. Spring for Python, Java for Spring ile karşılaştırıyor
- 8. Jsoup - Metin
- 9. Girişi Mesaj Yöntemi Jsoup
- 10. Java - Check for: Bir veya daha fazla whitespaces, karakter, bir veya daha fazla whitepace
- 11. Java For-Her Döngü: Sıralama sırası
- 12. Java için geliştirilmiş for döngüsünün sözdizimi nedir?
- 13. Siteye JSoup aracılığıyla postayla gönderme
- 14. Java: JSoup ile tüm bağlantıları belirli bir kelime ile ayıklayın?
- 15. Android JSoup Örnek
- 16. jsoup xpath'i destekliyor mu?
- 17. Selenium vs Jsoup performansı
- 18. Başarısız oldu Jsoup
- 19. Jsoup özel karakterleri kaldırır
- 20. Jsoup özniteliği kaldırılıyor html etiketleri
- 21. jsoup - Eksik ve bozuk etiketleri içeren HTML'yi temizleme
- 22. Google Sonuçları kazımak için JSoup kullanma
- 23. Boru veya Takas Giriş/Java
- 24. : java veya kabuk betiği?
- 25. Java: Grafik veya Grafik2D?
- 26. Ayrıştırıcı JSoup küçük harf harf
- 27. JSoup içinde "name" ile seçin
- 28. Jsoup Gecikme nedeniyle web sitesi
- 29. Jumper for Jersey'i kolayca kullanabilir
- 30. For döngüsü aşağıdaki eminim
İlgili: http://stackoverflow.com/questions/5183748/tagsoup-vs-jsoup-vs-html-parser-vs-hotsax-vs – Vadzim