Java kullanmamız gerektiğini varsayarsak, birçok farklı html içeriğini ayrıştırmak için esnek olan en iyi html ayrıştırıcısı nedir ve karmaşık ayrıştırma türleri yapmak için çok fazla kod gerektirmez?java için en iyi html ayrıştırıcısı nedir?
6
A
cevap
10
Bunun için Jsoup öneriyoruz. O, jQuery like CSS selectors and non-verbose element iteration desteği ile çok güzel bir API'ye sahiptir. Örnek olarak this answer bir kopyasını almak için, bu kendi sorunuzu ve buradaki tüm answerers adını yazdıran:
URL url = new URL("https://stackoverflow.com/questions/3121136");
Document document = Jsoup.parse(url, 3000);
String question = document.select("#question .post-text").text();
System.out.println("Question: " + question);
Elements answerers = document.select("#answers .user-details a");
for (Element answerer : answerers) {
System.out.println("Answerer: " + answerer.text());
}
alternatif XPath olurdu, ama JSoup zaten iyi bir kavrayışa sahip kim webdevelopers için daha yararlıdır CSS seçiciler.
1
İlgili konular
- 1. HTML ayrıştırıcısı nasıl oluşturulur?
- 2. Python'da HTML işlemenin en iyi yolu nedir?
- 3. Ücretsiz Java HTML ve JS ayrıştırıcısı
- 4. http bağlantıları için en iyi java lib?
- 5. Jsoup Java HTML ayrıştırıcısı: javascript olaylarını yürütme
- 6. En iyi java web hizmeti çerçevesi nedir?
- 7. HTML 4.01 sıkı düzenleme için en iyi Emacs modu nedir?
- 8. Swift içinde html ayrıştırmak için en iyi yöntem nedir?
- 9. Java için iyi bir hafif HL7 ayrıştırıcısı var mı?
- 10. Word'e HTML ayrıştırıcısı
- 11. Java web uygulamaları için en iyi 3D grafik kütüphanesi nedir?
- 12. .NET HTML DOM Ayrıştırıcısı?
- 13. varolan bir xml belgesini değiştirmek/düzenlemek için en iyi java Xml ayrıştırıcısı
- 14. Html Grafikleri için en iyi yöntemler
- 15. HTML düzenleri en iyi uygulama
- 16. Silverlight'taki FlowDocument için en iyi yedek nedir?
- 17. CMake için en iyi ücretsiz referans nedir?
- 18. Mongoid'i öğrenmek için en iyi öğretici nedir?
- 19. WebGL'yi öğrenmek için en iyi yol nedir?
- 20. Emacs için en iyi java araçları
- 21. HTML işaretlemesinde ERB denetim yapılarını girerken en iyi uygulama nedir?
- 22. node.js'de express.js ile html sunmanın en iyi yolu nedir? Böyle
- 23. C++ 'da HTML çıktısı üretmenin en iyi yolu nedir?
- 24. Bir Html tablosunu veritabamına dönüştürmenin en iyi yolu nedir
- 25. en iyi (veya en azından iyi) kılavuz
- 26. En iyi javascript obfuscator nedir?
- 27. Java kütüphanesi olarak mevcut en iyi ücretsiz JavaScript obfuscator nedir?
- 28. En iyi açık kaynaklı saf java bilgisayar görme kütüphanesi nedir?
- 29. Java kullanarak dosya aktarmanın en iyi yolu nedir?
- 30. Jmeter'da en iyi yolu bulmanın en iyi yolu nedir?
Teşekkürler! Bu harika görünüyor. – egervari
Rica ederim. – BalusC