içinde tavsiye edersiniz ne HTML ayrıştırma kitaplıkları? Artıları ve eksileri var mı?ben</p> <p>Ne HTML ayrıştırıcıları tavsiye edersin vb bazı özellikler/etiketlerinin değerleri bulmak için bazı HTML ayrıştırmak isteyen Java
cevap
Son derece basit olan HTML Parser'u denedim.
Bir projede HTML ayrıştırıcısını kullandım ve tam olarak beklendiği gibi çalışıyordu –
Ancak çok fazla öğretici yok ... – Lily
Benim sözde "metin düğümünde sürünen bir sürü javascript parçacığı (ve öğe öznitelikleri) farkettim "ekstraksiyonlar. Hatalı HTML'nin tüm ayrıştırma işleminin başarısız olmasına neden olduğu bazı durumlar da vardır. Bu yüzden kendi projemdeki htmlparser kütüphanesini biraz daha iyi bir şeyle değiştirmek istiyorum. – benjismith
HTML'nin tam ayrıştırmasını yapmanız mı gerekiyor? İçeriğindeki belirli değerleri (belirli bir etiket/param) arıyorsanız, basit bir normal ifade yeterli olabilir ve daha hızlı olabilir.
- 1. jQuery, .html()? Kullanırken bir dizeden bazı html öğeleri çıkarır mı?
- 2. Ben bazı seçenekleri hatırlıyorum HTML 5'i
- 3. node.js ile html sayfaları ayrıştırmak için tercih edilen DOM kitaplığı?
- 4. nasıl benim veritabanından bazı etiketlerini almak isteyen
- 5. Java/Guava'daki bazı Anahtarlar için bir Haritadaki tüm Değerleri Alın?
- 6. HTML ile ayrıştırmak için Xpath kullanarak PHP ile
- 7. Html görünümü nasıl devre dışı bırakılır? Ben bir html tablo engelli görünmesi için bazı forumlarda okumak
- 8. JSON ayrıştırıcıları için karşılaştırmalar?
- 9. html truncator java
- 10. html etiketlerinin bir <code>div</code> için <code>textarea</code> metni gönderen JavaScript bazı fonksiyon, inşa etmek isteyen
- 11. Değişken Adlarıyla Bazı Değişken Değerleri Değiştirin
- 12. java için en iyi html ayrıştırıcısı nedir?
- 13. nasıl HTML dosyalarından bazı verileri çıkarmaz çalışıyorlar BeautifulSoup
- 14. SyntaxError ben olmayan bazı ASCII cheracter içeren xml ayrıştırmak çalışıyorum
- 15. HTML - <! - InstanceEndEditable ->
- 16. Java Html Sınıfını Kullanarak belirli html sınıfını nasıl silebilirim?
- 17. HTML
- 18. HTML tablosunda tbody, colgroup, thead vb. Ne zaman kullanılır?
- 19. bazı metni
- 20. Java ile Markdown için HTML
- 21. Krom uzantısının silinmesinden sonra bazı html öğelerini web sitesinden kaldırın
- 22. Zend Formunda bir radyo düğmesi bazı HTML sonraki koyarak
- 23. Bazı DB işlemlerini gerçekleştirirken Flask'ta Statik HTML Sunma
- 24. PHP: __ ('Bazı metin') ne yapar?
- 25. Java Agent'lar için bazı ilginç kullanımlar nelerdir?
- 26. HTML etiketlerinin yürütülmesini önlemek için HTML etiketi?
- 27. "const sınıfı" ne anlama geliyor? Bazı sonra
- 28. HTML seçme/seçenek açılır listesinde bazı ek bilgiler taşımak
- 29. Bazı diğer html öğelerinin model değeri temelinde ng-show
- 30. jQuery'yi kullanarak bazı html öğelerini tıkladıysanız sağ tıklamayı nasıl tetikleyebilirim?
XPath, HTML ayrıştırma yoludur, düzenli biçimlendirilmiş HTML'de olduğu gibi normal ifadeler başarısız olduğunda da yardımcı olur. –