Html içerebilecek bazı metinleri filtrelemek istediğim için sorun yaşıyorum. Jsoup'u kullanarak, güzel olan etiketleri beyaz listeye ekleyin ve temizleyin.Jsoup özniteliği kaldırılıyor html etiketleri
Yalnızca bazı etiketlerin çoğunlukla stil veya sınıf nitelikleri içerebileceği, ancak farklı özellikler de olabileceği sorunu var. (name, target, ect.) Bunu temizlerken sorun yoktur, çünkü bunlar iyi bir şekilde sıyrılırlar, ancak beyaz etiketler eklendiğinde, izin verilen bazı etiketler, nitelikler nedeniyle engellenir. Temel beyaz liste, stil veya sınıf özelliklerini kapsayacak gibi görünmüyor, ben de karşılaştığım başka bir şey değil. Ben etiketleri oldukça geniş bir yelpazede sağlar, ancak temizlik sırasında çoğu kaldırmak istediğiniz beri
, ben izin veriyorum tüm etiketler için tüm özellikleri eklemek istemiyorum. En basit olanı, tüm etiketlerden tüm özniteliklerin çıkarılmasıdır. Zaten bunlarla ilgilenmiyorum ve sonra düz etiketli soyulmuş metnin geçerli olup olmadığını kontrol et.
tüm özellikleri ya da bazı basit döngü kaldıran bir işlev, bir başka seçenek tüm özelliklerini göz ardı ederek sadece etiketlere beyaz listeye almak whitelister anlatmak olacağını mı.
Related ile
upadted kodu: http://stackoverflow.com/questions/14303691/why-does-jsoup-remove-element-ids/14303971#14303971 –