Jsoup'a koyduğum bir HTML (String) var, böylece tüm href ve src özniteliklerine bir şey ekleyebilirim, bu da iyi çalışıyor. Ancak, bazı özel HTML karakterleri için Jsoup'un “
gerçek karakterine “
'dan dönüştürdüğünü fark ettim. Değeri önce ve sonra çıkardım ve bu değişikliği görüyorum.Jsoup özel HTML sembolleriyle ilgili sorunlara, ‘ — vb.
önce:
THIS — IS A “TEST”. 5 > 4. trademark: ™
sonra:
THIS — IS A “TEST”. 5 > 4. trademark: ?
halt neler oluyor? Bunu önlemek için herhangi bir Jsoup malzemesinden önce bu özel karakterleri HTML varlıklarına özel olarak dönüştürüyordum. Alıntılar gerçek alıntı karakterlerine değişti, büyük olan aynı kaldı ve ticari marka bir soru işaretine dönüştü. Aaaaaaa.
Bilginize, benim Jsoup kod yapıyor: Herhangi bir yardım için
Document document = Jsoup.parse(fileHtmlStr);
//some stuff
String modifiedFileHtmlStr = document.html();
Teşekkür!
Müthiş, teşekkürler ... bir cazibe gibi çalıştı. Jsoup’da yeniyim ve bunları sitelerinde yemek kitabında görmedim. – mikato
@ Andrew Chaschev settings.escapeMode (Entities.EscapeMode.extended); Entities bulundu ve dolayısıyla benim soruya http://stackoverflow.com/questions/20908946/jsoup-adding-extra-encoded- bir hatası oldu.Lütfen göz vermiyor şeyler-için-bir-html –
@ Andrew Chaschev kişiler sınıfı şimdi 1.6.1 jsoup sürümünü ama şimdi HTML dosyasıdır bile worse.Its appanding & yeni satır everywhere.Kindly yardım yüklü çalışıyor. –