Şu anda, HTML kodlarını java'daki eşdeğer karakterlerle dönüştürme üzerinde çalışıyorum. Aşağıdaki kodu karakterlere dönüştürmem gerekiyor. Ben hata ayıklama HTML kodlarını, eşdeğer karakterlerle değiştir Java
è - è
® - ®
& - &
ñ - ñ
& - &
Ben düzenli ifade deseni
(&#x)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)(;)
kullanarak çalıştı, matcher.find()
bana true
verir ama kontrolü ben dönüşüm için kod yazdım döngü atlar. Orada neler olduğunu bilmiyorum.
Ayrıca, bu düzenli ifadeyi optimize etmenin herhangi bir yolu var mı?
Herhangi bir yardım için teşekkür ederiz.
İstisna
Ayrıcajava.lang.NumberFormatException: For input string: "x26"
at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at org.apache.commons.lang.Entities.unescape(Entities.java:683)
at org.apache.commons.lang.StringEscapeUtils.unescapeHtml(StringEscapeUtils.java:483)
Zaten cevaplanır :). [Java'da HTML'den kaçınmak için önerilen yöntem] (http://stackoverflow.com/questions/1265282/recommended-method-for-escaping-html-in-java) –