içine karakter akışı dönüştürmek şöyle görünür:Java Ben buna karakterlerin bir grup var insan "okunabilir" dize
Комуникационна кабелна система
ve bazen böyle bir karışımına sahip:
Généralités
К о м у н: ilk çevirirк а ц и о н н а к а б е л н е м а
а с и с т ve ikinci:
G é n é ralit é s
Bunun bir tarayıcı kullanarak ve vücuda koyun görebilirsiniz.
Ama java çıkışını "gerçek" karakterlere nasıl yapabilirim? Yukarıdaki kodlama nedir?
Ben birkaç şey denedim ve son olarak bu (ki işe yaramadı):
import java.nio.charset.*;
import java.nio.ByteBuffer;
import java.nio.CharBuffer;
List<String> lst = new ArrayList<String>(); lst.add("К"); lst.add("о");
for (String s : lst) {
Charset utf8charset = Charset.forName("UTF-8");
Charset iso88591charset = Charset.forName("ISO-8859-1");
ByteBuffer inputBuffer = ByteBuffer.wrap(s.getBytes());
// decode UTF-8
CharBuffer data = utf8charset.decode(inputBuffer);
// encode ISO-8559-1
ByteBuffer outputBuffer = iso88591charset.encode(data);
byte[] outputData = outputBuffer.array();
System.out.println (new String(outputData))
}
HTML-kaçtı. –
bunlar varlık olarak adlandırılır. Eğer varlık-unicode dönüşüm ararsanız, bu şekilde aradığınızı bulabilirsiniz – dldnh
@dldnh netleştirmek için teşekkürler! internette arama yapmak için en kolay şey değil :) – momomo