HTML dosyalarını yüklemek ve ayrıştırmak için Jsoup adlı bir HTML ayrıştırıcısı kullanıyorum. Sorun, UTF-8
kodlamasını (?) Kullanırken, kazıma yaptığım web sayfasının ISO-8859-1
karakter kümesinde kodlanmasıdır. Bu, bazı karakterlerde soru işareti olarak gösteriliyor.Android'de bir dizeyi UTF-8'e nasıl dönüştürebilirim?
Yani şimdi ben UTF-8 biçiminde dizesi dönüştürmek gerekir sanırım.
Şimdi ben bana yardımcı olabilir sanırım Android SDK'deki CharsetEncoder denilen bu Class, bulduk. Ama bunu pratikte nasıl uygulayacağımı anlayamıyorum, bu yüzden pratik bir örnekle yardım edip edemeyeceğini merak ediyorum.GÜNCELLEME: Kod Bir byte [] içine sayfayı okuma ve Dize nesneleri ayrıştırma için jSoup yöntemleri kullanarak Android sizin için çalışma yapalım yapabilirsiniz (Jsoup)
url = new URL("http://www.example.com");
Document doc = Jsoup.parse(url, 4000);
Bir html dokümanı okumak için kullanılan kod gönderir misiniz? – yanchenko
Tamam, Gönderiyi güncelledim. – droidgren