XLS ve XLSX dosyalarını başarıyla ayrıştırmak için POI kullanıyorum. Ancak, bir Excel elektronik tablosundan, Çince veya Japonca gibi UTF-8 kodlu karakterler gibi özel karakterleri doğru şekilde ayıklayamıyorum. Ben bir UTF-8 kodlanmış csv veya sekmeyle ayrılmış dosyadan veri ayıklamak, ama Excel dosyası ile hiçbir şans nasıl anladım. Biri yardım edebilir mi?Excel dosyalarında UTF-8 karakterleri POI kullanarak nasıl ayrıştırılır
(Düzenleme : yorumlarla denKod pasajı) bir Excel dosyasından Pers metni ayıklanırken
HSSFSheet sheet = workbook.getSheet(worksheet);
HSSFEvaluationWorkbook ewb = HSSFEvaluationWorkbook.create(workbook);
while (rowCtr <= lastRow && !rowBreakOut)
{
Row row = sheet.getRow(rowCtr);//rows.next();
for (int col=firstCell; col<lastCell && !breakOut; col++) {
Cell cell;
cell = row.getCell(col,Row.RETURN_BLANK_AS_NULL);
if (ctype == Cell.CELL_TYPE_STRING) {
sValue = cell.getStringCellValue();
log.warn("String value = "+sValue);
String encoded = URLEncoder.encode(sValue, "UTF-8");
log.warn("URL-encoded with UTF-8: " + encoded);
....
Kullandığınız POI API'sinin bölümlerini işaret edebilir veya bize bir kod gösterebilir misiniz? Bu, hata ayıklamaya yardımcı olacak API değişikliklerini veya tanılamalarını önermemize yardımcı olur. –
Excel, karakterleri UTF-8 olarak saklamıyor, bu yüzden muhtemelen bir yere karıştığınızı düşünüyorum ... – Gagravarr
Excel Dosyası Ekran Görüntüsü: – user1198370