2012-06-07 12 views
15

Nodejs kullanarak UTF-16'da kodlanmış bir dosyayı okumalıyım (çok büyük olduğu için parçalar içinde). Dosyadaki veriler bir mongodb'a dönüşecek, bu yüzden utf-8'e dönüştürmem gerekecek. Googling'den, bu sadece Node tarafından desteklenmeyen bir düzlük gibi görünüyor ve ham verileri bir arabelleğe dönüştürmeye başvurmam gerekecek. Ama aynı zamanda daha iyi bir yol olması gerektiğini düşünüyorum ve onu bulamıyorum. Baska öneri?nonsts'de utf-16'da kodlanmış bir dosyayı nasıl okuyabilirim?

Teşekkürler.

+2

UTF-16'ya oldukça yakın olan ucs2'yi desteklemelidir. –

cevap

17

Düğüm, JavaScript tarafından desteklenen UTF-16 alt kümesini UCS-2'yi destekler. Bunu kullanmayı dene. Bu pull request adresine bakın

14

ucs2 içeren bir metin dosyasını okurken olurdu Normal utf8 değiştirin: Google için,

var fileContents = fs.readFileSync('import.csv','ucs2') 

Ayrıca: Bu muhtemelen çözümlenen dosyasında görünen herkes ek alma (soru işareti) karakterleri ise senin sorununun sebebi. Dosyayı UTF16/UCS2 olarak okuyun ve fazladan karakterler kaybolacaktır.

İlgili konular