R, Unicode karakterlerini dahili olarak iyi işliyor gibi gözükse de, R için bu tür UTF-8 Unicode karakterleriyle bir veri çerçevesi oluşturamıyorum. Bunu zorlamanın bir yolu var mı?UTF-8 dosyalarını R
data.frame(c("hīersumian","ǣmettigan"))->test
write.table(test,"test.txt",row.names=F,col.names=F,quote=F,fileEncoding="UTF-8")
çıktı metin dosyası okur: Bir Windows ortamında (Windows 7) R versiyonu 3.0.2 kullanıyorum
hiersumian <U+01E3>mettigan
. Ona R UTF-8 dosyayı doğru yazıyor cevaplarında öne sürülmüştür, ve Sorun dosyasını görüntülemek için kullanıyorum yazılımı ile yattığını
DÜZENLEME. İşte burada her şeyi yaptığım bir kod var. UTF-8'de kodlanmış bir metin dosyasında okuyor ve R doğru okuyor. Daha sonra R, dosyayı UTF-8'de yazar ve tekrar okur ve şimdi doğru Unicode karakterleri gider.
read.table("myinputfile.txt",encoding="UTF-8")->myinputfile
myinputfile[1,1]
write.table(myinputfile,"myoutputfile.txt",row.names=F,col.names=F,quote=F,fileEncoding="UTF-8")
read.table("myoutputfile.txt",encoding="UTF-8")->myoutputfile
myoutputfile[1,1]
Konsol çıkışı:
Bu "cevap" garip bir şey perde arkasında neler olduğunu ayrıntılı açıklamalar yapılması oldukça vermektedir> read.table("myinputfile.txt",encoding="UTF-8")->myinputfile
> myinputfile[1,1]
[1] hīersumian
Levels: hīersumian ǣmettigan
> write.table(myinputfile,"myoutputfile.txt",row.names=F,col.names=F,quote=F,fileEncoding="UTF-8")
> read.table("myoutputfile.txt",encoding="UTF-8")->myoutputfile
> myoutputfile[1,1]
[1] <U+FEFF>hiersumian
Levels: <U+01E3>mettigan <U+FEFF>hiersumian
>
eserleri Dosyayı terminalde, vi veya emacs'de görüntülerken (Ubuntu 12.04'te R-devel). –
@BenBolker Bu, bu sorunun R'nin Windows sürümüne özgü olduğu anlamına mı geliyor? – Sverre
Açıklamak gerekirse: bu Windows'a özgü bir sorundur. OS X'de sonuç doğrulanabilir. 'test.txt 'dosyası, test.txt: UTF-8 Unicode metni ile cevap verir. Bir hexdump doğru baytları gösterir. İyi yazılmış bir soru olsa da. –