gsub
kullanarak standart bir tire olduğunu düşündüğüm şeyi değiştirmeye çalışıyordum. Ben test oldu kodu:Özel karakterler içeren R gsub
gsub("-", "ABC", "reported – estimate")
Bu da, hiçbir şey yok. Ben kopyaladı ve http://unicodelookup.com/#–/1 içine yapıştırılmış ve bir en çizgi gibi görünüyor. Bu site bir en çizgi için hex, dec vb kodları sağlar ve ben en dash yerine çalışıyorum ama şansım yok. Öneriler?
(Bir bonus olarak, yardımcı olabilecek özel karakterleri tanımlamak için bir işlev olup olmadığını söylerseniz).
SO'nın kod biçimlendirmesinin çizgi biçimini değiştirip değiştirmeyeceğinden emin değilim. Bu yüzden kullanıyorum (-).
Bu harika. Belki de "özel karakterler" ile doğru terminolojiyi kullanmıyordum. Bununla kastettiğim, standart UTF-8 olmayan karakterler. Örneğin, ô - bunlar readr :: write_csv() öğesini kullanarak dışa aktarırken garip görünen karakterlerdir. Verdiğiniz gsub, "ô" yi "özel karakter" olarak tanımlamak için değiştirilebilir. – ZRoss
Tüm ascii: gsub ("[[: ascii:]] +", "", s) 'ile eşleşen bir regex ile kullanabilirsiniz. Bu, tüm ascii'leri sonuçtaki tüm Unicode karakterlerini koruyan bir dizgeden kaldıracaktır. –
Sadece bir PCRE yapısı olduğundan, yukarıdaki regex deseniyle 'perl = T 'kullanmanız gerekiyor. –