dışındaki denetim tabloları dışındaki yazdırılamayan utf8 karakterleri kaldırın Metin, kontrol karakterleri, rakamlar, boşluklar (Almanca) ve diğer utf8 karakterleri içeren bir Dize var.Dize
"Dilin bir parçası" olmayan tüm utf8 karakterleri kesmek istiyorum. Özel karakterler (tam liste dışı) ":/\ ßä,; \ n \ t" gibi hepsi korunmalıdır.
Ne yazık ki stackoverflow tüm bu karakterleri kaldırır, böylece bir resim eklemem gerekir (link).
Herhangi bir fikrin var mı? Yardım çok takdir edilir! Herkes mutlu Sadece bir tanesini bulmak mümkün değildi .. Dizelerinizi yüklemek istiyorsunuz bu özel karakterleri öldürmek değil bir yapıştırma hizmeti ..
[Düzenle] biliyorum yoksa:
PS BENCE regex "\ P {Cc}", PRESERVE yapmak istediğim karakterlerdir. Bu regex tersine çevrilebilir mi, dolayısıyla bu regex ile uyuşmayan tüm karakterler döndürülmeli mi?
Emin değilim, ancak \ P {şey} 'in tersine çevrilmiş sürümünün \ p {şey} olması olasıdır. Eğer değilse [^ \ P {something}] ile deneyebilirsiniz. – Pshemo
@Pshemo yeah indead küçük harf aşağıya olduğu gibi çalışmış gibi görünüyor .. teşekkürler! – friesoft
Olası çoğaltılabilir [Yazdırılabilir tüm karakterleri bir Java Dizgisinden ayırmanın en hızlı yolu] (http://stackoverflow.com/questions/7161534/fastest-way-to-strip-all-non-printable-characters-from- a-java-string) – Stewart