2010-11-20 20 views
0

İyi bir gece, YazmaRegex Unicode ve DB Okuma/

Şu anda Regex eşleştirmeye göre C# insan dil için çok basit bir sözcük analiser üzerinde çalışıyorum ve şu anda bir Regex specifing sorunuyla karşı karşıya am

o Hedef dilde olası tüm noktalama işaretlerini eşleştirebilir ve ayrıca her tür boş alanla eşleşebilecek başka bir eşleme yapabilir. Yığın Taşması'nda ve başka bir sitede arama yaptıktan sonra, noktalama için Regexs \p{P} ve boşluk için \p{Z} kullanabileceğimi buldum ve bir metin dosyasından okurken işe yarar. Soru şu ki, son programda bir SQL veritabanından kayıtları okumak ve bu sözcüksel analizörü kullanarak işlemek için ihtiyaç duyulacak ve DB'deki kayıtların kodlarının ne olduğunu bilmiyorum. Bu durumda bir sorun olabilir mi? Söz konusu Regex'ler, kodlamanın ne olduğu önemli değil, bir girdinin her noktalama işareti ve boşluk karakteriyle eşleşebilir mi?

Çok teşekkür ederim.

+0

Hangi db kullanıyorsunuz? – Amirshk

+0

SQL Server 2008. – Miguel

cevap

2

.NET Framework, dizeleri Unicode'a veritabanından dönüştürür. Onları doğru bir şekilde dönüştürüp dönüştürmediği, bir şeyin kodlanmış veritabanı metninin ne olduğunu söylemesine bağlıdır. Ama senin Regex göründüğü dizeler Unicode'da olacak.

Veritabanı erişim katmanının metni doğru bir şekilde veritabanı kaydından dönüştürdüğünü varsayarak, her zaman Unicode olduğu için kodlama konusunda endişelenmeniz gerekmez.

+0

Çok teşekkür ederim Mischel. – Miguel