2016-03-26 16 views
2

Ben "NLTK ile Python Metin İşleme" Bu kitabı okuyorum ve kitap sonuçları şunlardır:Sonuçlarda "u" nedir (Python)?

>>> stopwords.fileids() 
['danish', 'dutch', 'english', 'finnish', 'french', 'german', 'hungarian', 'italian', 'norwegian', 'portuguese', 'russian', 'spanish', 'swedish', 'turkish'] 

Ama terminalde kodları çalıştırmak gibi sonuçlar şunlardır:

>>> stopwords.fileids() 
[u'danish', u'dutch', u'english', u'finnish', u'french', u'german', u'hungarian', u'italian', u'norwegian', u'portuguese', u'russian', u'spanish', u'swedish', u'turkish'] 

Her dizenin önündeki "u" nedir?

+0

Ve 'u' sembolü dize değerleri önünde ne anlama geliyor?] (Http://stackoverflow.com/questions/11279331/what-does-the-u-symbol-mean-in-front -of-string-değerleri) – koukouviou

+0

İki dizgenin karşılaştırılmasıyla, biri 'u' ve diğeri diğeri olmadan, hala True (en iyi eşleşme) değerini döndürür, böylece çoğu durumda bunun için endişelenmenize gerek yoktur. – akash12300

+2

Şu anda Python 2 kullanıyorsunuz. Üstün metin işleme yeteneklerine sahip olduğundan, doğal dil işleme için Python 3'e geçmek istersiniz; Bu '' öneki de oraya gitti. NLTK sürüm 3.0 Python 3'ü destekler. –

cevap

4

Eğer piton yorumlayıcısı bu yazarak kendiniz kontrol edebilirsiniz bir dize içeren unicode

için u standları: python2 Unicode dizeleri üzerinde

s = unicode('abcdef') 
type(s) # <type 'unicode'> 
t = u'unicode' 
type(t) #<type 'unicode'> 

fazla bilgi | python3

İlgili konular