Eğer emojies bulmak için sadece uygun bir regex ile düzenli ifadeleri ve re.findall()
kullanabilirsiniz pythonic yolu olarak, harici bir kütüphaneyi kullanmak istemiyorsanız:
In [74]: import re
In [75]: re.findall(r'[^\w\s,]', a_list[0])
Out[75]: ['', '', '', '', '', '']
düzenli ifade r'[^\w\s,]'
, bir kelime karakteri, boşluk veya virgül olmayan herhangi bir karakterle eşleşen negatif karakter sınıfıdır.
Yorumda belirttiğim gibi, bir metin genellikle bu yaklaşımla kolayca ele alınacak sözcük karakterleri ve noktalama işaretleri içeriyor, diğer durumlar için bunları yalnızca karakter sınıfına manuel olarak ekleyebilirsiniz. Karakter sınıfında bir dizi karakter belirleyebileceğiniz için, daha kısa ve daha esnek hale getirebileceğinizi unutmayın.
Başka bir çözüm yerine olmayan emojisi karakter emojies kabul eden bir karakter sınıfını (^
olmadan []
) kullanımı hariç bir negatif karakter sınıfıdır. Çok sayıda emojiyi with different unicode values olduğu için, aralıkları karakter sınıfına eklemeniz yeterlidir. Burada daha fazla emojiyi eşleştirmek istiyorsanız, iyi bir referans, farklı emojilerle ilgili tüm standart emojileri içerir http://apps.timwhitlock.info/emoji/tables/unicode:
http://stackoverflow.com/q/26568722/674039 ve http://stackoverflow.com/q/35404144/674039 – wim