Şu anda bulup bir dizede karma etiketleri için '#' karakterinden sonra kelimeleri izole etmek re.findall kullanın. Ancak bu, örneğin aşağıdaki gibi aksanlı karakterler için geçerli değildir: áéíóúñü¿
.Python'da regex için aksanlı karakterler nasıl hesaplanır?</p> <pre><code>hashtags = re.findall(r'#([A-Za-z0-9_]+)', str1) </code></pre> <p>Bu str1 arar ve tüm Hashtag'leri bulur:
Bu harflerden biri str1'deyse, hashtag'i önceki harfe kadar kaydeder. Örneğin, #yogenfrüz
, #yogenfr
olacaktır.
ben bu
Kullanım 're.UNICODE' bayrağı: Bu cevabım bana çok yardımcı
çek ... Açık örnek) 'görmezden'. –
@AshwiniChaudhary: UNICODE bayrağı, kullanılan menzili ASCII olmayan karakterlerle eşleştirmez, no. Normal ifadeyi "a-z" ile eşleştiğini söylerseniz, "a" ve "bir şekilde" aynı şey olan insan yorumunu değil, tam anlamıyla alan aralığını alır. –
@MartijnPieters: Peki, ne yapacak? ;-) – JohnTortugo