Varsayılan POS etiketleme ve varsayılan belirteçlerini kullanıyorum ... ve yeterli görünüyor. Onların da varsayılan dolandırıcılarını istiyorum. NLTK araç seti kitabını okuyorum, ancak varsayılan bir
Büyük bir metin dosyasına (~ 7 GB) sahibim. Büyük metin dosyasını okumak için en hızlı yol olup olmadığına bakıyorum. Süreci hızlandırmak için, yığın-yığın-okuma olarak çeşitli yaklaşımları kullanıyor