Metin belgeleri içeren bir klasörden python 3 ile okumaya çalışıyorum. Özellikle, bu, LingSpam e-posta spam veri kümesinin bir değişikliğidir. Tüm 1893 metin belge isimlerini döndürmek için yazdığım kodu bekliyorum, ancak kod bunun yerine ilk 420 dosya ismini döndürüyor. Neden toplam dosya adlarının kısa olduğunu durduğunu anlamıyorum. Herhangi bir fikir?Neden glob.glob döngüsüm klasördeki tüm metin dosyaları arasında yinelenmiyor?
if not os.path.exists('train'): # download data
from urllib.request import urlretrieve
import tarfile
urlretrieve('http://cs.iit.edu/~culotta/cs429/lingspam.tgz', 'lingspam.tgz')
tar = tarfile.open('lingspam.tgz')
tar.extractall()
tar.close()
abc = []
for f in glob.glob("train/*.txt"):
print(f)
abc.append(f)
print(len(abc))
Küresel param paramlarını değiştirmeyi denedim, ancak yine de başarı yok.
Düzenleme: Görünüşe göre benim kodum benim için çalışıyor. İşte benim output
Kodun benim için gayet iyi çalışıyor: https://asciinema.org/a/39x9vuca48gd7fieugpkicbbt – larsks
Mutlak yolu kullanmayı denediniz mi? –
Ben de onayladım. Benim için çalıştı. – Hun