warc

    1ısı

    1cevap

    Çalışmalarım için web sitelerini kazıyorum ve bunları gziplenmiş web arşivlerine ("warc.gz" uzantısıyla) yazdım. Python 2.7.11 ve warc 0.2.1 kütüphanesini kullanıyorum. Dosyaların çoğunda bunları warc