Dosyayı tamamen ayıklamadan python kullanarak gz sıkıştırılmış metin dosyasından bir satırı okumak kolay mı? Ben 200m olan bir text.gz dosyası var. Ayıkladığımda, 7.4gb olur. Ve bu okumak zorunda olduğum tek dosya değil. Toplam işlem için 10 dosya okumalıyım. Bu sıralı bir iş olmasına rağmen, bence tüm bilgiyi harcamadan yapmanın akıllıca bir şey olacağını düşünüyorum. Bunun mümkün olduğunu bile bilmiyorum. Python kullanarak nasıl yapılabilir? Bir metin dosyasını satır-satır okumalıyım.python: sıkıştırılmış metin dosyalarından satırları oku
32
A
cevap
12
gzip.GzipFile kullanmayı denediniz mi? Bağımsız değişkenler open
'a benzer.
38
Standart gzip modülünü python'da kullanabilirsiniz. Sadece başka bir dosya olarak açmak ve satırlarını okumak için
kullanın.
buradafazla bilgi: Python gzip module
22
gzip.GzipFile kullanma:
import gzip
with gzip.open('input.gz','r') as f:
for line in f:
print('got line', line)
Not: python3 için size gelmiş dosyayı belirtmek için ikili okumaya 'r'
varsayılan olarak, 'rt'
açılan veya edilecek aksi halde line.decode(...)
kullanın.
Not : gzip.open(filename, mode)
gzip.GzipFile(filename, mode)
için bir takma addır. Sıkıştırılmamış dosyaları açmak için kullanılan with open(...) as f:
'a benzeyen eskiyi tercih ederim.
İlgili konular
- 1. Satırları txt oku ve C++
- 2. Python veya java kullanarak csv dosyasına yeni eklenen satırları oku
- 3. 7z ile sıkıştırılmış bir metin dosyasından nasıl okunur?
- 4. Python - Belirli uzantıların dosyalarından geçiş
- 5. Python: döngü içindeki tüm metin dosyalarının satırlarını oku
- 6. Oku metin dosyası ve Java
- 7. Metin dosyasından satırları ayıkla
- 8. Pdf ve word dosyalarından metin ayıklama
- 9. Yazdırılamayan "gremlin" karakterlerini metin dosyalarından çıkarma
- 10. Yalnızca benzersiz satırları SQLite (python) içine ekleme
- 11. Python .egg dosyalarından modülleri nasıl alır?
- 12. Python güncelleştirme satırları
- 13. Aynı anda iki textfile satırını oku -python
- 14. Metin satırları arasındaki boşluğu giderin
- 15. Python
- 16. Oktav/metin dosyasında metin dosyasını oku ve ayrıştır
- 17. Bir bash komut dosyasında satır numarasından başlayan satırları oku
- 18. 5 metin satırları, şöyle başka aşağıda gösterilecek jQuery
- 19. Sıkıştırılmış dosya
- 20. Metin dosyasındaki satırları ikinci bir metin dosyasına göre sıralamak nasıl
- 21. Python pdfMiner ile sayfa başına metin ayıkla?
- 22. DataGrid satırları için koşullu metin rengi?
- 23. Parse Dashboard'da Çoklu Metin Nesneleri/Satırları Güncelleniyor
- 24. Unix'teki bir metin dosyasından satırları birleştirmek mi?
- 25. Metin dosyasından satırları satırdan ayıklamak nasıl döngüde
- 26. Verileri .msg dosyalarından excel'e aktarma
- 27. Veritabanından .NET yapılandırmasını oku
- 28. Python 3.5 komut dosyalarından bağımsız çalıştırılabilir dosya nasıl oluşturulur?
- 29. Sıkıştırılmış arşiv sıkıştırması
- 30. C# - Sıkıştırılmış bayt []
Bu, tüm dosyayı belleğe yüklüyor mu? Ya da gerektiğinde satırları yüklemek için yeterince zeki mi? –
@Sachin_ruk bu dosyayı açmıyor sadece dosyayı açıyor. Verileri bir dosyadan okumak için '' 'f.readline()' 'yapmak zorundasınız. Ya da '' f.readlines (N) '' '' N'' okumak istediğiniz satır sayısıdır. – Tom