2016-03-31 21 views
0

Bir PDF'den dönüştürdüğüm bir .numbers dosyası var ve her 50 satıra ve DEF sütunlarından dağıtılan belirli hücrelerden veri almam gerekiyor. Örneğin, veriler bu formatta, dosyada aralıklıdır.python ile .numbers dosyasından veri ayıklama

Año Población Superficie 
1980 2061744 12855 
2000 3381005 55035 
2005 3745073 58668 
2010 4106054 63018 

Bunu yapmanın en iyi yolu nedir?

cevap

0

Daha fazla sayısal hesaplama yapmayı planlıyorsanız, Numpy'u kullanmanızı öneririz.

np.loadtxt fonksiyonu dosyayı satır satır (ilk bir atlama) okunur ve elde etmek için split kullanabilir, vb

Aksi başlık atlamayı sağlayan, bu verileri okumak için basit bir yol sağlar sütun değerleri, daha sonra bunları floatlara dönüştürür.

ardından kodu (denenmemiş) çalışması gerekir:

ano = [] 
poblacion = [] 
superficie = [] 

with open("yourfile.numbers") as file: 
    file.readline() # skip first line 
    for line in file: 
     values = map(float, line.split()) 
     ano.append(values[0]) 
     poblacion.append(values[1]) 
     superficie.append(values[2]) 
İlgili konular